Perang AI Dorong Platform ”Suka-suka” Keruk Data Pengguna
Publik sepertinya perlu kembali melihat kebijakan privasi yang dilakukan oleh platfrom. Platform akan bermain-main dengan kalimat yang pada ujungnya memungkinkan mereka memulung data yang dimiliki pengguna.
Oleh
ANDREAS MARYOTO
·4 menit baca
Meta yang merupakan perusahaan induk dari Facebook dan Instagram tak mau tertinggal dalam perlombaan kecerdasan buatan (AI). Dalam waktu dekat, mereka akan meluncurkan produk AI. Mereka tengah melatih teknologi kecerdasan buatannya. Informasi yang muncul, latihan itu menggunakan informasi publik yang selama ini beredar di platform mereka. Penggunaan data publik ini telah lama menjadi perdebatan. Apakah legal sebuah perusahaan teknologi menggunakan informasi publik?
Pada hari Kamis pekan lalu Meta mengumumkan serangkaian fitur AI baru mulai dari alat pengeditan di Instagram hingga asisten AI baru bernama Meta AI. Akan tetapi, bukan itu ceritanya, Meta juga menggunakan postingan publik Facebook dan Instagram untuk melatih bagian-bagian AI. Kabar ini kemudian membangkitkan kembali debat publik dengan kriteria dan penggunaan informasi publik.
”Kami telah mencoba untuk mengecualikan kumpulan data yang memiliki lebih banyak informasi pribadi,” kata President Meta of Global Affairs Nick Clegg dalam sebuah wawancara dengan Reuters yang dikutip laman PetaPixel. Clegg menambahkan bahwa ”sebagian besar” data yang digunakan Meta untuk pelatihan tersedia untuk umum karena perusahaan ingin menghormati masalah privasi. Ketentuan tersebut tampaknya menunjukkan bahwa sebagian dari data yang digunakan tersebut bukan data publik meskipun mereka tidak menjelaskan lebih lanjut tentang hal ini.
Clegg kemudian menjelaskan bahwa mereka menggunakan foto publik dan postingan teks untuk melatih AI-nya. Foto-foto tersebut digunakan untuk melatih platform bernama Emu, yaitu kecerdasan buatan yang menjadi pusat editor gambar AI yang akan datang di Instagram dan teks digunakan untuk meningkatkan pengetahuan bot obrolannya. Dalam pengumumannya beberapa hari lalu, Meta mengatakan, Emu dibangun dengan menggunakan teknologi dari Llama 2 dan model dasar yang mereka miliki untuk pembuatan gambar.
Fasilitas AI mereka bisa mengubah perintah teks Anda menjadi beberapa stiker unik dan berkualitas tinggi hanya dalam hitungan detik. Fitur baru ini, yang akan diluncurkan kepada pengguna berbahasa Inggris terpilih atau tertentu pada bulan depan di Whatsapp, Messenger, Instagram, dan Facebook Stories. Emu bakal memberikan lebih banyak pilihan untuk menyampaikan perasaan Anda setiap saat.
Kesadaran tentang pentingnya data kembali muncul sangat kuat tak lama setelah kecerdasan buatan ChatGPT hadir ke publik pada akhir tahun lalu. Fasilitas ini seolah menjadi penanda bahwa teknologi kecerdasan buatan sangat dekat dengan keseharian mereka. Perusahaan teknologi kemudian berbenah. Mereka berusaha mencari dan tentu menambah harta karun itu untuk melatih kemampuan teknologi kecerdasan buatan mereka. Data paling murah adalah data yang ada di platform mereka. Akan tetapi, masalahnya, mereka terbentur soal privasi sehingga sejumlah langkah dilakukan.
Pada Juli lalu Google diketahui mengubah kebijakan privasi mereka. Laman Search Engine Journal menyebutkan, selama akhir pekan Google memperbarui kebijakan privasinya untuk memungkinkan perusahaan mengumpulkan dan menganalisis informasi yang dibagikan orang secara daring untuk melatih model AI mereka. Google mengatakan akan menggunakan informasi tersebut untuk meningkatkan layanannya dan mengembangkan produk baru yang didukung oleh kecerdasan buatan.
Dalam blognya, Google menulis ”Google menggunakan informasi untuk meningkatkan layanan kami dan mengembangkan produk, fitur, dan teknologi baru yang bermanfaat bagi pengguna kami dan masyarakat. Misalnya, kami menggunakan informasi yang tersedia untuk umum guna membantu melatih model AI Google dan membangun produk dan fitur seperti kemampuan Google Translate, Bard, dan Cloud AI.” Tanpa pengetahuan yang mendalam soal kebijakan baru ini, orang cenderung menganggap biasa saja.
Matt G Southern dari Search Engine Journal mengatakan, kebijakan yang diperbarui ini menandai perubahan yang jelas dari persyaratan layanan Google sebelumnya. Sebelum pembaruan akhir pekan ini, kebijakan Google menyatakan bahwa mereka menggunakan data masyarakat untuk meningkatkan ”language model”. Kini, Google berhak menggunakan data atau informasi publik untuk menyempurnakan semua model dan produk kecerdasan buatan, termasuk sistem terjemahan, sistem yang menghasilkan teks, dan layanan komputasi awan AI.
Secara umum, kebijakan privasi membatasi perusahaan untuk mengumpulkan data yang diberikan langsung oleh pengguna. Kebijakan ini membuat publik merasa aman dengan data mereka di sebuah platform. Dengan kebijakan baru Google, perusahaan dapat menggunakan informasi apa pun yang diunggah seseorang secara publik secara daring. Mereka memiliki legalitas untuk menambang data tersebut. Kini banyak pihak memberi perhatian lebih mendalam tentang kebijakan-kebijakan baru yang muncul berkaitan dengan penambangan data.
Langkah yang sama dilakukan oleh platform X yang dulu bernama Twitter. Laman TechCrunch mengutip laporan Bloombergpada awal September lalu menyebutkan, kebijakan privasi X yang baru-baru ini diperbarui memberi tahu para penggunanya bahwa mereka sekarang akan mengumpulkan data biometrik serta riwayat pekerjaan dan pendidikan pengguna. Namun, tampaknya itu bukan satu-satunya langkah yang akan dilakukan terhadap data pengguna. Menurut pembaruan pada bagian lain kebijakan tersebut, perusahaan juga berencana menggunakan informasi yang dikumpulkannya dan informasi publik lainnya untuk membantu melatih pembelajaran mesin dan model AI.
Publik sepertinya perlu kembali melihat kebijakan privasi yang dilakukan oleh platform. Platform akan bermain-main dengan kalimat yang pada ujungnya memungkinkan mereka memulung data yang dimiliki pengguna. Ada yang terang-terangan, tetapi ada yang tersembunyi. Data memang bahan baku yang berharga bagi pemilik platform untuk melatih teknologi kecerdasan buatan mereka. Upaya-upaya yang dilakukan publik untuk menjaga data mereka sepertinya terlihat makin lemah.
Mereka makin tidak berdaya dengan agresivitas platform ketika membangun kecerdasan buatan. Langkah kecil para pengguna dengan melihat kembali kebijakan privasi dan kemudian mematikan beberapa kemampuan untuk menambang data kita masih bisa menekan agresivitas platform. Para pengguna harus rajin melihat kebijakan privasi dan memahami dampaknya buat mereka. Kita tidak boleh pasrah dengan ungkapan sejumlah orang yang mengatakan ”ke depan kita makin telanjang dan tidak bisa lagi menyembunyikan diri kita”. Suatu saat mungkin kita berharap akan muncul gerakan untuk mengerem perusahaan platform di era kompetisi pengembangan kecerdasan buatan.