Mencederai Budaya Ilmiah
Apabila kita taat dan menghormati budaya ilmiah dan tidak ingin mencederainya, seharusnya klaim ”big data” disertai data dan metodologinya. Apalagi jika itu untuk dasar pengambilan kebijakan.
Di era modern, big data merevolusi cara kita memproduksi pengetahuan. Namun tetap saja, asas dan prinsip yang tepat tak boleh ditinggalkan. Terlebih untuk menjadikannya sebagai dasar suatu kebijakan.
Pengambilan kebijakan berdasarkan big data merupakan hal yang baik, tetapi ada beberapa kondisi yang perlu diperhatikan sebelum menggunakannya. Big data termasuk mekanisme baru dalam memproduksi pengetahuan. Oleh karena itu, pengambilan kebijakan semestinya perlu taat kepada asas-asas dalam memproduksi pengetahuan.
Data menjadi suatu hal yang penting saat ini. Beberapa dekade terakhir, kita melihat cara yang berbeda dalam memproduksi, menyimpan, dan menganalisis data. Melalui kombinasi beberapa teknik, mulai dari komputasi, algoritma, hingga statistik sehingga dapat menghasilkan pengetahuan baru yang berasal dari big data. Big data telah merevolusi cara kita memproduksi pengetahuan.
Namun, dengan derasnya laju data dan perkembangan teknologi saat ini, apakah big data dapat mendisrupsi kemapanan metodologi dalam produksi ilmu pengetahuan?
Baca juga: ”Big Data”, Ke(tidak)cerdasan Buatan, dan Demokrasi Kita
Metode ilmiah
Dalam memproduksi ilmu pengetahuan, umumnya kita mengenal istilah metode ilmiah (scientific method). Mungkin, kita perlu menengok pelajaran biologi untuk memahaminya. Salah satu contoh menarik tentang metode ilmiah adalah Teori Evolusi dalam buku Asal-usul Spesies (On the Origin of Species, 1859) yang ditulis oleh Charles Darwin. Meskipun teori ini banyak menuai kritikan, kita tetap perlu tahu apa itu teori evolusi dan bagaimana pengetahuan tersebut dihasilkan hingga menjadi sebuah teori.
Pada 15 September 1835, Darwin berlabuh di Kepulauan Galapagos. Di kepulauan itu, dia mengamati dan melakukan observasi burung-burung finch. Ia melihat beberapa burung dalam spesies yang sama, tetapi memiliki paruh yang berbeda-beda. Dari fenomena tersebut ia kemudian mulai mengajukan pertanyaan, kenapa burung dengan spesies sama bisa memiliki paruh yang berbeda-beda?
Meskipun teori ini banyak menuai kritikan, kita tetap perlu tahu apa itu teori evolusi dan bagaimana pengetahuan tersebut dihasilkan hingga menjadi sebuah teori.
Untuk menjawab pertanyaan atas fenomena kukila tersebut, perlu jawaban sementara atau istilahnya hipotesis. Setelah mengajukan hipotesis, perlu proses pengumpulan data. Data digunakan untuk menguji apakah hipotesis bisa didukung ataupun malah disangkal. Proses ini dilakukan terus-menerus sehingga membentuk inti dari apa yang kita sebut metode ilmiah. Dalam kasus Darwin, dia menyimpulkan bahwa adanya keragaman makhluk hidup yang ada di alam, sebetulnya mempunyai nenek moyang yang sama.
Kesimpulan tersebut didukung dengan teori dasar seperti seleksi alam (natural selection) dan proses kausal evolusi lainnya. Teori-teori tersebut diselidiki dengan merumuskan dan menguji hipotesis. Darwin mengajukan hipotesis di banyak bidang, termasuk bidang geologi, morfologi dan fisiologi tumbuhan, psikologi, dan evolusi, serta mengujinya juga secara empiris (Francisco Ayala, 2019).
Darwin tak pernah mengklaim bahwa ”manusia adalah keturunan (maaf) kera” sebagaimana yang digaungkan oleh beberapa orang sezamannya. Para ilmuwan modern juga melihat pernyataan tersebut sebagai penyederhanaan teori yang salah. Hal ini dikarenakan masih terdapat ”mata rantai yang hilang” (missing link) antara nenek moyang manusia dan nenek moyang kera.
Terlepas dari kontroversi itu, seiring dengan perkembangan ilmu pengetahuan, terbukti bahwa teori evolusi yang digagas oleh Darwin hampir semua benar secara ilmiah. Ilmu genetika modern saat ini pun juga menegaskan kembali teori Darwin.
James Watson, Francis Crick, dan Maurice Wilkins adalah penerima Nobel bidang kedokteran tahun 1962 atas temuan mereka tentang struktur heliks ganda DNA (double-helix DNA). DNA terdiri dari empat macam nukleotida (adenine, cytosine, guanine, dan thymine) yang merupakan kode pemrograman genetik semua makhluk hidup. Polimer tersebut menentukan pembentukan struktur DNA dan sekaligus evolusi makhluk hidup. Penemuan itu tidak terlepas dari teori evolusi yang menjadi landasan di bioteknologi modern seperti rekayasa genetika, penelitian sel induk atau riset tentang kloning saat ini.
Baca juga: Dua Arus Besar Pembauran Populasi di Wallacea
Memang setelah Charles Darwin menerbitkan bukunya lebih dari 150 tahun lalu, dia selalu mendapat kritikan. Namun, nyaris tidak ada yang dapat membuktikan bahwa teori evolusi Darwin itu keliru secara ilmiah.
Dalam sains perlu proses falsifikasi. Karl Popper, salah satu filsuf sains terbesar abad ke-20, adalah pengusung falsifikasi. Falsifikasi mencoba meragukan proposisi, pernyataan, metodologi, teori, dan hipotesis untuk dibuktikan salah. Apabila tidak ditemukan kesalahan mulai dari proses awal hingga akhir, temuan tersebut bisa dianggap benar secara ilmiah.
Dalam budaya ilmiah, jamak ditemui proses evaluasi dan kritik dari penilaian sejawat atau peer-review yang bertugas menguji apakah metode dan temuan yang dihasilkan valid ataupun tidak. Tentu perlu ahli dalam bidang masing-masing untuk mengetahui apakah proses dan metodologi yang dilakukan sampai dengan hasil merupakan hal yang benar dan dapat dipertanggungjawabkan secara ilmiah.
Dalam budaya ilmiah, jamak ditemui proses evaluasi dan kritik dari penilaian sejawat atau peer-review yang bertugas menguji apakah metode dan temuan yang dihasilkan valid ataupun tidak.
Kembali ke masalah metode ilmiah. Selain terdapat langkah-langkah yang ketat oleh peneliti ditambah proses falsifikasi yang dilakukan oleh sejawat yang ahli di bidangnya. Hasil penelitian juga harus dapat direproduksi dan replikasi ulang oleh orang lain, ada asas reproducibility.
Proses produksi ilmu pengetahuan tidak bisa dilakukan secara serampangan. Apalagi ketika klaim atau hasil temuan baru yang melibatkan riset empiris belum menjadi well-established/accepted result dan konsensus bersama di bidang yang bersangkutan, harus diperlakukan dengan sangat hati-hati.
Problem epistemologis ”big data”
Epistemologi merupakan kata yang berasal dari Yunani klasik yang memiliki makna teori ilmu pengetahuan (theory of knowledge). Immanuel Kant lebih memilih istilah erkenntnistheorie daripada epistemologie, meskipun keduanya ada dalam bahasa Jerman. Erkenntnistheorie merupakan kata yang umum dipakai di pertengahan abad ke-19 dan banyak juga digunakan di ranah praktikal pada ilmu alam. Kant membedakan antara die Erkenntnis (proses memperoleh wawasan) dan das Erkenntnis (hasil dari proses tersebut). Erkenntnistheorie membahas tentang keduanya (Philip Schwarz, 2020).
Dari pengertian tersebut, masalah epistemologis big data berkaitan dengan bagaimana proses dan cara kita mendapatkan pengetahuan dari big data. Selain itu, bagaimana menunjukkan atau membuktikan bahwa hasil dari pengetahuan tersebut benar dan masuk akal.
Menariknya, ketika kita menengok penelitian yang melibatkan big data, terdapat perbedaan mendasar dalam tahap memperoleh data. Data didapatkan pada tahap awal (data-first paradigm) dari proses riset, hal ini tentu berbeda secara radikal dengan metode ilmiah yang sudah mapan sebelumnya.
Lantas pertanyaannya, apakah produksi ilmu pengetahuan dari big data masih bisa dianggap sebagai suatu hal yang ilmiah?
Baca juga: Menilik Kualitas "Big Data"
Dalam artikel ”Big Data, new epistemologies and paradigm shifts” menjelaskan bahwa big data termasuk ke dalam data-driven science yang berbeda dengan metode yang diawali dengan pengajuan hipotesis atau knowledge-driven science. Namun, data-driven science adalah versi rekonfigurasi dari metode ilmiah tradisional sehingga hasil pengetahuan dari big data tetap dapat diakui secara ilmiah. Ia memiliki cara dan metodologi baru dan berbeda dalam menghasilkan pengetahuan. Meskipun demikian, perubahan epistemologinya cukup signifikan.
Di sisi lain, dengan adanya big data, kita dapat menangkap fenomena yang dibicarakan oleh warganet melalui media sosial. Misalnya mengetahui derasnya percakapan warganet tentang pawang hujan di MotoGP, hingga menghitung seberapa banyak warganet yang setuju dengan pelaksanaan pemilu. Hal tersebut bisa ditangkap dan dipantau menggunakan big data.
Namun, saat ini media sosial yang banyak digunakan untuk menangkap data adalah Twitter. Bahkan Facebook melarang proses scraping data dari platformnya. Secara teknikal, satu-satunya cara legal untuk mengumpulkan data dari Facebook dengan teknik crawler adalah melalui izin tertulis. Selain itu, ketika suatu negara telah menerapkan aturan perlindungan data pribadi, General Data Protection Regulation (GDPR) misalnya, proses pengumpulan data pribadi merupakan hal yang ilegal, kecuali telah mendapatkan persetujuan secara eksplisit dari orang tersebut.
Dengan adanya big data, kita dapat menangkap fenomena yang dibicarakan oleh warganet melalui media sosial.
Celakanya, setelah skandal Cambridge Analytica, Facebook telah mengambil kebijakan tegas, yaitu Facebook’s data lockdown yang sekaligus kabar buruk bagi peneliti yang biasanya menggunakan platform media sosial di bawah Facebook. Instagram juga menerapkan pembatasan radikal pada akses datanya, hal ini membuat cara mendapatkan data dari platform tersebut jauh lebih sulit daripada sebelumnya. Pembatasan dilakukan untuk melindungi informasi pengguna. Oleh sebab itu, praktis sumber yang paling banyak dipakai untuk penelitian big data khususnya dari media sosial umumnya berasal dari Twitter.
Ketika ada klaim yang didasarkan pada big data, sesuai dengan kaidah ilmiah, kita perlu menguji mulai dari awal hingga akhir metodologi yang digunakan, serta melakukan proses falsifikasi atas klaim tersebut.
Salah satu prinsip sains adalah falsifikasi, temuan dan kesimpulan ilmiah dari seseorang perlu disanggah apabila ada yang kurang tepat dan harus bisa diuji. Prinsip penting lain adalah keterbukaan baik itu data, metodologi, hingga hasil yang dapat direplikasi ulang (reproducibility) oleh orang lain. Itulah beberapa alasan kenapa sains saat ini bisa bertahan hingga sekarang. Perlu diingat bahwa, budaya ilmiah tidak tumbuh dari klaim-klaim kosong beberapa orang.
Ismail Fahmi, pakar big data sekaligus pendiri Drone Emprit, menjelaskan bahwa, ”Ketika ada yang klaim big data, tapi tanpa buka metodologinya, itu jangan langsung dipercaya. Jadi harus terbuka metodologinya supaya peneliti lain bisa replikasi ulang klaimnya.”
Apabila kita taat dan menghormati budaya ilmiah dan tidak ingin mencederainya, seharusnya langkah-langkah tersebut perlu dilakukan. Kemudian, apabila data dan metodologi tidak dapat dibuka, seyogianya klaim tersebut tidak dijadikan dasar suatu pengambilan kebijakan penting dalam sebuah negara. Para elite semestinya memberikan teladan dalam mencerdaskan kehidupan bangsa melalui budaya ilmiah yang baik.
Baca juga: Adu Siasat Partai Politik, dari Isu Populis hingga ”Big Data” Pemilih
Penguatan budaya ilmiah sangat penting untuk dilakukan agar tidak terjadi kesalahan dalam pengambilan keputusan penting, baik itu berdasarkan data maupun big data oleh para pelajar, mahasiswa, ataupun pegawai outsourcing lima tahunan.
Data dan metodologi yang semestinya dibuka sesuai kaidah ilmiah malah ditutupi. Sementara aturan tentang perlindungan data pribadi warga yang semestinya dilindungi malah pembahasannya terhenti. Padahal melindungi segenap bangsa dan mencerdaskan kehidupan bangsa adalah dua amanat penting konstitusi. Entah konstitusi mana yang mereka patuhi.
Ahmad Mustafid, Mahasiswa Magister Technische Universität (TU) Kaiserslautern, Jerman