Pengolahan citra dapat digunakan untuk mengolah warisan budaya, khususnya mendigitalisasi manuskrip kuno. Melalui dukungan kecerdasan artifisial, berbagai aksara dari manuskrip yang rusak juga bisa diprediksi kembali.
Oleh
PRADIPTA PANDU
·5 menit baca
KOMPAS/YOLA SASTRA
Pegiat konservasi naskah kuno mengatur letak manuskrip peninggalan Syekh Abdul Latif Syakur (1882-1963) asal Nagari Balai Gurah, Agam, sebelum didigitalisasi di Padang, Sumatera Barat, Selasa (18/7/2023).
Indonesia merupakan negara yang kaya akan warisan budaya dan peradaban yang memiliki nilai historis bagi manusia. Salah satu warisan budaya dan peradaban tersebut ditunjukkan melalui manuskrip atau naskah kuno yang tersebar di sejumlah wilayah di Indonesia. Keberadaan manuskrip kuno ini bahkan menjadi sebuah identitas kebudayaan nasional.
Manuskrip kuno merupakan sebuah dokumen tertulis berisi informasi tentang identitas maupun peristiwa tertentu yang terjadi pada ratusan hingga ribuan tahun lalu. Manuskrip kuno masa lampau di Indonesia kini telah ditetapkan sebagai benda cagar budaya sebagaimana diatur dalam Undang-Undang Nomor 11 Tahun 2010 tentang Cagar Budaya.
Meski demikian, seiring berkembangnya zaman, manuskrip kuno yang mayoritas dituangkan di kertas dan berisi informasi penting ini rentan mengalami kerusakan karena faktor usia. Kondisi alam Indonesiadengan iklim tropis, udara lembap, dan kerap terjadi bencana hidrometeorologi menjadi faktor lain yang dapat mempercepat kerusakan manuskrip kuno.
Oleh karena itu, perlindungan manuskrip kuno melalui digitalisasi merupakan salah satu cara nonfisik yang mampu menjaga dan melestarikan peninggalan sejarah ini. Pelestarian manuskrip kuno melalui digitalisasi, teknologi, dan dukungan kecerdasan artifisial (AI) ini diharapkan mampu membuat generasi mendatang mengenal khazanah warisan leluhurnya.
Upaya melestarikan manuskrip kuno melalui penggunaan teknologi juga dilakukan oleh tim peneliti dari Departemen Teknik Informatika dan Program Studi Sastra Sunda Universitas Padjadjaran (Unpad), Bandung. Proyek ini salah satunya berfokus merekonstruksi dan menyempurnakan manuskrip kuno khususnya di sejumlah wilayah Sunda.
KOMPAS/YOLA SASTRA
Pegiat konservasi naskah kuno melakukan digitalisasi terhadap manuskrip peninggalan Kerajaan Tarusan yang ditulis pada awal dan pertengahan abad ke-19, Nagari Duku, Kecamatan Koto XI Tarusan, Kabupaten Pesisir Selatan, Sumatera Barat, Kamis (24/3/2022). Upaya digitalisasi naskah kerajaan ini mendesak dilakukan karena kondisinya yang memprihatinkan.
Dosen Departemen Teknik Informatika Unpad Setiawan Hadi mengemukakan, obyek dari rekonstruksi digital ini adalah manuskrip kuno yang ditulis di daun lontar dan berisi catatan sejarah termasuk aturan, resep, hingga teknik pertanian. Manuskrip di obyek organik ini dibuat pada abad ke-15 dan ditulis dengan cara disayat menggunakan pisau.
”Mengingat lontar ditulis dalam obyek atau media organik, yakni tumbuh-tumbuhan, maka sangat rentan dan sensitif terhadap penyimpanan. Beberapa tempat lain juga kurang mendapat perhatian dalam hal penyimpanan,” ujarnya dalam webinar bertajuk ”Kecerdasan Artifisial untuk Mengolah Warisan Budaya” yang diselenggarakan Badan Riset dan Inovasi Nasional (BRIN), Kamis (21/9/2023).
Mengingat lontar ditulis dalam obyek atau media organik, yakni tumbuh-tumbuhan, maka sangat rentan dan sensitif terhadap penyimpanan.
Peta jalan terkait riset dalam bidang manuskrip kuno telah dilakukan Unpad sejak tahun 2015. Saat itu, Unpad berkolaborasi dengan peneliti dari Perancis melakukan proyek Ancient Manuscripts Digitation and Indexation (Amadi). Sepanjang 2015-2018, proyek yang berfokus pada digitasi dan indeksasi berhasil membangun dataset manuskrip sunda kuno.
Strategi digitalisasi dalam proyek Amadi fokus dilakukan pada situs Kabuyutan Ciburuy di Garut, Jawa Barat. Proses awal digitalisasi ini dimulai dengan membangun studi kecil untuk melakukan pemotretan dan pemindaian terhadap lontar-lontar berbentuk persegi panjang.
KOMPAS/ZULKARNAINI
Peneliti filologi Melayu-Aceh dari Universitas Islam Negeri Ar-Raniry Banda Aceh, Hermansyah, saat meneliti salah satu manuskrip peninggalan masa lampau yang ditulis oleh ulama besar kala itu. Pada 18 Mei 2023, Badan PBB untuk Pendidikan, Ilmu Pengetahuan, dan Kebudayaan (UNESCO) menetapkan naskah Hikayat Aceh sebagai warisan dunia.
Data digital dari hasil pemotretan tersebut kemudian disimpan dalam sebuah situs bernama amadi.unpad.ac.id. Namun, situs ini belum bisa diakses secara penuh karena masih dalam proses penelitian, penambahan, dan perbaikan data. Sampai sekarang, situs ini tercatat memiliki 1.456 data dan 558 transliterasi atau penyalinan dengan penggantian huruf.
Beragam tindakan
Menurut Setiawan, secara umum penyimpanan data digital lontar memang mudah dilakukan. Akan tetapi, pihaknya melakukan tindakan lain yakni penelusuran, segmentasi, dan anotasi atau catatan pengarang. Hal ini dilakukan karena data tersebut tidak bisa dibaca oleh masyarakat umum dan hanya bisa dipahami oleh filologi atau pihak-pihak tertentu.
”Kompleksitas penulisan dalam lontar ini cukup sulit untuk membedakan obyek-obyek yang ada. Kemudian tidak semua citra digital lontar tertangkap dengan baik sehingga butuh upaya image processing (pengolahan citra) untuk menyempurnakan data ini,” katanya.
Selain itu, dilakukan juga binerisasi dengan cara menghapus latar belakang (background) citra tersebut dan mengambil teks tersebut yang bertujuan untuk mendapatkan obyek secara lebih jelas. Binerisasi ini menjadi salah satu tantangan lain karena masih dilakukan secara manual dan belum bisa dikerjakan secara otomatis.
”Kami juga melakukan cropping (pemotongan) untuk mendapatkan kata dan aksara. Dari pemotongan tersebut didapatkan dataset berbentuk identitas kata-kata, letak lontar, dan urutan ke berapa di dalam lontar tersebut,” tuturnya.
KOMPAS/RIZA FATHONI
Pengunjung mengakses menu situs web Khanasah Pustaka Nusantara (Khastara) yang baru diluncurkan di komputer Perpustakaan Nasional, Jakarta Pusat, Kamis (3/1/2019). Situs tersebut memuat koleksi digital hasil alih media dari berbagai koleksi tercetak Nusantara sehingga koleksi yang sudah rapuh tetap terjaga.
Setelah memiliki dataset aksara, tindakan selanjutnya adalah melakukan indeksasi untuk memudahkan pencarian kata atau aksara yang terdapat di dalam lontar. Sistem pencarian ini didukung dengan index generator yang berguna melihat berapa banyak jumlah kata yang dicari dalam satu lontar. Dengan sistem ini, setiap orang bisa menemukan kata yang dicari sesuai dengan konteks yang dibutuhkan.
Setiawan mengatakan, dengan bantuan filolog juga dilakukan transliterasi untuk mengubah aksara tersebut menjadi huruf latin. Filolog juga membantu dalam melakukan translasi untuk mengubah aksara menjadi bahasa Indonesia atau Inggris sehingga semakin memudahkan masyarakat umum dalam memahami isi manuskrip kuno dalam sebuah lontar.
Beragam dataset dari proyek Amadi kemudian dikembangkan kembali ke dalam proyek yang hampir serupa, yakni Amira tahun 2019-2021. Terbaru, selama 2022-2024 peneliti juga melakukan proyek Digital Reconstruction and Enhancement of Ancient Manuscripts (DREAM) guna merestorasi citra digital manuskrip kuno untuk aksara yang hilang.
”Penerapan AI sudah kami lakukan dalam sistem pencarian ini seperti faster R-CNN. Sekarang masih dalam tahap sistem pencarian untuk karakter dan belum berfokus pada kata. Jadi, ke depan masih ada tantangan untuk melakukan eksperimen tentang ini karena kata terdiri dari banyak aksara dan menarik menggabungkan semua aspek,” ucapnya.
Tantangan
Setiawan mengakui bahwa digitalisasi manuskrip kuno, khususnya yang berasal dari lontar tidak bisa dilakukan sekaligus karena jumlahnya yang mencapai ribuan. Kemudian banyak dijumpai juga lontar dengan kondisi pecah sehingga membutuhkan upaya lebih untuk menyatukan serpihan-serpihan tersebut menjadi satu lontar utuh.
FERGANATA INDRA RIATMOKO
Petugas pengelola manuskrip Kurnia Heniwati memeriksa digitalisasi naskah kuno Suluk Syattariyah di Museum Radya Pustaka, Surakarta, Jawa Tengah, Rabu (17/3/2021). Digitalisasi dilakukan untuk menyelamatkan isi naskah kuno yang semakin rapuh karena usia. Museum yang didirikan pada tahun 1890 ini memiliki dokumen tertua berupa Naskah Serat Yusuf yang dibuat tahun 1729.
”Tahun 2022 kami survei dan mayoritas lontar dalam kondisi jelek atau mengalami kerusakan. Hal ini menyebabkan beberapa karakter hilang, tetapi masih bisa diprediksi kata yang muncul. Sementara lontar dengan kondisi parah dan tercabik-cabik jadi tantangan sendiri. Di sinilah AI bisa diimplementasikan untuk memprediksi kata yang hilang,” katanya.
Tantangan lainnya adalah terkait dengan banyaknya ekstrak dataset aksara dengan gaya penulisan yang berbeda-beda. Sebab, karakter huruf dalam lontar memiliki gaya tersendiri sehingga perlu pengenalan dan pencermatan data aksara.
Kepala Pusat Riset Kecerdasan Artifisial dan Keamanan Siber Badan Riset dan Inovasi Nasional (BRIN)Anto Satriyo Nugroho mengatakan, dukungan AI terutama pengolahan citra dapat digunakan untuk mengolah warisan budaya. Dengan begitu, artefak budaya, seperti tulisan, lukisan, dan patung yang berusia puluhan hingga ribuan tahun mampu bercerita peristiwa historis di masa lampau.