Luncurkan ”Video Intelligence API”, Google Bisa Kenali Obyek dalam Video
Oleh
Prasetyo Eko P
·2 menit baca
SAN FRANCISCO, KOMPAS — Bayangkan Anda harus mengedit atau mencari potongan gambar dari sebuah rekaman video dengan durasi berjam-jam. Atau Anda adalah seorang editor di sebuah perusahaan media yang menerima kiriman begitu banyak video dari reporter dan videografer.
Untuk mencari obyek, gambar, atau potongan video yang dibutuhkan, tentu akan sangat menguras waktu dan energi jika harus menonton satu per satu rekaman video tersebut. Namun, dengan layanan yang baru saja diluncurkan Google, pekerjaan yang bisa menghabiskan waktu berjam-jam itu kini bisa dikerjakan dalam hitungan detik.
Dalam acara konferensi Google Cloud Next di Moscone Center West, San Francisco, Amerika Serikat, Google meluncurkan apa yang disebut ”Video Intelligence API (application programming interface)”. Peluncuran layanan itu dilakukan oleh Li Fei-Fei, Kepala Ilmuwan Artificial Intelligence dan Machine Learning Google.
”Ratusan jam video diunggah setiap menit. Kekayaan isi video menjadi tantangan teknologi selama bertahun-tahun. Faktanya, banyak dari kami, para ilmuwan komputer, memandang video sebagai materi gelap dalam jagat digital. Hari ini, saya dengan gembira meluncurkan API yang benar-benar baru, didukung machine learning, yaitu Video Intelligence API,” kata Li saat menjadi pembicara di Google Cloud Next, Rabu (8/3) waktu setempat atau Kamis (9/3) dini hari WIB.
Selama ini, komputer belum bisa memahami apa isi sebuah video tanpa dilakukan tagging secara manual. ”Kami kini mulai menemukan cahaya di dalam materi gelap jagat digital,” ujar Li.
Dalam demo yang dilakukan Google di panggung terlihat bagaimana Video Intelligence API bekerja. Pertama, diputar video sebuah iklan dari ajang Superbowl.
Dengan API itu, diketahui apa saja isi potongan gambar dalam video, seperti anjing dan pemandangan jalan serta pegunungan. Tak hanya itu, API ini juga mengetahui jenis anjing yang ada dalam video tersebut. Video Intelligence API juga bisa mengetahui bahwa video tersebut adalah sebuah iklan.
Dalam demo lain, dengan hanya mengetik kata pantai dalam kotak pencarian, muncul semua potongan video pantai, di dalam video, termasuk panjang dan waktu potongan video itu dalam sebuah video.
”Video Intelligence API menggunakan model deep-learning yang sangat kuat, dibangun dengan kerangka kerja seperti TensorFlow dan digunakan untuk platform media besar seperti Youtube,” ujar Li.
Li menekankan pentingnya kecerdasan artifisial dalam kehidupan, dan terutama perusahaan. Namun, banyak perusahaan yang kesulitan bagaimana menggunakannya.
Menurut Li, salah satu tujuan utama Google adalah membuat machine learning sebagai alat organisasi, perusahaan, atau bisnis dalam memperbaiki layanan. Video Intelligence API ditujukan untuk perusahaan yang ingin membangun katalog media dan memudahkan menangani atau manajemen video.