Model Suara AI Memukau dan Membuat Pengguna Khawatir dengan Realisme yang Luar Biasa

Purna Warta – Model suara AI baru dari perusahaan rintisan Sesame telah membuat pengguna tercengang dengan realisme yang mendekati manusia, yang memicu kekaguman sekaligus kegelisahan.

Model Ucapan Percakapan (CSM) Sesame, yang diperkenalkan pada akhir Februari, telah melintasi “lembah yang luar biasa” dari ucapan yang dihasilkan AI, dengan pengguna menggambarkan reaksi emosional terhadap suaranya, “Miles” dan “Maya.”

Baca juga: Shin Bet Israel akui kegagalan cegah Penyerbuan al-Aqsa

“Saya mencoba demonya, dan sungguh mengejutkan betapa manusiawi rasanya,” tulis seorang pengguna Hacker News. “Saya hampir sedikit khawatir akan mulai merasa terikat secara emosional dengan asisten suara dengan tingkat suara seperti manusia ini.”

Teknologi, yang memungkinkan percakapan yang nyata, telah menarik perbandingan dengan fiksi ilmiah sambil menimbulkan kekhawatiran tentang potensi penyalahgunaan.

Model suara tersebut menunjukkan pola bicara alami, termasuk suara napas, tawa, dan koreksi diri—ketidaksempurnaan yang dirancang untuk meningkatkan realisme. “Di Sesame, tujuan kami adalah mencapai ‘kehadiran suara’—kualitas ajaib yang membuat interaksi lisan terasa nyata, dipahami, dan dihargai,” perusahaan tersebut menyatakan dalam sebuah posting blog.

Namun, realisme tersebut telah meresahkan beberapa pengguna. Mark Hachman, seorang editor senior di PCWorld, menggambarkan interaksinya sebagai “sangat meresahkan,” mencatat suara AI tersebut mengingatkannya pada seorang teman lama. Yang lain telah membandingkan CSM dengan Mode Suara Lanjutan OpenAI, dengan alasan bahwa suara Sesame terdengar lebih alami dan menarik.

Sesame, yang didirikan oleh Brendan Iribe, Ankit Kumar, dan Ryan Brown, telah mendapatkan investasi dari Andreessen Horowitz, Spark Capital, dan perusahaan besar lainnya. Teknologi perusahaan tersebut menggunakan model berbasis transformator multimoda yang dilatih pada kumpulan data yang luas, yang memungkinkannya menghasilkan ucapan yang, dalam uji buta, menyaingi rekaman manusia dalam konteks yang terisolasi.

Meskipun memiliki kemampuan, CSM masih belum sempurna. “Saat ini, kami benar-benar berada di lembah, tetapi kami optimis dapat bangkit,” Iribe mengakui, dengan menyebutkan masalah pada nada, waktu, dan kecepatan.

Baca juga: Hamas Sambut Baik Rencana Rekonstruksi Gaza yang Diadopsi pada Pertemuan Puncak Arab di Kairo

Kemajuan suara AI yang sangat realistis juga telah menimbulkan kekhawatiran tentang penipuan. Para ahli memperingatkan bahwa ucapan canggih yang dihasilkan AI dapat membuat penipuan, seperti phishing suara, lebih meyakinkan dari sebelumnya. Beberapa keluarga terpaksa menggunakan kata-kata rahasia untuk verifikasi.

Meskipun model Sesame saat ini tidak mengkloning suara individu, teknologi serupa dapat dimanfaatkan untuk penipuan. OpenAI sebelumnya menunda peluncuran AI suaranya sendiri karena masalah keamanan.

Sesame berencana untuk membuka sumber komponen utama penelitiannya dan memperluas dukungan bahasa. Seiring suara AI menjadi lebih mirip manusia, perdebatan tentang implikasi etisnya baru saja dimulai.

Leave a Reply

Your email address will not be published. Required fields are marked *