Startup AI suara ElevenLabs pada hari Rabu memperkenalkan fitur yang memungkinkan Anda mengunggah berbagai jenis konten untuk membuat podcast multi-speaker untuk Anda, mirip dengan NotebookLM Google.
Fitur tersebut, yang disebut GenFM, dapat ditemukan di aplikasi iOS ElevenLabs Reader milik perusahaan. Saat ini GenFM mendukung 32 bahasa, antara lain Inggris, Hindi, Portugis, China, Spanyol, Prancis, Jerman, Jepang, dan lainnya.
Untuk menggunakan GenFM, Anda terlebih dahulu mengupload video, teks, atau dokumen YouTube. Aplikasi kemudian memilih dua suara secara otomatis untuk membuat podcast. Ada lebih dari selusin suara yang tersedia, catat perusahaan itu.
Salah satu layar menarik yang mungkin Anda lihat saat aplikasi menyiapkan podcast yang dihasilkan AI adalah “Menaburkan beberapa umms” dan “menambahkan beberapa jeda yang bijaksana.” Pada saat alat membantu manusia menghilangkan “Ums” dan “Ahs,” ElevenLabs menambahkan elemen manusia ke podcast yang dihasilkan AI.
“Kami berdebat tentang seberapa banyak yang harus memperkenalkan 'ums,' 'ahs,' 'mhmms'/ tawa/kata-kata yang mirip dengan pengisi atau lapisan dialog manusia — kami bertujuan untuk mencapai keseimbangan yang tepat antara percakapan alami dan manusia serta memberikan manfaat dari konten tersebut. ,” Jack McDermott, yang mengawasi pertumbuhan seluler di ElevenLabs mengatakan kepada TechCrunch melalui email.
“Saat kami melihat podcast berdurasi panjang yang luar biasa di luar sana, kami menemukan [fewer] interupsi dan alur percakapan yang lebih alami dan berwawasan luas,” katanya. “Tipe itu…