Nvidia ingin memberi tahu Anda bahwa keinginan audio teraneh Anda sekarang menjadi mungkin. Proyek AI terbaru perusahaan, bersama dengan AI NPC dan chatbot dalam game, adalah AI teks-ke-audio yang disebut Fugatto. Seperti model lainnya, audio Nvidia AI dapat membuat trek dari deskripsi sederhana, namun program ini juga dapat menghasilkan “suara yang belum pernah terdengar sebelumnya,” seperti “lolongan saksofon”, apa pun artinya.
Dalam sebuah postingan blog, Nvidia mengklaim model AI “Pisau tentara Swiss untuk suara” dapat memodifikasi suara yang ada atau membuat keseluruhan soundscapes begitu saja. Fugatto sebenarnya adalah akronim dari “Foundation Generative Audio Transformer Opus 1” yang panjangnya menjengkelkan. Ia mampu memproses suara, musik, dan kebisingan latar belakang dan menghasilkan semuanya menjadi satu trek audio. Itu juga dapat memodifikasi sumber suara yang ada.
Konyol jika menyebut sesuatu sebagai “suara yang belum pernah terdengar sebelumnya”, terutama jika suara tersebut berasal dari AI. Apa pun keluarannya, audio AI hanyalah algoritme AI yang menggunakan sumber yang ada dalam data pelatihannya untuk memberikan hasil yang mendekati perintah. Nvidia mengatakan modelnya unik karena dapat menggabungkan instruksi yang terpisah selama pelatihan dan “menciptakan soundscapes yang belum pernah terlihat sebelumnya.” Artinya, ini dapat melapisi dua efek audio berbeda untuk menciptakan sesuatu yang baru. Dalam sebuah video, Nvidia menunjukkan bagaimana ia bisa menghasilkan suara kereta api yang…