Meta seolah tak pernah ketinggalan dalam segala sisi teknologi. Baru-baru ini, mereka merilis salah satu teknologi AI terbaru mereka, AudioCraft, sebuah alat yang memungkinkan kreator menciptakan musik dan suara secara utuh lewat bantuan AI.
AudioCraft terdiri dari tiga model AI yang masing-masing menangani bagian berbeda untuk menghasilkan audio. Alat ini dapat menciptakan audio melalui instruksi tertulis seperti saat menggunakan ChatGPT atau AI Chatbot lainnya, mulai dari menirukan suara anjing menggongong, langkah kaki, pintu dibuka dan ditutup, hingga suara-suara umum lainnya.
Beberapa pengguna yang diberikan kesempatan khusus telah mencoba AudioCraft untuk menghasilkan audio. Suara-suara seperti siulan, sirene, hingga ombak terasa cukup natural. Namun, suara gitar saat diperintahkan membuat musik masih cukup kental terdengar seperti bukan petikan manusia.
Meta bukanlah yang pertama terjun menggabungkan musik dan AI. Google, salah satu pesaing berat Meta mengembangkan MusicLM, model bahasa yang mampu menghasilkan audio dengan durasi tertentu berdasarkan prompt atau perintah teks—saat ini baru dapat diakses oleh pengembang saja.
Kembali ke beberapa tahun silam, model audio elektronik sebetulnya bukan lagi barang baru di dunia musik. EDM adalah salah satu inovasi terbaik dalam dunia musik era digital, tetapi AI membawa industri audio dan musik ke level yang lebih tinggi. Kini, para musisi dapat menciptakan musik unik dan berkualitas dengan waktu lebih cepat berkat bantuan AI.
Meski kelihatannya saat ini AudioCraft lebih cocok untuk penggunaan di tempat-tempat tertentu seperti ruang tunggu, lift, atau sebagai musik latar video, Meta percaya AI ini dapat mengubah dan membawa gelombang lagu baru dengan cara yang sama seperti synthesizer mengubah musik pada masa kepopulerannya.
“Kami pikir MusicGen dapat menjadi jenis alat musik baru—sama seperti synthesizer saat pertama kali muncul,” terang Meta dalam sebuah blog. Meta mengakui kesulitan dalam menciptakan model AI yang mampu membuat musik karena audio seringnya mengandung jutaan titk yang sama sekali berbeda dengan konten berbasis teks saja.
Bersumber Terbuka
Meta mengatakan bahwa AudioCraft memerlukan sumber terbuka atau open source agar dapat memperkaya data yang digunakan untuk pelatihan.
“Kami mengakui bahwa dataset yang digunakan untuk melatih model kami kurang beragam. Terutama, dataset musik yang digunakan mengandung bagian yang lebih besar dari musik gaya Barat dan hanya mengandung pasangan teks dan metadata berbahasa Inggris,” kata Meta. “Dengan berbagi kode untuk AudioCraft, kami berharap peneliti lain dapat dengan lebih mudah menguji pendekatan baru untuk membatasi atau menghilangkan potensi bias dalam dan penyalahgunaan model generatif.”