Meta Luncurkan AudioCraft, Bisa Hasilkan Suara dan Musik dari Teks
CELEBESMEDIA.ID, Makassar - Meta meluncurkan AudioCraft
yaitu program berbasis teknologi kecerdasan buatan (AI) terbaru yang mampu
menghasilkan audio dan musik dari teks.
“Bayangkan seorang musisi profesional dapat menjelajahi
komposisi baru tanpa harus memainkan satu nada pun pada instrumen. Atau pemilik
usaha kecil menambahkan soundtrack ke video iklan terbaru mereka di Instagram
dengan mudah," kata Meta, Rabu (2/8).
Diberitakan ANTARA, AudioCraft terdiri atas tiga model yaitu
MusicGen yang dapat membuat musik, AudioGen yang menghasilkan efek suara, dan
EnCodec sebagai dekoder AI generatif.
Model MusicGen dilatih menggunakan 400 ribu rekaman musik
bersama dengan teks deskripsi dan metadata. Meta menyebutkan memiliki koleksi
musik dengan total durasi 20 ribu jam yang dilisensikan khusus untuk melatih
MusicGen.
"Dengan lebih banyak kontrol, kami rasa MusicGen dapat
berubah menjadi jenis instrumen baru – seperti synthesizer ketika pertama kali
muncul," kata Meta.
Untuk menggunakan MusicGen pengguna hanya perlu memasukkan
deskripsi tentang instrumen yang ingin dihasilkan contohnya "instrumen
jazz, tempo menengah, piano bersemangat" atau "musik elektronik 80-an
dengan ketukan drum".
Sedangkan AudioGen dilatih menggunakan efek suara yang umum
digunakan dan mampu menghasilkan berbagai suara seperti gonggongan anjing,
bunyi klakson mobil, atau suara langkah kaki di lantai kayu.
Terakhir, Meta menghadirkan versi terbaru EnCodec yang dapat
menghasilkan musik dengan kualitas tinggi menggunakan komponen yang lebih
sedikit.
Raksasa teknologi itu meluncurkan AudioCraft sebagai model
open-source agar dapat dimanfaatkan oleh peneliti dan praktisi untuk melatih
model mereka menggunakan dataset yang dimilikinya serta memajukan ranah
pembuatan musik dan audio menggunakan AI.
Meskipun terlihat canggih, Meta mengakui bahwa kumpulan data
yang digunakan untuk melatih model AudioCraft masih kurang beragam khususnya
pada kumpulan data musik.
Sebagian besar data yang digunakan untuk melatih MusicGen
adalah musik bergaya barat. Selain itu, teks dan metadata yang digunakan terbatas
hanya dalam bahasa Inggris.
“Dengan membagikan kode untuk AudioCraft, kami berharap
peneliti lain dapat lebih mudah menguji pendekatan baru untuk membatasi atau
menghilangkan potensi bias dan penyalahgunaan model generatif,” ujar perusahaan
pimpinan Mark Zuckerberg itu.