Pada hari ini, kita sedia melihat penggunaan kecerdasan buatan dalam penjanaan atau generatif teks dan gambar. Selain itu, kini Meta turut hadir dengan model tersendiri yang membolehkan penjanaan audio dinamakan Voicebox.
Meta menyatakan Voicebox dibangunkan dalam memudahkan orang dalam pelbagai perkara, termasuk membantu mereka yang mempunyai masalah penglihatan untuk mendengar mesej bertulis daripada rakan-rakan menggunakan suara mereka sendiri. Ia juga boleh dikembangkan untuk membolehkan seseorang mendengar terjemahan ke bahasa lain dalam suara yang sama, disamping menggunakannya untuk watak-watak dalam permainan.
Buat masa ini, Meta hanya berkongsi kertas kajian sahaja, dan tidak menawarkan model berkenaan untuk penggunaan umum lagi. Hal ini mungkin kerana potensi penyalahgunaan – terutamanya apabila boleh menjana audio menggunakan suara pihak lain.
Selain Meta, beberapa pihak lain juga sedang melihat kepada arena penjanaan audio ini.
- Sumber
- Meta



