Meta melancarkan model kecerdasan buatan (AI) Omnilingual Automatic Speech Recognition (ASR), yang mampu mengenalpasti lebih 1600 bahasa secara automatik. Ia dibangunkan menggunakan 7 bilion parameter dan ditawarkan secara sumber terbuka menggunakan lesen Apache 2.0. Daripada jumlah 1600 bahasa ini, 78% bahasa boleh diterjemah dengan ralat bawah 10%.

Untuk melatih Omnilingual ASR ini, Meta menggunakan 249 bahasa yang mempunyai sumber penggunaan yang tinggi, 881 bahasa dengan sumber penggunaan sederhana dan 546 bahasa lagi dengan sumber penggunaan yang rendah. Menurut Meta, secara teorinya Omnilingual ASR boleh dikembangkan lagi untuk menyokong sehingga 5400 bahasa dunia. Ia jauh meninggalkan model alih bahasa Whisper oleh OpenAI yang hanya menyokong 99 bahasa utama.
Tambah Meta lagi, Omnilingual ASR turut menyokong 500 bahasa baharu yang tidak disokong oleh mana mana sistem pengenalan bahasa automatik (ASR) sebelum ini. Omnilingual ASR boleh digunakan untuk mengenalpasti bahasa dalam bentuk audio dan teks secara automatik dengan transkrip akan dihasilkan serentak.

