Mesolitica MaLLaM ChatBot khas Bahasa Melayu di AWS, kami cuba dan ini hasilnya

LocalTechnology
9 Dec 2024 • 11:53 AM MYT
SoyaCincau
SoyaCincau

For everything that matters in tech

image is not available

Terdapat sebuah syarikat pemula di Malaysia bernama Mesolitica mengguna pakai Amazon Web Services (AWS) sebagai tapak operasi MaLLaM. MaLLaM adalah AI Large Language Model (LLM) yang direka khas untuk belajar Bahasa Melayu. MaLLaM dikatakan mampu untuk memahami nuansa seperti slang dan loghat yang diguna pakai penutur di Malaysia dan 16 bahasa pertuturan di sekitarnya. Mesolotica menggunakan 197 set data yang mengandungi hampir 200 billion token sumber terbuka berbahasa Melayu untuk melatih MaLLaM.

image is not available

Menurut AWS, langkah Mesolitica menggunakan platform AWS sebagai hos MaLLaM adalah baik kerana menggunakan AWS Trainium dan AWS Inferentia, Mesolitca boleh menjimatkan 87% kos operasi menjalankan MaLLaM dan mempertingkat output sebanyak 5.5x berbanding menggunakan hos konvensional. Tambahan pula, dengan adanya AWS cabang Asia Pacific (Malaysia), latensi mampu diturunkan sebanyak 20% menjadikan MaLLaM lebih responsif bila digunakan oleh pengguna tempatan.

MaLLaM boleh anda cuba dengan melayari laman web Mesolitica.

Percubaan ringkat Mesolitica untuk terjemahan dan percakapan loghat

Seperti yang dimaklumkan tadi, Mesolitica sudahpun boleh digunakan. Anda boleh cubanya secara percuma untuk tempoh terhad. Kami wujudkan akaun Mesolitica dan cubanya untuk lakukan terjemahan ke dalam Bahasa Melayu dan juga loghat Kelantan. Kami lagakannya dengan OpenAI ChatGPT dan juga Google Gemini.

Terjemahan daripada Bahasa Inggeris ke Bahasa Melayu

Berikut adalah teks sumber yang dicedok daripada satu artikel daripada SoyaCincau.com.

Unifi is spreading cheer among its loyal broadband customers with an irresistible offer, combining high-speed mobile connectivity with convenient flexibility. If you're a Unifi Home Broadband user, it's time to unwrap these exclusive perks and upgrade your digital lifestyle.

A 6-Month Complimentary UNI5G Mobile Plan

Existing Unifi Home Broadband customers can enjoy a 6-month complimentary trial of the UNI5G Postpaid 69 or UNI5G Postpaid 39 plans.

Depending on which plan you go for, you will get up to 60GB of High-Speed data which includes both 4G and 5G connectivity and up to 60GB of hotspot data. For UNI5G Postpaid 69, you will be automatically upgraded to Unlimited Data at no additional cost during the trial period.

Teks sumber ini disuapkan ke dalam tiga ChatBot iaitu Mesolitica, ChatGPT dan Google Gemini. Untuk terjemahan, semua ChatBot menerima prompt yang sama iaitu “adapt this into Bahasa Melayu”.

Daripada hasil terjemahan, didapati yang Mesolotica dan ChatGPT berikan terjemahan terus yang walaupun maksud setiap perkataan itu ada, kontek dan lenggok ayatnya tidak sebaik Google Gemini. Gemini berjaya sampaikan intipati ayat pertama tanpa menghilangkan perkataan daripada teks sumber. Mesolitica juga gagal untuk terjemahkan perkataan “depending” dalam perenggan ketiga yang lebih tepat diterjemah kepada “bergantung”.

Boleh disimpulan yang Gemini berjaya menterjemah teks sumber paling baik diikuti ChatGPT dan akhir sekali Mesolitica.

Terjemahan ke dalam loghat Kelantan

Mesolitica juga ia mampu fahami lenggok bahasa dan dialek tempatan. Jadi, kami suapkan ChatBot itu dengan prompt ini:

anda boleh cakap loghat kelantan?

cuba tukar ayat ini ke dalam loghat kelantan

awak dah makan?
kalau dah makan, awak makan apa tadi?
saya tadi datang daripada bandar, ada urusan sikit.

Berikut adalah hasilnya.

Mesoltica gagal hasilkan ayat terjemahan ke loghat Kelantan sebetulnya. Bukan sahaja gagal terjemah, malah dia masukkan ayat yang tidak ada di dalam prompt. ChatGPT dilihat terbaik kerana kekal berada dalam konteks. Gemini pula hampir berjaya tapi pada ayat terakhir, ada satu perkataan yang janggal iaitu “uroh”. Ia tidak pula kami temui dalam mana-mana sumber yang maksudnya adalah “urusan”.

Sumber: Bernama