Cerebras melancarkan cip AI WSE-3 yang menurut mereka adalah cip inferens AI terpantas di dunia. Lebih menarik mengenainya ialah ia juga adalah cip komputer terbesar pernah dihasilkan dengan saiz. 215 x 215 mm. Cip pemproses biasanya dipotong daripada sebuah wafer silikon. WSE-3 menggunakan keseluruhan wafer silikon untuk menghasilkan sebuah cip berteknologi 5nm dengan 4 trilion transistor, 900,000 teras dan memori terbina sebesar 44GB SRAM.

Sebagai perbandingan, WSE-3 mempunyai 52 kali ganda lebih banyak teras pemproses berbanding NVIDIA H100. Ini memberikannya kemampuan kelajuan memproses puncak mencecah 125 petaFLOP. Tambah Cerebras, secara purata komputer Cerebras CS-3 yang menggunakan WSE-3 mampu melakukan pemprosesan inferens AI sehingga 20 kali ganda lebih pantas berbanding sistem pesaing.

Sebagai contoh ia boleh memproses 1,800 token sesaat untuk model Llama 3.1 8B dan 450 token sesaat untuk model Llama 3.1 70B. Cip lain di pasaran hanya mampu mencapai 300 token sesaat sahaja. Oleh sebab itu Cerebras mengatakan perbezaannya kepantasan memproses adalah seperti berubah daripada internet dial-up ke jalur lebar.

Kemampuan memproses token dengan lebih pantas membolehkan chatbot AI dan juga AI generatif menjana respons dan imej dengan lebih pantas berbanding sekarang. Sesiapa yang pernah menggunakan perkhidmatan AI akan menyedari waktu memproses arahan yang diberikan kepada AI pada ketika ini adalah agak perlahan.
Cerebras kini menawarkan perkhidmatan AI awanan mereka menerusi tiga tahap iaitu percuma dengan had API, Developer yang menawarkan akses kepada Llama 3.1 8B serta 70B dan akhir sekali Enterprise dengan model yang ditala bagi keperluan spesifik pelanggan.
