Sebuah laboratorium di Tiongkok telah meluncurkan apa yang tampaknya menjadi salah satu model AI “penalaran” pertama yang menyaingi o1 OpenAI.
Pada hari Rabu, DeepSeek, sebuah perusahaan riset AI yang didanai oleh pedagang kuantitatif, merilis pratinjau DeepSeek-R1, yang diklaim perusahaan tersebut sebagai model penalaran yang bersaing dengan o1.
Tidak seperti kebanyakan model, model penalaran secara efektif memeriksa fakta dengan menghabiskan lebih banyak waktu untuk mempertimbangkan pertanyaan atau permintaan. Hal ini membantu mereka menghindari beberapa kendala yang biasanya membuat model tersandung.
Mirip dengan o1, DeepSeek-R1 beralasan melalui tugas, perencanaan ke depan, dan melakukan serangkaian tindakan yang membantu model sampai pada jawaban. Ini bisa memakan waktu cukup lama. Seperti o1, bergantung pada kerumitan pertanyaannya, DeepSeek-R1 mungkin “berpikir” selama puluhan detik sebelum menjawab.
DeepSeek mengklaim bahwa DeepSeek-R1 (atau tepatnya DeepSeek-R1-Lite-Preview) bekerja setara dengan model pratinjau o1 OpenAI pada dua tolok ukur AI populer, AIME dan MATH. AIME menggunakan model AI lain untuk mengevaluasi kinerja model, sedangkan MATH adalah kumpulan soal kata. Tapi modelnya tidak sempurna. Beberapa komentator di X mencatat bahwa DeepSeek-R1 kesulitan dengan tic-tac-toe dan masalah logika lainnya. (O1 juga demikian.)
DeepSeek juga dapat dengan mudah di-jailbreak — yaitu, diminta sedemikian rupa sehingga mengabaikan pengamanan. Seorang pengguna X mendapatkan model untuk memberikan resep sabu secara rinci.
Dan DeepSeek-R1 tampaknya…