OpenAI telah merilis beberapa model kecerdasan buatan baru dengan skema penamaan yang direvisi — dimulai dengan model OpenAI o1 terbarunya yang katanya dapat “berpikir sebelum menjawab.”

"Untuk tugas penalaran yang kompleks, ini merupakan kemajuan yang signifikan dan mewakili tingkat kemampuan AI yang baru," kata OpenAI dalam posting blog pada 12 September. "Mengingat hal ini, kami menyetel ulang penghitung kembali ke angka satu dan menamai seri ini OpenAI o1."

Model-model baru ini dapat berpikir dengan tenang dan menggunakan penalaran “rantai pemikiran” untuk memecahkan tugas-tugas yang rumit — khususnya dalam STEM (sains, teknologi, rekayasa, dan matematika) dan tugas-tugas yang terkait dengan pengkodean, kata OpenAI.

Sumber: OpenAI

Perusahaan AI itu membagikan video OpenAI o1 yang membuat kode permainan video dari perintah dan memecahkan teka-teki logika kompleks, antara lain.

Model “pratinjau” dan “mini” OpenAI o1 telah tersedia untuk pelanggan ChatGPT Plus dan perusahaan berencana untuk merilis versi yang lebih baik dalam beberapa bulan mendatang.

OpenAI berbagi data yang menunjukkan OpenAI o1 mengalahkan GPT-4o dalam beberapa tolok ukur, termasuk topik sains tingkat PhD dalam Biologi, Kimia, dan Fisika dan beberapa ujian sekolah menengah atas di Amerika Serikat.

Model peningkatan OpenAI o1 dibandingkan dengan GPT-4o pada beberapa tolok ukur. Sumber: OpenAI

Karena fokus OpenAI o1 mini pada kemampuan penalaran STEM, OpenAI tidak memiliki pengetahuan yang luas di area lain di luar fokus sempitnya.

“[Pengetahuan] faktualnya tentang topik non-STEM seperti tanggal, biografi, dan hal-hal sepele sebanding dengan LLM kecil seperti GPT-4o mini.”

“Kami akan meningkatkan batasan ini di versi mendatang, serta bereksperimen dengan memperluas model ke modalitas dan spesialisasi lain di luar STEM,” tambahnya.

Pakar industri mengantisipasi OpenAI akan merilis model AI yang berfokus pada penalaran pada bulan September dengan nama kode Strawberry.

Namun, OpenAI tidak mengungkapkan perbedaan antara berbagai model yang sedang dikembangkan.

Majalah: Taruhan $1 juta ChatGPT tidak akan mengarah pada AGI, penggunaan AI cerdas Apple, jutawan AI melonjak: AI Eye