OpenAI meluncurkan model inferensi baru o3, dengan hasil uji ARC-AGI yang luar biasa 75,7%, memecahkan rekor dan memperkenalkan teknologi "penyelarasan deliberatif" untuk meningkatkan keamanan model. Model ini saat ini terbuka untuk permohonan uji coba keamanan, dan diharapkan akan diluncurkan resmi pada awal 2025. (Latar belakang: Alat pembuatan video OpenAI Sora resmi diluncurkan! 5 sorotan fitur, paket langganan dibahas sekaligus) (Latar belakang tambahan: OpenAI mengumumkan model o1 versi penuh dan paket langganan baru ChatGPT Pro, apakah biaya bulanan 200 dolar layak?) Pengembang ChatGPT, OpenAI, menyelesaikan serangkaian peluncuran produk baru selama 12 hari dengan penampilan akhir model inferensi baru "o3" dan "o3-mini", yang dirancang untuk memiliki kemampuan inferensi yang lebih kuat, bertujuan untuk menyelesaikan tugas-tugas kompleks yang memerlukan penalaran logis bertahap. Hari ini, kami membagikan evaluasi untuk versi awal model berikutnya dalam seri model o kami: OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) 20 Desember 2024 Fitur model 1) Kemampuan inferensi mencetak rekor SoTA OpenAI menyatakan bahwa model o3 menunjukkan kinerja luar biasa dalam berbagai pengujian acuan, termasuk masalah pemrograman, matematika, dan sains yang kompleks, menunjukkan kemampuan penalaran logis yang kuat. Dalam evaluasi "ARC-AGI" yang dikembangkan oleh Alignment Research Center (ARC) untuk menguji kemampuan kecerdasan buatan umum (AGI), o3 mencetak hasil luar biasa 75,7% dalam beberapa tes tidak publik, menciptakan tonggak teknologi baru (State of the Art, SoTA). Selain itu, versi o3 dengan sumber daya komputasi tinggi (high-compute configuration) mencapai hasil lebih tinggi 87,5% dalam pengujian yang sama, tetapi mungkin tidak memenuhi syarat untuk ARC-AGI-Pub (hasil tes ARC-AGI yang dapat diverifikasi secara publik) karena persyaratan sumber daya yang melebihi standar. New verified ARC-AGI-Pub SoTA! @OpenAI o3 telah mencetak hasil luar biasa 75,7% di Evaluasi Semi-Publik ARC-AGI. Dan konfigurasi o3 berkomputasi tinggi (tidak memenuhi syarat untuk ARC-AGI-Pub) mencetak 87,5% di Evaluasi Semi-Publik. 1/4 pic.twitter.com/uQA47JWkl6 — ARC Prize (@arcprize) 20 Desember 2024 2) Pilihan multi-versi OpenAI menawarkan dua versi, o3 dan o3-mini, yang dijadwalkan akan diluncurkan pada akhir Januari 2025, dengan versi lengkap o3 yang akan dirilis kemudian (tanggal spesifik belum diumumkan). Model baru ini menggunakan API Waktu Berpikir Adaptif (Adaptive Thinking Time) yang baru diluncurkan oleh OpenAI, menyediakan tiga mode inferensi yang berbeda: rendah, sedang, dan tinggi. Fitur ini memungkinkan pengguna menyesuaikan durasi "waktu berpikir" model sebelum menjawab pertanyaan sesuai kebutuhan. Dari gambar di bawah, terlihat bahwa o3-mini dapat bersaing dalam hasil inferensi dengan model o1 saat ini, tetapi secara signifikan mengurangi biaya komputasi. 3) Peningkatan keamanan OpenAI telah mengadopsi metode pelatihan baru "penyelarasan deliberatif (Deliberative alignment)", yang secara langsung mengajarkan model bahasa besar (LLMs) untuk memahami norma-norma keamanan yang dapat dijelaskan yang ditulis oleh manusia, dan memastikan bahwa mereka mematuhi norma-norma ini dalam penalaran sebelum menjawab pertanyaan. OpenAI menyatakan: Dengan metode ini, kami berhasil mengoptimalkan model seri o OpenAI, sehingga dapat menggunakan teknik penalaran "rantai pemikiran" (Chain-of-Thought, CoT), merenungkan pertanyaan pengguna, menemukan teks norma terkait dalam kebijakan internal OpenAI, dan menghasilkan respons yang lebih aman. Asal nama Perlu dicatat bahwa OpenAI melewatkan penamaan "o2" dan langsung menggunakan "o3". CEO Sam Altman menjelaskan bahwa ini dilakukan untuk menghindari kebingungan dengan penyedia telekomunikasi Inggris O2, sekaligus menunjukkan selera humor unik OpenAI. Dalam siaran langsung, ia menyatakan: "Dengan hormat kepada Telefónica (induk perusahaan O2), dan untuk melanjutkan tradisi OpenAI yang sangat buruk dalam penamaan, kami menamakannya o3." Mengundang peneliti untuk berpartisipasi dalam uji keamanan Saat ini, o3 dan o3-mini berada dalam tahap uji keamanan internal, dan OpenAI telah membuka aplikasi, mengundang peneliti eksternal untuk berpartisipasi dalam uji keamanan. Aplikasi akan ditutup pada 10 Januari 2025. Mengenai peluncuran model ini, Sam Altman dengan percaya diri menyatakan bahwa ini menandai perkembangan AI memasuki "tahap berikutnya". Mengingat laporan Bloomberg tahun ini tentang sistem peringkat AI OpenAI, tahap berikutnya setelah chatbot dan model inferensi adalah Agen—sistem AI canggih yang dapat bertindak atas nama pengguna. Ini adalah arah utama yang sedang dijelajahi dan dikembangkan baik di pasar cryptocurrency maupun di bidang Web2 saat ini. Sistem peringkat AI OpenAI. Sumber gambar: Bloomberg Laporan terkait OpenAI mengumumkan fitur baru "fine-tuning pembelajaran penguatan" yang luar biasa pada Day 2, meningkatkan akurasi pembelajaran di bidang profesional AI OpenAI mengumumkan siaran langsung selama 12 hari berturut-turut: meluncurkan banyak fitur baru, apakah konsep koin AI dapat menguntungkan? Kegagalan dalam permainan politik OpenAI, Sam Altman mungkin sulit bersaing dengan "aliansi AI" Musk dan Trump? "OpenAI meluncurkan model o3! Kemampuan inferensi ditingkatkan, membuka jalan bagi AI generasi berikutnya" artikel ini pertama kali diterbitkan di BlockTempo (BlockTempo- media berita blockchain paling berpengaruh).