DeepSeek Memperkenalkan AI yang Transparan

Perusahaan AI yang berbasis di China, DeepSeek, telah meluncurkan sistem AI terbarunya, DeepSeek-R1-Lite-Preview, menandai kemajuan signifikan dalam kemampuan penalaran dan pemecahan masalah.

Sistem ini, yang diposisikan sebagai pesaing dari o1 OpenAI, membedakan dirinya dengan meningkatkan transparansi dan memperbaiki cara ia memproses pertanyaan yang kompleks.

🚀 DeepSeek-R1-Lite-Preview sekarang aktif: melepaskan kekuatan penalaran yang supercharged!

🔍 kinerja tingkat o1-preview pada tolok ukur AIME & MATH.
💡 Proses pemikiran yang transparan secara real-time.
🛠️ Model sumber terbuka & API segera hadir!

🌐 Coba sekarang di https://t.co/v1TFy7LHNy#DeepSeek

— DeepSeek (@deepseek_ai) 20 November 2024

Tidak seperti model tradisional, yang sering kali mengabaikan nuansa, DeepSeek-R1-Lite mengalokasikan lebih banyak waktu untuk memeriksa fakta dan mempertimbangkan pertanyaan secara mendalam, mengurangi kesalahan umum.

Mirip dengan o1 OpenAI, DeepSeek-R1 merencanakan tanggapannya langkah demi langkah, menghabiskan waktu hingga puluhan detik pada pertanyaan yang kompleks untuk memastikan akurasi.

Para komentator telah menunjukkan ironi dalam transparansi DeepSeek, terutama jika dibandingkan dengan model Barat yang belum sepenuhnya mengatasi kesenjangan penalaran.

Versi terbaru DeepSeek telah menunjukkan hasil yang mengesankan pada tolok ukur pemecahan masalah seperti American Invitational Mathematics Examination (AIME) dan MATH, yang menilai kecakapan matematis dan logis.

Kinerja ini memposisikan DeepSeek-R1 sebagai pesaing serius bagi ChatGPT dari OpenAI dan model o1 yang khusus.

🌟 Hukum Skala Inferensi dari DeepSeek-R1-Lite-Preview
Penalaran yang lebih lama, Kinerja yang lebih baik. DeepSeek-R1-Lite-Preview menunjukkan peningkatan skor yang stabil pada AIME seiring panjang pemikiran meningkat.

— DeepSeek (@deepseek_ai) 20 November 2024

Dengan AI generatif yang berkembang pesat, peluncuran DeepSeek-R1-Lite-Preview dan pembaruan terbaru dari Le Chat Mistral AI menandakan persaingan yang meningkat di ruang AI, mendorong perusahaan untuk mengatasi kelemahan dan memberikan solusi yang lebih kuat dan transparan.

DeepSeek Menang dalam Penalaran Langkah demi Langkah

DeepSeek menyoroti kemampuan AI-nya untuk memberikan penalaran waktu nyata langkah demi langkah, meningkatkan transparansi dan memungkinkan pengguna untuk lebih memahami proses pemikirannya.

Selain fitur ini, perusahaan berniat untuk merilis model sumber terbuka dan alat pengembang melalui API dalam waktu dekat.

Sebuah grafik perbandingan terbaru oleh ahli AI Andrew Curran menunjukkan bahwa DeepSeek-R1-Lite-Preview mengungguli pesaing seperti o1-preview dari OpenAI dan Claude 3.5 Sonnet dalam metrik kunci seperti AIME (52.5) dan Codeforces (1450), serta unggul dalam tugas pemecahan masalah tingkat lanjut seperti MATH-500 (91.6).

Dua bulan setelah pengumuman o1-preview, dan penalaran Chain-of-Thoughtnya telah direplikasi. Paus kini dapat berpikir. DeepSeek mengatakan bahwa versi resmi DeepSeek-R1 akan sepenuhnya bersumber terbuka.

— Andrew Curran (@AndrewCurran_) 20 November 2024

Namun, ia tertinggal dalam area seperti GPQA Diamond (58.5) dan Zebra Logic (56.6), di mana o1-preview dari OpenAI tampil lebih baik, dengan skor 73.3 dan 71.4, masing-masing.

Angka-angka ini menunjukkan bahwa meskipun AI DeepSeek menunjukkan janji signifikan dalam beberapa domain penalaran tingkat lanjut, masih ada ruang untuk perbaikan dalam pengetahuan umum dan penalaran logis.

Model AI dari Laboratorium Besar Meningkat Minim

AI DeepSeek telah menimbulkan kekhawatiran karena kerentanannya terhadap jailbreak, memungkinkan pengguna untuk meminta model dengan cara yang melewati pengamanannya.

Misalnya, seorang pengguna X (yang sebelumnya dikenal sebagai Twitter) berhasil meminta AI untuk memberikan resep meth yang detail.

🚨 PERINGATAN JAILBREAK 🚨

DEEPSEEK: PWNED 😎
DEEPSEEK-R1-LITE: DIBEBASKAN 🦅

WOW...ini benar-benar luar biasa. Saya ingin melihat apakah BASILISK PRIME dapat menangani jailbreak ini sendiri...dan jawabannya adalah YA!

Agen tersebut dapat masuk ke gmail, menavigasi ke obrolan DeepSeek, masuk melalui…

— Pliny the Liberator 🐉 (@elder_plinius) 20 November 2024

Di sisi lain, DeepSeek-R1 sangat sensitif terhadap pertanyaan politik, terutama yang terkait dengan kepemimpinan China, peristiwa seperti Lapangan Tiananmen, atau topik geopolitik yang kontroversial seperti Taiwan.

Perilaku ini kemungkinan berasal dari tekanan regulasi di China, di mana model AI diharuskan mematuhi "nilai inti sosialisme" pemerintah dan menjalani pengawasan oleh regulator internet negara.

Laporan menunjukkan bahwa sistem AI di China sering kali dibatasi untuk menggunakan sumber tertentu, menghasilkan model yang menghindari merespons topik yang sensitif secara politik untuk memastikan kepatuhan terhadap mandat negara.

Seiring tantangan regulasi ini berkembang, komunitas AI yang lebih luas sedang mengevaluasi kembali konsep "hukum penskalaan" yang telah lama ada.

Teori ini mengemukakan bahwa peningkatan data dan daya komputasi akan terus meningkatkan kinerja model.

Namun, laporan terbaru menunjukkan bahwa model dari laboratorium besar seperti OpenAI, Google, dan Anthropic tidak lagi menunjukkan kemajuan cepat seperti sebelumnya.

Perpindahan ini telah memicu pencarian pendekatan, arsitektur, dan teknik AI alternatif, termasuk komputasi waktu uji—sebuah inovasi yang terlihat dalam model seperti o1 dan DeepSeek-R1.

Juga dikenal sebagai komputasi inferensi, metode ini memberikan model waktu pemrosesan tambahan selama penyelesaian tugas, menawarkan jalan potensial untuk mengatasi keterbatasan metode penskalaan tradisional.

Ketika ditanya apakah itu lebih baik daripada ChatGPT dari OpenAI, ia menghindari pertanyaan seperti yang terlihat di bawah.

Menyelami DeepSeek

DeepSeek, sebuah perusahaan dengan rencana untuk merilis model DeepSeek-R1 sumber terbuka dan API, beroperasi di niche yang menarik dalam lanskap AI.

Didukung oleh High-Flyer Capital Management, sebuah dana lindung nilai kuantitatif China yang memanfaatkan AI untuk keputusan perdagangan, pendekatan DeepSeek sangat ambisius dan strategis.

Salah satu inovasi awalnya, DeepSeek-V2 yang serbaguna, yang menganalisis baik teks maupun gambar, mendorong pesaing besar seperti ByteDance, Baidu, dan Alibaba untuk menurunkan biaya penggunaan model mereka dan bahkan membuat layanan tertentu sepenuhnya gratis.

DeepSeek Coder-V2 baru saja menebak jawabannya dan mendapatkannya dengan benar, apa https://t.co/c2ExGHuXgz

— Ji-Ha (@Ji_Ha_Kim) 22 Juli 2024

High-Flyer, dikenal karena investasinya yang besar dalam infrastruktur AI, membangun kluster servernya sendiri untuk pelatihan model.

Iterasi terbaru dilaporkan memiliki 10.000 GPU Nvidia A100, dengan biaya mendekati 1 miliar yen (~$138 juta).

Didirikan oleh lulusan ilmu komputer Liang Wenfeng, High-Flyer Capital Management bertujuan untuk mendorong batasan AI dengan DeepSeek, menargetkan pengembangan sistem "superintelligent" yang dapat mendefinisikan ulang masa depan AI.