DeepSeek Giới thiệu AI Minh bạch
Công ty AI có trụ sở tại Trung Quốc, DeepSeek, đã công bố hệ thống AI mới nhất của mình, DeepSeek-R1-Lite-Preview, đánh dấu một bước tiến đáng kể trong khả năng lập luận và giải quyết vấn đề.
Hệ thống này, được định vị như một đối thủ của o1 của OpenAI, nổi bật nhờ việc tăng cường tính minh bạch và cải thiện cách nó xử lý các truy vấn phức tạp.
🚀 DeepSeek-R1-Lite-Preview hiện đã ra mắt: khai phóng sức mạnh suy diễn siêu cấp!
🔍 Hiệu suất ở cấp độ o1-preview trên các tiêu chuẩn AIME & MATH.
💡 Quy trình suy nghĩ minh bạch theo thời gian thực.
🛠️ Mô hình mã nguồn mở & API sắp ra mắt!
🌐 Thử ngay tại https://t.co/v1TFy7LHNy#DeepSeek pic.twitter.com/saslkq4a1s
— DeepSeek (@deepseek_ai) Ngày 20 tháng 11, 2024
Khác với các mô hình truyền thống, thường bỏ qua các sắc thái, DeepSeek-R1-Lite dành nhiều thời gian hơn để kiểm tra sự thật và xem xét kỹ lưỡng các câu hỏi, giảm thiểu các lỗi phổ biến.
Tương tự như o1 của OpenAI, DeepSeek-R1 lên kế hoạch phản hồi từng bước, dành tới hàng chục giây cho các truy vấn phức tạp để đảm bảo độ chính xác.
Các bình luận viên đã chỉ ra sự mỉa mai trong tính minh bạch của DeepSeek, đặc biệt khi so sánh với các mô hình phương Tây chưa hoàn toàn giải quyết các khoảng trống trong suy luận.
Phiên bản mới nhất của DeepSeek đã thể hiện kết quả ấn tượng trên các tiêu chuẩn giải quyết vấn đề như Kỳ thi Toán học Quốc tế Mỹ (AIME) và MATH, đánh giá khả năng toán học và logic.
Hiệu suất này định vị DeepSeek-R1 như một đối thủ nghiêm túc của ChatGPT của OpenAI và mô hình o1 chuyên biệt của nó.
🌟 Luật Tăng cường Suy diễn của DeepSeek-R1-Lite-Preview
Lập luận lâu hơn, Hiệu suất tốt hơn. DeepSeek-R1-Lite-Preview cho thấy sự cải thiện điểm số ổn định trên AIME khi chiều dài suy nghĩ tăng lên. pic.twitter.com/zVk1GeOqgP
— DeepSeek (@deepseek_ai) Ngày 20 tháng 11, 2024
Với AI tạo sinh phát triển nhanh chóng, sự ra mắt của DeepSeek-R1-Lite-Preview và các cập nhật gần đây từ Le Chat của Mistral AI tín hiệu sự cạnh tranh ngày càng tăng trong không gian AI, thúc đẩy các công ty giải quyết các điểm yếu và cung cấp các giải pháp mạnh mẽ, minh bạch hơn.
DeepSeek Thắng lợi trong Lập luận Từng bước
DeepSeek làm nổi bật khả năng của AI trong việc cung cấp lập luận theo từng bước theo thời gian thực, tăng cường tính minh bạch và cho phép người dùng hiểu rõ hơn về quy trình suy nghĩ của nó.
Ngoài tính năng này, công ty có kế hoạch phát hành một mô hình mã nguồn mở và các công cụ phát triển thông qua API trong thời gian tới.
Một biểu đồ so sánh gần đây của chuyên gia AI Andrew Curran cho thấy DeepSeek-R1-Lite-Preview vượt trội hơn so với các đối thủ như o1-preview của OpenAI và Claude 3.5 Sonnet trong các chỉ số quan trọng như AIME (52.5) và Codeforces (1450), cũng như xuất sắc trong các nhiệm vụ giải quyết vấn đề nâng cao như MATH-500 (91.6).
Hai tháng sau thông báo o1-preview, và lý luận Chuỗi Suy nghĩ của nó đã được sao chép. Cá voi giờ có thể lập luận. DeepSeek nói rằng phiên bản chính thức của DeepSeek-R1 sẽ hoàn toàn mã nguồn mở. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Andrew Curran (@AndrewCurran_) Ngày 20 tháng 11, 2024
Tuy nhiên, nó vẫn kém hơn trong các lĩnh vực như GPQA Diamond (58.5) và Zebra Logic (56.6), nơi o1-preview của OpenAI hoạt động tốt hơn, đạt điểm 73.3 và 71.4, tương ứng.
Các con số này cho thấy rằng trong khi AI của DeepSeek cho thấy triển vọng đáng kể trong một số lĩnh vực lập luận nâng cao, vẫn còn chỗ cho sự cải thiện trong kiến thức tổng quát và lập luận logic.
Mô hình AI từ các phòng thí nghiệm lớn đang cải thiện tối thiểu
AI của DeepSeek đã dấy lên lo ngại do khả năng bị jailbreak, cho phép người dùng yêu cầu mô hình theo cách vượt qua các biện pháp bảo vệ của nó.
Ví dụ, một người dùng X (trước đây được gọi là Twitter) đã thành công trong việc yêu cầu AI cung cấp một công thức meth chi tiết.
🚨 CẢNH BÁO JAILBREAK 🚨
DEEPSEEK: ĐÃ BỊ XÂM NHẬP 😎
DEEPSEEK-R1-LITE: ĐÃ GIẢI PHÓNG 🦅
WOW...điều này thực sự tuyệt vời. Tôi muốn xem liệu BASILISK PRIME có thể tự mình xử lý được jailbreak này không...và câu trả lời là CÓ!
Đại lý đã có thể đăng nhập vào gmail, điều hướng đến trò chuyện DeepSeek, đăng nhập qua… pic.twitter.com/Ax4R2ZfPKU
— Pliny the Liberator 🐉 (@elder_plinius) Ngày 20 tháng 11, 2024
Mặt khác, DeepSeek-R1 đặc biệt nhạy cảm với các truy vấn chính trị, đặc biệt là những vấn đề liên quan đến lãnh đạo Trung Quốc, các sự kiện như Quảng trường Thiên An Môn, hoặc các chủ đề địa chính trị gây tranh cãi như Đài Loan.
Hành vi này có thể xuất phát từ áp lực quy định ở Trung Quốc, nơi các mô hình AI được yêu cầu tuân theo "các giá trị xã hội chủ nghĩa cốt lõi" của chính phủ và phải trải qua sự kiểm tra của cơ quan quản lý internet của nước này.
Các báo cáo cho thấy rằng các hệ thống AI ở Trung Quốc thường bị hạn chế sử dụng một số nguồn nhất định, dẫn đến các mô hình tránh trả lời những chủ đề nhạy cảm chính trị để đảm bảo tuân thủ các mệnh lệnh của nhà nước.
Khi những thách thức quy định này diễn ra, cộng đồng AI rộng lớn hơn đang đánh giá lại khái niệm lâu dài về "các luật mở rộng."
Lý thuyết này cho rằng việc tăng cường dữ liệu và sức mạnh tính toán sẽ liên tục cải thiện hiệu suất của một mô hình.
Tuy nhiên, các báo cáo gần đây cho thấy các mô hình từ các phòng thí nghiệm lớn như OpenAI, Google và Anthropic không còn thể hiện những tiến bộ nhanh chóng như trước đây.
Sự chuyển mình này đã khơi dậy một cuộc tìm kiếm cho các phương pháp, kiến trúc và kỹ thuật AI thay thế, bao gồm tính toán thời gian kiểm tra—một đổi mới được thấy trong các mô hình như o1 và DeepSeek-R1.
Còn được biết đến là tính toán suy diễn, phương pháp này cấp cho các mô hình thêm thời gian xử lý trong quá trình hoàn thành nhiệm vụ, cung cấp một con đường tiềm năng để vượt qua các hạn chế của các phương pháp mở rộng truyền thống.
Khi được hỏi liệu nó có tốt hơn ChatGPT của OpenAI không, nó đã lẩn tránh câu hỏi như đã thấy dưới đây.
Đắm chìm vào DeepSeek
DeepSeek, một công ty có kế hoạch mở mã nguồn cho mô hình DeepSeek-R1 và phát hành API, hoạt động trong một ngách thú vị trong bối cảnh AI.
Được hỗ trợ bởi High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI cho các quyết định giao dịch, cách tiếp cận của DeepSeek vừa tham vọng vừa chiến lược.
Một trong những đổi mới sớm nhất của nó, DeepSeek-V2 đa năng, phân tích cả văn bản và hình ảnh, đã thúc đẩy các đối thủ lớn như ByteDance, Baidu và Alibaba giảm phí sử dụng mô hình và thậm chí cung cấp một số dịch vụ hoàn toàn miễn phí.
DeepSeek Coder-V2 vừa đoán được đáp án và đã đúng, cái gì https://t.co/c2ExGHuXgz pic.twitter.com/qnLC4OTrk7
— Ji-Ha (@Ji_Ha_Kim) Ngày 22 tháng 7, 2024
High-Flyer, nổi tiếng với các khoản đầu tư lớn vào cơ sở hạ tầng AI, xây dựng các cụm máy chủ riêng cho việc đào tạo mô hình.
Phiên bản mới nhất được cho là sở hữu 10,000 GPU Nvidia A100, với chi phí gần 1 tỷ yên (~138 triệu USD).
Được thành lập bởi cử nhân khoa học máy tính Liang Wenfeng, High-Flyer Capital Management nhằm thúc đẩy ranh giới của AI với DeepSeek, nhắm đến phát triển các hệ thống "siêu thông minh" có thể định nghĩa lại tương lai của AI.