DeepSeek, một công ty AI có trụ sở tại Trung Quốc, đã ra mắt DeepSeek-R1-Lite-Preview để cải thiện khả năng lập luận và giải quyết vấn đề. Được thông báo trong một bài đăng trên X, hệ thống được định vị là đối thủ cạnh tranh với các nhà lãnh đạo trong ngành như OpenAI.
Các bình luận viên tin rằng sự minh bạch của DeepSeek là mỉa mai khi các công ty ở phương Tây chưa giải quyết những khoảng trống này.
Ra mắt mới của DeepSeek AI có thể thực hiện toán tốt hơn
DeepSeek, một công ty AI có trụ sở tại Trung Quốc, đã giới thiệu một phiên bản mới của hệ thống AI của mình có tên là DeepSeek-R1-Lite-Preview. Trong một bài đăng trên X, họ cho biết rằng hệ thống AI mới đã cải thiện khả năng lập luận và giải quyết vấn đề.
Theo DeepSeek, bản xem trước hoạt động tốt trên các tiêu chuẩn như AIME (Kỳ thi Toán học Mời Mỹ) và MATH, đo lường khả năng giải quyết vấn đề và lập luận. Vì AI dường như có kỹ năng xử lý các vấn đề toán học và logic phức tạp, nó có thể sẵn sàng cạnh tranh với ChatGPT của OpenAI và đặc biệt là với OpenAI o1.
Trong tuần này, Le Chat của Mistral AI cũng đã thông báo cập nhật để cho phép truy cập miễn phí vào các tính năng mới. Các buổi ra mắt dường như đang tạo ra sự cạnh tranh khốc liệt trong thị trường AI sinh, vượt qua những thiếu sót của các sản phẩm khác.
DeepSeek suy nghĩ lớn tiếng khác với ChatGPT
DeepSeek cho biết AI của họ có thể hiển thị lý luận theo từng bước theo thời gian thực để làm cho quá trình suy nghĩ của nó trở nên minh bạch hơn. Trong khi đó, công ty AI cũng cho biết họ sẽ phát hành mô hình mã nguồn mở và các công cụ phát triển API trong những ngày tới.
Theo một bảng so sánh được trích dẫn bởi bình luận viên AI và công nghệ Andrew Curran, DeepSeek-R1-Lite-Preview đạt điểm cao nhất trong các tham số như AIME (52.5) và Codeforces (1450), vượt trội hơn các đối thủ như OpenAI o1-preview và Claude 3.5 Sonnet.
Nó cũng dẫn đầu trong MATH-500 (91.6), chỉ ra hiệu suất cao trong các nhiệm vụ giải quyết vấn đề nâng cao. Tuy nhiên, nó vẫn kém trong GPQA Diamond (58.5) và Zebra Logic (56.6) so với các mô hình như OpenAI o1-preview (73.3 và 71.4, tương ứng). Các con số có nghĩa là vẫn còn chỗ cho sự cải thiện trong các lĩnh vực kiến thức chung và lý luận logic.
Hai tháng sau thông báo o1-preview, và khả năng lập luận Chain-of-Thought của nó đã được tái hiện. Cá Voi giờ đây có thể lập luận. DeepSeek cho biết phiên bản chính thức của DeepSeek-R1 sẽ hoàn toàn mã nguồn mở. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Andrew Curran (@AndrewCurran_) Ngày 20 tháng 11 năm 2024
Cryptopolitan đã thử nghiệm các tính năng của buổi ra mắt để có một đánh giá không thiên kiến. Đầu tiên, trò chuyện của DeepSeek yêu cầu người dùng đăng nhập. Trò chuyện dưới tính năng 'Deep Think' giới hạn cuộc trò chuyện tối đa 50 tin nhắn mỗi ngày. Chúng tôi có thể nói rằng Deepseek suy nghĩ to lớn trong khi cũng ước lượng thời gian phản hồi của nó. Nó cũng đã giải quyết vấn đề toán mà chúng tôi đưa ra theo một thứ tự logic. So với đó, ChatGPT 4o mất ít thời gian hơn để đưa ra giải pháp nhưng không trình bày lý luận từng bước cho cùng một vấn đề.
Cách DeepSeek phản hồi với các vấn đề toán họcCách ChatGPT-4o phản hồi với các vấn đề toán học
Người có ảnh hưởng Bilawal Sidhu đã chỉ trích o1 và cho rằng, “Thật mỉa mai khi mô hình o1 của OpenAI ẩn giấu khả năng lập luận chuỗi suy nghĩ của mình, trong khi DeepSeek-R1 của Trung Quốc lại làm điều đó minh bạch với người dùng. Lẽ ra nó nên ngược lại?”
Nói như vậy, Trung Quốc có một khung pháp lý toàn diện về AI. Vào ngày 13 tháng 7 năm 2023, nhiều cơ quan của Trung Quốc, bao gồm Cục Quản lý Không gian mạng Trung Quốc (CAC) và Bộ Giáo dục, đã giới thiệu các quy định mới cho các công nghệ AI sinh. Những quy tắc này, được gọi là Quy định AI sinh, chính thức có hiệu lực vào năm ngoái vào ngày 15 tháng 8.
Phạm vi của quy định được cho là bao gồm việc sử dụng thuật toán, công nghệ tổng hợp sâu, việc sử dụng tất cả các công nghệ AI sinh và một số hoạt động công nghệ khác. Và với phương pháp lập luận minh bạch, hiệu suất mạnh mẽ trên các tiêu chuẩn cạnh tranh và kế hoạch phát hành các công cụ mã nguồn mở, DeepSeek đang đẩy ranh giới của AI sinh ở Trung Quốc và giữa các đối thủ cạnh tranh toàn cầu.
Hệ thống Bước-Đến-Bước Để Khởi Động Sự Nghiệp Web3 Của Bạn và Đạt Được Công Việc Crypto Lương Cao Trong 90 Ngày.