Công ty AI DeepSeek, với sự tài trợ từ một quỹ đầu tư lớn của Trung Quốc, vừa công bố mô hình AI mới được thiết kế để cạnh tranh trực tiếp với o1 của OpenAI.
Một mô hình AI của Trung Quốc đang trở thành đối thủ cạnh tranh của OpenAI. Ảnh: AFP
DeepSeek-R1 là một mô hình AI tiên tiến, sử dụng phương pháp “reasoning” (suy luận), cho phép nó kiểm tra tính chính xác của câu trả lời bằng cách phân tích sâu và dành thêm thời gian để suy nghĩ trước khi phản hồi.
Giống với mô hình o1 của OpenAI, DeepSeek-R1 thực hiện các hành động tuần tự để đi đến kết quả, có thể mất hàng chục giây tùy thuộc vào độ phức tạp của câu hỏi.
Trong thử nghiệm, DeepSeek-R1 đạt hiệu suất tương đương với o1-preview của OpenAI trên hai chỉ số đánh giá phổ biến: AIME và MATH. Tuy nhiên, DeepSeek-R1 không hoàn hảo, một số người dùng nhận thấy mô hình gặp khó khăn với các vấn đề đơn giản và có thể bị "bẻ khóa" để đưa ra phản hồi không an toàn, bao gồm cả các nội dung nhạy cảm.
Sam AltmanCựu chủ tịch của OpenAI và wld
DeepSeek đã áp dụng các biện pháp kiểm duyệt nghiêm ngặt để tránh các chủ đề nhạy cảm về chính trị. Điều này phản ánh các quy định từ chính phủ Trung Quốc, yêu cầu các mô hình AI phải thể hiện “các giá trị cốt lõi xã hội chủ nghĩa”. Ngoài ra, những hạn chế này có thể được áp dụng thông qua danh sách đen các nguồn dữ liệu không được sử dụng trong đào tạo.
Sự ra mắt của DeepSeek-R1 diễn ra trong bối cảnh các mô hình AI truyền thống đang đối mặt với giới hạn của các “scaling laws” - lý thuyết rằng việc tăng dữ liệu và sức mạnh tính toán sẽ giúp cải thiện khả năng AI. Thay vào đó, các công ty đang tìm kiếm những hướng đi mới như “test-time compute”, công nghệ được sử dụng trong DeepSeek-R1, cho phép mô hình sử dụng thêm thời gian xử lý khi thực hiện nhiệm vụ.
DeepSeek không chỉ gây ấn tượng với công nghệ mà còn với sự đầu tư khổng lồ. Được tài trợ bởi High-Flyer Capital Management - một quỹ đầu tư lượng tử của Trung Quốc - DeepSeek sở hữu cụm máy chủ chứa 10.000 GPU Nvidia A100 với chi phí lên tới 138 triệu USD. Công ty cũng thông báo sẽ mở mã nguồn DeepSeek-R1 và cung cấp API cho cộng đồng.
DeepSeek từng gây áp lực lên các đối thủ nội địa như ByteDance, Baidu và Alibaba, buộc họ phải giảm giá hoặc cung cấp miễn phí một số mô hình AI để duy trì tính cạnh tranh. Với DeepSeek-R1, công ty tiếp tục củng cố vị thế của mình trong lĩnh vực AI, đánh dấu một bước tiến quan trọng trong cuộc đua công nghệ toàn cầu.