OpenAI và Meta đang hợp tác để đào tạo các hệ thống AI trên các ngôn ngữ châu Phi. Dự án này, bao gồm gã khổng lồ viễn thông Pháp Orange SA, nhằm khắc phục một khoảng trống lớn trong AI. Châu Phi, một lục địa với hơn 2.000 ngôn ngữ, đã bị bỏ qua nhiều trong việc đào tạo AI.

Dự án sẽ được khởi động vào năm tới và ban đầu tập trung vào hai ngôn ngữ Tây Phi: Wolof và Pulaar. Cùng nhau, những ngôn ngữ này được nói bởi hơn 22 triệu người, nhưng các mô hình AI hiện tại không hiểu chúng.

Mục tiêu của Orange là mở rộng các công cụ giao tiếp của mình ở châu Phi và Trung Đông, nơi công ty hoạt động ở 18 thị trường. Nhưng đây không chỉ là về dịch vụ khách hàng. Giai đoạn đầu tiên sẽ sử dụng các trung tâm dữ liệu ở châu Âu và châu Phi cùng với các hệ thống đám mây công cộng để đào tạo AI. Tuy nhiên, công ty vẫn chưa làm rõ nơi họ sẽ lấy dữ liệu để đào tạo.

Mở rộng AI đến các ngôn ngữ địa phương

Steve Jarrett, Giám đốc AI của Orange, cho biết dự án chỉ mới bắt đầu với Wolof và Pulaar. Đến năm tới, họ dự định đào tạo các mô hình AI cho các ngôn ngữ khác ở vùng hạ Sahara như Lingala, Swahili và Bambara. Những ngôn ngữ này rất quan trọng đối với hàng triệu người nhưng hầu như không có trong các bộ dữ liệu AI.

Theo Jarrett, sáng kiến này là một bước tiến tới việc làm cho AI có thể tiếp cận được với mọi người, ngay cả những nhóm dân cư mù chữ hoặc bị loại trừ khỏi các tiến bộ kỹ thuật số.

OpenAI sẽ cho Orange quyền truy cập sớm vào các mô hình của mình. Điều này cho phép Orange phát triển các công cụ AI như tương tác giọng nói cho dịch vụ khách hàng. Họ cũng sẽ xử lý dữ liệu và lưu trữ từ các trung tâm dữ liệu châu Âu.

Các mô hình sẽ hoạt động như mã nguồn mở, miễn phí cho các mục đích phi thương mại như dịch vụ y tế và giáo dục. Mục tiêu rộng hơn? Triển khai các giải pháp AI tùy chỉnh cho tất cả 18 quốc gia Tây Phi nơi Orange hoạt động.

Để có bối cảnh, Wolof được nói ở Senegal, Gambia và miền nam Mauritania. Pulaar chủ yếu được sử dụng ở Senegal. Cùng nhau, những ngôn ngữ này đại diện cho một dân số đáng kể thường bị bỏ qua bởi các hệ thống AI chính thống.

Đây là một vấn đề lớn đối với các công ty như Orange, hoạt động ở những khu vực mà các ngôn ngữ địa phương chiếm ưu thế nhưng hoàn toàn không nhìn thấy đối với các công cụ như GPT của OpenAI hoặc Llama của Meta.

Tại sao “AI chủ quyền” lại quan trọng

Nỗ lực này khai thác vào khái niệm đang phát triển về “AI chủ quyền”. Ý tưởng rất đơn giản nhưng mạnh mẽ: các khu vực và quốc gia muốn kiểm soát cơ sở hạ tầng công nghệ cốt lõi mà AI dựa vào.

Bằng cách địa phương hóa việc lưu trữ và xử lý dữ liệu, họ đảm bảo rằng ngôn ngữ, văn hóa và lịch sử của họ không bị xóa bỏ. Đối với châu Phi, nơi thường bị gạt sang một bên trong sự phát triển công nghệ toàn cầu, đây là cơ hội để đưa sự đa dạng ngôn ngữ của mình lên bản đồ.

Vai trò của Orange ở đây là chiến lược. Công ty dự định địa phương hóa việc xử lý dữ liệu bằng cách lưu trữ các mô hình của OpenAI tại các trung tâm ở châu Âu.

Sự hợp tác này cũng mang lại cho Orange quyền truy cập sớm vào các tiến bộ AI mới nhất, mà họ dự định sử dụng cho các ứng dụng như hệ thống hỗ trợ khách hàng bằng giọng nói.

Một Hệ Thống Bước Đi Đến Bước Để Khởi Động Sự Nghiệp Web3 Của Bạn Và Đạt Được Những Công Việc Tiền Mã Cao Trong 90 Ngày.