Google chỉ ra rằng bản cập nhật này dựa trên mô hình ngôn ngữ AI PaLM 2. Theo nhà nghiên cứu Isaac Caswell của Google, mô hình AI PaLM 2 hoạt động đặc biệt tốt khi học các ngôn ngữ có liên quan cao, chẳng hạn như Awadhi và Marwadi, có liên quan đến tiếng Hindi và các ngôn ngữ gần với họ ngôn ngữ creole dựa trên tiếng Pháp, chẳng hạn như. như Seychellois Creole và Mauritius Creole (Morisien).

Google cũng hiểu tiếng Quảng Đông

Trong làn sóng ngôn ngữ mới này, Google Dịch cũng hỗ trợ tiếng Quảng Đông. Caswell cho biết tiếng Quảng Đông “từ lâu đã là một trong những ngôn ngữ được yêu cầu phổ biến nhất đối với Google Translate”. Tuy nhiên, tiếng Quảng Đông thường trùng lặp trong cách viết với tiếng phổ thông nên việc tìm kiếm dữ liệu phù hợp và đào tạo mô hình là một thách thức.

粵語.jpgNguồn: Google Google Translate cũng hỗ trợ tiếng Quảng Đông.

Ngoài ra, Caswell chỉ ra rằng khoảng 1/4 ngôn ngữ mới đến từ Châu Phi, cho thấy sự chú trọng của Google trong việc thúc đẩy số hóa các ngôn ngữ Châu Phi.

Caswell tiết lộ trong một cuộc phỏng vấn rằng hầu hết các ngôn ngữ mới đều có ít nhất một triệu người dùng và "một số ngôn ngữ có hàng trăm triệu người dùng". Việc đưa vào các ngôn ngữ này sẽ mở rộng phạm vi sử dụng của Google Dịch và nâng cao tính hữu ích của nó trong môi trường đa ngôn ngữ.

PaLM2 là gì? Nó mạnh đến mức nào?

Google cho biết hỗ trợ kỹ thuật đằng sau việc mở rộng ngôn ngữ này chủ yếu đến từ khả năng học tập mạnh mẽ của mô hình ngôn ngữ AI PaLM 2. Mô hình này không chỉ học và hiểu ngôn ngữ mới một cách hiệu quả mà còn thiết lập sự kết nối giữa các ngôn ngữ liên quan, từ đó nâng cao tính chính xác và tự nhiên của bản dịch.

PaLM 2 là mô hình đào tạo ngôn ngữ quy mô lớn (LLM) thế hệ thứ hai được Google phát hành vào năm 2023. Khi đó, Google đã chỉ ra rằng so với PaLM thế hệ đầu tiên, khả năng xử lý thế hệ thứ hai đã được cải thiện rất nhiều trong các lĩnh vực như toán học, lý luận logic và mã hóa.

Google PaLM 2 cũng có thể được chia thành 4 phiên bản, từ lớn đến nhỏ, đó là "Unicorn, Bison, Otter và Gecko". Chúng có thể được sử dụng trên nhiều loại thiết bị khác nhau và Gecko nhẹ thậm chí có thể được sử dụng ngoại tuyến trực tiếp trên thiết bị di động.

Google cho biết PaLM 2 sử dụng hơn 100 ngôn ngữ để đào tạo và chủ yếu giỏi hiểu và tạo ra ngôn ngữ tự nhiên, dịch thuật, mã hóa, hỏi đáp, tóm tắt, viết sáng tạo, logic toán học và lý luận thông thường; phần hiểu ngữ nghĩa, PaLM 2 có thể hiểu những thứ như Chúng là những từ không có nghĩa đen như câu đố và thành ngữ.

  • Bài viết này được in lại với sự cho phép của: "Thời đại kỹ thuật số"