Google đã công bố hôm thứ Năm rằng họ sẽ bổ sung hỗ trợ cho 110 ngôn ngữ mới vào ứng dụng Google Translate bằng trí tuệ nhân tạo. Dịch vụ này sẽ có sẵn trên điện thoại thông minh và Web và sẽ giúp ích cho mọi người trên toàn thế giới.

Cũng đọc: Google DeepMind phát triển V2A tạo âm thanh cho video AI

Trước sự phát triển hiện tại, Google Translate đã hỗ trợ 133 ngôn ngữ khác nhau, nhưng với sự bổ sung mới, công ty đã mở rộng dịch vụ của mình lên tổng cộng 243 ngôn ngữ. Một phần tư các ngôn ngữ mới được đưa vào là của người gốc Phi. Các ngôn ngữ mới nổi bật nhất bao gồm tiếng Afar, tiếng Quảng Đông, tiếng Punjabi và tiếng Tok Pisin.

PaLM2 có thể dịch các ngôn ngữ liên quan chặt chẽ một cách hiệu quả

Đây là đợt bổ sung ngôn ngữ lớn nhất sau lần bổ sung lớn trước đó vào tháng 5 năm 2022, trong đó công ty đã sử dụng công nghệ máy học không cần bắn. Google đang sử dụng PaLM2 để học/dịch dựa trên công nghệ Zero-shot. Với kỹ thuật này, mô hình không phải học từ các ví dụ, điều này cho phép học nhanh hơn.

Sau đó, vào năm 2022, Google đã công bố sáng kiến ​​1000 ngôn ngữ dành cho những ngôn ngữ phổ biến nhất trên toàn cầu. Google cho biết mô hình ngôn ngữ lớn (LLM) PaLM2 của họ giúp dịch các ngôn ngữ có liên quan chặt chẽ hiệu quả hơn. Kỹ sư phần mềm cao cấp tại Google Translate, Isaac Caswell cho biết,

“[PaLM2] là một phần quan trọng của câu đố, giúp Translate học các ngôn ngữ có liên quan chặt chẽ với nhau hiệu quả hơn, bao gồm các ngôn ngữ gần với tiếng Hindi, như Awadhi và Marwadi.”

Ông nói thêm rằng tiếng Creole Seychellois và tiếng Mauritian Creole gần với tiếng Creole của Pháp, cũng được dịch qua PaLM2. Mô hình AI tương tự đã được sử dụng để hỗ trợ chatbot Bard, đã phát triển thành Gemini nhưng hiện sử dụng một mô hình khác. PaLM2 được đào tạo trên bộ dữ liệu khổng lồ chứa 250 tỷ tham số. 

Google Dịch sẽ ra mắt nhiều ngôn ngữ hơn

PaLM2 là mô hình AI tiên tiến có thể thực hiện trôi chảy các văn bản viết, giúp nó có khả năng xử lý các tác vụ ngôn ngữ. Tuy nhiên, model này thiếu khả năng xử lý âm thanh hoặc hình ảnh. Google cho biết họ đã chọn “các loại ngôn ngữ phổ biến nhất” vì rất khó để chọn ngôn ngữ nào sẽ thêm vào. 

Công ty cho biết việc mở rộng sẽ phục vụ 8% dân số thế giới vì các ngôn ngữ đã chọn được sử dụng bởi “hơn 614 triệu người nói”. Caswell cho biết một số ngôn ngữ có hơn 100 triệu người nói.

Cũng đọc: Google Nose có thể trở thành hiện thực nhờ học máy

Công ty đã xem xét các cộng đồng nhỏ hơn, bổ sung thêm các ngôn ngữ được sử dụng bởi các cộng đồng bản địa có ít người. Trong số đó có một số ngôn ngữ không có người bản xứ nhưng “tích cực nỗ lực phục hồi”.

Một người dùng Reddit có tên stanley_fatmax đã nhận xét về bản cập nhật rằng:

"Ấn tượng; Theo tôi, đây là một trong những cách sử dụng AI thực sự thông minh và hữu ích. Tôi rất vui vì họ đã dành tình cảm cho Google Translate.”

Tuy nhiên, người dùng Reddit cũng cho biết hầu hết người nước ngoài mà anh biết hiện nay đều sử dụng dịch vụ thay thế có tên DeepL. Người dùng này nói rằng Google Dịch đang bị tụt lại phía sau và công ty nên làm việc trên các ngôn ngữ đã được hỗ trợ cùng với việc bổ sung thêm các ngôn ngữ mới.

Công ty tiết lộ rằng ngôn ngữ được yêu cầu nhiều nhất là tiếng Quảng Đông, vốn thường trùng lặp với tiếng Trung Quốc. Việc thu thập dữ liệu để đào tạo bằng tiếng Quảng Đông rất khó khăn vì nó giống với cách viết tiếng Quan Thoại. Một ví dụ khác là ngôn ngữ Manx ở Đảo Man, ngôn ngữ này đã tuyệt chủng vào năm 1974 sau cái chết của người bản xứ cuối cùng. Ngôn ngữ này đã được hồi sinh và hiện có hàng nghìn người nói nó trên khắp hòn đảo. Google cho biết họ sẽ tiếp tục tung ra các ngôn ngữ mới trong vài ngày tới.

Báo cáo về tiền điện tử của Aamir Sheikh