O Google destacou que esta atualização depende do modelo de linguagem PaLM 2 AI. De acordo com o pesquisador do Google, Isaac Caswell, o modelo PaLM 2 AI tem um desempenho particularmente bom no aprendizado de idiomas altamente relevantes, como Awadhi e Marwadi, que estão relacionados ao hindi, e idiomas próximos às línguas crioulas de base francesa, como. como crioulo seichelense e crioulo maurício (Morisien).
O Google também entende cantonês
Nesta onda de novos idiomas, o Google Tradutor também oferece suporte ao cantonês. O cantonês “é há muito tempo um dos idiomas solicitados mais populares para o Google Translate”, disse Caswell. No entanto, o cantonês muitas vezes se sobrepõe ao mandarim na escrita, portanto, encontrar os dados corretos e treinar o modelo é um desafio.
Fonte: Google O Google Translate também oferece suporte ao cantonês.
Além disso, Caswell destacou que cerca de um quarto das novas línguas são de África, mostrando a ênfase do Google na promoção da digitalização das línguas africanas.
Caswell revelou em entrevista que a maioria das novas línguas tem pelo menos um milhão de usuários, e “algumas línguas têm centenas de milhões de usuários”. A inclusão desses idiomas amplia o escopo de uso do Google Translate e aumenta sua utilidade em ambientes multilíngues.
O que é PaLM 2? Quão forte é isso?
O Google disse que o suporte técnico por trás dessa expansão linguística vem principalmente dos poderosos recursos de aprendizagem do modelo de linguagem PaLM 2 AI. Este modelo não só aprende e compreende eficazmente novas línguas, mas também estabelece ligações entre línguas relacionadas, melhorando assim a precisão e a naturalidade das traduções.
PaLM 2 é o modelo de treinamento de idiomas em grande escala (LLM) de segunda geração lançado pelo Google em 2023. Naquela época, o Google destacou que, em comparação com o PaLM de primeira geração, os recursos de processamento de segunda geração foram muito melhorados em campos como matemática, raciocínio lógico e codificação.
O Google PaLM 2 também pode ser subdividido em 4 versões, do grande ao pequeno, nomeadamente "Unicórnio, Bisonte, Lontra e Lagartixa". Eles podem ser usados em diferentes tipos de dispositivos, e o leve Gecko pode até ser usado offline diretamente em dispositivos móveis.
O Google disse que o PaLM 2 usa mais de 100 idiomas para treinamento e é principalmente bom para compreender e gerar linguagem natural, tradução, codificação, perguntas e respostas, resumo, escrita criativa, lógica matemática e raciocínio de bom senso; a parte de compreensão semântica, PaLM 2 pode entender coisas como são enigmas, expressões idiomáticas e outras palavras não literais.
Este artigo foi reproduzido com permissão de: "Era Digital"