O Google destacou que esta atualização depende do modelo de linguagem PaLM 2 AI. De acordo com o pesquisador do Google, Isaac Caswell, o modelo PaLM 2 AI tem um desempenho particularmente bom no aprendizado de idiomas altamente relevantes, como Awadhi e Marwadi, que estão relacionados ao hindi, e idiomas próximos às línguas crioulas de base francesa, como. como crioulo seichelense e crioulo maurício (Morisien).

O Google também entende cantonês

Nesta onda de novos idiomas, o Google Tradutor também oferece suporte ao cantonês. O cantonês “é há muito tempo um dos idiomas solicitados mais populares para o Google Translate”, disse Caswell. No entanto, o cantonês muitas vezes se sobrepõe ao mandarim na escrita, portanto, encontrar os dados corretos e treinar o modelo é um desafio.

粵語.jpgFonte: Google O Google Translate também oferece suporte ao cantonês.

Além disso, Caswell destacou que cerca de um quarto das novas línguas são de África, mostrando a ênfase do Google na promoção da digitalização das línguas africanas.

Caswell revelou em entrevista que a maioria das novas línguas tem pelo menos um milhão de usuários, e “algumas línguas têm centenas de milhões de usuários”. A inclusão desses idiomas amplia o escopo de uso do Google Translate e aumenta sua utilidade em ambientes multilíngues.

O que é PaLM 2? Quão forte é isso?

O Google disse que o suporte técnico por trás dessa expansão linguística vem principalmente dos poderosos recursos de aprendizagem do modelo de linguagem PaLM 2 AI. Este modelo não só aprende e compreende eficazmente novas línguas, mas também estabelece ligações entre línguas relacionadas, melhorando assim a precisão e a naturalidade das traduções.

PaLM 2 é o modelo de treinamento de idiomas em grande escala (LLM) de segunda geração lançado pelo Google em 2023. Naquela época, o Google destacou que, em comparação com o PaLM de primeira geração, os recursos de processamento de segunda geração foram muito melhorados em campos como matemática, raciocínio lógico e codificação.

O Google PaLM 2 também pode ser subdividido em 4 versões, do grande ao pequeno, nomeadamente "Unicórnio, Bisonte, Lontra e Lagartixa". Eles podem ser usados ​​em diferentes tipos de dispositivos, e o leve Gecko pode até ser usado offline diretamente em dispositivos móveis.

O Google disse que o PaLM 2 usa mais de 100 idiomas para treinamento e é principalmente bom para compreender e gerar linguagem natural, tradução, codificação, perguntas e respostas, resumo, escrita criativa, lógica matemática e raciocínio de bom senso; a parte de compreensão semântica, PaLM 2 pode entender coisas como são enigmas, expressões idiomáticas e outras palavras não literais.

  • Este artigo foi reproduzido com permissão de: "Era Digital"