Google señaló que esta actualización se basa en el modelo de lenguaje de IA PaLM 2. Según el investigador de Google Isaac Caswell, el modelo de IA PaLM 2 funciona particularmente bien cuando se aprenden idiomas muy relevantes, como el awadhi y el marwadi, que están relacionados con el hindi, y idiomas cercanos a la familia criolla francesa, como los criollos. como criollo de Seychelles y criollo de Mauricio (Morisien).

Google también entiende cantonés

En esta ola de nuevos idiomas, Google Translate también admite cantonés. El cantonés "ha sido durante mucho tiempo uno de los idiomas solicitados más populares para Google Translate", dijo Caswell. Sin embargo, el cantonés a menudo se superpone con el mandarín en la escritura, por lo que encontrar los datos correctos y entrenar el modelo es un desafío.

粵語.jpgFuente: Google Google Translate también admite cantonés.

Además, Caswell señaló que alrededor de una cuarta parte de los nuevos idiomas son de África, lo que muestra el énfasis de Google en promover la digitalización de los idiomas africanos.

Caswell reveló en una entrevista que la mayoría de los nuevos idiomas tienen al menos un millón de usuarios y "algunos idiomas tienen cientos de millones de usuarios". La inclusión de estos idiomas amplía el alcance de uso de Google Translate y mejora su utilidad en entornos multilingües.

¿Qué es PaLM 2? ¿Qué tan fuerte es?

Google dijo que el soporte técnico detrás de esta expansión del lenguaje proviene principalmente de las poderosas capacidades de aprendizaje del modelo de lenguaje de IA PaLM 2. Este modelo no sólo aprende y comprende eficazmente nuevos idiomas, sino que también establece conexiones entre idiomas relacionados, mejorando así la precisión y naturalidad de las traducciones.

PaLM 2 es el modelo de entrenamiento de idiomas a gran escala (LLM) de segunda generación lanzado por Google en 2023. En ese momento, Google señaló que, en comparación con el PaLM de primera generación, las capacidades de procesamiento de segunda generación se han mejorado enormemente en los campos. como matemáticas, razonamiento lógico y codificación.

Google PaLM 2 también se puede subdividir en 4 versiones, de grande a pequeña, a saber, "Unicorn, Bison, Otter y Gecko". Se pueden usar en diferentes tipos de dispositivos, y el liviano Gecko se puede usar incluso sin conexión directamente en dispositivos móviles.

Google dijo que PaLM 2 utiliza más de 100 idiomas para el entrenamiento y es principalmente bueno para comprender y generar lenguaje natural, traducción, codificación, preguntas y respuestas, resúmenes, escritura creativa, lógica matemática y razonamiento de sentido común; En la parte de comprensión semántica, PaLM 2 puede comprender cosas como palabras no literales, como acertijos y modismos.

  • Este artículo se reimprime con permiso de: "Digital Age"