OpenAI和Meta正在携手训练基于非洲语言的AI系统。这个包括法国电信巨头Orange SA的项目旨在填补AI中的一个重大空白。非洲这个拥有2000多种语言的洲在AI训练中大多被忽视。
该项目将于明年启动,最初专注于两种西非语言:沃洛夫语和普拉尔语。这两种语言的使用者超过2200万,但目前的AI模型无法理解它们。
Orange的目标是在其在18个市场运营的非洲和中东扩展其通信工具。但这不仅仅是关于客户服务。第一阶段将利用欧洲和非洲的数据中心及公共云系统来训练AI。然而,该公司尚未明确其将从何处获取训练数据。
扩展AI到本地语言
Orange的首席AI官Steve Jarrett表示,该项目仅从沃洛夫语和普拉尔语开始。到明年,他们计划为其他撒哈拉以南的语言如林加拉语、斯瓦希里语和班巴拉语训练AI模型。这些语言对数百万人至关重要,但在AI数据集中几乎不存在。
根据Jarrett的说法,这一倡议是使AI对每个人可及的步骤,甚至是那些文盲或其他被排除在数字进步之外的人口。
OpenAI将给予Orange早期访问其模型的权限。这使得Orange能够开发像客户服务语音互动这样的AI驱动工具。他们还将处理来自欧洲数据中心的数据处理和托管。
这些模型将作为开源运行,免费用于非商业用途,如健康和教育服务。更广泛的目标?为Orange在18个西非国家推出定制的AI解决方案。
为了提供背景,沃洛夫语在塞内加尔、甘比亚和毛里塔尼亚南部通用。普拉尔语主要用于塞内加尔。这两种语言代表著一个经常被主流AI系统忽视的庞大人口。
对于像Orange这样的公司来说,这是一个重要事件,因为它们在当地语言主导但对像OpenAI的GPT或Meta的Llama这样的工具完全不可见的地区运营。
为什么“主权AI”很重要
这一努力利用了日益增长的“主权AI”概念。这个想法既简单又强大:地区和国家希望控制推动AI的核心技术基础设施。
通过本地化数据存储和处理,他们确保自己的语言、文化和历史不会被抹去。对于经常在全球科技发展中被忽视的非洲来说,这是一个将其语言多样性纳入地图的机会。
Orange在这里的角色是战略性的。该公司计划通过在欧洲中心托管OpenAI的模型来本地化数据处理。
这个合作伙伴关系还使Orange能够提前获得最新的AI进展,并计划用于语音驱动的客户支持系统等应用。
一个逐步系统,让您在90天内启动您的Web3职业并获得高薪的加密工作。