科技专家和Synesis One的首席执行官艾萨克·邦警告说,少数科技巨头垄断数据并主导人工智能(AI)竞赛的情况是“极其危险的”。他主张对人工智能权力的“民主化”,确保持续的人工智能竞赛的最终“获胜者”不会成为行业巨头。

根据邦的说法,解决方案的一部分在于优先考虑去中心化数据众包,而不是依赖大型数据专注的公司。正如邦在对Bitcoin.com新闻的书面回应中解释的那样,去中心化数据众包让公司避免使用内部数据科学家。相反,他们可以“向一个普通的数字工人或专家的池子提出工作”来进行数据分析任务。

邦认为,这种模式非常适合那些寻求扩展但缺乏内部资源的公司。除了商业优势之外,去中心化数据众包还有助于应对集中科技巨头所面临的数据偏见挑战。

尽管政府对去中心化数据管理表达了公共安全的担忧,但邦仍然警告不要制定可能最终抑制创新的广泛规范。相反,他敦促监管机构和立法者在制定政策之前研究“去中心化数据来源如何被利用”。

邦的其他回应解决了人工智能行业的竞争和与人工智能使用相关的固有风险。以下是Synesis One首席执行官对发送问题的回答。

艾萨克·邦(IB):人工智能是引领第四次工业革命的关键技术,其影响超出我们目前的想象。几个主导玩家垄断数据并引领人工智能竞赛在许多方面都是极其危险的。人工智能技术不仅能使企业更具生产力并最大化其利润,还能使政府在物理和数字上增强其军事能力。人工智能竞赛的“赢家”将成为一个主导力量,我们现在采取行动以民主化人工智能的力量,对所有人来说都是至关重要的。

IB:传统上,公司通过其提供的产品或服务从用户/客户那里收集数据。为了利用收集的数据进行人工智能,公司雇用数据科学家和其他专家来清理和标注数据。对于拥有大量用户和资金的大公司来说,传统的数据收集和准备方法是有效的。然而,对于小型和中型公司来说,扩展其数据需求将非常困难。

去中心化数据众包是通过一个大型数字工人网络寻找原始数据或数据预处理,这些工人愿意并能够提供数据或预处理工作。公司或开发者可以在不拥有用户或内部数据科学家的情况下,从一个普通的数字工人或专家的池中为数据任务设置悬赏,进行数据工作。这使公司能够扩展,而无需花费大量金钱和时间来招聘内部人员。

IB:人类具有进行逻辑推理的能力。当今使用机器学习的人工智能使用统计计算来识别模式,而没有任何逻辑推理。随著人工智能模型的改进,对高质量数据和领域特定数据的需求变得越来越有价值。例如,通用LLM不适合在医疗环境中使用。LLM可以针对特定的医学领域进行微调,但这样做需要在该领域拥有专业知识的人类。这一概念不仅适用于通用LLM,还适用于其他具有更具体使用案例的人工智能应用。

IB:很简单——数据提供者和数据标注者的池越多样化,数据就会越多样化和具有代表性。在去中心化的众包网络中,原始数据和/或数据标注者的提供者不来自同一平台、公司、网络或群体。这减少了集中公司可能面临的数据偏见。

IB:最实用的使用案例之一是在自然语言领域。当今的企业是全球性的,这要求公司在其所服务市场的所有语言中提供相同质量的服务和产品。然而,目前许多表现最佳的LLM主要基于英语。我们已经看到企业依赖众包来满足不同语言和方言的需求,不仅是为了人工智能的需求,例如本地化他们的产品。

IB:只要所有数据交易都记录在链上,透明度应足以解决任何监督和监管的担忧。如果监管机构真的关心公共安全和安全,则应对集中实体的数据管理和使用制定更多规范。立法者应首先了解去中心化数据来源的运用方式,而不是凭恐惧草率下结论。如果存在恶意意图或使用情况,他们应该介入,而不是发布会伤害创新的全面规范。

Technologist: Decentralized Data Crowdsourcing Is Key to Countering Big Tech's Dominance

Synesis One的首席执行官,艾萨克·邦

IB:目前,我们尚未目睹平台的任何滥用情况。真正看到滥用可能影响国家安全层面的潜在风险是困难的。在数据存储层面,Synesis可以与分散式存储解决方案(例如IPFS、Arweave)和集中式解决方案(例如AWS)合作,这取决于客户。在数据标注层面,每个人都要经过同行评审,甚至同行评审可以由客户特别优化以防止恶意行为。

IB:在Synesis,我们的目标是成为全球最大的数字工人网络,专门提供帮助公司满足任何人工智能数据需求的专家。我们已经看到对于人工智能训练(例如微调、RLHF、原始数据)的专业知识需求的增加,因为人工智能被用于越来越多的使用案例。我们希望让任何规模的公司在任何领域都能够通过我们的平台和全球数字专家网络来扩展他们的人工智能数据需求。这不仅有助于公司扩展,还为世界各地的人们带来新的机会,通过在线提供他们的知识和技能来赚取收入。

IB:令人惊讶的是,主流公司尚未解决员工的许多痛点。其中一个与支付有关,因为跨境支付通常昂贵且缓慢。另一个主要痛点是缺乏透明度。这对我们来说是一个巨大的优势,因为我们的支付系统不需要最低余额,没有手续费,并且是即时的。我们已经吸引了许多对使用大型网络2数据标注领域的数字工人感到沮丧的人。随著我们吸引越来越多背景各异的数字工人并扩展网络,我们的解决方案将对潜在客户变得越来越有吸引力。

IB:我们的用户面临的最大风险之一是某些活动所需的知识和/或技能的不匹配。一些数据活动是技术性的,如果用户表现不佳,则不会获得良好的奖励。所有事物,包括用户的声誉,都是基于用户提供的工作的准确性。有些任务需要技术技能/知识,或者有陡峭的学习曲线。因此,任何新用户在平台上应该预期需要花一些时间学习如何进行一些活动/数据任务。我们不断更新和制作新的教育和培训材料,以便引导新用户和现有用户更好地表现。这对每个人都有利,只要用户花时间阅读和学习材料。