亚马逊高管表示,该公司的云部门正在调查有关人工智能初创公司 Perplexity 未经批准从网站抓取内容的指控。此前,多家新闻媒体指责 Perplexity 非法提取内容。

据称,Perplexity AI 忽视了名为“机器人排除协议”的网络标准。据《连线》杂志报道,该协议通常称为 robots.txt,网站根据该协议定义搜索引擎、AI 和其他爬虫程序可以访问哪些页面。《福布斯》还指责这家 AI 初创公司剽窃记者的作品。

另请阅读:软银以 30 亿美元的估值投资谷歌替代品 Perplexity AI

对于使用 Amazon Web Services (AWS) 托管或服务器的网站,必须遵守 robots.txt。虽然大多数网站都遵循该标准,但法律并不强制任何人遵守该协议。

Perplexity 涉嫌违反网络标准

亚马逊发言人 Samantha Mayowa 周五表示,该公司正在评估有关 Perplexity 违反协议的信息。新闻媒体《连线》指责 Perplexity 从禁止此类行为的新闻网站抓取内容。重要的是要记住,Perplexity 使用 AWS 来满足其服务器需求。

Mayowa在一份声明中表示,

“亚马逊的服务条款禁止滥用和非法活动,我们的客户有责任遵守这些条款,”来源:美联社。

该发言人表示,该公司经常收到来自各个渠道的有关涉嫌不当行为的投诉。她还补充说,AWS 会与客户沟通,了解所报告的问题。

Perplexity AI 的代表 Sara Platnick 表示,该公司的机器人访问网站的方式并没有违反 AWS 的使用条款。WIRED 本月早些时候发布了一份调查报告,称该公司向 Perplexity AI 模型提供了其新闻网站的标题以及有关特定主题的提示。结果显示,这些故事都是经过严格改写的,包括归因于 WIRED 的虚假声明。

多家出版物指责这家 AI 独角兽抄袭内容

《福布斯》也对 Perplexity 提出指控,称其通过一项名为“Perplexity Pages”的新功能进行抄袭。该出版物表示,Perplexity 在其平台上策划的页面显示的内容与彭博社和 CNBC 等新闻媒体的原始帖子相似。

令人担忧的是,Perplexity 因正确标注内容创作者而声名鹊起。《福布斯》声称,这些获得数千次浏览量的帖子并未在正文中提及原始出版商。它表示,Perplexity 仅在容易被忽略的链接上标注了创作者的小标识。

另请阅读:OpenAI 和微软因侵犯版权被起诉

美联社还报道称,Perplexity 捏造了虚假言论并将其归为真人所说,这令人担忧。Perplexity 引起了科技投资者的关注,最近的估值为 30 亿美元。

这家初创公司已经从亚马逊创始人杰夫·贝佐斯、Meta 首席科学家 Yann LeCun、谷歌首席科学家 Jeff Dean 等投资者那里筹集了超过 1 亿美元的资金。最近,日本软银也承诺向这家初创公司投资 1000 万至 2000 万美元。

Perplexity 首席执行官 Aravind Srinivas 表示,WIRED 提出的问题反映了对 Perplexity 运营方式的“深刻而根本的误解”。他说,该出版物发现抓取内容的 IP 地址是由提供网络抓取和索引服务的第三方运营的。

Aamir Sheikh 的 Cryptopolitan 报道