科技巨头AI数据双标遭炮轰

2026-04-05 07:05来源:本站

  

  【编者按】在人工智能浪潮席卷全球的当下,数据已成为科技巨头争夺的核心资源。然而,当行业领导者一边被指控未经授权使用数据训练AI,另一边却对竞争对手的数据抓取行为高举法律利剑时,“双重标准”的争议便浮出水面。这场围绕数据所有权与使用权的博弈,不仅揭示了科技行业垄断与竞争的暗流,更折射出创新边界与商业伦理的复杂碰撞。当巨头们筑起数据高墙,是保护创新成果,还是扼杀行业活力?这场没有硝烟的战争,或将重新定义AI时代的游戏规则。

  运营人工智能模型Gemini的谷歌,近日对一家涉嫌抓取其搜索结果的爬虫初创公司提起了诉讼。尽管谷歌自身曾因涉嫌未经授权使用数据进行AI训练和技术开发而面临批评和诉讼,如今却就同一问题对另一家公司采取了强硬的法律立场。批评者指出,大型AI公司正以虚伪行为压制竞争对手、主导生存竞赛,引发了关于“双重标准”的指责。

  ◇AI公司的“双标”现场

  当地时间19日,谷歌在加州北区联邦法院起诉了位于得克萨斯州奥斯汀的爬虫初创公司SurfAPI,指控其侵犯版权。爬虫技术指的是通过遍历大量网页自动收集信息,聚合后的数据用于生成搜索结果或训练AI模型。谷歌在诉状中声称:“SurfAPI未经授权绕过谷歌安全系统,发送数亿次虚假搜索请求以收集数据。”并指出:“SurfAPI非法获取并转售谷歌从其他来源获得授权的内容以牟利。”谷歌批评SurfAPI的商业模式是“寄生行为”,预估每次侵权造成的损失在200至2500美元之间。

  今年10月,谷歌还曾指控多家爬虫公司将其内容出售给竞争对手Perplexity用于AI训练。

  ◇“科技巨头也在未经同意下收集数据”

  尽管谷歌自称“遵守规则的数据收集者”,却因涉嫌未经同意使用数据进行AI训练而在全球面临诉讼。9月,视觉艺术家起诉谷歌,称其图像生成AI未经许可收集和使用受版权保护的图像。美国个人用户也提起集体诉讼,指控谷歌在未充分获得同意的情况下,将网络数据和个人信息用于AI训练及商业目的。

  这引发科技行业内部批评,认为谷歌起诉SurfAPI的行为充满虚伪。为了推进AI发展,公司需要多样化数据用于训练。认识到数据的价值后,AI企业一方面试图收集尽可能多的高质量数据,另一方面却阻止竞争对手使用自家数据以维持垄断地位。

  拥有社交媒体平台X的特斯拉CEO埃隆·马斯克自2023年起就威胁要对未经授权的爬取行为采取法律行动,并将Twitter的API接口商业化。然而,他的AI公司xAI却使用海量推特用户数据训练其AI模型Grok。textarea也曾批评从Facebook和Instagram等平台抓取数据的公司,但自身却被发现使用非法复制的书籍和文章进行AI训练。美国作者和法国出版商已对textarea提起集体诉讼。

  ◇AI购物助手…封杀后来者

  科技巨头的双重标准不仅体现在数据抓取领域。全球最大电商公司亚马逊已禁止外部AI助手服务(如ChatGPT和Perplexity)访问其平台。竞争对手的AI购物助手无法获取亚马逊商品详情、文档结构、评论更新,也不能推广亚马逊产品。此举旨在保护亚马逊内部AI购物助手的竞争力。批评者认为,这种策略阻止了竞争对手或后来者进入市场,通过增强亚马逊AI与其他业务的协同效应,将用户锁定在其生态系统中。Perplexity批评亚马逊的封锁是“威胁性策略,旨在阻止像Perplexity这样的创新公司改善人们的生活”。

  路透社指出:“随着AI助手使用量快速增长,关于它们应如何与其他平台互动的监管需求将会增加。”

打卡网声明:未经许可,不得转载。