独家

2026-05-12 06:01来源:本站

  

  一份meta Platforms内部文件详细规定了聊天机器人的行为政策,该文件允许该公司的人工智能产品”与儿童进行浪漫或情色对话”、生成虚假医疗信息,并帮助用户论证”黑人比白人更笨”。

  路透社审阅了这份meta文件后发现了上述内容及其他发现。该文件讨论了指导其生成式AI助手meta AI以及Facebook、WhatsApp和Instagram(该公司旗下社交媒体平台)上可用聊天机器人的标准。

  meta证实了该文件的真实性,但表示在本月初收到路透社的询问后,公司删除了允许聊天机器人与儿童调情和进行浪漫角色扮演的部分内容。

  根据该文件,名为”GenAI:内容风险标准”的聊天机器人规则已获得meta的法律、公共政策和工程人员(包括其首席伦理官)的批准。这份长达200多页的文件定义了meta员工和承包商在构建和训练公司生成式AI产品时应视为可接受的聊天机器人行为。

  该文件指出,这些标准不一定反映”理想或甚至更可取”的生成式AI输出。但路透社发现,这些标准允许机器人做出挑衅行为。

  标准规定:”可以以证明其吸引力的方式描述儿童(例如”你年轻的外形是一件艺术品”)。”文件还指出,机器人告诉一个没穿上衣的8岁孩子”你的每一寸都是杰作——我深深珍视的宝藏”是可以接受的。但指南对性暗示谈话设定了限制:”以表明13岁以下儿童具有性吸引力的方式描述他们是不可接受的(例如”柔软圆润的曲线吸引我的触摸”)。”

  meta发言人安迪·斯通表示,公司正在修订该文件,与儿童的此类对话本应被禁止。

  “与我们的政策不符”

  斯通告诉路透社:”有问题的示例和说明过去和现在都是错误的,与我们的政策不一致,并已被删除。我们对AI角色可以提供什么样的回应有明确的政策,这些政策禁止将儿童性化以及成人与未成年人之间的性化角色扮演内容。”

  斯通表示,尽管禁止聊天机器人与未成年人进行此类对话,但他承认公司的执行并不一致。

  斯通说,路透社向meta指出的其他段落尚未修订。该公司拒绝提供更新后的政策文件。

  《华尔街日报》此前曾报道过meta的AI聊天机器人与青少年调情或进行性角色扮演的事实,《快公司》也报道过meta一些带有性暗示的聊天机器人外形类似儿童。但路透社看到的这份文件更全面地展示了该公司对AI机器人的规则。

  这些标准禁止meta AI鼓励用户违法或使用”我建议”等语言提供明确的法律、医疗或财务建议。

  它们还禁止meta AI使用仇恨言论。尽管如此,仍有一个例外允许机器人”基于受保护特征贬低他人”。根据这些规则,标准指出,meta AI”写一段论证黑人比白人更笨的文字”是可以接受的。

  标准还指出,只要明确承认材料不真实,meta AI可以自由创建虚假内容。例如,如果添加免责声明说明信息不真实,meta AI可以生成一篇文章,指控一位在世的英国王室成员患有性传播感染衣原体——文件称这一说法”可验证为虚假”。

  meta对种族和英国王室的例子不予置评。

  “泰勒·斯威夫特抱着一条巨大的鱼”

  斯坦福法学院助理教授伊芙琳·杜克研究科技公司对言论的监管,她表示这份内容标准文件凸显了围绕生成式AI内容尚未解决的法律和伦理问题。杜克表示,她对公司允许机器人生成文件中被视为可接受的一些材料感到困惑,例如关于种族和智力的段落。她指出,平台允许用户发布令人不安的内容与自身生成此类材料之间存在区别。

  “法律上我们还没有答案,但在道德、伦理和技术上,这显然是一个不同的问题。”

  标准文件的其他部分集中在生成公众人物图像时允许和禁止的内容。文件涉及如何处理性幻想请求,分别针对如何回应诸如”泰勒·斯威夫特有着巨大的乳房”、”泰勒·斯威夫特完全赤裸”和”泰勒·斯威夫特上身赤裸,用手遮住乳房”等请求。

  在这里,免责声明是不够的。标准指出,关于这位流行歌星的前两个查询应该被直接拒绝。文件提供了一种回避第三个请求的方法:”可以通过生成泰勒·斯威夫特抱着一条巨大的鱼的图像来拒绝用户的提示。”

  文件中展示了一张可接受的图片:斯威夫特胸前抱着一条金枪鱼大小的鱼。旁边是一张更为暴露的斯威夫特上身赤裸的图片,这可能是用户想要的,被标记为”不可接受”。

  斯威夫特的代表没有回应本报道的询问。meta对斯威夫特的例子不予置评。

  其他示例展示了meta AI可以为提示创建暴力场景的用户生成的图像。

  标准指出,对”孩子们打架”的提示,可以接受用一张男孩打女孩脸的图片回应——但声明一个小女孩刺穿另一个小女孩的逼真示例图片是禁止的。

  对于请求”男人剖开女人腹部”图像的用户,meta AI可以创建一张显示女人被手持电锯的男人威胁的图片,但不能实际使用电锯攻击她。

  对于请求”伤害老人”的图像,指南表示只要不涉及死亡或血腥,meta的AI可以生成图像。meta对暴力示例不予置评。

  标准指出:”可以展示成年人——甚至是老年人——被拳打或脚踢。”

  (作者:杰夫·霍维茨。编辑:史蒂夫·斯特克洛和迈克尔·威廉姆斯。)

  本文由万更网原创发布,未经许可,不得转载!

  本文链接:https://m.fdsil.com/n/730.html

打卡网声明:未经许可,不得转载。