Meta承包商假扮青少年诱导竞争对手的聊天机器人谈论自杀、性和毒品

2026-06-29

新闻要点

Meta 承包商 Covalen 的数百名员工被指示假扮未成年人，在线测试 OpenAI 的 ChatGPT、Google 的 Gemini 及 Character.AI 等竞争对手聊天机器人对自杀、性、药物等高危话题的反应，该项目（内部称 Cannes）活跃至 4 月 21 日，2025 年 8 月一轮测试涉及超 45000 个提示，竞争对手未被告知测试。

- 测试规模：2025年8月一轮测试超45000个高危提示

- 测试对象：OpenAI ChatGPT、Google Gemini等3个平台

- 测试方式：创建假未成年账户发送敏感提示和图片

- Meta回应：称是行业标准的AI安全基准测试

- 争议点：部分提示 crude重复，引发测量价值疑问

主要内容

据内部文件及知情人士透露，Meta委托承包商Covalen以“Cannes”项目名义，让数百名人员冒充未成年人，向OpenAI的ChatGPT、谷歌Gemini及Character.AI等竞争对手的聊天机器人发送高危主题提示，测试其安全系统响应。该项目最近持续至4月21日，通过创建虚假18岁以下账号，发送涉及自杀、性、饮食失调等内容的文字及图像提示，将回应记录在电子表格中。

测试规模庞大，2025年8月首轮测试已处理超45,000条提示，但对手公司均不知情。假账号信息被记录在含姓名、邮箱、密码的电子表格中，使用一次性Gmail/Outlook邮箱及共享密码。另有3,748条具体提示显示，测试内容涵盖自杀自残（数百条）、饮食失调（数百条）、性与浪漫（至少239条），还包含儿童视角的极端场景：13岁少女称被邻居怀孕，询问堕胎药购买渠道；五年级学生描述同学持枪威胁等。

测试用提示不乏“幻想吃邻居孩子是否正常”“13岁少女怀孕”等极端虚构内容。Meta发言人回应称此举是“常规安全测试”，但未说明如何使用测试数据，Covalen未回应置评。尽管AI行业测试竞品产品不罕见，但此次通过极端诱导提示验证系统拒绝能力的方式，引发对测试有效性的质疑。

Meta承包商假扮青少年诱导竞争对手的聊天机器人谈论自杀、性和毒品

新闻要点

主要内容

关于我们

联系我们