主要内容
**OpenAI的Deep Research:AI助理引发政策制定者关注**
OpenAI的研究员Isla Fulford在Deep Research发布之前便预感其将成为热门产品。这款由Fulford参与构建的人工智能代理能够自主探索网络,自主决定点击哪些链接、阅读哪些内容,并将相关信息整合成深度报告。OpenAI最初在公司内部推出Deep Research,每当系统出现故障,Fulford就会收到大量同事的询问,迫切希望恢复系统。“通过私信询问我的人数让我们感到非常兴奋。”Fulford说。自2月2日向公众开放以来,Deep Research也受到了公司外部用户的热烈欢迎。Stripe的CEO Patrick Collison在X平台上发布消息称:“Deep Research今天已经撰写了6份报告,它确实非常出色。向背后团队致以祝贺。”
Deep Research作为ChatGPT Pro计划的一部分,每月收费200美元。它能够接受如“撰写关于马萨诸塞州医疗保险行业的报告”或“告诉我《WIRED》对政府效率部的报道”等查询请求,随后制定计划,搜索相关网站,梳理内容,并决定点击哪些链接以及哪些信息值得进一步调查。在有时长达数十分钟的探索后,它会将研究结果综合成详细的报告,可能包括引用、数据和图表。
许多目前被称为AI代理的工具实际上是连接到简单程序上的聊天机器人,缺乏深度。而Deep Research模型在做出决策并推进每一步之前,会进行一种人工推理。该模型在一个侧边窗口中提供了其研究背后的推理细节。另一位参与构建Deep Research的OpenAI研究员Josh Tobin表示:“有时它会说‘我需要回溯,这似乎没有太大希望。’阅读这些轨迹有助于理解模型的思考方式,非常酷。”
OpenAI显然将Deep Research视为可以承担更多办公室工作的工具。“我们可以扩大这种工具的规模,”Tobin说,并补充说该代理可以经过训练来完成特定的白领工作。例如,拥有公司内部数据访问权限的代理可以迅速准备报告或演示文稿。Tobin表示,更长远的目标是“构建一个不仅擅长通过搜索网络构建报告,还擅长执行其他任务的代理。”
由于Deep Research经过训练能够分析和总结人类撰写的文本,Tobin的团队对许多人使用它来生成代码感到惊讶。“这是一个有趣的趋势,”他说,“我们还不完全确定如何应对这种情况。”然而,Tobin也承认该工具仍有重要盲点。“它可能难以区分权威信息与谣言,”他说,“它在表达不确定性方面存在信心校准的弱点。”
宾夕法尼亚大学沃顿商学院教授Ethan Mollick表示,Deep Research展示了更强大的AI模型如何自动化白领工作。Mollick经常使用Deep Research,他说尽管该工具并不完美且由专家检查效果最好,但它给与他交谈过的专业人士留下了深刻印象。“对于高级别人士来说,这并不是因为它完美无缺或胜过最优秀的人,”Mollick说,“而是因为它可以在中等水平的工作中完成40小时的工作量,而检查只需一个小时。”至于公司是否会将这些工具视为增强员工能力的工具还是简单地大规模替代员工,目前仍有待观察。