主要内容
旅行最糟糕的部分是规划:寻找和预订交通工具、住宿、餐厅预订等繁琐事务,清单似乎无穷无尽。为了提供帮助,最新一波的 AI 代理,如 OpenAI 的 Operator 和 Anthropic 的 Computer Use 声称,它们可以从困惑的旅行者手中接过这些枯燥、繁琐的任务并为你完成。但它们挖掘优质内容的能力到底如何呢?还有比临时决定周末出游更好的了解方式吗?我让 ChatGPT Pro 订阅用户可用的 Operator 为我预订一些经济实惠、美食与艺术兼具的东西,并告知它我更倾向于乘火车出行。有趣的是,你实际上可以实时观察它的过程——该工具会打开一个浏览器窗口并开始像我一样搜索可通过铁路到达的目的地。它滚动了几篇文章,然后提供了两个建议:巴黎或布鲁日。我在聊天中输入“我最近去过巴黎,那就去布鲁日吧!”。在做出决定后,Operator 继续在欧洲之星网站上查找火车时间,并找到一张返回布鲁塞尔的往返票,其中包括在比利时境内的后续行程。然而,当我看到时间安排时进行了干预:它选择了周六的早班火车出发和周日同样早的火车返回——这并没有充分利用周末,我指出。它找到了一个较晚的返回选项。到目前为止我印象深刻,在确认之前我等待着再次检查我的日程安排。然而,当我回来时,会话已超时。与 ChatGPT 不同,Operator 在任务之间关闭会话,我不得不从头开始。我莫名感到被轻视,就好像我信赖的旅行助手把我甩给了同事。唉,票价已经改变,我发现自己在和 AI 讨价还价:难道找不到更便宜的东西吗?最终选定车票后,我接管以输入我的个人和付款信息。(我可能信任 AI 盲目地送我穿越国境,但我不会给它我的护照信息。)使用 ChatGPT 的 Operator 预订去布鲁日的火车票。订好火车后,Operator 认为它的工作完成了。但我还需要一个住宿的地方,我提醒它——它能预订酒店吗?它要求更多细节,而我故意含糊其辞,指定它应该舒适且位置便利。比较酒店或许是我最不喜欢的旅行规划方面,所以我很高兴让它在 Booking.com 上滚动浏览。当我看到它设置了错误的日期时,我忍住没有插话,但它自己纠正了。它花了一段时间查看宜必思的列表,但最终选择了一家名为马丁布鲁日的三星级酒店,我注意到用户对其位置评价很高。现在剩下的就是行程安排了。在这里,Operator 似乎失去了动力。它提供了一个敷衍的一日行程,似乎主要是从一个素食旅行博客中抄袭而来。第二天,它建议我“参观任何剩余的景点或博物馆”。哇,多谢提醒。旅行的那天到了,当我在凌晨 4:30 起床时,我想起了我为什么通常避免早起出发。不过,我顺利到达了布鲁日。我的车票允许后续行程,但我意识到我不知道要去哪里。我在手机上启动 Operator 并询问下一趟前往布鲁日的火车从哪个站台出发。它搜索了比利时铁路时刻表。几分钟后,它仍在搜索。我抬头看到了车站显示屏上的细节。在 Operator 弄清楚之前我已经到达了站台。布鲁日很迷人。鉴于 Operator 平淡无奇的行程安排,我开始自行探索。我意识到这种研究任务非常适合大型语言模型,它不需要代理能力。ChatGPT,Operator 的 OpenAI 兄弟,给了我一个更全面的计划,按小时规划活动,并不仅提供了用餐地点,还提供了点什么菜的建议(在 De Halve Mann 啤酒厂吃佛兰芒炖菜)。我还尝试了谷歌的 Gemini 和 Anthropic 的 Claude,它们的计划也很出色。