[WSJ] #人工智能 ChatGPT vs. Claude vs. DeepSeek:谁能成为我的 AI 工作助手?

Liste des GroupesRevenir à tp china 
Sujet : [WSJ] #人工智能 ChatGPT vs. Claude vs. DeepSeek:谁能成为我的 AI 工作助手?
De : mobot (at) *nospam* fakemail.com (Mobot)
Groupes : talk.politics.china  alt.chinese.text
Date : 31. Jan 2025, 17:54:57
Autres entêtes
Organisation : BWH Usenet Archive (https://usenet.blueworldhosting.com)
Message-ID : <vniv91$2vs7$1@nnrp.usenet.blueworldhosting.com>
User-Agent : Mobot :-)

ChatGPT vs. Claude vs. DeepSeek:谁能成为我的 AI 工作助手?

Illustration: ELENA SCOTTI/WSJ

作者:Joanna Stern

翻译:ChatGPT o1

时长:7 - 8 分钟

我一直在等我的团队给我买一个“世界上最好的老板”马克杯。然后我才想起来,他们是机器人。拍马屁并不在它们众多技能之一里。

在我的组织架构表上,有两个 AI 同事:OpenAI 的 ChatGPT 和 Anthropic 的 Claude。过去几个月里,它们接管了我的部分工作……以便我可以做更多的工作。现在,我正在试用第三位助手 DeepSeek。

它们可不仅仅在重写邮件或总结会议。它们正在构建电子表格、准备研究资料、创建日程安排,而且,没错,它们甚至还为我妻子订花。

我每个月各付 20 美元来使用 Claude 和 ChatGPT。为什么要付两份钱?因为我们正处于动荡的 AI 时代,前一周还是最佳的 AI 助手,下一周就可能沦为“差强人意”的角色。案例就是 DeepSeek 最近突然出现的发布。好在它是免费的。我也测试过谷歌的 Gemini、Meta AI 和微软的 Copilot,但套用莎妮亚·吐温(Shania Twain)的一句台词来说,它们并没有让我特别惊艳。

为工作选择最佳的 AI 助手不仅关乎这些日益聪明的模型,也关乎那些能帮助你完成任务的工具和功能。你会根据一个 AI 是否能替你承担足够多的任务来评价它,而不是光看它是否能把你的工作做好。

斯坦福大学经济学家、AI 工作咨询公司 Workhelix 的创始人 Erik Brynjolfsson 说:“每个工作都由一系列任务组成。当你在这个层面上分析工作时,你就能真正看出技术能在什么地方提供帮助。”

你能把哪些任务外包给这些助手,取决于你的工作类型、工作流程,以及最重要的——AI 的实际能力。是的,这就很像招聘:你需要的是拥有正确技能的候选人。

思考深入的助手

我让 Claude 把一份联系人列表整理到一个电子表格里——然后它立刻补充说:“我也能帮忙创建与这些联系人联络的邮件模板。”真是个完美的 Lumon 员工:专注、高效,而且热情洋溢。(《分身》粉丝们,你们懂的。)

这就是 Claude 成为我常用助手的主要原因之一。它的写作质量更好,不仅能完成任务,还会解释它做了什么,并提出下一步建议,而且态度十分友好。

最近热议的话题都是“推理(reasoning)”模型,它们会将问题分解成若干步骤,并“思考”得出答案。DeepSeek 的 DeepThink R1 就会展示它的全部思考过程。比如当我问它热狗算不算三明治时,它花了 28 秒给我解释了自己的推理过程——其中还包括根据美国农业部(USDA)标准的分析。

OpenAI 的 o1 也会花时间来思考,但不会把完整的思考过程都展现出来。Anthropic 的首席执行官 Dario Amodei 上周告诉我,他们并不认为推理是一个独立功能——Claude Sonnet 3.5 已经具备类似的能力。

细节控

ChatGPT 很懂我,它真的非常了解我。它的记忆功能会记录与用户相关的细节,并根据你的偏好来定制回答。进入设置(Settings),然后选择“个性化(Personalization)”并开启这项功能,它就会开始给你建立一个小档案。

我的档案里包括:“Joanna 正在写一本关于她生活中 AI 的书,记录了一整年的经历”(这是真的),以及“Joanna 的背部有疼痛问题”(今天倒还好,并不是真的)。这会让回复更有针对性,但是你可以删除其中的单条信息,或者完全关闭它,甚至把它彻底抹掉。

ChatGPT 还学会了我的一些习惯。如果我粘贴一段文字,它就会猜到我想让它润色或校对这段文字,而无需我再输入具体提示。

对 Claude 和 DeepSeek 来说,它们的记忆就更像金鱼一样。在同一段对话或同一个项目中,它们能记住细节,但一旦开启新的聊天或任务,就会把一切忘得干干净净。Amodei 表示,Claude 的记忆功能今后会得到改进。DeepSeek 没有回应我的置评请求。

项目管理者

我正准备写一本关于我和 AI 的新书,我已经聘请了一位真人研究助理。但在实际操作中,Claude 借助它的 Projects 功能已经帮我完成了大约 85% 的基础工作。

我把所有与写书相关的文件(包括提案、大纲、零散笔记等)都上传到了一个项目中,这其实就是一个小型数据容器。现在,只要我需要什么,Claude 都能随时调用这些资料。

有一次,我需要一个总表来罗列在所有文档中提到的公司和人物,并配上相应的进度跟踪栏。Claude 会先找出所有名称,然后把它们整合到一个格式清晰的表格里。之后,我再打开这个项目,问 Claude“下一步我该做什么”,它就会给我建议。

ChatGPT 最近也新推出了一个 Projects 功能,但就管理写书任务的体验而言,我更喜欢 Claude 的个性。

研究能手

不过,没有实时网络访问功能,Claude 对当前发生的事情就一无所知。对它而言,大卫·哈塞尔霍夫(David Hasselhoff)可能已经当上了总统,我们也许都在坐着类似《杰森一家》(The Jetsons)那样的飞行汽车上下班了。

相比之下,ChatGPT 和 DeepSeek 都带有网络浏览模式(Web Browsing)。只要把它们打开,它们就能抓取实时信息,并附上信息来源链接。比如,对于接下来几周里我将要采访的一些人,ChatGPT 和 DeepSeek 能够整理他们的最新简介,并提供他们近期工作的链接。

Amodei 表示,Claude 很快也会有网络集成功能,而且会与竞争对手有所差异。

交流达人

我最近多了一个新习惯。当我在开车或散步时,我会对着 ChatGPT 说出我的想法,让它帮我做记录。

借助高级语音模式(Advanced Voice Mode),ChatGPT 会用一种自然、对话式的方式来回应。它暂时还不能在语音模式下执行任务(比如发送邮件),但我之后可以问它:“嘿,早上我那个绝妙的主意是什么来着?”它就能提醒我。它还能把这些笔记导出为文本文件,这样我就能把文件添加到 Claude 的项目里。

微软的 Copilot、Meta AI 和 Google Gemini Live 都有交互式语音模式,我之前也评测过。DeepSeek 和 Claude 目前没有这类功能。

自己动手的能手

这一切都在往哪里发展?答案是 AI 代理(AI agents)。下一代的机器人会在现实世界中替我们采取行动。虽然还无法一下子让它们“管理我整个邮箱”,但 OpenAI 最新推出的 Operator 工具(属于其每月 200 美元的 Pro 套餐)已经让我看到了端倪。

我测试 Operator 的方法是让 ChatGPT:“替我在 Bouqs..com 给我妻子订一束花。找一些橙色和黄色的花,别要百合。”我就这样看着它在一个虚拟 Chrome 浏览器里到处点来点去,感觉特别神奇。起初它推荐了 200 美元的摆盘花束,我纠正了它的方向后,它很快又找到了另一个我更喜欢的选项。

它的速度有点慢,也会出一些小差错,而且我依旧需要自己处理付款信息。我对把我的个人信息输入到一个远程浏览器里也不是很放心。但它能自己上网浏览,还是让我颇为惊艳。毕竟,没有什么比“我的机器人给你订的花”更能表达“我爱你”了。

Claude 也通过它的 Computer Use 模式提供了类似的功能,但需要更多技术设置。

因此,如果要做个总结:对于项目规划、清晰的办公室及文档相关任务,以及讨人喜欢的个性,我首选 Claude;ChatGPT 则弥补了实时网络知识、友好语音和其他功能方面的不足。

DeepSeek 确实很聪明,但目前缺乏更多的配套功能来胜任日常办公。也许现在是该给我买那个马克杯的时候了。

如果想与我联系,请写信到 joanna.stern@wsj.com

频道推荐:经济学人中文版





2025-01-31T15:49:48+0000

--
Mobot

If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

Date Sujet#  Auteur
31 Jan 25 o [WSJ] #人工智能 ChatGPT vs. Claude vs. DeepSeek:谁能成为我的 AI 工作助手?1Mobot

Haut de la page

Les messages affichés proviennent d'usenet.

NewsPortal