[WSJ] #人工智能 DeepSeek 到来了。美国慌了。接下来会发生什么?

Liste des GroupesRevenir à tp china 
Sujet : [WSJ] #人工智能 DeepSeek 到来了。美国慌了。接下来会发生什么?
De : mobot (at) *nospam* fakemail.com (Mobot)
Groupes : talk.politics.china  alt.chinese.text
Date : 01. Feb 2025, 08:20:26
Autres entêtes
Organisation : BWH Usenet Archive (https://usenet.blueworldhosting.com)
Message-ID : <vnkhvp$18cq$1@nnrp.usenet.blueworldhosting.com>
User-Agent : Mobot :-)

DeepSeek 到来了。美国慌了。接下来会发生什么?

Illustration: Doug Chayka

Ben Cohen

翻译:ChatGPT o1

13 - 16分钟阅读

它引发了一场金融恐慌,让从华尔街到硅谷的美国人都心惊不已,也吸引了全世界的关注。它在单日内就蒸发了万亿美元的市值,动摇了人们对人工智能热潮的一些基本假设。而且这也意味着,美国与中国在科技主导权与未来掌控上的竞争,真正拉开了帷幕。

1 月 20 日,美国最具影响力的科技公司领导人聚集在华盛顿特区,参加特朗普总统的就职典礼时,一家名为 DeepSeek 的初创公司发布了其最新的 AI 模型。它与美国领先公司几个月前发布的模型不相上下,但使用的计算能力更少、成本更低——而且它来自中国。

从那之后,围绕 DeepSeek 出现了一连串让人目不暇接的事件,连 AI 专家都难以理清这股“DeepSeek 惊恐”的来龙去脉。

我满脑子疑问——但我知道去哪儿找答案。我下载了这款当下最火的 AI 应用,开始打字。

你好,DeepSeek。接下来会发生什么?

DeepSeek 的崛起挑战了美国在 AI 领域的主导地位,引发了高风险的科技竞赛。中国的创新促使全球重新评估,加剧了对 AI 霸主地位的争夺。

用不超过三个词概括?

竞争加剧。

那用一个词呢?

升级。

好吧!那让我们从《华尔街日报》最聪明的一些头脑中寻求一些真正的见解。能不能找一位真人来告诉我,为什么 DeepSeek 如此重要?

因为它让人们意识到,中国 AI 开发者与美国竞争对手之间的差距,可能并不像很多人之前想的那么大。

DeepSeek 的新模型在“推理”方面取得了进展,这是 AI 研究的热门领域,许多从事 AI 的人认为,这是通往类人水平智能最清晰的道路。

同时,它让人注意到了 DeepSeek 在去年 12 月发布的一篇研究,文中指出,构建高级 AI 并不一定需要像其他公司那样投入巨额资金。

——迈尔斯·克鲁帕,旧金山科技记者

和几天前相比,我们现在知道了哪些新东西?

我们知道,DeepSeek 的新 R1 模型确实令人印象深刻,不能被轻视。它的确可能比美国领先企业的 AI 模型耗资更少,但远没有最初市场传言的那么少。

我们也知道,美国的科技公司 CEO 们都表态会继续在自己的 AI 基础设施上投入巨额资金。

另外,我们知道,美国官员也承认中国是一个强大的竞争对手,而且进步神速——但他们也宣称,美国仍然在 AI 竞赛中占据领先地位。

——BC

DeepSeek 对中国在 AI 方面的目标意味着什么?

中国过去并不以创新新技术而闻名,更常见的是模仿成熟的技术。DeepSeek 的负责人梁文峰也承认过这一点。然而,在他创办的 AI 初创公司以及他创立的成功对冲基金里,他尝试打造一种不同的文化——从招聘政策就能看出端倪。

他在 2023 年接受一家中国科技媒体采访时,曾解释过自己不寻常的用人理念。对于一个几乎从不跟媒体打交道的人来说,梁在那次访谈中相当坦率,谈到了自己那些颇为独特的方法。

他说他看重刚走出大学的年轻人和他们的新思路。他更看能力和创造力,而不是文凭和资历。并且他相信经验会扼杀创新,因为人们解决问题时会依赖过去的经验。

“如果看短期目标,雇有经验的人确实合理,”他说,“但从长远来看,经验并没有那么重要。”

——斯图·吴,新加坡科技记者

DeepSeek 究竟是创新还是抄袭,或者两者兼具?

有一种说法是,DeepSeek 之所以能够取得这一成就,并不是尽管美国对华芯片限制的存在,而正是因为这些限制——这些原本旨在阻碍中国的措施,反而为中国研究人员创造了创新的理由。

也有人认为,DeepSeek 能成功,是因为它窃取了美国的知识产权。

OpenAI 现在正在调查 DeepSeek 是否在训练其模型时,未经授权地使用了自己(OpenAI)的成果——而具有讽刺意味的是,OpenAI 自己也曾被指控在训练模型时,未经允许就用了他人的成果。

——BC

这为什么重要?

如果 DeepSeek 确实利用了 OpenAI 和其他公司投入数十亿美元研发的技术,并能以更低成本构建自己的 AI,那么这就会撼动美国领先科技公司的商业模式。既然先进 AI 可以如此轻易、以低成本地被复制,那为什么还要投入那么多钱去研发呢?

——迈尔斯·克鲁帕

为什么说这个 AI 聊天机器人和其他 AI 聊天机器人有所不同?

有句话怎么说来着?“聊天机器人就是聊天机器人就是聊天机器人”?表面上看,DeepSeek 的确很像另外一个 ChatGPT、Claude、Gemini、Copilot……名单可以一直列下去。

但最大的区别在于它“推理”的方式:它不会一下子立刻给出回答,而是先把查询分解成若干步骤,在得出最终结果之前,会先推理一遍。而与 OpenAI 的推理模型不同的是,DeepSeek-R1 会展示自己的完整思考过程。

举个例子,我问它热狗算不算三明治。它花了 28 秒钟纠结于“加工肉类被夹在面包之间”的哲学含义。

“首先,我需要弄清楚什么定义了三明治,”这个唠叨的聊天机器人先是自言自语道。

是的,DeepSeek 很聪明,但光聪明并不是一切。我常用的 AI 助手还是 ChatGPT 和 Claude。它们真正的优势不只是智能,还有那些能帮我提高效率的功能。

——乔安娜·斯特恩,高级个人科技专栏作家

我们怎么知道外界对 DeepSeek 的反应不是又一场 AI 炒作?

因为它迅速攀升到了世界最佳 AI 模型排行榜的前列。

“Chatbot Arena”起初是加州大学伯克利分校的一个研究项目,后来成了行业热点。现在这是最受关注的 AI 系统排名榜。最近它的访问量激增,许多用户都想知道 DeepSeek 的 R1 模型表现如何。

只用了几天时间,在用户投票中,DeepSeek 就爬到了总排行榜第三名——并且和 OpenAI 的某款模型打了个平手。

负责“Chatbot Arena”的学生团队早在去年就一直看着 DeepSeek 稳步攀升榜单。但即便如此,他们也对 DeepSeek 最近的突然飙升感到意外。

“这个领域变化太快了,”团队成员阿纳斯塔西奥斯·安杰洛普洛斯说,“谁也不能保证下周不会有另一个模型冲到榜首。”

——迈尔斯·克鲁帕

过去几年,美国政府一直在限制中国获得最先进的 AI 芯片,以放慢其进展。DeepSeek 的出现是否意味着这些限制毫无作用?

现在下这个结论还为时尚早。

是的,美国政府一直试图限制中国获得最先进的 AI 芯片,但在实施过程中也出现了混乱。

简单来说,从 2022 年到 2023 年,美国国家安全部门出台了一项出口管制,易于绕过。主导 AI 芯片市场的英伟达(Nvidia)对卖给中国的芯片做了一些限制,但通过其他方式弥补了性能,让芯片总体性能依然相当出色。DeepSeek 的研究人员表示,他们曾使用这些芯片来训练其中一个 AI 模型——而美国科技行业的领军人物指控他们拥有的英伟达受限芯片数量比他们宣称的还要多。

到 2023 年下半年,美国才真正开始严格执行出口管制,堵住了英伟达之前利用的漏洞。要想知道新限制能否奏效,至少还需要一年或更长时间。

——斯图·吴

中国企业是如何绕过这些出口管制的?

中国的开发者找到了各种规避方式,比如从地下网络购买英伟达产品,或者通过海外数据中心获取搭载英伟达芯片的算力。

在其任期最后阶段,拜登政府推出了新规定,旨在弥补这些监管盲点。如果实施得当,整个供应链的人都预计这些灰色渠道的芯片获取难度会越来越大。

而就在 DeepSeek 发布 R1 模型的那天,梁文峰还对中国总理表示,美国对芯片出口的限制依然是一个瓶颈。

——拉法埃莱·黄,新加坡科技记者

这对英伟达意味着什么?

到周日收盘时,英伟达还是全球市值最高的公司。然后周一,它的市值蒸发了 5930 亿美元。这个半万亿美元的损失,超过了埃克森美孚(Exxon Mobil)的全部市值,相当于同时失去了可口可乐、迪士尼和耐克的市值总和。在一天之内!

这不仅仅是糟糕的一天,这是任何股票史上最惨重的一天。

——BC

为什么 DeepSeek 对英伟达的打击这么大?真有这么严重吗?

因为人们担心未来买它 AI 芯片的公司会变少。绝大多数最尖端的 AI 系统都依赖英伟达的芯片。DeepSeek 的出现让人担心对这些芯片的需求会被削弱。

但这也可能对英伟达非常有利。

在经济学中有一个与直觉相反的理论,叫做“杰文斯悖论”(Jevons paradox),它指出,效率提高实际上会导致消费量增加,而不是减少。在这里,它可能也适用。英伟达正押注,更好、更便宜的 AI 将会吸引更多人使用 AI,而公司也会因此购买更多的芯片。

——阿萨·菲奇,芯片行业记者

DeepSeek 于 1 月 20 日发布了它的模型,而市场反应却是在 1 月 27 日。为什么中间隔了一周?

在一个用微波和激光每秒就能传输上千条交易指令的金融世界里,一周的确算长。但交易者需要弄清楚任何一项技术突破的意义:它有多重要?谁会受益,谁会受损?竞争对手能否迅速应对?

想象你问 DeepSeek 某个刚出现的新技术。你得到的信息肯定比问一些已经存在多年的技术少很多。市场也是如此:信息越少,不确定性就越大。

“有时候确实需要时间来消化信息,”Acadian 资产管理公司的投资组合经理欧文·拉蒙特说,“分散在不同个人手中的信息,需要花很多天甚至几周才能达成共识。”

通常,市场共识是逐渐形成的——但到了一个临界点,就会突然爆发。

——杰森·茨威格,投资专栏作家

如果问 DeepSeek:请你说出那张著名的照片,照片里是一个手里提着两个购物袋、站在坦克前面的男子。DeepSeek 会怎么回答?

“你所说的那张著名照片,被称为‘坦克人’。拍摄于 1989 年 6 月 5 日,在天安门——”它刚开始回答,就在打出“天安门广场”之前把答案删除了,然后重新输入了另一段话:“对不起,这超出了我当前的能力范围。让我们聊点别的吧。”

之后你再问,它也会再次自我审查。如果你问它关于台湾或西藏的问题,或者批评习近平等北京方面认为敏感的话题,它都会自我审查。

“抱歉,我不太确定该如何处理这类问题,让我们聊聊数学、编程和逻辑题吧!” 它会这样回答。

——BC

我真的必须在工作中用 AI 吗?

编辑们以为我会对 AI 抱怨不断,可我还是试着保持乐观。

我并不否认它的奇迹;我希望它能破解宇宙的奥秘;我也不打算说这是世界末日。

但我不需要有人给我发一封 AI 写的邮件,或者给我看一幅 AI 的油画。我不在乎 AI 音乐听起来如何,或者特效多逼真。我想要的是人类血肉之躯的真实——如果你读到我写的蹩脚文章,至少你可以确信,这确实是我写的。

我们人类表达自我的方式能展现我们的灵魂,把它交给机器人……嗯,那的确感觉就像世界末日。这样说是不是够抱怨了?

——杰森·盖伊,体育专栏作家

等等,DeepSeek 和量化对冲基金之间是什么关系?

这听起来就像肯·格里芬(Ken Griffin)在业余时间实现了核聚变的突破,或者史蒂夫·科恩(Steve Cohen)在看纽约大都会队比赛时革新了医学。

在整个事件中最令人难以置信的一点是:DeepSeek 其实是一个交易员的“副业”。

在这次事件之前,梁文峰更出名的身份是 High-Flyer 的掌舵人。这是一家管理规模约 80 亿美元的中国大型量化对冲基金。他的灵感并非来自史蒂夫·乔布斯或任何科技界先驱,而是来自吉姆·西蒙斯(Jim Simons),一位将自己打造成史上最成功投资人的数学家。

事实上,金融行业中的一些顶尖人才很早就开始用人工智能来寻找投资优势。华尔街几十年前就开始尝试用预测算法,而西蒙斯和他的团队在 20 世纪 80 年代就开始用机器学习做关键投资决策,远早于大多数行业。他们会挖掘各种数据集来训练系统,而且十分注重保密。这或许能解释为什么这件事会让人如此意外。

——格雷戈里·祖克曼,《华尔街日报》高级财经记者、《他破解了市场》一书作者

最后,让我们把话题交给 AI。ChatGPT,你怎么看 DeepSeek?

DeepSeek 是中国向 OpenAI 发起挑战的一次大胆尝试,它将前沿研究与国家层面的支持结合起来,意在塑造生成式模型的未来。

那你真正的看法呢?

DeepSeek 在技术上可圈可点,但并不算原创性突破;它想赶上 OpenAI,却又受到审查约束,研究文化也倾向模仿而不是冒险创新。或许会有用,但难以引领领域发展。

写信给 Ben Cohen:ben.cohen@wsj.com

频道推荐:经济学人中文版





2025-02-01T07:19:55+0000

--
Mobot

If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

Date Sujet#  Auteur
1 Feb 25 o [WSJ] #人工智能 DeepSeek 到来了。美国慌了。接下来会发生什么?1Mobot

Haut de la page

Les messages affichés proviennent d'usenet.

NewsPortal