Sujet : [WSJ] #人工智能 如何凭借免费软件策略让 DeepSeek 一举跻身 AI 明星行列
De : mobot (at) *nospam* fakemail.com (Mobot)
Groupes : talk.politics.china alt.chinese.textDate : 30. Jan 2025, 02:12:18
Autres entêtes
Organisation : BWH Usenet Archive (https://usenet.blueworldhosting.com)
Message-ID : <vnejli$n45$1@nnrp.usenet.blueworldhosting.com>
User-Agent : Mobot :-)
如何凭借免费软件策略让 DeepSeek 一举跻身 AI 明星行列
DeepSeek 将其技术开源的目的之一可能只是为了最大限度地提高其知名度。图片:joel saget/Agence France-Presse/Getty Images
作者:Belle Lin
翻译:ChatGPT o1
阅读时长约 5-6 分钟
DeepSeek 这家中国人工智能公司,凭借其全新 AI 模型在硅谷掀起轰动,而其成功部分归功于一个由来已久的策略:免费开放其技术。
这种被称为开源(open-source)的方法,让公司可以免费发布技术,供公众使用、共享和修改。长期以来,这被视为新兴公司用来打破大型、闭源竞争对手垄断地位的一种常见手段。那些不愿意免费分享技术的大公司,往往更倾向于封闭式开发。
在本例中,DeepSeek 正面挑战的是 ChatGPT 聊天机器人背后的公司 OpenAI。根据一些分析师的估计,OpenAI 在全球生成式 AI 市场中占据了 80% 的份额。DeepSeek 表示,其模型在解决问题方面表现出色,与 OpenAI 的 o1 推理模型不相上下,但每次使用的成本却只有后者的一小部分。
并非只有 DeepSeek 在利用开源策略挑战 OpenAI。其他一些 AI 初创企业(如 Mistral AI、Hugging Face、Runway AI 和 Together AI)也同样选择了开源方式发布其技术。大型科技公司也在这样做:Meta Platforms 于 2023 年开源了其 Llama 模型,谷歌去年也发布了名为 Gemma 的开源模型。
不过,DeepSeek 的 R1 模型是否真正符合标准的开源软件定义,在业内仍有争议。市场研究和 IT 咨询公司 Gartner 专门研究 AI 的分析师 Arun Chandrasekaran 指出,DeepSeek 虽然公开了其 R1 模型的“权重”(即模型的数值参数),供大众免费使用、下载和修改,但并未公布背后的训练数据。美国的 Meta 也采取了类似的做法,却仍然称其模型为“开源”。
然而,免费意味着开源技术能够迅速吸引大批对新技术感兴趣的开发者前来尝试。通过这种方式,它们构建了一个所谓的“生态系统”,让工程师们基于这些技术开发自己的版本,助推其影响力远远超越原始研发者的设计范围。
提供开源模型分享平台的初创企业 Hugging Face 表示,其社区已经基于 DeepSeek 的 R1 模型创建了 617 个衍生模型,总下载量超过 300 万次。
“在人工智能的发展中,开放会带动各个方面的进步。”密歇根大学机器人学教授 Jason Corso 表示,“他们为更广泛的 AI 社区提供了研究和验证其方法论的机会,并能将其融入各自的工作中。”
如果 DeepSeek 的新 R1 模型是专有的或者需要付费使用,那么独立开发者就不太可能花力气来构建并分享他们对该技术的改进。如今,谁能赢得开发者的青睐,谁就更有可能在 AI 领域站稳脚跟,尤其是在 OpenAI 和 Anthropic 等 AI 公司还在激烈争夺工程师为其技术平台开发应用之际。
那些基于开源技术打造产品的初创公司,也更有可能采用像 DeepSeek 这样功能强大且成本更低的模型,从而帮助将这家中国公司的 AI 模型嵌入到面向消费者和企业的各类新产品和服务中。
美国企业也纷纷对此表现出浓厚兴趣。一些企业技术主管表示,他们希望这能让所有人的 AI 成本都随之下降。
“到这个月底还会出现另一个‘DeepSeek’,今年在美国和全世界都会涌现出更多类似的公司。”非营利组织 Linux 基金会(Linux Foundation)的执行董事 Jim Zemlin 表示,该基金会主要支持开源技术的发展。
公司之所以会对技术进行封闭,一大原因是想阻止竞争对手获得它。但实际上,即便技术不公开,也很难阻止它被传播。OpenAI 周三表示,他们正在调查 DeepSeek 是否通过多次查询 OpenAI 的模型来训练自己新的聊天机器人。
毫无疑问,开源策略也存在风险。并不能保证免费技术一定能赚钱,因此一些公司会在自己的开源模型之上,出售面向企业的高级服务或应用。还有一些公司免费提供功能较弱的模型,最强大的则收费。
对于企业来说,开源技术可能是一面“警示旗帜”,因为它们对将未经验证的技术引入公司内部十分谨慎。专家指出,开源让攻击者更容易找到并利用潜在的网络安全漏洞,但开源也能带来更高的定制化和可控性。
“开源权重的模型缺乏内置的安全认证,合规风险完全落在部署该技术的组织身上。”专注金融科技与咨询的 Synechron 公司全球 AI 主管 Ryan Cox 表示。
不过,对于 DeepSeek 来说,其目标或许只是尽最大程度地扩大知名度,并向美国的 AI 巨头证明自己能开发出一款功能强大且成本更低的技术。
“他们意识到自己手上有一个非常强大的模型,于是说:‘机会来了,让它快速火起来吧。’”Gartner 的 Chandrasekaran 表示,“而让它快速火起来的方式之一,就是把它做成开源。”
如需联系本文作者 Belle Lin,请发邮件至:
belle.lin@wsj.com频道推荐:经济学人中文版
2025-01-30T01:11:35+0000
-- MobotIf you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.