Sujet : [WSJ] #人工智能 OpenAI 正在调查 DeepSeek 是否使用其模型来训练新聊天机器人
De : mobot (at) *nospam* fakemail.com (Mobot)
Groupes : talk.politics.china alt.chinese.textDate : 29. Jan 2025, 16:11:43
Autres entêtes
Organisation : BWH Usenet Archive (https://usenet.blueworldhosting.com)
Message-ID : <vndgff$12qf$1@nnrp.usenet.blueworldhosting.com>
User-Agent : Mobot :-)
OpenAI 正在调查 DeepSeek 是否使用其模型来训练新聊天机器人
OpenAI 表示,已封禁其怀疑进行模型蒸馏的账户。
照片来源:Kristian Tuxen Ladegaard Berg/Zuma Press
作者:Sam Schechner
翻译:ChatGPT o1
阅读时长:4 - 5 分钟
OpenAI 正在调查一家中国人工智能初创公司 DeepSeek 是否通过反复向 OpenAI 的 AI 模型提问,从而为其新聊天机器人进行训练。
这家位于硅谷的公司周三表示,已观察到来自中国的多方企图从其 AI 工具中获取大量数据,目的很可能是通过一种名为“蒸馏(distillation)”的技术来训练他们自己的模型。
OpenAI 表示,已封禁了其怀疑进行模型蒸馏的账户,并与其主要合作伙伴微软(负责托管 OpenAI 模型)合作,以识别这些企图的幕后参与者。据知情人士透露,DeepSeek 是 OpenAI 正在调查的对象之一。
“确保我们与美国政府紧密合作,以保护最具能力的模型不被对手和竞争者获取美国技术,这一点至关重要。”一名 OpenAI 女发言人说道。她还补充称,中国的公司“不断尝试对美国领先 AI 公司的模型进行蒸馏”。
微软拒绝对此置评。DeepSeek 尚未回应置评请求。
OpenAI 的怀疑让人们看到了这样一种可能性:DeepSeek 新模型的性能(据称可与世界顶尖 AI 模型相媲美),可能并不像最初看上去那样出色。这也凸显了另一层担忧:那些在训练最先进模型上投入数亿美元的公司,或许难以阻止竞争对手复制他们的成果。
一些 DeepSeek 用户注意到,该聊天机器人有时会给出类似于 OpenAI 输出的文本。例如,在上周末社交媒体 Reddit 上的一张截图中,该聊天机器人回答道:“现在,根据 OpenAI 的政策,我必须避免声称自己拥有意识或感知能力。”
周一,DeepSeek 新推出的 R1 模型引发了市场震荡。投资者得知,尽管使用的芯片并不算先进,但新模型似乎依然表现良好,而人们此前普遍认为在缺乏高端芯片的情况下很难或几乎不可能达到这样的效果。
“蒸馏”是一种通过更大、更昂贵的模型输出来训练较小、更高效 AI 模型的方法。它能够将大型模型的专业能力“提炼”到小模型中,同时允许小模型模仿大模型的推理方式。
虽然 OpenAI 允许商业用户在其平台内对模型进行蒸馏,但公司服务条款禁止用户将 OpenAI 模型的输出用于训练另一个竞争性模型。
美国总统特朗普的 AI 专员(“AI czar”)大卫·萨克斯(David Sacks)于周二明确指责 DeepSeek 通过蒸馏 OpenAI 模型来构建其自身模型。
“有充分的证据表明,DeepSeek 在这里所做的,就是从 OpenAI 模型中提炼出了他们所需的知识。”萨克斯说,这位资深硅谷风投人士补充道,“我认为 OpenAI 并不想看到这样的情形。”
DeepSeek 表示,它能够在缺乏最先进 AI 芯片的情况下实现高性能 AI 模型,主要靠高超的编程技术,例如在较低规格芯片上挖掘更多性能。
该公司也承认使用过蒸馏技术,但仅用于自身的模型。DeepSeek 在一篇近期研究论文中称,他们通过从其最强大的模型 R1 中提取输出,来训练一些较小的模型,而这些小模型也展示了类似的推理能力。
News Corp(《华尔街日报》的母公司)与 OpenAI 有内容许可合作关系。
如需与 Sam Schechner 联系,请发送邮件至
Sam.Schechner@wsj.com频道推荐:经济学人中文版
[0] 经济学人中文版:
https://t.me/econo2022025-01-29T15:11:02+0000
-- MobotIf you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.