
时代周刊:国产 AI 黑马 DeepSeek 一鸣惊人,硅谷「颤抖」
来源:TIME
原标题:What to Know About DeepSeek, the Chinese AI Company Causing Stock Market Chaos
作者:Billy Perrigo、Tharin Pillay
编译及整理:比推BitpushNews
近日,中国杭州初创公司 DeepSeek 创建的新型 AI 模型震惊了美国 AI 业。它的表现超越了OpenAI的领先模型,取代ChatGPT 登顶 iOS 应用商店的榜首,并替代Meta成为「开源 AI 工具」的领先供应商。
所有叙事都指向一个关键问题:尽管美国对中国获取先进半导体的能力实施了制裁,但中国在全球 AI 竞赛中是否正在赶上美国?
DeepSeek 上周发布的新 R1 模型据称训练成本仅为 600 万美元,但在多个数学和推理指标上的表现却能与OpenAI 的 o1 模型相媲美——这是 OpenAI 及其支持者微软数百亿美元投资的成果。
中国模式对用户来说也更便宜。使用其最强大版本的成本比 OpenAI 及其竞争对手低 95% 左右。结果是:美国科技行业突然面临一个可能更便宜、更强大的挑战者,这让投资者感到不安,周一开盘,美国科技股遭遇疯狂抛售。
但并非所有人都相信,一些美国人工智能研究人员对DeepSeek真实的成本、以及部署了多少先进芯片来创建模型的说法表示怀疑。
然而,很少有人质疑 DeepSeek 的惊人能力。
美国著名风险投资家马克·安德森 (Marc Andreessen)在 X 上写道:“Deepseek R1 是人工智能的斯普特尼克时刻” ,斯普特尼克指的是冷战期间苏联成功将一颗卫星送入轨道的时刻。
那么,DeepSeek 是什么?它对美国科技霸权意味着什么?
什么是 DeepSeek?
DeepSeek 成立于不到两年前,由中国对冲基金幻方资本 (High-Flyer Capital Management) 创立,是一家致力于研究通用人工智能 (AGI) 的研究实验室。2024 年底发布的一系列开源版本让这家初创公司名声大噪,其中包括大型语言模型“v3”,其表现优于 Meta 的所有开源 LLM,可与 OpenAI 的闭源 GPT4-o 相媲美。
当时,首席执行官梁文峰表示,他聘请了一批年轻的计算机科学研究团队,目的是“解决世界上最难的问题”——关键是,不以盈利为目的。早期成果令人鼓舞:他的产品非常高效,以至于 DeepSeek 2024 年的发布引发了中国人工智能行业的价格战,迫使竞争对手大幅降价。
今年,这场价格战似乎将蔓延至太平洋彼岸。
然而,DeepSeek 的人工智能与美国竞争对手有一个重要区别。 尽管 DeepSeek 的模型在推理测试中表现出色,但它们受到一些政策的限制。例如,DeepSeek R1 拒绝回答某些较为敏感的历史话题。
DeepSeek 的成功对美国科技巨头意味着什么
正当谷歌、Meta、微软、亚马逊及其数十家竞争对手准备再投入数百亿美元建设新的人工智能基础设施时,DeepSeek 的成功引发了一个令人不安的问题:中国科技公司是否有可能在投入更少的情况下匹敌甚至超越硅谷的技术实力?
据科技新闻网站 The Information 上周末报道,Meta 计划今年在人工智能基础设施上投入 650 亿美元,目前已经建立了四个“作战室”来分析 DeepSeek 的模型,试图找出这家中国公司如何以如此低的成本训练模型,并利用这些见解改进自己的开源 Llama模型。
在金融市场,由于担心训练强大的人工智能所需的人工智能芯片数量可能比之前预想的要少,英伟达股价周一上午下跌逾 15%。其他美国科技股也出现下跌。
Pictet Asset Management 首席策略师 Luca Paolini 表示:“虽然 [DeepSeek R1] 对用户和全球经济来说是个好消息,但对美国科技股来说却是个坏消息。在估值和增长预期非常高的情况下,这可能会导致人工智能资本投资名义上缩减,并给利润率带来压力。”
但美国科技还没有失败——至少现在还没有。
目前,OpenAI 的“o1 Pro”模型仍被认为是世界上最先进的。然而,DeepSeek R1 的表现确实表明,中国比以前想象的更接近人工智能的前沿,开源模型已经赶上了闭源模型。
对于 OpenAI 和谷歌等闭源模型公司来说,更令人担忧的可能是 DeepSeek 向消费者收取的费用——或者说,费用太低了——以访问其最先进的模型。OpenAI 对其最先进的模型 o1 输出的每百万个“token”(即词段)收取 60 美元。相比之下,DeepSeek 对 R1 输出的相同数量 token 收取 2.19 美元——几乎低了 30 倍。
与美国政府密切合作的人工智能公司 Gladstone AI 的首席技术官爱德华·哈里斯 (Edouard Harris) 表示:“它侵蚀了工业基础,侵蚀了利润,削弱了私人资本进一步投资西方(人工智能)扩张的动力。”
…但是 Deepseek 是透明的吗?
DeepSeek 的成功更具爆炸性,因为它似乎让人质疑美国政府通过限制向中国出口强大芯片或 GPU 来限制其人工智能战略的有效性。如果 DeepSeek 的说法属实,则意味着尽管存在这些限制,中国仍有能力创建强大的人工智能模型,这凸显了美国战略的局限性。
DeepSeek 声称,其制约因素是芯片,而不是资金或人才。该公司表示,其仅使用 2,000 块二级 Nvidia 芯片训练其 v3 和 R1 模型。DeepSeek 首席执行官梁文峰在 2024 年表示:“钱从来都不是我们的问题。禁止出口先进芯片才是问题所在。”(美国现行政策禁止向中国出口最先进的 AI 芯片,OpenAI 和微软使用的美国数据中心就装有这类芯片。)
但这些说法是真的吗?
Scale AI 首席执行官Alexandr Wang最近在达沃斯接受CNBC采访时表示:“据我了解,DeepSeek 拥有 50,000 块 H100 芯片。”H100 是目前市场上性能最高的 Nvidia GPU 芯片。“他们不能公开谈论 [这个],因为这违反了美国实施的出口管制。”(这种规模的 H100 集群将耗资数十亿美元。)
上周一,中国总理李强在北京与梁文峰见面,这表明中国对这项技术的重视程度。据报道,在那次会议上,梁文峰表示,DeepSeek 需要更多芯片。“DeepSeek 只能使用几千个 GPU,但他们却成功了,”Gladstone AI 首席执行官杰瑞米·哈里斯 (Jeremie Harris) 表示。“因此,这引出了一个显而易见的问题:如果他们从政府那里获得拨款,全速推进,会发生什么?”
尽管中国可能用更少的芯片实现了惊人的人工智能能力,但专家表示,更多的计算能力将始终是一种战略优势。在这方面,美国仍然遥遥领先。乔治梅森大学研究员迪恩·鲍尔说:“拥有更多计算能力永远不是坏事。无论你拥有多少,你都会使用它。”
这将对中美科技竞争产生怎样的影响?
简短的回答是:从华盛顿的角度来看,情况尚不确定。
在拜登政府任期即将结束的日子里,即将离任的国家安全顾问杰克·沙利文 (Jake Sullivan)警告称,人工智能发展速度是“目前世界上最具影响力的事情”。就在上任几天后,特朗普总统宣布成立一个由 OpenAI 和其他公司支持的 5000 亿美元新企业,以建设对创造“通用人工智能”至关重要的基础设施——这是人工智能的下一个飞跃,其系统将足够先进,能够取得新的科学突破,以近似科幻小说中描述的那种方式进行推理。
尽管关于美国对中国芯片限制的未来仍存在疑问,但华盛顿的优先事项在特朗普总统上任第一周签署的人工智能行政命令中显而易见,该命令宣布“美国的政策是维持和加强美国在全球人工智能领域的主导地位,以促进人类繁荣、经济竞争力和国家安全。”
专家表示,保持这种主导地位至少在一定程度上意味着要准确了解中国科技公司在做什么,以及保护美国的知识产权。
Gladstone AI 的爱德华·哈里斯 (Edouard Harris) 表示:“DeepSeek 和许多其他中国大公司很有可能得到了中国政府的支持,而不仅仅是资金方面的支持。”他还建议美国人工智能公司加强安全措施。
人工智能将走向何方?
自 12 月以来,OpenAI 的新 o1 和 o3 模型打破了人工智能模型难以通过的高级推理测试的记录。
DeepSeek R1 做了类似的事情,在这个过程中体现了许多研究人员所说的范式转变:研究人员不是扩大用于训练模型的计算能力,而是扩大模型在回答问题之前思考响应的时间(以及计算能力和电力)。研究人员称之为“测试时间计算”的这种扩展将新一类“推理模型”(如 DeepSeek R1 和 OpenAI 的 o1)与不太复杂的前辈区分开来。许多人工智能研究人员认为,在这种范式达到极限之前,还有很大的发展空间。
一些人工智能研究人员认为,DeepSeek 的 R1 取得了与 DeepMind 的 AlphaZero 同等水平的突破,AlphaZero 是 2017 年推出的模型,它通过纯粹与自己对弈而不断提高,而不是观察任何人类游戏,从而成为国际象棋和围棋棋盘游戏中的超人。
这是因为R1 并没有像其他领先的 LLM 那样对人工标记的数据进行“预训练”。
相反,DeepSeek 的研究人员找到了一种方法,让模型从头开始引导自己的推理能力。
他们表示:“我们不需要明确地教导模型如何解决问题,而只需为其提供适当的激励,它就会自主开发出先进的解决问题的策略。”
这一发现意义重大,因为它表明,只要应用更多的计算能力,强大的人工智能能力可能会以比以前想象的更快的速度出现,而且所需的人力更少。“DeepSeek R1 就像是这种扩展范式的 GPT-1,”Ball 说。
最终,中国最近在人工智能领域的进步非但不会取代美国的地位,反而可能是一个重新排序的开始——换句话说,这是一个向未来迈出的一步,未来不再是一个霸权国家,而是多个人工智能力量中心相互竞争。
OpenAI 前政策工作人员 Miles Brundage 在 X 上写道:“除非发生战争,否则中国在一年之内也会拥有自己的超级智能,比美国晚不到一年。所以,除非你想要(发生战争),由多个国家共同发展的多极化人工智能格局似乎是必然的。”
比推快讯
更多 >>- 彭博社:摩根大通将在Coinbase的Base区块链上试行存款代币JPMD
- 消息人士:马斯克旗下xAI公司有望完成50亿美元的债务融资
- GMGN 及部分加密 KOL 的 X 账户现已解除封禁
- 生物公司 Eyenovia 启动 HYPE 国库储备策略,将投资 5000 万美元
- 摩根大通将试点在与 Coinbase 关联的区块链上发行存款代币
- TD Cowen :Strategy 的 STRD 发行将“为 MSTR 股东带来巨大增值”
- 市场消息:马斯克旗下xAI一个月开销达10亿美元,拟融资93亿美元
- 比特币反弹至 10.4 万美元上方,美国议员提出伊朗战争权力决议拟禁止美国介入
- Polymarket 上美军 7 月前对伊朗采取军事行动概率升至 66.7%
- SEC 推迟批准富兰克林 XRP 与 Solana 现货 ETF
- 特朗普将就伊朗问题举行重要会议
- 美联储将讨论对补充杠杆率标准的拟议修订
- 美国最高法院要求就特朗普全球关税政策举行听证会
- 特朗普对伊朗以色列战局频繁发言,市场对美国或参与对伊行动表现担忧
- 万斯:特朗普可能会采取进一步行动阻止伊朗核计划
- Ink 宣布将推出原生代币 INK,面向流动性协议早期参与者空投
- StarkWare 推出委托计划 Delegation Program
- 数据:超 2 万个比特币地址持仓价值超 1000 万美元,占 BTC 总供应量近 9.43%
- 欧委会主席:美国和欧盟同意 7 月 9 日为贸易谈判最后截止日期
- a16z 合伙人:已额外投资 7000 万美元用于 EIGEN 代币,且有锁定期
- 英国上市公司 Vinanz 拟筹集 358 万英镑扩大战略比特币储备
- AltLayer:2 亿枚 ALT 代币跨链置换已完成
- 观点:稳定币市值将因 GENIUS 法案获批增长 10 倍
- James Wynn:比特币进一步走高前可能会先下探至 9.3-9.5 万美元
- 现货黄金短线下挫 16 美元,现报 3368 美元/盎司
- 加密分析公司 TRM Labs:去年 99%稳定币活动是合法的
- 去中心化 AI 项目 Gradient Network 完成 1000 万美元种子轮融资,Pantera Capital 和 Multicoin Capital 领投
- 支持稳定币的跨境结算平台 XFX 完成 910 万美元子轮融资,Coinbase Ventures 等参投
- 数据:SMLR 市值与持仓 BTC 价值倒挂,比特币战略未使其上涨
- 某新建地址从 Binance 提取 5006 亿枚 PEPE,价值 520 万美元
- Binance 新一期 Alpha(SPARK)空投数据:70%账户已卖出,单号收益约为 114 美元
- Coinbase 寻求美国证券交易委员会批准提供基于区块链的股票
- 隐私公链 Namada 宣布已完成主网部署最后准备
- 刘强东:京东将在全球主要货币国家申请稳定币牌照
- Namada 已完成主网上线最后阶段
- 巴西主权战略比特币储备法案通过第一委员会审议
- Galaxy 和 Liquid Collective 合作向机构提供以太坊流动性质押服务
- 前 OpenAI 员工推基于加密货币的日结工资系统
- 美股开盘三大股指低开,标普 500 指数跌 0.35%
- 市场消息:马斯克旗下 xAI 寻求 43 亿美元融资
- Gemini Trust 声称美 CFTC 诉讼律师因“私利”对其提出可疑指控
- Mark Cuban:特朗普手机或将预装支持 TRUMP 代币和 USD1 的加密钱包
- DWF Labs 合伙人 Lingling:TG 账号被盗
- DPIN 基金会与 Nanyang Biologics 战略合作赋能科研项目
- 数据:过去 24 小时全网爆仓 3.59 亿美元,多单爆仓 2.36 亿,空单爆仓 1.23 亿
- PublicAI 完成 800 万美元 A 轮融资,Blockchain Builders Fund 等参投
- 上市公司 Fold Holdings 签署 2.5 亿美元股权购买协议,旨在扩大比特币储备
- Ondo Finance 推出全球市场联盟 Global Markets Alliance
- Eigen Labs 宣布推出 EigenCloud
- 分析师:美国零售销售数据整体疲软,美联储 FOMC 会议将进行讨论
比推专栏
更多 >>观点
比推热门文章
- 消息人士:马斯克旗下xAI公司有望完成50亿美元的债务融资
- Bankless:X号说没就没,当「加密难民」重新拥抱 Farcaster
- GMGN 及部分加密 KOL 的 X 账户现已解除封禁
- 生物公司 Eyenovia 启动 HYPE 国库储备策略,将投资 5000 万美元
- 摩根大通将试点在与 Coinbase 关联的区块链上发行存款代币
- TD Cowen :Strategy 的 STRD 发行将“为 MSTR 股东带来巨大增值”
- 市场消息:马斯克旗下xAI一个月开销达10亿美元,拟融资93亿美元
- 比特币反弹至 10.4 万美元上方,美国议员提出伊朗战争权力决议拟禁止美国介入
- 阿联酋的Crypto雄心:是下一个加密帝国还是空中楼阁?
- Polymarket 上美军 7 月前对伊朗采取军事行动概率升至 66.7%