
时代周刊:国产 AI 黑马 DeepSeek 一鸣惊人,硅谷「颤抖」
来源:TIME
原标题:What to Know About DeepSeek, the Chinese AI Company Causing Stock Market Chaos
作者:Billy Perrigo、Tharin Pillay
编译及整理:比推BitpushNews
近日,中国杭州初创公司 DeepSeek 创建的新型 AI 模型震惊了美国 AI 业。它的表现超越了OpenAI的领先模型,取代ChatGPT 登顶 iOS 应用商店的榜首,并替代Meta成为「开源 AI 工具」的领先供应商。
所有叙事都指向一个关键问题:尽管美国对中国获取先进半导体的能力实施了制裁,但中国在全球 AI 竞赛中是否正在赶上美国?
DeepSeek 上周发布的新 R1 模型据称训练成本仅为 600 万美元,但在多个数学和推理指标上的表现却能与OpenAI 的 o1 模型相媲美——这是 OpenAI 及其支持者微软数百亿美元投资的成果。
中国模式对用户来说也更便宜。使用其最强大版本的成本比 OpenAI 及其竞争对手低 95% 左右。结果是:美国科技行业突然面临一个可能更便宜、更强大的挑战者,这让投资者感到不安,周一开盘,美国科技股遭遇疯狂抛售。
但并非所有人都相信,一些美国人工智能研究人员对DeepSeek真实的成本、以及部署了多少先进芯片来创建模型的说法表示怀疑。
然而,很少有人质疑 DeepSeek 的惊人能力。
美国著名风险投资家马克·安德森 (Marc Andreessen)在 X 上写道:“Deepseek R1 是人工智能的斯普特尼克时刻” ,斯普特尼克指的是冷战期间苏联成功将一颗卫星送入轨道的时刻。
那么,DeepSeek 是什么?它对美国科技霸权意味着什么?
什么是 DeepSeek?
DeepSeek 成立于不到两年前,由中国对冲基金幻方资本 (High-Flyer Capital Management) 创立,是一家致力于研究通用人工智能 (AGI) 的研究实验室。2024 年底发布的一系列开源版本让这家初创公司名声大噪,其中包括大型语言模型“v3”,其表现优于 Meta 的所有开源 LLM,可与 OpenAI 的闭源 GPT4-o 相媲美。
当时,首席执行官梁文峰表示,他聘请了一批年轻的计算机科学研究团队,目的是“解决世界上最难的问题”——关键是,不以盈利为目的。早期成果令人鼓舞:他的产品非常高效,以至于 DeepSeek 2024 年的发布引发了中国人工智能行业的价格战,迫使竞争对手大幅降价。
今年,这场价格战似乎将蔓延至太平洋彼岸。
然而,DeepSeek 的人工智能与美国竞争对手有一个重要区别。 尽管 DeepSeek 的模型在推理测试中表现出色,但它们受到一些政策的限制。例如,DeepSeek R1 拒绝回答某些较为敏感的历史话题。
DeepSeek 的成功对美国科技巨头意味着什么
正当谷歌、Meta、微软、亚马逊及其数十家竞争对手准备再投入数百亿美元建设新的人工智能基础设施时,DeepSeek 的成功引发了一个令人不安的问题:中国科技公司是否有可能在投入更少的情况下匹敌甚至超越硅谷的技术实力?
据科技新闻网站 The Information 上周末报道,Meta 计划今年在人工智能基础设施上投入 650 亿美元,目前已经建立了四个“作战室”来分析 DeepSeek 的模型,试图找出这家中国公司如何以如此低的成本训练模型,并利用这些见解改进自己的开源 Llama模型。
在金融市场,由于担心训练强大的人工智能所需的人工智能芯片数量可能比之前预想的要少,英伟达股价周一上午下跌逾 15%。其他美国科技股也出现下跌。
Pictet Asset Management 首席策略师 Luca Paolini 表示:“虽然 [DeepSeek R1] 对用户和全球经济来说是个好消息,但对美国科技股来说却是个坏消息。在估值和增长预期非常高的情况下,这可能会导致人工智能资本投资名义上缩减,并给利润率带来压力。”
但美国科技还没有失败——至少现在还没有。
目前,OpenAI 的“o1 Pro”模型仍被认为是世界上最先进的。然而,DeepSeek R1 的表现确实表明,中国比以前想象的更接近人工智能的前沿,开源模型已经赶上了闭源模型。
对于 OpenAI 和谷歌等闭源模型公司来说,更令人担忧的可能是 DeepSeek 向消费者收取的费用——或者说,费用太低了——以访问其最先进的模型。OpenAI 对其最先进的模型 o1 输出的每百万个“token”(即词段)收取 60 美元。相比之下,DeepSeek 对 R1 输出的相同数量 token 收取 2.19 美元——几乎低了 30 倍。
与美国政府密切合作的人工智能公司 Gladstone AI 的首席技术官爱德华·哈里斯 (Edouard Harris) 表示:“它侵蚀了工业基础,侵蚀了利润,削弱了私人资本进一步投资西方(人工智能)扩张的动力。”
…但是 Deepseek 是透明的吗?
DeepSeek 的成功更具爆炸性,因为它似乎让人质疑美国政府通过限制向中国出口强大芯片或 GPU 来限制其人工智能战略的有效性。如果 DeepSeek 的说法属实,则意味着尽管存在这些限制,中国仍有能力创建强大的人工智能模型,这凸显了美国战略的局限性。
DeepSeek 声称,其制约因素是芯片,而不是资金或人才。该公司表示,其仅使用 2,000 块二级 Nvidia 芯片训练其 v3 和 R1 模型。DeepSeek 首席执行官梁文峰在 2024 年表示:“钱从来都不是我们的问题。禁止出口先进芯片才是问题所在。”(美国现行政策禁止向中国出口最先进的 AI 芯片,OpenAI 和微软使用的美国数据中心就装有这类芯片。)
但这些说法是真的吗?
Scale AI 首席执行官Alexandr Wang最近在达沃斯接受CNBC采访时表示:“据我了解,DeepSeek 拥有 50,000 块 H100 芯片。”H100 是目前市场上性能最高的 Nvidia GPU 芯片。“他们不能公开谈论 [这个],因为这违反了美国实施的出口管制。”(这种规模的 H100 集群将耗资数十亿美元。)
上周一,中国总理李强在北京与梁文峰见面,这表明中国对这项技术的重视程度。据报道,在那次会议上,梁文峰表示,DeepSeek 需要更多芯片。“DeepSeek 只能使用几千个 GPU,但他们却成功了,”Gladstone AI 首席执行官杰瑞米·哈里斯 (Jeremie Harris) 表示。“因此,这引出了一个显而易见的问题:如果他们从政府那里获得拨款,全速推进,会发生什么?”
尽管中国可能用更少的芯片实现了惊人的人工智能能力,但专家表示,更多的计算能力将始终是一种战略优势。在这方面,美国仍然遥遥领先。乔治梅森大学研究员迪恩·鲍尔说:“拥有更多计算能力永远不是坏事。无论你拥有多少,你都会使用它。”
这将对中美科技竞争产生怎样的影响?
简短的回答是:从华盛顿的角度来看,情况尚不确定。
在拜登政府任期即将结束的日子里,即将离任的国家安全顾问杰克·沙利文 (Jake Sullivan)警告称,人工智能发展速度是“目前世界上最具影响力的事情”。就在上任几天后,特朗普总统宣布成立一个由 OpenAI 和其他公司支持的 5000 亿美元新企业,以建设对创造“通用人工智能”至关重要的基础设施——这是人工智能的下一个飞跃,其系统将足够先进,能够取得新的科学突破,以近似科幻小说中描述的那种方式进行推理。
尽管关于美国对中国芯片限制的未来仍存在疑问,但华盛顿的优先事项在特朗普总统上任第一周签署的人工智能行政命令中显而易见,该命令宣布“美国的政策是维持和加强美国在全球人工智能领域的主导地位,以促进人类繁荣、经济竞争力和国家安全。”
专家表示,保持这种主导地位至少在一定程度上意味着要准确了解中国科技公司在做什么,以及保护美国的知识产权。
Gladstone AI 的爱德华·哈里斯 (Edouard Harris) 表示:“DeepSeek 和许多其他中国大公司很有可能得到了中国政府的支持,而不仅仅是资金方面的支持。”他还建议美国人工智能公司加强安全措施。
人工智能将走向何方?
自 12 月以来,OpenAI 的新 o1 和 o3 模型打破了人工智能模型难以通过的高级推理测试的记录。
DeepSeek R1 做了类似的事情,在这个过程中体现了许多研究人员所说的范式转变:研究人员不是扩大用于训练模型的计算能力,而是扩大模型在回答问题之前思考响应的时间(以及计算能力和电力)。研究人员称之为“测试时间计算”的这种扩展将新一类“推理模型”(如 DeepSeek R1 和 OpenAI 的 o1)与不太复杂的前辈区分开来。许多人工智能研究人员认为,在这种范式达到极限之前,还有很大的发展空间。
一些人工智能研究人员认为,DeepSeek 的 R1 取得了与 DeepMind 的 AlphaZero 同等水平的突破,AlphaZero 是 2017 年推出的模型,它通过纯粹与自己对弈而不断提高,而不是观察任何人类游戏,从而成为国际象棋和围棋棋盘游戏中的超人。
这是因为R1 并没有像其他领先的 LLM 那样对人工标记的数据进行“预训练”。
相反,DeepSeek 的研究人员找到了一种方法,让模型从头开始引导自己的推理能力。
他们表示:“我们不需要明确地教导模型如何解决问题,而只需为其提供适当的激励,它就会自主开发出先进的解决问题的策略。”
这一发现意义重大,因为它表明,只要应用更多的计算能力,强大的人工智能能力可能会以比以前想象的更快的速度出现,而且所需的人力更少。“DeepSeek R1 就像是这种扩展范式的 GPT-1,”Ball 说。
最终,中国最近在人工智能领域的进步非但不会取代美国的地位,反而可能是一个重新排序的开始——换句话说,这是一个向未来迈出的一步,未来不再是一个霸权国家,而是多个人工智能力量中心相互竞争。
OpenAI 前政策工作人员 Miles Brundage 在 X 上写道:“除非发生战争,否则中国在一年之内也会拥有自己的超级智能,比美国晚不到一年。所以,除非你想要(发生战争),由多个国家共同发展的多极化人工智能格局似乎是必然的。”
比推快讯
更多 >>- BMNR 董事长:ETH 未来 12 个月内公允价格或达 1-2 万美元,华尔街将探索 ETH 质押
- 马斯克向 Grok 询问量子计算破解比特币算法(SHA-256)的概率,Grok 回复称未来 5 年几乎为 0
- 以太坊合约币本位持仓量较历史高点跌超 11%
- 位于瑞士卢加诺的中本聪雕像今日被盗,该雕像由 Tether 参与创立
- 数据:巨鲸"先定 10 个大目标"开启 5 倍杠杆 BTC 多单,开仓价 112,891 美元
- 通信平台 Towns Protocol 公布代币经济学:57%的代币用于空投、赠款和其他社区计划
- 比特币再质押平台 SatLayer 空投注册现已开放,截止时间为 8 月 9 日
- 多家外媒今日报道中国再禁加密货币交易和挖矿或为不实消息
- 部分山寨币反弹明显,CFX 近 2 小时涨超 5%
- 香港立法会议员:稳定币没有炒卖机会,条例制定参考美日新和欧盟等同业
- RootData:B3 将于一周后解锁价值约 438 万美元的代币
- Project Hunt:去中心化 ZK-Rollup StarkNet 为过去 7 天被 Top 人物取关最多的项目
- 某鲸鱼 40 倍做多比特币,并设定止盈点位为 125,000 美元
- Sam Altman:ChatGPT 新模型拟于未来几月发布,但期间或出现容量危机
- 时隔两年再次建仓 ETH 的大户过去一周已建仓 6711.2 枚 ETH,成本约为 3685.4 美元
- 某鲸鱼 DOGE 10 倍多单于今晨下跌时被部分清算
- 某鲸鱼 5 小时前向 CEX 存入 7500 枚 ETH,过去 3 日已抛售 33,682 枚 ETH
- 以太坊最大持币机构 BMNR 持仓浮亏比例已超 9%,浮亏金额近 2 亿美元
- 萨尔瓦多近 7 日共增持 7 枚比特币,总持仓达 6256.18 枚
- 此前强势山寨币普跌,VINE、ZORA 较高点接近腰斩
- pump.fun 近 24 小时 Solana 发币平台市场份额升至 32.4%,Letsbonk 回落至 50%
- 加密恐慌与贪婪指数跌至 53,市场情绪近一个月首次回归中性
- 比特币矿工近两周减持超 3000 枚比特币
- 负责特朗普案的前检察官因涉嫌非法政治活动遭调查
- 麻吉大哥黄立成近期做多仓位导致其回吐此前超两千万美元盈利
- 某鲸鱼 6 小时前从 FalconX 收到 25,540 枚 ETH,其近期共累积 35,615 枚 ETH
- Sharplink Gaming 增持 15,822 枚 ETH,价值约 5556 万美元
- Arkham:LuBian 矿池曾于 2020 年被盗超 12.7 万枚比特币,现价值近 145 亿美元
- 数据:过去 24h Binance 净流入 7,281.08 万 USDT
- 数据:过去 24 小时全网爆仓 6.28 亿美元,多单爆仓 5.65 亿美元,空单爆仓 6286.66 万美元
- ETH/BTC 短时跌至 0.03042,24 小时跌超 2%
- 巨鲸先定 10 个大目标空单止盈,累计获利 749.4 万美元
- 数据:ETH 当前全网 8 小时平均资金费率为 0.0048%
- 某地址平仓 ETH 多单,过去 5 日利润损失超 1700 万美元
- 数据:BONK 已累计销毁 11.55T 代币,按当前价格计约 3 亿美元
- 美联储威廉姆斯:5 月和 6 月就业增长的异常大幅下调才是周五非农报告中的真正新闻
- 香港稳定币发行人监管制度生效,警惕虚假持牌诈骗
- 库格勒意外辞职或加速特朗普选定下任美联储主席人选
- 上市公司 Bitmax 增持 56.0445 枚 BTC,总持仓量突破 500 枚
- 数据:“内幕巨鲸”加仓 1.8 万枚 ETH 空单,空单已浮盈 641 万美元
- 特朗普关税重创巴菲特旗下伯克希尔消费品业务
- 伯克希尔 Q2 现金储备三年来首降,股市投资更趋谨慎
- 数据:ETH 全网合约持仓量 24h 减少 7.53%
- RootData:Rhea Finance 代币(RHEA) 24 小时涨幅 38%
- 数据:监测到 4,590.84 万 USDT 转入 Binance
- 数据:“内幕巨鲸”再度开启 XRP 与 SOL 空单,总仓位价值逾 2.21 亿美元
- Tether 7 月份共增发 60 亿枚 USDT,年初至今总流通量增加 200 亿美元
- 财新:香港或把首批稳定币牌照范围缩小为三到四家
- 香港稳定币进入合规时代:牌照角逐和场景探路
- 内部人士:建议国家级公链由央国企主导建设
比推专栏
更多 >>观点
比推热门文章
- 以太坊合约币本位持仓量较历史高点跌超 11%
- 位于瑞士卢加诺的中本聪雕像今日被盗,该雕像由 Tether 参与创立
- 数据:巨鲸”先定 10 个大目标”开启 5 倍杠杆 BTC 多单,开仓价 112,891 美元
- 通信平台 Towns Protocol 公布代币经济学:57%的代币用于空投、赠款和其他社区计划
- 比特币再质押平台 SatLayer 空投注册现已开放,截止时间为 8 月 9 日
- 多家外媒今日报道中国再禁加密货币交易和挖矿或为不实消息
- 部分山寨币反弹明显,CFX 近 2 小时涨超 5%
- 香港立法会议员:稳定币没有炒卖机会,条例制定参考美日新和欧盟等同业
- RootData:B3 将于一周后解锁价值约 438 万美元的代币
- Project Hunt:去中心化 ZK-Rollup StarkNet 为过去 7 天被 Top 人物取关最多的项目