
超越 GPU 租赁,Prime Intellect 如何让去中心化 AI 训练成为可能
通过开发切实可行的分布式 AI 训练框架,Prime Intellect 激活了去中心化 GPU 算力市场的潜力。
原文标题:《Prime Intellect: Making Magic to Scale AI Training》
撰文:Teng Yan
编译:思维怪怪
译者注:随着英伟达市值在年中突破 3 万亿美元,GPU 算力租赁成为 2024 年加密 AI 领域最热门的赛道。然而,大多数项目仅停留在算力资源聚合阶段,未能解决去中心化 AI 训练的核心难题——跨分布式 GPU 集群的模型训练。新锐项目 Prime Intellect 正试图打破这一瓶颈。加密研究员 Teng Yan 撰文探讨了 Prime Intellect 的创新方案,以及它如何有望引领去中心化 AI 训练的未来。
大多数 GPU 市场平平无奇,往往只是重复相同的产品体验,仅通过添加一个代币来补贴成本。
但去中心化 AI 训练则是一个全新的游戏,具有变革性潜力。Prime Intellect 正在为大规模去中心化 AI 训练构建关键基础设施。
以下是他们超越普通 DePIN 项目的原因:
Prime Intellect 的宏伟蓝图包含四个部分:
1. 整合全球算力资源
2. 开发用于协作模型开发的分布式训练框架
3. 协作训练开源 AI 模型
4. 实现 AI 模型的集体所有权
GPU 市场聚合器
7 月 1 日,他们通过推出 GPU 市场启动了第一阶段。该市场整合了主要中心化和去中心化 GPU 供应商的算力资源,包括 Akash Network、io.net、Vast.ai、Lambda Cloud 等。目标是通过聚合供应商资源并提供便捷工具,为用户提供最优惠的租赁价格。用户可以直接使用 Prime Intellect 平台,无需再逐一访问 Akash 或 io.net 进行比价。
他们的在线测试平台直观且易于使用。用户几分钟内就能启动集群,无需 KYC。你可以选择希望租赁 GPU 的位置和网络的安全级别(如安全云或社区云),此外还有一个「最低价」选项。
从顶级 H100 到 RTX3000 和 4000 系列,他们提供多种 GPU 选择。目前集群规模上限为 8 个 GPU,Prime Intellect 正努力将其扩大到 16-128 个。
大规模去中心化训练
他们蓝图的第二部分——开发分布式 AI 训练框架,最令人瞩目。
目前的情况是:训练大型基础 AI 模型通常需要自建数据中心。这涉及高速网络、定制数据存储、隐私保护和效率优化,这些仅靠租用多个 GPU 难以实现。所以微软、谷歌和 OpenAI 等巨头主导了这一领域毫不奇怪,小型玩家缺乏必要的资源。
而 Prime Intellect 将实现跨多个分布式 GPU 集群的模型训练。
去中心化训练面临多重挑战:
-
优化全球节点间的通信延迟和带宽
-
适应这些网络中不同类型的 GPU
-
容错能力:训练过程必须能适应 GPU 集群可用性的变化,因为这些集群可能会随时加入或退出
这需要将前沿研究转化为实际生产系统:
-
分布式低通信训练(DiLoCo):一种在连接不良的设备上进行数据并行训练的方法,每 500 步同步一次梯度,而非每步同步。
-
Prime Intellect 最近开源了支持全球分布式 GPU 协作模型开发的框架,任何人都可使用该代码。
-
他们重现了谷歌 DeepMind 的 DiLoCo 实验,在横跨 3 国的情况下训练模型,计算利用率达 90-95%。他们还将规模扩大至原始工作的 3 倍,展示了其在十亿参数模型上的有效性。
如果 Prime Intellect 能解决这些问题,将极大影响模型训练方式和资源利用效率。
Prime Intellect 正在开发的最后一项功能是一个协议,用于奖励贡献算力、代码和资金的参与者,并实现 AI 模型的集体治理。这契合去中心化 AI 理念,鼓励用户参与其中。预计他们可能会使用加密货币作为交易和所有权媒介。
我的看法
-
当前 GPU 市场同质化严重,缺乏吸引力。尽管一些市场通过代币激励聚集了供应,但由于去中心化训练的挑战,需求端仍然疲软。
-
全球去中心化 GPU 市场竞争激烈。(以下是几个 GPU 提供商的价格比较:)
-
如果 Prime Intellect 能提高去中心化 AI 训练的效率,将为 GPU 需求打开大门。
-
Prime Intellect 拥有知名投资者支持,如 Clem Delangue(Hugging Face 联创兼 CEO)、Erik Voorhees(Shapeshift 创始人兼 CEO)和 Andrew Kang(Mechanism Capital 联创兼合伙人)。
比推快讯
更多 >>- 数据:过去 24h Binance 净流出 1.78 亿 USDT
- 分析:Google Cloud 盗号者或与此前 BNB Chain 盗号者为同一人
- 美联储保尔森:9 月降息幅度 “合情合理”
- 美联储保尔森:倾向于今年内逐步下调利率,直至明年
- Aster:空投申领曾意外提前开放,现已修复
- 美联储 10 月降息 25 个基点的概率升至 96.7%
- 花旗银行计划于 2026 年推出加密资产托管服务
- Kraken 已上线 Sidekick(K)
- 标普全球、穆迪股价短线分别跌 2% 和 3%
- Aave DAO 累计回购 10 万枚 AAVE,拟以其作抵押开启 GHO 信贷
- BNB Chain:“重生支持”空投旨在帮助 Meme 币交易亏损用户
- Meme 代币 why 市值触及 80 万美元
- 渣打银行:若美国经济动能持续,2026 年降息可能性降低
- Neiro 宣布将与 OpenSea 合作推出 NFT 系列 Neiro Woofer Pack
- NEAR 宣布 House of Stake 已正式上线主网,锁定 NEAR 将获得协议治理权与激励
- 数据:比特币 ETF 今日净流出 97 枚 BTC,以太坊 ETF 净流出 34,603 枚 ETH
- Aave 代币回购总额已突破 10 万枚,ACI 创始人提议将回购力度翻倍
- 欧洲资产管理公司 Amundi 将进军加密 ETF 市场
- Cap Frontier Program 第三期已开启,规则与第二期保持不变
- Ferra 宣布完成 200 万美元 Pre-Seed 融资并上线 Sui 主网 DLMM DEX
- AC 新项目 Flying Tulip 披露公募细节:分四轮进行,每轮条款相同,支持在六条链出资
- 数据:监测到 3,417.85 万 USDT 转入 Binance
- Pyth Network 与 Kalshi 合作提供实时预测市场数据
- 嘉楠科技在加拿大启动 2.5 兆瓦比特币挖矿项目,利用滞留天然气
- 美股强劲反弹,标普 500 上涨 1.6% 受 AI 资本支出推动
- 九紫新能以 100 枚 Bitcoin 完成私募,推进加密资产战略
- CME 上线 SOL 与 XRP 期权交易
- 纳指涨幅扩大至 2%,标普 500 涨 1.5%,道指涨 1.1%
- 改革英国党领袖 Farage 承诺推动加密货币去监管化
- Garrett Jin:率先建立稳定基金的交易平台将吸引资金流入,并推动行业发展
- 巴西比特币金融上市公司 OranjeBTC 斥资 194 万美元增持 16 枚 BTC
- Bitfinex 报告:市场虽受重创但仍有希望,若 BTC 维持 11 万美元或将开启反弹
- BitMine 上周增持约 20 枚 ETH,以太坊总持仓达到 303 万枚
- ENDRA Life Sciences 拟配股募资 14,400 万美元以支持其数字资产财库
- 美联储官员静默期前本周将密集发声
- 狗狗币基金会商业分支 House of Doge 将通过合并在纳斯达克上市
- Strategy 斥资 2720 万美元购入 220 枚比特币,总持仓量达 640,250 枚
- 分析:链上出现 10 万枚 LINK 异动,疑为主网上线前集成测试
- Strategy 上周增持 220 枚 BTC,均价 123,561 美元
- BscScan 将于 10 月 14 日进行服务器维护
- BTC OG 巨鲸加仓 BTC 空单头寸至 2.08 亿美元,爆仓价 12.1 万美元
- CZ:与本人合照无需付费,警惕骗局
- 稳定币协议 STBL 计划在 10 月底前启动回购
- 全网 COAI 合约交易 24 小时爆仓 2980 万美元,仅少于 BTC、ETH 与 SOL
- 美元指数 DXY 短线下挫 9 点,现报 99.08
- 华检医疗成立美国附属公司,推进稳定币及知识产权证券化
- 美股高位徘徊,企业盈利预期乐观情绪降温
- 某巨鲸 20 倍做空 2.1 亿美元比特币,开仓价 116,812 美元
- 0x5a9 开头巨鲸以 400 万美元新开 BTC 多单,BTC 巨鲸近三小时集体看多
- Qube_RT 地址向币安存入 22 万枚 AVAX,若立即出售将亏损 38 万美元