
分析:DePIN 与人工智能的结合将有哪些新机遇?
作者 | CGV Research
随着世界迈向数字化转型的步伐不断加快,AI 和 DePIN(去中心化物理基础设施)已成为推动各行各业变革的基础性技术。AI 与 DePIN 的融合,不仅能够促进技术的快速迭代和应用广泛化,还将开启更为安全、透明和高效的服务模式,为全球经济带来深远的变革。
DePIN:去中心化脱虚向实,数字经济中流砥柱
DePIN,是去中心化物理基础设施(Decentralized Physical Infrastructure)的缩写。从狭义上说,DePIN 主要指由分布式账本技术支撑的传统物理基础设施的分布式网络,例如电力网络、通信网络、定位网络等。从广义上说,所有由物理设备支撑的分布式网络都可以称之为 DePIN,例如存储网络、计算网络。
from: Messari
如果说 Crypto 在金融层面带来了去中心化的变革,那么 DePIN 就是实体经济中的去中心化方案。可以说,PoW 矿机,就是一种 DePIN。从第一天起,DePIN 就是 Web3 的核心支柱。
AI 三要素——算法、算力、数据,DePIN 独占其二
人工智能的发展通常被认为依赖于三个关键的要素:算法、算力和数据。算法指驱动 AI 系统的数学模型和程序逻辑,算力指执行这些算法所需的计算资源,数据是训练和优化 AI 模型的基础。
三要素中哪个最重要?ChatGPT 出现之前人们通常认为是算法,不然学术会议、期刊论文也不会被一篇又一篇的算法微调所填充。可当 ChatGPT 与支撑其智能的大语言模型 LLM 亮相之后,人们开始意识到后两者的重要性。海量的算力是模型得以诞生的前提,数据质量和多样性对于建立健壮和高效的 AI 系统至关重要,相比之下,对于算法的要求不再如往常精益求精。
在大模型时代,AI 从精雕细琢变为大力飞砖,对算力与数据的需求与日俱增,而 DePIN 恰好能够提供。代币激励撬动长尾市场,海量的消费级算力与存储将成为大模型提供最好的养料。
AI 的去中心化不是可选项,而是必选项
当然有人会问,算力和数据,在 AWS 的机房中都有,而且在稳定性、使用体验方面都胜过 DePIN,为什么要选择 DePIN 而不是中心化的服务?
这种说法自然有其道理,毕竟纵观当下,几乎所有大模型都是由大型的互联网企业直接或间接开发的,ChatGPT 的背后是微软,Gemini 的背后是谷歌,中国的互联网大厂几乎人手一个大模型。为何?因为只有大型的互联网企业拥有足够的优质数据与雄厚财力支撑的算力。但这是不对的,人们已经不想再被互联网巨头操纵一切。
一方面,中心化的 AI 具备数据隐私和安全风险,可能受到审查与控制;另一方面,互联网巨头制造的 AI 会使人们进一步加强依赖性,并且导致市场集中化,提高创新壁垒。
from: https://www.gensyn.ai/
人类不应该需要一个 AI 纪元的马丁路德了,人们应该有权利直接和神对话。
商业角度看 DePIN:降本增效是关键
哪怕抛开去中心化与中心化的价值观之争,从商业角度来看,将 DePIN 用于 AI 仍然有其可取之处。
首先,我们需要清晰地认识到,尽管互联网巨头手中掌握了大量的高端显卡资源,散入民间的消费级显卡组合起来也能构成非常可观的算力网络,也就是算力的长尾效应。这类消费级显卡,闲置率其实是非常高的。只要 DePIN 给到的激励能超过电费,用户就有动力为网络贡献算力。同时,所有物理设施被用户自身所管理,DePIN 网络无需负担中心化供应商无法避免的运营成本,只需关注协议设计本身。
对于数据而言,DePIN 网络通过边缘计算等方式,能够释放潜在数据的可用性,降低传输成本。同时,多数分布式存储网络而言具备自动去重功能,减少了 AI 训练数据清洗的工作。
最后,DePIN 所带来的 Crypto 经济学增强了系统的容错空间,有望实现提供者、消费者、平台三赢的局面。
from: UCLA
以防你不相信,UCLA 最新的研究表明相同成本下使用去中心化计算相比传统 GPU 集群实现了 2.75 倍的性能,具体来说,快了 1.22 倍且便宜 4.83 倍。
筚路维艰:AIxDePIN 会遇到哪些挑战?
We choose to go to the moon in this decade and do the other things, not because they are easy, but because they are hard.
——John Fitzgerald Kennedy
运用 DePIN 的分布式存储与分布式计算无信任地构建人工智能模型仍然具备许多挑战。
工作验证
从本质上,计算深度学习模型与 PoW 挖矿都是通用计算,最底层都是门电路之间的信号变化。宏观而言,PoW 挖矿是“无用的计算”,通过无数的随机数生成与哈希函数计算试图得出前缀有 n 个 0 的哈希值;而深度学习计算是“有用的计算”,通过前向推导与反向推导计算出深度学习中每层的参数值,从而构建一个高效的 AI 模型。
事实是,PoW 挖矿这类“无用的计算”使用了哈希函数,由原像计算像很容易,由像计算原像很难,所以任何人都能轻易、快速地验证计算的有效性;而对于深度学习模型的计算,由于层级化的结构,每层的输出都作为后一层的输入,因此验证计算的有效性需要执行之前的所有工作,无法简单有效地进行验证。
from: AWS
工作验证是非常关键的,否则,计算的提供者完全可以不进行计算,而提交一个随机生成的结果。
有一类想法是让不同的服务器执行相同计算任务,通过重复执行并检验是否相同来验证工作的有效性。然而,绝大多数模型计算是非确定性的,即使在完全相同的计算环境下也无法复现相同结果,只能在统计意义上实现相似。另外,重复计算会导致成本的快速上升,这与 DePIN 降本增效的关键目标不相符。
另一类想法是 Optimistic 机制,先乐观地相信结果是经过有效计算的,同时允许任何人对计算结果进行检验,如果发现有错误,可以提交一个 Fraud Proof,协议对欺诈者进行罚没,并对举报者给予奖励。
并行化
之前提到,DePIN 撬动的主要是长尾的消费级算力市场,也就注定了单个设备所能提供的算力比较有限。对于大型 AI 模型而言,在单个设备上进行训练的时间会非常长,必须通过并行化的手段来缩短训练所需时间。
深度学习训练的并行化主要的难点在于前后任务之间的依赖性,这种依赖关系会导致并行化难以实现。
当前,深度学习训练的并行化主要分为数据并行与模型并行。
数据并行是指将数据分布在多台机器上,每台机器都保存一个模型的全部参数,使用本地的数据进行训练,最后对各个机器的参数进行聚合。数据并行在数据量很大时效果好,但需要同步通信来聚合参数。
模型并行是当模型大小太大无法放入单个机器时,可以将模型分割在多台机器上,每台机器保存模型的一部分参数。前向和反向传播时需要不同机器之间通信。模型并行在模型很大时有优势,但前后向传播时的通信开销大。
对于不同层之间的梯度信息,又可以分为同步更新与异步更新。同步更新简单直接,但是会增加等待时间;异步更新算法等待时间短,但是会引入稳定性问题。
from: Stanford University, Parallel and Distributed Deep Learning
隐私
全球正在掀起保护个人隐私的思潮,各国政府都在加强对个人数据隐私安全的保护。尽管 AI 大量使用公开数据集,真正将不同 AI 模型区分开的还是各企业专有的用户数据。
如何在训练过程中得到专有数据的好处同时不暴露隐私?如何保证构建的 AI 模型参数不被泄露?
这是隐私的两个方面,数据隐私与模型隐私。数据隐私保护的是用户,而模型隐私保护的是构建模型的组织。在当前的情况下,数据隐私比模型隐私重要得多。
多种方案正在尝试解决隐私的问题。联邦学习通过在数据的源头进行训练,将数据留在本地,而模型参数进行传输,来保障数据隐私;而零知识证明可能会成为后起之秀。
案例分析:市场上有哪些优质项目?
Gensyn
Gensyn 是一个分布式计算网络,用于训练 AI 模型。该网络使用基于 Polkadot 的一层区块链来验证深度学习任务是否已正确执行,并通过命令触发支付。成立于 2020 年,2023 年 6 月披露一笔 4300 万美元的 A 轮融资,a16z 领投。
Gensyn 使用基于梯度的优化过程的元数据来构建所执行工作的证书,并由多粒度、基于图形的精确协议和交叉评估器一致执行,以允许重新运行验证工作并比较一致性,并最终由链本身确认,来保证计算的有效性。为了进一步加强工作验证的可靠性,Gensyn 引入质押来创建激励。
系统中有四类参与者:提交者、求解者、验证者和举报者。
• 提交者是系统的终端用户,提供将要计算的任务,并为已完成的工作单元付费。• 求解器是系统的主要工作者,执行模型训练并生成证明以供验证者检查。• 验证器是将非确定性训练过程与确定性线性计算联系起来的关键,复制部分求解器证明并将距离与预期阈值进行比较。• 举报人是最后一道防线,检查验证者的工作并提出挑战,挑战通过后获得奖励。
求解者需要进行质押,举报者检验求解者的工作,如发现作恶,进行挑战,挑战通过后求解者质押的代币被罚没,举报者获得奖赏。
根据 Gensyn 的预测,该方案有望将训练成本降至中心化供应商的 1/5。
from: Gensyn
FedML
FedML 是一个去中心化协作的机器学习平台,用于在任何地方以任何规模进行去中心化和协作式 AI。更具体地说,FedML 提供了一个 MLOps 生态系统,可以训练、部署、监控和持续改进机器学习模型,同时以保护隐私的方式在组合数据、模型和计算资源上进行协作。成立于 2022 年,FedML 于 2023 年 3 月披露 600 万美元的种子轮融资。
FedML 由 FedML-API 和 FedML-core 两个关键组件构成,分别代表高级 API 和底层 API。
FedML-core 包括分布式通信和模型训练两个独立的模块。通信模块负责不同工作者/客户端之间的底层通信,基于 MPI;模型训练模块基于 PyTorch。
FedML-API 建立在 FedML-core 之上。借助 FedML-core,可以通过采用面向客户端的编程接口轻松实现新的分布式算法。
FedML 团队最新的工作中证明,使用 FedML Nexus AI 在消费级 GPU RTX 4090 上进行 AI 模型推理,比 A100 便宜 20 倍,快 1.88 倍。
from: FedML
未来展望:DePIN 带来 AI 的民主化
有朝一日,AI 进一步发展为 AGI,彼时算力将成为事实上的通用货币,DePIN 使得这一过程提前发生。
AI 和 DePIN 的融合开启了一个崭新的技术增长点,为人工智能的发展提供了巨大的机遇。DePIN 为 AI 提供了海量的分布式算力和数据,有助于训练更大规模的模型,实现更强的智能。同时,DePIN 也使 A I 向着更加开放、安全、可靠的方向发展, 减少对单一中心化基础设施的依赖。
展望未来,AI 和 DePIN 将不断协同发展。分布式网络将为训练超大模型提供强大基础,这些模型又将在 DePIN 的应用中发挥重要作用。在保护隐私和安全的同时,AI 也将助力 DePIN 网络协议和算法的优化。我们期待着 AI 和 DePIN 带来更高效、更公平、更可信的数字世界。
比推快讯
更多 >>- Binance 新 Bonding Curve 参与门槛:至少 241 分
- Justin Sun 亮相日本 WebX2025:行业共识催动波场 TRON 成为全球稳定币核心网络
- 美联储前副主席:美联储料谨慎下调政策利率
- 某巨鲸以 1.28 美元均价增持 294 万枚 VIRTUAL,价值超 370 万美元
- 花旗预计年底前 10 年期美国国债收益率将达到 4.10%
- 某比特币 OG 近日抛售 22769 枚 BTC 并买入做多 ETH
- 某巨鲸加仓做多 XPL,当前浮亏近 36 万美元,爆仓价 0.20816 美元
- 比特币充币趋势延续,过去 24 小时 CEX 净流入 7,316.90 枚 BTC
- Bitunix 分析师:食品业争取关税豁免,通胀与降息拉扯市场预期
- 分析师:比特币近期前景或取决于美国经济数据
- 数据:当前加密恐慌贪婪指数为 46,处于中性状态
- Project Hunt:梦幻体育平台 Football.Fun 为过去 7 天新增 Top 人物关注者最多的项目
- RootData:MAV 将于一周后解锁价值约 124 万美元的代币
- Metaplanet 增持 103 枚 BTC,总持仓量升至 18,991 枚
- 日本首相:Web3 将带动地方创新与全球合作新未来
- SBI Holdings 与 Chainlink 达成战略合作,旨在加速机构对数字资产的采用
- 香港财经事务及库务局局长许正宇:本港就稳定币定位清晰,不存在炒作机会
- 币安即将调整包括 TRX、SUI 在内的多个资产抵押率及合约杠杆,8 月 26 日起生效
- 数据:过去 24h Binance 净流出 3.05 亿 USDT
- 赵长鹏:“CBDC 已经过时,相比之下稳定币更胜一筹。”
- Metaplanet 在 9 月份的评估中被纳入富时日本指数
- 赵长鹏:过去几天合照数百张,不作为背书代言证明
- 某巨鲸/机构过去 13 小时里清仓超 1 万枚 ETH,总计获利 5170 万美元
- 观点:比特币挖矿面临“极其艰难”市场,电力成关键货币
- Arthur Hayes:加密牛市将持续至 2028 年
- 香港金管局将于 2026 年 1 月 1 日落实巴塞尔加密资产资本金新规
- Placeholder 合伙人:预计未来几周 SOL/ETH 与 SOL/BTC 汇率将进一步走强
- 数据:以太坊现货 ETF 8 月 22 日总净流入 3.41 亿美元,富达 FETH 净流入 1.18 亿美元居首
- 排队等待加入以太坊 PoS 网络的 ETH 升至 40.45 万枚,同时超 84 万枚 ETH 等待退出
- 日本财务大臣表示加密资产可作为多元化投资的一部分
- 港股加密货币 ETF、概念股集体冲高,博时以太坊 ETF、嘉实以太坊 ETF 均涨超 9%
- Arthur Hayes:预计 HYPE 有 126 倍潜在上涨空间
- 赵长鹏:如今的代币化价格追踪还存在问题,基础建设很重要
- 12.5 万美元滚仓做多 ETH平仓 2000 枚 ETH,清算价下调至 4658 美元
- James Wynn 的 10 倍 DOGE 多单被部分清算
- 中信证券:预计美联储年内将连续降息三次
- Raydium 已累计花费 1.963 亿美元回购 7100 万枚 RAY,占流通量 26.4%
- 3 月 28 日收到资金的未知黑客卖出于 4 日前购买的 5001 枚 ETH,获利 204 万美元
- 分析:因 LUNA 和 FTX 崩盘导致 LP 谨慎行事,未来中等规模加密基金或将“空心化”
- USDC 在以太坊网络使用量创历史新高,月交易额达 7483 亿美元
- 稳定币持有的美国国债规模已超过德国
- Pudgy Penguins CEO:计划两年内完成 Pudgy Penguins IPO 上市
- Metaplanet 从小盘股升级为中盘股,晋级 FTSE 日本指数和全球指数
- Vitalik:预测市场若能解决利息问题,将出现大量对冲应用场景并推动交易量进一步增长
- 某比特币多头在 109892 美元被强平亏损 1249 万美元,或为沉睡七年高调换仓 ETH 的 BTC 远古巨鲸抛售所致
- Willy Woo:比特币本周期上涨缓慢系远古巨鲸抛压所致,市场需消化万倍收益筹码
- 今日关注德国 IFO 指数及美国新屋销售数据
- 美联储 9 月降息概率达 84.1%,维持利率不变概率为 15.9%
- 央行加码投放中长期流动性,净投放达 6,000 亿元
- 过去 1 小时全网爆仓 2.99 亿美元,空单仅爆仓 1809.26 万美元
比推专栏
更多 >>观点
比推热门文章
- 某比特币 OG 近日抛售 22769 枚 BTC 并买入做多 ETH
- 某巨鲸加仓做多 XPL,当前浮亏近 36 万美元,爆仓价 0.20816 美元
- 全面解读:10 个热门 Launchpad 平台机制与散户必备指南
- Arthur Hayes长文访谈:ETH终局在1-2万美元,秋季或迎回调
- 比特币充币趋势延续,过去 24 小时 CEX 净流入 7,316.90 枚 BTC
- Bitunix 分析师:食品业争取关税豁免,通胀与降息拉扯市场预期
- 分析师:比特币近期前景或取决于美国经济数据
- 数据:当前加密恐慌贪婪指数为 46,处于中性状态
- Project Hunt:梦幻体育平台 Football.Fun 为过去 7 天新增 Top 人物关注者最多的项目
- RootData:MAV 将于一周后解锁价值约 124 万美元的代币