值得信赖的区块链资讯!
Dragonfly 合伙人:“不要信任,亲自验证”在去中心化推理中的应用
区块链和机器学习显然有很多共同之处。
编译:深潮 TechFlow
你想要运行一个像 Llama2–70B 这样的大型语言模型。如此庞大的模型需要超过 140GB 的内存,这意味着您无法在家用计算机上运行原始模型。那么你有哪些选择?你可能会转向云服务提供商,但你可能不太愿意信任一个单一的中心化公司来为你处理这个工作负载并收集你所有的使用数据。那么你需要的是去中心化推断,它可以让你运行机器学习模型而不依赖于任何单一的提供商。
信任问题
在去中心化网络中,仅仅运行模型并信任输出是不够的。假设我让网络使用 Llama2–70B 分析一个治理困境,我怎么知道它实际上没有使用 Llama2-13B,给我提供了更糟糕的分析,并将差额收入囊中?
在中心化的世界中,你可能会相信像 OpenAI 这样的公司是诚实的,因为它们的声誉受到了威胁(而且在某种程度上,LLM 的质量是不言而喻的)。但在去中心化的世界中,诚实并不是默认的,它需要经过验证。
这就是可验证推断发挥作用的地方。除了对查询提供响应之外,你还要证明它在你请求的模型上正确运行了。但是怎么做呢?
最简单的方法是将模型作为智能合约在链上运行。这肯定可以保证输出经过验证,但这是极其不切实际的。GPT-3 用一个维度为 12,288 的嵌入来表示单词。如果你在链上进行这个大小的单次矩阵乘法运算,根据当前的 Gas 价格,它将花费约 100 亿美元,这个计算将填满每一个区块大约一个月的时间。
所以,我们需要采取不同的方法。
观察了这个领域之后,我清楚地看到了三种主要的方法,用于解决可验证推断:零知识证明、乐观型欺诈证明和加密经济学。每种方法都有其自身的安全和成本影响。

1.零知识证明(ZK ML)
想象一下能够证明你运行了一个大型模型,但证明的大小实际上是固定的,不管模型有多大。这就是 ZK ML( 机器学习 ) 所承诺的,通过 ZK-SNARK 实现。
虽然原则上听起来很优雅,但将一个深度神经网络编译成零知识电路,然后证明它,是极其困难的。而且成本极高 ,至少,你可能会看到推断成本增加了 1000 倍,延迟增加了 1000 倍(生成证明的时间),更不用说在任何事情发生之前,将模型本身编译成电路。最终,这个成本必须转嫁给用户,因此对终端用户来说,这将变得非常昂贵。
另一方面,这是唯一一种在密码学上保证正确性的方法。使用 ZK,无论模型提供者多么努力,都无法作弊。但是这样做的成本很高,使得这对于可预见的未来的大型模型来说是不切实际的。
示例:EZKL, Modulus Labs, Giza
2.乐观型欺诈证明(Optimistic ML)
乐观的方法是相信,但要验证。我们假设推断是正确的,除非证明相反。如果一个节点试图作弊,“观察者”可以在网络中指出作弊者,并使用欺诈证明对其进行挑战。这些观察者必须随时观察链,并重新运行他们自己的模型以确保输出正确。
这些欺诈证明是 Truebit 风格的交互式挑战:响应游戏,在游戏中,你要反复在链上对模型执行轨迹进行分割,直到找到错误为止。

如果这确实发生了,那将是极其昂贵的,因为这些程序庞大且具有巨大的内部状态,一个单独的 GPT-3 推断成本约为 1 petaflop(10⁵ 浮点运算)。但是博弈论表明,这几乎不可能发生(欺诈证明在编码时也非常难以正确编写,因为在实际生产中几乎不会执行到这段代码)。
乐观的好处是,只要有一个诚实的观察者在关注,ML 就是安全的。成本比 ZK ML 便宜,但请记住,网络中的每个观察者都在重新运行每个查询。在平衡状态下,这意味着如果有 10 个观察者,那么安全成本必须转嫁给用户,所以他们将不得不支付超过 10 倍推断成本的费用(或者有多少观察者就支付多少)。
缺点是,与乐观型聚合技术一样,你必须等待挑战期结束,以确保响应已被验证。但是,根据网络参数的设置方式,你可能只需要等待几分钟而不是几天。
示例: Ora, Gensyn
3.加密经济学(Cryptoeconomic ML)
在这里,我们放弃所有花哨的技术,做简单的事情:权益加权投票。用户决定有多少节点应该运行他们的查询,它们各自透露他们的响应,如果响应之间有差异,那么奇怪的节点就会被砍掉。标准的预言机机制,这是一个更直接的方法,让用户设定他们想要的安全级别,平衡成本和信任。如果 Chainlink 在做 ML,这就是他们会采取的方式。
这里的延迟很快,你只需要每个节点的提交和揭示。如果这被写入到区块链中,那么从技术上讲,这可以在两个区块中发生。
然而,安全性是最弱的。如果大多数节点都愿意合作,那么它们可以理性地选择合谋。作为用户,你必须思考这些节点投入了多少,并且作弊会给他们带来多大的成本。也就是说,使用类似 Eigenlayer 的重新质押和可归因的安全性,网络可以在安全失败的情况下提供有效的保险。
但这个系统的好处是用户可以指定他们想要多少安全性。他们可以选择在他们的法定数量中有 3 个节点或 5 个节点,或者是网络中的每个节点。或者,如果他们想要冒险,他们甚至可以选择 n=1。这里的成本函数很简单:用户为他们的 quorum 中想要的法定数量支付费用。如果你选择了 3 个,你就要支付 3 倍的推断成本。
这里的棘手问题是:你能让 n=1 安全吗?在一个简单的实现中,一个孤立的节点应该每次都会作弊,如果没有人监督的话。但我怀疑,如果你加密查询并通过意向进行支付,你可能能够对节点隐瞒他们实际上是唯一回应这个任务的节点。在这种情况下,你可能可以向普通用户收取少于 2 倍推断成本的费用。
最终,加密经济学方法是最简单、最容易的,也可能是最便宜的,但从原则上讲,它是最不引人注目和最不安全的。但是一如既往,细节决定成败。
示例:Ritual 、Atoma Network
为什么可验证的 ML 很难
你可能会想,为什么我们还没有所有这些东西呢?毕竟,归根结底,ML 模型只是非常大的计算机程序。证明程序正确执行一直是区块链的核心。
这就是为什么这三种验证方法反映了区块链如何保护其区块空间的方式,ZK rollup 使用 ZK 证明,乐观型 rollup 使用欺诈证明,大多数 L1 区块链使用加密经济学。毫无疑问,我们最终会得出基本相同的解决方案。那么当应用于 ML 时,是什么使这变得困难?
ML 是独特的,因为 ML 计算通常被表示为密集的计算图,旨在在 GPU 上高效运行。它们不是为了被证明而设计的。因此,如果你想在 ZK 或乐观环境中证明 ML 计算,它们必须重新编译成可行的格式,这是非常复杂和昂贵的。

机器学习的第二个基本困难是非确定性。程序验证假设程序的输出是确定性的。但是,如果你在不同的 GPU 架构或 CUDA 版本上运行相同的模型,你会得到不同的输出。即使你强制每个节点使用相同的架构,你仍然会遇到算法中使用的随机性问题(扩散模型中的噪声,或者 LLM 中的代币抽样)。你可以通过控制随机数种子来修复这种随机性。但即使如此,你仍然会面临最后一个令人不安的问题:浮点运算中固有的非确定性。
几乎所有的 GPU 操作都是在浮点数上进行的。浮点数很难处理,因为它们不是可结合的——也就是说,对于浮点数来说,(a + b) + c 总是与 a + (b + c) 相同这种说法并不正确。由于 GPU 高度并行化,每次执行时加法或乘法的顺序可能会不同,这可能会导致输出中的小差异。这不太可能影响 LLM 的输出,因为单词的离散性质,但对于图像模型来说,可能会导致像素值微妙地不同,从而使两个图像不能完全匹配。
这意味着你要么需要避免使用浮点数,这会对性能造成巨大的打击,要么你需要在比较输出时允许一些灵活性。无论哪种方式,细节都很烦琐,你无法完全抽象出来。(这就是为什么以太坊虚拟机不支持浮点数,尽管一些区块链如 NEAR 支持浮点数的原因。)
简而言之,去中心化推理网络很难,因为所有的细节都很重要,而现实中的细节却出人意料地多。
总结
目前,区块链和机器学习显然有很多共同之处。其中一个是创造信任的技术,另一个则是迫切需要信任的技术。虽然去中心化推理的每种方法都有其自身的权衡,但我非常感兴趣地想看看企业家们如何利用这些工具来构建最好的网络。
比推快讯
更多 >>- 企业支付及金融平台 Airwallex 完成 3.3 亿美元融资,Addition 领投
- 四年前获得 99.1 万枚 SOL 的巨鲸继续止盈,向币安转入 1357 万美元 SOL
- Upbit 黑客事件发生后曾延迟超 6 小时方上报监管机构
- 分析:美联储降息几乎成定局,市场聚焦投票分歧与鲍威尔措辞
- 数据:过去 1 小时 Binance 净流入 3,007.28 万 USDT
- 冷静开单王不再冷静?空单陷入严重浮亏
- 数据:Circle 过去 7 天在 Solana 链上铸造约 22.5 亿枚 USDC
- XMAQUINA 通过提案即将进行 $DEUS TGE,1.1 亿枚 DEUS 将用于最后一轮预售
- Ripple 的 RLUSD 在以太坊上的供应量达到 11 亿美元市值
- 韩媒:因监管延误,韩国年内允许现货加密货币 ETF 交易的计划已基本落空
- 阿根廷央行考虑允许银行提供加密货币交易服务
- DWF Labs 合伙人,市场低估了 BTC 和加密行业的未来增长潜力
- 马斯克澄清以 8000 亿美元估值出售股份一事:公司一直保持正向现金流,NASA 订单仅占总收入的 5%
- OKX 将下线 KITEUSDT 永续合约
- Uniswap 创始人:Uniswap CCA 首次拍卖已结束,竞标额达 5900 万美元
- USDD 2.0 第十二期供应挖矿现已开启
- 多个内幕新账户同出手,押注特朗普今年不会解密 UFO 文件
- 日本 10 年期国债收益率升至 1.965%,创 2007 年 6 月以来新高
- “铁头多军”回归再度做多 ETH/SUI/FARTCOIN,总持仓 2028 万美元
- 欧洲央行施纳贝尔:对加息政策感到安心
- Bybit 与 Circle 达成战略合作,全面强化 USDC 全球合规生态
- 菲律宾数字银行 GoTyme 推出加密货币服务,支持 BTC、ETH、SOL 等 11 种资产
- 数据:ETH 全网合约持仓量 24h 增长 5.13%
- Hyperliquid:24 小时费用达 200 万美元,位居所有区块链之首
- 链上 meme 交投活跃度上升,Franklin、DOYR 等带动市场情绪回暖
- 吴杰庄连任第八届香港立法会议员,表态将继续推动 Web3 在香港发展
- 半木夏:美联储降息与扩表将带来跨市场普涨
- 华尔街预期鲍威尔本周将鹰派降息,美联储面临近年来最大内部分歧
- Matrixport:比特币短线企稳但情绪谨慎,FOMC 前难见明确突破
- 哈佛大学增加比特币投资至 4.43 亿美元,配比高于黄金
- 数据:StraitsX 向 Binance 转移 234.31 万 XUSD,价值约 234 万美元
- 币安获阿布扎比全球市场完整监管授权,将全面迁移至 ADGM 监管架构
- CZ:推特内容基本亲自运营
- 数据:“1011 内幕巨鲸”开启多单后 ETH 价格涨幅已超 5%
- 灰度:Bittensor 下周减半事件有望推高 TAO 价格
- 数据:35 枚 BTC 从匿名地址转入 Cumberland,价值约 318.71 万美元
- 某巨鲸在 HyperLiquid 存入 600 万美元 USDC 并开多 ETH、SUI 和 FARTCOIN
- meme 币 Franklin 近 1 小时交易笔数超 9300 笔,市值回升至 1300 万美元
- 数据:MDT 24 小时跌超 34%,PHA 跌超 16%
- 数据:比特币现货 ETF 上周净流出 8777 万美元,ARKB 净流出 7786 万美元居首
- Metaplanet 自 9 月 30 日以来再未增持比特币,股价自峰值跌超 77%
- 金砖国家推出以黄金为支撑的数字货币Unit
- 特朗普发布国家安全战略,只字未提加密货币和区块链
- 美国商务部长之子执掌的比特币财库公司 Twenty One 转移 43,122 枚 BTC
- RootData:CYBER 将于一周后解锁价值约 295 万美元的代币
- ASTER 宣布加速阶段 4 回购执行,日均回购规模提升至约 400 万美元
- 特朗普帖子中含$BIG,市场质疑其再发 meme 币
- Bitunix 荣获 FinanceFeeds Awards2025Best Emerging Exchange称号
- Securitize CEO:数字资产流动性不足,最成功的代币化资产是美元
- 富达 CEO:华尔街将“被迫”接受区块链技术
比推专栏
更多 >>观点
比推热门文章
- 四年前获得 99.1 万枚 SOL 的巨鲸继续止盈,向币安转入 1357 万美元 SOL
- Upbit 黑客事件发生后曾延迟超 6 小时方上报监管机构
- 分析:美联储降息几乎成定局,市场聚焦投票分歧与鲍威尔措辞
- 数据:过去 1 小时 Binance 净流入 3,007.28 万 USDT
- 冷静开单王不再冷静?空单陷入严重浮亏
- 数据:Circle 过去 7 天在 Solana 链上铸造约 22.5 亿枚 USDC
- XMAQUINA 通过提案即将进行 $DEUS TGE,1.1 亿枚 DEUS 将用于最后一轮预售
- Ripple 的 RLUSD 在以太坊上的供应量达到 11 亿美元市值
- 韩媒:因监管延误,韩国年内允许现货加密货币 ETF 交易的计划已基本落空
- 阿根廷央行考虑允许银行提供加密货币交易服务
比推 APP



