值得信赖的区块链资讯!
了解区块链延迟和吞吐量
原文作者:Lefteris Kokoris-Kogias
大家鲜少提到如何正确地测量一个(区块链)系统,但它却是系统设计和评估过程中最重要的步骤。系统中有许多共识协议、各种性能的变量和对可扩展性的权衡。
然而,直到目前都没有一种所有人都认同的可靠方法,能够让人进行苹果对比苹果这种同一范畴内的合理比较。在本文,我们将概述受到数据中心化系统测量机制启发的一种方法,并探讨在评估一个区块链系统时可以避免的一些常见错误。
关键指标及其相互作用
在开发区块链系统时,我们应该将两个重要指标考量在内:延迟和吞吐量。
用户关心的第一件事就是交易延迟,即发起交易或支付和收到确认交易有效性信息(比如,确认交易发起方有足够的钱)之间的时间。
在传统的 BFT 系统中(如 PBFT、Terdermint、Tusk 和 Narwhal 等),一旦交易被确认就会被敲定,而最长链共识机制(如 Nakamoto Consensus、Solana/Ethereum PoS)中,一笔交易可能会被打包进区块,然后再重组。结果就是,我们需要一直等到交易达到「k 个区块深」了才能进行敲定,这就导致了延迟的时间大大超过了单次确认的时间。
其次,系统的吞吐量一般对于系统设计者来说十分重要。这就是系统每单位时间所处理的总负载,一般表达为每秒交易量 (TPS)。
乍一看,这两个关键指标看起来是完全相反的东西。但因为吞吐量由每秒的交易量得出,而延迟则是以秒为单位进行测量。自然而然地,我们会认为吞吐量 = 负载/延迟。
但事实并非如此。因为许多系统倾向于生成在 y 轴上展示吞吐量或延迟,而在 x 轴上展示节点数量的图表,所以这种计算方式的实现是不可能的。相反,我们能生成一个更好的、包含吞吐量/延迟指标的图表,它以非线性的方式呈现让图表清晰易读。

当没有竞争时,延迟是恒定的,仅是改变系统的负载,就可以改变吞吐量。会发生这种情况,是因为低竞争情况下,发送交易的最小开销是固定的,且队列延迟为 0,致使「无论进来什么,都能直接出去」。
在竞争激烈的情况下,吞吐量是恒定的,但仅是改变负载就可以让延迟发生变化。
这是因为系统已经超负载了,而增加更多负载会造成等待队列无限变长。更反常的是,延迟似乎会随着实验长度而发生变化,这是一个无限增长队列的人为结果。
这些表现都可以在典型的「曲棍球图」或「L 型图」上看到,它取决于到达间隔的分布(下文会谈论到)。因此,这篇文章的关键要点是,我们应该在热区进行测量,这里的吞吐量和延迟都会影响我们的基准;而不用测量边缘区域,这里的吞吐量和延迟只有一个是重要的。

测量方法论
在做实验时,实验者有三种主要的设计选项:
开环 vs. 闭环
现在有两种可以控制对目标发出请求流的主要方法。开环系统基于 n = 个客户端进行建模,这些客户端根据速率 和到达间隔分布(例如 Poisson)向目标发送请求。闭环系统会在任何给定时间内限制未完成请求的数量。开环系统和闭环系统的区别是特定部署的特点,同一个系统可以部署在不同的场景中。
例如,一个键值存储(key-value store)可以在一个开环部署中为数千个应用程序服务器提供服务,或在一个闭环部署中只为几个阻塞客户端提供服务。
对正确的部署场景进行测试是必不可少的,因为比起闭环系统的延迟通常受制于潜在的未完成请求数量,而开环系统可能会产生大量的等待队列,所以,延迟会更长。一般来说,区块链协议可以被任意数量的客户端使用,所以在开环环境下对其做评估会更准确。
综合基准测试的到达间隔分布
在创建合成工作负载时,我们必然会问:如何向系统提交请求?许多系统在测量之前会先预加载事务,但这会使测量产生偏差,因为系统从异常状态 0 开始运行。此外,预加载的请求已经在主存储器中,也因此绕过了其网络堆栈。
更好一些的方法则是以确定的速率发送请求(比如,1000 TPS),这会导致 L 型的图表(橙线)的出现,因为系统的容量得到了最佳使用。

然而,开放系统往往不以可预测的方式运作。相反,它们有处于高负载和低负载的时间段。为了对此进行建模,我们可以采用概率间隔分布,该分布一般是基于泊松分布。它将导致「曲棍球」图表(蓝线),因为即使平均速率低于最佳值,泊松爆发也会导致一些排队延迟(最大容量)。但这对我们十分有利,因为我们可以看到系统如何处理高负载以及负载恢复正常时,系统恢复的速度有多快。
热身阶段
最后要考虑的一点是何时开始测量。我们希望流水线在开始之前充满事务;否则,将需要测量预热延迟。理想情况下,预热延迟的测量应该通过热身阶段中的延迟测量来完成,直到测量结果遵循预期的分布。
如何进行比较
最后一个难题是合理比较系统的各种部署。同样,难点在于延迟和吞吐量是相互依赖的,因此我们可能难以生成公平的吞吐量/节点数图表。
最好的方法是定义服务级别目标 (SLO) 并测量当时的吞吐量,而不是简单地将每个系统推到其最高吞吐量(这种情况下,延迟毫无意义)。在吞吐量/延迟图上绘制一条与延迟轴相交 SLO 处的水平线并对相交点进行采样,这是一种可视化的好方法。

但我设置了 5 秒的 SLO,它只需要 2 秒。
有人可能想要增加这里的负载,以便利用饱和点之后稍高的可用吞吐量。但是这很危险。如果系统操作配置不足,意外的请求爆发将导致系统达到完全饱和,致使延迟激增且很快会违背 SLO。实质上,在饱和点之后运行会导致一种不稳定的平衡。
因此,有两点需要考虑:
1. 过度配置系统。本质上,系统应该在饱和点以下运行,以便吸收到达间隔分布中的爆发,而不会导致排队延迟增加。
2. 如果 SLO 下方有空间,请增加 batch 的大小。这会增加系统关键路径上的负载,而不会增多排队延迟,它为你提供更高的吞吐量以获得你所要的更高延迟权衡。
我正在产生巨大的负载,该如何测量延迟呢?
当系统的负载很高时,尝试访问本地时钟,并为到达系统的每个事务添加时间戳可能会导致结果出现偏差。
相反,还有两个更可行的选择。第一种也是最简单的方法是对事务进行抽样;例如,在某些事务中可能存在一个魔数(magic number),而这些事务是客户端为其保留计时器的事务。在提交时间之后,任何人都可以检查区块链以确定这些事务何时提交,从而计算它们的延迟。这种做法的主要优点是,它不会干扰到达间隔分布。但是,因为必须修改某些事务,所以它可能被认为是「hacky(具有攻击性质的)」。
而更系统的方法则是使用两个负载生成器。第一个是主要的负载生成器,由它来遵循泊松分布。第二个请求生成器则用来测量延迟,并且它的负载会低得多;与系统的其余部分相比,可以将这个请求生成器视为单个客户端。即使系统向每个请求发送回复(就像某些系统所做的那样,例如 一个键值存储),我们也可以轻松地将所有回复放到负载生成器中,并只测量来自请求生成器的延迟。
唯一棘手的部分是,实际的到达间隔分布是两个随机变量的总和;但是,两个泊松分布的总和仍然是泊松分布,所以数学并不难 : )。
总结
测量大规模分布式系统对于识别瓶颈和分析压力下的预期行为是至关重要的。希望通过使用上述方法,我们都可以朝着公用语言迈出第一步,这最终将让区块链系统更适用于他们所做的工作以及他们对终端用户的承诺。
在未来的工作中,我们计划将此方法应用于现有的共识机制中,如果有兴趣,请在 Twitter 上联系!
致谢:所有这些都是我在设计和实施 Narwhal & Tusk(最佳论文奖 @ Eurosys 2022)期间与我的合著者吸取的经验教训,还有之前 Marios Kogias、Joachim Neu、Georgios Konstantopoulos 和 Dan Robinson 对草稿的评论。
比推快讯
更多 >>- 数据:比特币未平仓合约量降至七个月以来最低水平,较 10 月高点下降超 30%
- Vaulta 基金会 CEO 宣布辞职,已启动继任者选举流程
- Auradine 推出高效比特币矿机 Teraflux,能效达 9.8 J/TH
- Greeks.live:部分社区成员认为今年比特币的底部或在 9.6-9.8 万美元
- 美股开盘,道指涨 0.18%,AMD 涨 7.58%
- Coinbase:Coinbase One 会员可在 Launchpad 申请最多 5 倍的代币份额
- Shodai Network 完成 250 万美元种子轮融资,Consensys 等参投
- 嘉楠科技披露比特币持仓增至 1610 枚,以太坊持仓增至 3950 枚
- 美联储威廉姆斯:美联储需要再次扩大资产规模的时间不会太长
- 富兰克林将专有 Benji 技术平台扩展至 Canton 网络
- 美联储威廉姆斯:美联储银行储备金接近理想水平
- Stable 宣布 Anchorage Digital 成为主网上线托管合作方
- DFDV 将发行永续优先股募资 6500 万美元以继续增持 SOL
- 何立峰:中美双方应共同维护好、落实好元首会晤重要共识和成果,推动中美经贸关系稳定发展
- 吉尔吉斯斯坦拟推出规模达 5000 万美元的国家稳定币
- Sui 将推出原生稳定币 USDsui
- 麻吉大哥近 4 小时持续加仓 ETH 和 UNI 多单,现持仓价值超 785 万美元
- 美国众议院拟于美东周三晚 7 点左右对结束政府停摆的法案进行投票
- Coinbase 宣布将离开特拉华州重新在德克萨斯州注册
- 美国财长贝森特:关税红利正在讨论中,尚未做出决定
- 美国财长贝森特:预计民众将在明年 Q1 和 Q2 开始对经济感觉更好
- 佘智江今日被引渡回国,曾涉非法区块链融资项目
- TON Strategy Q3 财报:TON 总持仓量增至 2.178 亿枚
- 美国财长贝森特:未来几天将有重大关税消息
- J.P. 摩根将 Coinbase、MARA 和 RIOT 股票评级为超配,表现或将优于大盘
- 大摩发布特斯拉股价分析:四重因素为特斯拉估值和技术领导地位长期催化剂
- 财新:6 万枚比特币洗钱案主犯钱志敏预计将于 2030 年 2 月下旬获释
- 前高盛合伙人 Liz Martin 加入 Coinbase 产品副总裁
- Seismic 完成 1000 万美元融资,a16z crypto 领投
- Empery Digital 发布 Q3 财报,回购价值约 8000 万美元普通股,回购计划规模增至 1.5 亿美元
- Cookie DAO:已完成 Antix.in 活动前 500 名 Snappers 快照
- Plasma 将在 48 小时内将 XPL 托管至加密银行 Anchorage
- Bubblemaps:APR 代币空投的 60%由同一实体通过 14,000 个地址领取
- 美国银行:机构投资者正逢低买入美股,对冲基金和散户则选择抛售
- 路透调查:105 位经济学家中有 84 位认为美联储将在 12 月降息 25 个基点
- 数据:上市公司今年 Q3 增持 19.5 万枚比特币,价值 205 亿美元
- 美股释放“不祥之兆”:标普 500 中创新低股票数量持续增加
- 某币安实盘聪明钱 7 天获利 211.6 万美元,大多为空单
- Leap Therapeutics 获 5888 万美元投资并买入约 20.37 万枚 ZEC
- Kraken 联合 CEO 批评英国加密监管过严,英美或将加强数字资产合作
- Bitwise CIO:合规 ICO 或将成为下一轮加密牛市核心驱动力
- Kyuzo's Friends 团队完成 1,100 万美元融资,Key Origin 平台首个正版 IP 授权游戏全面加速
- Coinbase CEO:代币销售平台会对违规行为实施惩罚
- 分析师:MegaETH 仍未有效去除女巫地址,SHIFT Protocol 联创或是漏网之鱼
- BNB 财库公司 Nano Labs 宣布提前偿还可转换债券,以加强风险管理
- 日本首个日元稳定币发行商 JPYC 或将成为政府债券市场新力量
- 高盛预测:标普 500 指数未来 10 年年回报率将达 6.5%
- 公布 Q3 财报后,美股 Circle 盘前由涨转跌
- Circle:探索在 Arc 网络发行原生代币
- Circle Q3 财报:营收 7.40 亿美元、净利 2.14 亿美元同比翻倍
比推专栏
更多 >>观点
比推热门文章
- Greeks.live:部分社区成员认为今年比特币的底部或在 9.6-9.8 万美元
- 美股开盘,道指涨 0.18%,AMD 涨 7.58%
- 美股开盘加密板块涨跌不一,BitMine 上涨 3.54%
- Coinbase:Coinbase One 会员可在 Launchpad 申请最多 5 倍的代币份额
- Shodai Network 完成 250 万美元种子轮融资,Consensys 等参投
- 嘉楠科技披露比特币持仓增至 1610 枚,以太坊持仓增至 3950 枚
- 美联储威廉姆斯:美联储需要再次扩大资产规模的时间不会太长
- 预测市场普及面临哪些核心障碍
- 富兰克林将专有 Benji 技术平台扩展至 Canton 网络
- 美联储威廉姆斯:美联储银行储备金接近理想水平
比推 APP



