值得信赖的区块链资讯!
Paradigm:如何使用链上数据进行策略研究?
链上数据的来源、结构以及提取和处理工具。
原文标题:《Using On-Chain Data for Policy Research: Part 1》
原文作者:Brendan Malone,Paradigm
原文编译:Kxp,BlockBeats
I. 引言
Crypto 政策在制定时很少会用到真实且细化的数据,原因主要有以下三点:
1. 新兴技术领域的相关政策大多还停留在理论及定性分析层面,早期阶段很少会使用到数据。
2. 尽管链上数据全部开放透明,但要想访问这些数据人们需要在短期内完成大量工作(即直接从区块链提取原始数据),即便对于 Crypto 原生从业者来说也是如此。
3. 区块链「取证」公司和数据供应商有少量的数据产品,但它们都不具备灵活性/可定制性,也不能满足经济/金融研究人员的需求。
许多现代经济学和金融学研究人员错过了将工具应用于 Crypto 数据分析的机会。从设计上讲,Crypto 可以向任何人提供细化数据,但大部分政策在制定时仍依赖于 CoinMarketCap 等外部预聚合时间序列数据源,而不是直接从数据源获取数据,这又是什么原因导致的呢?
正如政策制定者可以查询美国每家主要银行的资产负债表,并逐秒观察消费者存款的变化一样,他们也可以毫不费力地查看整个 Ethereum 生态系统的 Stablecoin 发行情况,但大多数分析 Stablecoin 的政策文件却采取了一种探讨假设事件的分析方法。
我将在本篇中具体阐释以下几点内容,希望可以对想要使用链上数据的政策研究人员有所帮助:
· 链上数据的获取方法
· 链上数据所采用的结构
· 提取和使用链上数据的几个基本工具
在随后的文章中,我将探讨如何使用这里收集的数据来判断 Crypto 市场的走势。同时,我将在结尾发布可供免费使用的数据和代码。通过阐明如何在区块链中查询数据,我希望向大家展示 Crypto 的开放性可以为数据决策开辟的新方法。
如果您就职于一家监管机构或研究机构,并在获取 Crypto 数据时遇到了困难,欢迎与我们取得联系分享你的想法,了解 Paradigm 可以为您提供哪些帮助。
II. 链上数据获取方法
一般来讲,数据收集工作应集中在一个区块链(Ethereum)及特定项目的子集上,这些项目主要是以美元计价、法币支持的 Stablecoin,具体包括 USDC、Tether、Binance USD、Pax Dollar 和 Gemini Dollar。该方法广泛适用于链上数据,即便你想创建一个不同的数据集。
Etherscan 这类区块浏览器非常适用于查看交易快照以及收集特定智能合约的信息,但根据我的经验,它们却不太能用于生成大型数据集。在收集和处理原始数据时,你基本上有两个选择:(1)在本地运行一个完整的节点,或(2)查询已经从链上直接写入原始数据的数据库。第一种方法对于专业技能和计算资源的要求比较高,而第二种方法则只需要基本的 SQL 和 Python 技能就可以实现,所以这里我们将采用第二种方法。
Dune 和谷歌云平台(GCP)的 BigQuery 有最新的链上数据,这些数据都以表格的形式存储在数据库中,研究人员可使用 SQL 命令对其进行查询。Dune 还提供免费的数据库,不过其速度较慢,而且还有些局限性,但它非常适合于 A/B 测试的数据查询,也有助于你熟悉数据库的运行模式,尤其是对于那些不善于使用 SQL 查询关联数据库的人。BigQuery 虽然更加灵活快捷,但谷歌会对计算资源收费,所以其价格也相对昂贵。我在第一次处理数据时,为了节省费用,我会先在 Dune 中测试查询语句,然后再将其输入 GCP 中运行。在大多数情况下,这种方法都能起到很好的效果(还有一点值得注意的是,Dune 的 Crypto 表格数量至少是 GCP 的 100 倍,包括一些用户生成、预先清理过的高质量 Crypto 表格。相比之下,GCP 中的数据大多是原始区块或交易。Dune 也有一些非常方便的内置数据可视化工具,值得单独购买。)
III. 链上数据结构
要回答这个问题,你首先需要搞清楚自己处理数据的目的。对于这个测试案例,我决定为主要的法定支持 Stablecoin 建立一个大型的时间序列数据集,并观察一些特定的行为: 铸币(即发行 Stablecoin),烧毁 (即停止流通 Stablecoin) 和转移。我之所以选择以这种方式进行研究,是因为政策制定者和学者目前最为关注法定支持的 Stablecoin,所以这些数据在短期内可能相当有用。
以美元计价的几大 Stablecoin 都采用了 ERC-20Token 标准。顾名思义,ERC-20 是一种在 Ethereum 上使用智能合约创建 Token 的标准化方式。如果你把区块链理解为一个巨大的去中心化 Excel 表格,那么智能合约就类似于 Excel 函数。在函数中输入参数之后,它将使用其内置逻辑产生一个特定的输出结果(例如,MAX 函数就是用来输出所输入参数中的最大值)。
我们可以使用智能合约的 Ethereum 地址来对它们进行定位,这些地址是区块链数据结构中的唯一标识符:
· USDC
与 API 类似,智能合约也是可以重复使用的程序。每次智能合约获得互动指令时,都会产生该互动的记录,并由 Ethereum 协议以日志的形式记录在区块链上,而这些日志则构成了智能合约活动的可靠信息来源。
当智能合同执行一个特定函数时,例如烧毁 ERC-20 Stablecoin 以将其从流通中移除,该函数及其参数将作为交易日志记录在区块链上。
在下面的交易中,USDC Stablecoin 的发行商 Circle 烧毁了价值 1056.92 美元的 USDC。

如果你切换到「日志」标签,你就可以查看交易事件日志,相应的字段为
· 地址:智能合约的合约地址。USDC Stablecoin 的合约地址是0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48。
· 名称:智能合约执行的函数,以及该函数中的参数。在这里,智能合约正在调用烧毁函数,该函数接收的参数指定了所烧毁币的发送地点(例如燃烧池,必须是 Ethereum 地址)和烧毁币的数量(其金额必须是小于 256 位的无符号整数)。
Etherscan 的输出结果还会显示主题和数据字段,这些字段包含了我们在分析交易时需要解析的大部分相关信息。
· Topic0 是函数签名的哈希值。从本质上讲,它会将函数及其参数经由单向算法得到一个唯一的函数哈希值。Ethereum 使用的是 Keccak-256 哈希函数,当你通过 Keccak-256 算法输入函数签名时,它总是会产生相同的哈希值,所以任何时候该哈希值出现在日志中,你都能确信是调用了同一个函数。
· Topic1 是烧毁函数的一个索引参数。在这里,Topic1 是烧毁的 Token 被发往的地址。(注意:如果烧毁函数有更多的参数,这些参数将作为额外的主题出现)
· 这里的数据字段表示所烧毁 Token 的数量。
既然我们已经了解了链上数据的基本结构,就可以开始从 Dune 和 GCP 中提取数据了。
IV. 提取并处理链上数据的基本工具
如前所述,在这个例子中,我选择从现有数据库中提取链上数据,而不是访问 Ethereum 网络上的活动节点。为了便于理解,我使用 SQL 从 GCP 提取了大量原始数据表格,然后在 Python 中使用 pandas 库对其进行清理。
当我们从 GCP 提取表格时,我们将使用 BigQuery,它储存有很多 Ethereum 的数据表,如下图左边一栏所示。当你点击一个表格时,相应的数据库模式就会出现,就如下图中的 ethereum.logs 表。与此同时,其中涉及的地址、数据和主题都会记录到日志数据中去。

下图中的查询语句将用于提取日志表中涉及与 USDC、Tether USD、Binance USD、Pax Dollar 或 Gemini Dollar 合约互动的所有记录。除了 ethereum.logs 中的信息外,一些额外的信息也很有用,所以我还合并了 ethereum.block 表中的数据,其中涵盖了 Gas 费等信息。

得到的表格可以直接由 Python 读取,并借助 pandas 数据框架细分为以下字段:
· log_index
· transaction_hash
· transaction_index
· address
· data
· topics
· block_timestamp
· block_number
· block_hash
· number
· miner
· size
· gas_limit
· gas_used
· base_fee_per_gas
这些字段中的大多数都可以直接使用,不过第三节中讨论的主题字段需要用 Python 进行一些额外的清理,以便将其分成多列。
V. 结语
这篇文章使用的是 Ethereum 的日志数据,同样的方法也可以用来访问链上的各种数据。Python 和 SQL 是大多数经济学家和政策制定者所熟悉的工具,它们可以发挥很大作用。与传统金融相比,Crypto 更具透明度。这样一来,研究人员就可以利用实时数据来阐明金融体系的运作方式,并及时控制住可能出现的风险。
在下一篇文章中,我将着重分析法币支持 Stablecoin 的铸造与烧毁,并提前准备好相应的数据集。在第三篇文章中,我将以图表的形式向大家展示精细化链上数据可用来研究的问题。
比推快讯
更多 >>- 古尔斯比:服务业通胀“并非温和”
- 伊朗外交部长:已就主要原则与美国达成共识
- Strategy 当前浮亏 57.56 亿美元,BitMine 浮亏 79.43 亿美元
- 比特币矿企 Hive 营收同比增长 219%,但因加速折旧而净亏损 9100 万美元
- 美元兑加元短线走高 10 余点,现报 1.3664
- 某鲸鱼再充值 50 万 USDC,2 倍杠杆做多 WLFI
- Ripple CEO:CLARITY 法案在 4 月底前通过的概率达 80%
- BitMine 上周增持 45,759 枚 ETH,总持仓增至 437.15 万枚
- 链上黄金最大空头链上股民黄金空单扭亏为盈,月盈利达 1540 万美元
- BTC 财库公司 DDC 增持 80 枚比特币,总持仓量突破 2000 枚
- 美国共和党在中期选举中赢得参议院的概率降至 60%的新低
- 某新建地址从 Binance 提取 2500 万枚 WLFI
- Kevin O’Leary:量子威胁被解决之前,机构会将比特币持有比例限制在 3% 以内
- 纳斯达克 100 指数期货延续跌势,下跌 1.1%
- 加密 VC Dragonfly 完成第四期基金募集,规模达 6.5 亿美元
- Strategy 增持 2486 枚比特币,总持有量达 717,131 枚
- 意大利银行巨头披露持有约 9600 万美元比特币现货 ETF,并建立 Strategy 看跌期权对冲
- 观点:MVRV Z-Score 尚未进入历史低位绿色区间,或暗示未到抄底时机
- 美伊第二轮谈判结束,伊朗提出新方案
- 萨尔瓦多 BTC 持仓量增至 7,565.37 枚
- 贝莱德向 Coinbase 转入 1,700 枚比特币和 22,661 枚以太坊
- 贝莱德向 Coinbase 存入 1701 枚 BTC 和 2.26 万枚 ETH
- 麻吉大哥 Hyperliquid 持仓价值跌破 100 万美元,动用 5 年前投资资金补仓,总亏损达 2800 万美元
- 数据:BTC 未平仓合约持仓量较历史高点下降 55%,创 2023 年 4 月以来最大跌幅
- TON Foundation 与 Banxa 合作,为亚洲企业提供稳定币支付服务
- 数据:Polygon 每日 USDC 交易量创历史新高,突破 1200 万笔
- 以太坊链上 RWA 总价值突破 170 亿美元,相比去年增长 315%
- 美国银行:市场情绪依然极度乐观,AI 泡沫成为投资者最关注的尾部风险
- 观点:币安稳定币净流入连续三个月为负,储备金减少约 90 亿美元,资金持续流出交易所生态
- CryptoQuant.:币安持有 475 亿美元稳定币,占交易所总流动性 65%
- BVNK 获马耳他 MiCA 许可证,将扩展稳定币服务至欧洲
- 分析师:加密新基金数量触及 5 年低点,2023 至 2025 年募资总额仅与 2022 年全年接近
- Arkham:JELLYJELLY 未平仓合约量激增,或存在团体试图操纵币价
- TRM Labs:尽管遭主流交易平台下架,门罗币网络活跃度不降反升
- 数据:EtherFi 单用户收入达 256 美元,远超 Revolut、Wise、SoFi 等支付平台
- 数据:以太坊链上 RWA 资产总市值突破 150 亿美元
- 数据:若 ETH 突破 2,064 美元,主流 CEX 累计空单清算强度将达 7.08 亿美元
- 分析师:比特币每日净买入量仍大于开采量,但科技股下跌或将导致比特币持续承压
- 德国央行行长:欧元稳定币将为欧洲提供更多独立性,以摆脱美元稳定币的影响
- Polygon 昨天日交易费用收入超越以太坊
- 快餐连锁店 Steak'n Shake:支持比特币支付已推动销售额显著增长
- 粉丝仅 1300 名的巨鲸 0x58bro 通过做空 ETH 及 ENA 等资产浮盈 700 万美元
- Crypto.com 首席法务官:将与 DraftKings 等平台联合开发预测市场 OG.com
- 某鲸鱼地址今日将 129 枚 BTC 兑换为 4412 枚 ETH
- 美股盘前部分科技股走软,AMD 跌 1.3%
- 分析师:预计熊市将于 2027 年中结束,至少持续至 2026 年年底
- Polymarket 上“天价皮卡丘卡牌拍卖价”押注事件落幕,最终成交价超 1600 万美元
- 英镑稳定币发行商 Agant:英国加密立法最早或将于 2027 年生效
- 美元小幅上涨,市场降息预期或过度
- Dragonfly 合伙人:发币时机对项目长期表现无显著影响,“干就完了”
比推专栏
更多 >>- Happy new year【Horse success】|0213Asian
- Was it finished?|0206 Asian
- 围猎以太坊多头:「巨鲸」们暴亏 70 亿美元,正被集体围观
- Challenge,risk And chances|0130 Asian
- Meta 豪赌 AI:砸钱 1350 亿美元,2026 的扎克伯格,值得相信么?
- Variables: Terrible snowstorm|0128 Asian
- 英特尔「生死线」时刻:在 ICU 门前,陈立武如何清算遗产并开启自救?
- 從1月13號到今天,提前到5100|0126Asian
- You Should work HARDER in 2026|0120 Asian
- 硅谷最聪明那群人的「终极推演」:2026,我们应该「All-In」什么?
观点
比推热门文章
- 某鲸鱼再充值 50 万 USDC,2 倍杠杆做多 WLFI
- Ripple CEO:CLARITY 法案在 4 月底前通过的概率达 80%
- BitMine 上周增持 45,759 枚 ETH,总持仓增至 437.15 万枚
- 链上黄金最大空头链上股民黄金空单扭亏为盈,月盈利达 1540 万美元
- BTC 财库公司 DDC 增持 80 枚比特币,总持仓量突破 2000 枚
- 美国共和党在中期选举中赢得参议院的概率降至 60%的新低
- 某新建地址从 Binance 提取 2500 万枚 WLFI
- Kevin O’Leary:量子威胁被解决之前,机构会将比特币持有比例限制在 3% 以内
- 纳斯达克 100 指数期货延续跌势,下跌 1.1%
- 加密 VC Dragonfly 完成第四期基金募集,规模达 6.5 亿美元
比推 APP



