玻璃屋中的幽灵——为什么DeFi市场永不遗忘

thogiti
发布于 2026-01-05 19:30
阅读 1083

本文深入探讨了去中心化金融（DeFi）市场中订单流的“记忆”现象，即市场交易方向的持续性。通过分析链上数据，文章解释了如何区分潜在需求与由 MEV（矿工可提取价值）驱动的反应性交易，如三明治攻击和清算。文章还讨论了长记忆效应对执行者、流动性提供者和协议设计的影响，强调了理解市场记忆对于构建更高效的DeFi协议的重要性。

![玻璃屋中的幽灵 - 为什么 DeFi 市场永不遗忘](https://img.learnblockchain.cn/2026/01/06/defi-markets-memory-ghost-in-the-machine.jpeg)

理解价格变化的原因是市场中最古老的问题。“供需关系”是标准答案，但它很少告诉你**如何**将不平衡转化为价格。在实践中，该机制存在于交易记录中：打印了什么，以什么顺序打印，以及具有什么持久性。

这种框架与 APS 观点**解码供需动态** [1] 相一致，它使用一个简单的经验对象，即买方与卖方发起的交易的 $+1/-1$ 符号记录，来定义 order flow 中的“记忆”。

DeFi 应该使这种分析更容易。数据是原生的和公开的：每次交换都有时间戳，每个区块都有编号，每条路径都可追溯。但这种透明性具有欺骗性。DeFi 的交易记录是意图和反应的混合体。清算、夹击、后运行、路由伪影和排序权力都在上面留下痕迹，如果你只读取符号序列，这些痕迹看起来就像“需求”。

本文使用 Yuki Sato 和 Kiyoshi Kanazawa 的两篇定量论文 [2, 3]，构建了一个用于分离这些信号的框架。他们对 Lillo-Mike-Farmer (LMF) 模型 [4] 进行了定量测试：市场范围内的订单符号中的长记忆，metaorder 长度的重尾分布，以及将两者联系起来的 sharp exponent 关系。

我们不在此声称新的物理学。相反，我们提供仪器的校准：严格定义的框架，可证伪的定量桥梁，以及区分潜在需求与 MEV 层的 mechanical 的学科。

---

## 01 - 交易记录、符号和记忆

要理解市场记忆，我们必须首先定义我们的主要工具：**交易记录**。

在传统金融中，这指的是实时打印交易的纸质股票代码机。在 DeFi 中，交易记录是区块内每次执行交易的按时间顺序排列的、不可变的记录。然而，原始交易数据对于分析来说太嘈杂了。我们需要将其提炼成一个代表压力的信号。

我们特别关注 Aggressive Trades，即跨越价差以消耗流动性的市价订单，而不是提供流动性的被动限价订单。我们将此数据流编码为二进制“符号序列”，表示为 $\varepsilon_t$：

* (+1) 如果交易是由买方发起的（激进买入）。
* (-1) 如果交易是由卖方发起的（激进卖出）。

这个序列 $\varepsilon_t$ 是我们的原子分析单元。

如果市场没有记忆，就像一系列独立的抛Coin一样，知道时间 $t$ 的交易符号不会告诉你任何关于时间 $t + \tau$ 的符号的信息。但数据表明并非如此。Sato 和 Kanazawa 分析了东京证券交易所九年的数据，发现交易方向的“回声”持续数小时、数天甚至数周 [2]。

我们使用**自相关函数**来衡量这种持久性：
$$
C(\tau) = \langle \varepsilon_t , \varepsilon_{t+\tau} \rangle
$$

在一个随机市场中，这个值会立即降至零。在真实市场中，它会缓慢衰减，遵循幂律：
$$
C(\tau) \propto \tau^{-\gamma}, \qquad 0 < \gamma < 1
$$

这种“缓慢衰减”是**长记忆**的数学定义 [1]。这意味着没有一个单一的时间尺度可以让市场“忘记”。相关性逐渐消失，将时间上的大量交易联系起来。

问题：长记忆是否意味着价格是可预测的？

答案：并非自动如此。这衡量的是**压力**，而不是**回报**。市场可以显示出持续的压力 ($\varepsilon_t$)，同时保持回报难以预测，因为价格通过冲击、库存风险和套利对该压力做出反应。

曲线不是原因。如果交易记录记得，那么是什么产生了这种持久性。

---

## 02 - 为什么在没有可预测性的情况下存在记忆

持久性是合理的，因为大型参与者很少一次性执行。如果你需要购买大量头寸，在一个交易中跨越价差（或 AMM 曲线）是昂贵且明显的。你需要将决策分解为随时间执行的较小交易。

当许多参与者这样做时，市场会看到 runs：买入后跟着买入。这发生不是因为“情绪正在上升”，而是因为一个大的决定正在被分块揭示。

问题：如果这种压力是可预测的，为什么每个人都不能抢先交易？

答案：因为市场随着压力的到来而做出反应。流动性调整，价格变动，竞争将可预测性转化为成本。压力仍然是可预测的，但利润通过冲击和逆向选择而被竞争掉。

这需要对“记忆”提供的内容进行仔细措辞：它是关于流程生成器的结构线索，而不是交易信号。

---

## 03 - 分裂机制：Metaorders 和重尾

想象一下走在沙滩上。你的脚印创造了一条清晰的道路。这些脚印没有随着潮水消失，而是保持可见数天。你的新步骤受到那些旧脚印的微妙影响，从而产生超出你当前位置的模式。

**"Metaorder"** 是隐藏的决定：“购买 $Q$ 个单位。” 市场观察到执行情况：许多较小的子订单，通常共享相同的符号 [1]。

分裂将一个大的决定变成一系列相同符号的 prints。定量图取决于异质性。Metaorders 并非都具有相似的长度。有些很短；有些很长。标准模型假设 metaorder 长度 ($L$) 的重尾分布：
$$
P(L) \propto L^{-(\alpha+1)}, \qquad \alpha > 1
$$

为了重现符号记录中的长记忆，LMF 模型预测 metaorder 大小分布必须具有幂律尾，其指数与符号记忆指数相关：
$$
\alpha = \gamma + 1
$$
[2]。

问题：为什么这种关系很有价值？

答案：它是可证伪的。你可以从公共符号记录中估计 $\gamma$，从类似分裂的参与者的运行长度中估计 $\alpha$，并检查 $\alpha$ 是否接近 $\gamma+1$ [2]。

这座桥梁是我们框架的支柱。DeFi 的工作是打破它。

---

## 04 - 桥梁：你可以在 DeFi 中测试的内容

桥梁有两个指数和一个学科：
1.  从订单符号记录中估计 $\gamma$。
2.  从 metaorder 长度代理（类似分裂动作的相同符号活动的运行）中估计 $\alpha$。
3.  检查 $\alpha \approx \gamma+1$ 是否在同一状态、同一记录上成立。

Sato 和 Kanazawa 明确定义“metaorder 长度”为每个分裂交易者的连续相等符号的长度，应用间隙规则以避免跨越长时间中断进行缝合 [2]。

DeFi 翻译是可能的，但有条件：
* “交易者 ID”变为地址（或地址群集）。
* “市价订单”变为交换 / 激进成交。
* “Runs”可能因路由、批处理和身份分裂而碎片化。

问题：如果一个地址产生长时间的买入，那是否是一个 metaorder？

答案：也许是。它可能是一个真正的执行程序。它可能是一个路由器。它可能是一个对其他人做出反应的机器人。运行长度是一个统计数据；“metaorder”是一种解释。

DeFi 需要一个 TradFi 论文经常忽略的额外对象：一种将类似意图的 flow 从类似反应的 flow 中分离出来的方法。

Sato 和 Kanazawa 使用东京证券交易所的“虚拟服务器 ID”来跟踪个人帐户，从而证明了这一点。他们发现，虽然分裂交易者仅占用户的约 25%，但他们占了**80% 的市价订单** [2]。

---

## 05 - 前置因子 $c_0$：警告

一旦你接受 $C(\tau) \approx c_0 \tau^{-\gamma}$，你可能会问振幅 $c_0$ 的含义。

LMF 风格的理论将 $c_0$ 与微观结构联系起来。Sato 和 Kanazawa 讨论了一种估算器，该估算器从 $c_0$ 和 $\gamma$ 中退出“分裂交易者的有效数量” [2]。

在 DeFi 中，将该计算视为警告信号。

即使分裂强度在不同交易者之间有所不同，指数关系仍然保持稳健，但前置因子对异质性很敏感 [3]。在实践中，“LMF 人数统计”的行为更像是下限而不是人口普查，因为异质性系统地移动了前置因子 [3]。

在 DeFi 中，异质性和身份碎片化是默认设置。$c_0$ 告诉我们 концентрации，但它没有告诉我们到底存在多少分裂者。

Sato 和 Kanazawa 使用前置因子 $c_0$ 推导出了分裂交易者数量 ($N_{ST}$) 的估算器。假设同质分裂强度：
$$
N_{ST} \approx \left[ (\gamma + 1) c_0 \right]^{\frac{1}{1-\gamma}}
$$
[2]。

我们可以在链上验证这一点。我们可以计算参与分裂行为的唯一钱包地址，并检查记忆的物理特性是否与链的现实相符。

---

## 06 - 潜在需求与反应层

市场生活在潜在供需的状态中，其变化通过交易缓慢显现 [1]。

前半部分在链上仍然成立。后半部分受到污染。在 DeFi 中，用户交易揭示了意图并触发了反应：
* 三明治使用额外的打印符来括住交易。
* 后运行套利在价格变动后“修复”价格。
* 清算会强制单边压力，看起来像一个 metaorder。
* 排序器排序会扭曲时间轴，而不会添加明显的新交易。

这些机制在符号记录中产生持久性，而无需投资者执行大型决策。DeFi 桥梁测试版本需要分解。

---

## 07 - MEV 层：当交易记录对其自身做出反应时

三种主题以不同的方式将结构写入交易记录。

**三明治。** 受害者交换由搜索者在交易前和交易后进行。这创造了紧密的局部结构：额外的打印符，其符号以机械方式与受害者的符号相关联。

**后运行/套利。** 价格变动会产生修复交易。这会产生短期逆相关（买入后卖出），但它会聚集在产生大幅价格变动的相同事件周围。除非你进行分段，否则混合物看起来具有欺骗性。

**清算。** 这些会产生与分裂无关的运行。一个变动会触发清算；清算会进一步推动；更多帐户触发。级联看起来像持续的单边压力。

问题：应该排除清算窗口吗？

答案：应该对其进行标记。如果你的长记忆信号主要存在于清算状态中，那么故事就不再是“潜在需求泄漏出来”。它变成了“风险引擎反馈循环产生持久性”。

即使你拟合的 $\gamma$ 看起来稳定，MEV 也很重要。干净的幂律拟合可能来自多种机制的混合。

---

## 08 - 纯粹的抢先交易和排序权力

抢先交易通常被描述为“一个机器人比我先交易”。在 DeFi 中，排序权力更深。中继器、构建器、排序器或场所可以通过重新排序、延迟、选择性包含或内部化流程来提取价值。

问题：为什么纯粹的抢先交易可能不会在 $\gamma$ 中清楚地显示出来？

答案：$\gamma$ 衡量的是符号序列的持久性，而不是福利、执行质量或谁赢得了比赛。排序权力可能会恶化支付的价格，而不会过多地改变长期的符号自相关。

排序权力以三种方式扭曲推断：
* 它会扭曲“时间”（你的事件顺序是记录的顺序，这可能是对抗性的）。
* 它会碎片化运行（损害你的 $\alpha$ 代理）。
* 它会改变可观察性（你的交易记录变成“打印的内容”，而不是“发生的事情”）。

不要假装你可以重建真相。运行敏感性检查：备用时钟、块内排序代理和可见性审核。

---

## 09 - 为什么这在 DeFi 中很重要

如果 order flow 具有长记忆，那么市场就不会受到独立脉冲的冲击。它是由程序和反射循环推动的。

对于执行者来说，持久性意味着在你开始交易之后的环境与在你开始交易之前不同。无论持续性来自你剩余的子订单还是来自反应层，可见性都有成本。

对于 LP 来说，持久性流量会放大逆向选择。费用可以补偿，但当持续性由旨在可重复的提取层主导时，障碍会上升。

这解释了为什么 DeFi 市场经常超调并缓慢恢复。大多数无常损失计算器都假定随机的、不相关的交易。但是由于 metaorders 的长程相关性，损失变得依赖于路径。来自同一鲸鱼的一系列小额销售比等规模的随机交易产生更多的损失。

对于协议设计，目标不是“使 $\gamma$ 变小”。目标是减少来自合成反射循环的持久性部分。批处理、受保护的路由和排序规则会改变持久性的存在位置：在真正的执行约束内部，或在提取反应循环内部。

---

## 10 - 观察技巧

科学是令人恐惧的斗争，目的是看到实际存在的东西。

在传统金融中，像佐藤和金泽这样的研究人员必须是法医侦探，重建“虚拟服务器 ID”来猜测谁在交易。在 DeFi 中，我们淹没在数据中。我们拥有每个地址、每个 nonce 和每个毫秒时间戳。

这种透明性是一个陷阱。如果你只是下载 Uniswap 交易的 CSV 并运行自相关脚本，你会发现“记忆”。但你可能会衡量错误的事情。

**显微镜下的准备工作**

将数据集视为生物标本。在放大它之前，你必须准备好载玻片。
1.  **干净的交易记录：** 按其在区块链中的精确位置对每个交换进行排序：`block_number` $\rightarrow$ `tx_index` $\rightarrow$ `log_index`（对于多交换交易至关重要）。
2.  **约定一致性：** 保持严格的基础/报价约定（例如，始终为 ETH/USDC）。这似乎微不足道，直到你花费数小时调试为什么你的相关分析在数据集中途颠倒了符号。

**三个交易记录**

将信号与噪声分离。我建议为相同的数据创建三个不同的视图：
1.  **完整的交易记录：** 链上显示的每个交易。
2.  **反应交易记录：** 可靠地识别为 MEV 驱动的交易（三明治、后运行、清算级联）。
3.  **意图交易记录：** 剩下的所有内容。

这种差异通常令人震惊。我曾经分析过一个稳定币池在波动高峰期间的行为，完整的交易记录显示出极端的持久性，但意图交易记录显示出大部分随机流量。 “记忆”的出现几乎完全是由 MEV 机器人相互反应产生的。如果不分离交易记录，你就会对幽灵建模。

---

## 11 - 第一性原理

[理查德·费曼曾说过](https://www.youtube.com/watch?v=k7_mVS9mKII)，*“第一性原理是你不能欺骗自己，而你最容易欺骗自己。”*

在 DeFi 分析中，欺骗自己很容易。

最诱人的陷阱是**前置因子陷阱**。 Lillo-Mike-Farmer 模型的数学给出了一个公式，用于根据相关幅度估计活跃鲸鱼的数量。很想插入数据，求解 $N$，并声称你知道操纵池的鲸鱼数量。

但那个前置因子不是人口普查计数器。它是衡量集中的晴雨表。在加密货币的 EOA、智能合约和多重签名钱包的碎片化格局中，异质性是规则。你计算出的数字是灵敏度工具，而不是人数统计 [3]。

我们还必须尊重**时钟**。在物理学中，时间平稳流动。在以太坊中，时间以 12 秒的心跳跳动（Solana 400 毫秒，比特币 10 分钟）。如果你使用“事件时间”（交易 #1、交易 #2、交易 #3）测量记忆，你将依赖于决定该顺序的区块构建器。始终对照“区块时间”进行交叉检查，即每个区块的净买入或卖出压力。当这两个时钟讲述截然不同的故事时，你正在查看区块构建伪影，而不是市场动态。

---

## 结论：鲸鱼背后的人

让我以一些个人的事情结束。

在我职业生涯的早期，我看到一位高级交易员执行了看似奇怪的行为。三天来，他每隔 15 分钟就会精确地发出相同的小额买单。当我问他为什么时，他笑了。

“年轻人，”他说，“市场有记忆。我的工作不是与那种记忆作斗争，而是与它共舞。”

这种智慧一直伴随着我。 Lillo-Mike-Farmer 模型不仅仅是关于数学，它尊重市场背后的人类现实。

佐藤和金泽在东京使用“虚拟服务器 ID”来证明了这一点，这是阴影的阴影。在 DeFi 中，我们使用货币的源代码。区块链提供了一个“玻璃屋”，我们可以在其中实时验证流动性的物理特性。

但是我们在屏幕上看到的持久性，那个随着时间推移缓慢衰减的 $\gamma$ 指数，是人类约束的数字足迹。它是一个 DAO 财务主管试图在不崩溃价格的情况下进行多元化；是一位创始人清算股权来购买房屋；是一位基金经理在三个不眠之夜进入一个头寸。

市场会记住，因为人们必须及时采取行动。

当我们构建下一代 AMM、永续合约和借贷协议时，我们不应试图抹去这种记忆。我们应该构建理解它的协议。我们需要与鲸鱼一起呼吸的流动性，以及与人性合作的基础设施，而不是与之作对。

足迹就在那里。我们只是最终学会了如何阅读它们。

---

**参考资料**

[1] F. Lillo, *[解码供需动态](https://physics.aps.org/articles/v16/192)*, APS Physics 16, 192 (2023).

[2] Y. Sato and K. Kanazawa, *[从市场订单流中的长记忆中推断微观金融信息](https://dx.doi.org/10.1103/PhysRevLett.131.197401)*, Phys. Rev. Lett. 131, 197401 (2023).

[3] Y. Sato and K. Kanazawa, *[定量统计分析订单拆分行为...](https://dx.doi.org/10.1103/PhysRevResearch.5.043131)*, Phys. Rev. Research 5, 043131 (2023).

[4] F. Lillo 等人, [供需中长期记忆理论](https://dx.doi.org/10.1103/PhysRevE.71.066122), Phys. Rev. E 71, 066122 (2005).

>- 原文链接： [github.com/thogiti/thogi...](https://github.com/thogiti/thogiti.github.io/blob/master/_posts/2026-01-04-defi-markets-memory-the-ghost-in-the-glass-house.md)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

理解价格变化的原因是市场中最古老的问题。“供需关系”是标准答案，但它很少告诉你如何将不平衡转化为价格。在实践中，该机制存在于交易记录中：打印了什么，以什么顺序打印，以及具有什么持久性。

这种框架与 APS 观点解码供需动态 [1] 相一致，它使用一个简单的经验对象，即买方与卖方发起的交易的 $+1/-1$ 符号记录，来定义 order flow 中的“记忆”。

我们不在此声称新的物理学。相反，我们提供仪器的校准：严格定义的框架，可证伪的定量桥梁，以及区分潜在需求与 MEV 层的 mechanical 的学科。

01 - 交易记录、符号和记忆

要理解市场记忆，我们必须首先定义我们的主要工具：交易记录。

(+1) 如果交易是由买方发起的（激进买入）。
(-1) 如果交易是由卖方发起的（激进卖出）。

这个序列 $\varepsilon_t$ 是我们的原子分析单元。

我们使用自相关函数来衡量这种持久性： $$ C(\tau) = \langle \varepsilont , \varepsilon{t+\tau} \rangle $$

在一个随机市场中，这个值会立即降至零。在真实市场中，它会缓慢衰减，遵循幂律： $$ C(\tau) \propto \tau^{-\gamma}, \qquad 0 < \gamma < 1 $$

这种“缓慢衰减”是长记忆的数学定义 [1]。这意味着没有一个单一的时间尺度可以让市场“忘记”。相关性逐渐消失，将时间上的大量交易联系起来。

问题：长记忆是否意味着价格是可预测的？

答案：并非自动如此。这衡量的是压力，而不是回报。市场可以显示出持续的压力 ($\varepsilon_t$)，同时保持回报难以预测，因为价格通过冲击、库存风险和套利对该压力做出反应。

曲线不是原因。如果交易记录记得，那么是什么产生了这种持久性。

02 - 为什么在没有可预测性的情况下存在记忆

当许多参与者这样做时，市场会看到 runs：买入后跟着买入。这发生不是因为“情绪正在上升”，而是因为一个大的决定正在被分块揭示。

问题：如果这种压力是可预测的，为什么每个人都不能抢先交易？

这需要对“记忆”提供的内容进行仔细措辞：它是关于流程生成器的结构线索，而不是交易信号。

03 - 分裂机制：Metaorders 和重尾

"Metaorder" 是隐藏的决定：“购买 $Q$ 个单位。” 市场观察到执行情况：许多较小的子订单，通常共享相同的符号 [1]。

分裂将一个大的决定变成一系列相同符号的 prints。定量图取决于异质性。Metaorders 并非都具有相似的长度。有些很短；有些很长。标准模型假设 metaorder 长度 ($L$) 的重尾分布： $$ P(L) \propto L^{-(\alpha+1)}, \qquad \alpha > 1 $$

为了重现符号记录中的长记忆，LMF 模型预测 metaorder 大小分布必须具有幂律尾，其指数与符号记忆指数相关： $$ \alpha = \gamma + 1 $$ [2]。

问题：为什么这种关系很有价值？

答案：它是可证伪的。你可以从公共符号记录中估计 $\gamma$，从类似分裂的参与者的运行长度中估计 $\alpha$，并检查 $\alpha$ 是否接近 $\gamma+1$ [2]。

这座桥梁是我们框架的支柱。DeFi 的工作是打破它。

04 - 桥梁：你可以在 DeFi 中测试的内容

桥梁有两个指数和一个学科：

从订单符号记录中估计 $\gamma$。
从 metaorder 长度代理（类似分裂动作的相同符号活动的运行）中估计 $\alpha$。
检查 $\alpha \approx \gamma+1$ 是否在同一状态、同一记录上成立。

Sato 和 Kanazawa 明确定义“metaorder 长度”为每个分裂交易者的连续相等符号的长度，应用间隙规则以避免跨越长时间中断进行缝合 [2]。

DeFi 翻译是可能的，但有条件：

“交易者 ID”变为地址（或地址群集）。
“市价订单”变为交换 / 激进成交。
“Runs”可能因路由、批处理和身份分裂而碎片化。

问题：如果一个地址产生长时间的买入，那是否是一个 metaorder？

DeFi 需要一个 TradFi 论文经常忽略的额外对象：一种将类似意图的 flow 从类似反应的 flow 中分离出来的方法。

Sato 和 Kanazawa 使用东京证券交易所的“虚拟服务器 ID”来跟踪个人帐户，从而证明了这一点。他们发现，虽然分裂交易者仅占用户的约 25%，但他们占了80% 的市价订单 [2]。

05 - 前置因子 $c_0$：警告

一旦你接受 $C(\tau) \approx c_0 \tau^{-\gamma}$，你可能会问振幅 $c_0$ 的含义。

LMF 风格的理论将 $c_0$ 与微观结构联系起来。Sato 和 Kanazawa 讨论了一种估算器，该估算器从 $c_0$ 和 $\gamma$ 中退出“分裂交易者的有效数量” [2]。

在 DeFi 中，将该计算视为警告信号。

在 DeFi 中，异质性和身份碎片化是默认设置。$c_0$ 告诉我们 концентрации，但它没有告诉我们到底存在多少分裂者。

Sato 和 Kanazawa 使用前置因子 $c0$ 推导出了分裂交易者数量 ($N{ST}$) 的估算器。假设同质分裂强度： $$ N_{ST} \approx \left[ (\gamma + 1) c_0 \right]^{\frac{1}{1-\gamma}} $$ [2]。

我们可以在链上验证这一点。我们可以计算参与分裂行为的唯一钱包地址，并检查记忆的物理特性是否与链的现实相符。

06 - 潜在需求与反应层

市场生活在潜在供需的状态中，其变化通过交易缓慢显现 [1]。

前半部分在链上仍然成立。后半部分受到污染。在 DeFi 中，用户交易揭示了意图并触发了反应：

三明治使用额外的打印符来括住交易。
后运行套利在价格变动后“修复”价格。
清算会强制单边压力，看起来像一个 metaorder。
排序器排序会扭曲时间轴，而不会添加明显的新交易。

这些机制在符号记录中产生持久性，而无需投资者执行大型决策。DeFi 桥梁测试版本需要分解。

07 - MEV 层：当交易记录对其自身做出反应时

三种主题以不同的方式将结构写入交易记录。

三明治。 受害者交换由搜索者在交易前和交易后进行。这创造了紧密的局部结构：额外的打印符，其符号以机械方式与受害者的符号相关联。

后运行/套利。 价格变动会产生修复交易。这会产生短期逆相关（买入后卖出），但它会聚集在产生大幅价格变动的相同事件周围。除非你进行分段，否则混合物看起来具有欺骗性。

清算。 这些会产生与分裂无关的运行。一个变动会触发清算；清算会进一步推动；更多帐户触发。级联看起来像持续的单边压力。

问题：应该排除清算窗口吗？

即使你拟合的 $\gamma$ 看起来稳定，MEV 也很重要。干净的幂律拟合可能来自多种机制的混合。

08 - 纯粹的抢先交易和排序权力

问题：为什么纯粹的抢先交易可能不会在 $\gamma$ 中清楚地显示出来？

排序权力以三种方式扭曲推断：

它会扭曲“时间”（你的事件顺序是记录的顺序，这可能是对抗性的）。
它会碎片化运行（损害你的 $\alpha$ 代理）。
它会改变可观察性（你的交易记录变成“打印的内容”，而不是“发生的事情”）。

不要假装你可以重建真相。运行敏感性检查：备用时钟、块内排序代理和可见性审核。

09 - 为什么这在 DeFi 中很重要

如果 order flow 具有长记忆，那么市场就不会受到独立脉冲的冲击。它是由程序和反射循环推动的。

对于 LP 来说，持久性流量会放大逆向选择。费用可以补偿，但当持续性由旨在可重复的提取层主导时，障碍会上升。

10 - 观察技巧

科学是令人恐惧的斗争，目的是看到实际存在的东西。

这种透明性是一个陷阱。如果你只是下载 Uniswap 交易的 CSV 并运行自相关脚本，你会发现“记忆”。但你可能会衡量错误的事情。

显微镜下的准备工作

将数据集视为生物标本。在放大它之前，你必须准备好载玻片。

干净的交易记录： 按其在区块链中的精确位置对每个交换进行排序：block_number $\rightarrow$ tx_index $\rightarrow$ log_index（对于多交换交易至关重要）。
约定一致性： 保持严格的基础/报价约定（例如，始终为 ETH/USDC）。这似乎微不足道，直到你花费数小时调试为什么你的相关分析在数据集中途颠倒了符号。

三个交易记录

将信号与噪声分离。我建议为相同的数据创建三个不同的视图：

完整的交易记录： 链上显示的每个交易。
反应交易记录： 可靠地识别为 MEV 驱动的交易（三明治、后运行、清算级联）。
意图交易记录： 剩下的所有内容。

11 - 第一性原理

理查德·费曼曾说过，“第一性原理是你不能欺骗自己，而你最容易欺骗自己。”

在 DeFi 分析中，欺骗自己很容易。

最诱人的陷阱是前置因子陷阱。 Lillo-Mike-Farmer 模型的数学给出了一个公式，用于根据相关幅度估计活跃鲸鱼的数量。很想插入数据，求解 $N$，并声称你知道操纵池的鲸鱼数量。

我们还必须尊重时钟。在物理学中，时间平稳流动。在以太坊中，时间以 12 秒的心跳跳动（Solana 400 毫秒，比特币 10 分钟）。如果你使用“事件时间”（交易 #1、交易 #2、交易 #3）测量记忆，你将依赖于决定该顺序的区块构建器。始终对照“区块时间”进行交叉检查，即每个区块的净买入或卖出压力。当这两个时钟讲述截然不同的故事时，你正在查看区块构建伪影，而不是市场动态。

结论：鲸鱼背后的人

让我以一些个人的事情结束。

“年轻人，”他说，“市场有记忆。我的工作不是与那种记忆作斗争，而是与它共舞。”

这种智慧一直伴随着我。 Lillo-Mike-Farmer 模型不仅仅是关于数学，它尊重市场背后的人类现实。

市场会记住，因为人们必须及时采取行动。

足迹就在那里。我们只是最终学会了如何阅读它们。

参考资料

[1] F. Lillo, 解码供需动态, APS Physics 16, 192 (2023).

[2] Y. Sato and K. Kanazawa, 从市场订单流中的长记忆中推断微观金融信息, Phys. Rev. Lett. 131, 197401 (2023).

[3] Y. Sato and K. Kanazawa, 定量统计分析订单拆分行为..., Phys. Rev. Research 5, 043131 (2023).

[4] F. Lillo 等人, 供需中长期记忆理论, Phys. Rev. E 71, 066122 (2005).

原文链接： github.com/thogiti/thogi...

登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

本文参与登链社区写作激励计划，好文好收益，欢迎正在阅读的你也加入。