本文分析了预测市场中交易与赌博的本质区别,通过五个诊断测试来区分赌博行为和交易策略。研究表明,预测市场优于传统民意调查,因为市场聚集了由资本配置加权的信息。文章还探讨了三种不同的交易模式,并强调了结构性套利机会,以及构建高效执行系统的必要性。

为什么预测市场不是赌博?(数学原理)
让我们直奔主题。
数学系列的第 1 部分和第 2 部分的浏览量达到了数百万。信息很明确。人们理解这里存在根本的区别。大多数人只是还不知道那是什么。本文将解决这个问题。这不是数学系列的第 3 部分。第 3 部分正在进行紧张的研发,将涵盖扩展到七位数的执行基础设施。在我们开始之前,你需要理解你实际在执行什么。
收藏此文 - 我是 Roan,一名后端开发人员,致力于系统设计、HFT 风格的执行和量化交易系统。我的工作重点是预测市场在负载下的实际行为。对于任何建议、有意义的合作,伙伴关系,欢迎私信。
你现在要实施的框架
在开始之前,这里有一个五点诊断方法,可以告诉你你是在赌博还是在交易。在你的 20 个仓位上运行这个诊断:
测试 1:在结果出来之前退出 对于每笔交易,问:我是否在事件解决之前平仓? 如果是,少于 50%: 你在赌博结果 如果是,大于 80%: 你在交易概率漂移
测试 2:中位数持有时间 计算所有交易中,从进入到退出的中位数时间。 如果大于 24 小时: 你在等待结果(赌博) 如果小于 6 小时: 你在捕获信息流(交易)
测试 3:仓位大小一致性 你的仓位大小与优势的大小相关吗? 如果你每次都下注相同的金额:赌博 如果大小随计算出的优势而变化:交易
测试 4:订单类型分布 你的订单中,限价单和市价单的百分比是多少? 如果限价单小于 30%: 你受到了不利选择 如果限价单大于 90%: 你在避免知情交易流
测试 5:利润来源 利润来自哪里? 如果来自对结果的正确判断:赌博(不可扩展) 如果来自结构性错误定价:交易(可扩展)
立即在你的交易历史记录上运行这五个测试。结果会告诉你,你是在构建一个系统还是在玩游戏。
我会等你。说真的,如果你在进一步阅读之前没有运行这些测试,你就错过了重点。
完成了?很好。现在让我们来谈谈为什么这些指标很重要,以及研究实际上表明了什么。
研究揭示了什么:
在 1988 年至 2004 年期间,研究人员在美国总统选举期间,将预测市场与传统民意调查同时进行。他们分析了五个选举周期的 964 项民意调查,并比较了准确性。
市场击败民意调查的概率为 74%。
但重要的是:在选举前 100 多天做出的预测,准确性差距显着扩大。在远离事件发生的时候,市场明显优于专家民意调查。
为什么?市场不聚合意见。它们聚合了按资本配置加权的信息。
拥有真实信息的人下大赌注。猜测的人下小赌注或退出。随着时间的推移,资本通过纯粹的选择压力集中在知情者手中。成功的交易者会积累。失败的交易者退出。
价格反映了一贯正确的交易者的信念,并根据他们控制的资本量进行加权。这不是共识。这是达尔文式的信息过滤。
民意调查会询问每个人的意见并对结果进行平均。市场迫使每个人将资本置于风险之中,并让选择压力从噪声中过滤出真相。
这就是根本的区别。
同时进行的三种游戏
我分析了 Polymarket 和其他主要预测市场上的数千名交易者。出现了三种不同的模式。
模式 1:结果投注 交易者简介:持有仓位 3 到 7 天。使用市价单。根据信念确定仓位大小(“我非常确定”)。在结果出来时退出。
盈利能力:扣除费用后为负数或盈亏平衡。
原因:每笔交易都会受到不利选择。当你市价买入时,拥有更好信息的人很乐意卖出。你是退出流动性。
模式 2:信息交易 交易者简介:持有仓位 6 到 18 小时。围绕新闻流进行交易。当信息被计入价格时退出。根据信息优势确定大小。
盈利能力:积极但不一致。取决于信息获取。
原因:信息优势是暂时的且具有竞争力。一旦你的优势消失,你的利润也消失了。
模式 3:结构性剥削 交易者简介:持有仓位 2 到 6 小时。专门使用限价单。用凯利判据确定大小。交易套利和错误定价。
盈利能力:始终为正。表现最佳者在一年内赚了 201 万美元。
原因:结构性优势是可再生的。套利之所以存在,是因为市场选择了速度而不是完美的准确性。优势不断再生。
以下是将这三者区分开来的原因: 模式 1 和 2 取决于正确。模式 3 取决于数学正确。
你无法控制你的预测是否正确。你可以控制你的执行是否捕获了结构性低效率。
顶级交易员在一年内执行了 4,049 笔交易。每笔交易的平均利润:496 美元。胜率:>90%。他们没有预测结果。他们求解整数程序的速度比竞争对手更快。
让我解释一下这意味着什么。
现在正在发生的套利
Polymarket 使用中央限价订单簿。当买价与卖价相遇时,订单匹配。很简单。
但以下是创造机会的原因:CLOB 不会实时强制执行数学关系。
示例: YES 的交易价格为 0.62 美元 NO 的交易价格为 0.33 美元 总和:0.95 美元
从数学上讲,YES + NO 必须等于 1.00 美元,因为只有一个结果为 TRUE。但是在 CLOB 中,价格可能会暂时违反这一点。
为什么?因为强制执行约束需要对每笔交易运行优化算法。这需要时间。Polymarket 选择执行速度而不是数学上的完美。
结果:以 0.62 美元购买 YES,以 0.33 美元购买 NO。总成本:0.95 美元。保证支付:1.00 美元。每套完整的保证利润:0.05 美元。
分析 2024 年 Polymarket 数据的研究发现,41% 的多结果市场在其生命周期的某个时刻显示出这种错误定价。中位数错误定价:每美元 0.08 美元。
这些机会持续了几分钟到几小时。快速的交易者抓住了他们。缓慢的交易者提供了流通性。
但从量化角度来看,这很有趣:这并不是消失的低效率。它是结构性的。这是 Polymarket 为拥有快速市场而付出的代价。
他们可以通过使用 LMSR(对数市场评分规则)来消除套利。通过凸成本函数,LMSR 在数学上保证了无套利定价,该函数强制所有结果概率之和为 1。
但是 LMSR 需要在每笔交易中都解决优化问题。执行延迟从 50 毫秒增加到 30 秒或更长时间。
用户离开。流动性消失了。平台失败。
因此,套利仍然存在。通过设计。
对你而言,这意味着:这种优势是可再生的。这不是 alpha 衰减。只要平台优先考虑速度,它就是存在的结构性摩擦。
问题变成了:你的执行速度是否足够快以捕获它?
延迟堆栈(为什么 30 毫秒很重要)-
当特朗普在摇摆州民意调查中领先的消息传出时,会发生什么?
在 Twitter 上看到新闻(延迟 30 秒) 打开 Polymarket(5 秒) 查看当前价格(3 秒) 决定购买(10 秒) 点击购买,确认交易(8 秒) 交易提交到区块链(2 秒)
总计:从新闻到执行 58 秒。
新闻 API webhook 触发(500 毫秒) NLP 模型提取信号(200 毫秒) 交易模型更新概率(100 毫秒) 以编程方式生成订单(50 毫秒) 通过 WebSocket 提交到 CLOB(20 毫秒) 在链上确认(2 秒)
总计:从新闻到执行 2.87 秒。
20 倍的速度差异不是为了更快。而是为了捕获整个移动与什么都不捕获之间的区别。
当零售看到价格时,专业人士已经执行、捕获了优势并将资本转移到了下一个机会。
这不是传统意义上的高频交易。你不需要微秒优化。但是你确实需要比人类的反应时间更快。
58 秒和 2.87 秒之间的区别是盈利能力和捐赠之间的区别。
仓位大小方程-
大多数交易者随意确定仓位大小。 “我将为此进行 100 美元。” 或者基于信心。 “我真的很确定,所以我将做 500 美元。”
这两种方法都不是最优的。
数学上正确的方法是凯利判据。对于预测市场,公式简化为:
最佳仓位大小 =(优势 × 获胜概率)/ 赔率
在实践中: 你估计真实概率:70% 市场价格:60% 你的优势:10 个百分点
代入凯利: 优势 = 0.10 获胜概率 = 0.70 赔率 = (1 - 0.60) / 0.60 = 0.67
最佳比例 = (0.10 × 0.70) / 0.67 ≈ 0.10 或 10% 的资本
如果你下注 2%,你将 80% 的预期价值留在桌面上。如果你下注 30%,你将在正常方差下冒着破产的风险。
对专业投注者的研究表明,凯利的大小调整产生了最高的长期复合增长率。这不是偏好。在对数效用下,这是数学上最优的。
但这是大多数人错过的:凯利假定你的优势估计是准确的。如果你系统地高估优势,凯利将系统地超额投注,你将破产。
出于这个原因,专业交易者使用部分凯利。当优势估计存在错误时,半凯利(最佳金额的 0.5 倍)或四分之一凯利(0.25 倍)会降低破产风险。
关键的见解:仓位大小是优势大小和优势不确定性的函数。不是信念。不是你感觉有多确定。
数学决定大小。不是情绪。
不利选择测试-
当你下市价单时,有人会采取另一面。他们为什么愿意与你交易?
要么: A) 他们拥有更好的信息,并且知道你是错的 B) 他们出于流动性原因退出仓位 C) 他们正在运行做市算法
大多数时候,这是 A。
这会造成不利选择。快速成交表明你在知情交易流的错误一方。
以下是如何衡量它。对于每笔交易,计算:
成交质量 =(执行价格 - 订单时的中点)/ 点差
如果你正在购买: 正的成交质量 = 你支付的价格低于中点(好) 负的成交质量 = 你支付的价格高于中点(不利选择)
如果你正在出售: 正的成交质量 = 你收到的价格高于中点(好) 负的成交质量 = 你收到的价格低于中点(不利选择)
对 CLOB 市场的研究表明: 市价单:平均成交质量 = -0.72(糟糕) 在 <1 分钟内成交的限价单:成交质量 = -0.31(不利选择) 在 >10 分钟内成交的限价单:成交质量 = +0.43(好)
模式很明显:快速成交是不好的成交。如果你的订单立即执行,你可能犯了一个错误。
专业交易者几乎完全使用限价单。如果限价单在几秒钟内成交,他们知道发生了变化,他们会立即重新评估仓位。
零售交易者为了方便而使用市价单。他们不断被知情交易者和做市商挑走。
简单的规则:如果你不能等待 30 秒的成交,你不应该进行交易。
概率期限结构-
预测市场具有类似于期权的时间结构。随着结果接近,波动性会降低。
结果前 100 天:价格会因小道消息而波动 5% 到 10% 结果前 30 天:价格会因类似消息而波动 2% 到 4% 结果前 7 天:价格会波动 0.5% 到 1% 结果前 1 天:除非出现重大意外,否则价格几乎不会变动
这种结构是可以利用的。
远离结果(30 天以上): 使用动量策略。信息有方向性地累积。价格趋势。
接近结果(7 天以下): 使用均值回归策略。大多数信息都是已知的。价格对噪音反应过度并进行修正。
对选举预测市场的研究表明了完全相同的模式。动量策略在 30 天以上的时间里是有利可图的。均值回归策略在 7 天以下的时间里是有利可图的。
含义:你的策略必须适应时间范围。在 T 减 60 天时有效的方法在 T 减 2 天时会失败。
专业交易者会根据日历上与结果的接近程度来切换策略。零售交易者在所有时间范围内都使用相同的方法,并想知道为什么结果不一致。
一笔交易的故事
让我带你了解一下专业的结构性交易者如何看待一笔特定的交易。这是我与一位为量化基金管理资金的交易员朋友进行的真实对话。
设置: 市场:“特朗普会赢得宾夕法尼亚州吗?” 当前价格:0.52 美元 相关市场:“共和党会以 5 分以上的优势赢得宾夕法尼亚州吗?” 相关市场价格:0.28 美元
交易者的思考过程:
“如果共和党以 5 分以上的优势赢得宾夕法尼亚州,特朗普肯定会赢得宾夕法尼亚州。这些事件不是独立的。市场对它们的定价就好像它们是独立的一样。”
“让我们检查一下数学。如果两者都解析为 TRUE,我应该能够构建一个成本低于 1.00 美元但保证支付 1.00 美元的投资组合。”
“以 0.48 美元的价格购买“特朗普赢得宾夕法尼亚州”的 NO。以 0.28 美元的价格购买“共和党以 5+ 的优势获胜”的 YES。总费用:0.76 美元。”
“如果共和党以 5+ 的优势获胜:特朗普获胜(NO 支付 0 美元,YES 支付 1 美元,总计 1.00 美元)。如果共和党没有以 5+ 的优势获胜:要么特朗普仍然获胜,要么他不获胜,但共和党 YES 支付 0 美元。”
“等等,这行不通。让我重新计算一下组合。”
“实际上,套利的方向相反。如果特朗普以 0.52 美元的价格获胜,但共和党以 5+ 的优势获胜仅为 0.28 美元,则定价错误。如果特朗普以很大的优势获胜,那么共和党以 5+ 的优势获胜的概率应该接近该概率。”
“优势是:以 0.28 美元的价格购买共和党以 5+ 的优势获胜。相对于特朗普的获胜概率而言,其结构性定价过低。”
这就是专业人士的思考方式。不是“谁会赢?”而是“这些价格在数学上是否一致?”
他们正在解决约束满足问题。他们正在检查市场价格是否违反逻辑依赖关系。
当他们发现违规行为时,他们会在错误定价得到纠正之前执行。
这笔交易花了 90 秒的时间来分析。该仓位持有了 4 个小时。当相关市场重新平衡时,获得了优势。总利润:部署 2,000 美元,利润 347 美元。
如果你每周能找到其中一次,那么年化回报率为 450%。
这不是赌博。这是应用数学。理解这一点。
我定期与自营交易公司和对冲基金的量化人员交谈。以下是他们关于预测市场的全部说法:
“优势显而易见。基础设施是瓶颈。”
每个认真的公司都知道预测市场是可以利用的。他们知道套利的存在。他们知道结构性低效率。
是什么阻止了他们?构建执行层。
WebSocket 提要。以编程方式提交订单。用于依赖性检测的整数规划求解器。风险管理系统。延迟优化。
数学是公开的。研究是公开的。机会是可见的。
但是,将其转换为在规模上可靠执行的生产系统?那是大多数人失败的地方。
如果你既了解数学又了解基础设施,那么你就是真正可以提取这种优势的 1% 的人中的佼佼者。
现在改变了什么-
如果你为了娱乐而交易预测市场,那么本文中的任何内容都不重要。继续做你正在做的事情。
如果你正在从事量化交易的职业或想从事量化交易的职业,那么一切都会改变。
运行我在开始时给你的五个诊断测试。如果你失败了三个或更多个,那么你就是在赌博。在存入另一美元之前修复它。
开始跟踪: 中位数持有时间(目标:低于 6 小时) 成交质量(目标:平均为正) 仓位大小与优势的相关性(目标:R² > 0.7) 限价单百分比(目标:>90%)
构建基础设施: 设置与 Polymarket CLOB API 的 WebSocket 连接 编写以编程方式提交订单 在你的执行逻辑中实施凯利仓位大小调整 在数据库中跟踪所有指标以进行分析
停止交易观点。开始交易结构。
机会是真实的。研究证明了这一点。问题在于你是否会构建捕获它的系统,还是继续单击按钮并抱有希望。
顺便说一句,如果你已经做到了这一点,请返回到顶部的五个诊断测试。运行它们。认真地。仅该部分就比大多数价值 500 美元的预测市场交易课程更有价值。
数学有效。机会存在。唯一的问题是执行。数学系列第 3 部分即将推出...
- 原文链接: x.com/RohOnChain/status/...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!