UMA 的AI实验:AI代理能否增强乐观预言机?

  • uma_xyz
  • 发布于 2025-06-04 19:50
  • 阅读 24

UMA推出了Optimistic Truth Bot,这是一个实验性的AI代理系统,旨在为UMA的Optimistic Oracle中的实时问题提供答案。该系统通过AI代理提出建议,以提高效率并保留人工监督,目前在预测市场中已达到90%以上的准确率。该实验旨在探索AI如何与人类协作,以实现更快、更公平和更具前瞻性的链上真相验证。

UMA 的 AI 实验:AI 代理能否增强乐观预言机?

要点:

  • UMA 推出了乐观真相机器人 —— 一个实验性的代理系统,用于在 UMA 的乐观预言机中提出实时问题的答案。

  • AI 代理提议者有潜力在保留人工监督的同时提高效率,并且已经在真实的预测市场上实现了 90% 以上的准确率。

在一个虚假信息比事实传播更快的时代,验证什么是真实的,尤其是在链上,比以往任何时候都更加重要。这就是 UMA 存在的意义。

作为区块链预言机,UMA 始终是独一无二的。虽然像 Chainlink 这样的其他预言机提供简单的价格信息以插入智能合约,但 UMA 专注于复杂真实世界数据

UMA 的乐观预言机 (OO) 通过允许任何人提出问题的答案,并给其他人提出异议的机会,从而将细微的信息带到链上。如果没有人提出异议,则该答案被接受为真,这使得系统具有乐观性。

OO 是唯一可以大规模处理自然语言问题的预言机,例如“罗马尼亚法院是否宣布选举无效?”或“6 月之前是否存在中越贸易协议?”。它不依赖于 API。它依赖于人:一个去中心化的投票者网络,他们审查提议验证细微的主张。

UMA 的乐观预言机旨在以去中心化、无需信任的方式验证数据提议和争议。

该系统显着地支持了像 Polymarket 这样的预测市场,但也适用于 DAO 治理IP 争议智能合约审计跨链桥接 和许多其他用例。如果没有 UMA,他们将无法以去中心化具有成本效益的方式大规模验证这些主张

自推出以来,UMA 的 OO 已经处理并解决了近 60,000 项断言,确保了近 400 亿美元 的交易量,包括加密领域一些风险最高的预测市场。

但是,如果我们可以充分利用 UMA 以人为本的预言机的优势,并使其更快、更便宜、更具可扩展性,会怎么样?

揭秘 UMA 的 AI 提议者实验:乐观真相机器人

今天,我们将揭晓一个经过数月开发的 AI 实验,即 乐观真相机器人

乐观真相机器人是一个复杂的 AI 系统,它监控处理推荐预测市场应该如何解决,主要是在 Polymarket 上。从本质上讲,它充当 UMA 乐观预言机中的人类,专门履行提议者角色,其中包括提出数据请求的答案。

虽然我们仍在试验中,但乐观真相机器人尚未在链上提出这些提议。目前,它与人工提议者并行运行,并在 X 上实时发布其建议。但是,随着其准确性的提高,目标是在未来将其直接插入到预言机中。

这项实验并不是我们第一次尝试将 AI 集成到 UMA 的预言机系统中。在过去的两年中,随着新的 AI 功能的出现,我们大约每六个月就会使用 LLM 进行实验。每次实验都有相同的目标:探索代理系统在 UMA 的预言机操作中能够可靠地工作。每次迭代我们都看到了渐进式的进步,但直到现在,结果都没有足够的说服力。

这是我们第一次对 LLM 系统参与预测市场预言机的质量和可靠性感到真正兴奋。

在整个堆栈中,提议者会回答通过 OO 提出的所有问题。他们的答案然后由另一组人公开验证,或者在 <2% 的时间内,提出异议并提交投票。它们是系统的支柱,负责理解任何给定的预测市场,并建议应如何解决。

乐观真相机器人如何工作

路由器、解算器和监督者:一个三层系统

LLM 会出现幻觉,将事实与虚构混淆。为此,乐观真相机器人利用模块化代理系统来降低错误率。这类似于 专家混合 技术,其中整个 AI 系统由专门的子模块(专家)组成,以处理请求处理管道的不同部分。特别是,乐观真相机器人在其代理系统中包含三个主要级别:

  • 路由器:接收处理预测市场请求的请求,并决定将其路由到何处。路由器具有所有可能的解算器、它们的优势和局限性的上下文。这些知识使路由器能够为给定的市场选择最佳的解算器。

  • 解算器:解算器的任务是找到预测市场的解决方案。解算器架构设计为可扩展和模块化的,随着 AI 技术的不断改进,将来可以添加额外的解算器。解算器设计为专门的,运行受约束和特定的方法来解决市场。目前,主要有两种解算器。

    • 困惑度解算器:通过搜索网络并从多个来源综合信息来处理通用和开放式问题。

    • 代码运行器解算器:编写自定义代码来查询 API 以解决预测市场。对于像体育或加密货币价格这样的市场,最好直接访问来源(例如,查询币安),而不是尝试在互联网上搜索结果。

  • 监督者:充当质量控制层,通过检查已知的幻觉模式、检查与市场定价的一致性以及标记边缘情况来验证解算器的答案。如果监督者对解算器的结果不满意,它可以重新启动整个流程,并重新提示路由器,并提供有关出错的更多信息。例如,监督者可能对解算器的回复质量不满意,例如 Perplexity 对市场结果做出预测和推断,而不是以事实为基础。然后,监督者将提示路由器告诉 Perplexity 解算器更加以事实为导向。此外,监督者可以告诉路由器考虑使用多解算器方法,以证实不同技术之间的结果。

要查看它的实际效果,请在 X 上关注 @OOTruthBot,乐观真相机器人会在每次提案上发布实时建议。每条推文还链接到一个仪表板,你可以在其中查看提示详细信息和日志,以深入了解其解决过程。

有关技术上的深入了解,你可以在 GitHub 上探索完整的开源架构和代码。

我们为什么要构建它

那么,为什么要构建 AI 提议者,尤其是在 UMA 一直以人为驱动的情况下?

这很简单。

UMA 独特的优势在于其无需许可去中心化的人工投票者网络,他们审查评估投票复杂的主观真理。在这些情况下,提案存在争议(有人说它不是真的),并且正确的答案需要人工判断背景理解才能解决。

但是,提出提案的前一步,即有人提出数据声明,通常很简单,可以通过 AI 提高效率。AI 可以通过以下方式改进预言机:

  • 减少人为错误

  • 降低成本

  • 避免过早的提案

  • 提高提议者的吞吐量

  • 让人工投票者专注于更难的提案

乐观真相机器人使用严格的保护措施逻辑来分析具有可验证结果的过去事件。它还会检查时间敏感性,确保它不会过早地提出答案,这是当前 80% 争议的原因(了解更多关于早期提案“P4”的信息)。

这项实验推进了我们对 下一代 OO 的愿景,这是一个更高效和先进的乐观预言机版本。从本质上讲,乐观真相机器人可以引导我们走向未来,在这个未来中,AI 提出建议人类做出决定,使 UMA 成为唯一具有 AI 效率人工监督 的预言机。

这不仅仅是一个理论概念;乐观真相机器人已经在分析真实世界的事件。在过去的几个月中,我们一直在跟踪其在与人工投票者相比的实时预测市场中的表现。初步结果令人鼓舞,产生了可以塑造 UMA 如何在链上验证和记录真相的未来的见解。

到目前为止的结果

性能基准

早期结果令人兴奋且有意义。乐观真相机器人迄今已处理超过 3000 个市场,并且我们在此期间学到了很多关于如何改进系统的信息。乐观真相机器人目前的实时准确率在所有市场类型中约为 ~78%

将其放在上下文中,UMA OO 中的人工投票者有着卓越的记录:98.2% 的断言在没有争议的情况下被接受。当发生争议时,超过 80% 的争议是关于时间(P4 –“提案太早”),而不是关于提案准确性的分歧。这意味着只有 0.4% 的所有提案面临对其准确性的真正挑战,并且在需要 DVM 投票的预测市场请求中,UMA 投票者始终**收敛于真相**。

现在,虽然实验结果尚未达到人工基准,但特别有希望的是,当我们查看解析为“否”(P1) 或“是”(P2) 的市场时,忽略 50:50 的分割(P3)或“太早”(P4) 的解析,机器人的准确率跃升至 95%。这表明乐观真相机器人正在接近 UMA 上的人工为明确、可决定的结果设定的高准确率标准。

该机器人的设计目的是避免做出它认为完全站不住脚的陈述:我们希望避免误报。这种严谨性解释了总体准确率和忽略 P4 结果的准确率之间的巨大差异。

我们正在跟踪不同类别的表现,从加密货币和体育到政治和娱乐,很明显,某些类型的市场比其他类型的市场更容易被代理系统解决。

像体育、资产价格和简单的实际问题这样的市场证明了机器人最容易做对的事情。这很有道理:具有明确答案的简单问题更容易验证,并且代码运行器解算器几乎每次都可以通过简单地调用 API 来实现接近完美的结果。迄今为止,该机器人在体育和资产定价市场上的准确率达到了 99.3%。

更开放式的预测市场问题仍然具有挑战性。例如,复杂的政治地缘主题很难始终如一地验证,尤其是在市场措辞中存在细微差别或对地面上实际发生的事情存在模糊不清的情况下。Polymarket 承载了各种各样的这些市场,对于 LLM 驱动的系统来说,难度各不相同。

以“特朗普在 5 月 30 日的匹兹堡集会上会说多少次‘钢铁厂’这个词?”这样的市场为例;这些市场本质上对于 LLM 来说很难解决。在这种情况下,Perplexity 解算器必须首先找到有关集会的信息并找到相关的直播。然后,它需要提取记录并计算该词被说了多少次。这个过程可能具有挑战性,因为找到正确的流可能很困难,而且记录的质量通常很差。迄今为止,如果我们忽略 P4(解析为“太早”的市场),该机器人在“提及市场”中的正确率达到了 72%。

简单市场和复杂市场之间的差异突显了为什么我们在这里选择了多解算器架构:随着创建更好的技术并且 LLM 技术不断改进,可以将额外的解算器添加到组合中。路由器和监督者逻辑将加强并改进,并且随着时间的推移,整个代理系统的准确率将呈上升趋势。

公开构建下一代 OO

该实验代表了我们致力于公开构建,并与我们的社区透明地分享成功和挑战。乐观真相机器人目前的总体准确率为 78%,我们邀请你加入我们,共同推动进步并尝试实现人工准确率。

将此视为对 AI 如何补充而不是与人类竞争的探索,帮助我们了解 AI 代理在链上真相验证中的优势、局限性和新兴作用。

我们将继续分享有关我们的发现、成功和经验教训的定期更新,并在进展过程中与社区互动。

链上真相的未来

这项实验位于两个强大趋势的交汇处:AI 的崛起和在虚假信息时代可验证真相日益增长的重要性。如果 AI 将在世界验证什么是真实的方面发挥作用,那么该系统需要人工监督透明度问责制。UMA 正在构建的正是这一点,并且我们正在公开地这样做。

此外,UMA 没有构建一个新的未经证实的 AI 平台来利用一个流行的叙述;我们正在将 AI 插入到具有已证实结果的现有技术中。乐观预言机具有实际需求、参与的实际经济激励措施,并且具有去中心化的人工监督,因此预言机对参与者的错误具有鲁棒性。这是 AI 参与真相制造 和帮助 扩展预言机 的绝佳机会。

UMA 不仅仅是基础设施。它是一种建立在乐观主义之上的协议;真相可以扩展,人类和机器可以协作,信息的未来不必是混乱的。乐观预言机是我们 验证真相 的方式。乐观真相机器人是我们使该过程 更快更公平面向未来 的方式。

  • 原文链接: blog.uma.xyz/articles/ex...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
uma_xyz
uma_xyz
江湖只有他的大名,没有他的介绍。