一个可操作的信任模型

  • spengrah
  • 发布于 5小时前
  • 阅读 15

文章提出了一个可工程化的信任模型,将信任定义为基于资源价值的风险预测。信任由内部特质(Pistis)和外部环境约束(Hardness)共同构成,为区块链、AI 协作及复杂组织治理中的信任量化与设计提供了理论基础。

我们所有的社会基础设施都运行在某种形式的信任之上。协作、合作、组织和治理都依赖于人们和系统彼此的行为。今天,这些系统正面临压力。AI 正在将非人类的 Agent 引入各级协作,现有世界秩序的制度基础正在我们脚下发生位移。为了构建能够经受未来考验的协作基础设施,我们需要一门新的信任工程学科。

然而,信任本身仍然缺乏明确的定义。“Trustless”、“trusted”、“信任假设”、“trust-minimized”——这些术语在协作论述中被不断提及。它们被随意使用,且往往各自代表不同的含义。甚至学者们也无法达成一致。Williamson (1993) 将计算型信任称为术语上的矛盾,Gambetta (1988) 将信任建模为主观概率,而 Rousseau 及其同事 (1998) 则得出结论,认为威慑根本不是信任。

一门工程学科需要一个清晰、可操作的信任模型。本文正要介绍这样一个模型。

我提议:

  1. 信任是一种预测 —— 委托人对 Agent 行为的概率预测,其强度足以指导决策。

  2. 信任关乎资源 —— 涉及委托人可能受 Agent 行为影响的资源。

  3. 信任具有上下文相关性 —— 始终限定于特定的 Agent、领域和环境。

  4. 信任由两个组成部分构成 —— 取决于委托人对 Agent 的了解(我借用 Jordan Hall 的说法称之为 pistis)以及环境如何塑造 Agent 的行为(借用 Josh Stark 的说法称之为 hardness)。

  5. 信任可以用资源价值来衡量 —— 量化为委托人在给定背景下愿意接受的最大资源敞口。

我建立这个模型的目的是让信任不仅可以被描述,而且可以被工程化

1. 信任是一种预测

每当你把车借给朋友、授权团队管理预算或建立合伙关系时,你都是在将自己的资源置于他人的自由裁量权之下。这就是委派(delegation):一方(委托人)依赖另一方(Agent)以(有望)增进委托人利益的方式行事。委派可以是层级制的,比如董事会任命 CEO;也可以是互惠的,比如联合创始人分担责任,在这种情况下,双方同时既是委托人又是 Agent。

由于委派会将委托人的资源暴露在风险之中,只有当委托人对他们的 Agent 不会滥用资源有足够的信心,或者潜在的回报值得冒险时,他们才会进行委派。后者很重要,值得进行独立研究,但本文的重点是前者。委托人的信心是一种预报:是对 Agent 在委派背景下行为的预测。这种预测就是信任。

这种观点是有先例的。值得注意的是,Gambetta 将信任定义为“Agent 评估另一个 Agent 将执行特定动作的特定水平的主观概率,这种评估既发生在他能够监控该动作之前,也发生在会影响其自身行动的背景中。”信任之所以重要,正是因为它驱动了委托人关于委派什么、委派多少以及委派给谁的决策。

2. 信任关乎资源

这些决策 —— 委派什么、委派多少以及委派给谁 —— 都是关于资源的决策。委托人不会抽象地预测 Agent 的行为;他们关心行为是因为行为对他们利益的影响。为了使其精确化,我将委托人关心的所有事物,包括委派中可能涉及的所有利益,都建模为资源。构成信任的预测,从根本上说是关于由于委派而导致委托人资源会发生什么的预测。

什么算作资源?在我的模型中,几乎所有东西都是:物理商品如食品和建筑材料,数字商品如软件和信息,概念性商品如金钱和知识产权,以及关系性商品如声誉和隐私。使它们都成为资源的原因在于委托人重视它们,并且 Agent 的行为可以影响这些价值。1 在每种情况下,委托人都在问同样的问题:我可以信任你处理这些资源吗?我的车?这些数据?我孩子的安全?

重要的是,处于风险中的资源超出了委托人明确委派的范围。委派电子数据的访问权可能不会危及数据本身,但 Agent 可能会利用该访问权损害委托人重视的其他资源。这一完整的足迹就是委托人的资源敞口:由于委派而处于风险中的一切,而不仅仅是移交的预算、数据访问权限或材料。

3. 信任具有上下文相关性

作为委托人的预测,信任必然具有视角性:它是委托人在特定背景下对特定 Agent 的看法。Alice 对 Bob 煮晚餐的信任与她对 Bob 管理国库的信任是不同的预测。正如 Hardin (2002) 所言:A 信任 B to do X。说“我信任你”总是一种简写 —— with what? 以及 to do what? 完整的陈述应指明 Agent、领域和条件。

我们可以将背景分解为两个截然不同的组成部分:领域(委派的主体)和环境(外部条件)。领域是委托人希望 Agent 代表其完成的目标和任务,以及委托人为完成这些目标和任务而委派的资源 —— 即委派的主体 —— 正如我们在上一节中所建立的,信任预测归根结底是关于这些的。

抽象地说,领域包含 Agent 可能采取的一组潜在行动,这些行动要么由委派的资源促成,要么可能影响委托人处于风险中的资源。我们早期的委派例子主要是从领域角度构建的:开车、管理预算和煮晚餐。考虑建立合伙关系:在这种互惠委派中,两个个体努力合作以实现共同目标。该目标以及他们为实现目标而汇集的资源构成了领域。

环境是塑造 Agent 在该领域内可以采取或可能采取哪些行动的一组外部条件。合伙关系的互惠委派是通过法律文件达成的,这些文件定义了合伙关系本身的界限:每个合伙人被允许或不被允许做什么,以及这些规则如何执行。这些机制是环境的一部分。

post image

4. Pistis 和 Hardness:信任的两个组成部分

到目前为止,我们已经确定信任是一种预测,并且这种预测是针对由领域和环境共同构成的背景做出的。因此,信任必然受到这两者的影响。委托人对 Agent 的解读很重要,塑造该位置上任何 Agent 行为的环境条件也同样重要。这是我的模型与许多信任文献分道扬镳的地方。2

Williamson 认为“计算型信任”(基于理性动机的依赖)是一个术语矛盾。Rousseau 等人更进一步:他们得出结论,“威慑”(由后果强制执行的合规)不是信任,并将其从模型中剔除。在这一观点中,环境约束是信任的替代品 —— 是控制而非信心。我不同意:如果信任是预测,而环境改变了预测,你就不能排除环境的贡献。预测就是信任;你无法将输出与其组成部分之一分离。

考虑一个熟悉的案例:你遇到一个人并得知他和你上同一所母校。你立刻会多信任他一点。大多数人会称之为社会信任 —— 一种身份认同感、共同经历,甚至可能是共同价值观。其中一些确实是真实的。但实际上发挥作用的很大一部分是你们可能共享的相互联系网络:二度或三度关系创造了潜在的声誉问责。如果这个人辜负了你,消息会通过一个对你们双方都很重要的网络传播。最坏的情况下,你知道如何找到他们。这种对其行为的影响是环境性的,而非个人的;它所起的作用比许多人意识到的要多。

这种环境 —— 共同的母校 —— 与那两个人之间建立的实际个人关系同样重要。一个可操作的信任模型需要分别考虑这两者,这样我们才能推论它们如何结合以及如何加强每一个。

Pistis

信任的第一个组成部分源于委托人对 Agent 本身的评估:这个人是谁?他们的本质是什么?借用 Jordan Hall (2026) 的说法,我称之为 pistis

Pistis 对应于委派领域。适配 Mayer, Davis, 和 Schoorman (1995) 著名的框架,委托人对 Agent 的 pistis 反映了他们对 Agent 的能力、诚信和内在一致性(共同价值观、身份、使命)的评估。过往记录、压力下的判断、性格:这些都是委托人所感知到的 Agent 的属性,而不是环境的属性。从这个意义上说,声誉作为 pistis 的信息输入;它是 Agent 在先前背景下表现的压缩记录。

Hall 对 pistis 的描述非常精彩:

建立校准后的相互依赖关系的能力 —— 这种关系既不基于盲目的希望,也不基于务实的合同,而是基于证明过的可靠性、透明的行动和渐进的深化。[...] 你们决定合作做一些小事。他们兑现了。或者他们没有。经过几个月,甚至几年,你勾勒出他们是谁的画像。但那副画像始终是不完整的,始终由叙事 —— 他们的和你的 —— 所介导。人们表演可靠。人们表演透明。而这种表演有时与真实情况难以区分,直到真相大白的那一刻。

一旦双方之间建立了 pistis,产生信任的边际成本就很低。具有强大 pistis 的团队之所以行动迅速,正是因为他们不在验证上消耗精力。但 pistis 是通过直接经验形成的,且建立成本高昂。正如 Hall 所描述的,它形成缓慢、脆弱,且不易扩展。邓巴数本质上就是我们用于建立和维持 pistis 的带宽耗尽的点。

Hardness

信任的第二个组成部分源于塑造 Agent 行为的环境因素,无论该 Agent 是谁。借用 Stark (2022) 的说法,我称之为 hardness3 如果说 pistis 问的是“这个 Agent 是谁?”,那么 hardness 问的就是“处于这个位置上的任何 Agent 能做/会做什么?”

Hardness 处于一个从软到硬的光谱上:从社会规范和声誉问责到结构性激励(Token 质押、抵押品、利润分享),再到制度机制(法律、合同、专业执照)以及物理定律和智能合约。

某些 hardness 是预先存在的 —— 继承自物理、地理、现有的社交网络或法律管辖区。但其中很大一部分是可以工程化的。Stark 指出,人类已经逐步学会了创造 hardness:首先是通过利用原子,然后是通过建立制度,现在则是通过创建区块链和部署智能合约。Hardness 是工程化信任的一个设计杠杆。你可以选择在环境中构建多少 hardness,什么样的 hardness,以及以什么样的成本。

Hardness 的成本结构在整个光谱中各不相同。制度性 hardness 的建立和执行可能非常昂贵(律师并不便宜)。相比之下,智能合约的部署相对廉价,且维护成本几乎为零。但由于这两种机制都与 Agent 无关,hardness 可以在 pistis 无法扩展的地方实现扩展。

post image

信任 = Pistis + Hardness

这是模型的核心:信任是 pistishardness聚合,是由这两种输入构成的单一预测。要理解原因,请考虑两者是如何相互作用的。在给定的委派中,pistishardness 是经济上的替代品。委托人可以通过不同的组合达到相同的信任水平:高 pistis 加低 hardness,或者反之,或者中间的任何混合。例如,一个在可罚没合约中质押了 5 万美元的恶意 Agent 仍然可以在 5 万美元的额度内被信任。尽管 pistis 为零,但 hardness 很高,因此委托人在这个背景下仍然可以信任该 Agent。

但如果从时间跨度来看,这种关系就发生了变化:pistishardness 是经济上的互补品。回到你之前遇到的那位校友。共享的校友网络 —— 即让你能多信任他们一点的潜在声誉问责 —— 是一种 hardness。这种 hardness 使得开展小规模合作变得足够安全,从而为从其能力和性格的直接证据中形成 pistis 创造了机会。随着 pistis 的增长,你愿意委派更多任务,并最终共同建立新的 hardness:如果没有这种关系,就无法建立的更具扩展性的结构。

这大致就是健康的制度运作的方式:结构为关系的形成创造了条件,而不是反过来。Hall 将此描述为一个渐进的阶梯 —— “观察、协调、依赖、约束” —— 每一步都是赢得的,且如果被证明不合理,也可以撤回。我的模型为该阶梯提供了一个机制:hardness 降低了第一步的成本,而 pistis 从那里开始复利。

5. 信任以资源价值衡量

早些时候我们问过:我可以信任你处理我的车吗?处理这些数据?处理我孩子的安全?但在每一个问题中都潜伏着一个更深层的问题:有多少利益受牵连?我可以信任你处理 100 美元吗?那 100,000 美元呢?如果信任是关于委托人资源敞口的预测,那么它有一个自然的单位:这些资源的价值。信任是委托人在给定背景下愿意接受的最大资源敞口 —— 即该背景下的信任容量(trust capacity)。

100 美元的例子很简单,因为金钱有其自身的单位。但同样的逻辑适用于委托人重视的任何资源。我们想要衡量的是资源价值4 资源对委托人的价值,以委托人能够估计的任何术语表示。正是这种估值 —— 而非资源的类型或自然单位 —— 提供了一个通用分母。就像信任一样,资源价值始终具有视角性和上下文相关性。即使是 100,000 美元,对亿万富翁和对靠工资过活的人来说意义也不同,而且你的隐私在某些背景下比在其他背景下对你更重要。

资源价值是可以量化的。这并不是因为每种资源都有自然单位,而是因为委托人总是在对资源进行比较判断。你可能无法为你的隐私给出一个精确的美元数字,但你每天都在权衡它与其他资源的关系,比如社交媒体的访问权或电子商务的便利性。

我们可以用资源价值来衡量 pistis 和 hardness。由于委托人的资源与 Agent 的激励之间存在直接关系,hardness 与资源价值呈正相关。一个 5 万美元的可罚没债券覆盖了 5 万美元的资源价值,而一份保密协议则保护了其所涵盖信息的价值。如果你能为资源估值(委托人总是这样做的,即使是含蓄的),你就能衡量 hardness

Pistis 则不那么显而易见。但请考虑:你会信任一个亲密的朋友在晚上照看你的孩子,但你可能不会将同样的社会信任延伸到一个只见过一两次面的邻居。在这两种情况下,涉及的是同样的资源(你孩子的安全)。这种完全基于你对人的评估的差异,具有明确的量级;并且它是以该资源对你的价值来计价的。

这两个组成部分都以所涉及资源的价值计价。这种同质性使得信任可以被工程化:我们可以用一个替代另一个 —— 如果 pistis 下降,就用更多的 hardness 来补偿 —— 并且我们可以识别差距。如果一项委派需要一定的信任容量,我们从 pistis 和预先存在的 hardness 中已经获得了多少,其余的又可以从哪里获得?

作为说明,考虑 Alice 将 10 万美元的国库管理权委派给 Bob。根据他们的工作历史和个人关系,她估计在没有任何环境条件的情况下,她愿意在国库管理领域委派给 Bob 的金额最高可达 6 万美元;这就是她对 Bob 在该领域的 pistis。Alice 还要求 Bob 缴纳 5 万美元的可罚没债券。6 万美元的 pistis 和 5 万美元的 hardness 加在一起,创造了足够的信任容量,让 Alice 能够进行委派。

但现在把 Bob 换成一个未知的 Agent:pistis 降至接近零,仅靠 5 万美元的债券是不够的。为了弥补差距,Alice 可以增加更多的 hardness(例如更严格的支出上限,或要求新 Agent 的某些类型交易必须获得 Alice 的批准),或者投入时间与新 Agent 建立 pistis

让我们再看一个例子:一个家庭在两个孩子上大学之间做选择。在一所学校,这个家庭与教职员工有密切的联系 —— 他们认识多年并深切信任其判断的人。这所学校位于一个制度监管薄弱、对学生福利责任有限的州。在另一所学校,这个家庭一个人也不认识,但它运行在严格的监管、强制性的安全规程以及如果学生因疏忽受害将面临严重法律后果的环境下。在这两种情况下,pistishardness 的构成几乎相反,但这两个背景都可以赢得该家庭的信任。


应用模型:信任与分形委派

上述五个命题定义了一个单一委派中的信任原子模型。该模型是一个原语;一个我们可以以多种方式应用的建筑块。其中最能说明问题的一种方式是询问在委派链中会发生什么:Alice 委派给 Bob,Bob 委派给 Carol。信任在这些环节中是如何动态变化的?

每一个环节都是一个独立的委派。Agent 自身变成了一个委托人,并对他自己的 Agent 的行为形成新的预测。但信任的两个组成部分在这些环节中的表现非常不同,尤其是在涉及委托人的资源敞口时。Pistis 让委托人对其直接 Agent 的行为产生信心。但其相关性会随着每一次嵌套委派而退化,因为领域在每个环节都会变得更窄。Alice 对 Bob 在某个领域的 pistis 并不能告诉她太多关于 Carol 在更窄领域的信息,即使 Bob 对 Carol 有 pistis

考虑一个常见的公司场景。CEO 对她的副总裁在广泛的财务领域有很高的 pistis。副总裁将一个更窄的子领域委派给承包商。CEO 对副总裁的 pistis 并不涵盖那个更窄的领域;它从未被限定于此。因此,CEO 的资源敞口直接传递到了承包商身上。如果承包商玩忽职守,“我的副总裁为他担保”这种话是给不了什么安慰的。

另一方面,hardness 不会随着委派而退化。链条中任何一点的硬边界都限制了其上方所有人的风险,无论下方发生了什么。如果副总裁增加了一份包含责任条款和履约保证金的稳健承包商协议,CEO 的资源敞口就被锁定在该边界内,无论下游发生了什么、领域是什么,或者 CEO 是否见过该承包商。在 AI 委派文献中,Tomasev et al. (2026) 将这些边界称为“责任防火墙”。

在一个委派网络中,必须在每个环节评估 pistis。但在任何环节应用的 hardness 都可以被整个链条所依赖。能够对信任的两个组成部分进行建模,使得信任在组织规模上的设计成为可能。

post image

迈向信任工程学科

该模型定义了一个信任的原子原语:一个分解为可衡量、可设计组件的单一委派。从该原语出发,我们可以将 pistishardness 之间的权衡正式化,设计能为给定委派产生正确构成的环境,并推论信任如何在网络中传播。对于任何给定的系统,我们可以指明要构建什么 hardness,在哪里投资 pistis,以及系统的每个部分可以承受多少资源敞口。我们可以询问给定的信任构成成本是多少,甚至可能预测它对委派预期回报的影响。这些都是设计问题,而且是有答案的。一个可操作的、定量的模型是信任工程学科的基础。

该模型已经重新界定了加密领域最容易产生误导的主张之一。“Trustless”并不意味着缺乏信任。相反,它意味着一种由 hardness 而非 pistis 主导的信任构成。区块链结合了密码学和经济激励,以产生具有最低 pistis 要求的信任。这种结合所涉及的分布式计算和经济质押带来了巨大的固定成本,但它产生了一个以 hardness 形式实现的廉价、可编程信任平台。

这种信任工程的需求比以往任何时候都更加迫切。人类共同的生物特性、先验知识、规范和进化的社会直觉为我们提供了足够的共识,以至于许多行为可以被假设而无需专门设计。AI Agent 并不共享这种构成。对于非人类 Agent,人类含蓄做出的可预测性评估必须被明确地设计出来。

社会将需要全新的协作基础设施。建立一个可操作的信任模型就是我们的起点。


感谢 Brennan Mulligan, Sara Norval, Nick Naraghi, Alex Murray, dancingpenguin.eth, Shelby Steidl, 以及 Abram Dawson 对早期草稿提出的宝贵意见。

  1. 这里的资源不仅限于工具性商品。委托人重视的任何事物(包括关系和隐私等目的本身)在这个模型中都算作资源,因为委派可以将其中任何一个置于危险之中。
  2. Tomasev et al. (2026) 在 AI 委派文献中得出了兼容的分解结论,将信任定义为委派者对受托人能够按照明确约束和隐含意图执行任务的信念程度。他们的“明确约束”对应于 hardness;“隐含意图”对应于 pistis
  3. Hall 通过不同的渊源得出了类似的概念,称之为 horkos —— 古希腊的誓言契约,是 pistis 的仪式化对应物。“计算机无法做出承诺,”Hall 写道,“但它们是由誓言构建的。”我更喜欢 Stark 的标签:hardness 突出了物质和制度光谱,而 horkos 则强调了约束行为。两者都抓住了可预测性可以内置于环境中的洞见,但 hardness 更好地服务于工程框架。
  4. 资源价值与经济学意义上的效用密切相关。两者都捕捉到了从决策者角度出发的主观估值理念。我使用“资源价值”是为了避免预期效用理论的包袱,后者带有关于理性、基数测量和概率加权的假设,而这些在这里并非必要。
  • 原文链接: paragraph.com/@hq.spengr...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
spengrah
spengrah
江湖只有他的大名,没有他的介绍。