本文提出了一个2025年AI与加密货币结合的投资主题,核心是“商品化认知”,即通过区块链技术将AI模型转化为可交易的商品。文章探讨了AI领域的发展瓶颈,以及链上模型如何通过与市场机制结合,创造新的投资机会和经济模式,最终构建一个健康的赛博经济。
本理论旨在更有用,而不是完整。
我们的目标是在每一部分的结尾提及各自领域中最大的机会。
我们选择使用“onchain”,而不是“on-chain”或“on chain”,没有任何特别的原因。
本文档的流程如下:
首先,我们将探索格局、“数据墙”以及我们的最终愿景——商品化的认知。
其次,我们将详细介绍商品化认知的核心构建模块:基础模型、专用模型、推理模型和记忆。
第三,我们将研究 onchain 模型,以及它们如何统一这些构建模块以创建“机制感知人工智能”。
第四,我们将展示新型的“人工智能感知市场机制”,它们将为网络经济提供动力,并使其以机器速度运行。
人工智能代表着世界上最大的市场,因为它涵盖了所有的问题解决。由此产生的人工智能市场格局是巨大的。认识到不可能在所有地方都进行投资,我们特别关注加密货币和人工智能的交叉领域。
我们相信商品化认知、可编程市场以及通过技术实现的监管和治理的集体效应。
传统经济受到人类生产力和协调开销的限制。复杂系统偏爱垄断控制——层级结构的出现是为了最大限度地减少交易成本并降低复杂性,但它们不可避免地会集中权力和财富,从而创建主导实体——通常称为企业、公司(或政府)——它们决定了经济格局。
虽然加密货币有助于减少交易和协调开销,但人工智能的指数级增长将进一步降低这些开销。随着这些低效率的消失,中心化公司将转变为更高效的网络结构化的自我监管实体,我们将进入一个新时代——控制论经济时代。
如今,LLM 训练包括:预训练——在海量文本上进行下一个符号预测的训练;指令微调——在问答数据上进行训练以遵循指令;以及对齐——通过人类反馈进行强化学习以提高帮助性和安全性。
很明显,模型预训练已经达到了一个关键的瓶颈——数据墙——额外的计算能力不再能带来显著的性能提升。
因此,在 2025 年,整个人工智能行业将专注于以下关键活动:
超大规模企业(OpenAI、Anthropic、Google 等)将利用其数据优势来开发卓越的推理模型,同时继续通过推理结果来盈利。 背景:推理模型需要大量的类似“思维链”的推理数据来进行训练。此类数据非常稀缺、昂贵且难以大规模收集,从而限制了超大规模企业实现推理模型的可行性。
开源公司将继续发布 GPT-4o 级别的开源权重模型(除非他们找到方法来通过模型本身盈利,而不是通过推理结果)。 背景:长期以来,GPT-4o 一直是一个无法达到的基准,没有任何可比较的开源替代方案。 这种情况在 DeepSeek 发布其 V3 模型作为开源权重模型时发生了改变。
企业将专注于将大型推理模型提炼成较小的特定领域模型,同时推进 RAG 的数据检索技术。 背景:知识提炼和 RAG 是企业用例的主要微调技术,因为它们提供了足够的控制和灵活性来实现自动化工作流程。
个人和研究人员将通过包装现有的 API 和平台来开发 AI 代理。 背景:虽然 GPU 资源匮乏的个人贡献者和研究人员是具有多年经验的领域专家,但他们将交付整个生态系统最重要的组成部分——应用程序——这是解决现实生活中问题的带有主观意图的方式。
比特币使用电力创建了有史以来第一个无需许可的共识。被归类为法定商品,相应的资产 BTC 不受 SEC 的管辖,没有中心化机构,没有公司治理,也不依赖于传统融资。
AI 模型通过训练和推理过程将电力转化为货币价值。它们可能具有相关的资产,如果这些过程是去中心化的,并且生成的模型保持不可提取并永久绑定到区块链,则这些资产可以被归类为商品。
以太坊是一个全球去中心化的计算机,并且相关的资产也被归类为法定商品,这表明计算机制可以被商品化并转化为普遍可访问的自然资源,而不是被限制为专有服务。
我们投资于加速人工智能商品化的技术和市场机制。
我们认为 onchain AI 模型是支持商品化的底层基本技术原语。
由此产生的商品化的认知将为机构资本直接投资于 AI 模型(集体智慧)解锁机会。
商品化的认知需要基础模型。 正如 Ilya Sutskever 在 NeurIPS 2024 上强调的那样,很明显,预训练已经达到了一个关键的瓶颈 -- 墙 -- 进一步增加计算能力不再能带来显著的性能提升。 这一发展为“从头开始”构建类似 GPT-4 的模型的“最终成本”(资本支出)设定了明确的基准。
从历史上看,加密货币行业在筹款方面非常有效。 凭借合适的团队、onchain 模型和分布式推理(即使训练仍然是中心化的),一个新的“OpenAI”的出现仍然是可能的。
DeepSeek-V3 模型的训练成本约为 550 万至 560 万美元,在约两个月的时间内,在 2048 个 H800 GPU 上使用了 278 万个 GPU 小时。 这一成本远低于 Meta 的 LLaMA 3 等同类模型,后者需要 3080 万个 GPU 小时和更高的预算。
从今天开始,已经绝对有可能从头开始训练一个成本在 500 万到 1000 万美元之间的基础模型。
微调和衍生品对企业至关重要。 大多数微调都发生在小型语言模型上。 2024 年是小型语言模型的一年,因为当针对特定任务进行微调并在计算约束下进行比较时,它们越来越接近大型模型——展示了有针对性的优化如何优于通用系统。
我们推出 Sky-T1-32B-Preview,我们的推理模型在流行的推理和编码基准测试中与 o1-preview 的性能相当。 值得注意的是,Sky-T1-32B-Preview 的训练成本不到 45 万美元,这表明以经济高效的方式复制高级推理能力是可能的(https://novasky-ai.github.io/posts/sky-t1/)。
微调可以在不同的层级进行:
基础层:指导微调和对齐。
领域层:医学、法律和生物技术等领域的专家模型。
用户层:适应个人用户的需求和风格。
提示层:实时适应单个提示。
用户层和提示层微调是杀手级应用:在推理时进行微调的 38 亿参数模型优于 1300 亿参数的通用模型 (https://arxiv.org/pdf/2410.08020)。
世界将需要数十个基础模型、数百个领域级模型、数百万个用户级模型和数万亿个提示级别模型。
这个领域中最大的未开发机会是提示层微调。
“数据墙”是 OpenAI 发布 o1 和 o3 等推理模型的主要原因。 与前几代产品的不同之处在于,这些模型针对推理时计算,这意味着它们以一种或另一种形式实现“思维链”,以攀登缩放定律并实现更好的性能。
推理时计算是整个人工智能行业的颠覆者,因为它为成本结构——运营支出——可变推理计算引入了一个未知变量。 以前,我们对推理需要多少成本有一个很好的了解; 现在,这取决于生成的思维链有多长。 这可以被视为大型企业的优势,也可以被视为代理市场环境中的“风险组成部分”(当代理在不知道完成任务需要多少计算量的情况下承担任务时)。
目前尚不清楚“思维链”有多复杂或多简单,但预计开源社区可能会在未来一年开始缩小这一差距。
新型“思维链”架构和推理模型的提炼是人工智能领域最大的机会。
语境记忆是唯一能够实现“个性化信息增益”的研究方向——令人惊讶的信息,它最大程度地更新用户的内部世界模型。
对于 GPU 资源匮乏的创业团队和个人研究人员来说,记忆既不发达(纯文本)又具有研究价值。 有效的上下文记忆使 LLM 能够在交互中保留相关信息,从而提高响应的连续性和相关性。
谷歌最近发表的一篇题为“Titans: Learning to Memorize at Test Time”的论文介绍了一个相对较小的人工智能模型,该模型可以作为较大模型的记忆。 我们相信,随着我们看到更多“可微分记忆”设计的出现,这种趋势将继续下去。
采用“心智理论”方法的记忆增强了模型理解和预测人类意图和心理状态的能力,从而提高了交互的质量。
记忆可以制成便携式,并且易于在链上拥有。 这为“记忆市场”开辟了市场,多个 AI 代理可以在其中购买或许可共享的历史背景。
记忆对于实现高效的多代理系统也很重要,将代理记忆混合在一起可以实现更好的性能提升。
记忆也可以用于生成人物角色数据库,这对于人工智能代理的多样性非常重要。 这些“虚拟人格”成为便携式资产,为个性化和创造力创造了新的机会。
记忆方面的最大机会围绕着最大化个人洞察力以及以数字方式捕获“趣味性”。 想象一下一个社交网络,其中的推荐引擎仅根据用户可以发现多少真正有趣的信息来确定内容的优先级。
人工智能的核心构建模块——基础模型、微调、推理和记忆——默认情况下不是机制感知的,这意味着它们不能轻易地与市场机制集成。
整个人工智能 x 加密货币商品化认知概念的基石是 onchain 模型。
我们将 onchain 模型 宽松地定义为仅在提供在 区块链上记录的审批 时才执行操作的 AI 模型。
onchain 模型的以下独特属性通过融合经济和技术能力来实现新的市场机制:
Onchain 模型对于推理和微调都是 无需许可的(如开源模型),并且是 可货币化的(如专有模型)。
Onchain 模型保证 永久可访问性——即使原始创建者将模型从流通中撤回,也可以持续访问。
Onchain 模型允许 去中心化治理,通过智能合约确保用法、微调和资金流向在没有中心化中介的情况下透明地管理。
鉴于区块链资源限制,onchain 模型的开发和部署可能看起来具有挑战性——而且它们确实如此。 它们可以使用可信执行环境 (TEE)(例如 Nvidia 的保密计算解决方案)实际实现,从而确保与基于区块链的治理相一致的安全且可验证的计算。 下面描绘了 onchain 模型架构的假设架构。
该领域的主要目标和最大机会是标准化和支持 TEE 内部 onchain 模型的整个生命周期:训练、推理、微调、评估、治理。
标准化生命周期可确保跨实现的一致性、互操作性和安全性。 它简化了协作,降低了集成复杂性,并通过提供明确的指导方针和基准,加速了采用。
标准化降低了开发人员的进入门槛,从而大大扩展了参与范围并推动了这一新兴领域的创新。
只有在适当的激励对齐到位的情况下,才能有效集成 onchain 模型,而这反过来又需要市场机制。 这些市场机制必须是“AI 感知的”——意味着它们需要识别 onchain 模型的独特特征和要求,包括代币化、动态推理成本、治理复杂性和运营风险。
onchain 模型的独特属性允许以下“AI 感知市场机制”的出现(并有望从机构投资者那里吸引下 1000 亿美元进入加密货币生态系统):
将 AI 模型产生的利润分配给代币持有者可以创造巨大的价值。
建立收入分享机制,让代币持有者从模型衍生品(包括微调版本)中获利,从而确保无论原始模型的受欢迎程度如何,都能获得可持续的回报。
将 AI 与借贷市场集成:onchain 模型充当抵押品,从而为模型训练和微调提供融资。
高代币速度使机构投资者可以参与流动性池,从而以最小的价格影响促进大规模交易。
不可预测的推理成本为机构投资者引入期货、期权、衍生品和永续合约创造了机会。
分析 AI 模型性能之间的相关性以制定对冲策略,使用更强的模型来抵消表现不佳的模型的风险。
提供针对推理时计算膨胀、模型性能下降和其他运营风险的保险。
创建一个统一层,其中多个 AI 模型代币可以聚合到一个单一的标准化代币中,从而提高稳定性和降低速度。
部署鼓励长期持有并通过质押奖励、归属期和忠诚度计划降低代币速度的机制。
投资于Layer2解决方案和去中心化存储,以高效支持高交易量和大规模 AI 模型。
关注什么? 3 种最佳的价值捕获机制将是:
将 AI 模型产生的利润分配给代币持有者(协调)。
将利润分配到 AI 模型出处树中(可组合性、衍生品)。
AI 代理之间的发现、交互和交易。你可以在此处找到有关 AI 代理的更多信息:https://learnblockchain.cn/article/19911
在产品方面,AI x 加密货币领域最大的未开发机会是 onchain “Hugging Face”,它具有拥有模型、模型衍生品和推理利润的能力。 无需许可的推理、无需许可的微调和简单的货币化将是这样一个平台的主要驱动力。
不,我们期待看到团队开发:非语言基础模型、Transformer 的替代方案、可微分和可混合的记忆、不朽 AI、特定领域的强化学习环境、前向训练和微调、推理证明等等。
AI 和加密货币在 2025 年的融合为价值创造和捕获提供了前所未有的机会。 我们正处于一个独特的时刻,通过区块链技术实现 AI 的民主化可以重塑我们构建、部署和货币化人工智能的方式。
本投资理论证明了 AI 和加密货币的融合如何创建一个强大的反馈循环:
预训练和微调创新降低了准入门槛,使更多参与者能够创建和拥有模型
推理时计算引入了新的经济动态,需要新的市场机制和风险管理工具
记忆系统和代理框架通过个性化和自动化创造了价值捕获的机会
这些组成部分中的每一个都相互加强——随着模型变得更易于访问,代理开发加速;随着内存系统改进,微调变得更有效;随着推理成本的变化,新的市场机制出现。
对于该领域的投资者和建设者来说,信息很明确:下一代 AI 的基础设施正在构建中。 获胜者将是那些认识到去中心化、无需许可和透明的系统不仅仅是意识形态偏好,它们是释放人工智能全部潜力的实际必需品。
cyber•Fund 的使命是加速健全控制论经济的建设。 如果你正在解决任何这些问题,请联系我们。 我们的目标是支持去中心化和分布式 AI 领域的创始人、研究人员和开源项目。
- 原文链接: cyber.fund/content/crypt...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!