文章探讨了人工智能发展的哲学基础,认为AI的发展历程与西方认识论的演变相呼应,经历了从模仿(柏拉图)、经验(亚里士多德)到自我反思(黑格尔)的阶段。文章还指出,Richard Sutton的“苦涩的教训”在于强调通过经验学习的重要性,而非依赖人类的直觉和预先设定的知识。
Richard Sutton 与 Dwarkesh Patel 对话时,他的疲惫显而易见。在人工智能领域工作五十年后,他得出的教训是“苦涩的”:建立在人类直觉之上的智能总是失败,而从经验中学习的系统最终会胜出。计算和反馈胜出;模仿和直觉失败。
将知识建立在经验之上的亚里士多德会认同这个教训。
在 Sutton 这一代人之前,另一种自信占据主导地位。 如果智能可以被建模为知识,那么我们可以通过示例来教机器:给它们提供正确的形式,它们就会重现理想的行为。 这是西方思想中最古老的梦想,柏拉图的模仿,即知识是回忆,学习是对完美形式的模仿。
有监督的预训练仍然带有那种回响。 模型观察大量的人类表达语料库,并学习推理的表面语法。 它说得流利,有时很优美,但它没有活过。 它在没有经验的情况下记忆,而且正如 Sutton 所强调的那样,在没有目标或基本事实的情况下,它无法真正地从世界中学习。
Sutton 的“苦涩教训”打破了这一传统。 像亚里士多德一样,他坚持认为知识来自世界本身:来自互动、犯错和适应。 强化学习用反馈代替回忆。 机器不复制老师;它通过奖励的梯度感受到它的错误。 亚里士多德称之为习惯的东西,优化器称之为策略。
这种转变不仅仅是技术性的。 这是一种经验性的转变,为机器重现。
但仍然存在一种张力。 如果预训练是正题(模仿),强化是对立(经验),那么该领域仍然需要一个综合:能够注意到自己的错误,将经验教训向前推进,并重塑其理解的系统。 沿着这条哲学路线前进,黑格尔赫然在目,思想的进步不是通过积累,而是通过扬弃来解决内在矛盾:取消、保存和提升之前的东西。
人工智能所揭示的是:
智能的语义(它的含义)和智能的认识论(它是如何学习的)不能分开,它们必须共同进化。
人工智能的轨迹反映了西方认识论的哲学演变:
现在,LLM → RLHF → Agent 代表了代码中的三联画。
所以,是的,我们不仅仅是在重温旧问题, 我们正在将哲学最深刻的辩证法计算化: 意义、真理和自我理解是如何共同出现的。
这是一个图表,展示了柏拉图的模仿学习、亚里士多德的经验学习和黑格尔的辩证反思如何直接映射到现代人工智能的架构。
如何阅读下面的图表: 这是一个尝试映射思维运动的图表。柏拉图 → 模仿(形式)。亚里士多德 → 经验(互动)。黑格尔 → 反思(自我纠正)。每个阶段都包含前一个阶段的矛盾,并将其升华为更丰富的整体(如黑格尔辩证法)。
graph TB
classDef stage fill:#fafafa,stroke:#555,stroke-width:1px;
A["Plato: Imitation Learning (Semantic Layer)"] -->|Thesis| B["Aristotle: Experience Learning (Epistemic Layer)"]
B -->|Antithesis| C["Hegel: Dialectical Self-Reflection (Meta-Epistemic Layer)"]
subgraph "Stage 1 — Plato: Mimesis"
class A stage;
A1["Pretraining / Supervised Learning"]
A2["Learns ideal forms<br/>and linguistic patterns"]
A3["Meaning from form (imitation)"]
A4["Analogue:<br/>Ideal Forms, a priori knowledge"]
A --> A1 --> A2 --> A3 --> A4
end
subgraph "Stage 2 — Aristotle: Empiricism"
class B stage;
B1["Reinforcement Learning / RLHF"]
B2["Learns from feedback,<br/>interaction, and consequence"]
B3["Knowledge forged in interaction"]
B4["Analogue:<br/>Observation and induction"]
B --> B1 --> B2 --> B3 --> B4
end
subgraph "Stage 3 — Hegel: Dialectical Intelligence"
class C stage;
C1["Reflects on its own learning process —<br/>Agentic systems (AutoGPT, Voyager, Reflexion)"]
C2["Integrates form and experience"]
C3["Tracks and improves its learning procedures"]
C4["Self-modeling,<br/>reasoning,<br/>and planning"]
C5["Analogue:<br/>Aufhebung (Sublation) — contradiction preserved and lifted"]
C --> C1 --> C2 --> C3 --> C4 --> C5
end
A3 -->|"Contradiction / empirical feedback"| B1
B3 -->|"Reflection on failure and contradiction"| C1
C4 -->|"Sublation (Aufhebung): self-correcting synthesis"| A
这不是一个模型层次结构;而是一种思维运动。 出现的是一个持续的自我纠正过程,黑格尔的扬弃,其中每个矛盾都不会被丢弃,而是被带入到更全面的理解中。
Sutton 的教训之所以苦涩,不是因为经验是“更好的数据”,而是因为它是唯一可以扩展的老师。 手工制作的知识将智能困在模仿中。 反馈让它的成长速度超过了其设计师的理解。 人类洞察力从架构师到观察者的降级,令人刺痛。
刺痛中有一种恩典。 机器的挣扎反映了我们自己的挣扎:从相信智慧存在于理想中,到接受智慧是在错误和纠正中形成的转变。 Sutton 的教训是古老的。 无论是人类还是人工智能的学习,都是通过克服矛盾,朝着更高的目标前进。
- 原文链接: github.com/thogiti/thogi...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!