本文对比了 Claude Code 和 Codex 在真实生产代码库中的表现。Claude 速度快且智能,但倾向于在现有文件中堆砌代码,适合快速原型开发;Codex 虽然运行速度较慢,但更注重重构与规范,能更好地遵循指令,适合构建可扩展的企业级软件。

一名拥有 14 年经验(包括在 MAG7 公司的经历)的工程师花费了超过 20 个小时在真实的生产代码库上运行 Claude Code 和 Codex。以下是调查结果的详细分析。
这种对比是站在首席/资深工程经理(Principal/Staff Engineering Manager)同等职位的角度进行的。这两个工具都使用了严谨、专业的流程进行测试,而非简单的业余爱好者提示词。
在对比结果之前,需要注意的是,这两个工具都在同一系统下运行:
postgres_performance.md、python_threading.md)检查 SOLID、DRY、KISS 和 YAGNI 原则。CLAUDE.md 和 AGENTS.md 长度约为 100 行,涵盖了 TDD 规则、git 工作流、关键开发惯例和 docker 命令。
Claude 的表现就像一名时间紧迫的高级工程师:聪明且快速,但专注于交付功能而非维持长期的架构整洁。
CLAUDE.md 中写入的明确惯例。Claude 的交互速度非常适合原型设计,但它需要一名技术娴熟的驾驶员不断监控输出。

Codex 感觉就像一名拥有 5-6 年经验、考虑周全的工程师。虽然在速度方面不是“首席”级别,但它在结构方面展现出了很高的能力。
AGENTS.md,很少允许指令在会话中期被覆盖。自主性是一个显著的优势,尽管你以较慢的执行速度为代价。

Codex Pro x5 的使用上限大致与 Claude x20 相似,这是预算编制的一个因素。
这两个工具都扮演着倍增器的角色。它们不能修复拙劣的工程;它们只是倍增了输入的初衷速度。如果驾驶员不懂软件工程,这两个工具最终都会产生垃圾。
CLAUDE.md 和 AGENTS.md 文件至关重要。100 行清晰的惯例在每个会话中都能提供巨大的价值。最有效的 AI 编程设置是保留在工程师治理之下的设置。

- 原文链接: x.com/hooeem/status/2044...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!