## 黑暗工厂日记 #2：别再组建机器人团队了

我像组建人类团队一样为我的AI流水线配备了角色：产品经理、工程师、质检员、评审员。结果它重现了官僚主义。解决办法是彻底抛弃人类类比。

当我第一次尝试实施一个“软件黑暗工厂”——一个由智能体构建、测试和交付的无人值守流水线时，我犯了一个可预见的错误。我把自主性当作人员配置问题来处理。我创建了一个“产品经理智能体”、“工程师智能体”、“质检智能体”和一个“评审智能体”，然后围绕它们重建了人类团队的工作流程。它看起来有条不紊，但运作起来却像一个官僚机构：过多的交接、过多的等待、过多的时间在不同步骤之间转换上下文。

## 瓶颈不在于代码生成

我研究的那些以智能体优先模式实际交付产品的团队越多，就越清晰地看到：困难的部分不在于代码生成。而是辅助系统工程，即设计能让智能体工作可靠的环境。工程师的角色正在被重新定义。人类负责掌舵：确定优先级、明确验收标准、验证结果。智能体负责执行：生成代码、测试、文档、CI配置，甚至评审循环。代码库成为意图和约束的记录系统，其结构使得智能体能够找到重要信息，并忽略无关内容。

## 我们仍在模仿自己

这促使我有了第二个认识：我们仍处于自主系统的V1阶段，因为我们总是在以我们自己为类比来建模它们。我们问：“一个优秀的工程师会怎么做？”然后试图模拟那个人。但机器不需要会议或说服。它们需要明确的意图、快速的反馈和可强制执行的约束。在高吞吐量下，传统规范会颠倒过来。等待变成了浪费。纠错变得廉价。流程必须为迭代、并行和机械强制执行而构建：测试、自定义代码检查器、结构检查以及智能体无需繁琐步骤即可读取和执行的遥测数据。

## 工厂是一个验证流水线

我一直在研究的“软件工厂”方法毫不浪漫地指出：规范和场景驱动着非交互式智能体编写代码、运行辅助系统并自主收敛，无需人工审查。这听起来鲁莽，直到你看到其背后的基础设施。第三方服务的行为克隆让你能够运行大量场景、安全探索边缘情况，并在不触及实时系统的情况下验证行为。工厂不是一场对话。它是一个验证流水线，将场景转化为证据，将证据转化为发布。

## 信任必须基于证据

信任是真正的障碍。缺乏信任会阻碍生产部署，而解决方案是自动化推理。神经符号方法，结合了生成模型和符号方法，可以证明或反驳安全属性和正确性主张，而不是仅仅依赖于“它通过了我们的测试”。在黑暗工厂中，信任不能是一种感觉。它必须是证据：可检查的约束、可重现的行为、可诊断的故障。

所以，别再试图让机器像人一样工作了。从第一性原理出发，围绕机器擅长之处重新设计。将规范、场景、辅助系统、遥测数据和自动化检查作为一流的生产资产。优化你的代码库，使其对智能体而言更易读。将架构和“品味”编码为不变式。通过持续清理来应对熵增，而不是依靠英雄式的周五加班。

黑暗工厂不是一个团队。它是一个系统。

## 延伸阅读

*   OpenAI谈辅助系统工程——零人工编写代码交付真实产品
*   StrongDM的软件工厂——“数字孪生宇宙”规模化验证方法
*   Werner Vogels和Byron Cook谈自动化推理——为何信任必须来自证明，而非感觉