猴子、机关枪、aimbot:给编程团队的 AI 治理方案
AI 代码治理不是要从初级开发者和 AI 代理手中夺走工具,而是要安装guardrails,让每一发子弹都命中目标而不会造成附带损害。
机关枪已经发到每个人手里了。 AdEspresso 联合创始人、Unkover 首席 AI 官 Massimo Chieruzzi 精准地捕捉到了这一点:"AI 有时让你感觉自己像一只端着机关枪的猴子。"…
7 posts
AI 代码治理不是要从初级开发者和 AI 代理手中夺走工具,而是要安装guardrails,让每一发子弹都命中目标而不会造成附带损害。
机关枪已经发到每个人手里了。 AdEspresso 联合创始人、Unkover 首席 AI 官 Massimo Chieruzzi 精准地捕捉到了这一点:"AI 有时让你感觉自己像一只端着机关枪的猴子。"…
AI 编程对能够从任何混乱中恢复的精英团队有效。其他人则只能面对恐惧、失败的 CI 和被放弃的实验。差距不在模型本身。
观察两个团队使用同一个 AI 模型,你会看到两种完全不同的结果。 第一个团队让模型构建一个界面。输出接近但不够准确。样式偏离了 Figma 文件。状态管理触及了不该碰的文件。构建在本地通过但在 CI…
大多数团队尝试 AI 编程,代码上线后被 QA 驳回,然后放弃。问题不在于模型——而在于缺少让 AI 输出变得可信任的护栏。
大多数尝试 AI 编程的团队都遵循相同的轨迹。 他们一开始充满热情。模型在几分钟内生成了功能,他们把它发布了。QA 发现了一个 bug,于是他们发布了修复。QA 又发现了一个 bug,这次在一个本应毫无关联的 module 里。修复涉及十四个文件,QA 又发现了三个新问题。…
AI 编程工具擅长生成第一版。真正的工程挑战始于第四版——当团队需要改动某些东西而不破坏其他一切时。
每个 AI 编程演示都遵循相同的套路。有人向模型发出提示。一个能工作的应用凭空出现。观众印象深刻。 他们理应如此。速度是真实的。能力是真实的。有 AI 参与时,第一版确实发布得更快。 问题在于,第一版从来不是难点。 软件工程的成本不集中在初始创建阶段。它集中在第四、第五、第六次迭代:…
衡量 AI 生成代码质量的真正标准不是它在第一天能否运行,而是在第三十天你能否在不 rewrite 其他所有内容的情况下替换它。
关于 AI 生成代码质量的大多数讨论都聚焦于生成时的正确性。输出能编译吗?能通过测试吗?符合规格说明吗? 这些只是基本门槛。它们无法告诉你真正的成本。 真正的衡量标准是可替换性:当需求变化时,你能以多低的成本删除这个 module 并在相同的 contract 背后重新实现它? 如果答案是"轻而易举",那么 AI…
人工审查不一致,AI 审查更不可靠。AI 生成 codebase 唯一可扩展的防线是确定性 enforcement:让构建失败的规则,而非被忽视的建议。
对 AI 生成代码的标准建议是"仔细审查"。 这个建议正确但在规模化时毫无用处。 开发者审查 AI 输出时,在精力充沛、熟悉领域且没有时间压力的情况下能发现问题。在其他所有条件下——而这是大多数情况——问题会漏过。 用 AI 审查者来发现 AI…
这篇对 Stanford CS146S 的评析认为,它准确看到了 AI coding 的转向,但真正决定长期质量的仍是 AI architecture:系统是否可替换、可约束、可持续演进。
Stanford 的课程代码 ,课程全名是 The Modern Software Developer,由 Mihail Eric 授课,是一门在 2025 年秋季首次开设的课程。想看课程的官方概览和 syllabus 细节,可以直接访问官方课程站点…