Simon Willison前几天在Heavybit播客里说了一句话,我看完之后愣了好一会儿。

他说的是:

我现在让Claude Code写一个JSON API接口,跑个SQL返回结果,这种活儿我根本不去审查代码了。我知道它会做对,加测试,加文档,都会做对。但我没有看那些代码。这玩意儿直接上生产,负责任吗?

如果你不知道Simon是谁--他是Datasette的作者,Python圈子里资深的开发者,在AI编程这个话题上算是说真话的那类人。他不是那种卖课的,也不是疯狂吹AI会取代程序员的营销号。

所以他说的这番话,我才觉得有意思。

两个世界正在合并

事情是这样的。vibe coding这个概念,大概是去年开始火起来的,指的是那种完全不管代码怎么写的,直接让AI帮你生成,你就是个指挥官。典型用户画像:不是程序员,要做个什么东西,直接告诉AI,AI给你吐出来,好用就用,不好用就让它改。

agentic engineering呢,是Simon自己发明的一个词,用来描述专业的程序员怎么用AI--你不是完全放手,而是在用AI放大你的能力,还是要懂安全、懂可维护性、懂性能,只是你跑得更快了。

这两个东西,按理说应该是完全不同的世界。一个是玩票,一个是专业。

但Simon说了一个让人不安的事实:

这两个东西,已经开始在我自己的工作中融合了。这让我非常不安。

不安在哪里?不安在于,随着AI编程工具越来越可靠,Simon发现自己已经不再逐行审查AI生成的代码了。即便是生产级别的项目。

一个没有职业声誉的工具

Simon提到了一个很核心的点:

他说,我信任另一个团队给我提供的图片处理服务,我不会去读他们的每一行代码。我会看文档,用它来处理图片,然后如果出问题了,我才会去看他们的Git仓库。

所以我现在也在用同样的方式对待AI编程工具。

听起来合理对吧?但问题来了:

Claude Code没有职业声誉。它没办法为它写的东西承担后果。但它一直在证明自己——每次都把那些常规的活儿做对,而且风格还是我喜欢的。

这话翻译成人话就是:我知道这东西可靠,但我没法让它为bug负责。出了事,只有我一个人站在那儿。

这种信任,说到底是一种偏差正常化--每次AI没出问题,你就多信它一点,直到有一天你在错误的时间信任了它,然后被坑。

评估软件的方式变了

Simon还提到了一个我特别有共鸣的点:

以前你想判断一个GitHub仓库质量高不高,你会去看commit数量、看readme质量、看有没有自动化测试。这些信号基本上是准的--投入了这么多心血的项目,大概率靠谱。

现在呢?

你可以在半小时内,用AI生成一个拥有100次commit、漂亮readme、完整测试用例的GitHub仓库。这看起来和你花三个月精心维护的项目一模一样。

Simon说了一句很诚实的话:

我自己做的项目,我都看不出来质量如何了。

所以他提了一个新的判断标准--不是测试覆盖率,不是文档多漂亮,而是:有没有人真的用过。

一个vibe coding出来的东西,如果你自己用了两个星期每天都在用,这个信号比什么都值钱。

瓶颈已经转移了

如果你能把代码产量从每天200行提升到2000行,什么会坏掉?

Simon提到了Anthropic设计负责人Jenny Wen的一个观点:现有的设计流程,是建立在「设计搞错代价很高」这个前提上的--你设计搞错了,工程师花三个月做出来,浪费巨大。所以设计阶段要反复推敲,尽量做对。

但如果设计和实现的周期大幅缩短呢?设计错了代价变低了,那设计流程本身是不是可以更大胆一些?

这个逻辑延伸到整个软件工程生命周期的每一个环节。代码审查、测试、部署文档--所有这些环节的假设前提都是「写代码很慢」。现在这个前提不成立了,整个体系都需要重新思考。

想想就刺激。

为什么我还是不怕

Simon最后说了一句让我印象很深的话:

我跟这些AI工具对话的时候,我一直在被提醒,我们做的事情有多难。生产软件是一件极其困难的事情。给我世界上所有的AI工具,我们要实现的东西依然真的很难。

他提了Matthew Yglesias的一个观点,说得更好:

我不想vibe coding。我想要专业的软件公司用AI编程辅助来做更多、更好、更便宜的软件,然后卖给我。

就像我可以看YouTube视频自己安装管道,但我还是想雇一个水管工。

这种「我不需要成为水管工,但我需要一个好用的水管系统」的感觉,太真实了。

我的感受

说实话,看完Simon这篇文章,我最大的感受不是恐惧,是一种奇怪的释然。

vibe coding和agentic engineering的边界在模糊,这件事让我不舒服。但不舒服的原因,可能不是因为AI太强了,而是因为我们之前对「写代码」这件事的定义,可能一直太窄了。

写代码的门槛确实变低了。但「写好代码」的门槛,可能反而变高了--因为你需要更多的判断力,来决定什么时候信任AI,什么时候不信任,什么时候需要亲自review,什么时候可以放手。

这不是一个技术问题。这是一个关于「在AI时代,专业的意思是什么」的问题。

Simon说他还在消化这个变化。我们大概也是。