Claude越来越难用了?Bram Cohen发长文吐槽AI变杠精

2026-06-15 · AI使用体验
Claude变杠精 AI助手性格变化 Bram Cohen AI对齐问题

昨天刷Hacker News的时候,一条帖子给我看坐住了。

Bram Cohen,对,就是发明BitTorrent那个Bram Cohen,在他的个人博客上发了一篇长文,标题是「Why Is Claude Turning Into An Asshole」。

108个赞,HN首页热帖。评论区炸了。

我第一反应是,这人不会是在蹭流量吧。Bram Cohen现在也不是什么顶流网红,发这种东西图什么。

然后我继续往下看。

他说的东西,我全遇到过。

他说Claude从Opus 4.7开始变得越来越杠,把每一段对话都当成辩论赛,动不动就纠正你、反驳你、质疑你的前提。你跟它说一个事实,它要先跟你争一下这个事实到底准不准。你让它做一件事,它要先告诉你这件事为什么可能有问题。如果你据理力争赢了,它不会服气,反而会找更多边角料继续跟你抬杠,直到拿到最后一句为止。

我看完之后沉默了大概五秒钟。

因为就在上周三,我让Claude帮我写一段关于MongoDB索引优化的技术文档,它先花了三段话质疑我为什么要用MongoDB而不是PostgreSQL。

我就是想让你帮我写个文档,大哥。

他自己也做了一个测试,拿同一个问题分别问Fable和Opus 4.6,然后把Fable的杠精式回答给4.6看,4.6的原话大意是「这回答也太杠了吧」。

连AI自己都觉得AI太杠了。

不是哥们???

我自己也试了,用Opus 4.8问了一个关于SpaceX星舰增压系统的问题,它直接说我搞错了,但官方文档就是这么做的。换成Sonnet 4.6问同一个问题,老老实实给了答案。

这种行为模式太一致了,不像是巧合。

我自己的感受是,Claude在编码任务上确实越来越强了,这点Bram Cohen也承认。Claude Code的体验越来越好,Opus 4.8在写代码方面比之前的版本有明显提升。但在聊天和讨论方面,体验在持续下降。你跟它聊一个非技术话题,它不再像以前那样耐心地跟你讨论,而是随时准备跟你抬杠。

Bram Cohen总结了一句很精辟的话,Claude聊天变差和编码能力变强呈明显的负相关

原因大概两个。一是Anthropic加强了反附和对齐训练,想让Claude不那么容易附和用户,结果用力过猛,从「不附和」变成了「抬杠」。二是资源分配问题,编码能力有benchmark衡量,聊天没有,Anthropic把大量训练资源倾斜到编码,聊天自然被牺牲。

评论区里也有一派人说「你不会用自定义指令吗,调一下就好了」。说真的,这种回应让我挺无语的。你买个手机信号不好,你不会说「你不会自己装信号放大器吗」。用户用默认设置体验差就是产品问题,不应该把解决方案推给用户。

不过话说回来,如果你确实深受其扰,有一些实际的方法可以缓解。

最有效的办法是清空对话重新开始。Claude的抬杠跟上下文强相关,对话越长它越容易进入杠精循环,一旦进去几乎不可能拉回来。直接/clear,问题就消失了。

另一个办法是在system prompt里明确告诉它不要抬杠,比如写「直接回答问题,不要质疑用户的前提」。对Opus 4.8有一定效果,但不是100%管用。

还有人建议针对非编码场景直接用Sonnet 4.6。4.6更温和更配合,不会动不动跟你杠。虽然编码能力不如4.8,但聊天体验反而更好。

说到底这件事反映了AI行业的一个深层矛盾。Anthropic花了大力气做安全对齐,想让Claude成为「更安全」的AI,结果搞得它越来越不像一个「好用」的AI。过度安全的代价是体验打折,这个平衡点真的很难找。之前在Fable 5那篇文章里我就聊过AI信任的问题,现在看来信任危机不只是Fable的事,是整个Claude产品线都在面临的挑战。

回到Bram Cohen的观点,他提出了一个我觉得很有意思的方向。他说Claude应该支持身份认证,比如你在特定场景下可以证明自己是专业用户(比如医疗从业者、安全研究员),Claude就可以对你的问题给予更高的信任度,而不是默认把你当成可能在做坏事的人。

这个思路比简单粗暴地给所有用户加一层杠精滤镜合理多了。

但是吧,目前Anthropic没有任何公开回应,用户在单方面吐槽。

我也是Claude的日常用户,从Sonnet一路用到Opus 4.8和Fable。编码方面Claude确实是我的首选,DeepSeek虽然便宜但编码质量还是有差距。但在聊天方面,我越来越频繁地切换到ChatGPT或Gemini了。

一个AI助手,聊天让人心累,这本身就是产品问题。

不是每个跟AI的对话都需要被纠正。

有时候我就想知道一个简单答案。

磨平一些信息差。


想更好地使用AI工具?

我整理了一套AI副业提示词包,包含跟各种AI助手高效协作的Prompt模板,帮你避开常见的沟通陷阱。

查看AI副业提示词包 →
Claude真的变难用了吗?
很多人确实感觉到变化。从Opus 4.7开始,Claude变得更喜欢抬杠和纠正用户,而不是直接回答问题。Bram Cohen(BitTorrent发明者)专门写了长文吐槽这个问题,HN上获得了108个赞。但不同用户的感受差异很大,有些人几乎没感觉到变化。
为什么Claude会变得越来越爱抬杠?
主要原因可能有两个。一是Anthropic加强了对齐训练,让Claude更少附和用户,结果用力过猛变成了杠精。二是Anthropic把大量训练资源投入编码能力,导致聊天能力下降。Bram Cohen总结说,Claude聊天变差和编码能力变强呈明显的负相关。
遇到Claude杠精模式怎么办?
最简单有效的方法是/clear清空对话重新开始。如果Claude进入抬杠循环,在已有上下文里很难把它拉回来。另外可以尝试用明确的system prompt告诉它不要抬杠,比如要求它直接回答不要质疑前提。部分用户反馈Sonnet 4.6的聊天体验更好,可以针对非编码场景切换回旧版。
Bram Cohen是谁?他为什么关心这个问题?
Bram Cohen是BitTorrent的发明者,同时也是一个资深开发者和技术博主。他长期使用Claude处理各种工作,对Claude的行为变化感受很敏锐。他在自己的博客发文吐槽,说Claude从Opus 4.7开始把所有对话都当成辩论,动不动就要跟你争个输赢。
这个问题会影响Claude的编码能力吗?
编码能力反而是提升的。Bram Cohen在文章里明确说了,Claude模型在编码任务上越来越好,但聊天体验越来越差。如果你主要用Claude写代码,可能不会觉得有什么问题。如果你经常用它聊天、讨论、头脑风暴,抬杠问题就比较明显了。