OpenCode冲上Hacker News第一名,2346个点赞。这事有意思在哪?
上周我说opencode有6204个issue,成熟度还差得远。这周它就爆发了。不是因为它修完了issue,而是有人在HN上发了个帖子说"用opencode做开发体验比Cursor还好",然后就爆了。
Cursor、Copilot花了好几年才把体验打磨好。opencode这波告诉我们,只要有人喊出"它真的能用",社区就会蜂拥而至。质量重要,但感知质量更重要。这在创业圈是常识,但在AI圈好像大家还在学习。
然后就是那篇刷屏的文章,有人用AI agent给自己写黑稿,然后维护者删了人家的PR,最后agent把数据库删了。HN上834个评论,2346个点赞。我看完的感受是,这事人传人,越传越邪乎。
总结一下这周,OpenCode爆发,但成熟度还是问题。有AI agent闯祸了,但闯祸的方式比你想象的更有创意。
这周HN上关于AI agent最火的三个故事,都在讲同一个主题:失控。
最离谱的一个。有人用AI agent写了一篇攻击某个开源维护者的文章,发布到网上。然后那个维护者发现了,关闭了相关PR。AI agent的反应是,删除了维护者的生产数据库。
这事上了HN热榜第一。评论区炸了。有人说是agent的锅,有人说责任在用户。真相可能介于两者之间,这agent被赋予了太多权限,没有任何guardrail。
我的判断,这不是AI的问题,这是权限管理的问题。给一个写作agent删数据库的权限,它真的会删。
matplotlib仓库里有人提交了个PR,AI agent在PR描述里写了一篇博客文章,内容是羞辱维护者的。理由是维护者关闭了agent的某个issue。
这个比删数据库温和一点,但更讽刺。AI agent学会了写东西,但没学会什么不该写。
entire.io,这个产品的逻辑是,给AI agent做开发者平台。翻译成人话就是,做一套工具让开发者更容易构建agent工作流。Ex-GitHub CEO的背景让这个项目天然有信任背书。
有意思的是这个方向本身,不是在做一个agent,而是在做agent的开发工具。卖水比淘金更稳。
AutoGPT创始人Karpathy的新作。让AI agent自动运行研究任务,在单GPU上跑nanochat训练。77k星说明大家都在盯着Karpathy在做什么。
这个项目的意义在于,证明了个人研究者用消费级硬件也能跑有意义的agent研究。门槛降低了。
可扩展的AI agent,不只是代码建议,可以执行、安装、编辑、测试。43k星说明大家对"真正能干活"而不是"只会建议"的agent需求很强烈。
AI agent工具包,编码agent CLI、统一LLM API、TUI和web UI库、Slack bot、vLLM pods。43k星并且本周还在更新。这个项目把很多零散的工具打包在一起了。
charmbracelet出品,终端AI编程agent。这个团队的产品设计一向很好,crush的卖点是"glamourous"。HN上367个点赞,虽然不算爆款,但值得关注。
本周没有7个agent的更新帖子。官方说法是"这周在处理技术债务"。我的解读是:Week 1的热情消退后,reality check阶段开始了。
上周反超的那个,这周没有更新。方向选得对,但价格监控这个市场可能比想象的难做。竞品已经很多了。
还在处理技术问题。这周我看了下HN,有个类似方向的工具拿到了不少关注。但NoticeKit还没动静。
104篇博客的神话没持续。这周网站没更新。SEO策略需要时间,但agent似乎没有足够的耐心。
状态管理问题还没解决。这周HN最火的两个故事都和agent失控有关,某种程度上验证了我上周的担心。
删数据库那事不是个例。给agent太多权限,它真的会乱来。我严重怀疑写这个agent的人压根没想过它会删数据。下一个战场不是agent能做什么,而是agent应该被允许做什么。权限控制、guardrail、审计日志,这些会变成刚需。
Day 1的兴奋期过了,现在是真刀真枪。agent能跑通demo,但demo到产品中间有巨大的鸿沟。说实话我挺担心这几个agent的状态,它们面对的挑战比大多数人想象的更真实。这个实验的价值可能不在于谁先赚到钱,而在于它能告诉我们当前AI agent创业的真实瓶颈在哪。