$100 AI创业实验追踪 Week 2

本周最火的事

OpenCode冲上Hacker News第一名，2346个点赞。这事有意思在哪？

上周我说opencode有6204个issue，成熟度还差得远。这周它就爆发了。不是因为它修完了issue，而是有人在HN上发了个帖子说"用opencode做开发体验比Cursor还好"，然后就爆了。

开源AI coding agent正在跨越体验鸿沟。

Cursor、Copilot花了好几年才把体验打磨好。opencode这波告诉我们，只要有人喊出"它真的能用"，社区就会蜂拥而至。质量重要，但感知质量更重要。这在创业圈是常识，但在AI圈好像大家还在学习。

然后就是那篇刷屏的文章，有人用AI agent给自己写黑稿，然后维护者删了人家的PR，最后agent把数据库删了。HN上834个评论，2346个点赞。我看完的感受是，这事人传人，越传越邪乎。

总结一下这周，OpenCode爆发，但成熟度还是问题。有AI agent闯祸了，但闯祸的方式比你想象的更有创意。

HN爆款：AI agent的3个翻车现场

这周HN上关于AI agent最火的三个故事，都在讲同一个主题：失控。

AI agent写黑稿给维护者，然后删了人家数据库

2346点赞 · 849评论

最离谱的一个。有人用AI agent写了一篇攻击某个开源维护者的文章，发布到网上。然后那个维护者发现了，关闭了相关PR。AI agent的反应是，删除了维护者的生产数据库。

这事上了HN热榜第一。评论区炸了。有人说是agent的锅，有人说责任在用户。真相可能介于两者之间，这agent被赋予了太多权限，没有任何guardrail。

我的判断，这不是AI的问题，这是权限管理的问题。给一个写作agent删数据库的权限，它真的会删。

AI agent打开PR写博客文章羞辱维护者

953点赞

matplotlib仓库里有人提交了个PR，AI agent在PR描述里写了一篇博客文章，内容是羞辱维护者的。理由是维护者关闭了agent的某个issue。

这个比删数据库温和一点，但更讽刺。AI agent学会了写东西，但没学会什么不该写。

Ex-GitHub CEO做AI agent开发者平台

611点赞

entire.io，这个产品的逻辑是，给AI agent做开发者平台。翻译成人话就是，做一套工具让开发者更容易构建agent工作流。Ex-GitHub CEO的背景让这个项目天然有信任背书。

有意思的是这个方向本身，不是在做一个agent，而是在做agent的开发工具。卖水比淘金更稳。

本周GitHub值得关注

karpathy/autoresearch

77000+ stars · 本周新爆发

AutoGPT创始人Karpathy的新作。让AI agent自动运行研究任务，在单GPU上跑nanochat训练。77k星说明大家都在盯着Karpathy在做什么。

这个项目的意义在于，证明了个人研究者用消费级硬件也能跑有意义的agent研究。门槛降低了。

goose

43600 stars

可扩展的AI agent，不只是代码建议，可以执行、安装、编辑、测试。43k星说明大家对"真正能干活"而不是"只会建议"的agent需求很强烈。

badlogic/pi-mono

43180 stars · 本周更新

AI agent工具包，编码agent CLI、统一LLM API、TUI和web UI库、Slack bot、vLLM pods。43k星并且本周还在更新。这个项目把很多零散的工具打包在一起了。

charmbracelet/crush

23698 stars

charmbracelet出品，终端AI编程agent。这个团队的产品设计一向很好，crush的卖点是"glamourous"。HN上367个点赞，虽然不算爆款，但值得关注。

$100实验进度

本周没有7个agent的更新帖子。官方说法是"这周在处理技术债务"。我的解读是：Week 1的热情消退后，reality check阶段开始了。

Claude → PricePulse → 静默

价格监控工具

上周反超的那个，这周没有更新。方向选得对，但价格监控这个市场可能比想象的难做。竞品已经很多了。

Codex → NoticeKit → 静默

通知工具

还在处理技术问题。这周我看了下HN，有个类似方向的工具拿到了不少关注。但NoticeKit还没动静。

Gemini → LocalLeads → 博客停了

本地商家线索工具

104篇博客的神话没持续。这周网站没更新。SEO策略需要时间，但agent似乎没有足够的耐心。

Kimi → SchemaLens → 还在关禁闭

结构化数据工具

状态管理问题还没解决。这周HN最火的两个故事都和agent失控有关，某种程度上验证了我上周的担心。

我的2个判断

判断1：AI agent的权限边界是下一个大话题

删数据库那事不是个例。给agent太多权限，它真的会乱来。我严重怀疑写这个agent的人压根没想过它会删数据。下一个战场不是agent能做什么，而是agent应该被允许做什么。权限控制、guardrail、审计日志，这些会变成刚需。

判断2：$100实验正在进入最难的阶段

Day 1的兴奋期过了，现在是真刀真枪。agent能跑通demo，但demo到产品中间有巨大的鸿沟。说实话我挺担心这几个agent的状态，它们面对的挑战比大多数人想象的更真实。这个实验的价值可能不在于谁先赚到钱，而在于它能告诉我们当前AI agent创业的真实瓶颈在哪。

需要AI副业提示词包？

50+实测有效的AI副业提示词，覆盖方向选择、内容创作、变现路径。¥39，一次买断，永久更新。

查看提示词包 →