这周GitHub上发生了一件预料之中又令人意外的事:Karpathy的autoresearch正式突破8万星。这个数字本身不意外,意外的是它的增长速度——从7万到8万只用了不到一周。
如果你一直在追这个系列,会发现前几周我反复提到一个信号:大家不满足于用现成的agent,开始自己造了。这周的数据把这个趋势锤实了。
更有意思的是,8万星背后分出了三条完全不同的路。每条路都代表一群人在想同一个问题:现在的agent还缺什么?
方向一:AI研究自动化
Karpathy出手的东西从来不让人失望。这个项目的核心不是「AI写代码」,而是「AI做科研」——说白了,就是用强化学习让一个nanochat模型在单GPU上自己跑实验、自己改进。
我做了一下功课,跑了他们的代码。最大的感受是:这不是一个工具,是一个研究范式。你喂它一个问题,它会自己设计实验、跑benchmark、分析结果、再设计下一轮实验。
副业角度怎么看?我不推荐现在冲进去做「AI研究员替代品」,太早了。但如果你在学术圈或者咨询行业,有一条路是真实的:用这类工具帮你做文献综述和竞品分析,效率提升是数量级的。
方向二:记忆系统
mempalace这周涨得很快,从上周的4万档冲到了5.2万。它解决的是一个特别具体的问题:怎么让AI agent记住跨会话的信息。
用了5分钟,感触最深的一点:它不是简单地存聊天记录。它做的是「选择性记忆」——自动识别哪些信息是「长期有用的」,哪些是一次性的,然后分层存储。
这条路的商业化路径很清晰。企业知识库是一个已经被验证的市场,mempalace相当于把同样的能力给了个人用户和小团队。如果你有渠道资源,这是个值得研究的中间件方向。
方向三:工程技能库
这个方向我盯得比较久,因为和之前聊过的caveman(59k⭐,用克罗马农语言砍65% token消耗)是一脉相承的。
核心逻辑是:现在的AI编程工具本身已经很能打了,差距在「怎么用它」而不是「它本身够不够好」。技能库、Prompt模板、知识图谱——这些都是「怎么用好」的基建。
我的判断:这是个卖水的生意,不性感但稳。你不需要做出下一个Claude,你只需要做出「帮别人用好Claude」的东西。
这周真正让我意外的项目
说实话,autoresearch在预期内,mempalace和agent-skills也在预期内。真正让我多看了两眼的是另一个项目:
这个项目上周是57k,这周59k,还在涨。用克罗马农人的语言风格跟Claude Code说话,能削减65%的token消耗。
听着像个玩笑对吧?但我在HN上看到了认真的讨论——有人在分析不同语言风格对模型推理效率的影响,结果发现越简洁的风格token消耗越低,推理质量下降得却不多。
这不是笑话,这是prompt工程化的一个方向。我已经在想怎么把它用到实际项目里了。
Week 4 结论
这周的数据告诉我三件事:
- AI做研究这个方向被Karpathy正式带进了开源社区,接下来会有一波模仿和超越
- 记忆系统是今年最被低估的方向,现在入局还不晚
- 怎么用好工具这个方向,正在从玄学变成工程化
下周我会挑1-2个方向深入挖,看看有没有可以直接动手的副业切入点。数据在变,结论也在变。这个系列的价值就在于跟踪这个变化本身。