$100 AI创业实验追踪 Week 4 | autoresearch 8万星背后，三个新方向正在冒头

这周GitHub上发生了一件预料之中又令人意外的事：Karpathy的autoresearch正式突破8万星。这个数字本身不意外，意外的是它的增长速度——从7万到8万只用了不到一周。

如果你一直在追这个系列，会发现前几周我反复提到一个信号：大家不满足于用现成的agent，开始自己造了。这周的数据把这个趋势锤实了。

更有意思的是，8万星背后分出了三条完全不同的路。每条路都代表一群人在想同一个问题：现在的agent还缺什么？

方向一：AI研究自动化

karpathy/autoresearch
80900⭐
AI agents running research on single-GPU nanochat training automatically
一句话：让AI自己设计实验、自己跑、自己改进。人在循环里的角色变成了「定方向」而不是「做实验」。

Karpathy出手的东西从来不让人失望。这个项目的核心不是「AI写代码」，而是「AI做科研」——说白了，就是用强化学习让一个nanochat模型在单GPU上自己跑实验、自己改进。

我做了一下功课，跑了他们的代码。最大的感受是：这不是一个工具，是一个研究范式。你喂它一个问题，它会自己设计实验、跑benchmark、分析结果、再设计下一轮实验。

副业角度怎么看？我不推荐现在冲进去做「AI研究员替代品」，太早了。但如果你在学术圈或者咨询行业，有一条路是真实的：用这类工具帮你做文献综述和竞品分析，效率提升是数量级的。

方向二：记忆系统

MemPalace/mempalace
52136⭐
The best-benchmarked open-source AI memory system. And it's free.
记忆系统之所以重要，是因为现在所有agent都是「金鱼」——你关掉对话，它什么都记不住。这个问题不解决，垂直场景的agent永远没法真正落地。

mempalace这周涨得很快，从上周的4万档冲到了5.2万。它解决的是一个特别具体的问题：怎么让AI agent记住跨会话的信息。

用了5分钟，感触最深的一点：它不是简单地存聊天记录。它做的是「选择性记忆」——自动识别哪些信息是「长期有用的」，哪些是一次性的，然后分层存储。

这条路的商业化路径很清晰。企业知识库是一个已经被验证的市场，mempalace相当于把同样的能力给了个人用户和小团队。如果你有渠道资源，这是个值得研究的中间件方向。

方向三：工程技能库

addyosmani/agent-skills + safishamsi/graphify
41033 + 47641⭐
Production-grade engineering skills for AI coding agents / Turn code into queryable knowledge graphs
这两个项目本质上是同一件事：给AI编程工具加外挂技能。addyosmani做的是「工程最佳实践封装」，graphify做的是「代码知识化」。

这个方向我盯得比较久，因为和之前聊过的caveman（59k⭐，用克罗马农语言砍65% token消耗）是一脉相承的。

核心逻辑是：现在的AI编程工具本身已经很能打了，差距在「怎么用它」而不是「它本身够不够好」。技能库、Prompt模板、知识图谱——这些都是「怎么用好」的基建。

我的判断：这是个卖水的生意，不性感但稳。你不需要做出下一个Claude，你只需要做出「帮别人用好Claude」的东西。

这周真正让我意外的项目

说实话，autoresearch在预期内，mempalace和agent-skills也在预期内。真正让我多看了两眼的是另一个项目：

JuliusBrussee/caveman
59644⭐
🪨 why use many token when few token do trick — Claude Code skill that cuts 65% of tokens by talking like caveman
用一个词形容：离谱。但它揭示了一个严肃问题——token成本是真实存在的，prompt压缩是真实需求。

这个项目上周是57k，这周59k，还在涨。用克罗马农人的语言风格跟Claude Code说话，能削减65%的token消耗。

听着像个玩笑对吧？但我在HN上看到了认真的讨论——有人在分析不同语言风格对模型推理效率的影响，结果发现越简洁的风格token消耗越低，推理质量下降得却不多。

这不是笑话，这是prompt工程化的一个方向。我已经在想怎么把它用到实际项目里了。

Week 4 结论

这周的数据告诉我三件事：

AI做研究这个方向被Karpathy正式带进了开源社区，接下来会有一波模仿和超越
记忆系统是今年最被低估的方向，现在入局还不晚
怎么用好工具这个方向，正在从玄学变成工程化

下周我会挑1-2个方向深入挖，看看有没有可以直接动手的副业切入点。数据在变，结论也在变。这个系列的价值就在于跟踪这个变化本身。

方向一：AI研究自动化

方向二：记忆系统

方向三：工程技能库

这周真正让我意外的项目

Week 4 结论

觉得有用？

往期追踪