传统的AI Agent是怎么工作的?你给它一个任务,它用同一个模型从头做到尾。
简单任务也用大模型,浪费。复杂任务也用小模型,崩。
OpenSquilla做的事是「智能路由」。它的核心思路是:
简单问题 → 分配给便宜的小模型处理
复杂问题 → 分配给贵但能力强的大模型
每个任务 → 自动选择最合适的模型和参数
官网说它有4层路由分级,3层沙箱安全隔离,还能记忆上下文。架构叫Microkernel——类似操作系统的微内核思路,核心只做最小化的调度,其他功能都是插拔式的插件。
支持的模型包括OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、Qwen等等。基本上涵盖了所有主流LLM提供商。
技术栈是Python 3.12+,装起来也简单,官方提供了一个bash脚本搞定。
好,现在说重点。这种「省Token」的工具,赚钱逻辑在哪里?
答案很简单:谁在花钱用AI Agent?企业在花。开发者在花。做AI应用的人在花。
而这群人最大的痛点是什么?成本。Token费用每个月都在跑,月底一对账单就心疼。
如果你能帮他们省下60-80%的Token成本,哪怕你只收省下部分的30%作为服务费,对他们来说也是净赚。
具体怎么落地?我列了3种普通人可以做的方向:
目标客户:中小企业、创业公司、有AI需求但没有专职AI工程师的团队
报价参考:¥3,000-8,000/次 + 维护费 ¥1,000/月
很多公司想用AI Agent来处理客服、数据分析、文档处理这类重复性工作。但他们不知道怎么搭、懒得维护、不想养人。
你可以帮他们做这么几件事:评估业务场景看适不适合,在他们的服务器上把OpenSquilla跑起来,配置好路由策略,再对接业务流程。最后收一个日常维护费。
第一个客户可能不好找。我的建议是先免费帮一两个朋友的公司部署,积累案例和口碑。拿到真实反馈之后,再去做推广。
目标客户:律所、医疗机构、电商公司、内容团队
报价参考:¥5,000-20,000/套 + 年费 ¥2,000-8,000/年
通用方案不好卖,行业方案才好卖。
比如,电商公司每天要用AI处理:商品描述生成、用户评价分析、客服对话、库存预警。这些任务里,有80%是简单重复的query,完全可以用小模型处理。
你针对一个行业做深度配置,把路由策略、Prompt模板、专属插件都打包好,形成一套「开箱即用」的解决方案。
这个方向的壁垒在哪里?行业Know-How。你对这个行业越了解,你能配置的Prompt和规则就越精准,客户就越愿意付钱。
选行业的时候有个小技巧:选那些Token消耗量大、但AI应用还处于早期的行业。量大意味着优化空间大,早期意味着竞争少。
目标客户:OpenSquilla的终端用户
报价参考:¥49-199/个插件,¥99-399/套模板包
OpenSquilla是一个微内核架构,插件开发门槛很低。官方文档说「5行代码就能写一个插件」。
你可以开发针对特定场景的插件,比如:
专门处理合同审查的插件
专门对接小红书API的插件
专门做SEO文章生成的插件
然后把这些插件放到GitHub上开源引流,同时在 Gumroad 或者自己网站上卖高级版。
这种模式的优点是:边际成本接近零。一个插件开发完,卖100份和卖10000份,成本几乎一样。
缺点是:需要一定的开发能力,而且要找到真正的需求点。
OpenSquilla这个项目,现在入场有优势。
首先它还处于非常早期。v0.1.0的版本,说明还有很多功能在开发中。这意味着先入场的人有先发优势——等它成熟了,大厂直接复制,你就没机会了。
然后它的定位很清晰。「Token高效」这个点,直击AI应用落地的最大痛点——成本。比起「功能更强」、「速度更快」,「更省钱」是客户最愿意掏钱的理由。
最后,GitHub 2天99星的速度,说明市场已经在用脚投票了。这种增速不是偶然的,是有人在认真做产品。
OpenSquilla的官网上有一个「Free Tokens」申请入口。用户可以申请免费的Token额度来试用。这意味着项目方在同时推进开源和商业化。开源版本免费用,想用更多或者要企业级服务就付费。这是SaaS的经典打法。
对于普通人来说,现在最好的策略是这样的:
先把OpenSquilla跑起来,自己用一遍,搞清楚它的能力和边界。然后选一个你想服务的行业或场景,开始做案例。等有了案例,再去找客户。这个顺序不能颠倒。
最坏的情况是什么?项目方自己做托管服务,自己做行业方案。那你就做一个「用OpenSquilla做定制开发」的自由职业者,专门接项目做实施。这也是一条路。
最好情况是什么?AI Agent的Token优化需求爆发,OpenSquilla成为这个领域的事实标准。你早早在GitHub上活跃、做插件的人,直接享受这个领域快速发展的红利。
我不知道哪个情况会发生。但我知道一件事:Token成本问题不会消失,只会在AI应用越来越普及的时候变得越来越重要。
提前占位,总比事后拍大腿强。