上周五OpenRouter宣布融了1.13亿美元,B轮,CapitalG领投,NVIDIA、Snowflake、Databricks都跟了。
说实话这新闻本身没那么震撼,AI赛道融资家常便饭。但有一个数据让我盯着看了很久,OpenRouter的周处理量从半年前的5万亿token涨到了25万亿token。涨了5倍。服务800多万开发者,接了400多个模型。
这说明一件事,企业在用AI这件事上已经过了「试试看」的阶段,进入「全面铺开」的阶段了。
而全面铺开以后呢?API账单开始让人肉疼了。
我前两个月接触了一家做跨境电商的创业公司,他们团队15个人,每天用Claude和GPT写产品描述、处理客服消息、做市场分析。我帮他们拉了一下API账单,月费68000块。
老板看着账单说了一句,「我知道AI好用,但这价格再涨下去我就要回去用人工了。」
我后来帮他们做了一件事,把API调用做了路由优化,简单说就是让简单的任务用便宜的模型,复杂的任务才用贵的模型。一个月后他们的API账单从68000降到了38000。省了将近一半。
他们付了我5000块的实施费,外加每月1500的维护费。
这件事让我意识到,AI API路由优化可能是一个被严重低估的副业方向。
企业AI花冤枉钱的真相
你想想看,一个公司内部的AI使用场景大概分几类。写邮件、总结会议纪要、做数据整理,这些是简单任务。写代码、做复杂的业务分析、处理客服投诉,这些是中等任务。做产品设计、写架构方案、做战略决策,这些是复杂任务。
问题在于,大多数公司不管什么任务,全用一个模型。要么全用Claude Opus,要么全用GPT-4o。就像你出门买菜开一辆法拉利,接孩子上学也开法拉利,下楼拿快递还是开法拉利。不是法拉利不好,是没必要。
我自己也踩过这个坑。去年刚开始大量用AI的时候,所有事都扔给GPT-4o,一个月API费两千多块。后来我发现,80%的日常任务用GPT-4o-mini或者DeepSeek就能搞定,效果差别不大。现在我的月费降到了三百多。
这还只是个人使用。企业规模一上去,浪费是指数级的。WSJ最近有篇报道说,美国企业开始限制AI使用了,原因就是成本飙升。Axios也写了篇「AI sticker shock」,讲的是同一件事,企业的AI账单开始失控。
但企业又不可能不用AI,因为竞争对手在用。那怎么办?只能在「怎么用得更聪明」上做文章了。
这就是AI API路由优化的机会所在。
这活到底怎么赚钱
先说说我自己的收入情况,过去六周我做了四单,给大家看看明细。
第一单,跨境电商公司模型路由。 5000块实施费,月维护1500。这家就是上面说的那家,月API费从68000降到38000。核心操作很简单,写商品描述这种简单任务路由到DeepSeek,客服对话路由到Claude Sonnet,只有写代码才用Claude Opus。
第二单,SaaS公司多模型接入。 3000块实施费,月维护800。他们原本只接了Anthropic的API,想加OpenAI的模型但开发团队没空做。我帮他们搭了一个统一的API网关,两个供应商的模型通过同一个接口调用,开发团队不用改任何代码。
第三单,AI创业公司token用量优化。 4000块实施费,月维护1200。这家公司做了个AI客服产品,每天有几万次API调用,但很多调用是重复的或者可以缓存的。我帮他们做了请求缓存和结果去重,token用量降了35%。
第四单,律师事务所AI合规部署。 2500块实施费,月维护600。律所对数据安全特别敏感,不想把文件发给OpenAI或者Anthropic。我帮他们搭了一个本地化的模型路由方案,简单任务用本地部署的DeepSeek,敏感任务才走专线API。
六周合计,实施费14500,月维护费合计4100。如果这些客户续约,光是月维护费就够我付房租了。
跟之前写的省token那个方向不一样,API路由优化不只是在客户端省钱,而是在系统层面做智能调度。复杂度高一点,但单价也高,而且客户的粘性强得多。
需要什么工具和技术
说真的,门槛没有想象中高。核心工具就三个,
LiteLLM。 这是一个开源的AI API代理服务器,GitHub上快5万星了。它做的事情很简单,把100多个不同的AI模型API统一成一个OpenAI格式的接口。安装也就一行命令,配置也不复杂。对于只想做基础路由的人来说,LiteLLM够用了。
OpenRouter。 如果不想自己搭路由,可以直接用OpenRouter。它本身就是做模型路由的,400多个模型通过一个API调用,还有智能路由功能,可以自动根据成本和延迟选择最优模型。OpenRouter刚融了1.13亿美元,说明资本看好这个方向。很多企业其实不需要自己搭系统,只需要有人帮他们把现有的API调用迁移到OpenRouter上就行了。
自建路由方案。 如果客户对数据安全有要求(比如律所、金融机构),就需要自建方案。我通常用LiteLLM做底层,外面套一层自己写的路由逻辑。路由规则不复杂,就是根据任务类型、token数量、响应时间要求来选择模型。用Claude Code或者Cursor写这些路由逻辑,半天就搞定了。
如果你连LiteLLM都不会装,那就从最简单的开始。先用OpenRouter的API帮客户替换掉现有的直连API,光是这一步就能省20-30%的钱,因为OpenRouter本身就能在不同供应商之间比价。
完整的操作流程
这是我跑通以后总结出来的标准流程,
第一步,找到目标客户。 什么类型的企业最需要?简单判断标准就是,他们在用AI,但不是技术公司,没有专门的AI工程师。跨境电商、SaaS创业公司、律师事务所、会计师事务所、小型金融机构、内容营销公司。找到以后,问他们一个问题,「你们每个月的AI API费用大概是多少?」。如果答案是五千以上,就有优化空间。
第二步,做一次免费的API账单审计。 这一步特别关键,也是你拿单的利器。让客户导出他们的API使用日志,你分析一下里面有多少调用可以用便宜模型替代。绝大多数企业自己从来没做过这个分析。你把分析结果拿给他们看,「你们70%的调用只需要用DeepSeek就够了,没必要全走Claude Opus,每个月至少能省40%」。这个数据一摆出来,成交率非常高。
第三步,设计路由方案。 根据客户的具体使用场景,设计一个模型路由策略。哪些任务用什么模型,什么情况做fallback,什么情况做缓存。写成一个方案文档给客户确认。
第四步,部署和测试。 用LiteLLM或者OpenRouter搭好路由系统,先在测试环境跑几天。重点关注三点,响应质量有没有下降(对比测试很重要),延迟有没有增加,成本有没有真的降下来。质量不能降是底线,否则客户不会续约。
第五步,正式切换和监控。 确认没问题以后正式切到新的路由系统,前一周重点盯监控。我一般会给客户搭一个简单的仪表盘,实时显示每个模型的调用量、成本和质量评分。客户看到数字在跳动,会特别有安全感。
第六步,长期优化。 路由方案不是一成不变的。新的模型不断出来,价格也在变化,过一两个月就要重新评估一下路由策略。这也是为什么月维护费是合理的,因为优化是一个持续的过程。
变现路径不止一条
做了一段时间以后,我发现这个方向的变现路径还挺丰富的,不止是按单收费。
路径一,实施费加月维护。 就是我上面说的模式,适合个人起步。一单2000-5000实施费,月维护500-1500。积累五到八个客户,光月维护费就能过万。
路径二,做行业模板。 比如你发现跨境电商公司的使用场景高度相似,就做一个「跨境电商AI路由模板」,以后同类客户直接套用,实施周期从一周缩短到两天。模板本身也可以卖,定价几百到一千。
路径三,做代理。 有些企业不想自建,想直接用托管服务。你可以搭一个多租户的路由平台,帮多个企业同时做模型路由优化,按调用量收费。这个天花板高很多,但需要一定的运维能力。
我个人是从路径一开始的,现在正在往路径二过渡。路径三暂时还没精力做,但觉得是个不错的方向。
踩过的坑
这活看着简单,但真做起来也踩了不少坑,
坑一,质量对比一定要做。 我第一单犯了一个错误,直接把所有简单任务切到便宜模型,没有做质量对比测试。结果客户一周后来找我,说「客服回复的质量变差了」。后来我老老实实做了A/B测试,把100条真实请求分别用两个模型跑一遍,对比输出质量,再根据结果调整路由规则。这个步骤绝对不能省。
坑二,不要低估迁移成本。 有的客户代码里硬编码了Anthropic的SDK,要改成统一的API格式需要改代码。有些客户甚至不知道自己代码里有多少地方调用了AI API。接单之前一定要先评估迁移工作量,不然实施费收少了,自己做亏本买卖。
坑三,数据安全是红线。 金融、法律、医疗这些行业的客户对数据安全特别敏感,有些甚至要求API请求不能走公网。遇到这类客户,要做好本地化部署的准备,提前评估自己有没有这个能力。如果搞不定,就不要接,宁可少赚一笔也不能砸口碑。
坑四,模型价格变化很快。 今年API价格几乎每个月都在变,DeepSeek降价、GPT-4o-mini出来、Anthropic调整定价策略。你的路由策略也要跟着变。月维护费的一部分价值就在这里,帮客户持续跟踪和调整。
如果你也想试试
如果你看到这里觉得这事自己能干,我建议从这两步开始。
第一,装一个LiteLLM,自己用一周。把你自己平时用的AI API全接到LiteLLM上,体验一下统一接口和模型切换的感觉。自己先跑通了,才好给客户推荐。
第二,找一家在用AI的小公司,帮他们做一个免费的API账单审计。这个动作的转化率非常高,因为大部分企业从来没有看过自己的API账单明细。你帮他们分析出来的结果本身就有价值,而且能直接展示你能做什么。
这个赛道的窗口期还很长。因为企业在AI上的投入只会越来越多,API成本只会越来越高,而大多数非技术公司根本没有能力自己优化模型调用。就像云计算早期,企业需要有人帮他们做云成本优化一样,AI时代也需要有人帮他们做模型成本优化。
OpenRouter融了1.13亿,LiteLLM快5万星,这个方向已经起来了。但做实施服务、帮企业落地的人还很少。信息差还在。
磨平一些信息差。