上周五OpenRouter宣布融了1.13亿美元,B轮,CapitalG领投,NVIDIA、Snowflake、Databricks都跟了。

说实话这新闻本身没那么震撼,AI赛道融资家常便饭。但有一个数据让我盯着看了很久,OpenRouter的周处理量从半年前的5万亿token涨到了25万亿token。涨了5倍。服务800多万开发者,接了400多个模型。

这说明一件事,企业在用AI这件事上已经过了「试试看」的阶段,进入「全面铺开」的阶段了。

而全面铺开以后呢?API账单开始让人肉疼了。

我前两个月接触了一家做跨境电商的创业公司,他们团队15个人,每天用Claude和GPT写产品描述、处理客服消息、做市场分析。我帮他们拉了一下API账单,月费68000块。

老板看着账单说了一句,「我知道AI好用,但这价格再涨下去我就要回去用人工了。」

我后来帮他们做了一件事,把API调用做了路由优化,简单说就是让简单的任务用便宜的模型,复杂的任务才用贵的模型。一个月后他们的API账单从68000降到了38000。省了将近一半。

他们付了我5000块的实施费,外加每月1500的维护费。

这件事让我意识到,AI API路由优化可能是一个被严重低估的副业方向。

企业AI花冤枉钱的真相

你想想看,一个公司内部的AI使用场景大概分几类。写邮件、总结会议纪要、做数据整理,这些是简单任务。写代码、做复杂的业务分析、处理客服投诉,这些是中等任务。做产品设计、写架构方案、做战略决策,这些是复杂任务。

问题在于,大多数公司不管什么任务,全用一个模型。要么全用Claude Opus,要么全用GPT-4o。就像你出门买菜开一辆法拉利,接孩子上学也开法拉利,下楼拿快递还是开法拉利。不是法拉利不好,是没必要。

我自己也踩过这个坑。去年刚开始大量用AI的时候,所有事都扔给GPT-4o,一个月API费两千多块。后来我发现,80%的日常任务用GPT-4o-mini或者DeepSeek就能搞定,效果差别不大。现在我的月费降到了三百多。

这还只是个人使用。企业规模一上去,浪费是指数级的。WSJ最近有篇报道说,美国企业开始限制AI使用了,原因就是成本飙升。Axios也写了篇「AI sticker shock」,讲的是同一件事,企业的AI账单开始失控。

但企业又不可能不用AI,因为竞争对手在用。那怎么办?只能在「怎么用得更聪明」上做文章了。

这就是AI API路由优化的机会所在。

这活到底怎么赚钱

先说说我自己的收入情况,过去六周我做了四单,给大家看看明细。

第一单,跨境电商公司模型路由。 5000块实施费,月维护1500。这家就是上面说的那家,月API费从68000降到38000。核心操作很简单,写商品描述这种简单任务路由到DeepSeek,客服对话路由到Claude Sonnet,只有写代码才用Claude Opus。

第二单,SaaS公司多模型接入。 3000块实施费,月维护800。他们原本只接了Anthropic的API,想加OpenAI的模型但开发团队没空做。我帮他们搭了一个统一的API网关,两个供应商的模型通过同一个接口调用,开发团队不用改任何代码。

第三单,AI创业公司token用量优化。 4000块实施费,月维护1200。这家公司做了个AI客服产品,每天有几万次API调用,但很多调用是重复的或者可以缓存的。我帮他们做了请求缓存和结果去重,token用量降了35%。

第四单,律师事务所AI合规部署。 2500块实施费,月维护600。律所对数据安全特别敏感,不想把文件发给OpenAI或者Anthropic。我帮他们搭了一个本地化的模型路由方案,简单任务用本地部署的DeepSeek,敏感任务才走专线API。

六周合计,实施费14500,月维护费合计4100。如果这些客户续约,光是月维护费就够我付房租了。

之前写的省token那个方向不一样,API路由优化不只是在客户端省钱,而是在系统层面做智能调度。复杂度高一点,但单价也高,而且客户的粘性强得多。

需要什么工具和技术

说真的,门槛没有想象中高。核心工具就三个,

LiteLLM。 这是一个开源的AI API代理服务器,GitHub上快5万星了。它做的事情很简单,把100多个不同的AI模型API统一成一个OpenAI格式的接口。安装也就一行命令,配置也不复杂。对于只想做基础路由的人来说,LiteLLM够用了。

OpenRouter。 如果不想自己搭路由,可以直接用OpenRouter。它本身就是做模型路由的,400多个模型通过一个API调用,还有智能路由功能,可以自动根据成本和延迟选择最优模型。OpenRouter刚融了1.13亿美元,说明资本看好这个方向。很多企业其实不需要自己搭系统,只需要有人帮他们把现有的API调用迁移到OpenRouter上就行了。

自建路由方案。 如果客户对数据安全有要求(比如律所、金融机构),就需要自建方案。我通常用LiteLLM做底层,外面套一层自己写的路由逻辑。路由规则不复杂,就是根据任务类型、token数量、响应时间要求来选择模型。用Claude Code或者Cursor写这些路由逻辑,半天就搞定了。

如果你连LiteLLM都不会装,那就从最简单的开始。先用OpenRouter的API帮客户替换掉现有的直连API,光是这一步就能省20-30%的钱,因为OpenRouter本身就能在不同供应商之间比价。

完整的操作流程

这是我跑通以后总结出来的标准流程,

第一步,找到目标客户。 什么类型的企业最需要?简单判断标准就是,他们在用AI,但不是技术公司,没有专门的AI工程师。跨境电商、SaaS创业公司、律师事务所、会计师事务所、小型金融机构、内容营销公司。找到以后,问他们一个问题,「你们每个月的AI API费用大概是多少?」。如果答案是五千以上,就有优化空间。

第二步,做一次免费的API账单审计。 这一步特别关键,也是你拿单的利器。让客户导出他们的API使用日志,你分析一下里面有多少调用可以用便宜模型替代。绝大多数企业自己从来没做过这个分析。你把分析结果拿给他们看,「你们70%的调用只需要用DeepSeek就够了,没必要全走Claude Opus,每个月至少能省40%」。这个数据一摆出来,成交率非常高。

第三步,设计路由方案。 根据客户的具体使用场景,设计一个模型路由策略。哪些任务用什么模型,什么情况做fallback,什么情况做缓存。写成一个方案文档给客户确认。

第四步,部署和测试。 用LiteLLM或者OpenRouter搭好路由系统,先在测试环境跑几天。重点关注三点,响应质量有没有下降(对比测试很重要),延迟有没有增加,成本有没有真的降下来。质量不能降是底线,否则客户不会续约。

第五步,正式切换和监控。 确认没问题以后正式切到新的路由系统,前一周重点盯监控。我一般会给客户搭一个简单的仪表盘,实时显示每个模型的调用量、成本和质量评分。客户看到数字在跳动,会特别有安全感。

第六步,长期优化。 路由方案不是一成不变的。新的模型不断出来,价格也在变化,过一两个月就要重新评估一下路由策略。这也是为什么月维护费是合理的,因为优化是一个持续的过程。

变现路径不止一条

做了一段时间以后,我发现这个方向的变现路径还挺丰富的,不止是按单收费。

路径一,实施费加月维护。 就是我上面说的模式,适合个人起步。一单2000-5000实施费,月维护500-1500。积累五到八个客户,光月维护费就能过万。

路径二,做行业模板。 比如你发现跨境电商公司的使用场景高度相似,就做一个「跨境电商AI路由模板」,以后同类客户直接套用,实施周期从一周缩短到两天。模板本身也可以卖,定价几百到一千。

路径三,做代理。 有些企业不想自建,想直接用托管服务。你可以搭一个多租户的路由平台,帮多个企业同时做模型路由优化,按调用量收费。这个天花板高很多,但需要一定的运维能力。

我个人是从路径一开始的,现在正在往路径二过渡。路径三暂时还没精力做,但觉得是个不错的方向。

踩过的坑

这活看着简单,但真做起来也踩了不少坑,

坑一,质量对比一定要做。 我第一单犯了一个错误,直接把所有简单任务切到便宜模型,没有做质量对比测试。结果客户一周后来找我,说「客服回复的质量变差了」。后来我老老实实做了A/B测试,把100条真实请求分别用两个模型跑一遍,对比输出质量,再根据结果调整路由规则。这个步骤绝对不能省。

坑二,不要低估迁移成本。 有的客户代码里硬编码了Anthropic的SDK,要改成统一的API格式需要改代码。有些客户甚至不知道自己代码里有多少地方调用了AI API。接单之前一定要先评估迁移工作量,不然实施费收少了,自己做亏本买卖。

坑三,数据安全是红线。 金融、法律、医疗这些行业的客户对数据安全特别敏感,有些甚至要求API请求不能走公网。遇到这类客户,要做好本地化部署的准备,提前评估自己有没有这个能力。如果搞不定,就不要接,宁可少赚一笔也不能砸口碑。

坑四,模型价格变化很快。 今年API价格几乎每个月都在变,DeepSeek降价、GPT-4o-mini出来、Anthropic调整定价策略。你的路由策略也要跟着变。月维护费的一部分价值就在这里,帮客户持续跟踪和调整。

如果你也想试试

如果你看到这里觉得这事自己能干,我建议从这两步开始。

第一,装一个LiteLLM,自己用一周。把你自己平时用的AI API全接到LiteLLM上,体验一下统一接口和模型切换的感觉。自己先跑通了,才好给客户推荐。

第二,找一家在用AI的小公司,帮他们做一个免费的API账单审计。这个动作的转化率非常高,因为大部分企业从来没有看过自己的API账单明细。你帮他们分析出来的结果本身就有价值,而且能直接展示你能做什么。

这个赛道的窗口期还很长。因为企业在AI上的投入只会越来越多,API成本只会越来越高,而大多数非技术公司根本没有能力自己优化模型调用。就像云计算早期,企业需要有人帮他们做云成本优化一样,AI时代也需要有人帮他们做模型成本优化。

OpenRouter融了1.13亿,LiteLLM快5万星,这个方向已经起来了。但做实施服务、帮企业落地的人还很少。信息差还在。

磨平一些信息差。

常见问题

AI API路由优化服务需要会编程吗?技术门槛高不高?

基础服务(帮客户迁移到OpenRouter)几乎不需要编程能力,会配置API Key就行。但如果要做更精细的路由策略、搭监控仪表盘、做质量对比测试,需要一些Python基础。建议至少会用Cursor或者Claude Code来写脚本,虽然代码不复杂,但总归需要能看懂和修改。整体门槛比做AI桌面自动化或AI数据分析服务略高一些,但天花板也更高。

做AI模型路由优化一单能赚多少钱?月收入大概多少?

实施费一单2000-5000元,取决于客户规模和迁移复杂度。月维护费500-1500元。我六周做了四单,实施费合计14500元,月维护费合计4100元。全职做的话,积累8-12个长期客户,光月维护费就能稳定在8000-15000元,再加上新单的实施费,月入两万以上是可以预期的。

LiteLLM和OpenRouter有什么区别?应该选哪个?

LiteLLM是开源的AI API代理,你可以自己部署,完全掌控数据,适合对数据安全有要求的客户。OpenRouter是托管服务,400多个模型通过一个API调用,自带智能路由和成本优化,适合不想自己维护基础设施的客户。建议两个都学会,根据客户需求推荐不同方案。很多情况下可以先用OpenRouter快速上线,客户后续如果需要本地化再迁移到LiteLLM。

哪些企业最需要AI API路由优化服务?怎么找到他们?

最典型的客户画像是,已经在用AI但不是技术公司的中小企业,比如跨境电商、SaaS创业公司、律师事务所、会计师事务所、内容营销机构、AI客服产品公司。他们的特征是每月AI API费用在5000元以上,但没有专门的AI工程师来优化成本。找客户的方式包括,在技术社区发帖分享优化案例、通过朋友介绍、直接联系目标公司的CTO或运营负责人,主动提供免费API账单审计。

帮企业做AI模型路由优化,模型质量会下降吗?

如果路由策略设计得当,质量不会下降。关键是对不同任务做A/B测试,确认便宜模型在特定场景下的表现和贵模型相当。比如写商品描述这种任务,DeepSeek和GPT-4o的质量差距微乎其微,但价格差了好几倍。需要注意的是,不能一刀切地把所有任务都换成便宜模型,而是要根据任务类型、敏感度和质量要求精细匹配。这也是专业服务的价值所在。

我整理了一份AI API路由优化服务的完整实操手册,内容包括LiteLLM从零搭建教程、OpenRouter迁移指南、API账单审计模板、路由策略设计文档、客户报价参考表。已经帮不少朋友入行了。如果你也想试试,可以看看这个提示词包,希望能帮你少走一些弯路。

点击查看AI副业提示词包 →