凤凰彩票app 老外用不起GPT,全跑来“薅”中国大模子的羊毛了

发布日期:2026-03-02 12:23    点击次数:194

凤凰彩票app 老外用不起GPT,全跑来“薅”中国大模子的羊毛了

文 | 超聚焦

大模子正在从"比拼智商",形成一门"进厂打螺丝"的生意。

据财联社报说念,OpenRouter 最新周度数据知道,平台前十模子总 token 量约 8.7 万亿,中国模子独占 5.3 万亿,占比 61%。

而当周 token 调用量前三模子均为国产大模子,永别为 Minimax M2.5、Kimi K2.5、GLM-5,调用量环比上周永别变动增多 197%、下跌 20%、增多 158%。

其中,MiniMax M2.5 以 2.45 万亿 token 空降榜首,Kimi K2.5 以 1.21 万亿紧随自后,智谱 GLM 5 和 DeepSeek V3.2 分列第三、第五。

要知说念,当作全球最大的大模子 API 团聚平台,OpenRouter 荟萃了全球缔造者的实在调用需求,它的榜单堪称当今 AI 行业最硬核的"算力消耗晴雨表"。

看到国产大模子如斯跋扈地"屠榜",许多东说念主的第一反映笃定是:难说念在绝对才调上,国内大模子还是赶上GPT、Claude 和 Gemini 了吗?

谜底显然是申辩的。若是真要死磕相称复杂的逻辑推理或硬核的代码工程,硅谷这几家闭源巨头依然是当下绝对的时间天花板。

{jz:field.toptypename/}

那么,既然绝对智商并莫得赶上北好意思顶尖模子,那为什么偏巧是国内大模子跑满了全网的调用量?对改日的 AI 竞争时势又意味着什么?

01大模子不是真金不怕火金术而是活水线

国内大模子企业,正在用义乌作念小商品的逻辑,降维狙击硅谷的赛博魔法。之是以中国大模子巧合在 Openrouter 上"屠榜",唯"低廉"尔。

畴昔,大模子的订价权在国外巨头手中。以 GPT-4o 或 Claude 3.5 Opus 为例,才调强,但价钱也高。处理百万 Token 的数据,频繁需要铺张几好意思元甚而十几好意思元。

在 AI 爆发的尝鲜期,这个价钱民众咬咬牙也就接受了。可一朝迈入 Agent 期间,情况透彻变了。

最近在科技圈闹得沸沸扬扬的" OpenClaw 封禁事件",等于这场算力资本危境的最直不雅切面。

当作一款爆火的开源 AI 智能体,OpenClaw 能像"数字打工东说念主"不异经受电脑、全自动处理文献甚而写代码。为了省钱,许多极客和缔造者念念出了一个"绝妙"的决策:他们诈欺代码接口,让 OpenClaw 去"白嫖"谷歌和 Anthropic 每月 20 好意思元的个东说念主包月订阅做事(如 Claude Pro),而不是老敦朴实去调用官方按量付费的玄妙 API。

后果可念念而知,当 AI 从"你问我答的聊天框"形成"自动盘算、反复实施的数字打工东说念主"时,它在后台每一次的搜索、试错、纠错和轮回,齐在跋扈燃烧 Token。这种 Agent 级别的恐怖婉曲量,径直把蓝本堪称"不限量"的包月做事给刷爆了。

濒临被"薅秃"的算力资源,谷歌和 Anthropic 也坐不住了。他们不仅遑急下场,严禁第三方器用接入订阅制通说念,谷歌甚而对部分高频调用的账号祭出了"长久封禁"的终极杀招。

巨头们这番"掀桌子"操作的中枢逻辑其实唯有一个:算力资本实在扛不住了。

在 Agent 期间,若是不时放任民众用 20 好意思元的包月订阅跑自动化任务,CSP 巨头也一定会歇业;但若是逼着缔造者去走官方 API,按照每百万 Token 十几好意思元的价钱计费,那么伊始进的高价大模子就不再是先进出产力,而是成了一个吞吃利润的无底洞,径直把无数 AI 应用和缔造者的贸易模式逼到了死角。

恰是在大浩荡行业齐堕入"用不起算力"的死局时,他们回头一看,发现大洋对岸的中国大模子企业,还是把价钱卷到了一个令东说念主发指的地步。

当今,像 DeepSeek、GLM、Kimi 或者是 MiniMax 等国产优秀大模子,其 API 的调用价钱还是被硬生生打到了每百万 Token 只需要两到三好意思元。

而有些厂商为了霸占缔造者生态,更是对百万级凹凸文或特定例模的模子实行恒久的免费绽放。这还是不是"打个八折"的促销,而是数目级的资本断层。

许多东说念主可能会问:低廉诚然好,但若是模子不够奢睿,低廉又有什么用?但事实却是,绝大浩荡东说念主高估了实在场景对"极限智商"的需求,却低估了"长尾任务"对算力婉曲量的恐怖消耗。

在实在的贸易寰球和极客缔造圈里,90% 的 AI 任务根底不需要用到"爱因斯坦级别"的智商。

念念象一下咱们常常使用 AI 的场景:把一册十万字的英文网络演义翻译成华文;丢给 AI 几十个 PDF 财报让它索求出扫数的利润数据;写一段几百行的前端基础代码;又或者是当今 OpenRouter 上消耗量极大的"变装演出"——玩家和 AI 演出的臆造变装进行几千轮的闲聊。

这些任务有一个共同本性:逻辑深度一般,但文本婉曲量巨大。关于这类"蓝领型"的融会职责,排行前方的中国模子还是不仅是"合格",而是作念得相称出色。

这就好比你要给公司几万份快递单号录入表格,你完全莫得必要去花重金礼聘一位诺贝尔奖得主(顶尖闭源模子),你只需要雇佣一批吃力、褂讪且工资极低的实习生(高性价比模子)就能完好搞定。

更而且顶尖闭源模子与高性价比模子之间的差距,在蒸馏时间的存不才,凤凰彩票welcome两者的差距最多唯有半个身位。

因此,全球的缔造者们极其默然地选拔了"智能路由"计谋:把海量的、繁琐的、容错率高的基础任务和长文本阅读,沿路路由给低廉的中国模子;唯有到了需要作念最终的复杂逻辑判断,或者遭受了极难的算法题时,才会量入为主地调用GPT或 Claude。

这,才是国内大模子能跑满全网调用量的原因。

02算力图霸战,变压器才是底牌

低廉的大模子,从来齐不是天上掉下来的馅饼。

许多东说念主误合计,国内大模子的白菜价是靠着国内厂商"烧钱补贴"砸出来的。但这其实低估了中国工程师在时间落地上的恐怖压榨力。

当硅谷还在迷信"狂放出古迹"、跋扈堆叠万亿参数时,国内大模子企业早就在"爱惜"这门艺术上作念到了旷古绝伦。

在这个赛说念上,中国厂商展现出了极其恐怖的制造业基因和工程化压榨才调。

尽人皆知,受制于相干禁令,国内大模子企业经常无法像硅谷巨头那样,爽朗买入数以十万计的最顶尖 GPU。在"算力清贫"的箝制下,国内工程师们别无选拔,只可硬生生地在工程优化的泥沼里进行极限微操。

为了裁汰单次推理的算力消耗,他们把 MoE 玩到了极致。

{jz:field.toptypename/}

一个领有上千亿参数的雄壮模子,在恢复一个陋劣的常常问题时,系统会精确地只激活其中几十亿参数的"内行网络",让剩下的大部分网络保抓睡觉。这就好比一个巨大的工场,不再是为了出产一颗螺丝钉而让扫数车间灯火通后,而是精确放纵产线,极地面省俭了算力和电力消耗。

为了应付百万级超长凹凸文带来的显存问题,中国工程师们在底层框架上死磕,对 KV Cache 进行像素级的压缩和优化,把雄壮的数据极其严实地打包塞进有限的显存里,硬是在相对错误的硬件上,跑出了并列甚而超越寰球前方的超长文本处理才调。

这种对底层算力近乎变态的压榨,加上国内极其熟习的硬件适配工程,硬生生把大模子推理的物理资本砍掉了几个数目级。

比较之下,大洋此岸的北好意思巨头们就算念念打价钱战,亦然心多余而力不及,因为他们还是被千里重的物理基建透彻锁死了。

在这个问题上,马斯克早在 2023 年就给出了预言:"我的瞻望是,咱们将从……今天的硅相称短少形成……两年内的电力短少。这大约等于事情的趋势。"

而实验也确乎如斯,北好意思老旧的电网系统和漫长的环评审批,根底无法支抓新建超大型数据中心的用电狂飙。玄妙的工业电价、奇高的东说念主力运维资本,甚而有钱齐买不到的高压变压器,最终完全化作了激昂的千里没资本,均派到了每一次的 API 调用里。

换句话说,北好意思顶尖大模子的"贵",有一泰半是替逾期的基础神色和激昂的腹地成分买了单。

于是,当激昂的物理资本遇上全球对算力的无穷需求,一个属于中国 AI 的全新定位出身了。

畴昔四十载,咱们吃透了东说念主口红利和完善的供应链,成为了向全球输出实体商品的"寰球工场";而今天,跟着大模子干涉应用落地的深水区,告别东说念主口红利的中国,正在依托着寰球顶级的特高压电网、极其放心的廉价工业电力,以及首屈一指的工程落地才调,转型为新期间的"寰球 Token 工场"。

至此,改日的全球 AI 大单干还是相称明晰:那些海量的文档精读、低级代码生成、高并发的长文本翻译和臆造东说念主闲聊,总计会当作"赛博代工订单",顺着海底光缆,源源赓续地路由给国内大模子集群。

电能一朝在 AI 芯片中被飘浮为 Token,它就透彻脱离了物理形态的管理。它不像需要漫长的口岸装卸和远舶来品轮运载的产物,而是以光速通过海底光缆,在毫秒之间传输到寰球的每一个边缘。

因此,与其说是全寰球的极客跑来"薅"国内大模子的羊毛,不如说是中国正在以绝对的资本与基建上风,悄然经受 AI 应用期间的底层命根子。

当硅谷巨头们还在为摘取 AGI 的终极金冠不计代价地烧钱、深陷物理基建的泥沼时,国内大模子企业还是化身为新期间的"基建狂魔",用这源源赓续、特出山海的廉价 Token,稳安详当地作念起了全球智能创新最不行或缺的"水电煤"生意。