100万亿token背后六大洞察:效率与创意并重

日期:2025-12-14 18:52:06 / 人气:8


AI的价值不只是提效,还在于创造新体验
在某个时刻,你肯定好奇一个问题,那就是现在大家都在用AI干什么?
答案就是:一半人在用AI写代码,另一半人在用AI玩角色扮演。 这不是段子,而是分析人类与AI真实对话的100万亿token数据后得出的结论。
这个结论来自OpenRouter最近发布的36页研究报告。先和你介绍一下OpenRouter,简单说,它就是一个AI模型的“超市”,把ChatGPT、Claude、Gemini、DeepSeek等AI模型都整合在一个平台上,用户能随意切换使用,就像你能在超市里选购多个品牌的商品。
过去一年里,OpenRouter记录了100万亿个token的使用数据。这里,你可以把token理解为AI处理的“字数”,一个token大约相当于一个汉字或半个英文单词。
那么,100万亿这个数量级是个什么概念?我相信很多同学和我一样,只要数字超出自己银行账户的量级,就只剩“很多很多”的模糊概念。
简单粗暴地说,这个数据如果平摊给全球所有人,相当于每个地球人都写了一本一万多字的小册子。如果把这些数据打印成10万字左右一本的书,可能相当于20个世界最大图书馆(美国国会图书馆)的藏书量。
当然,这里需要说明的是,这份数据是来自单一平台的数据,无法完整呈现整个AI世界的全貌。因为还有大量的公司自己部署了开源大模型,或者直接对接OpenAI等公司的API,这些数据都不在这份报告的统计范围内。
这就像我们只统计了盒马超市的全国饮料销量,但是那些电商渠道或者街边小店的数据,我们没办法直接拿到。不过“大力出奇迹”,100万亿数据的庞大体量,已经能让我们看到很多有价值的洞察了。
01核心发现:效率与创意并重
基于这些真实数据,这份报告揭示了一个颠覆认知的事实:
编程任务占比从2025年初的11%暴涨到50%以上,同时,角色扮演、写小说、玩游戏等创意类应用,在开源模型使用量的占比也超过50%。而那些我们以为的主流工作场景,比如写邮件、翻译、做总结,反而只占很小比例。

这说明 AI的价值不只是提高效率,还在于创造新体验 。一边是程序员用AI解决复杂技术问题,一边是普通用户用AI获得情感陪伴。这两个截然不同的使用场景,共同构成了AI的真实生态。
除了这个核心发现,报告里还有很多值得关注的内容。比如中国AI的崛起速度、用户忠诚度的秘密以及全球AI竞争格局的变化。
接下来,我就从报告里,给你梳理出几个值得关注的关键洞察。
02关于编程与角色扮演
先说说关于编程和角色扮演这两个核心场景。
编程任务的爆发,其实反映出程序员的工作方式正在改变。报告显示,编程任务的平均输入长度达到2万个token。需要注意的是,这个输入长度和我们想象的“写超长提示词”还不太一样,具体是什么概念呢?
举个例子,一个前端工程师把整个React项目的组件库、API文档、报错日志都发给AI,让它帮忙排查为什么某个按钮点击后无响应。
这种场景下,我们给AI的输入长度自然很高,这也意味着 AI不再是“写个函数”的简单助手,而是能处理整个代码库的协作者 。这里岔一句,现在我遇到任何系统或代码上的报错,也都是截张图发给AI,直接问“该怎么办”。
角色扮演这边更有意思。在开源模型里, 超过50%的使用量都集中在角色扮演、写小说、玩游戏等创意类应用 。用户让AI扮演游戏角色、写互动小说、创造虚拟人物,甚至陪自己聊天。
这些看似“不务正业”的用途,消耗的token量和专业编程不相上下。
你可能好奇,为什么这个方向下大家倾向于用开源模型?我觉得是因为开源模型的可控性更强,容易调教出自己的独特风格,而且能跳过很多平台方的审查或内容过滤,在响应速度和处理时间上更有优势。
03中国AI的崛起速度
第二个洞察,是关于中国AI的崛起速度。
报告显示,2024年底,中国开源模型在OpenRouter平台的使用占比只有1.2%,几乎可以忽略不计。但到了2025年中期,有几个星期的占比已经飙升到30%。
不到一年时间,从1%增长到30%,这个速度非常惊人 。这可是100万亿token级别呈现的数据变化,很难靠什么市场活动或营销来拉动,核心还是技术实力的实打实提升。
更关键的是, 这种增长不是昙花一现 。报告统计了2024年11月到2025年11月期间整整一年的数据。如果按token使用量排名,在开源模型中,DeepSeek以14.37万亿排全球第一,Qwen以5.59万亿排第二。
你再看看后面的名单:Meta的LLaMA是3.96万亿,Mistral AI是2.92万亿,OpenAI的开源模型只有1.65万亿。DeepSeek的token使用量几乎是OpenAI开源模型的9倍。
当然,需要注意的是,这里对比的是OpenAI的开源模型,属于它的防御型产品,并不是它的核心闭源模型。
那么,为什么token使用量大能说明模型好用?
因为用户愿意把更多、更复杂的任务交给它处理。如果一个AI只便宜但效果差,用户可能试一次就不会再用了。但如果它既便宜又好用,用户就会把越来越多工作交给它,token使用量自然上去了。这也印证了DeepSeek的真实竞争力。
当然,不只是DeepSeek,整个中国开源模型的生态都在快速迭代。
2024年底,DeepSeek在开源模型里几乎一家独大,占比超50%。但到了2025年底,它的占比降到25%以下。
这不是DeepSeek变差了,而是Qwen、MiniMax、Kimi等新玩家起来了,整个市场蛋糕被做大了,虽然DeepSeek的比例下降了,但总量依然是在增长的。
市场从“一家独大”变成“多元竞争” ,对咱们普通用户来说,这意味着我们有了更多选择,不用只盯着那一两个模型。
04用户忠诚度的秘密
第三个洞察,是关于用户忠诚度的秘密。
报告里把它称作“ 灰姑娘的水晶鞋效应 ”。它的意思就是第一个能解决你问题的AI,会对你产生很强的锁定效应,就像灰姑娘的水晶鞋一样,只有她能穿上,别人穿就会磨脚。
数据显示,2025年5月Claude Sonnet 4刚发布时的那批早期用户,到了第5个月留存率还有40%。同样的情况也出现在Gemini 2.5 Pro上,6月份的早期用户,5个月后留存率也有40%。
但那些后来才开始用这些模型的用户,留存率普遍不到10%。也就是说, 越早期的用户,其实对某个模型的忠诚度和使用深度越高 。
为什么差距这么大?因为当一个AI第一次解决你工作中的关键问题时,你会围绕它建立整套工作流程。它熟悉你的工作习惯、表达方式和思维节奏,换一个新AI就像换双新鞋,需要重新磨合。
这时候就算有更好的模型出现,你可能也懒得换了,因为切换成本太高。个人是这样,企业或团队更是如此,当你们用惯一个产品,再次更换的难度会更大。
这个发现也给了我们一个实用建议: 选对第一个AI很重要 。
不要随便找个AI就开始用,最好先多试几个,找到真正适合自己的。因为一旦你形成了使用习惯,后面再换就很难了。
05价格并非决定性因素
第四个洞察,可能会颠覆很多人的认知: 价格不是决定AI使用量的关键 。
报告显示,价格和使用量的相关性极弱,10%的价格下降,只能带来0.5%到0.7%的使用增长。
报告里提到了一些具体例子,Claude在编程任务上每百万token得花约2美元,但它依然占据编程任务60%以上的市场份额。OpenAI的GPT-5 Pro的定价更夸张,每百万token得花35美元,是DeepSeek的100多倍,但用的人依然不少。
这说明 用户在选择AI时,更看重能力和可靠性,而不是价格 。
你想想看,如果你是程序员,正在处理一个关键项目,你会为了省几块钱选一个不靠谱的AI吗?大概率不会。你宁愿多花点钱,也要用一个真正能解决问题的工具。
所以咱们选AI别只看价格,免费的不一定最适合你,贵的也不一定就是智商税。
特别是很多创业者或者企业的负责人,总是喊着为什么员工不用AI,但是你又不从制度或基建上支持,让同事们能用上最强大最顺手的AI工具,这就是典型的“又想马儿跑得快,又想马儿不吃草”。
我们内部的做法是,为所有同事搭建通用AI平台,里面能调用各种最新模型,包括你要是想做智能体,也有完善的基础设施,能调用GPT-5、Claude、Gemini等全球顶尖模型。
此外,对于产研或AI相关团队,如果需要高频使用各种AI工具,那就可以自己决定工具的购买。买完后,公司报销90%,个人承担10%。这10%主要是为了确保大家真的会用这些工具。
06 AI使用方式的演变
第五个洞察,是我们使用AI的方式正在改变。
过去20个月里,用户发送给AI的平均提示词长度从1500个token涨到6000多个,增长了近4倍。AI的输出内容也从平均150个token涨到400个,增长了近3倍。
这个变化背后,反映了 AI角色的转变:从助手到协作者 。
以前我们用AI,更多的是“写个文案”、“翻译一段话”这类简单任务。但现在不一样了,你可以把整个项目背景、相关合作方的特点、你想达成的目标都告诉AI,让它帮你设计一套完整的沟通策略。
AI不再只是直接回答问题,而是帮你理解、分析、提方案,甚至帮你发现你自己都没注意到的问题。
这种使用方式的改变,也带来了一个有意思的现象,叫“ 杰文斯悖论 ”。
简单来说,就是AI越便宜,大家用得越多,总成本反而更高。因为当你发现AI能处理更长的上下文,你就会给它更多内容,让它做更复杂的任务,结果就是消耗的token比以前更多。
07全球AI使用格局的变化
最后一个洞察,是关于全球AI使用格局的变化。
报告显示,亚洲用户的支出占比从2025年初的13%飙升到31%,翻了一倍多。同时,北美用户的占比从50%以上首次跌破50%。这是个标志性变化,说明 AI使用正从“美国主导”转向“全球共享” 。
更直观的是语言分布数据。所有AI对话中,英语占82.87%,这并不意外。但第二名是简体中文,占4.95%,远超俄语的2.47%和西班牙语的1.43%。
你想想看,全球有那么多语言,中文能排第二,这说明中国用户的使用量确实很大。而且我相信英文对话中,也有大量对话是咱们中国用户产生的,毕竟编程等场景下,用英文表达有时更准确一些。
那么,这个趋势对我们来说意味着什么?我觉得最直接的是, AI产品会越来越重视中文市场 。
以前很多AI工具都是英文优先,中文支持总是慢半拍。但现在不一样了,当中文用户占比越来越高时,AI公司不可能再忽视这个市场。所以我们能看到,越来越多AI产品开始重视中文体验,甚至专门为中文用户优化功能。
08结语
说实话,完整看完这份报告,我最大的感受是: AI的使用方式远比我们想象的多元 。
一半人写代码,另一半人玩角色扮演,这两个看似完全不搭边的场景,证明了AI既是生产力工具,也是创意伙伴。中国开源模型使用占比从1%到30%的逆袭,证明了技术竞争格局正在重塑。而“水晶鞋效应”提醒我们,选对第一个AI,可能比我们想象中的更重要。
最后我想说,AI的竞争格局还在快速变化,今天的第一名,明天可能就被超越。但对我们来说,这是好事。竞争越激烈,我们能用到的工具就越好,选择也越多。
所以别焦虑,好好享受这个AI工具层出不穷的时代。
报告链接:
https://openrouter.ai/state-of-ai"

作者:杏悦2娱乐




现在致电 8888910 OR 查看更多联系方式 →

杏悦2娱乐 版权所有