如何正确理解Token经济学?
吃瓜电子官网最新热点:如何正确理解Token经济学?
更新时间: 浏览次数:1932
文 | 解码Decode 文 | 解码Decode 😅 去年5月,当大模型厂商卷起价格战时,Tokens大概率是👏出镜率最高的英文单词。 简单来说,Tokens是大语言😉模型(LLM)用来切割自然语言文本的基本单位,可以直观的理解😆为“字”或“词”。 就像工业时代用“千瓦时”度量电力消😎耗,互联网时代用“GB”度量数据流量,AI时代用“Token🙌”来度量模型的工作量。一个Token可以理解为一个词或词片段🚀(中文里可能是一个字或词语)。 Tokens的调用量,🌟本质反映了模型推理过程的计算量。而计算量的高或低,直接揭示了😅模型在实际应用中的能力、成本、速度和可行性。 因此,从😀Tokens角度跟踪AI应用落地进展,就是一个非常深刻且切中🎉要害的视角。 它意味着我们将AI从一种“黑箱魔法”或纯😡粹的技术概念,拉回到了一个可度量、可分析、可商业化的实际生产😀要素的层面。 简单来说,这意味着我们不再只关注AI“能😢做什么”,而是开始量化分析它“做了多少”、“效率多高”、“成🤯本多少”以及“价值多大”。 谁在消耗tokens? 🔥 模型厂商以tokens为主要定价单位的底层逻辑是:模型调🚀用时的tokens消耗量与相应算力投入存在强关联性。而另一条😴暗线则是,算力投入链接了营收与tokens调用量。 换👏个说法就是,模型厂商营收与其tokens调用量呈现显著同步的🤗高增趋势。 2024年6月至2025年6月,OpenA⭐I大模型基础设施——微软Azure云的日均tokens调用量🙄从0.55万亿上涨至4.40万亿,与此同时,OpenAI年化⭐营收(ARR)从2024年12月的55亿美元增长至2025年😀6月的突破100亿美元,并在2025年8月达到120亿-13😡0亿美元。 也就是说,谁消耗tokens更多谁就是基模😆厂商的主流商业模式。 就目前来看,OpenAI、Ant💯hropic、字节跳动等基模厂商主要有C端和B端两种,其中C😁端包括原生聊天助手、工具类原生应用(影视、图片、编程等)的订🙄阅收入、付费功能以及与内部C端产品整合后的间接收入(如Goo👏gle Chrome); B端则包含为大客户落地AI应😴用和企业直接API调用。 C端的tokens调用量,主😀要贡献者有三个: 1 大流量池产品内部的附加AI功能 😀 2024年5月谷歌搜索上线的AI Overview功能🤯,至2025年二季度月活已超20亿。国海证券预测,AI Ov🌟erview功能单日tokens消耗量在1.6至9.6万亿区😍间内,在2025年7月Google日均tokens调用量中的👍占比为4.9%至29.4%。 展开全文 抖音、剪😡映、今日头条等同样为大流量池C端产品,月活量级已达到10亿(🙌2025年3月)、7亿(2025年7月)、2.6亿(2024🤗年下半年月均)。 百度之于搜索、美图秀秀之于图像,大流👏量C端应用的AI改造都是上述逻辑。据非凡产研,2025年7月🥳百度AI搜索访问量居国内智慧搜索品类第一、美图秀秀的国内访问🤗量/存量月活、新增下载量依旧居图像品类第一,且月度收入仍在环😘比提升。 2 原生聊天助手 ChatGPT聊天助😘手保有较大C端用户规模,2025年7月APP+网页端合计月活❤️达10.15亿,是OpenAI重要Tokens调用量驱动因素👍。 3 视频赛道拥有较大用户基础的新兴应用 除产😍品内置AI功能、聊天助手外,图像、视频、陪伴、办公、教育赛道😉内均出现了有较大潜力的C端新兴AI应用。 字节跳动进行😢多维度布局,推出醒图/星绘(图像)、即梦(视频)、猫箱(陪伴🤩)、豆包爱学(教育)等AI应用。 其中醒图、即梦7月月💯活达到4924万(当月收入59万美元)、1393万(当月收入😘58万美元),已成为图像、视频赛道内拥有较大用户量级的产品;🚀猫箱7月月活794万,当月收入达112万美元,商业转化效率较🚀高。 例如接入gpt-image-1、Leonardo😡.AI的Canva,用于文生图、文生视频、图像补全等除文本模😉态外的编辑、生成场景。根据Gemini、Kimi等大模型的折🤩算口径,单张图片的输出(输入)tokens消耗量在1024(⭐kimi)—1290(Gemini)之间。 B端tok🤗ens调用量主要源于企业级AI应用。其所呈现出来的特征,一是😢渗透率较高,Google发布的“全球601个领先企业AI应用👏案例”显示,各大规模的企业已开始尝试将生成式AI投入生产,涉🎉及汽车与物流、商业与专用服务、金融服务、医疗与生命科学、酒店🚀与旅游、制作、工业与电子、媒体、营销与游戏、零售、科技、通信🙌、公共部门与非盈利组织”11大行业。 二是基模厂商的B🎉端收入比例较大。 数据预测2025年OpenAI来自B👏端的ARR收入占比达54%;Anthropic占比达80%。🥳谷歌透露Gemini企业客户超过8.5万家,推动调用量同比增😊长35倍;火山引擎大模型收入2024年在国内公有云市场中份额😊排名第一,占比达46.4%(外部使用量,不包括豆包等内部AP😊P)。 技术迭代解锁应用需求 越来越多的toke😂ns调用量,并非因为更大参数的大模型,而是推理增强、多模态、🙌Agent化、长上下文转型共同作用的结果。用一句话概括既是:❤️技术迭代解锁应用需求。 以GPT-5和Grok4为例:💯 GPT-5把“更强的推理能力(通过引入test-ti😎mecompute)+多模态+更长上下文+更严格的安全控制等😢”置于产品默认层面; Grok4核心升级则是把“原生工🎉具调用+多代理协同推理+超长上下文等”做成一个可商用产品。 🙄 GPT-5和Grok4如此设置的目标,是希望借助技术迭🤩代增强AI在更复杂、更具备“生产力”的关键场景下的实用性、准😴确性,并且使得AI应用加速落地。 举个例子,假设原来1🙌轮客服对话服务消耗200tokens,升级后客服问答场景中的😍大模型推理过程将扩展成: 客户意图澄清+内部知识库检索😁+逻辑校验+答案润色4个环节,即4轮内部推理,每轮150~2🙄00tokens,最终消耗600至800tokens。 😊 类似的案例在对应的推理增强、多模态、Agent化、长上下文🤯转型中都能找到,其最终结果是双向增强,存量AI应用场景的解决😡方案更好,对应的tokens调用量也倍数增长。 随着技🥳术趋势的不断推进,大量原本因“不准、不全、不落地”而被搁置的⭐需求将被解锁。当准确率、可控性跨过可行性线后,用户特别是B端❤️企业(有生产力场景需求)或将从观望转为批量采购。 总结🤔起来就四点,推理增强把能用变成敢用、多模态把单点工具变成端到💯端工作流、Agent化把对话变成可审计的业务系统、长上下文把😀项目级任务放进模型。 与此同时,虽然tokens调用量🚀倍数增长,但定价却是直线下降。 比如xAI的Grok-🌟4-Fast,输出百万Token仅需0.5美元(约3.5元人❤️民币),但比起国内基模厂商来还是不够狠,去年9月阿里通义千问❤️主力模型最高降价85%,Qwen-Turbo低至0.3元/百😴万Tokens。 其中一部分原因是基模厂商的价格战,让😊“一百万Tokens的钱,都买不了钵钵鸡”,也有一部分是因为😡模型厂优化算力成本的结果。 2024-2025年,为优😜化大模型算力成本,模型厂商进行了压缩大模型单次推理计算量(稀🌟疏化、量化、投机解码)、提升GPU利用率(连续批处理、编译器😊融合)以及换用租金更便宜的云、芯片(国产替代、专用ASIC)🙄等方面的尝试,平均tokens定价实现了较大降幅。 此🙌外模型厂商还进一步通过“模型分层+价格分层”的多样化策略压低🥳模型的使用门槛,让中小预算客户也可接入,比如:OpenAI 🔥用GPT-5-mini/nano覆盖轻量场景;Google以❤️Gemini 2.5 Flash 主打“极速低价”;Anth👏ropic用Claude 3.5 Haiku 提供中等规模、🤔高性价比选项等。 因此一个AI飞轮就已成型,当模型使用😜成本下降,企业/个人调用ROI随之上升,更多应用需求从观望向😎采购转化,促进tokens调用量倍数增长的同时,AI应用随之😂迎来生态繁荣。 Token经济学就意味着,可以直观的获🥳得以下几个关键进展的洞察:成本与经济效益的量化、技术效能与模🙌型能力的评估、应用场景的深化与演化以及商业模式与市场格局的清😅晰化。其中成本与经济效益的量化是最直接、最商业化的意义。 🤩 尾声 如果把AI大模型想象成一个“知识电厂”,To😜ken就是它发出的“度电”,你的提示词就是“合上电闸”的指令🤯,AI应用开发者就像是“家电制造商”。 从Tokens😴角度跟踪进展,就相当于电力公司和社会在跟踪: 全社会总😀用电量(AI应用的总规模)增长了多少? 哪种家电(哪种AI😜应用)最耗电(消耗Token最多)? 发电技术是否进步了(😉模型效率)?每度电的成本是否下降? 新的高能效家电(高效的❤️AI应用)是否被开发出来? 从Tokens角度跟踪AI🤯应用落地进展,意味着AI行业正在走向成熟、务实和工业化。它摒😢弃了早期对参数规模和技术炫技的过度关注,转而聚焦于一个更根本🎉的问题:如何以可承受的成本,可靠地利用AI能力来解决实际问题🎉并创造商业价值。 这标志着AI不再是实验室里的玩具,而😉是真正成为了驱动下一代技术和商业创新的基础效用。作为从业者、🥳投资者或观察者,理解Token经济学,就如同在互联网时代理解🙄带宽成本一样,至关重要。返回搜狐,查看更多
北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)
天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)
河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)
唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)
秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)
邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)
邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)
保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)
张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)
承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)
沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)
第一财经 不同硬件、不同大脑,不同机器人厂商进入不同场🌟景,在多方变量的加持下,机器人的规模化落地似乎遥遥无期。 😎 9月17日,第一财经记者在采访第三方部署方、机器人本体厂🤗商和场景落地方时发现,一个行业新角色正在出现。一个类似于安卓🤗操作系统的中间算法层正在承担屏蔽硬件差异、兼容不同大脑架构的🔥功能,为机器人在真实场景中的规模化落地提供可能。 如今😁,这一产业角色已经吸引了谷歌、智元、富临精工(300432.❤️SZ)、格力博(301260.SZ)、东土科技(300353😴.SZ)、巨星新材料等企业押注。但在硬件厂商坚持自家体系、大🤗模型企业追逐通用智能的格局下,行业的“安卓时刻”何时到来,仍😂有待市场与现实工况的双重检验。 机器人涌入场景,跨本体🎉训练遇阻 当机器人厂商涌向场景方,新的问题正在出现。 🥳 “这个月至少有两家机器人公司正在和我们谈合作。”Kel🤩vin是长三角一家物流上市公司的技术负责人,他告诉记者,为了😢和人形机器人厂商进行合作,自己不得不拨出一个八人左右的团队和😢不同机器人企业进行对接。“我们需要开放不同的数据接口,提供一😁个专门的实验场景,还需要根据各家机器人的要求不断调整流程和测😊试参数”。 在大量的人力和物力投入之外,Kelvin坦❤️言自己算不过来ROI(Return on Investmen💯t,投资回报率)。“机器的工作效率不稳定,且运维需要大量后续😁的费用。”他向第一财经记者透露,物流企业马上就会备战“双11🤩”时间,在此期间是否继续让机器人上岗,他还在犹豫。 更😂大的问题是,由于不同厂商的机器人算法不兼容、硬件各自封闭,导🌟致一个场景的成功经验难以迁移到另一个场景。“有的时候我们的流😁水线哪怕是多一个弯折,机器人都需要重新走一轮POC(Proo⭐f of Concept,概念验证)。” “厂商觉得我🙌们不够开放,我们觉得机器人厂商要得太多。”Kelvin说,这🎉是产业上下游之间对接存在的普遍问题。第一财经记者了解到,一些👍“中间人”的角色正在产业链中诞生。前上汽自动驾驶域控制器算法😘负责人,安努智能工程算法总监杨曾告诉记者,团队正在研发的一套⭐中间件算法平台,希望像手机里的操作系统一样,把不同厂商的机器🔥人纳入统一的兼容框架。 就像手机的操作系统让不同软件在💯同一套规则下运转一样,中间件希望能够通过屏蔽底层硬件差异,使😉一套算法能够迁移到不同厂商的机器人上。“如果每遇到一个新的硬🙄件,就要重新训练,机器人在实际场景部署的速度就会非常慢。”重🌟庆大学助理教授,人工智能及多模态实验室具身智能负责人,安努智🤗能首席科学家胡喆告诉第一财经记者,想要提高机器人的通用化,跨😅本体是必须跨过的门槛。 在不改动模型本身的前提下,兼容🤩不同机器人的大脑,成为中间件的挑战。“虽然主流的模型是VLA🤔模型(Vision-Language-Action Mode😢l,视觉-语言-动作模型),但其中的架构仍然不同,有端到端,🥳也有分层式。”胡喆说,中间件在机器人大脑和机器人作业的实际场💯景中充当一个“翻译官”的角色。在他的设想里,输出的指令会先被😆中间件被转化为统一的目标和约束,再交由各家机器人自身的规划控😊制器执行。 “这样我们就不必为每一个新厂商重新训练模型🤔,只需要向每一个机器人的规划控制器下达指令,就能让中间件跑通🤗整个流程。”胡喆说。 展开全文 物理规律难仿真,🎉机器人“干中学” “我们曾经试过,在实验室里跑通了所有😴算法,结果到实际场景中发现完全不是一回事儿。”钛维云创的创始🤯人张磊告诉记者,当自己试图让机器人处理布料这样的柔性物体时,🚀由于布料材质、厚薄、摩擦力不同,实验室的环境并不能完全满足操😆作需要。 张磊透露,像布料、不规则包裹等物体,POC周😜期“很长,且难以给出确切的时间”,“因为我们需要提前磨合算法🙄、下线采集数据、再拿到实验室反复训练,才能勉强适配场景”。 🎉 工厂中的物料、工艺成千上万,换一条生产线、换一个工位,😅都可能带来完全不同的情况。 “离线的强化学习不可能把所🙄有真实场景一网打尽。”胡喆告诉第一财经记者,机器人不仅需要根😎据场景反复调试算法,还往往要重新采集数据回到实验室做离线训练😂,这让整个周期被拉长,时间和人力都被大量消耗。 边做边🚀改,或许才是机器人进行学习的关键。 胡喆透露,他正在尝😴试利用实时的在线学习算法,允许机器人在实际作业过程中一边操作😜一边采集数据,并实时更新模型。这种方式只需在现场额外增加几秒👏钟运行和100个数据量,“我们会根据模型出来的结果选择数据,😉让机器人在不断学习的过程中遗忘无用的数据,保持数据的精简,也😀不会对算力提出过多的要求”。 机器人“干中学”的另一边🙄,团队也在尝试利用仿真等手段降低机器人的学习成本。“现在大部🎉分机器人仿真环境离现实工况还有很大差距,因为仿真环境中缺乏物🔥理定律的支撑。”美国肯塔基大学空气动力实验室仿真负责人、安努❤️智能联席科学家付博直言,大部分仿真平台依赖数据驱动,却缺乏物😴理定律的支撑。 “如果只是换个环境光影、物体形状等表层🔥变量,那在这种仿真里能跑通的算法,一旦放到现实中,往往会失效😀。”付博说。 让虚拟环境逼近真实世界,并不是一件容易的🔥事。“摩擦力、空气流动等连续变化的环境很难被拆成可以极端的小👏单元。”付博解释,以机器人搬箱子举例,这个场景涉及了力学、刚😡体运动学与工程力学等基本的物理规律。付博说,加入这些规律的仿🤔真能够模拟不同重量箱子堆叠时的微小形变,计算箱内散落零件导致😡的重心偏移,并让机器人理解物体变化对抓取稳定性的影响,以及机🤩器人发力点与物体形变的关联。 他坦言,将这些物理定律的😢融入仿真环境是一个“正在进行的过程”,需逐步攻克计算量庞大的🙄技术难题。付博认为,只有当机器人在仿真环境中充分理解并内化这🤩些物理规律,才能在真实场景中更好地应对突发情况,实现泛化能力🎉的提升。“模型永远无法完全替代实验,但我们希望通过极致的物理😀仿真,让真实实验只需做一次就能验证可行性。” 谷歌提前⭐布局,中间件或成规模化关键 从机器人本体和大脑厂商到最😉终的应用企业,中间还需要大量复杂的部署工作——包括接口打通、😂场景适配、算法迁移等环节。对整个产业链而言,这是一块颇具吸引🤩力的“肥肉”,盯上的远不止安努智能一家企业。 今年6月🤗,银河通用和博世中国成立合资公司博银合创。根据双方披露内容,😀合资公司将聚焦复杂装配、智能质检等高精度制造场景,并且构建标😂准化、模块化、可复制的训练与部署体系,支撑机器人产品的快速迭🤔代与规模化部署。 今年年初,富临精工宣布公司与智元机器⭐人等相关方签署了《人形机器人应用项目投资合作协议》,各方共同😂投资设立合资公司实施人形机器人项目。当前,富临精工、智元、巨😢星新材料均为安努智能股东。就在9月,专注于北美市场的产业股东🤩格力博、聚焦机器人操作系统的东土科技也宣布增资安努智能。 👏 在海外,Google(谷歌)的母公司Alphabet孵化😎的Intrinsic也在扮演类似的角色。Intrinsic试🤩图通过通用算法和工具链降低机器人系统的集成成本,让不同厂商的😆机器人在同一套兼容框架下运行。 通过一个类似操作系统的😂中间件来对接不同机器人厂商和场景,这是安努智能董事长文宏杰提😍出的解题思路。虽然路径各异,但上述三家兼具机器人和产业方背景🙄的第三方部署商,它们的共同点都是试图在碎片化的产业格局中,寻👏找一套能跨越厂商和场景的兼容方式。 不过,机器人产业是👏否会像手机产业那样,最终走向由统一“操作系统”支撑的格局,仍😢充满疑问。一位由数码3C行业转至机器人产业的工程师告诉第一财😆经记者。与手机产业面临的问题不同,机器人领域的情况更为复杂,😅硬件厂商坚持各自的体系,而大模型企业则瞄准通用智能,“屁股决😊定脑袋,大家想的未必是同一个目标”。 多方角力之下,第😊三方部署商设想的中间件是否能够建立起产业上下游的桥梁,还需要😴进一步观察。“模型如果停留在实验室、本体如果只会跳几支舞,那😜最终只是一个故事。”文宏杰认为,在当下的机器人产业,关键不是😆讲模型和本体的“故事”,而是扎进具体场景,通过部署获取真机数🥳据和工程化经验,将商业化的流程拉通、沉淀。 在他看来,🔥这些工程化的经验和数据才能汇聚成类似“操作系统”的底座,真正🔥支撑机器人跨厂商、跨场景的落地。“如果中间件能够像安卓这样的🚀操作系统一样稳定通用、开放兼容,任何厂商都能接入,机器人产业😜的规模化会越来越近。” (本文来自第一财经)返回搜狐,😊查看更多
推荐阅读
【民企500强看现场】华为公布昇腾芯片后续规划
6030
追觅汽车官图发布:无序对开车门、隐藏式双B柱
2070
Claude公司CEO称AI加速取代人类,近半白领岗位未来 5 年恐被淘汰
6950
未经用户同意为其自动注册会员?亚马逊被判违反消费者保护法
6537
华为坤灵发布一站式中小企业智能化方案
6439
2025年世界互联网大会文化遗产数字化论坛在陕西西安开幕
5840
和合信诺拖欠39人近200万元工资被罚,招银国际入股
9784
尼日利亚男子打赌挑战头顶4袋水泥身亡,不到10秒倒地,4天后身亡;赌资是朋友的手机
1884
五指山市图书馆原馆长叶向新被“双开”,6月宴请领导并醉酒驾车,造成交通事故
2515
360元一盒茶叶过期被罚款5万元,当地政府:市场监管局存在“小过重罚”,撤销处罚决定
5837
涉嫌严重违纪违法,河南莫笑迎被查
2398
交通运输部:推动异地还车免费或降费
4775
苹果 watchOS 26.0.1 正式版发布
4271
苹果 macOS 26.0.1 正式版发布
3013
苹果 visionOS 26.0.1 正式版发布
3462
苹果 iOS/iPadOS 26.0.1 正式版发布
2335
德国考虑禁止 16 岁以下人群使用社交媒体
2176
国家税务总局将严查平台向外卖员、快递员等变相收费
4160
极氪 9X 推出购置税补贴方案:最高不超过 1.5 万元
8580
EA 公司 550 亿美元“卖身”后,CEO 称价值观保持不变
6345
我国三大运营商拿到卫星移动通信牌照;鸿蒙5终端数破2000万;腾讯/华为等六家企业签署个人信息保护承诺书...
1073