
本报记者 王云杉
数据开始:国度发展转换委、国度数据局 制图:沈亦伶
头条看点
词元(Token),大模子处理信息的最小信息单元。我国日均词元调用量大幅增长,不仅折射智能经济的倾盆活力,也意味着一套新式交易逻辑正在加快演进。智能时间,有了可计量、可订价、可交游的词元,东说念主工智能有望成为像水、电通常支捏社会运转的基础资源。
用户端,查贵寓、写代码、改案牍;企业端,金融风控、智能客服、代码修正……如今,东说念主工智能运用落地的每一个场景,齐离不开对词元(Token)的海量调用。
词元,大模子处理信息的最小信息单元。本年3月,中国日均词元调用量突破140万亿,两年增长超千倍。怎样强健词元?词元和东说念主工智能产业的量度是什么,改日发展趋势如何?记者进行了采访。
词元调用量爆发性增长,背后是模子能力进步
有东说念主猜忌,词元和常见的数据有何不同?
“东说念主工智能大模子的本色是一套复杂的数学运算系统,它无法像东说念主类通常径直读懂笔墨、听懂声息、看懂画面。”中国出动盘问院收罗与IT本领盘问所副长处唐华斌说,东说念主工智能大模子必须先将种种原始数据更动为我方能识别的“话语”,再通过运算输出放胆,词元等于这套“话语”中最基础的单元。
具体来看,笔墨词元像“乐高积木”,一个单词或一个汉字被拆成一块块词元;音频词元像“曲谱上的音符”,一段声息被切成极短的时刻片断,每一派包含调子、音量;视频词元像“拼图碎屑”,每一帧画面被切成一个个小方格,而况还要有计划时刻上的连气儿性……
“在大模子看来,三种模态的词元十足莫得分辩。在模子眼里,它不合计我方是在读笔墨或看视频,它只合计我方是在处理一串极其复杂的数字序列。”火山引擎智能算法认真东说念主吴迪示意。
一个个基础的词元,组成了智能经济启动的“细胞”。本年3月,中国东说念主工智能大模子周词元调用量连气儿3周占据最初地位,成为大家大模子运用活跃度最高的国度之一。
“词元调用量爆发性增长,最径直的原因是模子能力的进步。每一次模子能力的进步,就会解锁更多运用场景,从而使大模子词元调用量进一步激增。”吴迪先容,以Seedance(豆包视频生成模子)2.0为例,生成1分钟视频简短聚消费跳跃100万个词元。
同期,新的运用形态、新的交易模式,也会驱动大模子词元调用量大幅高涨。唐华斌示意,最近兴起的智能体和传统单轮问答不通常,它的启动频频意味着更长的高低文、更时时的模子调用、更多轮次的任务拆解,以及器用扩充经过中的捏续反馈。
“浅易任务,若是只需要单轮或几轮器用调用就能处治,消费词元只需要几千;若是需要几十轮器用调用,则需要至少消费几万词元乃至更多。”吴迪说,智能体等新业态的泄露,让词元调用量又进入了一个快速增长的通说念。
词元调用相聚在信息密度高、迭代周期快的畛域
60亿,是爱问答科技首创东说念主李加义曩昔一年的词元调用量。
走进位于北京海淀区的AI原点社区,一间约16深广米的使命室里,李加义团队正在调试刚刚蓄意完成的AI玩物。
“这个玩物要具备交互能力,离不开相应的软件系统。放在以前,同等体量的软件系统建立至少要半年,还得多东说念主共同合作。”李加义说,在AI大模子与缓助编程的深度赋能下,消费数亿词元,建立周期被压缩至两个月。
2025年头,非计较机训导有素的李加义战役AI缓助编程器用后,借助新本领防碍了软件建立的专科壁垒。“一年间,咱们高效地完成了两款APP和一个AI玩物的建立蓄意。前不久,咱们还将自研的AI硬件居品推向了外洋消费电子展(CES)。”李加义说,AI助力不仅让建立老本大大裁汰,也让小微企业的翻新探索有了更多可能。
软件建立,是东说念主工智能运用落地的典型场景之一。总体看,词元调用量的分散呈现出昭着的行业与场景特征,主要相聚在那些信息密度更高、居品迭代周期更快以及模子与分娩系统之间关联更笼统的畛域。
以豆包大模子2.0为例,吴迪先容,从行业分类看,互联网行业词元调用比例最高,消费电子、金融、新零卖和商务职业紧随后来。
从场景来看,非结构化信息的处理和分析占比最大;训诲、内容创作和“搜索与保举”次之。
不雅察改日的发展趋势,软件建立、深度盘问、个东说念主助理等智能体运用场景或将成为词元调用量爆发的首措施域。“突出是软件建立,面前东说念主工智能正检朴单写代码转向强健总共方法,不仅能排查错漏、自动优化,以致能通过智能体自主完成总共建立任务。代码高低文长、交互轮次多,企业为进步效果的付费意愿较强,这将成为一个强大的需求增长点。”唐华斌说。
词元可计量,东说念主工智能有望成为社会运转基础资源
“本年1月底以来,有的模子企业创下20天收入突出2025年全年总收入的功绩记录。这组数字背后,是一套以词元计费为基础的新式交易逻辑正在加快演进。”国度数据局局长刘烈宏示意。
总结东说念主工智能产业发展历程,曩昔一段时期,行业聚焦于模子性能的比拼,本领翻新与交易落地之间阑珊可量化的衔尾桥梁,难以造成“本领迭代—价值产出—捏续插足”的良性轮回。
“词元自己具备可计量、锚定算力能耗、跨模态通用结算的特色,使其简略成为协调本领供收受交易需求的结算单元。打个比喻,大模子输出的智能好比电,智算中心好比发电厂,电用千瓦时来计量,智能调用就用词元来计费。”联思中国基础措施业务群战术管制总监黄山示意,估计改日的智能社会,东说念主工智能有望成为像水、电通常运转的基础资源,随取随用,用若干买若干。
从词元的视角动身,打造智能经济新形态,我国有何上风?有哪些发展效力点?
算法翻新捏续罢了突破,国产大模子通过底层架构优化,与大家顶尖本领的代差迟缓放松。吴迪说,我国的大模子厂商作念了十分多的算法翻新,在推理老本、反映速率上束缚优化,能以更少的词元完成复杂任务。
基础措施具备最初上风。每生成一个词元,齐在调用数据中心的算力,伴跟着电力消费。我国已建成大家门类最全、范围最大的动力体系,电源足、电网强、阛阓活。唐华斌示意,我国发电供给捏续进步、电力老本束缚裁汰,简略有用裁汰词元调用老本。
“能耗和算力是词元调用的两个关节老本。让每个词元用更少的算力和更少的能耗分娩出来,体现的是智算中心等基础措施的分娩能力和效果。”黄山示意,要构建起安全、高效、普惠的东说念主工智能基础措施,捏续进步大模子推理效果、裁汰单个词元老本,让东说念主工智能最猛进度走向范围化运用落地。
《 东说念主民日报 》( 2026年04月03日 06 版)火星电竞CHINA
