陈波:静态数据词元化是词元经济价值循环的起点

2026-06-18 15:44:34
作者:陈波
分享
文章提及标的
人工智能--
基因测序--
数据要素--
工业互联网--
海量数据--
英伟达--

编者按

词元经济的核心问题终究是围绕价值的:让数据的价值被公正地看见,让看见的价值被高效地流通,让流通的价值被公平地分享。而这一切的第一步,就是数据词元化。

2026年3月,一个源自人工智能领域的技术词汇——“词元”(Token),开始进入决策视野,并很快引起产业、市场、研究界的极大关注。其中文译名直观易懂,普通大众对与之相关技术和概念的接受速度大大加快。令社会各界为之瞩目的是,到底用了多少AI可以词元量进行统计衡量,其增长速度超乎寻常。我们认为,一个新词语的出现,不只是提出一个新概念,更可能引发一场认知革命,进而深刻影响经济社会生活的方方面面。

5月20日,全国首例纯数据资产信托收益权ABS首期5.32亿元在深交所成功发行,全网吸引19.8亿元资金认购,超额认购倍数达3.72倍,数据首次以独立核心资产的身份登陆资本市场。5月28日,全国首例以“词元”为核心计量单位的数据产权在青岛数据集团所属青岛数据资产登记评价中心登记完成。一组海洋生物基因测序(885578)数据,其DNA序列中的每个碱基对,被精准映射为可计量的词元。

这些突破性进展的背后,是今年4月在青岛试运行的全国首个词元计量收益分配体系——它让数据真正参与到收益分配的全链条中,重构了数据要素(886041)价值体系的底层逻辑。

一、词元破局,打通了人工智能全产业链

词元,正在成为智能时代价值创造与分配的“主角”。

2026年4月13日,《中国经济时报》发表的《词元经济的崛起、挑战与治理策略》指出,词元的调用量真实反映了人工智能(885728)的应用程度,词元作为一种数据要素(886041),具有与传统经济要素截然不同的经济属性。

中国工业互联网(885783)研究院发布的《Token驱动智能经济研究报告(2026年)》揭示,Token经历了“三次跃迁”:从自然语言处理时代的“技术符号”,到多模态技术驱动下的“计算基石”,最终跃迁为“能源(850101)+芯片+数据集+大模型”贯通融合的标准化产物——一种新型生产要素。

词元正在贯穿智能经济的整条产业链。它上接算力与能源(850101),中贯模型与平台,下触千行百业的场景应用,把原本割裂的环节,咬合为一条连续运转的价值循环链。

在上游,词元让算力基础设施从“建了再说”走向“算得清账”。每一次词元调用,都对应着明确的算力消耗、电力支撑和网络传输。在中游,词元重塑商业模式,从“卖资源”走向“卖结果”。用户购买的是一段分析、一份代码、一份诊断意见。头部企业的竞争焦点,已从“谁的模型参数更大”转向“谁能更稳定、更便宜地交付词元”。在下游,词元让AI的价值在实体经济中“可见”。代码生成、文书起草、辅助诊断——这些智能服务的结果直接进入核心生产环节,创造可衡量的商业价值。“人类定目标、智能体组织执行、系统自动结算”的新型作业模式,正在成型。

6月8日,国家数据局正式发布《关于推进行业高质量数据集建设行动的实施方案》,“词元”这一前沿概念首次被写入国家顶层设计。文件明确提出“探索词元交易等新型交易模式”,旨在“构建以词元为基础,可量化、可定价的数据价值体系”。这一里程碑式的政策表述,标志着中国数据要素(886041)市场化改革正进入以“标准化产品”和“新型交易模式”为特征的深水区。词元,这把打开数据价值万亿级市场的关键钥匙,也正打通人工智能(885728)全产业链。

然而,一个根本性问题随之浮现:这条产业链的源头活水在哪里?

无论中游的模型能力多强、下游的应用场景多广,如果没有高质量数据作为“初始输入”,高质量的词元生产就无从谈起。过去几十年,国家和企业在信息化、数字化进程中已积累了海量数据(603138),但这些数据大多处于“沉睡”状态。已开发利用的部分,相较于待开发部分,可谓九牛一毛。根本原因在于,没有价值循环,数据价值难以变现,数据加工既费力又不挣钱。

如今,词元经济的崛起为打通全产业链提供了新的可能。而启动这一经济循环的关键,就在于起点——数据词元化。

二、数据词元化,开启了词元经济价值循环

长期以来,数据交易陷入一个看似无解的怪圈。人人都说数据有价值,但真到交易时,市场只能用最简单的计量方式——按存储容量卖,或按条目数卖。不是因为不想精细定价,而是因为没有公认的、可替代的价值衡量方法和使用计量方式。市场一直在期待这样一种工具。而词元,让数据企业看到了希望。

词元破局的要义在于,它可以将数据拆解为可单独定价、可独立流通、可全链路溯源的最小价值颗粒。无论是结构化字段,还是非结构化文本、图像、基因序列,都能统一转化为标准化的词元单位进行核算。有了词元,数据便可以与具体场景关联,价值衡量因而有了实现的可能。词元这把新的价值度量工具,可以把数据要素(886041)市场从非标准化的经验定价,推向可量化、可审计、可清算的规范运作轨道。

基于词元的经济价值循环的建立,使数据在经济属性上实现了从单一“资源要素”层次向“可资本化”阶段的本质跃迁。在整个循环中,词元如同血液般贯穿始终。正因如此,英伟达(NVDA)创始人黄仁勋才会说,词元具有货币的特点。

具体来看,这一循环包含五个阶段:

第一阶段:供给与资产化。数据持有者将原始的、非结构化的数据资源,通过清洗、标注、确权和价值评价,转化为标准化的“词元化数据集”。词元在此扮演着价值计量单位和产权登记单元的角色。

第二阶段:交易与流通。模型研发方在数据交易市场中合规采购高质量的词元化数据集作为训练“燃料”。交易模式从传统的“买断数据包”向“按调用词元量分成”演进,形成对数据供给方的持续激励。

第三阶段:生产与服务。大模型厂商和智算平台利用采购的数据进行模型训练,为用户及智能体提供服务。用户按不同类型的词元调用量及词元单价付费。

第四阶段:应用与价值创造。用户通过调用模型将AI能力嵌入业务流程,直接在实体经济中创造最终的商业价值和社会福利。交易完全基于企业提供的服务价值进行。

第五阶段:价值分配与再投资。整个链条创造的价值按照贡献度进行分配,部分收益回流至数据供给方,部分支撑模型研发与算力投入,形成正向循环。

这一循环的可贵之处在于,它已被实践证明是可以实现的。静态数据完全可以被成功词元化为可信、可定价的资产,而数据源头的精确计量,正是数据企业参与后面所有环节的基础。

三、服务可计量,成为词元经济循环的关键

智能时代的核心是智能服务的普及,智能服务必须可计量、可审计、可清算——这是智能经济循环运转的命门所在。一旦计量失准,全产业链的计价、结算、分配就会松动,导致链条断裂。

这个痛点在企业端表现得尤为尖锐。许多企业在引入AI后发现,智能体的多轮反思与工具调用会产生“链式消耗放大效应”,一个看似简单的用户请求,背后可能触发数十次隐式词元调用,导致成本失控却“算不清账”。词元调用量多了,但最终用户不买账,这个循环还是运转不起来。这涉及算两个账,一是数量账,二是质量账,首先是要算清楚数量账。

“服务可计量”绝不仅仅是一个技术问题。以词元及其它多种方式为基础的智能服务计量体系,这是词元经济产业化运营的基础设施,应由权威机构建设、维护和管理。

这一基础设施的建设,已上升为国家层面的战略行动。近日,国家市场监督管理总局、国家发展改革委联合印发的《人工智能(885728)计量体系和能力建设指引(2026版)》,系统布局了AI计量能力建设,标志着AI产业正从“建算力、扩规模”向“提质量、强根基”迈出关键一步。清华大学教授沈阳提出:“计量是质量的基石。当AI技术加速渗透千行百业,如何让其性能可测量、结果可比较、过程可追溯,已成为产业健康发展必须回答的基础性命题。”

《指引》围绕基础支撑、通用技术、核心技术、计量技术规范、计量服务产业、智能赋能计量等六大部分进行了系统布局。其中最基础的是数据体系建设——构建最高计量特性数据集、标准参考数据集和测试数据集三级体系,为AI的“可测量”提供数据根基。这套计量体系与词元经济的需求高度契合,词元作为智能经济的新型生产要素,其可计量性、与场景的高度关联性,恰恰需要这样一套从数据根基到技术规范的全链条能力来支撑。

在具体运营层面,词元的计量贯穿“生产供给—调度经销—终端消费(883434)”三层架构。可以说,词元在哪里,计量就在哪里。当每一次词元调用都自带溯源标签,清分结算能够自动完成,数据提供方、模型方、应用方各按其贡献获取分成时,词元经济循环才能真正实现持续、公平地运转。而“服务可计量”,正是这一切得以运转的底层保障。

我们已经看到青岛数据集团在过去一年多时间内,初步跑通了静态数据词元化到资本认可的完整闭环,用实践证明了词元经济循环具有可操作性。

下一步的关键是词元质量评价标准体系的建设,我们不仅需要数量,还需要质量。6月3日,《中国经济时报》以“让词元更有质量——推动词元经济高质量发展”为主题,邀请业内专家撰文讨论。正如系列文章所强调的,词元产生于“用户—智能体—模型”的动态服务过程,其质量本质就是AI服务质量。要更好实现“优质优价”、让高质量数据获得合理溢价,还需要加快构建与场景深度耦合、覆盖“能力、底线、价值”三维框架的词元质量评价标准体系,这是词元经济健康发展的必经之路。

词元经济的核心问题终究是围绕价值的:让数据的价值被公正地看见,让看见的价值被高效地流通,让流通的价值被公平地分享。而这一切的第一步,就是数据词元化。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈