在人工智能深刻重塑全球产业格局、国家文化数字化战略加速推进的时代背景下,出版业正站在智能化融合创新的关键转型节点。8月28日,数传集团将在第十五届中国国际数字出版博览会期间,举办主题为“数智焕新·智链未来”的“AI赋能出版全链路价值创新研讨会暨出版融合可信数据空间加盟签约仪式”。
会议前夕,围绕出版业如何抓住AI技术变革的契机,实现数据驱动、智能协同、价值跃升,数传集团常务副总裁温亚莉接受了《中国新闻出版广电报》记者采访,分享了她对于行业趋势的判断以及数传集团的相关实践探索。
文章要点
01 出版业未来会加速“出数”转型
在AI时代,出版行业从“出书”迈向“出数”,内容不再只是纸面产品,而是可被训练、调用、交易的数据资产,可构建全新价值闭环,价值不可估量。
02 提出“内容即资产,数据可变现”
出版物因其权威、结构清晰的特性,具备转化为AI训练语料的天然优势,优质内容经过标注确权后可进入数据要素市场,形成长期价值回报。
03 呼吁构建“出版数据地图”,亮出数据家底
数传集团建议行业梳理各出版社的语料资源,公开专业优势,构建“出版数据地图”,增强市场识别度和交易匹配效率。
04 发起成立联盟,统一标准,提升话语权
“出版融合数据资产管理联盟”聚焦数据确权、标注与授权等全流程标准制定,旨在为行业赢得定价主动权,构建面向未来的协同生态。
05 提出从卖书到“卖数”,商业模式再造
未来出版或将以语料调用、长期数据服务等形式成为主营业务,“知识精炼厂”“数据服务商”将成为出版业新身份。
采访原文如下
“出版融合数据资产管理联盟”成立,助力行业数据化转型——从出书到“出数” 从卖书到“卖数”
《中国新闻出版广电报》张君成
在人工智能日新月异的浪潮中,数据正加速跃升为核心生产要素,成为驱动各行各业高质量发展的“新石油”。7月11日,上海数据交易所出版融合数纽中心正式揭牌,标志着出版行业与数据要素市场的深度耦合迈出关键一步。与此同时,由数传集团与上海数据交易所联合发起的“出版融合数据资产管理联盟”也应运而生,旨在构建行业统一标准、打通确权通道、提升数据价值,实现从出书到“出数”、从卖书到“卖数”的深层转型。
“今天的出版业正站在数据化转型的关口。谁能率先完成从内容提供者到数据服务商的角色升级,谁就能抢占未来发展的主动权。”数传集团常务副总裁温亚莉日前在接受《中国新闻出版广电报》记者采访时提出,出版社应树立从出书到“出数”、从卖书到“卖数”的理念。在她看来,数据价值的释放已不再停留在内容数字化的初级阶段,而是向着结构化、标准化、可交易的数据资产形态演化。
出版社向数据服务商转型
当前,全球数据资产的交易正呈现爆发式增长趋势。以美国的Scale AI为例,其平台可处理图文、音视频多种模态,服务于OpenAI、Meta等多元客户,2024年营收达8.7亿美元,预计2025年突破20亿美元。
“它卖的不是数据本身,而是围绕数据构建的一整套产品与服务。背后反映的是数据从信息集合转化为战略资产的全过程。”温亚莉指出,这一逻辑正在各行各业复制蔓延。尤其是在AI技术驱动下,对结构化、语义清晰、高可信度语料的需求不断提升,出版业所拥有的内容资源正在迎来“第二次价值觉醒”。
她进一步分析,出版物的内容长期以严谨、权威、结构清晰著称,这些特点恰好匹配AI训练对数据质量的严格要求。也就是说,出版行业有潜力向数据服务商转型,不仅为AI模型“喂数”,更可主导语料标准、数据质量、标注体系等核心环节,成为推动内容产业数智转型的关键力量。
以教辅出版为例,其多年积累的题库与解析文本可用于构建教育智能体训练数据集;学术出版则可围绕专业期刊与专著内容搭建知识图谱,为大模型提供语义支撑。“我们的内容资源天然就是优质数据的原料,只要进行合理标注和确权,就能变成可交易、可调用的‘数’,甚至远比卖书更具商业前景。”温亚莉说。
“从读书到‘读数’,‘数’所蕴含的不只是格式的转变,更是价值的转变。”在温亚莉看来,那些出书节奏慢,但内容质量高的专业学术类出版社更具潜力。因为未来垂类大模型的核心语料,很可能就来源于这些“深水区”。
“读数”是用户需求的质变
“我们不能再用传统出版的视角来看待未来的内容变现方式。”在温亚莉看来,当前出版行业面临的不是“是否转型”的问题,而是“如何把握窗口期”的关键抉择。
读者的阅读习惯也正在发生转变。“无论是教育领域的智能化学习,还是数字出版平台的内容推荐,‘数’已经成为用户接触内容的第一入口。”温亚莉认为,从读书到“读数”,不仅是终端形态的演变,更是用户需求的质变。
“很多出版社可能还没意识到自己手里握着多么珍贵的内容资产。”温亚莉建议,当前行业亟须从资源盘点入手,主动评估自身在垂直领域的语料优势。
不仅要盘点,还要公示。温亚莉强调:“要让买家知道你在什么领域最强,你的数据‘家底’在哪里。只有亮出身份、挂出招牌,行业之间才有可能形成合作,外部市场才可能找上门来。”她提议,未来可构建“出版数据地图”,帮助全行业梳理各社的专业优势,提升市场识别度和匹配效率。
出版行业构建面向数据交易的新型能力,包括数据确权、标注、使用授权、定价机制等全流程能力。“要像数字内容平台一样,用调用频次、用户转化、使用效果来计算回报。”温亚莉表示,这种能力将决定未来出版行业能否真正在“数据赛道”上形成可持续增长。
数据资产交易应以价值为导向
“未来已来,我们要做的是用产业组织方式提前布局,用技术与规则把握数据主动权。”在温亚莉看来,出版业真正的挑战,不是转型方向不清晰,而是如何从理念落地到行动。
她指出,行业当前面临的首要问题,是分散无序、标准各异。在缺乏统一确权、标注与授权机制的情况下,出版资源虽丰富,却难以真正形成市场流通的数据资产。为此,数传集团联合上海数据交易所发起的“出版融合数据资产管理联盟”,正是为破解这一瓶颈而设。
“以联盟为核心,形成共识、统一标准、协同确权。”温亚莉强调,联盟不是松散的联谊组织,而是为行业构建议价能力、协同竞争力的基本单元。通过统一的数据标注规范、版权确权逻辑和调用授权机制,出版行业才有能力在面对大型互联网平台和AI企业时,掌握定价权与话语权。
同时,联盟将推动“价格联盟”制度,防止内部“破价”内耗。温亚莉提出,数据资产的交易更应以价值为导向,守住定价底线,体现内容与技术的双重投入。
“我们不妨换个视角来看自己。”温亚莉说,“过去我们是内容工厂,现在我们要变成知识的精炼厂、数据的提供商。”她表示,未来不排除有出版社的主营收入来源从纸质图书转向语料调用、从一次性销售转向长期服务、从版权交易转向数据授权。
“从卖书到‘卖数’,这一步并不远。”温亚莉说,“只要愿意开始尝试,未来的出版或许会有全新的商业模式。”
(文章来自《中国新闻出版广电报》8月27日 三版头条)