施其明:以出版业为切口,构建高质量中文AI语料供给体系
3月28日至29日,2026中国网络媒体论坛在河南郑州举行。本届论坛由中央网信办、人民日报社、河南省委网信委联合主办,聚焦“发挥主流媒体引领力 激发多元主体创造力——共创繁荣网络内容生态”主题。深耕出版与人工智能融合领域的资深专家施其明受邀参会,并在“善用善治:AI内容规范发展”主题论坛案例分享环节发表题为《铸实基座,始通新途——构建中文AI语料高质量供给体系新路径》的演讲。
作为国家新闻出版署出版融合发展重点实验室总工程师,施其明曾作为技术骨干参与多项国家科技支撑计划及国家重点研发计划项目,在人工智能与出版融合领域积淀深厚。同时,他在人工智能底层技术研发领域功底扎实,带领团队荣获国家专精特新“小巨人”、福布斯中国人工智能科技企业50强、世界独角兽企业、国家可信数据空间创新发展试点等多项资质荣誉。
施其明表示,构建高质量的中文AI语料供给体系,是落实国家人工智能发展战略的基础性、先导性工程。语料作为人工智能三大核心要素之一,是服务国家数字经济战略的“基础底座”、支撑大模型持续突破的“压舱石”,也是维护文化主权与意识形态安全的“战略屏障”,其建设质量直接影响人工智能技术发展上限与国际竞争格局。
基于对出版业与人工智能技术的双重深刻理解,施其明敏锐地发现:出版业是构建高质量中文AI语料供给体系的优质切口。出版语料具备审核严格、可信度高,文本完整、逻辑连贯,体系完善、价值密度高等独特战略价值,且出版业编辑的能力模型与语料加工需求高度契合。
2025年底,施其明带领团队以出版业为切口,率先探索出高质量语料生产的完整路径。联合化学工业出版社、崇文书局等多家出版机构,他完整跑通了从语料测评、加工到结算的全流程——这一实践不仅验证了依托出版力量进行规模化语料生产的可行性,更证明了出版业完全有能力成为中文AI语料的核心供给方,为出版业转型开辟了新的价值增长空间。
围绕构建面向“十五五”时期的高质量中文AI语料供给体系,施其明提出系统性规划与建议:以出版业为先行试点,逐步向基础及高等教育、科研院所、智库机构等知识生产高地复制推广,打通从知识创新源头到AI产业应用的价值闭环,打造自主可控、安全合规、全域覆盖、标准统一的国家级中文语料库。同时,从制度、技术、流通三个层面提出具体建议,包括由国家层面牵头制定语料建设全生命周期标准规范,强化产学研用协同攻关语料加工关键技术,依托国家可信数据空间打造语料安全交易平台,推动语料资源在安全合规前提下高效流动。
施其明表示,构建中文AI语料高质量供给体系,是应对国际竞争的现实需要,也是抢占未来AI产业发展制高点的长远之策。他期待与业界各方携手,为我国AI强国建设筑牢语料根基,共同推动人工智能产业健康有序发展。







