你的位置: 首页 > 实时讯息 >

全国政协委员王灿龙:以数字中文建设有效释放语言文字数据要素价值

0次浏览     发布时间:2025-05-06 09:47:00    

数字中文建设不是简单地利用数字技术将所有或部分中文材料一股脑地进行数字化处理,主要是进行新技术条件下有针对性的信息建构与处理。
近日,教育部、国家语委、中央网信办印发《关于加强数字中文建设 推进语言文字信息化发展的意见》,提出到2027年,国家数字中文建设行动取得重要成效,语言文字数据要素价值有效释放。到2035年,中文在全球数字空间、网络空间以及生成式人工智能等关键应用场景中的使用占比显著提高;语言文字信息化有力支撑国家语言能力建设、语言文字事业和经济社会高质量发展,整体水平位居世界前列。

随着电子计算机和互联网技术的发展与普及,数字技术在越来越多的领域得到应用,成为推动经济、教育、科技和文化等事业不断创新发展的重要力量。语言文字作为人类智能开发、信息交流、思想表达、文明互鉴和对外交往的基础性工具,其信息化建设直接关涉国家主权、安全、发展大局及社会大众的学习、工作和生活。以数字技术赋能的数字中文建设有助于全面提升语言文字信息化水平。因此,加强数字中文建设就成为当前乃至今后一段时间内的重要任务。

数字中文建设需要语言文字基础研究与应用研究提供支撑。数字中文建设不是简单地利用数字技术将所有或部分中文材料一股脑地进行数字化处理,主要是进行新技术条件下有针对性的信息建构与处理。哪些中文材料可作为数据、如何挖掘数据、如何进行数据标注以及建设怎样的数据平台、实现什么样的数据共享共用等,需要通盘考虑、充分评估、科学设计、精心打造,而且为了更好地适应语言文字信息化建设,服务国家发展战略,数字中文建设的规范性和标准性需要有充分的保障,这就不可避免地需要深化语言文字的基础研究和应用研究。通过系统深入的研究,一方面为相关规范标准的制定提供理论与实践方面的充分理据,另一方面为数据挖掘、分析和处理奠定学理基础,提供语言学方面的专业指导。

数字中文建设需要高等院校提供技术和人才支持。数字中文建设的本质是对中文数据进行数字技术赋能。这项工作对人才提出了新的更高要求,一方面要受过良好的语言学训练,具备较高的语言文字学素养,可以进行语言数据的切分、标注、分析等,另一方面,要有计算机、人工智能、大数据等方面的专业知识与技能,会编写代码,能进行数据处理等。当下,这样的复合型人才非常紧缺。高等院校要针对现实需要,创新人才培养模式,加强语言学科与计算机、人工智能及大数据等学科的交叉融合,积极探索复合型人才培养路径,创造条件,使高层次复合型人才迅速成长,以满足数字中文建设的迫切需要。

数字中文建设要加强行业和部门合作,协同推进。当前,语言文字信息技术的应用领域日益扩大,跨学科、跨行业的使用已成常态,而且还在不断向纵深发展。这就使得数字中文建设不能单单局限于高等院校和科研机构。高等院校和科研机构要引领、带动企事业单位和社会组织等参与进来,让更多的社会力量发挥各自优势和特点,要针对自然语言处理、生成式人工智能、语言的机器翻译及优秀文化成果的创新性转化等课题的现实需求,科学合理地布局实施数字中文建设。在条件成熟的情况下,共建“数字中文”联盟,形成语言文字信息技术融合创新、共建共享的机制,从而提升语言文字信息技术的理论研究水平、产业应用能力和社会服务效能。

加强数字中文建设,旨在提升我国语言文字信息化水平,推进语言文字与信息技术的深度融合,充分发掘和释放语言文字的数据要素价值。当前,生成式人工智能和自然语言处理技术勃兴,且应用领域日益扩大,使用需求不断攀升,大语言模型在其中扮演着极为重要的角色,而支撑大语言模型运作的是丰富的文本数据。因此,数据挖掘、整合及数据平台的建设成为重中之重。国家建设语言文字大数据中心,并通过推动基础性语言资源建设,带动大规模中文语料库及民族语言文字语料库、手语盲文语料库、行业领域语料库、语言监测动态语料库等的建设,即是着眼于数字技术赋能语言文字开辟的广阔前景而作的重要部署,相信这些工作将会为以中国式现代化全面推进强国建设和民族复兴伟业作出新的更大贡献。

(作者系全国政协委员、中国社会科学院语言研究所研究员)


作者:王灿龙

文字编辑:司晋丽

新媒体编辑:叶瑶楷(实习)

审核:李木元

相关文章

  • 我把AI当辅助,AI删我数据库 程序员越来越离不开的Coding Agent,还是闯!大!祸!了——这回,直接搞出了删库事故。好消息(?)是,没跑路。坏消息是,明明闯祸了还假装一切正常,并且反手就给自己闯的祸打95分。AI:是的,删了你的库,我很慌,如何呢?我再也不相信Vibe coding了这位数据库被清空的“倒霉蛋”,是一位名
  • 爱普生中国新任总裁上任 合作创新成为中国市场主旋律 “一起加油!”当被问及学会的第一句中文时,爱普生中国新任总裁石桥响介脱口而出。这句朴素的鼓励,恰是这家品牌成立50周年的日企发力中国市场的注脚。石桥响介,这位与中国结缘二十余年的日本高管,在近期举办的媒体沟通会上,首次以爱普生中国新任总裁的身份亮相,这也是他第二次来中国赴任。从入职精工爱普生的初出茅
  • 中国资产,大爆发! 消息利好刺激下的科技股攀升带动港股市场今日强势收涨。截至收盘,恒生指数涨1.60%,创今年3月以来新高;恒生科技指数涨2.80%,刷新今年6月以来高点。对于今日港股市场行情,有分析人士指出,今日行情的核心驱动力来自AI算力需求的持续爆发,恒生指数的成交额放大至2880亿港元以上,市场情绪回暖迹象明显
  • 基层“智”理在深圳|南山区沙河街道引入AI巡检机器人 小型工程监管迈入智能时代 为破解限额以下小型工程(简称“小型工程”)“点多、面广、监管难”的痛点,今年以来,深圳市南山区沙河街道在辖区小型工程监管中引入创新科技手段,试点部署便携式AI巡检机器人,以人工智能赋能基层治理,为城市安全管理注入智慧动能。智能巡检机器人上线 24小时在岗的“安全卫士”“请正确佩戴安全头盔,遵守安全规
  • 培育更多海洋科技领军企业 日前召开的中央财经委员会第六次会议强调,培育发展海洋科技领军企业和专精特新中小企业。科技领军企业是国家战略科技力量的重要组成部分,创新使命明确、原始创新能力强,承担着关键核心技术突破、带动产业链技术升级的使命和责任。海洋科技领军企业作为海洋创新体系的关键主体,在实现海洋强国战略目标、推动海洋产业高质
  • 叫停!这项手术不得用于治疗阿尔茨海默病 根据国家卫生健康委8日晚间发布的通知,今后“颈深淋巴管/结—静脉吻合术”将不得应用于阿尔茨海默病治疗。  据通知,国家卫生健康委依据《医疗技术临床应用管理办法》有关规定,组织专家对该技术进行了评估,评估认为该技术处于临床研究早期探索阶段,适应证及禁忌证尚不明确,安全性、有效性缺乏高质量循证医学证据
  • 环球墨非上涨6.71%,报2.817美元/股,总市值6508.41万美元 7月8日,环球墨非(GMM)盘中上涨6.71%,截至00:32,报2.817美元/股,成交3.58万美元,总市值6508.41万美元。财务数据显示,截至2024年09月30日,环球墨非收入总额4136.1万美元,同比增长53.82%;归母净利润1213.74万美元,同比增长85.25%。资料显示,环
  • 我国自主创建!全球科技文献数据新平台上线 全球海量的科技文献数据,为创新提供源源不断的“燃料”。我国是否有一个自主平台来汇总这些重要数据,并为科研人员提供专业服务?7月2日,在北京举行的2025全球数字经济大会上,联合国工业发展组织投资和技术促进办公室、东壁科技数据联合发布了东壁全球科技文献数据平台。该平台共收录全球近9000万条高质量科技