“世界语言文字‘两库一蓝本’”和“汉语语音点查询系统” 正式发布

4月22日,北京语言大学语言资源高精尖创新中心通过线上学术发布会的形式,正式推出世界语言和文字基本知识库、世界语言文字名称中文译写规则(简称“两库一蓝本”)以及“汉语语音点查询系统”。

“世界语言文字‘两库一蓝本’”和“汉语语音点查询系统” 正式发布

来源: 中国日报网
2021-04-23 13:44 
分享
分享到
分享到微信

中国日报4月23日电(记者 邹硕)4月22日,北京语言大学语言资源高精尖创新中心通过线上学术发布会的形式,正式推出世界语言和文字基本知识库、世界语言文字名称中文译写规则(简称“两库一蓝本”)以及“汉语语音点查询系统”。

语言是了解一个国家最好的钥匙,为了让国人更好地了解全世界的语言文字基本情况,语言资源高精尖创新中心设立了由孙宏开先生和黄行先生联合主持的“语言识别理论及语言数量统计的方法论研究”重大项目,在全球范围内汇聚各种权威开源信息,经整理加工,构建“世界语言基本知识库”和“世界文字基本知识库”,重点展现世界上7000多种已知语言的存在状况和使用状况,具体内容包括:世界诸语言的国际标准语言代码(ISO 639-3)、语言名称、使用人口、地理分布、语言地位和活力、语言系属、语言类型、方言情况、文字情况等。此外,项目组还基于我国已有国家标准和全球主流翻译软件的翻译结果,以英语音节和汉字对照的方式,研制了“世界语言文字名称中文译写规则”,为世界语言文字名称的中文翻译和文献检索提供了学术蓝本。

本次发布会上,语言资源高精尖创新中心特聘研究员黄行先生还介绍了诸多基于“两库一蓝本”提炼总结的知识点,包括:世界上语言数量最多和最少的国家,世界诸语言的活力地位情况,所辖语种超过100种的全球10大语系,世界上作为母语使用人口最多的20种语言,世界上作为官方语言分布国家最多的10种语言,中国和14个陆地邻国共有的50余种跨境语言,全世界主要文字的样态和源流关系以及中国文字与世界文字的源流关系,依据“一蓝本”首次译写的部分语言的中文名称等。

北京语言大学李宇明教授在点评环节高度评价了“两库一蓝本”。他认为“两库”进一步向国内普及了世界语言文字基本知识,将在诸多领域发挥重要的应用价值:第一,服务教育和科研,将世界语言文字的最新知识补充到教科书中,有利于学生更加客观全面地了解世界的语言文字情况,相关知识库也为今后编写《世界语言志》、更科学地划分语言和方言等提供了知识支撑;第二,服务国家外语规划,例如,阿拉伯语、俄语、英语是“一带一路”地区作为官方语言使用最广的三种语言,因此要重视培养俄语和阿拉伯语的人才语言规划;第三,服务国家安全,例如,我国和周边国家有数量众多的跨境语言,研究好利用好这些语言,对睦邻友好和边防安全等都大有裨益。他还认为“世界语言文字名称中文译写规则”为规范和新译世界语言的中文名称提供了重要的学术蓝本,希望能不断完善争取在不远的将来成为国家标准。

中国社会科学院、北京外国语大学顾曰国教授认为以往的语言学研究更多关注的是语言与个人的关系,对世界语言的总体情况尤其是语言与国家的关系关注不够。“两库一蓝本”基于科学的规划方案,充分考虑了语言和国家之间的关系,取得的成果对语言本体研究、人工智能、语言学习等都具有重要的参考借鉴意义。他还详细介绍了国内外在语言与人脑、语言与人工智能、语言与人类健康等方面的最新研究动态。

语言资源高精尖创新中心特聘研究员、“汉语国际教育优质学习资源建设与应用”重大项目负责人姜丽萍教授在本次发布会上详细介绍了汉语语音点查询系统,该系统主要面向海内外汉语教师、普通话培训人员及相关研究人员等专业人士,为可用于汉语教学、教材编写、汉语语音研究以及普通话测试练习等领域的一个辅助教研平台。

汉语语音点查询系统目前仅开发电脑版,尚未开发手机版,主要提供以语音点为检索条件的词汇查询,对不同词表里的所有字词进行筛选和展示,查询结果穷尽列出符合某一语音点或某一语音点组合信息的所有字词,同时提供词表来源及等级的限定。这里的语音点包括:声母、韵母、声调、声韵母语音特征,及轻声、儿化、变调等音变现象。

汉语语音点查询系统有五种查询方式,具体为:单字搜索、汉语拼音、声母和韵母语音特征、双音节及多音节组合、音变。用户可根据自己的需求选择相应的查询方式进行检索。

汉语语音点查询系统的数据来源,目前收录了《汉语国际教育用分级汉字表》(简称3000字表)、《HSK词汇大纲》(简称HSK5000词)、《普通话水平测试用普通话词语表》(简称PSC词表)等字词表,共有3800多个汉字,17700多个词条。系统对所录入汉字的拼音、声母、韵母、声调、来源等进行了标注,对所录入词汇的拼音、音节数、等级/来源等也进行了标注。

汉语语音点查询系统将根据用户的使用情况和反馈进行优化、升级,后续还会进一步扩充字表和词表的数量,将《国际中文教育中文水平等级标准》中的汉字表、词汇表等信息及时添加到汉语语音点查询系统数据库中,最大限度地满足用户的需求。

北京大学刘元满教授在现场点评中指出,汉语语音点查询系统“急”教师之所需,从汉语教学最初应该解决的语音教学问题入手,查询界面“可视、可感”,不仅有利于学生查询学习标准语音,更方便教师备课,开展教学工作。同时,该系统设计融入大纲意识和标准意识,除服务国内外对外汉语教学外,也能应用于少数民族地区普通话教学,在推进国家语言文字事业发展中发挥作用,应用前景广泛。

北京外国语大学张晓慧教授指出汉语语音点查询系统的成功研制进一步反映了国际中文教育日趋规范并且注重标准的制定。语音教学是汉语教学中最基础、关键、现实的教学阶段,汉语语音点查询系统集语音、词汇和意义为一体,为教学者在有限的的时间查找词汇,夯实学生语音基础提供了资源。教师在语音教学中,依据等级、高低频等选择例子,“唤醒”学生最近学习的知识内容,学习效果会大大提升。同时,张教授指出,该系统对于本土教师普通话教学开展、汉教教师培训、语音研究与定量分析、教材编写等也将发挥重要功用,可以提高师资队伍语音教学的专业性,让教材编写更加规范、科学。

北京语言大学李宇明教授认为在全新的教育时代,开发优秀的语言教学软件应当秉持“助教”、“助学”、“助用”理念,即帮助教师教学,尊重学生的学习规律和生活逻辑,帮助其在各领域的工作和生活中更好地使用语言解决实际问题,姜丽萍教授领衔的团队在这方面进行了非常有益的的探索。李宇明教授指出随着线下教育不断向线上、线下相结合的模式转型,需要重新组织全新的、多学科结合的教研模式和教学团队,让大家在学习资源建设、课件制作、课程讲授、学习数据分析、学习效果反馈等环节各司其职,最终真正实现“因材施教”“因人施教”。应当借鉴公司化运作模式,有计划、有规模、成系统地向教师和学习者提供语言学习资源,让师生把精力真正放到教和学上,从繁琐的事务性工作中解放出来。最后,李宇明教授希望将来有更多的高校、学者和社会大众参与到此类项目中,让全世界“任何愿意学汉语的人”和“任何帮助他人学汉语的人”都能更好地受益。

据悉,自2016年成立以来,北京语言大学语言资源高精尖创新中心着力建设“语言资源库”、“‘语言通’智能服务”、“语言文化博物馆”三大工程,通过搭平台、聚人才、接任务、出成果、建学科,在语言资源战略保有保护,语言智慧学习资源建设与开发,领域语言资源建设与智能应用等方面,产出了一批服务国家战略需要、对接北京市重大需求、引领学术前沿的语言资源成果和智能技术产品,得到了国家、社会和学界的高度认可。

(编辑:富文佳 许聃)

(邹硕)

【责任编辑:许聃】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn