×
第六届汉语中介语语料库建设与应用国际学术讨论会论文选集

第六届汉语中介语语料库建设与应用国际学术讨论会论文选集

1星价 ¥58.8 (6.0折)
2星价¥58.8 定价¥98.0
暂无评论
图文详情
  • ISBN:9787519914400
  • 装帧:70g胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:354
  • 出版时间:2023-03-01
  • 条形码:9787519914400 ; 978-7-5199-1440-0

本书特色

本书分为汉语中介语语料库建设研究和基于汉语中介语语料库的应用研究两大部分,囊括了计算语言学发展特点等理论问题,汉语中介语语料库建设标注、转写等技术问题,运用汉语中介语语料库进行词典编纂、词汇复杂性研究,以及生造词对比研究、单一量词研究、嵌偶词研究等应用问题,反映了近年来汉语中介语语料库研究的相关成果。

内容简介

  《第六届汉语中介语语料库建设与应用国际学术讨论会论文选集》为第六届汉语中介语语料库建设与应用国际学术讨论会论文选集,分为汉语中介语语料库建设研究和基于汉语中介语语料库的应用研究两大部分,囊括了计算语言学发展特点等理论问题,汉语中介语语料库建设标注、转写等技术问题,运用汉语中介语语料库进行词典编纂、词汇复杂性研究,以及生造词对比研究、单一量词研究、嵌偶词研究等应用问题,反映了近年来汉语中介语语料库研究的相关成果。

目录

目??录
在第六届汉语中介语语料库建设与应用国际学术研讨会开幕式上的致辞
刘利 ................................................................................................................. 001

汉语中介语语料库建设研究
当前计算语言学发展的几个特点
冯志伟 ............................................................................................................. 003
“全球汉语中介语语料库”的建设平台与检索功能
张宝林 崔希亮 ............................................................................................. 018
学习者语料库的语用问题:以汉语二语为例
吴伟平 ............................................................................................................. 039
汉语口语中介语语料转写若干问题探讨
刘运同 ............................................................................................................. 057
少数民族国家通用语言口语语料库的构建
彭恒利 陈昳可 ............................................................................................. 066
面向国际中文教育的多样态商务汉语词汇核心资源的构建
王鸿滨 ............................................................................................................. 077
20 年来国内外学习者语料库建设及应用研究分析
尤易 曹贤文 ................................................................................................. 091
对全球汉语中介语语料库字层面标注升级的思考
范晨菲 ............................................................................................................. 108
近 30 年汉语中介语语料库研究现状和趋势分析
邓司琪 ............................................................................................................. 116

基于汉语中介语语料库的应用研究
基于读书报告用词考察的来华研究生汉补课程反思
韩玉国 ............................................................................................................. 129
汉语二语学习者笔语产出性词汇复杂性研究
张江丽 ............................................................................................................. 142
政治隐喻特点及其映射规律探析
宋锐 王治敏 ................................................................................................. 153
韩国学习者汉语短时类时间副词深度习得状况研究
卜晓琳 胡晓清 ............................................................................................. 168
中介语语料库在外向型汉语虚词学习词典编纂中的作用
王雪燕 荆磊 ................................................................................................. 191




??
韩美 CSL 学习者生造词对比研究
赵习连 宋春阳 ............................................................................................. 206
介词“从”及其结构的偏误分析与教学建议
卢方红 ............................................................................................................. 218
基于语料库的韩国汉语学习者量词“个”习得研究
马子涵 ............................................................................................................. 233
动态助词“过”的偏误分析及习得顺序考察
胡楚欣 ............................................................................................................. 245
基于语料库的“很是”与“很为”的对比研究
孟杨 ................................................................................................................. 261
马来西亚华文小学汉语传承语与外语学习者书面表现的对比分析
曹 娜 张馨予 黄建通 曹贤文 ............................................................. 274
泰国学习者汉语单双音易混淆词语特征及成因研究
段清钒 ............................................................................................................. 288
基于 HSK 动态作文语料库“从”的语义习得与中介语研究
王予暄 ............................................................................................................. 303
方位成分“中”语法化和习得过程关系研究
吴贻卿 ........................................................................................................... 327
基于语料库的韩国学习者汉语嵌偶词习得研究
张昱 胡晓清 ................................................................................................. 335

展开全部

节选

  《第六届汉语中介语语料库建设与应用国际学术讨论会论文选集》:  第二个趋势是统计机器学习的趋势。对机器学习的日益增长的重视,导致了计算语言学的学者们与统计机器学习的研究者更加频繁地互动,彼此互相影响。对于支持向量机技术、*大熵技术以及与它们在形式上等价的多项逻辑回归、图式贝叶斯模型等技术的研究,都成了计算语言学的标准研究实践活动。  第三个趋势是高性能计算机系统发展的趋势。高性能计算机系统的广泛应用,为机器学习系统的大规模训练和效能发挥提供了有利的条件,而这些在20世纪是难以想象的。  在20世纪90年代末期,大规模的无监督统计学习方法得到了重新关注。机器翻译和主题模拟等领域中统计方法的进步,说明了可以只训练完全没有标注过的数据来构建机器学习系统,这样的系统也可以得到有效的应用。由于建造可靠的标注语料库要花费很高的成本,建造的难度很大,在很多问题中,这成为使用有监督的机器学习方法的一个限制性因素。因此,这个趋势的进一步发展,将使我们更多地使用无监督的机器学习技术。  当前的计算语言学研究提倡建立语料库,使用机器学习的方法,让计算机自动地从浩如烟海的语料库中获取准确的语言知识。机器词典和大规模语料库的建设,成为当前计算语言学的热点。这是语言学获取语言知识方式的巨大变化,作为21世纪的语言学工作者,我们都应该注意到这样的变化,逐渐改变获取语言知识的手段。  进入21世纪之后,传统的机器学习方法进一步发展成基于神经网络的深度学习方法。这种深度学习方法是独立于具体的语言的,只要有足够大的语言数据,即使研究者不懂有关的语言,仍然可以使用深度学习技术,让计算机自动地从海量的大数据中学习到语言的各种特征,完全用不着采用手工的方法来设计语言特征,把研究人员从艰苦琐碎的特征工程中解放出来,而且,这种深度学习方法达到的分析精度还大大地超过了基于规则的方法或基于传统的机器学习方法所能达到的精度。这是在计算语言学历史上获取语言学知识方法的具有革命性意义的变革,每一个计算语言学工作者都应当敏锐地认识到这样的变革,改变陈旧的、传统的语言特征获取方法,采用新颖的、现代的语言特征获取方法。第三,数学方法越来越受到重视。计算语言学中越来越多地使用统计学方法来分析语言数据,使用人工观察和内省的方法,显然不可能从浩如烟海的语料库中获取精确可靠的语言知识,必须使用统计学的方法。  语言模型是描述自然语言内在规律的数学模型,构造语言模型是计算语言学研究的核心。语言模型可以分为传统的规则型语言模型、基于统计的语言模型和基于深度学习的语言模型。规则型语言模型是人工编制的语言规则,这些语言规则主要来自语言学家掌握的语言学知识,具有一定的主观性和片面性,难以处理大规模的真实文本,而且费时费力,是一项非常艰苦的特征工程。基于统计的语言模型通常是概率模型,计算机借助语言统计模型的概率参数,可以估计出自然语言中语言成分出现的可能性,而不是单纯地判断这样的语言成分是否符合语言学规则,这种概率性的语言统计模型显然比规则型语言模型更加客观和全面。基于深度学习的语言模型完全不需要人工设计语言特征,计算机从大数据中自动地获取语言特征,这样的基于深度学习的语言模型比概率性的语言统计模型更胜一筹,机器学习的效果大大提高了。  目前,计算语言学中的深度学习语言模型已经相当成熟。研究这样的深度学习语言模型需要具备丰富的数学知识,因此,我们应当努力进行知识更新,学习数学。如果我们认真地学会了数学,熟练地掌握了数学,就会使我们在获取语言知识的过程中如虎添翼。  第四,自然语言处理中越来越重视词汇的作用,出现了强烈的“词汇主义”倾向。  弗斯(Firth)认为,词汇是语言描述的中心。他在1957年首先提出了搭配和类连接理论,将词汇内容从语法和语义学中分离出来。后来,韩礼德(Halliday)提出词汇不是用来填充语法确定的一套空位,而是一个独立的语言学层面;词汇研究可以作为对语法理论的补充,却不是语法理论的一部分。近些年来,语言大数据支持的词汇学研究蓬勃发展。越来越多的实证研究表明,词汇和语法在语言中是交织在一起的,必须整合起来进行描述。词汇是话语实现的主要载体,语法的作用仅仅是管理意义、组合成分和构筑词项。语言学中的这种强调词汇作用的倾向,叫作“词汇主义”(lexicalism)。  这种词汇主义的倾向也影响到计算语言学。  自然语言中充满了歧义,计算语言学的学者们注意到,自然语言中歧义问题的解决不仅与概率和结构有关,还往往与词汇的特性有关;英语中的介词短语附着问题和并列结构歧义问题,都必须依靠词汇知识才能解决。事实证明,尽管在计算语言学中使用了概率的方法,但在遇到词汇依存问题的时候往往显得捉襟见肘、无能为力,我们还需要探索其他的途径来进一步提升概率语法的功能,其中的一个有效的途径,就是在概率语法中引入词汇信息。  当前,词汇知识库的建造成为普遍关注的问题。各种语法知识库和语义知识库的建设,都反映了这种强烈的“词汇主义”的倾向。第五,多语言在线自然语言处理技术迅猛发展。随着网络技术的进步,互联网逐渐变成一个多语言的网络世界,互联网上的机器翻译、信息检索和信息抽取等计算语言学研究的需要变得更加紧迫。  ……

作者简介

胡晓清,女,山东政法学院副校长,教授。长期从事国际中文教育教学与研究,主持完成国家社科基金项目2项,教育部人文社科重大攻关项目子课题1项,省社科项目2项;主持省教改重点项目2项,完成省教改项目1项。获批省研究生优质课1门,省一流课程1门,省教学成果二等奖1项。出版《国别化汉语中介语动态语料库建设与研究》等专著5部。是国家社科项目通讯评审和鉴定专家。张宝林,北京语言大学教授,博士研究生导师。西北师范大学兼职教授,福建师范大学客座教授,语言资源高精尖创新中心特聘研究员,中央民族大学语言教学、认知与习得开放研究中心学术顾问。中国语料库语言学研究会理事,中国语文现代化学会语言资源开发与应用专业委员会副理事长。主要研究领域为汉语教学语法、国际中文教育、语料库语言学。主持或作为主要成员参加重量、省部级、校级科研项目10多项;独立或合作出版学术专著、教材、大纲、词典等10多部,发表学术论文70多篇。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航