×
大规模真实文本汉语字母词语考察研究

包邮大规模真实文本汉语字母词语考察研究

1星价 ¥23.7 (7.9折)
2星价¥23.7 定价¥30.0
暂无评论
图文详情
  • ISBN:9787561534892
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:32开
  • 页数:295
  • 出版时间:2010-04-01
  • 条形码:9787561534892 ; 978-7-5615-3489-2

本书特色

《大规模真实文本汉语字母词语考察研究》:夏门大学国学研究院资助出版丛书

内容简介

汉语中字母词语的使用情况已经无法仅仅用外来语来涵盖,比如:hsk、gb、3c、阿q等。而且这种语言现象在汉语中的使用,呈泛滥的态势,有的字母串已经产生了很强的构词语能力,字母参与构词也已屡见不鲜,它们已经是汉语中不容忽视的一种新语言现象。它们的影响还不仅限于此,对于汉语信息处理而言,字母词语不仅是汉语中的一类新词语,而且其中含有大量的各领域术语,其中许多术语正在进入汉语语言社会的各个层面,它们已经成了情报翻译、自动分词、信息检索、机器翻译中不可低估的影响因素。
  语言学界见仁见智,态度各异,有人主张保卫祖国语言的纯洁性,有人为字母词语叫好。本书认为字母词语在汉语中的使用不是孤立的,只有经过大规模真实文本的考察,才可以用事实说话,并据实给予规范和制定相关的政策。
  本书采用语料库技术与内省相结合、定量和定性相结合的研究方法,以大规模真实文本为研究基础,历时5年,跟踪考察了近两亿真实文本语料。界定了文字字母;对字母词语所用字符进行了考察和归纳,界定了字母词语;在共时截面上对字母词语在主流报纸媒体的使用状况进行了全面客观的描述和分析;对字母词语的主题领域分布、用法分布状况进行了量化分析研究;从不同角度对字母词语分类、构成成分进行了研究;从历时发展的角度对字母词语演化状况进行了跟踪研究;从语言信息处理的角度对字母词语的统计特征和字母词语的自动识别进行了研究;对通用字母词语的量化提取进行了探索;对字母词语将给汉语文字系统带来怎样的影响进行了探索等等。客观真实地描写和分析了字母词语的各种情况,取得了大量**手的资料。全书共分15章,书后附有作者整理的字母词语研究文献索引录,双语对释字母词语表,5年历时字母词语表,《人民日报》、《北京青年报》、《羊城晚报》共有字母词语表等附录。
  本书对社会语言学、汉语词汇学、新词语、外来语的研究有重要的参考价值,是中文信息处理领域的人员和相关单位关注的对象,同时也可为政府有关部门制订相关政策提供参考。

目录


**章 绪论
 1 字母词语的界定
 2 字母词语与真实文本
 3 本书的结构
第二章 主流报纸媒体字母词语的使用状况
 1 语料的选择
 2 文本中使用的非汉字符
 3 外文字母在汉语文本中的使用情况
 4 媒体字母词语的量化概况
 5 各报纸媒体字母词语概况
  5.1 《人民日报》字母词语概况
  5.2 《北京青年报》字母词语概况
  5.3 《羊城晚报》字母词语概况
 6 媒体字母词语的一次性使用情况
 7 不同性质媒体中字母词语的使用情况
 8 媒体共有字母词语情况
 9 小结
第三章 字母词语中的标点
 1 字母词语中的标点符号
 2 字母词语中标点符号出现情况及问题
  2.1 字母词语中标点的出现情况
  2.2 与标点相关问题的处理
 3 小结
第四章 字母词语中的数字
 1 数字在字母前的情形
 2 数字在字母后的情形
 3 含数字字母词语之管见
第五章 单字母、多字母、光杆字母词语与字母词语并列结构
 1 单字母字母词语
 2 多字母字母词语考察
 3 光杆字母词语与外语原文缩略语
  3.1 光杆字母词语使用状况
  3.2 字母词语原文缩略和汉语拼音成词问题
 4 字母词语的并列结构
第六章 双语对释字母词语
 1 双语对释字母词语在文本中的使用情况概述
 2 对释汉字串的分布考察
 3 双语对释字母词语语形历时演化分析
 4 双语对释字母词语使用方式演化
  4.1 共有双语对释字母词语i型、ⅱ型分布
  ……
第七章 字母词语领域分布特点
第八章 字母词语有多少种用法
第九章 字母词语的演化态势
第十章 字母词语的使用与规范
第十一章 字母词语对汉语文字系统的影响
第十二章 通用字母词语提取研究
第十三章 字母词语的自动识别
第十四章 字母词语的社会接受程度考察
第十五章 结束语
附录1 《人民日报》历时5年一般字母词语
附录2 《人民日报》双语对释字母词语
附录3 2002年《人民日报》《北京青年报》《羊城晚报》共有字母词语
附录4 《北京青年报》双语对释字母词语(2002)
附录5 《羊城晚报》双语对释字母词语(2002)
附录6 字母词语研究文献索引
参考文献
后记
展开全部

节选

《大规模真实文本汉语字母词语考察研究》采用语料库技术与内省相结合、定量和定性相结合的研究方法,以大规模真实文本为研究基础,历时5年,跟踪考察了近两亿真实文本语料。界定了文字字母;对字母词语所用字符进行了考察和归纳,界定了字母词语;在共时截面上对字母词语在主流报纸媒体的使用状况进行7全面客观的描述和分析;对字母词语的主题领域分布、用法分布状况进行了量化分析研究;从不同角度对字母词语分类、构成成分进行了研究;从历时发展的角度对字母词语演化状况进行了跟踪研究。

相关资料

插图:面的、口头的、日常生活中街市门面、各种标牌的……语言的使用涉及生活的方方面面,边边角角,各个层面,各个年龄段。我们只是从一个侧面考察了字母词语的使用情况,虽说一滴水可以折射大海,但毕竟客观实际中还存在大量应该但却没有被反映的现实。如果可以,我们应该从更多的途径考察更多的媒体中外文字母的使用情况,以便更全面地反映外文字母在汉语中的使用状况。自动提取和人工校对的结果不可谓不丰富,十几万条次的工程字母词语,足以产生一些很有价值的结论,但因投入的时间、人力、物力等原因,我们目前不可能对它们一一标记语义、领域、结构、语法等属性以供后人更好地研究它们,或为国家语言生活提供更好的参考。面对如此大量的条目进行人工归类分析,工程非常巨大,我们认为必须对计算机辅助字母词语自动聚类进行研究,以减少人工投入;工程中还存在语言学需要解决的问题、各领域术语的映射问题,如:语言学对专名描述就不够精细,拿来说事时往往捉襟见肘;语言学的专名与语言信息处理学界的命名实体之间是一种什么样的关系,我们弄不清楚或者就没有想去弄清楚,这一点也反映出语言学和语言信息处理研究上缺乏沟通和互补。因而,我们对《人民日报》的提取结果进行的分类分析,也只是粗浅的、不太成熟的,但已经可以初见字母词语在汉语中使用状况的端倪。考察中我们发现字母词语一次性出现的比率达到甚至超过了70%,这种现象引起了我们的注意,我们发现这种现象除了与字母词语是新词语、出现的次数低有关系外,也和它们多为产品名、公司名、各种术语协定名有关。这类对象只在各种专业或行业文本中高频出现。还有一个更重要的原因就是字母词语缺乏使用规范,造成字母词语使用的混乱状态,同一个对象有多个不同的指称,如“全国男篮甲A联赛(CBA)”这个比较普通的字母词语在文本中还有“全国男子篮球甲A联赛(CBA)”这一孪生兄弟,所以对字母词语结果进行

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航