×
文本挖掘概论:研究设计、数据收集与分析

文本挖掘概论:研究设计、数据收集与分析

1星价 ¥42.2 (6.2折)
2星价¥42.2 定价¥68.0
暂无评论
图文详情
  • ISBN:9787568939089
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:256
  • 出版时间:2023-08-01
  • 条形码:9787568939089 ; 978-7-5689-3908-9

本书特色

在大数据时代,海量的文本数据成为发现新知识、新观点、新规则的金矿,对于社科研究者,学习文本挖掘的必要性已经越来越凸显。大数据涵盖了社会生活中存在的大量的、有趣的语言和社会现象,但文本挖掘的新手研究者往往会感到无从下手,而本书能够为这类群体提供一个便捷的研究起点。

内容简介

本书概括性地介绍了文本挖掘的几种主要方法、方法论基础,文本挖掘的主要形式,以及如何根据研究的目的进行观点挖掘、信息抽取、主题分析,书中还介绍了三十余种用于文本挖掘和分析软件。本书写给计划使用网络工具和数据开展研究的本科生和研究生,首先引导读者在研究初期考虑伦理、哲学和逻辑问题,随后概述文本挖掘、文本分析以及社会科学和计算语言学领域的研究方法。适用以下领域:人类学、传播学、计算机科学、教育学、语言学、市场营销学、政治学、心理学和社会学。

目录

**部分 基础入门 第1章 文本挖掘和文本分析 第2章 数据获取 第3章 研究伦理 第4章 哲学和逻辑基础 第二部分 研究设计和基础工具 第5章 研究设计 第6章 网络抓取和网络爬虫 第三部分 文本挖掘基础 第7章 词汇资源 第8章 基础文本处理 第9章 监督学习 第四部分 人文社会科学与文本分析 第10章 叙事分析 第11章 主题分析 第12章 隐喻分析 第五部分 计算机科学与文本挖掘 第13章 文本分类 第14章 观点挖掘 第15章 信息抽取 第16章 主题模型 第六部分 写作和展示 第17章 成果撰写和展示 附录A 数据资源 附录B 文本处理和清洗软件 附录C 文本分析软件 附录D 质性数据分析软件 附录E 观点挖掘软件 附录F 索引和关键词频软件 附录G 可视化软件 附录H 统计工具 附录I 网络资源 术语表 参考文献
展开全部

作者简介

加布·伊格纳托(Gabe Ignatow)
社会学副教授,2007年起任教于北得克萨斯州大学(UNT)。研究方向为社会学理论、文本挖掘和分析、新媒体以及信息政策。
目前与计算机科学和统计学领域的专家合作,将文本挖掘和主题模型技术应用于社会科学研究。1990年以来,加布一直致力于文本的混合分析方法,并在以下期刊发表了研究成果:Social Forces,Sociological Forum,Poetics,Journal for the Theory of Social Behaviour,Journal of Computer-Mediated Communication。共发表或出版三十余篇论文和图书章节,担任以下期刊的编委会成员:Sociological Forum、Journal for the Theory of Social Behaviour和Studies in Media and Communication。
曾担任北得克萨斯州大学社会学系研究生项目副主任和本科生项目主任,耶鲁大学文化社会学中心理事会成员。研究生项目搜索引擎公司GradTrek的联合创始人和首席执行官。

拉达·米哈尔恰(Rada Mihalcea)加布·伊格纳托(Gabe Ignatow) 社会学副教授,2007年起任教于北得克萨斯州大学(UNT)。研究方向为社会学理论、文本挖掘和分析、新媒体以及信息政策。 目前与计算机科学和统计学领域的专家合作,将文本挖掘和主题模型技术应用于社会科学研究。1990年以来,加布一直致力于文本的混合分析方法,并在以下期刊发表了研究成果:Social Forces,Sociological Forum,Poetics,Journal for the Theory of Social Behaviour,Journal of Computer-Mediated Communication。共发表或出版三十余篇论文和图书章节,担任以下期刊的编委会成员:Sociological Forum、Journal for the Theory of Social Behaviour和Studies in Media and Communication。 曾担任北得克萨斯州大学社会学系研究生项目副主任和本科生项目主任,耶鲁大学文化社会学中心理事会成员。研究生项目搜索引擎公司GradTrek的联合创始人和首席执行官。 拉达·米哈尔恰(Rada Mihalcea) 密歇根大学计算机科学与工程专业教授,研究兴趣为计算语言学,尤其是词汇语义学、多语自然语言处理和计算社会科学。担任以下期刊的编委:Computational Linguistics,Language Resources and Evaluation,Natural Language Engineering,Research on Language and Computation,IEEE Transactions on Affective Computing以及Transactions of the Association for Computational Linguistics。 2015年计算语言学协会北美分会(NAACL)会议主席,2011年计算语言学协会会议联合项目主席,2009年自然语言处理中的经验方法会议联合项目主席。曾获2008年美国国家科学基金会CAREER奖和2009年美国青年科学家与工程师总统奖。2013年,获得家乡罗马尼亚克卢日-纳波卡颁发的“荣誉公民”称号。 译者简介 汪顺玉 二级教授,博士,博士生导师,“西外学者”领军学者,西安外国语大学研究生院院长。先后主持国家社科重点项目、jiaoyu部人文社科项目、省市级哲学社会科学规划课题、教改重点课题、教育考试院课题等 10 余项。在《外语教学》《英语研究》《重庆大学学报》《上海科技翻译》《天津外国语大学学报》等刊物发表学术论文 30 余篇,出版学术专著、译著、教材 8 部。学术兴趣包括语言测试与评价、学术翻译、话语研究、社会研究方法等。 陈瑞哲 西安外国语大学在读博士,西安邮电大学人文与外国语学院讲师。发表学术论文10余篇,出版书籍5部,译著2部。曾获陕西省第十五次哲学社会科学优秀成果奖二等奖,陕西高等学校人文社会科学研究优秀成果三等奖。研究兴趣为文本挖掘和话语分析。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航