| 
					题名:
				 | 文本挖掘 Wen Ben Wa Jue / (美) 茱莉亚· (Julia Silge) ,(美) 戴维·罗宾逊 (Davi , | 
| 
					ISBN:
				 | 978-7-111-58855-9 价格: CNY59.00 | 
| 
					语种:
				 | chi | 
| 
					载体形态:
				 | 178页 24cm | 
| 
					出版发行:
				 | 出版地: 北京 出版社: 机械工业出版社 出版日期: 2018.1 | 
| 
					内容提要:
				 | 全书共9章,主要介绍如何使用基于R的整洁工具来进行文本分析。首先介绍了整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍了如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍了如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;最后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通信信息。 | 
| 
					主题词:
				 | 程序语言 程序设计 | 
| 
					中图分类法:
				 | TP312 版次: 5 | 
| 
					主要责任者:
				 | 茱莉亚· Julia Silge Zuo Li Ya ·JuliaSilge | 
| 
					主要责任者:
				 | 戴维·罗宾逊 Davi Dai Wei ·Luo Bin Xun Davi | 
| 
					主要团体责任者:
				 | O’Reilly精品图书系列 | 
| 
						索书号:
					 | 2 |