本书系统地介绍了数据预处理10数据仓库和数据挖掘的原理10方法及应用技术, 以及采用Mahout 对相应的挖掘算法进行实际练习17本书共有11 章, 分为两大部分17第1 ~7 章为理论部分17第1 章为绪论, 介绍了数据挖掘与知识发现领域中的一些基本理论10研究方法等, 也简单介绍了Hadoop 生态系统中的Mahout; 第2 ~7 章按知识发现的过程, 介绍数据预处理的方法和技术10数据仓库的构建与OLAP 技术10数据挖掘原理及算法(包括关联规则挖掘10聚类分析方法10分类规则挖掘)10常见的数据挖掘工具与产品17第8 ~11 章为实验部分, 采用Mahout 对数据挖掘各类算法进行实际练习17
本书应用性较强, 与实践相结合, 以小数据集为例详细介绍各种挖掘算法, 使读者更易掌握挖掘算法的基本原理及过程; 使用广泛的大数据平台———Hadoop 生态系统中的Mahout 对各种挖掘算法进行实际练习, 实战性强, 也符合目前数据处理与挖掘的发展趋势17
本书既便于教师课堂讲授, 又便于自学者阅读, 可作为高等院校高年级学生“数据挖掘技术” “数据仓库与数据挖掘” “数据处理与智能决策”等课程的教材17