类似推荐
编辑推荐
论述支持大数据分析的关联规则并行挖掘算法与集群系统性能优化,探讨其在智能制造领域的应用。
内容简介
大数据推动了各行各业的迅猛发展,各领域呈现出新产品、新技术、新服务和新的发展业态,但“信息丰富而知识贫乏”的现象仍然存在。逾越数据与知识之间的鸿沟,需要强有力的分析工具和分析方法的支撑。现有的关联规则挖掘算法,因其时空复杂性和I/O代价高,难以适应大数据分析任务。
本书充分利用Hadoop、Spark等集群系统的强大数据处理能力,论述了支持大数据分析的关联规则并行挖掘算法与集群系统性能优化,并探讨了其在智能制造领域的应用。本书可供从事数据挖掘、机器学习及并行计算等相关专业的科研人员参考,也可作为高等院校计算机、大数据专业的高年级本科生与研究生的学习参考书。
作者简介
作者荀亚玲,女,1980年生,山西临汾霍州人,博士,现任太原科技大学计算机科学与技术学院副教授。在科研方面一直从事数据挖掘和并行与分布式计算等方面的研究工作。在关联规则挖掘、天体光谱数据挖掘技术、并行与分布式计算等领域进行了理论和应用研究,已取得了一些阶段性的研究成果。先后参与了多项国家自然科学基金、国家"863”高技术发展计划基金项目子课题。
章节目录
版权信息
内容简介
前言
第一篇 基础理论篇
第1章 绪论
1.1 数据挖掘
1.2 关联规则
1.3 集群系统与并行计算模型
1.4 大数据环境下的数据挖掘及应用
第2章 MapReduce集群环境下的数据放置策略
2.1 引言
2.2 数据放置策略的关键问题与度量标准
2.3 数据放置策略的优化
2.4 数据放置策略的分析与归纳
2.5 本章小结
第二篇 关联规则并行挖掘及性能优化篇
第3章 压缩后缀链表与并行频繁项集挖掘算法
3.1 问题提出
3.2 基础理论
3.3 基于MapReduce的频繁项集挖掘算法
3.4 实验评价
3.5 本章小结
第4章 FIUT算法与频繁项集并行挖掘
4.1 引言
4.2 FIUT算法描述
4.3 FiDoop算法概述
4.4 基于MapReduce的FiDoop算法
4.5 实现细节
4.6 FiDoop-HD算法
4.7 实验评价
4.8 本章小结
第5章 MapReduce编程模型下的约束频繁项集并行挖掘算法
5.1 问题提出
5.2 约束频繁项集挖掘算法的并行化
5.3 基于MapReduce的约束频繁项集并行挖掘
5.4 基于MapReduce的约束频繁项集并行挖掘算法(PACFP)
5.5 负载均衡
5.6 实验结果及分析
5.7 本章小结
第6章 支持并行频繁项集挖掘的数据划分策略
6.1 引言
6.2 并行FP-Growth算法
6.3 相关工作
6.4 问题陈述和设计目标
6.5 数据划分策略
6.6 实现细节
6.7 实验评价
6.8 本章小结
第7章 频繁项集并行化过程中的重定向任务调度
7.1 问题提出
7.2 重定向任务调度算法
7.3 实验结果及分析
7.4 本章小结
第8章 基于Spark内存计算的并行频繁项集挖掘及优化
8.1 引言
8.2 FP-Growth 算法的并行化分析
8.3 Spark环境下的均衡FP-Growth算法
8.4 实验评价
8.5 本章小结
第三篇 应用篇
第9章 冷轧辊加工质量管理过程相关性分析
9.1 引言
9.2 系统需求与总体设计
9.3 数据预处理及关键技术
9.4 提取关联规则
9.5 系统实现及运行结果
9.6 本章小结
附录A 冷轧辊加工数据
附录B 冷轧辊加工数据预处理格式
参考文献
并行数据挖掘及性能优化:关联规则与数据相关性分析是2020年由电子工业出版社出版,作者荀亚玲。
得书感谢您对《并行数据挖掘及性能优化:关联规则与数据相关性分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。