高性能计算系统与大数据分析

高性能计算系统与大数据分析

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书包含了大数据分析在各个行业中的应用案例,以简明的方式了解数据分析的重要性。

内容简介

大数据时代,数据的规模、速度、范围和结构对计算、存储和网络基础设施提出了更高的要求,如何构建更加高效的基础设施对于获得良好的大数据分析结果至关重要。

本书从大数据分析中对高性能技术的需求讲起,分析了进行高性能大数据分析需要的网络基础设施、存储基础设施,如何使用高性能计算进行实时分析,高性能计算范型,大数据分析中的高性能集成系统、数据库和数据仓库,高性能大数据分析的可视化等内容。

章节目录

版权信息

译者序

前言

第1章 IT领域的变革以及未来趋势

1.1 引言

1.2 新兴的IT趋势

1.3 数字化实体的实现与发展

1.4 物联网/万物互联

1.5 对社交媒体网站的广泛采用

1.6 预测性、规范性、个性化分析时代

1.7 用于大数据及分析的Apache Hadoop

1.8 大数据、大洞见、大动作

1.9 结论

1.10 习题

第2章 大数据/快速数据分析中的高性能技术

2.1 引言

2.2 大数据分析学科的出现

2.3 大数据的战略意义

2.4 大数据分析的挑战

2.5 高性能计算范型

2.6 通过并行实现高性能的方法

2.7 集群计算

2.8 网格计算

2.9 云计算

2.10 异构计算

2.11 用于高性能计算的大型机

2.12 用于大数据分析的超级计算

2.13 用于大数据分析的设备

2.13.1 用于大规模数据分析的数据仓库设备

2.13.2 in-memory大数据分析

2.13.3 大数据的in-database处理

2.13.4 基于Hadoop的大数据设备

2.13.5 高性能大数据存储设备

2.14 结论

2.15 习题

参考文献

第3章 大数据与快速数据分析对高性能计算的渴望

3.1 引言

3.2 重新审视大数据分析范型

3.3 大数据和快速数据的含义

3.4 用于精确、预测性、规范性洞见的新兴数据源

3.5 大数据分析为何不俗

3.6 传统的和新一代的数据分析案例研究

3.7 为何采用基于云的大数据分析

3.8 大数据分析:主要处理步骤

3.9 实时分析

3.10 流分析

3.11 传感器分析

3.11.1 大数据分析与高性能计算的同步:附加价值

3.12 结论

3.13 习题

第4章 高性能大数据分析的网络基础设施

4.1 引言

4.2 当前网络基础设施的局限

4.3 高性能大数据分析网络基础设施的设计方法

4.3.1 网络虚拟化

4.3.2 软件定义网络

4.3.3 网络功能虚拟化

4.4 用于传输大数据的广域网优化

4.5 结论

4.6 习题

参考文献

第5章 高性能大数据分析的存储基础设施

5.1 引言

5.2 直连式存储

5.2.1 DAS的缺点

5.3 存储区域网络

5.3.1 块级访问

5.3.2 文件级访问

5.3.3 对象级访问

5.4 保存大数据的存储基础设施需求

5.5 光纤通道存储区域网络

5.6 互联网协议存储区域网络

5.6.1 以太网光纤通道

5.7 网络附属存储

5.8 用于高性能大数据分析的流行文件系统

5.8.1 Google文件系统

5.8.2 Hadoop分布式文件系统

5.8.3 Panasas

5.8.4 Luster文件系统

5.9 云存储简介

5.9.1 云存储系统的架构模型

5.9.2 存储虚拟化

5.9.3 云存储中使用的存储优化技术

5.9.4 云存储的优点

5.10 结论

5.11 习题

参考文献

进一步阅读

第6章 使用高性能计算进行实时分析

6.1 引言

6.2 支持实时分析的技术

6.2.1 in-memory处理

6.2.2 in-database分析

6.3 大规模在线分析

6.4 通用并行文件系统

6.4.1 GPFS用例

6.5 GPFS客户案例研究

6.5.1 广播公司:VRT

6.5.2 石油公司从Lustre迁移到GPFS

6.6 GPFS:关键的区别

6.6.1 基于GPFS的解决方案

6.7 机器数据分析

6.7.1 Splunk

6.8 运营分析

6.8.1 运营分析中的技术

6.8.2 用例以及运营分析产品

6.8.3 其他IBM运营分析产品

6.9 结论

6.10 习题

第7章 高性能计算范型

7.1 引言

7.2 为何还需要大型机

7.3 大型机中HPC是如何演化的

7.3.1 成本:HPC的一个重要因素

7.3.2 云计算中的集中式HPC

7.3.3 集中式HPC的要求

7.4 HPC远程模拟

7.5 使用HPC的大型机解决方案

7.5.1 智能大型机网格

7.5.2 IMG的工作原理

7.5.3 IMG架构

7.6 架构模型

7.6.1 具有共享磁盘的存储服务器

7.6.2 没有共享磁盘的存储服务器

7.6.3 无存储服务器的通信网络

7.7 对称多处理

7.7.1 什么是SMP

7.7.2 SMP与集群方法

7.7.3 SMP是否真的重要

7.7.4 线程模型

7.7.5 NumaConnect技术

7.8 用于HPC的虚拟化

7.9 大型机方面的创新

7.10 FICON大型机接口

7.11 大型机对手机的支持

7.12 Windows高性能计算

7.13 结论

7.14 习题

第8章 in-database处理与in-memory分析

8.1 引言

8.1.1 分析工作负载与事务工作负载的对比

8.1.2 分析工作负载的演化

8.1.3 传统分析平台

8.2 in-database分析

8.2.1 架构

8.2.2 优点和局限

8.2.3 代表性的系统

8.3 in-memory分析

8.3.1 架构

8.3.2 优点和局限

8.3.3 代表性的系统

8.4 分析设备

8.4.1 Oracle Exalytics

8.4.2 IBM Netezza

8.5 结论

8.6 习题

参考文献

进一步阅读

第9章 大数据/快速数据分析中的高性能集成系统、数据库和数据仓库

9.1 引言

9.2 下一代IT基础设施和平台的关键特征

9.3 用于大数据/快速数据分析的集成系统

9.3.1 用于大数据分析的Urika-GD设备

9.3.2 IBM PureData System for Analytics

9.3.3 Oracle Exadata Database Machine

9.3.4 Teradata数据仓库和大数据设备

9.4 大数据分析的融合式基础设施

9.5 高性能分析:大型机+Hadoop

9.6 快速数据分析的in-memory平台

9.7 大数据分析的in-database平台

9.8 用于高性能大数据/快速数据分析的云基础设施

9.9 用于大数据的大文件系统

9.10 用于大数据/快速数据分析的数据库和数据仓库

9.10.1 用于大数据分析的NoSQL数据库

9.10.2 用于大数据/快速数据分析的NewSQL数据库

9.10.3 用于大数据分析的高性能数据仓库

9.11 流分析

9.12 结论

9.13 习题

第10章 高性能网格和集群

10.1 引言

10.2 集群计算

10.2.1 集群计算的动机

10.2.2 集群计算架构

10.2.3 软件库和编程模型

10.2.4 先进集群计算系统

10.2.5 网格与集群间的差异

10.3 网格计算

10.3.1 网格计算的动机

10.3.2 网格计算的演进

10.3.3 网格系统的设计原则和目标

10.3.4 网格系统架构

10.3.5 网格计算系统的优点和局限

10.3.6 网格系统和应用

10.3.7 网格计算的未来

10.4 结论

10.5 习题

参考文献

进一步阅读

第11章 高性能P2P系统

11.1 引言

11.2 设计原则与特点

11.3 P2P系统架构

11.3.1 集中式P2P系统

11.3.2 分散式P2P系统

11.3.3 混合P2P系统

11.3.4 高级P2P架构通信协议和框架

11.4 高性能P2P应用

11.4.1 Cassandra

11.4.2 SETI@Home

11.4.3 比特币:基于P2P的数字货币

11.5 结论

11.6 习题

参考文献

进一步阅读

第12章 高性能大数据分析的可视化维度

12.1 引言

12.2 常用技术

12.2.1 图表

12.2.2 散点图

12.2.3 树状图

12.2.4 箱形图

12.2.5 信息图

12.2.6 热图

12.2.7 网络和图的可视化

12.2.8 词云与标签云

12.3 数据可视化工具与系统

12.3.1 Tableau

12.3.2 Birst

12.3.3 Roambi

12.3.4 Qlikview

12.3.5 IBM Cognos

12.3.6 Google Charts和融合表

12.3.7 Data-Driven Documents(D3.js)

12.3.8 Sisense

12.4 结论

12.5 习题

参考文献

进一步阅读

第13章 用于组织增权的社交媒体分析

13.1 引言

13.1.1 社交数据收集

13.1.2 社交数据分析

13.1.3 移动设备的发展

13.1.4 强大的可视化机制

13.1.5 数据本身的快速变化

13.2 社交媒体分析入门

13.3 建立一个用于企业社交媒体分析的框架

13.4 社交媒体内容指标

13.5 社交媒体分析的预测分析技术

13.6 使用文本挖掘的情感分析架构

13.7 社交媒体数据的网络分析

13.7.1 社交媒体数据的网络分析入门

13.7.2 使用Twitter的网络分析

13.7.3 极化网络图

13.7.4 In-Group图

13.7.5 Twitter品牌图

13.7.6 Bazaar网络

13.7.7 广播图

13.7.8 支持网络图

13.8 组织的社交媒体分析的不同方面

13.8.1 收入及销售的潜在客户开发

13.8.2 客户关系和客户体验管理

13.8.3 创新

13.9 社交媒体工具

13.9.1 社交媒体监控工具

13.9.2 社交媒体分析工具

13.10 结论

13.11 习题

参考文献

第14章 医疗保健的大数据分析

14.1 引言

14.2 影响医疗保健的市场因素

14.3 不同的相关方设想不同的目标

14.4 大数据对医疗保健的好处

14.4.1 医疗保健效率和质量

14.4.2 早期疾病检测

14.4.3 欺诈检测

14.4.4 人口健康管理

14.5 大数据技术采纳:一个新的改进

14.5.1 IBM Watson

14.5.2 IBM Watson架构

14.6 医疗保健领域中的Watson

14.6.1 WellPoint和IBM

14.7 EHR技术

14.7.1 EHR数据流

14.7.2 EHR的优点

14.8 远程监控和传感

14.8.1 技术组件

14.8.2 应用远程监控的医疗保健领域

14.8.3 远程监控的局限

14.9 面向医疗保健的高性能计算

14.10 人脑网络的实时分析

14.11 癌症检测

14.12 3D医学图像分割

14.13 新兴医疗方法

14.14 BDA在医疗保健方面的用例

14.15 人口健康控制

14.16 护理流程管理

14.16.1 核心IT功能

14.17 Hadoop用例

14.18 大数据分析:成功案例

14.19 BDA在医疗保健方面的机会

14.20 Member 360

14.21 基因组学

14.22 临床监测

14.23 BDA在医疗保健中的经济价值

14.24 医疗保健的大数据挑战

14.25 医疗保健大数据的未来

14.26 结论

14.27 习题

高性能计算系统与大数据分析是2019年由机械工业出版社华章分社出版,作者[印] 阿诺帕马·拉曼。

得书感谢您对《高性能计算系统与大数据分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
揭秘云计算与大数据 电子书
系统阐述云计算和大数据的知识、原理、架构和实战技巧。
财务大数据分析与可视化 电子书
本教程选用微软PowerBI为数据分析工具,将10个项目划分为应用入门、进阶提升和财务综合应用三个循序渐进的学习阶段。应用入门包括财务大数据与可视化分析认知、PowerBI初体验、数据获取与整理、数据建模和数据可视化5个项目;进阶提升包括PowerBI动态交互、数据可视化分析实例和爬虫案例分析3个项目;财务综合应用包括财务数据可视化智能分析和应收账款数据可视化分析2个综合案例。本书结构合理、案例丰
病案首页大数据分析与应用 电子书
本书主要包含四个部分,包括对病案首页内涵与标准、病案首页数据汇集与质量管理、病案首页数据分析与应用以及病案数据分析应用展望。其中病案首页数据分析与应用部分是本书的特色部分,区别于一般基于服务能力/效率、质量安全以及患者入/离院方式的分析思路,本书在大数据分析基础上,从患者人员流动、医疗资源监测与规划以及医疗共同体几个方面利用病案首页数据提出新的分析思路,以推进对病案首页数据的进一步价值挖掘,更好的
云计算与大数据技术应用 电子书
本书共11章,主要内容包括云计算与大数据概述、相关技术、虚拟化技术、集群系统基础、MPI、Hadoop、Spark、Storm、数据中心技术和云计算大数据仿真技术、云计算数据存储技术。本书内容丰富,每章节的流程设计合理,在内容上的详尽程度也合情合理,同时将实验内容融合在课程之中,使理论紧密联系实际,内容系统讲解,循序渐进,螺旋迭代,深入浅出;采用项目任务式;用实战教学,注重入门并提高,边做边学。本
大数据分析可视化 电子书
本书从大数据可视化的基本概念入手,介绍大数据的采集及预处理、大数据可视化的主要工具及使用相关工具进行可视化分析等方面的内容。《大数据分析可视化》共8章。第1章-第3章主要介绍大数据可视化的基本概念、相关工具和大数据采集及预处理,第4章-第6章主要介绍基本图形制作、极坐标系和平行坐标系下各类图形制作及基本三维图形与地图制作,第7章-第8章主要介绍机器学习可视化图形制作及进阶图形制作。