Java数据分析指南

Java数据分析指南

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

《Java数据分析全攻略》:11章教授数据分析、数据库、编程技巧。

内容简介

本书包含11章内容,详细介绍了数据分析、数据预处理、数据可视化、数据统计、关系型数据库、回归分析、分类法、聚类法、推荐系统、NoSQL数据库以及Java大数据分析等内容。由浅入深地带领读者了解数据分析的各项要点,并结合具体的代码示例讲解如何通过Java及相关编程方法实现数据分析。

章节目录

版权信息

版权声明

内容提要

译者简介

作者简介

审阅者简介

前言

本书内容

阅读准备

目标读者

排版约定

注释

提示

资源与支持

配套资源

提交勘误

与我们联系

关于异步社区和异步图书

第1章 数据科学导论

1.1 数据分析起源

1.2 科学方法

1.3 精算科学

1.4 蒸汽计算

1.5 一个惊人的例子

1.6 赫尔曼·何乐礼

1.7 ENIAC

1.8 VisiCalc

1.9 数据、信息和知识

1.10 为什么用Java

1.11 Java集成开发环境

1.12 小结

第2章 数据预处理

2.1 数据类型

2.2 变量

2.3 数据点和数据集

2.4 关系数据库表

2.4.1 关键字段

2.4.2 键—值对

2.5 哈希表

2.6 文件格式

2.6.1 微软Excel数据

2.6.2 XML和JSON数据

2.7 生成测试数据集

2.7.1 元数据

2.7.2 数据清洗

2.7.3 数据缩放

2.7.4 数据过滤

2.7.5 排序

2.7.6 合并

2.7.7 散列法

2.8 小结

第3章 数据可视化

3.1 表和图

3.1.1 散点图

3.1.2 线图

3.1.3 条形图

3.1.4 直方图

3.2 时间序列

3.3 Java实现

3.4 移动平均

3.5 数据排序

3.6 频率分布

3.7 正态分布

3.8 指数分布

3.9 Java示例

3.10 小结

第4章 统计

4.1 描述性统计量

4.2 随机抽样

4.3 随机变量

4.4 概率分布

4.5 累积分布

4.6 二项分布

4.7 多元分布

4.8 条件概率

4.9 概率事件的独立性

4.10 列联表

4.11 贝叶斯定理

4.12 协方差和相关

4.13 标准正态分布

4.14 中心极限定理

4.15 置信区间

4.16 假设检验

4.17 小结

第5章 关系数据库

5.1 关系数据模型

5.2 关系数据库

5.3 外键

5.4 关系数据库设计

5.4.1 创建数据库

5.4.2 SQL命令

5.4.3 数据插入数据库

5.4.4 数据库查询

5.4.5 SQL数据类型

5.4.6 JDBC

5.4.7 使用JDBC PreparedStatement

5.4.8 批处理

5.4.9 数据库视图

5.4.10 子查询

5.4.11 表索引

5.5 小结

第6章 回归分析

6.1 线性回归

6.1.1 Excel中的线性回归

6.1.2 计算回归系数

6.1.3 变异统计量

6.1.4 线性回归的Java实现

6.1.5 安斯库姆的四重奏

6.2 多项式回归

6.2.1 多元线性回归

6.2.2 Apache Commons的实现

6.2.3 曲线拟合

6.3 小结

第7章 分类分析

7.1 决策树

7.1.1 熵和它有什么关系?

7.1.2 ID3算法

7.1.3 Weka平台

7.1.4 数据的ARFF文件类型

7.1.5 Weka的Java实现

7.2 贝叶斯分类器

7.2.1 Weka的Java实现

7.2.2 支持向量机算法

7.3 逻辑回归

7.3.1 k近邻算法

7.3.2 模糊分类算法

7.4 小结

第8章 聚类分析

8.1 测量距离

8.2 维数灾难

8.3 层次聚类法

8.3.1 Weka实现

8.3.2 K-均值聚类

8.3.3 k-中心点聚类

8.3.4 仿射传播聚类

8.4 小结

第9章 推荐系统

9.1 效用矩阵

9.2 相似性度量

9.3 余弦相似性

9.4 一个简单的推荐系统

9.5 亚马逊项目对项目的协同过滤推荐

9.6 实现用户评分

9.7 大型稀疏矩阵

9.8 使用随机访问文件

9.9 Netflix大奖赛

9.10 小结

第10章 NoSQL数据库

10.1 映射数据结构

10.2 SQL与NoSQL

10.3 Mongo数据库系统

10.4 Library数据库

10.5 MongoDB的Java开发

10.6 MongoDB的地理空间数据库扩展

10.7 MongoDB中的索引

10.8 为什么选择NoSQL,为什么选择MongoDB

10.9 其他的NoSQL数据库系统

10.10 小结

第11章 Java大数据分析

11.1 扩展、数据分块和分片

11.2 谷歌的PageRank算法

11.3 谷歌的MapReduce框架

11.4 MapReduce的一些应用示例

11.5 “单词计数”示例

11.6 可扩展性

11.7 MapReduce的矩阵操作

11.8 MongoDB中的MapReduce

11.9 Apache Hadoop

11.10 Hadoop MapReduce

11.11 小结

附录 Java工具

命令行

Java

NetBeans

MySQL

MySQL Workbench

从NetBeans访问MySQL数据库

Apache Commons Math库

javax JSON库

Weka库

MongoDB

Java数据分析指南是2018年由人民邮电出版社出版,作者 (美) 约翰·哈伯德 (John R. Hubbard) 。

得书感谢您对《Java数据分析指南》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
PowerBI商务智能数据分析 电子书
一本教你用Microsoft Power BI分析处理经营业务数据的教程。
pandas数据处理与分析 电子书
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
Excel数据处理与分析 电子书
聚焦Excel在财会工作中的典型应用,呈现Excel强大的财会管理功能!提升办公效率! 案例设置基于实际工作过程,案例不仅涉及会计和财务部门日常办公的各个方面,而且这些办公案例之间紧密关联。读者既学会了Excel功能,又熟悉了会计与财务管理岗位的办公业务。 10小时与本书内容同步的视频讲解,光盘与图书内容完美结合。 赠8小时Windows 7视频讲解,轻松运用主流操作系统。 赠1200个Office 2013应用技巧,自如应对工作中的各种状况。 赠900套Word/Excel/PPT 2013实用模板,稍加修改即可应用到工作中。 赠视频讲解常用办公设备和办公软件的使用方法,全面提升办公技能。 赠财务/人力资源/生产/文秘/行政等岗位工作手册,提高效率的有效工具。 赠电脑日常维护与故障排除常见问题解答,轻松搞定常见电脑问题。
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
Power BI商业数据分析 电子书
1. 作者是注册会计师,熟练使用PowerBI,实践经验丰富。 2. 作者的公众号现已成为国内影响力的PowerBI公众号之一,专注于PowerBI知识的分享,其文章通俗易懂、简洁干练、精彩不断,深受广大PowerBI学习者喜爱。