Julia数据科学应用

Julia数据科学应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

《Julia数据科学实践》:领域应用、原理、实例及练习。

内容简介

本书介绍了Julia在数据科学领域的应用以及相关的几个基本的数据科学原理,然后,详细介绍了如何安装Julia并发挥其功能强大的库。本书提供了众多的示例,展示了使用Julia命令、数据集和函数所能够解决的问题。本书每一章都带有练习和问题,帮助读者掌握Julia这一数据分析工具。

章节目录

版权信息

版权声明

内容提要

前言

第1章 Julia简介

1.1 Julia如何提高数据科学水平

1.1.1 数据科学工作流程

1.1.2 Julia被数据科学社区接受的过程

1.2 Julia 扩展

1.2.1 包的质量

1.2.2 找到新的包

1.3 关于本书

第2章 建立数据科学工作环境

2.1 Julia IDE

2.1.1 Juno

2.1.2 IJulia

2.1.3 其他IDE

2.2 Julia扩展包

2.2.1 找到并选择扩展包

2.2.2 安装扩展包

2.2.3 使用扩展包

2.2.4 破解扩展包

2.3 IJulia基础

2.3.1 文件处理

2.3.2 在.jl文件中组织代码

2.3.3 引用代码

2.3.4 工作目录

2.4 要使用的数据集

2.4.1 数据集描述

2.4.2 下载数据集

2.4.3 加载数据集

2.5 在Julia中实现一个简单的机器学习算法

2.5.1 算法描述

2.5.2 算法实现

2.5.3 算法测试

2.6 将工作区保存到数据文件

2.6.1 将数据保存为分隔值文件

2.6.2 将数据保存为Julia数据文件

2.6.3 将数据保存为文本文件

2.7 帮助

2.8 小结

2.9 思考题

第3章 Julia入门

3.1 数据类型

3.2 数组

3.2.1 数组基础

3.2.2 在数组中引用多个元素

3.2.3 多维数组

3.3 字典

3.4 基本命令与函数

3.4.1 print()和println()

3.4.2 typemax()和typemin()

3.4.3 collect()

3.4.4 show()

3.4.5 linspace()

3.5 数学函数

3.5.1 round()

3.5.2 rand()和randn()

3.5.3 sum()

3.5.4 mean()

3.6 数组与字典函数

3.6.1 in

3.6.2 append!()

3.6.3 pop!()

3.6.4 push!()

3.6.5 splice!()

3.6.6 insert!()

3.6.7 sort()和sort!()

3.6.8 get()

3.6.9 keys()和values()

3.6.10 length()和size()

3.7 其他函数

3.7.1 time()

3.7.2 条件语句

3.7.3 string()

3.7.4 map()

3.7.5 versioin()

3.8 运算符、循环语句与条件语句

3.8.1 运算符

3.8.2 循环语句

3.8.3 break命令

3.9 小结

3.10 思考题

第4章 Julia进阶

4.1 字符串处理

4.1.1 split()

4.1.2 join()

4.1.3 正则表达式函数

4.2 定制函数

4.2.1 函数结构

4.2.2 匿名函数

4.2.3 多分派

4.2.4 函数示例

4.3 实现简单算法

4.4 创建完整解决方案

4.5 小结

4.6 思考题

第5章 Julia数据科学应用概述

5.1 数据科学工作流程

5.2 数据工程

5.2.1 数据准备

5.2.2 数据探索

5.2.3 数据表示

5.3 数据建模

5.3.1 数据发现

5.3.2 数据学习

5.4 信息萃取

5.4.1 数据产品创建

5.4.2 知识、交付物与可视化产品

5.5 保持开放型思维

5.6 在实际问题中应用数据科学流程

5.6.1 数据准备

5.6.2 数据探索

5.6.3 数据表示

5.6.4 数据发现

5.6.5 数据学习

5.6.6 数据产品创建

5.6.7 知识、交付物和可视化产品

5.7 小结

5.8 思考题

第6章 Julia数据工程

6.1 数据框

6.1.1 创建并填充数据框

6.1.2 数据框基础

6.1.3 引用数据框中的特定变量

6.1.4 探索数据框

6.1.5 筛选数据框

6.1.6 在数据框变量上应用函数

6.1.7 使用数据框进行工作

6.1.8 修改数据框

6.1.9 对数据框的内容进行排序

6.1.10 数据框的一些补充建议

6.2 导入与导出数据

6.2.1 使用.json数据文件

6.2.2 保存数据到.json文件

6.2.3 将数据文件加载到数据框

6.2.4 保存数据框到数据文件

6.3 数据清洗

6.3.1 数值型数据的清洗

6.3.2 文本型数据的清洗

6.4 数据格式化与转换

6.4.1 数值型数据的格式化

6.4.2 文本数据的格式化

6.4.3 数据类型的重要性

6.5 对数值型数据进行转换

6.5.1 标准化

6.5.2 离散化(分箱)与二值化

6.5.3 二值变量转换为连续型变量(仅对于二值分类问题)

6.5.4 文本数据转换

6.5.5 大小写标准化

6.5.6 向量化

6.6 初步的特征评价

6.6.1 回归

6.6.2 分类

6.6.3 特征评价补充说明

6.7 小结

6.8 思考题

第7章 探索数据集

7.1 倾听数据

本章要使用的扩展包

7.2 计算基本统计量和相关性

7.2.1 变量概要

7.2.2 变量之间的相关性

7.2.3 两个变量之间的可比性

7.3 绘制统计图

7.3.1 图形语法

7.3.2 为可视化准备数据

7.3.3 箱线图

7.3.4 条形图

7.3.5 折线图

7.3.6 散点图

7.3.7 直方图

7.3.8 导出统计图到文件

7.4 假设检验

7.4.1 检验的基础知识

7.4.2 错误类型

7.4.3 灵敏度与特异度

7.4.4 显著性水平与检验力

7.4.5 KRUSKAL-WALLIS检验

7.4.6 T-检验

7.4.7 卡方检验

7.5 其他检验

7.6 统计检验附加说明

7.7 案例研究:探索OnlineNewsPopularity数据集

7.7.1 变量统计

7.7.2 可视化

7.7.3 假设

7.7.4 奇妙的T-SNE方法

7.7.5 结论

7.8 小结

7.9 思考题

第8章 构建数据空间

8.1 主成分分析

8.1.1 在Julia中使用PCA

8.1.2 独立成分分析:主成分分析的最常用替代方法

8.2 特征评价与选择

8.2.1 方法论概述

8.2.2 在Julia中使用余弦相似度进行特征评价与选择

8.2.3 在Julia中使用DID进行特征评价与选择

8.2.4 特征评价与选择方法的优缺点

8.3 其他数据降维技术

8.3.1 其他降维方法概述

8.3.2 何时使用高级降维方法

8.4 小结

8.5 思考题

第9章 数据抽样与结果评价

9.1 抽样技术

9.1.1 基本抽样

9.1.2 分层抽样

9.2 分类问题的性能指标

9.2.1 混淆矩阵

9.2.2 准确度

9.2.3 精确度与召回度

9.2.4 F1指标

9.2.5 误判成本

9.2.6 受试者工作特征(ROC)曲线及相关指标

9.3 回归问题的性能指标

9.3.1 MSE及其变种RMSE

9.3.2 SSE

9.3.3 其他指标

9.4 K折交叉验证(KFCV)

9.4.1 在Julia中应用KFCV

9.4.2 KFCV小提示

9.5 小结

9.6 思考题

第10章 无监督式机器学习

10.1 无监督式学习基础知识

10.1.1 聚类的类型

10.1.2 距离的度量

10.2 使用K-均值算法分组数据

10.2.1 使用Julia实现K-均值聚类

10.2.2 对K-均值算法的使用建议

10.3 密度和DBSCAN算法

10.3.1 DBSCAN算法

10.3.2 在Julia中应用DBSCAN

10.4 层次聚类

10.4.1 在Julia中使用层次聚类

10.4.2 何时使用层次聚类

10.5 聚类的验证方式

10.5.1 Silhouettes

10.5.2 关于聚类验证的一些建议

10.6 关于有效进行聚类的一些建议

10.6.1 处理高维数据

10.6.2 标准化

10.6.3 可视化建议

10.7 小结

10.8 思考题

第11章 监督式机器学习

11.1 决策树

11.1.1 在Julia中使用决策树

11.1.2 关于决策树的一些建议

11.2 回归树

11.2.1 在Julia中实现回归树

11.2.2 关于回归树的一些建议

11.3 随机森林

11.3.1 在Julia中使用随机森林进行分类

11.3.2 在Julia中使用随机森林进行回归

11.3.3 关于随机森林的一些建议

11.4 基本神经网络

11.4.1 在Julia中使用神经网络

11.4.2 关于神经网络的一些建议

11.5 极限学习机

11.5.1 在Julia中使用ELM

11.5.2 关于ELM的一些建议

11.6 用于回归分析的统计模型

11.6.1 在Julia中使用统计回归

11.6.2 关于统计回归的一些建议

11.7 其他监督式学习系统

11.7.1 提升树

11.7.2 支持向量机

11.7.3 直推式系统

11.7.4 深度学习系统

11.7.5 贝叶斯网络

11.8 小结

11.9 本章思考题

第12章 图分析

12.1 图的重要性

12.2 定制数据集

12.3 图的统计量

12.4 环的检测

用Julia检测环

12.5 连通子图

12.6 团

12.7 图的最短路径

12.8 最小生成树

12.8.1 在Julia中实现MST

12.8.2 用文件保存和加载图

12.9 Julia在图分析中的作用

12.10 小结

12.11 思考题

第13章 更上一层楼

13.1 Julia社区

13.1.1 与其他Julia用户进行交流

13.1.2 代码库

13.1.3 视频文件

13.1.4 新闻

13.2 学以致用

13.2.1 从这些特征开始

13.2.2 关于这个项目的一些思考

13.3 在数据科学中使用Julia的最后思考

13.3.1 不断提高Julia编程水平

13.3.2 贡献Julia项目

13.3.3 Julia在数据科学中的未来

附录A 下载安装Julia与IJulia

附录B 与Julia相关的一些常用站点

附录C 本书所用的扩展包

附录D Julia与其他平台的集成

D.1 Julia与R的集成

D.1.1 在R中运行Julia脚本

D.1.2 在Julia中运行R脚本

D.2 Julia与Python的集成

D.2.1 在Python中运行Julia脚本

D.2.2 在Julia中运行Python脚本

附录E Julia中的并行处理

附录F 各章思考题答案

欢迎来到异步社区!

Julia数据科学应用是2018年由人民邮电出版社出版,作者 (美) 弗格里斯 (Zacharias Voulgaris) 。

得书感谢您对《Julia数据科学应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
数亦有道:Python数据科学指南 电子书
本书以问题为导向,用具体应用场景讲明白如何选择、使用合适的数据科学工具。
Foxtable数据库应用开发宝典 电子书
1.“职场小白”秒变“数据大咖” Foxtable以Excel之表,管理着数据库之芯:数据录入、查询统计、表间关联、报表生成……全部手到拈来,无须编写任何代码。 2.二次开发不求人 可以十倍于Excel VBA的工作效率,开发出符合自身需要且能无限分发的数据管理软件。开发过程中仅需关注商业逻辑,无须纠缠于具体功能的实现,因为Foxtable已经做了大量模块化的处理。 3.一夫当关,玩转全端 Foxtable拥有简单的服务器搭建方式,使用户无须其他任何第三方工具即能实现数据在C/S和B/S上的共享,轻松玩转PC端与移动端。
MySQL数据库技术与应用 电子书
MySQL是目前最流行的关系数据库管理系统之一。本书以MySQL5.6数据库管理系统为平台,以案例教学法为编写主线,介绍了数据库系统的基本概念和应用技术。本书以学生选课管理系统作为教学案例,以网上书店作为实训案例,采用“学习要点—内容示例—归纳总结—习题实训”的结构体系设计每章内容。最后一章以一个具体的项目案例开发设计过程,将数据库原理知识与实际数据库开发结合在一起。本书采用在线开放课程教学方式,
大数据导论 思维、技术与应用 电子书
本书以基本概念与实例相结合的方法,由浅入深、顺序渐进的对大数据思维、技术和应用做了全面系统的介绍。全书共12章,分为大数据基础篇、大数据存储篇、大数据处理篇、大数据挖掘篇和大数据应用篇。每个知识节点都配有与理论学习内容相结合的案例介绍和代码实例,并在每章后面都配有丰富的作业。
Excel商务数据分析与应用 电子书
本书以实践中商务数据分析工作的基本流程为主线,讲解相关人员在商务数据分析工作中所需掌握的基础知识,并通过“实践练习”环节提升读者应用所学知识来解决实际问题的能力。本书共7章。第1章概要介绍商务数据分析的基本情况,第2章~第6章讲解商务数据分析各个步骤的相关知识点及其应用,第7章要求读者综合应用前面各章内容完整地解决一个实践领域中的问题。本书每章都配备真实案例供读者学习,以增强读者的实战能力。本书配