KNIME视觉化数据分析

KNIME视觉化数据分析

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书与读者一同探讨和思考数据分析的基本概念、需求、方案等问题,并以KNIME为工具,展示数据分析的具体流程。

内容简介

本书对KNIME中的众多节点进行了介绍,对各节点的难度和重要性进行了标记,以便新手更快地学习,对节点的覆盖性说明和一些高级内容,会让读者更深入地了解和使用KNIME。对所有日常有数据分析需求的读者来说,本书能帮助其轻松应对大部分常见的数据分析问题,是一本不可多得的KNIME使用参考书。

按照当今的流行术语来说,KNIME是一款通用型的低代码(low code)数据分析软件,也就是说,它的主要操作方式通过"拖拉曳”就能完成。本书适合所有日常有数据分析需求的读者,能帮助其轻松应对大部分常见的数据分析问题。

作者简介

作者雒玉玺,即“指北君”,拥有十多年数据分析经验的专家,专注于最新的数据分析、机器学习和人工智能技术,在金融、制造、零售、医疗保健、生命科学等行业有丰富的实践经验。全面掌握数据分析相关技术,具有高效的分析能力,提供数据方面的咨询和培训服务。此外,独立运营公众号 "数据分析指北",欢迎关注互动。

章节目录

版权信息

内容简介

自序

第1章 数据分析方法论

1.1 基本要求与基础概念

1.1.1 目标读者

1.1.2 楔子

1.1.3 厘清谁是数据的所有者

1.1.4 成为科学家还是工程师

1.2 方法论

1.2.1 你的问题是什么

1.2.2 问题的解空间

1.2.3 科学方法

1.2.4 “然后呢”

1.2.5 CRISP-DM数据挖掘的跨行业标准流程

1.3 后续内容

第2章 KNIME使用基础

2.1 权衡数据分析的需求与解决方案

2.1.1 制定实施方案

2.1.2 案例:一次关于工具选型的聊天

2.2 KNIME简介、生态圈和资源

2.2.1 KNIME简介

2.2.2 当我们提到KNIME时,具体是指什么

2.2.3 KNIME的相关资源

2.3 安装KNIME及其扩展

2.3.1 安装KNIME分析平台

2.3.2 启动KNIME

2.3.3 安装KNIME扩展

2.3.4 卸载KNIME扩展

2.4 KNIME的使用

2.4.1 关于KNIME界面

2.4.2 KNIME使用简介

2.4.3 导入和导出现有工作流

2.4.4 例子服务器及Hub的使用

2.5 遇到问题怎么办

第3章 KNIME数据分析基础

3.1 数据来源及轮廓

3.1.1 了解原始数据来源

3.1.2 了解轮廓,进行探索性分析

3.1.3 一个好例子

3.1.4 房价例子

3.2 计算机如何处理表格数据

3.2.1 基础数据操作

3.2.2 展示示例数据

3.2.3 具体的小问题

3.3 基础操作之读取数据源

3.3.1 读取文件

3.3.2 读取数据库

3.3.3 导入之前的数据

3.4 基础操作之挑选(select)操作

3.4.1 了解完备概念

3.4.2 你会几种编程语言

3.4.3 回顾之前的问题

3.4.4 SQL中的挑选操作

3.4.5 KNIME中的挑选操作

3.5 基础操作之CASE、group by和join

3.5.1 条件操作、缺失值和排序

3.5.2 分组操作——group by

3.5.3 子查询——subquery

3.5.4 连接操作——join

3.5.5 使用KNIME完成之前的问题

3.6 了解KNIME中的重要概念

3.6.1 了解路径

3.6.2 了解节点基础

第4章 KNIME基础节点——数据访问类型

4.1 IO节点集合

4.1.1 Read(读)目录下的节点

4.1.2 File Folder Utility(文件、文件夹工具)目录下的节点

4.1.3 Other(其他)目录下的节点

4.1.4 文件处理节点的补充说明

4.2 DB节点集合

4.2.1 Connection(连接)目录下的节点

4.2.2 获取数据的两种模式

4.2.3 Query(查询)目录下的节点

4.2.4 Read/Write(读/写)目录下的节点

4.2.5 Utility(工具)目录下的节点

4.3 JSON、XML类型

4.3.1 JSON格式介绍与解析

4.3.2 XML格式介绍与解析

4.3.3 JSON与XML的相应节点

4.4 Web相关节点

4.5 NoSQL相关节点

4.6 网络数据访问

4.6.1 网络数据简要说明

4.6.2使用GET/POST Request节点

4.6.3 其他

第5章 KNIME基础节点——转换类型

5.1 Column(列)处理节点集合

5.1.1 Binning(分桶)目录下的节点

5.1.2 Convert & Replace(转换 & 替换)目录下的节点

5.1.3 Filter(过滤)目录下的节点

5.1.4 Split & Combine(分割与组合)目录下的节点

5.1.5 Transform(转换)目录下的节点

5.1.6 其他的列处理节点

5.2 Row(行)处理节点集合

5.2.1 Filter(过滤)目录下的节点

5.2.2 Transform(转换)目录下的节点

5.2.3 GroupBy(分组聚合)节点

5.2.4 Pivoting(转轴或透视)节点

5.2.5 其他行处理节点

5.3 Table(表)处理节点集合

5.4 PMML节点集合

5.5 时间数据类型相关操作

第6章 KNIME基础节点——分析和数据挖掘类型

6.1 机器学习简述

6.1.1 监督学习和非监督学习

6.1.2 基本概念和约定

6.1.3 模型选择、超参优化及错误分析

6.2 Analytics节点集合

6.2.1 学习器(Learner)和预测器(Predictor)

6.2.2 Feature Selection(特征选择)节点

6.2.3 Scoring(记分)目录下的节点

6.2.4 Statistics(统计)类节点

6.2.5 Distance Calculation(距离计算)类节点

6.3 探索性数据分析(EDA)练习

6.3.1 泰坦尼克号

6.3.2 数据探索

6.3.3 对原始数据进行粗略观察

6.3.4 进一步观察数据

6.4 简单的机器学习练习——使用KNIME中的决策树算法

第7章 进阶话题——流变量与控制循环结构

7.1 流变量从入门到精通

7.1.1 了解流变量

7.1.2 生成流变量

7.1.3 使用流变量

7.1.4 流变量的操作

7.1.5 流变量的特别使用方式

7.2 循环(Loop)结构

7.2.1 两种Loop End(循环结束)节点

7.2.2 递归循环

7.2.3 循环的调试

7.2.4 和流变量有关的循环

7.2.5 其他循环

7.3 分支(Switches)结构

7.3.1 IF Switch节点

7.3.2 Java IF(Table)节点

7.3.3 CASE Switch类节点

7.3.4 Empty Table Switch(空表切换)节点

7.3.5 其他说明

7.4 错误处理

7.4.1 Try…Catch结构

7.4.2 举例:循环中的Try...Catch结构

7.4.3 其他

第8章 进阶话题——数据可视化、模块化与编程节点

8.1 数据可视化

8.1.1 数据可视化简介

8.1.2 KNIME中的可视化节点简介

8.1.3 以折线图(Line Plot)为例介绍可视化相关节点

8.1.4 其他可视化图表

8.1.5 通用可视化节点——Generic JavaScript View

8.2 模块化

8.2.1 KNIME模块化简史

8.2.2 元节点(Metanode)

8.2.3 组件(Component)

8.2.4 其他建议

8.3 生成报告

8.4 Java相关节点

8.4.1 Java Snippet(simple)节点

8.4.2 Java Snippet Row Filter(Java行过滤器)节点

8.4.3 Java Snippet节点

8.5 Python相关节点

8.5.1 Python环境配置

8.5.2 KNIME中的Python

8.5.3 Python相关节点介绍

8.5.4 与Jupyter交互

8.5.5 Conda的常用命令

第9章 高级话题

9.1 可复现性与测试

9.2 深度学习介绍

9.2.1 基于Keras的深度学习

9.2.2 基于TensorFlow 2的深度学习

9.2.3 使用现有模型进行预测

9.2.4 使用深度学习的其他方式

9.3 时间序列分析介绍

9.3.1 想要预测什么

9.3.2 时间图(Time Plot)

9.3.3 季节图(Seasonal Plot)

9.3.4 季节性子图(Seasonal Subseries Plot)

9.3.5 箱形图(Box Plot)

9.3.6 散点图(Scatter Plot)

9.3.7 滞后图(Lag Plot)

9.3.8 自相关图(Auto Correlation Plot)与偏自相关图(Partial autocorrelation function Plot)

9.3.9 时间序列的组成

9.3.10 时间序列的预处理

9.3.11 趋势(Trend)成分

9.3.12 季节性(Seasonal)成分

9.3.13 周期性(Cyclic)成分

9.3.14 经典的统计学方法

9.4 扩展开发介绍

9.5(机器学习的)集成部署(Integrated Deployment)

9.5.1 概述

9.5.2 使用举例

9.6 KNIME Server、Executor与Edge简介

9.6.1 架构简介

9.6.2 功能简介

KNIME视觉化数据分析是2023年由电子工业出版社出版,作者雒玉玺 等。

得书感谢您对《KNIME视觉化数据分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
PowerBI数据分析:报表设计和数据可视化应用大全 电子书
涉及PowerBI所有原生组件、微软APPStore的三方组件,以及上北智信科技有限公司研发的特色组件,提供全书所有组件及案例文件,帮助读者火速上手并实际应用。
Power BI数据分析与数据可视化(微课版) 电子书
本书注重基础、循序渐进,系统地讲述了Microsoft推出的智能商业数据分析软件PowerBI的相关基础知识,涵盖了安装PowerBIDesktop、获取数据、查询编辑器、数据分析表达式、数据视图、管理关系、报表、可视化效果、PowerBI服务等内容,并在最后一章以社科研究数据分析为例进行了知识点的综合讲解。对于每一个知识点,本书都尽量结合实例帮助读者学习理解。前8章最后都配有综合实例来说明本章知
数据化运营管理 电子书
网店数据化运营与营销。
Power BI商业数据分析 电子书
1. 作者是注册会计师,熟练使用PowerBI,实践经验丰富。 2. 作者的公众号现已成为国内影响力的PowerBI公众号之一,专注于PowerBI知识的分享,其文章通俗易懂、简洁干练、精彩不断,深受广大PowerBI学习者喜爱。
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。