剑指大数据:企业级数据仓库项目实战(金融租赁版)

剑指大数据:企业级数据仓库项目实战(金融租赁版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

全景介绍了金融租赁行业离线数据仓库的搭建过程。

内容简介

本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了金融租赁行业离线数据仓库的搭建过程。在整个数据仓库的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并在其中穿插了许多大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、金融租赁业务概述、数据仓库理论介绍和数据仓库建模等。

本书的第1章至第3章是项目前期准备阶段,主要为读者介绍了数据仓库的概念、应用场景和搭建需求等,并初步搭建了数据仓库项目所需的基本环境;第4章至第5章是数据仓库搭建的核心部分,详细为读者讲解了数据仓库建模理论和数据从采集到分层搭建的全过程,是本书的重点;第6章至第7章介绍了全流程调度和指标可视化。

作者简介

尚硅谷教育,一家专业的IT教育培训机构,开设了JavaEE、大数据、HTML5前端等多门学科,在互联网上发布的JavaEE、大数据、HTML5前端、区块链、C语言、Python等技术视频教程广受赞誉。

章节目录

版权信息

内容简介

前言

第1章 数据仓库概论

1.1 数据仓库的概念与特点

1.2 数据仓库的演进过程

1.3 数据仓库技术

1.4 数据仓库基本架构

1.5 数据库和数据仓库的区别

1.6 学前导读

1.6.1 学习的基础要求

1.6.2 你将学到什么

1.7 本章总结

第2章 项目需求描述

2.1 前期调研

2.2 项目架构分析

2.2.1 金融租赁行业简介

2.2.2 金融租赁数据仓库产品描述

2.2.3 系统功能结构

2.2.4 系统流程图

2.3 项目业务概述

2.3.1 数据采集模块业务描述

2.3.2 数据仓库需求业务描述

2.3.3 数据可视化业务描述

2.4 系统运行环境

2.4.1 硬件环境

2.4.2 软件环境

2.5 本章总结

第3章 项目部署的环境准备

3.1 集群规划与服务器配置

3.2 安装JDK与Hadoop

3.2.1 准备虚拟机环境

3.2.2 安装JDK

3.2.3 安装Hadoop

3.2.4 Hadoop的分布式集群部署

3.3 本章总结

第4章 业务数据采集模块

4.1 金融租赁业务概述

4.1.1 金融租赁业务流程

4.1.2 业务表结构

4.2 数据同步

4.2.1 数据同步策略

4.2.2 数据同步工具选择

4.3 环境准备

4.3.1 安装DataX

4.3.2 安装Maxwell

4.3.3 安装ZooKeeper

4.3.4 安装Kafka

4.3.5 安装Flume

4.4 模拟业务数据

4.4.1 安装MySQL

4.4.2 数据模拟

4.5 业务数据的采集

4.5.1 全量同步

4.5.2 增量同步

4.6 采集通道启动和停止脚本

4.7 本章总结

第5章 数据仓库搭建模块

5.1 数据仓库理论准备

5.1.1 数据建模概述

5.1.2 关系模型与范式理论

5.1.3 维度模型

5.1.4 维度建模理论之事实表

5.1.5 维度建模理论之维度表

5.1.6 星形模型、雪花模型与星座模型

5.2 数据仓库建模实践

5.2.1 名词概念

5.2.2 为什么要分层

5.2.3 数据仓库搭建流程

5.2.4 数据仓库开发规范

5.3 数据仓库搭建环境准备

5.3.1 安装Hive

5.3.2 Hive on Spark配置

5.3.3 YARN容量调度器并发度问题

5.3.4 数据仓库开发环境配置

5.3.5 模拟数据准备

5.3.6 复杂数据类型

5.4 数据仓库搭建——ODS层

5.4.1 ODS层表格的创建

5.4.2 ODS层业务数据导入脚本

5.5 数据仓库搭建——DIM层

5.5.1 部门维度表(全量)

5.5.2 员工维度表(全量)

5.5.3 行业维度表(全量)

5.5.4 DIM层每日数据装载脚本

5.6 数据仓库搭建——DWD层

5.6.1 审批域金融租赁全流程累积快照事实表

5.6.2 DWD层首日数据装载脚本

5.6.3 DWD层每日数据装载脚本

5.7 数据仓库搭建——ADS层

5.7.1 待审/在审项目主题指标

5.7.2 已审项目主题指标

5.7.3 已审项目转化主题指标

5.7.4 ADS层数据导入脚本

5.8 数据模型评估及优化

5.9 本章总结

第6章 DolphinScheduler全流程调度

6.1 DolphinScheduler概述与安装部署

6.1.1 DolphinScheduler概述

6.1.2 DolphinScheduler安装部署

6.2 创建MySQL数据库和表

6.3 DataX数据导出

6.4 全流程调度

6.4.1 数据准备

6.4.2 全流程调度配置

6.5 电子邮件报警

6.5.1 注册邮箱

6.5.2 配置电子邮件报警

6.6 本章总结

第7章 数据可视化模块

7.1 部署FineBI

7.1.1 安装

7.1.2 初始化

7.2 数据源的配置

7.2.1 配置数据连接

7.2.2 配置数据源

7.3 制作图表

7.3.1 制作堆积柱状图

7.3.2 制作饼状图

7.3.3 制作多系列柱状图

7.3.4 制作仪表板

7.4 本章总结

剑指大数据:企业级数据仓库项目实战(金融租赁版)是2024年由电子工业出版社出版,作者尚硅谷教育 编著。

得书感谢您对《剑指大数据:企业级数据仓库项目实战(金融租赁版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python数据分析案例实战(慕课版) 电子书
全书共分10章,内容包括数据分析基础、NumPy模块实现数值计算、pandas模块实现统计分析、Maplotlib模块实现数据可视化、客户价值分析、销售收入分析与预测、二手房数据分析预测系统、智能停车场运营分析系统、影视作品分析和看店宝。
Java编程技术与项目实战(第2版) 电子书
本书从Java语言的基本特点入手,全面介绍了Java语言的基本概念和编程方法,并扼要介绍了Java的高特。全书内容涉及Java基本语法、数据类型、异常、界面设计、小应用程序、I/O数据流、线程等内容,这些内容基本覆盖了Java的实用技术,是进一步使用Java进行技术开发的基础。
HADOOP大数据开发实战 电子书
Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
图数据库实战 电子书
图数据库入门教程书籍,采用Gremlin语言,完整展示图应用程序的构建过程,从入门到实践学习图数据库。
Calcite数据管理实战 电子书
Calcite数据库原理及应用教程,SQL大数据技术原理及应用,帮助你解决数据源管理难题。