100 条"数据湖仓"搜索结果
数据科学基础实践教程 电子书
  • 陈展荣 刘小丽 余宏华 杜宝荣
  • 本书以数据处理为主线,介绍了数据处理的基本原理、算法的可视化工具、常见算法的思想、Python程序设计及算法实现,以及常用的图文制作工具。
数据采集与预处理 电子书
  • 米洪 张鸰
  • 本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机
Python大数据应用基础 电子书
  • 吕会红 邱静怡
  • 本书内容由浅入深,实例指导性强,通过大量的实例讲述Python程序设计基础,同时结合Python语言的特性,讲解各类基于Python的大数据应用实例。本书全部例题代码适用于Python3.6及更高版本。全书共13章,主要内容包括大数据及Python概述,Python基础知识、程序流程控制结构、常用组合数据类型、函数与模块、面向对象程序设计、文件相关操作、数据预处理和数据分析、使用NumPy进行处理
大数据财务管理 电子书
  • 张奇
  • 大数据时代,如何挖掘蕴藏在数据背后的宝贵信息,从而让数据开口“说话”,为企业经营决策提供科学依据?如何利用好大数据,降低运营成本,减少经营风险?这是当下很多企业要攻克的难题。本书全面解读了大数据环境下财务管控模式和流程创新、企业定位、成本管控、投资决策、商业模式创新、全面预算体系建设等关键问题,可以帮助企业利用好大数据,提升财务管理效率和经营业绩。
大数据处理平台 电子书
  • 宋杰
  • 本书从数据查询、数据分析和迭代计算平台3个方面对大数据处理平台的体系结构、基本原理、主流技术、国内外研究进展和成果进行了全面、深入的阐述,对大数据实时处理平台的架构和核心技术进行了展望。企业技术人员可参考本书选择合适的技术构建大数据处理平台或对现有平台进行优化;高校院所的科研人员可参考本书了解大数据管理的基本原理和现有研究成果;学生读者可通过学习本书全面了解大数据处理平台。同时,本书也适用于对大数
数据结构(C语言) 电子书
  • 王海艳
  • 本书介绍了数据结构的基本概念和基本算法,共分10章。各个章节分别是第1章概述,第2章线性表,第3章栈与队列,第4章数组和矩阵,第5章树,第6章搜索,第7章搜索树,第8章散列表,第9章图,第10章排序。
MySQL数据库教程 电子书
  • 郑阿奇
  • 本书以当前较流行的MySQL5.7作为平台,系统介绍MySQL数据库原理及其应用。具体内容涉及MySQL初步、MySQL数据库和表、MySQL查询和视图、MySQL索引与完整性约束、MySQL语言、MySQL存储过程函数触发器事件、MySQL数据库备份与恢复、MySQL用户权限维护和MySQL十五管理。通过实验对命令进行操作练习,保证实验内容和教程同步,教程实例和实验实例分别自成系统,简单方便。在
七周七数据库 电子书
大数据可视化 电子书
  • 匡泰,周苏
  • “大数据可视化”是一门理论性和实践性都很强的课程。本书为高等职业院校相关专业“大数据可视化”课程全新设计编写,针对高等职业院校学生的发展需求,系统、全面地介绍大数据可视化的基本知识和技巧,包括数据可视化之美、Excel数据可视化方法与应用、数据引导可视化设计、数据可视化过程、数据可视化组织、Tableau应用初步、Tableau数据管理、Tableau可视化分析、Tableau仪表板与故事以及Ta
数据科学的数学基础 电子书
  • 卢力
  • 本书共11章,主要内容包括:线性代数基础、线性空间与线性变换、向量与矩阵范数、矩阵分解、概率统计基础、随机过程等。
大数据和大分析 电子书
  • 段云峰
  • 本书首先参阐述大数据出现的背景,解释数据资产、数据驱动等基本概念,剖析数据分析的重要性,介绍了大分析的内容和范围、关键点等;其次,阐述了大数据建设的基本内容和有关应用领域等,涉及收集、存储、标准、技术选择等内容,重点介绍了数据质量、安全管理等数据管控的内容;结尾,给出了大数据建设配套的人才、管理结构等方面的内容和经验,分享如何引入互联网思维,开辟新视野的理念。
图数据库实战 电子书
  • [美] 戴夫·贝克伯杰
  • 图数据库入门教程书籍,采用Gremlin语言,完整展示图应用程序的构建过程,从入门到实践学习图数据库。
大数据开发项目实战 电子书
  • 祝锡永,张良均 主编
  • 本书以项目案例为导向,贯穿讲解一个大数据的实战项目:广电大数据用户画像。全书共8章,具体内容包括大数据项目概述、Hadoop生态组件基础、广电大数据用户画像——需求分析、广电大数据用户画像——数据采集与预处理等。
Python商业数据分析 电子书
  • 编著
  • 全书共12章,主要内容包括:商业数据分析概论、Python商业数据存取、Python商业数据图形绘制与可视化、Python描述性统计、Python参数估计、Python参数假设检验、Python相关分析、Python一元线性回归分析、Python多元线性回归分析、Python时间序列分析、Python量化金融数据分析、Python机器学习。
Excel数据获取与处理 电子书
  • 杨怡滨 张良均
  • 本书以项目为导向,由浅入深地介绍Excel2016在数据获取与处理中的应用。全书共14个项目,项目1简单介绍Excel2016的界面,以及工作簿、工作表、单元格的概念;项目2介绍各种类型数据的输入;项目3介绍如何美化工作表;项目4介绍如何使用Excel获取文本数据;项目5介绍如何使用Excel获取网站数据;项目6介绍如何使用Excel获取MySQL数据库中的数据;项目7介绍如何对数据进行排序;项目
云数据中心基础 电子书
  • 戴经国 何丰 王国滨 郭炳宇 姜善永
  • 本教材共介绍7个项目,项目1为云数据中心认知,主要介绍了什么是数据中心、云数据中心的特点、体系结构、云数据中心和传统数据中心的区别、绿色数据的概念以及发展趋势。项目2介绍了云数据中心的规划与设计,主要包括云数据中心的设计建设的指标、基础设施的规划以及云数据中心的优化策略。项目3介绍了云数据中心的硬件选型,主要包括服务器设备、网络设备以及存储设备的介绍和选型。项目4到项目6则重点介绍了虚拟化技术、云
数据共享与数据整合技术 电子书
  • 叶树江、耿生玲、谢锟、郭炳宇、姜善永
  • 本教材一共6个项目,项目1为SOA基础知识导入,主要介绍了SOA的基本概念、发展历程,与企业IT战略之间的关系;项目2介绍了Web服务的相关基础知识,包括Web服务的体系结构特性、服务规范、SOAP、WSDL、UDDI等;项目3介绍了ESB的相关知识,明确了ESB与EAI之间的关系,介绍了SOA思想针对实际问题的具体实现思路,重点讲解了iESB引擎和iESB设计器的安装配置方法;项目4至项目6比较
Hadoop数据仓库实战 电子书
  • 肖睿 兰伟 廖春琼
  • 本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
Python数据可视化 电子书
  • 黑马程序员
  • 本书共分为9章,第1章介绍数据可视化与matplotlib的入门知识;第2-8章全面地介绍matplotlib的核心知识,包括使用matplotlib绘制简单图表、图表辅助元素的定制、图表样式的美化、子图的绘制及坐标轴共享、坐标轴的定制、绘制3D图表和统计地图、使用matplotlib绘制高级图表;第9章介绍pyecharts的基础知识。
大数据技术与应用 电子书
  • 胡大威,孙琳
  • 本书教学设计遵循教学规律,对真实项目进行了科学拆分与提炼。主要内容分为Hadoop大数据技术基础与Hadoop大数据分析案例两部分,前者包括大数据的有关概念、Hadoop概述、Hadoop集群的部署与管理、HDFS、MapReduce编程以及Hadoop生态的其他常用组件ZooKeeper、HBase、Hive、Sqoop、Flume、Storm、Kafka的工作原理、安装部署和使用方法,后者通过