100 条"干净的数据:数据清洗入门与实践"搜索结果
走近大数据 电子书
  • 中国通信企业协会 段云峰 张韬
  • 本书首先介绍了大数据的一些基本概念,阐述了大数据发展的历史必然性;然后围绕大数据生态的各个技术和组件进行了基本的介绍;接着介绍了建设大数据系统要考虑的一些关键内容;最后以附录的形式给出了一些企业建设大数据系统的案例。
大数据导论 电子书
  • 甘勇,陶红伟
  • 随着大数据时代的到来,涌现出多元化海量数据。大数据背后隐藏着大量的经济利益,尤其是通过数据整合、分析与挖掘,其所表现出的数据整合与控制力量已经远超以往。本书详细介绍了数据科学与大数据技术的详细内容。共分为9章,主要内容包括:大数据与数据科学、数据采集与数据预处理、数据存储、大数据处理平台、数据分析、数据可视化、数据安全与隐私、大数据应用、数据思维。  本书适合作为数据科学与大数据专业及其相关专业本
数据存储技术 电子书
  • 本书是华为ICT学院数据存储技术官方教材,旨在帮助学生学习数据存储技术的基本概念和原理、以及存储系统的搭建和使用。本书从信息传递方式的变迁引出数字化信息管理与存储的概念,进而概述存储系统构成和存储基础技术,再以磁盘阵列技术作为案例来阐述在同一存储设备上获得性能、容量、可用性三方面提升的设计思路;接下来从存储接口、传输协议、关键技术和功能支持等方面来讨论几类存储系统,包括直接连接存储、存储区域网络、
大数据导论 电子书
  • 林子雨
  • 本书内容包括大数据概述、大数据与其他新兴技术的关系、大数据基础知识、大数据应用、数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化、大数据分析综合案例。
解惑大数据 电子书
  • 丁圣勇 樊勇兵 闵世武 编著
  • 《解惑大数据》是一本系统介绍大数据的技术普及读物,可帮助读者迅速了解大数据的概况。全书分为4章,共120个问题,内容涵盖大数据概念、大数据技术、大数据应用等各个方面。第1章为大数据概述篇,介绍了大数据的概念、技术特点及应用方向等;第2章为分布式平台篇,介绍了大数据的核心计算平台;第3章为分布式数据库篇,介绍大数据中广泛使用的分布式数据库;第4章为大数据与数据挖掘篇,介绍经典的数据挖掘算法以及大数据
大数据营销 电子书
  • 陈佳 主编
  • 本书分为4篇13章。其中,第1章到第4章属于基础篇,主要介绍大数据概述、大数据营销概述、大数据时代的消费者行为分析、大数据广告营销等内容。第5章、第6章属于工具篇,主要介绍精准营销、大数据搜索营销等内容。第7章到第11章属于智能应用篇,主要介绍当前热门的大数据营销应用领域,包括App营销、微信营销、微博营销、O2O营销、短视频与直播营销等内容。第12章、第13章属于拓展篇,主要介绍跨界营销、其他大
基于Hadoop与Spark的大数据开发实战 电子书
  • 肖睿 丁科 吴刚山
  • 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Knative快速入门与实践 电子书
大数据实践:赋能数字中国建设 电子书
  • 周斌
  • 本书聚焦数字中国建设过程中大数据的形成和开发实践,在数据产生过程中明确了数据标准和数据基础结构;在数据交换过程中定义了数据交换的规则;在数据治理过程中详细描述了数据治理的方法论和工具;在数据应用上具体描述了不同职能部门的业务指标,为指挥调度、相关决策提供数据分析结果。本书对专业知识融会归纳,有的放矢,以大数据在数字中国建设实践的视角给予读者全面、详细的开发指导。本书可用于大数据工程师、数字中国信息
Python在数据分析中的应用——统计分析方法与计量模型实践 电子书
  • 饶艳超
  • Python是当前最流行的数据分析工具之一,在做数据分析时我们经常会用到一些统计学基础知识和概念,如概率,分布,直方图,箱体图,分位数等,会构建统计分析模型和计量经济模型进行探索性分析、回归分析、方差分析、时间序列分析等,进行模型的参数估计和估计参数的假设检验等。本书关注Python在数据分析中的应用,结合具体示例讲解如何应用Python进行多元回归分析、如何进行多元统计分析推断、如何设定模型和数
大数据时代的调查师 电子书
  • 顾佳峰
  • 适读人群:职业经理人、调查业者和研究生、高年级本科生。本书结合大量的企业案例,采用通俗易懂的语言,深入浅出地阐述了精准调查和分析的原理、方法和具体应用,从抽样、测量、问卷设计、调查实施、数据分析、第三方评估和报告撰写这些方面,以抽丝剥茧的方式来进行论述,适合职业经理人、调查业者和即将进入职场的大学生读者进行阅读。精准调查和分析能力成为了大数据时代的人们工作和生活需要的一种能力和素质,本书对于这种能力的开发和提升,无疑具有显著的促进作用。本书特点是从实践应用的角度来阐述精准调查和分析的相关理论,在理论和实践中搭建了一条牢固的桥梁。即便是非调查专业人士,都可以读懂和理解精准调查和分析,并掌握相关的技能,从而在大数据时代中不落伍。全书思想深刻而充满了新意,观点清晰而独到,案例丰富,行文流畅,深入浅出,是一部难得的佳作。
大数据:挖掘数据背后的真相 电子书
大数据时代的营销传播 电子书
  • 阳翼 编
  • 近年来,大数据经经济社会的各个领域带来了革命性的变化,广告业更是走在前列的若干领域之一。本书收录了“大数据时代的营销传播:第三届数字营销传播研究与应用国际研讨会”的前瞻性演讲实录和学术论文,内容涉及大数据时代营销传播的现状与趋势、策略与方法、效果与伦理等,可为学界研究和业界实践提供借鉴和参考。
全数据时代的炼金师 电子书
  • 顾佳峰
  • 本书用生动活泼的语言,结合古今中外实例来分析数据科学发展历程及其趋势,探讨大数据和调查数据在现实社会中的妙用,便于人们全面认识各种数据的特征及数据融合的力量,提高人们数据利用能力。本书还深入论述了社会生活中人们如何通过“数据修炼”来训练全数据思维,掌握从浩繁数据中获取有价值信息的能力,成为数据时代的“炼金师”,使得数据为我所用。这是一部适合数据时代所有人阅读的书籍,相信广大读者都能从中获得启发和助
基于大数据的内部控制 电子书
  • 徐礼礼
  • 本书是应用型本科学校会计学与财务管理专业系列教材之一。全书共13章,分三个部分,第一部分理论篇包括第1章企业内部控制概述,第2章大数据时代的内部控制,第3章互联网金融企业的风险管控要点。第二部分技术篇介绍了第4章人力资源管理,第5章资产管理,第6章公司财务管理,第7章互联网金融业务管理。第三部分实战篇包括第8章财务报表管理控制——上市公司,第9章大数据与会计信息化,第10章大数据环境下的云审计,第
驭数之道:还原真实场景的企业大数据应用实践 电子书
  • 中国信息通信研究院 人民邮电报社
  • 驭数之道依托中国信息通信研究院主办的大数据“星河奖”评选结果,在全国两百多项大数据应用的成功实践中甄选出20余个涉及金融、政务、通信、地产、交通、工业等多个行业的具有突出创新的应用和平台建设实践案例,是一本以案例为主的大数据实践指南。
企业数据治理与SAP MDG实现 电子书
  • 程旺
  • 深度解析企业数据治理工程,助力企业数字化转型。
PythonQtGUI与数据可视化编程 电子书
  • 张晓东
  • PythonPyQt5编写GUI应用程序及数据可视化方法
PySpark大数据分析与应用 电子书
  • 戴刚
  • 本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
数据可视化基础与应用 电子书
  • 刘佳
  • 本书共9章,由浅入深地介绍各类数据可视化技术及相关可视化工具的使用方法,力求培养读者对数据可视化的认知以及动手能力。第1章和第2章是基础应用,介绍数据可视化的定义、作用和发展历史,以及如何使用Excel进行数据可视化;第3章~第5章介绍数据可视化工具Tableau的基本使用方法;第6章~第9章详细介绍如何利用代码实现数据可视化,包括前端数据可视化、使用JavaScript实现数据可视化、大屏数据可