100 条"Spark大数据分析实战"搜索结果
  • 高彦杰
  • 微软资深Spark工程师从核心技术、算法、系统架构、应用场景等角度,深入讲解Spark大数据分析的各种技术和方法。
大数据开发项目实战 电子书
  • 祝锡永,张良均 主编
  • 本书以项目案例为导向,贯穿讲解一个大数据的实战项目:广电大数据用户画像。全书共8章,具体内容包括大数据项目概述、Hadoop生态组件基础、广电大数据用户画像——需求分析、广电大数据用户画像——数据采集与预处理等。
HADOOP大数据开发实战 电子书
  • 杨力
  • Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
数权法1.0:数权的理论基础 电子书
  • 主编
  • 《数权法1.0》基于“数据人”假设,创新性地提出了“数权法”的概念,试图建构一个“数权—数权制度—数权法”的法律架构,这必定会成为法学领域的创新与突破,在中国乃至世界范围内都具有划时代的意义。从农耕文明到工业文明再到数字文明,人类从“人权”“物权”迈向“数权”时代,法律将实现从“人法”到“物法”再到“数法”的跃迁。数权法是人类迈向数字文明的新秩序,是时代进化的产物。
Spark海量数据处理:技术详解与平台实战 电子书
  • 范东来
  • 在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架ApacheSpark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了StructuredStreaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
财务大数据分析与可视化 电子书
  • 李静
  • 本教程选用微软PowerBI为数据分析工具,将10个项目划分为应用入门、进阶提升和财务综合应用三个循序渐进的学习阶段。应用入门包括财务大数据与可视化分析认知、PowerBI初体验、数据获取与整理、数据建模和数据可视化5个项目;进阶提升包括PowerBI动态交互、数据可视化分析实例和爬虫案例分析3个项目;财务综合应用包括财务数据可视化智能分析和应收账款数据可视化分析2个综合案例。本书结构合理、案例丰
病案首页大数据分析与应用 电子书
  • 肖兴政
  • 本书主要包含四个部分,包括对病案首页内涵与标准、病案首页数据汇集与质量管理、病案首页数据分析与应用以及病案数据分析应用展望。其中病案首页数据分析与应用部分是本书的特色部分,区别于一般基于服务能力/效率、质量安全以及患者入/离院方式的分析思路,本书在大数据分析基础上,从患者人员流动、医疗资源监测与规划以及医疗共同体几个方面利用病案首页数据提出新的分析思路,以推进对病案首页数据的进一步价值挖掘,更好的
大数据技术基础与实战 电子书
  • 编著
  • 本书主要内容包括:大数据技术概述、Linux基础与集群搭建、Hadoop集群配置、HDFS、MapReduce分布式编程、Hive大数据仓库、HBase数据库部署与操作、数据获取与Flume应用、基于Spark的内存计算,以及利用大数据平台处理图像。
Spark最佳实践 电子书
  • 林世飞
  • 腾讯专家首次分享Spark最新实践,基于真实数据,用案例分析全面解读大数据应用设计!
Spark编程基础 电子书
  • 林子雨
  • 系统、完整的数据科学与大数据技术专业解决方案。深入浅出,有效降低Spark技术学习门槛。
Python商务数据分析与实战 电子书
  • 何伟,张良均 主编
  • |a本书以Python数据分析常用技术与真实案例相结合的方式,介绍Python商务数据分析应用的重要内容。全书共10章,内容包括:商务数据分析概述、Python数据分析简介、数据获取、探索性分析、数据预处理等。
Python数据分析与挖掘实战 电子书
  • 翟世臣,张良均 主编
  • 本书共11章,分为基础篇(第1-5章)和实战篇(第6-11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识:实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预测、电视产品个性化推荐,以及基于TipDM大数据挖掘建模平台实现金融服务机构资金流量预测。本书大部分章节包含实训和课后
Python数据分析入门与实战 电子书
  • 开课吧组编 杨国俊 张植皓 潘海超 等编著
  • 本书系统地描述了如何利用Python语言进行数据分析。由浅入深的编写方式可以帮助读者轻松愉快地进入数据的世界。全书从理论到实践、从基础语法到科学计算库,循序渐进地讲解了Python数据分析所需要学习的技能。搭配项目实战帮助读者更好、更快地掌握Python数据分析知识点。此外,还全面介绍了数据分析的必知必会技能。本书提供代码资源下载服务,每章均配有重要知识点串讲视频。本书不仅适合零基础喜欢数据分析的
Python数据分析入门与实战 电子书
  • 刘麟 编著
  • 掌握数据分析技巧,运用强大的Python工具,解决工作中繁琐的数据问题。
R语言医学数据分析实战 电子书
  • 赵军 编著
  • 以医学数据为例,讲解如何使用R进行数据分析。
R语言与数据分析实战 电子书
  • 朱顺泉
  • 本书共13章,主要包括:数据分析概述及R语言环境,R语言的数据对象及其类型,R语言数据存储与读取,R语言编程,R语言可视化,R语言描述性统计,R语言参数估计,R语言参数假设检验等内容。
Excel数据分析基础与实战 电子书
  • 张良均
  • 本书以任务为导向,全面介绍了数据分析的流程和Excel数据分析的应用,并详细阐述了使用Excel2016解决企业实际问题的方法。全书共11章,分为基础部分(第1~6章)和实战部分(第7~11章)。基础部分的内容包括数据分析与Excel2016概述、外部数据的获取、数据处理、函数的应用、数据透视表和数据透视图、数据分析与可视化;实战部分为新零售智能销售数据分析项目实战,内容包含项目数据处理、商品销售
铁路文本大数据分析挖掘研究及应用 电子书
  • 李平,杨连报
  • 本书阐述了铁路文本大数据分析挖掘的理论、技术及应用,内容包括:绪论、文本大数据分析挖掘基础、文本大数据分析挖掘理论体系、常用分析与挖掘工具包、铁路文本大数据分析挖掘平台研究、铁路安全文本大数据应用案例、铁路应急管理文本大数据应用案例。
数说电网运营电网企业运营大数据分析案例集萃 电子书
  • 凌卫家
  • 本书是国网浙江省电力公司运营监测业务主题库试点优秀成果的汇编,包括客户用电行为特征、配网薄弱环节、企业经营风险管控与资金计划管理等13个监测分析主题的52个具有代表性的成果案例。
大数据Hive离线计算开发实战 电子书
  • 杨力
  • 本书从数据处理平台数据库和数据仓库入手,帮助读者逐步搭建大数据Hive数据仓库平台,并介绍了这种传统数据分析方法在大数据平台成功应用的典型案例。本书通过对Hive数据定义语言、Hive数据操纵语言、Hive数据基本查询、Hive数据复杂查询的详细介绍,全面阐述了Hive大数据平台工具的应用与开发。另外,还介绍了Hive数据库对象、用户自定义函数以及Azkaban工作流作业调度器,帮助读者掌握Hiv
PowerBI零售数据分析实战 电子书
  • 郑志刚
  • 一本讲解如何将PowerBI应用于零售业务领域的实战指南。