100 条"干净的数据:数据清洗入门与实践"搜索结果
数据清洗 电子书
  • 黄源 涂旭东 罗少甫 编著
  • 《数据清洗》主要介绍数据清洗技术的基本概念与应用。全书共有8章,分别讲述了数据清洗基础、数据清洗方法、文件类型、数据采集与抽取、Excel数据清洗与转换、ETL数据清洗与转换、Python数据清洗、R语言数据清洗。《数据清洗》将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据清洗的相关技术。针对书中重要的、核心的知识点,提供了较多的练习,帮助读者达到熟练应用的目的。《数据清洗》可作
Spark SQL入门与数据分析实践 电子书
  • 杨虹 谢显中 周前能 张安文编著
  • 本书共8章内容,由浅入深地讲解SparkSQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。
赋能数字经济:大数据创新创业启示录 电子书
  • 首席数据官联盟
  • 首席数据官联盟启动百人大数据专访:产业热点、难点、疑点
数据资源规划与管理实践 电子书
  • 陈刚
  • 本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。
Python数据科学基础与实践 电子书
  • 编著
  • 本书共9章,主要内容包括数据科学概述、Python基础知识、Python数据科学常用库、Python数据获取、Python数据分析、Python数据挖掘、Python文本挖掘、深度学习基础、深度学习应用。
Python3爬虫实战——数据清洗、数据分析与可视化 电子书
  • 姚良
  • 1.从零开始,适合新手学习对于只有代码入门基础的新手来说,看文档学习使用工具是十分困难的一件事。因为对代码的不理解、没有编程思维,看文档简直就像是在看天书。另外大部分的新文档都是英文版的,国内的中文文档都是翻译过来的,在翻译过程中容易产生偏差。而本书基础知识篇中,从各官方文档中直接整理出爬虫爬取需要用到的部分。没有繁杂啰唆的文字,用简单的语言告诉你学习的重点知识,让你快速上手爬虫。在实战阶段,详细介绍每一个步骤,便于理解,让你也能靠自己写出爬虫。2.实例丰富,解决各种爬虫问题网上很多爬虫的各种教程,大部分都是爬取豆瓣电影、招聘网站职位进行分析。本书实战项目挑选的都是网上少有人爬取的网站,让你可以学习到各式各样的爬取方式。3.站得更高,设计自己的产品本书除了教你如何爬取网站外,还有很多以爬虫为基础的多功能设计教程,如爬虫机器人、爬虫网站、爬虫搜索功能。让你在学会爬取技术的同时,形成产品的思维去设计自己的产品。
Python数据分析入门与实战 电子书
  • 刘麟 编著
  • 掌握数据分析技巧,运用强大的Python工具,解决工作中繁琐的数据问题。
Python数据分析入门与实战 电子书
  • 开课吧组编 杨国俊 张植皓 潘海超 等编著
  • 本书系统地描述了如何利用Python语言进行数据分析。由浅入深的编写方式可以帮助读者轻松愉快地进入数据的世界。全书从理论到实践、从基础语法到科学计算库,循序渐进地讲解了Python数据分析所需要学习的技能。搭配项目实战帮助读者更好、更快地掌握Python数据分析知识点。此外,还全面介绍了数据分析的必知必会技能。本书提供代码资源下载服务,每章均配有重要知识点串讲视频。本书不仅适合零基础喜欢数据分析的
MySQL数据库基础与实践 电子书
  • 夏辉 编著
  • 本书从实用的角度出发,全面讲解MySQL数据库技术。
大数据理论与工程实践 电子书
  • 陆晟 刘振川 汪关盛 等
  • 本书主要面向架构师,或者是有具体大数据问题需要解决的工程师;也适合从零开始搭建大数据结构,或者需要将现有的非大数据的需求修改成大数据方案的读者。你将从书中学到以下方面的知识:◎数据存储◎计算资源◎计算模型◎大数据应用◎数据治理◎大数据与人工智能
数据科学基础实践教程 电子书
  • 陈展荣 刘小丽 余宏华 杜宝荣
  • 本书以数据处理为主线,介绍了数据处理的基本原理、算法的可视化工具、常见算法的思想、Python程序设计及算法实现,以及常用的图文制作工具。
Python与R语言数据科学实践 电子书
  • J.
  • 本书从数据科学的角度,讲解了Python和R的语言特性以及各自的优缺点,介绍了包括包、框架和工作流在内的开源生态系统,分析了Python和R分别适用于哪些业务场景,并通过真实的案例演示如何在单个工作流中集成Python与R,使两种语言充分发挥优势,改善业务应用的效果。本书还提供了Python和R的对照翻译,帮助读者在两种语言间快速切换。本书适合数据科学领域有一定Python或R基础的开发人员阅读,
数据新闻理论与实践(微课版) 电子书
  • 编著
  • 本书将理论贯穿于实践之中,由三部分构成,主要内容层层递进:数据新闻入门、数据新闻基础实践和数据新闻进阶。第一部分是根据作者在数据新闻领域的科研和教学实践,总结出的数据新闻的基础概念、市场情况、制作工具等入门知识。第二部分主要针对新的需求,在兼顾数据新闻基本规则和原理的基础上,对数据新闻选题与数据查找的基本方法,数据分析的格式、应用及基本关系,Excel用于数据新闻的常用操作,数据新闻的图表表达,数
Python医学数据分析入门 电子书
  • 刘文婷
  • 数据分析是当今大数据时代最关键的技术,其广泛应用于包括医学在内的各个领域。
Access数据库实践教程 电子书
  • 姜书浩
  • 本书适用于“Access数据库”课程的实践环节教学,也可以作为计算机等级考试的参考书。
数据科学:理论、方法与Python语言实践 电子书
  • 谢健民 黎海波 主编
  • 全书共分为10章,第1-2章介绍了数据科学的基础知识以及数据科学所需的各项技术;第3-5章涵盖了Python的语法基础,函数、模块与组合数据类型,文件读写;第6章介绍了网络爬虫的数据采集及方法;第7-8章重点介绍了数据分析过程中的两个重要模块:numpy和pandas;第9章介绍了数据可视化与应用;第10章结合之前的内容,以一个综合案例进行了实战分析。本书配有电子课件、电子教案、教学大纲、习题答案
电力大数据基础平台建设与应用实践 电子书
  • 王扬[等]
  • 本书围绕电力大数据平台的建设与使用,从大数据平台体系架构、基础平台建设与实施、典型业务场景顶层设计和实际业务应用等方面开展论述。
数据分析从入门到进阶 电子书
  • 透彻讲解Excel、SQL、Tableau、Python四项数据分析必会工具。
大数据技术原理与应用——从入门到实战 电子书
  • 主编
  • 本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoo
数据治理与数据安全 电子书
  • 张莉
  • 一本书讲清数据,推进数据开放共享与跨境流动战略,助力个人信息保护。