100 条"干净的数据:数据清洗入门与实践"搜索结果
数据挖掘 电子书
  • 宋万清
  • 本书着力于介绍数据挖掘基础知识、基本原理、常用算法,主要内容包括数据挖掘概述、数据的描述与可视化、数据的采集和预处理、数据的归约、关联规则挖掘、分类与预测、非线性预测模型、聚类分析、深度学习简介、使用Weka进行数据挖掘。本书通俗易懂,注重基础知识、基本原理和基本方法,注重启发和引申,以培养学生独立思考和独立发现的能力。  本书适合作为数据科学与大数据、信息管理、统计等专业的本科层次基础课教材,也
HBase入门与实践 电子书
  • 彭旭
  • 大数据时代快速上手HBase行动指南。
Kafka入门与实践 电子书
  • 牟大恩
  • 本书适合应用Kafka的专业技术人员阅读,包括但不限于大数据相关应用的开发者、运维者和爱好者。
水利数据中心的理念与技术 电子书
  • 艾萍,李观义
  • 本书以我国水利行业数据中心建设与发展的技术需求为主线,围绕水利信息的组织与应用,系统阐述了数据中心技术应用于水利业务领域的基本理念与技术体系,针对物联网、云计算和大数据等信息技术对水利数据中心建设与发展的影响与融合进行了深入分析与阐述,论述了以场景应用模式为特征,融合了多项新信息技术的水利数据中心核心应用新模式。
大数据时代的数据挖掘 电子书
  • 李涛
  • (1)内容全面,覆盖当前数据挖掘的主要应用。在介绍每个应用案例时,详细阐述应用的背景,该领域中数据的来源和特点,数据采集与预处理方式,应用领域中数据挖掘的任务和实施数据挖掘技术的难点。同时提供相应的数据挖掘算法分析、工具设计以及系统实现。(2)条理清晰、便于理解。一方面,面向热爱和关心数据挖掘技术的学术界和工业界读者,帮助他们更好地理解研究的目的和应用的基础;另一方面,让没有太多相关技术背景的读者可以通过阅读本书能够了解数据挖掘的意义和价值,可以看出数据挖掘是如何被广泛地应用于实际案例并成为解决各种问题的核心工具。
数据科学的数学基础 电子书
  • 卢力
  • 本书共11章,主要内容包括:线性代数基础、线性空间与线性变换、向量与矩阵范数、矩阵分解、概率统计基础、随机过程等。
大数据测试技术 数据采集、分析与测试实践(在线实验+在线自测 ) 电子书
  • 刘攀
  • 本书从工程角度出发,阐述了运用大数据技术进行软件测试的方法和实现过程。全书共11章,介绍了大数据测试思维、手机联网数据的收集方法、数据格式的转换方法、大数据的处理方法、软件缺陷挖掘技术及实践项目的应用等。本书第1章介绍了大数据的测试方法和思维方式,随后每一章都通过案例来讲解大数据技术的相关理论及其测试应用。除第1章外,每章最后都提供了思考题来帮助读者回顾和巩固本章的学习内容,本书最后还提供了思考题
Python数据分析与应用 电子书
  • 张良均
  • 本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,后落实在任务实现环节。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
Excel数据处理与分析 电子书
  • 聚焦Excel在财会工作中的典型应用,呈现Excel强大的财会管理功能!提升办公效率!案例设置基于实际工作过程,案例不仅涉及会计和财务部门日常办公的各个方面,而且这些办公案例之间紧密关联。读者既学会了Excel功能,又熟悉了会计与财务管理岗位的办公业务。10小时与本书内容同步的视频讲解,光盘与图书内容完美结合。赠8小时Windows7视频讲解,轻松运用主流操作系统。赠1200个Office2013应用技巧,自如应对工作中的各种状况。赠900套Word/Excel/PPT2013实用模板,稍加修改即可应用到工作中。赠视频讲解常用办公设备和办公软件的使用方法,全面提升办公技能。赠财务/人力资源/生产/文秘/行政等岗位工作手册,提高效率的有效工具。赠电脑日常维护与故障排除常见问题解答,轻松搞定常见电脑问题。
Hive大数据存储与处理 电子书
  • 张良均
  • 本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容循序渐进、由浅入深。本书共8章,包括广电大数据用户画像需求分析、部署开发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询进阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序开发。本书大部分章包含实训和课后习题,通过练习
Python数据分析与挖掘 电子书
  • 杨玲
  • 本书面向大数据应用型人才,以任务为导向,系统地介绍Python数据分析与挖掘的常用技术与真实案例。全书共7章,第1、2章介绍Python数据分析的常用模块及其应用,涵盖NumPy数值计算模块、pandas数据分析模块,较为系统地阐述Python数据分析的方法;第3、4章介绍轻量级的数据交换格式JSON和连接MySQL数据库的pymysql模块,并以此进行数据综合案例的分析;第5章介绍Matplot
大数据与管理会计 电子书
  • 许本锋
  • 本书共6篇,对企事业单位财务管理过程进行了细化分类,第一篇从管理会计的理论与运用入手,通过研究财务预算和财务分析工具,引入了重型工业企业、医院、教育机构等行业的管理实践,展现了管理会计运用过程;第二篇是会计核算;第三篇是内部控制;第四篇是内部审计;第五篇是事业单位会计;第六篇是智能会计。
揭秘云计算与大数据 电子书
  • 嬴图团队
  • 系统阐述云计算和大数据的知识、原理、架构和实战技巧。
Elasticsearch数据搜索与分析实战 电子书
SPSS数据处理与分析 电子书
  • 王旭
  • 本书教授如何用SPSS分析调查数据,实例导入、详细介绍操作过程。
pandas数据处理与分析 电子书
  • 耿远昊
  • 本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
大数据分析与挖掘 电子书
  • 石胜飞
  • 数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
大数据技术基础与实战 电子书
  • 编著
  • 本书主要内容包括:大数据技术概述、Linux基础与集群搭建、Hadoop集群配置、HDFS、MapReduce分布式编程、Hive大数据仓库、HBase数据库部署与操作、数据获取与Flume应用、基于Spark的内存计算,以及利用大数据平台处理图像。
Python网络爬虫与数据采集 电子书
  • 主编
  • 本书的主旨是介绍如何结合Python进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫开发的各个方面,涉及包括HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等不同领域的内容。全书共分为15章,包括了Python基础知识、网站分析、网页解析、Python文件读写、Python与数据库、AJAX技术、模拟登录、文本与数据分析、网站测试、S
数据科学与大数据技术导论 电子书
  • 杜小勇主编
  • 本书是高校的大数据导论课程教材,清楚地介绍了大数据相关的概念、理论、术语与基础技术,并使用真实连贯的商业案例以及简单的图表,帮助读者更清晰地理解大数据技术。本书可作为高等院校相关专业“大数据基础”“大数据道路”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员和所有对大数据感兴趣的人士阅读。