得书 - 好书推荐、正版图书免费阅读
首页
书库
排行榜
VIP会员
新书
快讯
注册 | 登录
100 条"大数据采集与处理"搜索结果
大数据采集与处理
张雪萍
大数据时代关键技术:采集、预处理、存储、计算和安全
电子书
数据采集与预处理
米洪 张鸰
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机
电子书
数据采集与预处理
林子雨 编著
本书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。
电子书
数据采集及预处理基础与应用
陈瑛
本书主要介绍如何利用Kettle和Python这两个具有代表性的工具进行数据预处理的相关技术与方法,包括数据抽取、数据清洗、数据集成、数据变换等。全书有9章,内容涉及数据采集、环境部署、Kettle安装及应用、pandas应用,以及数据可视化的基础内容。本书采用任务式编写形式,将大数据预处理技术的理论和实现分解到一个个任务中,融入到一个个典型案例中,让读者在完成各任务的同时掌握和理解相关内容。本书
电子书
大数据采集与爬虫
主 编 李俊翰 付雯副主编 王正霞 胡心雷
《大数据采集与爬虫》主要讲解了如何使用Python编写网络爬虫程序,内容包括Python环境搭建、Python的基础语法、爬虫基础知识、网络基础知识、常用爬虫库和解析库、数据持久化存储、WebAPI和异步数据抓取技术、Selenium和ChromeDriver的用法,以及Scrapy爬虫框架的基本原理和操作。*后介绍了一个网络爬虫的综合案例,以巩固前面所学的知识。《大数据采集与爬虫》适合作为高等职
电子书
大数据采集、预处理与可视化(微课版)
葛继科
为了适应数字经济时代的新发展趋势,培养新时代大数据专业人才,编者通过总结多年的教学经验,借鉴国内外相关领域的教学优势,详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相关工具和应用案例,进而编成本书。本书是集理论与实践于一体的应用型教材。全书共7章,包括大数据概述、Python程序设计、大数据采集、大数据预处理技术、Excel数据获取与预处理、Python数据预处理、数据可视化技术。本书在
电子书
Python网络爬虫与数据采集
主编
本书的主旨是介绍如何结合Python进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫开发的各个方面,涉及包括HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等不同领域的内容。全书共分为15章,包括了Python基础知识、网站分析、网页解析、Python文件读写、Python与数据库、AJAX技术、模拟登录、文本与数据分析、网站测试、S
电子书
大型无人机电力线路巡检数据采集与处理技术
彭向阳
本书系统论述了利用大型无人机开展超视距电力线路安全巡检的方案设计、载荷配置、多传感器系统集成与检校、数据采集与处理的方法、技术流程、关键技术及实践应用。
电子书
Excel数据获取与处理
杨怡滨 张良均
本书以项目为导向,由浅入深地介绍Excel2016在数据获取与处理中的应用。全书共14个项目,项目1简单介绍Excel2016的界面,以及工作簿、工作表、单元格的概念;项目2介绍各种类型数据的输入;项目3介绍如何美化工作表;项目4介绍如何使用Excel获取文本数据;项目5介绍如何使用Excel获取网站数据;项目6介绍如何使用Excel获取MySQL数据库中的数据;项目7介绍如何对数据进行排序;项目
电子书
Python程序设计与数据采集(微课版)
董付国
本书知识框架可分为三部分。第一部分(第1章)阐述Python开发环境的搭建与使用;第二部分(第2章~第7章)阐述Python程序设计的基础知识,包括内置类型、运算符与内置函数,程序控制结构,列表与元组,字典与集合,字符串,函数;第三部分(第8章~第10章)阐述不同场景下Python数据采集的方法与应用,包括基于文件和设备的数据采集、基于SQLite数据库的数据采集、基于网页的数据采集。本书通过大量
电子书
pandas数据处理与分析
耿远昊
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
电子书
SPSS数据处理与分析
王旭
本书教授如何用SPSS分析调查数据,实例导入、详细介绍操作过程。
电子书
ETL数据整合与处理(Kettle)
王雪松,张良均 主编
本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理相关内容。全书共8章,第1章介绍ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2-6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL;第
电子书
Python数据处理与挖掘
吴振宇 李春忠 李建锋
本书以构建完整的知识体系为目标,按照从简单到复杂的思路,贯穿了数据处理与挖掘的各个环节,具体包括:Python快速入门、Python数据类型、Python常用模块、Python数据获取、Python数据挖掘基础、Python数据挖掘算法、Python大数据挖掘和Python数据可视化。此外,针对各知识点,全书均设计了相应的Python案例,并给出了实现代码、效果图以及相应的解释,以强化读者对各知识
电子书
Excel数据分析与处理
刘福刚
全书分为4篇:第1篇为应用基础篇,主要介绍Excel的基本功能和基本操作;第2篇为数据处理篇,主要介绍使用公式和函数实现数据处理的方法,以及直观显示数据的方法;第3篇为数据分析篇,主要介绍Excel数据管理、数据分析方面的基本功能和分析方法;第4篇为拓展应用篇,主要介绍宏和协同功能。
电子书
Hive大数据存储与处理
张良均
本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容循序渐进、由浅入深。本书共8章,包括广电大数据用户画像需求分析、部署开发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询进阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序开发。本书大部分章包含实训和课后习题,通过练习
电子书
信息处理与数据科学
马秀麟
本书是在大数据与人工智能快速发展并对人们的科学研究、生活产生了重要影响的大形势下,结合教育部计算机公共课教指委提出的“加强在校大学生计算思维能力培养”的指导思想,为高等院校《大学计算机应用基础》类课程的教学而编写的。本书从信息处理与数据科学的视角入手,依据大学计算机公共课的课程体系及本书的设计理念,重点探索与分析了信息在计算机中的表示、各类信息资源的编辑处理技术、数据科学与数据分析的相关概念与技术
电子书
工业互联网设备数据采集(中级)
北京工联科技有限公司 组编
本书在《工业互联网设备数据采集(初级)》基础上,侧重于流程制造、离散制造行业的工业单体设备和工厂生产单元的数据采集。介绍了虚拟仿真系统及工业智能网关配置、数据采集与上传等实施步骤。此外,本书第五章及第六章引入工业App知识,介绍了多种工业App类型的配置与应用方法。本书穿插数据采集系统中应用的设计实例,既注重原理,又注重实践,配有大量图表、示例和练习题,内容丰富,概念讲解清楚,表达严谨,逻辑性强,
电子书
工业互联网设备数据采集(初级)
北京工联科技有限公司 组编
本书向读者深入浅出地介绍了工业互联网和工业互联网平台的基础知识,围绕工业数据采集系统的基本概念、组成、主要性能指标、对工业智能网关与设备的准备、安装、Web界面配置、采集与上传、故障现象与处理进行了详细介绍。
电子书
Python大数据处理与分析
编著
本书介绍利用Python进行大数据处理与分析的详细方法和步骤。全书共9章,主要内容包括搭建开发环境、Numpy库、Pandas库、Matplotlib库、数据预处理以及多个案例分析。
电子书
Python数据预处理
黑马程序员
全书共8章,其中第1章介绍数据预处理的入门知识;第2-6章介绍科学计算库numpy和数据分析库pandas,以及通过pandas库实现数据获取、数据清理、数据集成、数据变换和数据规约的功能;第7章介绍数据清理工具OpenRefine的安装及使用;第8章结合前期的核心知识进行实战演练。除第1章外,其他章均配置了丰富的示例或案例,读者可以一边学习一边练习,巩固所学的知识,并在实践中提升实际开发能力。本
文章导航
1
2
3
4
5
>
推荐书籍
相关词语
数据库
数据分析
大数据
数据处理
Pandas
科技关键词
软件
SPSS
意见反馈
我的书架
公众号
关注微信公众号