100 条"Python数据预处理技术与实践"搜索结果
  • 文俊
  • 本书详细介绍数据预处理技术,实用性强,适合大数据从业者。
Python数据预处理 电子书
  • 黑马程序员
  • 全书共8章,其中第1章介绍数据预处理的入门知识;第2-6章介绍科学计算库numpy和数据分析库pandas,以及通过pandas库实现数据获取、数据清理、数据集成、数据变换和数据规约的功能;第7章介绍数据清理工具OpenRefine的安装及使用;第8章结合前期的核心知识进行实战演练。除第1章外,其他章均配置了丰富的示例或案例,读者可以一边学习一边练习,巩固所学的知识,并在实践中提升实际开发能力。本
Python数据预处理(微课版) 电子书
  • 主编
  • 本书以JupyterNotebook为主要开发工具,全面地介绍数据预处理的相关知识。全书共分8章,内容分别为初识Python数据预处理、数据获取与存储、数据清洗、数据集成、数据变换、数据规约、综合实战:家用热水器用户行为分析以及两个综合实战项目。每个章节均配置了丰富的示例或案例,通过本书的学习,读者可以充分理解常用数据预处理方法的精髓、掌握具体技术细节,并在实践中提升实际开发能力,为数据分析和机器
Python数据预处理(微课版) 电子书
  • 主编
  • 本书的设计和编写目标是培养读者的数据思维能力和数据预处理能力,内容具有典型性和实用性,系统介绍基于Python的数据预处理的流程和技术。全书共8个单元,单元1介绍数据预处理的基础知识,单元2介绍Python数据预处理的库pandas的用法及主要数据对象的用法,单元3~单元7依次介绍数据预处理流程中数据获取、数据合并、数据清洗、数据变换和数据描述等相关知识和技术。为突出培养读者的动手能力,本书单元2
数据采集与预处理 电子书
  • 米洪 张鸰
  • 本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机
数据采集与预处理 电子书
  • 林子雨 编著
  • 本书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。
Python数据科学基础与实践 电子书
  • 编著
  • 本书共9章,主要内容包括数据科学概述、Python基础知识、Python数据科学常用库、Python数据获取、Python数据分析、Python数据挖掘、Python文本挖掘、深度学习基础、深度学习应用。
高维数据分析预处理技术 电子书
  • 祝琴 著
  • 作者针对高维稀疏数据挖掘问题,从数据预处理的角度,研究对象—属性空间的划分问题,其目的是把所研究的数据挖掘空间分解为若干规模较小的对象—属性空间,从而降低实际数据挖掘的难度。本书针对高维稀疏数据挖掘问题,以降低数据挖掘规模,建立了体系完整的数据预处理理论和方法,具有很强的理论意义和实际应用前景。
Python与R语言数据科学实践 电子书
  • J.
  • 本书从数据科学的角度,讲解了Python和R的语言特性以及各自的优缺点,介绍了包括包、框架和工作流在内的开源生态系统,分析了Python和R分别适用于哪些业务场景,并通过真实的案例演示如何在单个工作流中集成Python与R,使两种语言充分发挥优势,改善业务应用的效果。本书还提供了Python和R的对照翻译,帮助读者在两种语言间快速切换。本书适合数据科学领域有一定Python或R基础的开发人员阅读,
数据采集及预处理基础与应用 电子书
  • 陈瑛
  • 本书主要介绍如何利用Kettle和Python这两个具有代表性的工具进行数据预处理的相关技术与方法,包括数据抽取、数据清洗、数据集成、数据变换等。全书有9章,内容涉及数据采集、环境部署、Kettle安装及应用、pandas应用,以及数据可视化的基础内容。本书采用任务式编写形式,将大数据预处理技术的理论和实现分解到一个个任务中,融入到一个个典型案例中,让读者在完成各任务的同时掌握和理解相关内容。本书
数据科学:理论、方法与Python语言实践 电子书
  • 谢健民 黎海波 主编
  • 全书共分为10章,第1-2章介绍了数据科学的基础知识以及数据科学所需的各项技术;第3-5章涵盖了Python的语法基础,函数、模块与组合数据类型,文件读写;第6章介绍了网络爬虫的数据采集及方法;第7-8章重点介绍了数据分析过程中的两个重要模块:numpy和pandas;第9章介绍了数据可视化与应用;第10章结合之前的内容,以一个综合案例进行了实战分析。本书配有电子课件、电子教案、教学大纲、习题答案
机器学习与Python实践 电子书
  • 黄勉
  • 机器学习理论实践全书,12章内容丰富,适合各层次读者。
Python数据分析与应用 电子书
  • 张良均
  • 本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,后落实在任务实现环节。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
Python网络爬虫与数据采集 电子书
  • 主编
  • 本书的主旨是介绍如何结合Python进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫开发的各个方面,涉及包括HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等不同领域的内容。全书共分为15章,包括了Python基础知识、网站分析、网页解析、Python文件读写、Python与数据库、AJAX技术、模拟登录、文本与数据分析、网站测试、S
Python数据处理与挖掘 电子书
  • 吴振宇 李春忠 李建锋
  • 本书以构建完整的知识体系为目标,按照从简单到复杂的思路,贯穿了数据处理与挖掘的各个环节,具体包括:Python快速入门、Python数据类型、Python常用模块、Python数据获取、Python数据挖掘基础、Python数据挖掘算法、Python大数据挖掘和Python数据可视化。此外,针对各知识点,全书均设计了相应的Python案例,并给出了实现代码、效果图以及相应的解释,以强化读者对各知识
Python基础与大数据应用 电子书
  • 丁辉
  • 本书分为11章,前6章讲解了Python基本语法和基本应用,后5章系统地讲解了用Python爬取数据、处理数据、分析数据的方法与过程。每章除了丰富的实例外,还设计了来源于实践的项目训练及拓展训练项目。
Python数据分析与挖掘 电子书
  • 杨玲
  • 本书面向大数据应用型人才,以任务为导向,系统地介绍Python数据分析与挖掘的常用技术与真实案例。全书共7章,第1、2章介绍Python数据分析的常用模块及其应用,涵盖NumPy数值计算模块、pandas数据分析模块,较为系统地阐述Python数据分析的方法;第3、4章介绍轻量级的数据交换格式JSON和连接MySQL数据库的pymysql模块,并以此进行数据综合案例的分析;第5章介绍Matplot
大数据采集、预处理与可视化(微课版) 电子书
  • 葛继科
  • 为了适应数字经济时代的新发展趋势,培养新时代大数据专业人才,编者通过总结多年的教学经验,借鉴国内外相关领域的教学优势,详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相关工具和应用案例,进而编成本书。本书是集理论与实践于一体的应用型教材。全书共7章,包括大数据概述、Python程序设计、大数据采集、大数据预处理技术、Excel数据获取与预处理、Python数据预处理、数据可视化技术。本书在
Python数据分析入门与实战 电子书
  • 开课吧组编 杨国俊 张植皓 潘海超 等编著
  • 本书系统地描述了如何利用Python语言进行数据分析。由浅入深的编写方式可以帮助读者轻松愉快地进入数据的世界。全书从理论到实践、从基础语法到科学计算库,循序渐进地讲解了Python数据分析所需要学习的技能。搭配项目实战帮助读者更好、更快地掌握Python数据分析知识点。此外,还全面介绍了数据分析的必知必会技能。本书提供代码资源下载服务,每章均配有重要知识点串讲视频。本书不仅适合零基础喜欢数据分析的
Python数据分析入门与实战 电子书
  • 刘麟 编著
  • 掌握数据分析技巧,运用强大的Python工具,解决工作中繁琐的数据问题。
数据结构与算法(Python版) 电子书
  • 周元哲
  • 本书讲述了Python语言与数据结构。