100 条"Python数据爬取技术与实战手册"搜索结果
Python数据处理与挖掘 电子书
  • 吴振宇 李春忠 李建锋
  • 本书以构建完整的知识体系为目标,按照从简单到复杂的思路,贯穿了数据处理与挖掘的各个环节,具体包括:Python快速入门、Python数据类型、Python常用模块、Python数据获取、Python数据挖掘基础、Python数据挖掘算法、Python大数据挖掘和Python数据可视化。此外,针对各知识点,全书均设计了相应的Python案例,并给出了实现代码、效果图以及相应的解释,以强化读者对各知识
Python数据分析与挖掘 电子书
  • 杨玲
  • 本书面向大数据应用型人才,以任务为导向,系统地介绍Python数据分析与挖掘的常用技术与真实案例。全书共7章,第1、2章介绍Python数据分析的常用模块及其应用,涵盖NumPy数值计算模块、pandas数据分析模块,较为系统地阐述Python数据分析的方法;第3、4章介绍轻量级的数据交换格式JSON和连接MySQL数据库的pymysql模块,并以此进行数据综合案例的分析;第5章介绍Matplot
Spark海量数据处理:技术详解与平台实战 电子书
  • 范东来
  • 在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架ApacheSpark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了StructuredStreaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
大数据技术原理与应用——从入门到实战 电子书
  • 主编
  • 本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoo
Python机器学习入门与实战 电子书
  • 桑园 编著
  • 本书以零基础讲解为特色,用实例引导读者学习,深入浅出地介绍Python机器学习的相关知识和实战技能。
Python深度学习与项目实战 电子书
  • 本书基于Python以及两个深度学习框架Keras与TensorFlow,讲述深度学习在实际项目中的应用。本书共10章,首先介绍线性回归模型、逻辑回归模型、Softmax多分类器,然后讲述全连接神经网络、神经网络模型的优化、卷积神经网络、循环神经网络,最后讨论自编码模型、对抗生成网络、深度强化学习。
Python机器学习编程与实战 电子书
  • 林耀进 张良均
  • 本书共8章,内容包括Python概述、NumPy数值计算、pandas基础、pandas进阶、Matplotlib绘图、scikit-learn、餐饮企业综合分析与预测、通信运营商客户流失分析与预测。前6章设置了选择题、填空题和操作题,后两章设置了操作题,希望通过练习和操作实践,读者可以巩固所学的内容。
Python3爬虫实战——数据清洗、数据分析与可视化 电子书
  • 姚良
  • 1.从零开始,适合新手学习对于只有代码入门基础的新手来说,看文档学习使用工具是十分困难的一件事。因为对代码的不理解、没有编程思维,看文档简直就像是在看天书。另外大部分的新文档都是英文版的,国内的中文文档都是翻译过来的,在翻译过程中容易产生偏差。而本书基础知识篇中,从各官方文档中直接整理出爬虫爬取需要用到的部分。没有繁杂啰唆的文字,用简单的语言告诉你学习的重点知识,让你快速上手爬虫。在实战阶段,详细介绍每一个步骤,便于理解,让你也能靠自己写出爬虫。2.实例丰富,解决各种爬虫问题网上很多爬虫的各种教程,大部分都是爬取豆瓣电影、招聘网站职位进行分析。本书实战项目挑选的都是网上少有人爬取的网站,让你可以学习到各式各样的爬取方式。3.站得更高,设计自己的产品本书除了教你如何爬取网站外,还有很多以爬虫为基础的多功能设计教程,如爬虫机器人、爬虫网站、爬虫搜索功能。让你在学会爬取技术的同时,形成产品的思维去设计自己的产品。
Python电商数据分析实战(微课版) 电子书
  • 编著
  • 全书共分为3篇。第一篇是理论基础篇,讲解从事电子商务数据分析前需要了解的理论知识,每个理论知识点都结合案例做详细的解析。第二篇是专业方法篇,介绍数据采集和数据清洗的专业方法。第三篇是应用场景篇,介绍运营与数据平台的应用、运营诊断与复盘的方法、宏观市场分析、市场细分及竞争分析、流量运营分析、产品运营分析、消费者运营分析及商务报告的撰写等。本书既可以作为高等院校电子商务专业、商务数据分析与应用专业、大
数据结构与算法(Python版) 电子书
  • 周元哲
  • 本书讲述了Python语言与数据结构。
Python大数据处理与分析 电子书
  • 编著
  • 本书介绍利用Python进行大数据处理与分析的详细方法和步骤。全书共9章,主要内容包括搭建开发环境、Numpy库、Pandas库、Matplotlib库、数据预处理以及多个案例分析。
Python数据预处理 电子书
  • 黑马程序员
  • 全书共8章,其中第1章介绍数据预处理的入门知识;第2-6章介绍科学计算库numpy和数据分析库pandas,以及通过pandas库实现数据获取、数据清理、数据集成、数据变换和数据规约的功能;第7章介绍数据清理工具OpenRefine的安装及使用;第8章结合前期的核心知识进行实战演练。除第1章外,其他章均配置了丰富的示例或案例,读者可以一边学习一边练习,巩固所学的知识,并在实践中提升实际开发能力。本
Python数据分析 电子书
  • 吴道君,朱家荣
  • 本书全面讲解Python数据分析的相关知识和技术,内容包括Python数据分析概述、NumPy数值计算、Matplotlib数据可视化、Pandas数据分析、数据预处理、Sklearn机器学习。  本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。  本书内容充实、结构合理、实用性强,具有明确的应用能力培养目标,易于接受和理解,学完本书后,可以具备数据分析的基本能力。  本书适合
Python3快速入门与实战 电子书
  • 理论与实战相结合,结合大量案例系统为你介绍Python。
Python办公效率手册 电子书
  • 本书从日常办公场景和职场人的实际工作需求出发,以实战案例为主线,分解一个个任务,用轻松的方式讲解使用Python编程语言解决办公难题,提升工作效率的知识与方法,内容涵盖:使用Python处理大量重复性的Word文档、Excel表格工作,以此大大提升工作效率;巧用Python处理PDF文档、PPT演示文稿、电子邮件、图形图像,实现专业的内容输出;以及编写Python爬虫程序,抓取网络数据信息。这些知
Python图像处理实战 电子书
  •  著
  • 本书先介绍经典的图像处理技术,然后探索图像处理算法的演变历程,始终紧扣图像处理以及计算机视觉与深度学习方面的最新进展。全书共12章,涵盖图像处理入门基础知识、应用导数方法实现图像增强、形态学图像处理、图像特征提取与描述符、图像分割,以及图像处理中的经典机器学习方法等内容。
机器学习Python实战 电子书
  • 张松慧 陈丹 主编
  • 本书使用Python的机器学习算法库scikit-learn讲解机器学习重要算法的应用,内容包括机器学习认知、数据预处理、KNN算法、线性回归算法、逻辑回归算法、朴素贝叶斯算法、决策树与随机森林算法、支持向量机、k-mcans算法、神经网络、模型评估与优化。本书使用通俗易懂的语言、丰富的图表和大量的案例对机器学习的重要算法进行讲解,提供一条从实践出发掌握机器学习知识的途径,读者即使没有很扎实的数学
Elasticsearch数据搜索与分析实战 电子书
Python数据分析与可视化 电子书
  • 主编
  • 本书采用理论分析和Python编程实战相结合的形式,按照数据分析与可视化的基本步骤,数据分析与可视化的基本理论知识和相应的Python库进行了详细的介绍,让读者能够在了解基本理论知识的同时快速上手实现数据分析与可视化的程序。
Python数据分析与可视化 电子书
  • 高晓燕
  • 本书共3章。第1章讲述Python基础知识,包括Python语言基本语法、内置数据类型、Python控制语句、函数和文件操作;第2章讲述Python数据分析,包括Numpy数值计算基础、Numpy数学与算术函数、Numpy中的数据统计与分析、pandas统计分析基础、pandas数据运算、pandas数据载入与预处理;第3章讲述数据可视化,包括matplotlib绘图基础、使用pandas和Sea