100 条"Jupyter数据科学实战"搜索结果
Jupyter数据科学实战 电子书
  • [印度] 普拉泰克·古普塔
  • Jupyter数据科学手册,初学者的实战指南,通过简单易懂的Python示例,掌握数据科学技能,学习线性代数和统计学的基础知识,为实际业务场景实现和保存机器学习模型。
大数据技术原理与应用——从入门到实战 电子书
  • 主编
  • 本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoo
大数据+医疗:科学时代的思维与决策 电子书
  • 动脉网蛋壳研究院
  • 本书案例丰富翔实,将理论与实际紧密结合,对互联网技术人员、健康医疗行业的从业人士,以及高等院校相关专业的学生均有很大帮助。
R语言与社会科学调查数据分析 电子书
  • 编著
  • 作者运用R语言,分析中国综合社会调查数据,涵盖了初级的描述性统计、简单的回归模型、中阶的广义线性回归、二值型回归、泊松回归模型、高阶的匹配模型、主成分分析、机器学习等内容。本书通过可复制的代码、模型原理解读和丰富的图表,展现了如何将R语言应用在社会科学的研究中。
Python高手修炼之道:数据处理与机器学习实战 电子书
  • 许向武
  • 适读人群:1.没有编程知识的新手不同于一般的基础语法讲解教程,本书并未将Python开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python语言和Python编程。2.从未接触过Python语言,但了解一点编程知识的初学者本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python程序员本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30余个模块的使用。构建从Python入门到数据分析到机器学习的路线图,入门有章可循;1.讲解独到,常见盲点趣解析作者基于多年的经验积累,善于总结概括初学Python过程中的误区。2.内容全面,常用工具全涵盖书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。3.拓展训练,重点知识有强化语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。4.代码完整,随时动手可复现本书提供了完整、可验证的代码,方便读者动手练习并强化理解。
Spark大数据实时计算:基于Scala开发实战 电子书
  • 杨力
  • 通过实用技术和实战案例,让你轻松掌握大数据实时计算的方法。
Python大数据分析与挖掘实战(微课版) 电子书
  • 黄恒秋 莫洁安 谢东津 张良均 苏颖
  • 本书以应用为导向,将理论与实践相结合,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本知识,以及如何将其应用到具体领域的方法。本书分3篇:基础篇、案例篇和提高篇。基础篇(第1章-第6章)主要介绍Python基础知识及应用于科学计算、数据处理、数据可视化、机器学习、深度学习等方面的基础知识;案例篇(第7章-第11章)主要介绍利用Python进行金融、地理信息、交通、文本分析、图像识别等领域
大数据Hadoop 3.X分布式处理实战 电子书
  • 吴章勇 杨强
  • 本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。
跟着迪哥学:Python数据分析与机器学习实战 电子书
  • 唐宇迪
  • 本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。
用数据提升人力资源管理效能(实战案例版) 电子书
  • 任康磊
  • 8大模块应用场景描述,22个典型行业案例精讲,帮你学习如何在人力资源管理中运用数据。
Excel财务数据处理与分析实战技巧精粹 电子书
  • 郭辉
  • 一本拿来解决实际问题的财务工作者案头书。
MySQL数据库应用技术及实战(第2版) 电子书
  • 肖睿
  • 本书采用任务驱动教学的形式详细讲解MySQL数据库的各种操作,帮助读者快速熟练地掌握MySQL数据库。本书主要内容包括认识数据库,MySQL数据库初体验,数据的基本操作,高级查询,存储过程,事务、视图、索引、备份和恢复,数据库规范化设计,综合实战——银行ATM存取款机系统等。
大数据实时流处理技术实战——基于Flink+Kafka技术 电子书
  • 刘均 主编
  • 本书以项目实践作为主线,结合必需的理论知识,以任务的形式设计内容,每个任务都包含任务描述及任务实施的步骤,读者按照实施步骤进行操作就可以完成相应的学习任务,从而不断提升项目实践能力。本书主要内容涉及流式数据的基础知识、Flink的简介及发展历史、Flink的系统架构及FlinkAPI介绍、Flink的集群部署模式、Flink流式API的基本应用、Flink时间和窗口API的应用、Flink高级应用
地球科学中的大数据分析与挖掘算法手册 电子书
  • 李国庆 刘莹 庞禄申 等
  • 本书以数据分析与挖掘思想为主线,深入剖析关联、分类、回归、聚类、顺序模式挖掘、深度学习以及异常检测等算法的原理、实现、相似算法、改进思路以及地学案例,具有很强的系统性、完整性以及落地性,可以作为各行业特别是地球科学领域中希望驾驭大数据并发掘其价值的科研人员和工程人员的参考书,读者既可以通过本书系统掌握大数据分析挖掘的思想方法,也可以将其作为算法工具书查阅。
Python3爬虫实战——数据清洗、数据分析与可视化 电子书
  • 姚良
  • 1.从零开始,适合新手学习对于只有代码入门基础的新手来说,看文档学习使用工具是十分困难的一件事。因为对代码的不理解、没有编程思维,看文档简直就像是在看天书。另外大部分的新文档都是英文版的,国内的中文文档都是翻译过来的,在翻译过程中容易产生偏差。而本书基础知识篇中,从各官方文档中直接整理出爬虫爬取需要用到的部分。没有繁杂啰唆的文字,用简单的语言告诉你学习的重点知识,让你快速上手爬虫。在实战阶段,详细介绍每一个步骤,便于理解,让你也能靠自己写出爬虫。2.实例丰富,解决各种爬虫问题网上很多爬虫的各种教程,大部分都是爬取豆瓣电影、招聘网站职位进行分析。本书实战项目挑选的都是网上少有人爬取的网站,让你可以学习到各式各样的爬取方式。3.站得更高,设计自己的产品本书除了教你如何爬取网站外,还有很多以爬虫为基础的多功能设计教程,如爬虫机器人、爬虫网站、爬虫搜索功能。让你在学会爬取技术的同时,形成产品的思维去设计自己的产品。
从Power BI到Analysis Services:企业级数据分析实战 电子书
  • 本书介绍本地AnalysisServices与AzureAnalysisServices的安装、开发、部署、处理以及增强开发等内容,同时还介绍PowerBI、SQLServerStudioManagement、SQLServer、VisualStudio2019等协同工具的使用方法,力求帮助读者找到企业级BI遇到的系统性能瓶颈,并提供行之有效的解决方案。
R语言高效能实战:更多数据和更快速度 电子书
  • 本书将目标设定为“在一台笔记本电脑上能够运行”,从单机大型数据集处理策略、提升计算性能、其他工具和技巧3个方面介绍了使用R语言处理数据时的实用方法。主要内容包括数据集占用空间、善用data.table处理数据、数据分块处理、提升硬盘资源使用效率、并行编程技术、提升机器学习性能,以及其他资源管理和提高性能的实用策略。
BIM造价大数据:GTJ2018+BIM5D建模与交互实战 电子书
  • 马远航 陈志伟
  • 本书基于BIM技术在造价管理中“理论-建模-交互-应用”的定位,根据实际业务操作的顺序进行介绍,共分为8章。第1章主要介绍BIM及BIM造价的概念和特点,分析了国内外的BIM造价类软件和BIM在全过程造价管理中的应用;第2章主要介绍BIM和造价数据的来源及其相关标准;第3-4章以一个具体的实战为例,分别介绍某工程的手工建模和快速建模方式;第5章主要介绍运用Revit、GTJ2018和BIM5D完成
Hadoop海量数据处理:技术详解与项目实战(第2版) 电子书
  • 范东来
  • 本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase,并深入探讨了Hadoop的运维和调优;应用篇则包含了一个具有代表性的完整的基于Hadoop的商业智能系统的设计和实现;结束篇对全书进行总结,并对技术发展做了展望。
Hadoop大数据开发案例教程与项目实战(在线实验+在线自测) 电子书
  • 西普教育研究院 时允田 林雪纲
  • 本书是一本Hadoop学习入门参考书,全书共11章,分为基础篇和提高篇两部分。基础篇包括第1~6章,具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章,具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平
概率论与数理统计 电子书
  • 同济大学数学系
  •   1.内容经典,附二维码方式增加章导读以及扩展阅读内容,既体现数学严谨的思维逻辑,又反映数学之美。  2.细化考研题目。配套辅导教材将细致讲解考研题目,培养学生的逻辑思维能力。  3.随时更新新技术发展资料,配有微课视频。