跟着迪哥学:Python数据分析与机器学习实战在线阅读

简介: 本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。

内容提要

本书结合了机器学习、数据分析和Python语言,通过案例以通俗易懂的方式讲解了如何将算法应用到实际任务。

全书共20章,大致分为4个部分。第1部分介绍了Python必备的工具包,包括科学计算库Numpy、数据分析库Pandas、可视化库Matplotlib;第2部分讲解了机器学习中的经典算法,例如回归算法、决策树、集成算法、支持向量机、聚类算法等;第3部分介绍了深度学习中的常用算法,包括神经网格、卷积神经网络、递归神经网络;第4部分是项目实战,基于真实数据集,将算法模型应用到实际业务中。

本书适合对人工智能、机器学习、数据分析等方向感兴趣的初学者和爱好者。

前言

人工智能的飞速发展,带来了丰富的机遇与挑战。机器学习算法工程师、数据挖掘工程师、大数据工程师等岗位的薪资在IT行业也颇丰。面对高薪与前沿技术的诱惑,越来越多的大学毕业生准备投身其中,但苦于缺乏指导性教材进行系统学习,非科班出身的大学毕业生更是缺乏相关数学基础。

很多同学认识我是通过在线课程或线下培训,机器学习培训工作已经伴我走过了近4个年头。在这期间,开发的线上就业课程40余门,参与的学员累计超过30万人,顺利完成企业与高校讲师培训30余场,直播课程百余场。忙碌之余,最大的收获就是收到同学们晒出的各大企业的offer与认可。

在培训工作中,同学们给我最多的反馈就是虽然能参考的资料有很多,但是都很难理解,尤其对于初学者而言,看各种公式就要晕掉了。这几年我也一直在思考如何讲解才能让大家更深刻、更轻松地理解机器学习中的每一个算法。

本书是我多年培训教学和学习心得的总结,最大的特色就是以接地气的方式向大家通俗地讲解算法原理与应用方法,让读者能够更轻松地去理解其中每一个复杂的算法。学习的目的肯定要在实际任务中发挥作用,我写作的初衷也是希望更多读者能将理论与实战方法应用到自己的业务中,所以本书整体风格是以实战为主,通过案例来解读如何将机器学习应用在实际的数据挖掘任务中。

本书面向的读者

本书主要面向对人工智能、机器学习、数据分析等方面有强烈兴趣的初学者和爱好者,通过本书的学习,读者能够掌握机器学习中经典算法原理推导、整体流程以及其中数学公式与各种参数的作用。案例全部采用当下流行的Python语言,从最基础的工具包开始讲起,让大家熟练使用Python及其数据科学工具包进行机器学习和数据挖掘领域的项目实战任务,并处理其中遇到的种种问题。

路线图

本书内容大体可以分为以下4个部分。

图0-1 本书学习路线图

总结起来比较合适的学习路线如下。

第①步:Python工具包的使用,先把称心如意的“兵器”准备好,它们是实战中的好帮手。

第②步:理解机器学习算法,建模分析的核心就是其中的算法了,打牢基础才能走得更远。

第③步:项目实战应用,将算法模型应用到实际业务中,通过实际任务来进行提升。

可能很多读者都觉得应当先把Python的基础打牢固再进行后续的学习,我觉得这样可能会花费较多时间,从而耽搁后续重点内容学习,建议读者对于编程语言通过实际案例边练边学,把重点放在机器学习原理与应用中。

阅读本书需要准备什么/如何使用本书

对于初学者来说,可能在学习路线以及职业规划上有些迷茫,这里结合我对机器学习与数据科学领域的理解来进行阐述分析。首先无论从事人工智能中哪个方向,肯定要从工程师做起,那手里一定得有一个称心如意的“兵器”,本书选择的是Python语言,基于3.x版本进行实战演示。读者如果具备大学数学基础,学习起来会相对更容易一些,在学习过程中,难免遇到各种难以理解的算法问题,建议大家先对其整体流程进行通俗理解,再结合实际案例进行思考,很多时候数学上的描述十分复杂,而代码中的解释却浅显易懂。项目实战的目的一方面是从应用的角度阐述如何进行实际任务建模与分析,另一方面也是一个积累的过程。人工智能行业发展迅速,不要停下学习的脚步,每天都要学习新的知识来充实自己。

版权:人民邮电出版社