机器学习算法竞赛实战

机器学习算法竞赛实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

本书是算法竞赛领域一本系统介绍竞赛的图书,书中不仅包含竞赛的基本理论知识,还结合多个方向和案例详细阐述了竞赛中的上分思路和技巧。

内容简介

本书分为五部分:第一部分以算法竞赛的通用化流程为主,介绍竞赛中各个部分的核心内容和具体工作;第二部分介绍了用户画像相关的问题,讲解了竞赛案例Elo Merchant CategoryRecommendation;第三部分以时间序列预测问题为主,先讲述这类问题的常见解题思路和技巧,然后分析天池平台的全球城市计算 AI挑战赛和Kaggle平台的Corporacion Favorita Grocery Sales Forecasting:第四部分主要介绍计算广告的核心技术和业务,包括广告召回、广告排序和广告竞价,其中两个实战案例是2018腾讯广告算法大赛——相似人群拓展和Kaggle平台的TalkingData AdTracking Fraud Detection Challenge:第五部分基于自然语言处理相关的内容进行讲解,其中实战案例是Kaggle平台上的经典竞赛Quora Question Pairs。

作者简介

王贺(鱼遇雨欲语与余)
毕业于武汉大学计算机学院,硕士学位,研究方向为图数据挖掘,现任职于小米商业算法部,从事应用商店广告推荐的研究和开发。是2019年和2020年腾讯广告算法大赛的冠军,从2018年至2020年多次参加国内外算法竞赛,共获得五次冠军和五次亚军。

刘鹏
2016年本科毕业于武汉大学数学基地班,保研至中国科学技术大学自动化系,硕士期间研究方向为复杂网络与机器学习,2018年起多次获得机器学习相关竞赛奖项,2019年至今就职于华为技术有限公司,任算法工程师。

钱乾
本科就读于美国佐治亚理工大学,研究方向包括机器学习、深度学习、自然语言处理等,现就职于数程科技,工作方向为物流领域的智能算法应用,任大数据技术负责人。

章节目录

版权信息

前言

第一部分磨刀事半,砍柴功倍

第1章 初见竞赛

1.1 竞赛平台

1.2 竞赛流程

1.3 竞赛类型

1.4 思考练习

第2章 问题建模

2.1 赛题理解

2.2 样本选择

2.3 线下评估策略

2.4 实战案例

2.5 思考练习

第3章 数据探索

3.1 数据初探

3.2 变量分析

3.3 模型分析

3.4 思考练习

第4章 特征工程

4.1 数据预处理

4.2 特征变换

4.3 特征提取

4.4 特征选择

4.5 实战案例

4.6 思考练习

第5章 模型训练

5.1 线性模型

5.2 树模型

5.3 神经网络

5.4 实战案例

5.5 思考练习

第6章 模型融合

6.1 构建多样性

6.2 训练过程融合

6.3 训练结果融合

6.4 实战案例

6.5 思考练习

第二部分物以类聚,人以群分

第7章 用户画像

7.1 什么是用户画像

7.2 标签系统

7.3 用户画像数据特征

7.4 用户画像的应用

7.5 思考练习

第8章 实战案例:Elo Merchant Category Recommendation

8.1 赛题理解

8.2 数据探索

8.3 特征工程

8.4 模型训练

8.5 模型融合

8.6 高效提分

8.7 赛题总结

第三部分以史为鉴,未来可期

第9章 时间序列

9.1 什么是时间序列

9.2 时间序列模式

9.3 特征提取方式

9.4 模型的多样性

9.5 思考练习

第10章 实战案例:全球城市计算 AI 挑战赛

10.1 赛题理解

10.2 数据探索

10.3 特征工程

10.4 模型训练

10.5 强化学习

第11章 实战案例:Corporación Favorita Grocery Sales Forecasting

11.1 赛题理解

11.2 数据探索

11.3 特征工程

11.4 模型训练

11.5 赛题总结

第四部分精准投放,优化体验

第12章 计算广告

12.1 什么是计算广告

12.2 广告类型

12.3 广告召回

12.4 广告排序

12.5 广告竞价

12.6 思考练习

第13章 实战案例:2018 腾讯广告算法大赛

13.1 赛题理解

13.2 数据探索

13.3 特征工程

13.4 模型训练

13.5 模型融合

13.6 赛题总结

第14章 实战案例:TalkingData AdTracking Fraud Detection Challenge

14.1 赛题理解

14.2 数据探索

14.3 特征工程

14.4 模型训练

14.5 赛题总结

第五部分听你所说,懂你所写

第15章 自然语言处理

15.1 自然语言处理的发展历程

15.2 自然语言处理的常见场景

15.3 自然语言处理的常见技术

15.4 思考练习

第16章 实战案例:Quora Question Pairs

16.1 赛题理解

16.2 数据探索

16.3 特征工程

16.4 模型训练

16.5 模型融合

16.6 赛题总结

作者简介

机器学习算法竞赛实战是2021年由人民邮电出版社出版,作者王贺,刘鹏,钱乾。

得书感谢您对《机器学习算法竞赛实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
机器学习 电子书
机器学习基础与高级内容全面讲解,实例丰富,易于学习巩固。
实用机器学习 电子书
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包
机器学习公式详解 电子书
适读人群 :(1)高等院校人工智能、计算机、自动化等相关专业机器学习方向的学生;(2)学术界机器学习领域的研究人员和教师;(3)工业界对机器学习感兴趣的专业人员和工程师。 1.周志华教授“西瓜书”《机器学习》公式完全解析指南! “南瓜书”系Datawhale成员自学笔记,对“西瓜书”中250个重难点公式做了详细解析和推导(重难点公式覆盖率达99%),旨在解决机器学习中的数学难题。 2.机器学习初学小白提升数学基础能力的必备练习册! 以本科数学基础视角对“西瓜书”里比较难理解的公式加以解析和推导细节,补充大量重、难点数学知识和参考材料,分享在学习中遇到的“坑”以及跳过这个“坑”的方法,对于初学机器学习的小白也能上手练习! 3.俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达等人工智能领域大咖亲笔推荐
Python高手修炼之道:数据处理与机器学习实战 电子书
适读人群 :1.没有编程知识的新手 不同于一般的基础语法讲解教程,本书并未将Python 开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python 语言和Python 编程。2.从未接触过Python 语言,但了解一点编程知识的初学者 本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python 程序员 本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30 余个模块的使用。 构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。
联邦学习:原理与算法 电子书
人工智能机器学习教程书籍,平安科技联邦学习团队执笔,由浅入深介绍联邦机器学习的算法体系,注重工程实践,保证理论前沿性。