编辑推荐
深入浅出自然语言处理:基础、核心技术、序列标注及预训练模型。适合AI及机器学习爱好者。
内容简介
本书系统介绍了自然语言处理及深度学习,并结合实际应用场景和综合案例,深入浅出地讲解自然语言处理领域的相关知识。全书共15章,分为4个部分。第1部分是自然语言处理基础,首先介绍自然语言处理的相关概念和基本技能,然后介绍词向量技术和实现方法,最后介绍关键词提取技术。第2部分是自然语言处理核心技术,分别介绍朴素贝叶斯算法、N-gram 语言模型、PyTorch 深度学习框架、FastText 模型文本分类和基于深度学习的文本分类。第3部分是序列标注,介绍序列标注的具体应用,如HMM词性标注和HMM命名实体识别等常见的自然语言处理应用场景。第4部分是预训练模型,它在很大程度上促进了自然语言处理的发展,这部分内容关注预训练模型的具体应用,如 ALBERT 的命名实体识别、Transformer 的文本分类、BERT的文本相似度计算、ERNIE 的情感分析等。本书适合对人工智能、机器学习、深度学习和自然语言处理感兴趣的读者阅读,也可以作为应用型本科院校和高等职业院校人工智能相关专业的教材。
章节目录
版权信息
内容简介
《自然语言处理应用与实战》编委会
前言
第1部分 自然语言处理基础
第1章 绪论
1.1 自然语言处理综述
1.2 文本处理技能
1.3 文本数据处理
本章总结
作业与练习
第2章 词向量技术
2.1 词向量概述
2.2 词向量离散表示
2.3 词向量分布表示
本章总结
作业与练习
第3章 关键词提取
3.1 关键词提取概述
3.2 关键词提取的实现
本章总结
作业与练习
第2部分 自然语言处理核心技术
第4章 朴素贝叶斯中文分类
4.1 朴素贝叶斯分类算法概述
4.2 机器学习库sklearn
4.3 案例实现:朴素贝叶斯中文分类
本章总结
作业与练习
第5章 N-gram语言模型
5.1 N-gram概述
5.2 案例实现:基于N-gram的新闻文本预测
本章总结
作业与练习
第6章 PyTorch深度学习框架
6.1 PyTorch基础
6.2 PyTorch数据加载
6.3 PyTorch自带数据集加载
本章总结
作业与练习
第7章 FastText模型文本分类
7.1 FastText模型简介
7.2 案例实现:FastText模型文本分类
本章总结
作业与练习
第8章 基于深度学习的文本分类
8.1 基于TextCNN的文本分类
8.2 基于TextRNN的文本分类
8.3 基于TextRCNN的文本分类
8.4 案例实现:基于深度学习的文本分类
本章总结
作业与练习
第3部分 序列标注
第9章 HMM的词性标注
9.1 词性标注简介
9.2 HMM词性标注的原理和基本问题
9.3 案例实现:HMM的中文词性标注
本章总结
作业与练习
第10章 HMM的命名实体识别
10.1 命名实体识别
10.2 NER的HMM
10.3 案例实现:HMM的中文命名实体识别
本章总结
作业与练习
第11章 BiLSTM-CRF的命名实体识别
11.1 CRF简介
11.2 BiLSTM-CRF的原理
11.3 案例实现:BiLSTM-CRF的中文命名实体识别
本章总结
作业与练习
第4部分 预训练模型
第12章 ALBERT的命名实体识别
12.1 预训练模型简介
12.2 预训练模型Hugging Face
12.3 案例实现:ALBERT的中文命名实体识别
本章总结
作业与练习
第13章 Transformer的文本分类
13.1 Transformer概述
13.2 Self-Attention机制
13.3 案例实现:Transformer的文本分类
本章总结
作业与练习
第14章 BERT的文本相似度计算
14.1 文本相似度简介
14.2 BERT的文本相似度简介
14.3 案例实现:BERT的文本相似度计算
本章总结
作业与练习
第15章 ERNIE的情感分析
15.1 情感分析简介
15.2 ERNIE简介
15.3 案例实现:ERNIE的中文情感分析
本章总结
作业与练习
反侵权盗版声明
自然语言处理应用与实战是2023年由电子工业出版社出版,作者韩少云。
得书感谢您对《自然语言处理应用与实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。