自然语言处理应用与实战

自然语言处理应用与实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

深入浅出自然语言处理:基础、核心技术、序列标注及预训练模型。适合AI及机器学习爱好者。

内容简介

本书系统介绍了自然语言处理及深度学习,并结合实际应用场景和综合案例,深入浅出地讲解自然语言处理领域的相关知识。全书共15章,分为4个部分。第1部分是自然语言处理基础,首先介绍自然语言处理的相关概念和基本技能,然后介绍词向量技术和实现方法,最后介绍关键词提取技术。第2部分是自然语言处理核心技术,分别介绍朴素贝叶斯算法、N-gram 语言模型、PyTorch 深度学习框架、FastText 模型文本分类和基于深度学习的文本分类。第3部分是序列标注,介绍序列标注的具体应用,如HMM词性标注和HMM命名实体识别等常见的自然语言处理应用场景。第4部分是预训练模型,它在很大程度上促进了自然语言处理的发展,这部分内容关注预训练模型的具体应用,如 ALBERT 的命名实体识别、Transformer 的文本分类、BERT的文本相似度计算、ERNIE 的情感分析等。本书适合对人工智能、机器学习、深度学习和自然语言处理感兴趣的读者阅读,也可以作为应用型本科院校和高等职业院校人工智能相关专业的教材。

章节目录

版权信息

内容简介

《自然语言处理应用与实战》编委会

前言

第1部分 自然语言处理基础

第1章 绪论

1.1 自然语言处理综述

1.2 文本处理技能

1.3 文本数据处理

本章总结

作业与练习

第2章 词向量技术

2.1 词向量概述

2.2 词向量离散表示

2.3 词向量分布表示

本章总结

作业与练习

第3章 关键词提取

3.1 关键词提取概述

3.2 关键词提取的实现

本章总结

作业与练习

第2部分 自然语言处理核心技术

第4章 朴素贝叶斯中文分类

4.1 朴素贝叶斯分类算法概述

4.2 机器学习库sklearn

4.3 案例实现:朴素贝叶斯中文分类

本章总结

作业与练习

第5章 N-gram语言模型

5.1 N-gram概述

5.2 案例实现:基于N-gram的新闻文本预测

本章总结

作业与练习

第6章 PyTorch深度学习框架

6.1 PyTorch基础

6.2 PyTorch数据加载

6.3 PyTorch自带数据集加载

本章总结

作业与练习

第7章 FastText模型文本分类

7.1 FastText模型简介

7.2 案例实现:FastText模型文本分类

本章总结

作业与练习

第8章 基于深度学习的文本分类

8.1 基于TextCNN的文本分类

8.2 基于TextRNN的文本分类

8.3 基于TextRCNN的文本分类

8.4 案例实现:基于深度学习的文本分类

本章总结

作业与练习

第3部分 序列标注

第9章 HMM的词性标注

9.1 词性标注简介

9.2 HMM词性标注的原理和基本问题

9.3 案例实现:HMM的中文词性标注

本章总结

作业与练习

第10章 HMM的命名实体识别

10.1 命名实体识别

10.2 NER的HMM

10.3 案例实现:HMM的中文命名实体识别

本章总结

作业与练习

第11章 BiLSTM-CRF的命名实体识别

11.1 CRF简介

11.2 BiLSTM-CRF的原理

11.3 案例实现:BiLSTM-CRF的中文命名实体识别

本章总结

作业与练习

第4部分 预训练模型

第12章 ALBERT的命名实体识别

12.1 预训练模型简介

12.2 预训练模型Hugging Face

12.3 案例实现:ALBERT的中文命名实体识别

本章总结

作业与练习

第13章 Transformer的文本分类

13.1 Transformer概述

13.2 Self-Attention机制

13.3 案例实现:Transformer的文本分类

本章总结

作业与练习

第14章 BERT的文本相似度计算

14.1 文本相似度简介

14.2 BERT的文本相似度简介

14.3 案例实现:BERT的文本相似度计算

本章总结

作业与练习

第15章 ERNIE的情感分析

15.1 情感分析简介

15.2 ERNIE简介

15.3 案例实现:ERNIE的中文情感分析

本章总结

作业与练习

反侵权盗版声明

自然语言处理应用与实战是2023年由电子工业出版社出版,作者韩少云。

得书感谢您对《自然语言处理应用与实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
文本上的算法——深入浅出自然语言处理 电子书
《文本上的算法深入浅出自然语言处理》结合-作者多年学习和从事自然语言处理相关工作的经验,力图用生动形象的方式深入浅出地介绍自然语言处理的理论、方法和技术。本书抛弃掉繁琐的证明,提取出算法的核心,帮助读者尽快地掌握自然语言处理所必需的知识和技能。本书主要分两大部分。第一部分是理论篇,包含前3章内容,主要介绍一些基础的数学知识、*优化理论知识和一些机器学习的相关知识。第二部分是应用篇,包含第4章到第8
Spark海量数据处理:技术详解与平台实战 电子书
在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架Apache Spark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。 本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了Structured Streaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。 本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
Excel数据处理与分析:数据思维+分析方法+场景应用 电子书
作者在世界500强企业从事数据分析师工作,有着丰富的实践经验,带你轻松入门数据分析。
大数据技术原理与应用——概念、存储、处理、分析与应用 电子书
全书共有13章,系统地论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在Hadoop、HDFS、HBase和MapReduce等重要章节,安排了入门级的实践操作,让读者更好地学习和掌握大数据关键技术。
Python高手修炼之道:数据处理与机器学习实战 电子书
适读人群 :1.没有编程知识的新手 不同于一般的基础语法讲解教程,本书并未将Python 开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python 语言和Python 编程。2.从未接触过Python 语言,但了解一点编程知识的初学者 本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python 程序员 本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30 余个模块的使用。 构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。