作者:陆晓蕾

陆晓蕾简介:

陆晓蕾书籍
  • 本书介绍了基于Python3的语料库相关技术与应用,内容包括语料自动获取与语料分析实践。全书分为理论篇和实践篇,理论篇主要介绍了如何将Python3应用到语料自动获取、存储与读取、清洗与预处理、语料检索与分析等典型应用场景,其中第4章还涉及部分自然语言处理的内容,包括情感分析、命名实体识别等;实践篇主要从开发环境配置出发,以IMDb为例,阐述了影评语料的自动获取和基于机器学习的文本分析方法。从语料