Python社会媒体挖掘

Python社会媒体挖掘

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

获取、存储、分析和可视化社交数据的一站式解决方案参考指南。

内容简介

本书主要内容包括:如何用Python的公共API与社会媒体平台交互,如何为数据分析存储社会媒体数据,使用Python分割社会媒体数据,用文本分析方法理解社会媒体数据,如何用统计和分析手段从海量数据中挖掘出有用信息,如何用Web技术将数据可视化展现出来。

作者简介

作者马尔科·邦扎尼尼,数据科学咨询师,拥有伦敦玛丽王后大学信息检索专业博士学位,是PyData伦敦meetup及系列会议的合作组织者,在很多国际会议上做过演讲,并且在PacktPub上教授“Python数据分析”和“实用Python数据科学技术”两门课程。他在个人博上分享了很多技术主题,主要关于Python、文本分析和数据科学。

章节目录

版权信息

前言

本书内容

本书需要的工具

目标读者

排版约定

读者反馈

客户支持

下载示例代码

下载本书中的彩色图片

勘误

反盗版

问题

电子书

第1章 社会媒体、社交数据和Python

1.1 入门

1.2 社会媒体——机遇和挑战

1.2.1 机遇

1.2.2 挑战

1.2.3 社会媒体挖掘技术

1.3 Python的数据科学工具

1.3.1 Python开发环境的安装

1.3.2 高效的数据分析

1.3.3 机器学习

1.3.4 自然语言处理

1.3.5 社会网络分析

1.3.6 数据可视化

1.4 Python中的数据处理

1.5 创建复杂的数据管道

1.6 小结

第2章 Twitter数据挖掘——标签、话题和时间序列

2.1 入门

2.2 Twitter API

2.2.1 接口访问频率限制

2.2.2 搜索与流

2.3 从Twitter收集数据

2.3.1 从时间线获取推文

2.3.2 推文的结构

2.3.3 使用流API

2.4 分析推文——实体分析

2.5 分析推文——文本分析

2.6 分析推文——时间序列分析

2.7 小结

第3章 Twitter用户、粉丝和社区

3.1 用户、好友和粉丝

3.1.1 回到Twitter API

3.1.2 用户资料的结构

3.1.3 下载好友和粉丝的资料

3.1.4 分析你的社会网络

3.1.5 度量影响力和参与度

3.2 挖掘粉丝

3.3 挖掘对话

3.4 在地图上绘制推文

3.4.1 将推文转换为GeoJSON

3.4.2 用Folium轻松绘制地图

3.5 小结

第4章 Facebook帖子、页面和用户互动

4.1 Facebook Graph API

4.1.1 注册你的应用

4.1.2 鉴权和安全

4.1.3 用Python连接Facebook Graph API

4.2 挖掘你的帖子

4.2.1 帖子的结构

4.2.2 时间频率分析

4.3 挖掘Facebook页面

4.3.1 从页面获取帖子

4.3.2 度量参与度

4.3.3 用词云可视化帖子

4.4 小结

第5章 Google+话题分析

5.1 Google+ API入门

在Google+中搜索

5.2 在Web GUI中嵌入搜索结果

5.2.1 Python的装饰器

5.2.2 Flask路由和模板

5.3 Google+页面的笔记和活动

5.4 笔记的文本分析和TF-IDF计算

用n-gram方法捕获短语

5.5 小结

第6章 Stack Exchange提问和回答

6.1 提问和回答

6.2 Stack Exchange API入门

6.2.1 搜索带标签的问题

6.2.2 搜索用户

6.3 处理Stack Exchange的存档数据

6.4 问题标签的文本分类

6.4.1 监督学习和文本分类

6.4.2 分类算法

6.4.3 评估

6.4.4 Stack Exchange数据的文本分类

6.4.5 在实时应用中嵌入分类器

6.5 小结

第7章 博客、RSS、维基百科和自然语言处理

7.1 博客和自然语言处理

7.2 从博客和网站获取数据

7.2.1 使用WordPress.com API

7.2.2 使用Blogger API

7.2.3 解析RSS和Atom订阅

7.2.4 从维基百科获取数据

7.2.5 关于网络爬取的一点建议

7.3 自然语言处理基础

7.3.1 文本处理

7.3.2 信息抽取

7.4 小结

第8章 挖掘所有数据

8.1 很多社交API

8.2 挖掘YouTube上的视频

8.3 挖掘GitHub上的开源软件

8.4 挖掘Yelp上的本地商家

8.5 创建自定义的Python客户端

HTTP让事情变得简单

8.6 小结

第9章 关联数据和语义网

9.1 数据网

9.1.1 语义网词汇

9.1.2 微格式

9.1.3 关联数据和开放数据

9.1.4 RDF

9.1.5 JSON-LD格式

9.1.6 Schema.org

9.2 从DBpedia挖掘关系

9.3 挖掘地理坐标

9.3.1 从维基百科抽取地理数据

9.3.2 在Google Maps上绘制地理数据

9.4 小结

看完了

Python社会媒体挖掘是2018年由人民邮电出版社·图灵出品出版,作者[意] 马尔科·邦扎尼尼。

得书感谢您对《Python社会媒体挖掘》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python大数据分析与挖掘实战(微课版) 电子书
本书以应用为导向,将理论与实践相结合,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本知识,以及如何将其应用到具体领域的方法。本书分3篇:基础篇、案例篇和提高篇。基础篇(第1章-第6章)主要介绍Python基础知识及应用于科学计算、数据处理、数据可视化、机器学习、深度学习等方面的基础知识;案例篇(第7章-第11章)主要介绍利用Python进行金融、地理信息、交通、文本分析、图像识别等领域
Python数据分析、挖掘与可视化(慕课版) 电子书
1.Python零基础,轻松学会数据分析与挖掘2.编码、分析、挖掘,数据分析全流程一次搞定3.微课视频,扫码即可观看,重点难点逐个击破本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。
数据挖掘 电子书
本书着力于介绍数据挖掘基础知识、基本原理、常用算法,主要内容包括数据挖掘概述、数据的描述与可视化、数据的采集和预处理、数据的归约、关联规则挖掘、分类与预测、非线性预测模型、聚类分析、深度学习简介、使用Weka进行数据挖掘。本书通俗易懂,注重基础知识、基本原理和基本方法,注重启发和引申,以培养学生独立思考和独立发现的能力。  本书适合作为数据科学与大数据、信息管理、统计等专业的本科层次基础课教材,也
新媒体与社会发展 电子书
作者将互联网使用与城乡发展联结起来,思考当有如此之巨大影响力的互联网技术为城市与农村居民逐步采纳后,能否为缩小城乡发展差距提供机遇。与此同时,当时作者正着手硕士论文的选题,于是以“数字鸿沟”为切入点,尝试探索互联网在城乡发展中所发挥的作用。
特异群组挖掘 电子书
本书阐述了特异群组挖掘任务,包括介绍了特异群组挖掘的概念,分析了特异群组挖掘任务与聚类、异常等任务之间的差异,给出了特异群组挖掘任务的相关算法,并且列举了特异群组挖掘的几个重点应用。