社交网站的数据挖掘与分析(原书第2版)

社交网站的数据挖掘与分析(原书第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?

内容简介

《社交网站的数据挖掘与分析(原书第2版)》第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界中寻找的内容和你闻所未闻的有用信息。

·借助IPython Notebook、自然语言工具包、NetworkX和其他科学计算工具挖掘主流社交网站

·使用高级文本挖掘技术(如聚类和TF-IDF)来提取人类语言数据中有价值的知识

·通过发现GitHub上人、编程语言和代码工程间的亲密性,构建兴趣图谱

·利用D3.js进行交互式可视化,充分发挥HTML5和JavaScript工具包的灵活特性

·以“问题-解决方案-讨论”的方式详细讲解深入挖掘Twitter数据的实用技术,并提供代码示例

《社交网站的数据挖掘与分析(原书第2版)》的配套代码在公开的GitHub代码库中进行维护,可以通过一站式虚拟机来访问,你只需要使用方便易用的IPython Notebook,即可进入愉快的交互式学习情景。

作者简介

作者Matthew A. Russell,Digital Reasoning Systems公司首席技术官(CTO)、Zaffra公司负责人。作为一名计算机科学家,他热衷于数据挖掘、开源软件开发和创造技术以扩展人类智能。

章节目录

版权信息

O’Reilly Media,Inc.介绍

译者序

译者简介

前言

第一部分 社交网络导引

序幕

第1章 挖掘Twitter:探索热门话题、发现人们的谈论内容等

1.1 概述

1.2 Twitter风靡一时的原因

1.3 探索Twitter API

1.4 分析140字的推文

1.5 本章小结

1.6 推荐练习

1.7 在线资源

第2章 挖掘Facebook:分析粉丝页面、查看好友关系等

2.1 概述

2.2 探索Facebook的社交图谱API

2.3 分析社交图谱联系

2.4 本章小结

2.5 推荐练习

2.6 在线资源

第3章 挖掘LinkedIn:分组职位、聚类同行等

3.1 概述

3.2 探索LinkedIn API

3.3 数据聚类速成

3.4 本章小结

3.5 推荐练习

3.6 在线资源

第4章 挖掘Google+:计算文档相似度、提取搭配等

4.1 概述

4.2 探索Google+API

4.3 TF-IDF简介

4.4 用TF-IDF查询人类语言数据

4.5 本章小结

4.6 推荐练习

4.7 在线资源

第5章 挖掘网页:使用自然语言处理理解人类语言、总结博客内容等

5.1 概述

5.2 抓取、解析、爬取网页

5.3 通过解码语法来探索语义

5.4 以实体为中心的分析:范式转换

5.5 人类语言数据处理分析的质量

5.6 本章小结

5.7 推荐练习

5.8 在线资源

第6章 挖掘邮箱:分析谁和谁说什么以及说的频率等

6.1 概述

6.2 获取和处理邮件语料库

6.3 分析Enron语料库

6.4 探索和可视化时序趋势

6.5 分析你自己的邮件数据

6.6 本章小结

6.7 推荐练习

6.8 在线资源

第7章 挖掘GitHub:检查软件协同习惯、构建兴趣图谱等

7.1 概述

7.2 探索GitHub的API

7.3 使用属性图为数据建模

7.4 分析GitHub兴趣图谱

7.5 本章小结

7.6 推荐练习

7.7 在线资源

第8章 挖掘带标记语义网:提取微格式、推断资源描述框架等

8.1 概述

8.2 微格式:易于实现的元数据

8.3 从语义标记过渡到语义网:一个小插曲

8.4 语义网:发展中的变革

8.5 本章小结

8.6 推荐的练习

8.7 在线资源

第二部分 Twitter实用指南

第9章 Twitter实用指南

9.1 访问Twitter的API(开发目的)

9.2 使用OAuth访问Twitter的API(产品目的)

9.3 探索流行话题

9.4 查找推文

9.5 构造方便的函数调用

9.6 使用文本文件存储JSON数据

9.7 使用MongoDB存储和访问JSON数据

9.8 使用信息流API对Twitter数据管道抽样

9.9 采集时序数据

9.10 提取推文实体

9.11 特定的推文范围内查找最流行的推文

9.12 特定的推文范围内查找最流行的推文实体

9.13 对频率分析制表

9.14 查找转推了状态的用户

9.15 提取转推的属性

9.16 创建健壮的Twitter请求

9.17 获取用户个人资料信息

9.18 从任意的文本中提取推文实体

9.19 获得用户所有的好友和关注者

9.20 分析用户的好友和关注者

9.21 获取用户的推文

9.22 爬取好友关系图

9.23 分析推文内容

9.24 提取链接目标摘要

9.25 分析用户收藏的推文

9.26 本章小结

9.27 推荐练习

9.28 在线资源

第三部分 附录

附录A 关于本书虚拟机体验的信息

附录B OAuth入门

附录C Python和IPython Notebook的使用技巧

作者简介

封面介绍

社交网站的数据挖掘与分析(原书第2版)是2015年由机械工业出版社华章分社出版,作者[美] Matthew A. Russell。

得书感谢您对《社交网站的数据挖掘与分析(原书第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Excel 2010 商务数据分析与处理(第2版) 电子书
本书较系统地介绍了Excel2010的功能、操作技巧、各种实用函数、数据处理和数据分析工具的使用等。本书的特点是通过案例引导读者掌握解决实际应用问题的方法和技巧。本书案例丰富且具有实用价值,并配有习题和实验,以便读者巩固所学知识,提高实际应用能力。本书可作为本科、研究生相关课程的教材,也可作为Excel培训班、办公室管理人员和计算机爱好者的自学参考书或速查手册。
Excel数据处理与分析 电子书
聚焦Excel在财会工作中的典型应用,呈现Excel强大的财会管理功能!提升办公效率! 案例设置基于实际工作过程,案例不仅涉及会计和财务部门日常办公的各个方面,而且这些办公案例之间紧密关联。读者既学会了Excel功能,又熟悉了会计与财务管理岗位的办公业务。 10小时与本书内容同步的视频讲解,光盘与图书内容完美结合。 赠8小时Windows 7视频讲解,轻松运用主流操作系统。 赠1200个Office 2013应用技巧,自如应对工作中的各种状况。 赠900套Word/Excel/PPT 2013实用模板,稍加修改即可应用到工作中。 赠视频讲解常用办公设备和办公软件的使用方法,全面提升办公技能。 赠财务/人力资源/生产/文秘/行政等岗位工作手册,提高效率的有效工具。 赠电脑日常维护与故障排除常见问题解答,轻松搞定常见电脑问题。
Python数据分析与应用 电子书
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案, 后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
pandas数据处理与分析 电子书
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
Elasticsearch数据搜索与分析实战 电子书
深入描述了Elasticsearch的各种运行机制。