监控平台解密:IT系统风险感知和洞察

监控平台解密:IT系统风险感知和洞察

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书采用循序渐进的讲解方式,介绍了如何从零开始构建一个企业级监控平台的相关理论技术和实践方法。

内容简介

作者首先从监控系统总体设计原理出发,逐步介绍企业级监控系统的常用架构、各个组件模块作用、运行模式、监控体系的建设路线、监控信息的合并算法、监控颗粒度设置经验以及如何保障监控系统自身可靠性等内容;

随后自下而上依次对硬件设备、操作系统、虚拟机、常用数据库和中间件、容器和容器编排、系统和应用日志以及应用链路等常见监控领域实施监控的技术原理、常用监控指标以及实现方式等内容作了介绍;

最后对监控系统下阶段发展趋势也即智能监控,以及涉及相关技术原理及常用智能监控功能作了展望及介绍。

通过对本书的系统学习,可以对计算机监控系统的基本原理、设计思想、实现方式等方面有全面而深入的了解。

作者简介

编著者姜才康,现任中汇信息技术(上海)有限公司总经理,中国计算机用户协会金融信息分会理事,上海计算机学会理事,上海信息化理事。在金融信息化建设方面贡献突出,长期从事金融行业应用软件设计开发、技术标准制定和技术管理工作,不断夯实金融基础设施,构建全方位的银行间市场风险治理和安全运维体系,先后获得数十项银行发展科技奖。

章节目录

版权信息

内容简介

推荐序一

推荐序二

推荐序三

前言

第1章 监控系统规划及原理

1.1 IT监控运维管理的发展历程

1.1.1 新兴的中国市场(1985—1994年)

1.1.2 运营商大建设期(1995—2000年)

1.1.3 多元化的监控运维系统(2001—2010年)

1.1.4 面向云和应用(2010年至今)

1.2 监控体系总体规划

1.2.1 IT运营体系的阶段性

1.2.2 监控体系建设的阶段性

1.3 监控系统的分类

1.4 监控系统工作原理

1.5 监控系统运行模式分类

1.5.1 主动/被动监控

1.5.2 有代理/无代理

1.6 监控事件总线

1.6.1 什么是集中监控事件总线

1.6.2 事件总线的市场格局

1.6.3 监控事件总线的功能设计

本章小结

第2章 计算机硬件设备监控

2.1 计算机的分类

2.2 数据中心常见的计算机种类

2.2.1 大型机

2.2.2 小型机、PC服务器

2.2.3 RISC、CISC

2.2.4 刀片机

2.3 计算机硬件设备监控

2.3.1 大型机设备监控

2.3.2 小型机设备监控

2.3.3 PC Server设备监控

2.3.4 刀片机设备监控

本章小结

第3章 虚拟机监控

3.1 虚拟化分类

3.1.1 硬件虚拟化

3.1.2 桌面虚拟化

3.1.3 应用程序虚拟化

3.1.4 网络虚拟化

3.2 ESXi虚拟化监控

3.2.1 ESXi虚拟化概述

3.2.2 ESXi架构图及监控入口

3.2.3 使用Zabbix监控ESXi

3.3 KVM虚拟化监控

3.3.1 KVM虚拟化概述

3.3.2 使用Zabbix监控KVM

本章小结

第4章 操作系统监控

4.1 操作系统的种类

4.1.1 类UNIX系统

4.1.2 Windows系统

4.2 操作系统功能模块

4.3 CPU监控

4.3.1 CPU相关概念

4.3.2 CPU状态

4.4 内存监控

4.4.1 内存相关概念

4.4.2 内存状态

4.5 进程监控

4.5.1 进程相关概念

4.5.2 进程状态监控

4.6 文件属性监控

4.6.1 Windows中的文件属性

4.6.2 类UNIX中的文件属性

4.7 文件系统监控

4.7.1 文件系统概念

4.7.2 文件系统状态

4.8 网络模块监控

4.9 监控系统如何监控操作系统

4.9.1 Windows

4.9.2 Linux

本章小结

第5章 数据库监控

5.1 数据库分类

5.1.1 关系型数据库

5.1.2 非关系型数据库

5.2 数据库状态指标分类

5.3 当前连接数与最大允许连接数

5.3.1 连接数的相关概念

5.3.2 连接数指标实例

5.4 QPS/TPS

5.4.1 QPS/TPS的相关概念

5.4.2 QPS/TPS指标实例

5.5 慢查询

5.5.1 慢查询的相关概念

5.5.2 慢查询指标实例

5.6 磁盘I/O监控

5.6.1 磁盘I/O相关概念

5.6.2 磁盘I/O的获取

5.7 其他针对性指标

5.7.1 Mysql Binlog cache的相关概念

5.7.2 Mysql Binlog cache指标实例

5.7.3 Oracle表空间的概念

5.7.4 Oracle表空间指标实例

5.7.5 Mysql MHA高可用集群的概念

5.7.6 Mysql MHA高可用集群指标

5.7.7 Oracle集群的概念

5.7.8 Oracle集群指标实例

本章小结

第6章 中间件监控

6.1 Nginx监控

6.1.1 Nginx概述

6.1.2 Nginx服务的进程及端口

6.1.3 服务可用性监控

6.1.4 Nginx日志监控

6.1.5 Nginx状态页监控

6.2 Tomcat监控

6.2.1 Tomcat概述

6.2.2 请求吞吐量指标和延迟指标

6.2.3 线程池指标

6.2.4 Errors错误率指标

6.2.5 JVM内存使用情况指标

6.2.6 JVM监控工具

6.3 ActiveMQ监控

6.3.1 ActiveMQ概述

6.3.2 生产者数量监控

6.3.3 消费者数量监控

6.3.4 队列深度监控

6.3.5 ActiveMQ监控实践

本章小结

第7章 Docker容器监控

7.1 Docker容器运行状态

7.2 Docker容器性能指标

7.3 cAdvisor对容器监控

7.3.1 CPU的监控

7.3.2 内存的监控

7.3.3 磁盘的监控

7.3.4 网络的监控

7.4 Docker容器内的应用日志监控

本章小结

第8章 Kubernetes监控

8.1 Kubernetes简介

8.2 Prometheus简介

8.3 Prometheus部署

8.4 Kubernetes集群监控

8.4.1 宿主机监控

8.4.2 容器监控

8.4.3 集群资源监控

8.4.4 API Server监控

8.4.5 应用系统监控

本章小结

第9章 应用监控

9.1 应用性能管理概述

9.2 调用链路跟踪

9.2.1 Span的概念

9.2.2 Trace的概念

9.3 APM系统的设计与实现

9.3.1 APM系统通用架构

9.3.2 Span的创建及SpanContext的传递逻辑

9.3.3 TraceID和SpanID的生成方法

9.3.4 代码注入方法

9.3.5 APM系统性能优化

本章小结

第10章 日志监控

10.1 日志的基本概念

10.2 日志的作用

10.2.1 运维监控

10.2.2 资源管理

10.2.3 入侵检测

10.2.4 取证和审计

10.2.5 挖掘分析

10.3 常见日志类型及格式

10.3.1 W3C Extended Log File格式

10.3.2 Apache access log

10.3.3 Syslog

10.4 日志规范

10.4.1 应用日志打印规范

10.4.2 日志的轮转归档

10.4.3 日志的爆发抑制

10.5 日志监控基本原理

10.5.1 前置式日志监控

10.5.2 集中式日志监控

10.5.3 日志监控的基本过程

10.6 日志监控的常见场景

10.6.1 关键字监控

10.6.2 多节点日志监控

10.6.3 应用系统性能监控

10.6.4 应用系统业务量异常监控

10.6.5 安全监控与异常IP自动封禁

10.7 日志采集与传输

10.7.1 拉式采集(PULL)

10.7.2 推式采集(PUSH)

10.7.3 日志过滤

10.8 日志解析与日志监控策略

10.8.1 日志解析工具

10.8.2 正则表达式

10.8.3 日志监控策略

10.9 常见日志监控系统

10.9.1 基于ELK的日志监控

10.9.2 基于Splunk的日志监控

本章小结

第11章 智能监控

11.1 智能监控概述

11.1.1 Gartner AIOps

11.1.2 NoOps

11.1.3 智能监控实施路径

11.2 监控数据治理

11.2.1 大数据平台选型

11.2.2 大数据平台设计

11.2.3 监控运维数据治理

11.3 监控动态基线

11.3.1 动态阈值设计与计算

11.3.2 基于动态阈值异常检测

11.3.3 监控动态阈值案例

11.4 监控自愈

11.4.1 什么是自愈

11.4.2 自愈的优势

11.4.3 监控自愈模块设计

11.4.4 监控自愈案例分享

本章小结

参考文献

监控平台解密:IT系统风险感知和洞察是2022年由电子工业出版社出版,作者姜才康 编著。

得书感谢您对《监控平台解密:IT系统风险感知和洞察》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
微信公众平台与小程序开发——从零搭建整套系统 电子书
适读人群 :web开发开发工程师、后台开发工程师 大专及以上 本书适合零售以及培训班 ·求职利器,Web工程师与后台工程师必修技能。 ·即学即用,系统详尽地呈现高效的开发步骤。 ·自我修炼,从思路到实践,全面提升开发水平。 本书从微信公众平台的基础知识入手,详尽地阐述了开发原理、应用场景,并讲解了公众平台开发相关的关键功能和概念,如微信支付、网页授权账号绑定、JS-SDK、 微信小程序等;微信公众平台开发的主要调试工具及方法的相关内容,可以帮助开发者快速定位问题;搭建基于CodeIgniter的PHP微信公众平台开发框架,是非常实用 的知识,本书在此基础上介绍了多个案例实现;zui后,本书展示了如何在腾讯云平台搭建一套完整的系统,并介绍了服务器运维的相关知识。 微信公众平台开发是当下非常热门的技术之一,涉及前端以及后台技术的工程师需要融汇贯通、熟练掌握。 本书适合具有一定程序开发基础的技术人员阅读。
Spring Cloud微服务和分布式系统实践 电子书
以微服务与分布式开发结合的独特视角展现来自一线开发者的实战经验总结。
大数据处理平台 电子书
本书从数据查询、数据分析和迭代计算平台3个方面对大数据处理平台的体系结构、基本原理、主流技术、国内外研究进展和成果进行了全面、深入的阐述,对大数据实时处理平台的架构和核心技术进行了展望。企业技术人员可参考本书选择合适的技术构建大数据处理平台或对现有平台进行优化;高校院所的科研人员可参考本书了解大数据管理的基本原理和现有研究成果;学生读者可通过学习本书全面了解大数据处理平台。同时,本书也适用于对大数
微信公众平台开发技术 电子书
本书较为全面地介绍了微信公众平台开发的基本流程与方法。全书共11章,主要分为两个部分:第一部分(第1~8章)介绍了微信公众平台及其接口,主要包括初识微信公众平台、微信公众平台开发准备、自定义菜单、消息的接收与响应、用户管理与账号管理、微信小店、微信支付、高级接口等;第二部分(第9~11章)介绍了几种微信公众平台的开发应用案例,包括天气预报应用实例、游戏开发应用实例、微商城综合实例等。部分章节提供了
云计算平台管理与应用 电子书
本书系统地介绍了云计算基础架构与实践相关知识,全书共分为5个项目,项目1主要介绍了云计算的概念与发展趋势、云计算的架构内涵与关键技术、云计算基础架构等内容;项目2主要介绍了共享存储模型、磁盘存储阵列、存储网络、共享文件系统等内容;项目3主要介绍了网络总体架构、接入层网络、主机网络虚拟化、OpenFlow网络流量平面等内容;项目4主要介绍了云接入技术、桌面云和VMwareView桌面云等内容;项目5