预测模型实战:基于R、SPSS和Stata

预测模型实战:基于R、SPSS和Stata

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

全面拆解临床预测模型知识体系;真实案例一镜到底,助你充分掌握预测模型全流程。

内容简介

本书从生物医药三种建模讲起,引出临床预测模型,系统介绍了临床预测模型的基本思想与理论体系并配合SPSS、Stata和R语言实战,让读者全面掌握临床预测模型的建模、评价、验证与展示技术,从而轻轻松松进行临床预测模型研究,顺利发表SCI(Science Citation Index,科学引文索引)论文。

本书内容通俗易懂,实用性强,适用人群为生物医药领域医生、护士、硕博士研究生、医学高校教师,特别适合临床预测模型的入门读者和进阶读者阅读。

作者简介

编著者武松,安徽中医药大学教授,中国疾病预防控制中心流行病与卫生统计学博士,世界中联临床科研统计学会理事,国家高级统计分析师,SPSS高级数据分析师。擅长使用SPSS、SAS、R、Stata等多种统计软件,国内多家杂志编委。

章节目录

版权信息

作者简介

内容简介

第1章 临床预测模型基础

1.1 三种建模策略解读

1.1.1 风险因素发现模型

1.1.2 风险因素验证模型

1.1.3 临床预测模型

1.2 临床预测模型分类与分型

1.2.1 预测模型目的分类

1.2.2 预测模型数据来源分类

1.2.3 数据集分类

1.3 区分度-C指数

1.4 净重新分类指数

1.5 综合判别改善指数

1.6 校准度

1.6.1 Hosmer-Lemeshow检验

1.6.2 Calibration plot

1.7 临床决策曲线

1.8 模型可视化(Visualization)

1.9 交叉验证

1.9.1 简单交叉验证(Simple Cross Validation)

1.9.2 K折交叉验证(K-Folder Cross Validation)

1.9.3 留一法交叉验证(Leave-one-out Cross Validation)

1.10 自助抽样法

1.11 LASSO回归

1.12 临床预测模型报告规范

第2章 模型构建相关问题

2.1 单变量进入模型的形式

2.1.1 数值变量进入模型的形式

2.1.2 等级变量进入模型的形式

2.1.3 分类变量进入模型的形式

2.2 模型构建策略探讨

2.2.1 先单后多法

2.2.2 全部进入法

2.2.3 百分之十改变量法

2.2.4 LASSO回归法

2.3 统计建模

2.3.1 危险因素筛选模型

2.3.2 风险因素验证模型

2.3.3 临床预测模型

第3章 SPSS临床预测模型实战

3.1 SPSS在诊断模型中的应用

3.1.1 数据拆分

3.1.2 统计建模

3.1.3 模型评价

3.2 SPSS在预后模型中的应用

第4章 Stata诊断模型实战

4.1 Logistic回归模型构建

4.1.1 先单因素分析

4.1.2 后多因素分析

4.1.3 正式后多因素分析

4.1.4 模型比较

4.1.5 最终模型

4.1.6 预测概率

4.2 Logistic回归模型区分度评价

4.2.1 训练集的AUC分析

4.2.2 训练集ROC曲线分析

4.2.3 验证集AUC分析

4.2.4 验证集ROC分析

4.2.5 多条ROC曲线

4.3 Logistic回归模型校准度评价:HL检验与校准曲线

4.3.1 基于HL函数的校准度

4.3.2 校准曲线加强版

4.3.3 Bootstrap校准曲线

4.4 Logistic回归模型临床适用性评价:临床决策曲线(DCA)

4.4.1 训练集临床决策曲线

4.4.2 验证集临床决策曲线

4.4.3 决策曲线优化

4.4.4 净减少曲线(Net Reduction)

4.5 Logistic回归模型可视化:Nomo图

4.6 NRI和IDI

4.6.1 NRI(净重新分类指数)

4.6.2 IDI(综合判别改善指数)

4.7 如何利用别人文章的模型

4.8 交叉验证

4.9 Bootstrap

4.10 LASSO-Logit

4.10.1 LASSO回归

4.10.2 路径图

4.10.3 CV-LASSO

4.11 缺失值处理

4.11.1 直接删除法

4.11.2 单一插补法

4.11.3 多重插补法

第5章 Stata预后临床预测模型实战

5.1 模型构建

5.1.1 建立时间变量和结局变量

5.1.2 单因素分析

5.1.3 多因素分析

5.1.4 模型比较

5.1.5 确定最终模型

5.2 区分度

5.2.1 C-index

5.2.2 C-index和Somers_D及95%可信区间

5.2.3 时点ROC曲线(Time ROC)

5.3 校准度

5.3.1 建立模型

5.3.2 训练集时点校准曲线

5.3.3 验证集时点校准曲线

5.3.4 训练集校准曲线加强版

5.3.5 验证集校准曲线加强版

5.4 决策曲线

5.4.1 建立模型

5.4.2 设立时间节点死亡概率

5.4.3 模型组与验证组DCA

5.4.4 多模型DCA曲线

5.4.5 净获益的数据

5.5 Nomo图

5.5.1 构建模型

5.5.2 命令绘制Nomo图

5.5.3 窗口Nomo绘制

5.6 NRI与IDI

5.6.1 NRI

5.6.2 IDI

5.7 Bootstrap

第6章 R语言诊断临床预测模型实战

6.1 Logistic回归模型构建

6.1.1 单因素分析

6.1.2 多因素分析

6.2 Logistic回归模型区分度评价

6.2.1 训练集AUC与ROC

6.2.2 验证集AUC和ROC

6.2.3 绘制多条ROC曲线

6.2.4 两条ROC曲线比较

6.2.5 Bootstrap法ROC内部验证

6.3 Logistic回归校准度评价:HL检验与校准曲线

6.3.1 calibrate包val.prob函数校准曲线实现

6.3.2 Hosmer-Lemeshow test检验

6.3.3 riskRegression包plotCalibration函数校准曲线实现

6.3.4 lrm+calibrate+plot校准曲线实现

6.3.5 校准曲线方法四(Bootstrap法)

6.4 Logistic回归模型临床决策曲线(DCA)

6.4.1 软件准备工作

6.4.2 rmda包决策曲线实现

6.4.3 临床影响曲线(clinical impact curve)

6.4.4 DCA及可信区间

6.4.5 交叉验证DCA

6.4.6 DCA包临床决策曲线绘制

6.5 Logistic回归模型可视化:Nomo图

6.5.1 rms包常规普通列线图回归

6.5.2 regplot包绘制交互列线图

6.5.3 普通列线图变种

6.5.4 DynNom包动态列线图

6.5.5 制作网络版动态列线图

6.6 Logistic回归模型诊断效果评价

6.6.1 诊断试验评价

6.6.2 ROC曲线比较

6.6.3 Logistic回归分析

6.7 NRI和IDI

6.7.1 净重新分类指数

6.7.2 综合判别改善指数

6.8 如何验证别人已经发表的模型

6.9 LASSO在Logistic回归中应用

6.9.1 软件包准备

6.9.2 数据准备

6.9.3 LASSO-Logit

6.9.4 CV-LASSO

6.10 交叉验证与Bootstrap

6.10.1 简单交叉验证

6.10.2 十重交叉验证

6.10.3 留一法交叉验证

6.10.4 Bootstrap CV

6.10.5 Bootstrap ROC

第7章 R语言预后临床预测模型实战

7.1 COX回归模型构建

7.1.1 数据读取

7.1.2 软件包准备

7.1.3 先单因素分析

7.1.4 后多因素分析

7.1.5 批量单因素分析

7.1.6 多因素分析

7.1.7 模型比较

7.2 预后模型区分度分析

7.2.1 Concordance index

7.2.2 Time-ROC

7.2.3 时间依赖AUC

7.3 预后模型校准度分析

7.3.1 基于rms包的校准曲线

7.3.2 基于pec包的校准曲线

7.4 预后模型决策曲线分析

7.4.1 基于stdca.R的决策曲线

7.4.2 基于dcurves包的决策曲线

7.4.3 基于ggDCA包的决策曲线

7.5 交叉验证

7.6 预后模型Nomo展示

7.6.1 普通生存概率列线图

7.6.2 中位生存时间列线图

7.6.3 网格线列线图

7.6.4 动态列线图

7.7 NRI和IDI

7.7.1 NRI(净重新分类指数)

7.7.2 IDI

7.8 LASSO-COX

7.8.1 数据准备

7.8.2 LASSO-COX

7.8.3 CV-LASSO

7.9 模型效果验证

7.9.1 风险分组后KM曲线

7.9.2 风险得分图

7.10 生存分析数值变量分类方法

7.10.1 Time-ROC

7.10.2 X-Tile

参考资料

预测模型实战:基于R、SPSS和Stata是2023年由清华大学出版社出版,作者武松 编著。

得书感谢您对《预测模型实战:基于R、SPSS和Stata》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
贝叶斯电力负荷预测模型研究 电子书
本书介绍了基于贝叶斯理论优化参数负荷预测模型,全书共七章,主要内容包括电力负荷的影响因素分析、概率论的基本知识、贝叶斯理论的基础知识、马尔可夫链蒙卡洛算法的基本概念和方法等。
文本数据挖掘——基于R语言 电子书
文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应
数据可视化——基于R语言 电子书
本书以R语言为实现工具,以数据可视化分析为导向,结合实际案例介绍数据可视化方法。全书共8章,第1章介绍数据可视化概述以及R语言数据处理的基本技能;第2章介绍R语言绘图基础,重点介绍R语言传统绘图包graphics中的绘图函数及基本使用方法;第3章介绍类别数据的可视化方法;第4章介绍数据分布特征的可视化方法;第5章介绍变量间关系的可视化方法;第6章介绍样本相似性的可视化方法;第7章介绍时间序列的可视
R语言高效能实战:更多数据和更快速度 电子书
本书将目标设定为“在一台笔记本电脑上能够运行”,从单机大型数据集处理策略、提升计算性能、其他工具和技巧3个方面介绍了使用R语言处理数据时的实用方法。主要内容包括数据集占用空间、善用data.table处理数据、数据分块处理、提升硬盘资源使用效率、并行编程技术、提升机器学习性能,以及其他资源管理和提高性能的实用策略。
区间数序列的数学模型预测技术 电子书
全书共12章,包括区间数序列预测研究概况、GM(1,1)与累积法、基于序列转换的GM(1,1)、基于序列转换的新陈代谢GM(0,N)、基于序列转换的ARMA模型、基于序列转换的支持向量机预测方法、基于整体发展系数的区问数GM(1,1)、BIGM(1,1)和TIGM(1,1)修正、基于整体发展系数的区间数多变量灰色模型、矩阵型GM(1,1)、矩阵型多变量灰色模型、向量自回归和多元线性回归联合模型等。