诊断图
分类:
绘制诊断图是最为常见的一种模型评价方法,适用于基础模型和最终模型的比较与 评价。总体而言,模型诊断图可根据不同变量分为以下几种:
1. 基于预测的模型诊断图
2. 基于残差的模型诊断图
3. 基于贝叶斯估算的模型诊断图
不同的诊断图从不同的视角评估模型的准确性与适用性,反映了模型化过程中的模 型设定错误、违背随机变量分布假设以及离群值等问题。这些诊断图可并行比较,描述纳 入协变量前后模型的改善情况,以指导模型的开发与优化过程。
基于预测的模型诊断图
呈现实际观测值与群体、个体预测值的一致性,反映模型对于实测值的拟合程度。
1、因变量-群体预测值(DV-PRED)
绘图:参考线,趋势线,x轴和y轴尺度一致。参考线一般为y=x的对角线;趋势线通常为LOESS回归线。一般坐标反映数值较大处偏差,对数坐标可反映数值较小处偏差。
DV-PRED散点图可直观地评估群体预测值能否很好地描述数据的集中趋势和离散程度。如果群体预测值存在较大系统偏差,不能很好地描述数据特征,则提示需要进一步优化、改进结构模型或统计学模型。
群体预测值在对角线附近的分布主要与模型结构有关,还与很多因素相关,如个体间 变异和残差变异的大小、数据的删减等。此外,趋势线未考虑误差的异方差性,未考虑数 据是否来自不同个体。因此,使用该诊断图须谨慎.
2、因变量-个体预测值(DV-IPRED)
绘图:
x轴为个体预测值,y轴为因变量或者观测值。描述个体数据集中趋势和离散程度。
参考线,趋势线,x轴和y轴尺度一致。参考线一般为y=x的对角线;趋势线通常为LOESS回归线。一般坐标反映数值较大处偏差,对数坐标可反映数值较小处偏差。
一般残差变异的收缩值小于20
3、个体药时曲线
展示每一个个体的实测值、群体预测值、个体预测值,可以反映每一个个体的拟合程度。
基于残差的模型诊断图
基于残差的模型诊断图可以比基于预测的模型诊断图更好地评估预测偏差。
1、加权残差-时间(WRES、CWRES、CWRESI)
绘图:x轴为时间,time或者tad ,y轴为条件加权残差(CWRES)。参考线一般为y=0。
可用于评估结构模型的准确性。应在y=0两侧(±2)对称分布,且与时间无关,绝对值大于6的点可视为异常值。
2、加权残差-预测值(WRES-PRED)
与条件权重残差对时间诊断图类似,CWRES-PRED优于WRES-PRED。CWRES在y=0两侧(±2)对称分布,如果CWRES随PRED有趋势性变化,说明拟合欠佳
3、加权残差直方图、Q-Q图
CWRES或IWRES的直方图可以描述残差是否服从均值为0的正态分布。Q-Q图也有相似的功能。直方图中虚线为核密度曲线,QQ图中实线为y=x参考线。若条 件加权残差服从正态分布,则空心圆点应近似分布在参考线附近。由图可见,空心圆点在 尾端偏离参考线,提示条件加权残差不完全服从正态分布。
基于贝叶斯估算的模型诊断图
对某个参数基于贝叶斯的诊断依赖于其个体间变异。个体参数可以结合参数先验分布、残差变异以及个体数据,通过贝叶斯方法估算获得。
1、个体间变异和残差变异的收缩值
个体间变异的收缩描述了贝叶斯估算的方差趋近于0的现象;残差变异的收缩描述了数据量减少时,个体加权残差的分布趋近于0的现象。该现象可以影响诊断图评价结 果的可靠性,还可影响某些量效关系的分析,如协变量与暴露效应之间的关系。因此,当残差变异的收缩>20
2、参数和个体间变异的散点图矩阵
考察各参数或各各参数个体间变异的相关性。在协变量模型的建立过程中,应充分考虑这些参数之间的相关性,对角线面板显示变量名及其直方图,右上面板呈现变量两两 之间的相关系数和统计p值,左下面板为两变量的散点图和LOESS回归趋势线。由图可 见,分布容积和清除率、分布容积和吸收速率常数之间均存在较强相关,而清除率和吸 收速率常数之间相关性较弱,在模型化过程中应充分考虑诊断图所提供的这些信息。
3、个体间变异的直方图和Q-Q图
考察参数的个体间变异是否服从均值为0的正态分布。是检验参数正态性的一种有效手段,如图所示,清除率个体间变异的正态性较差,提示模型尚 需进一步优化。
4、个体间变异对协变量的相关性图
初步探索参数的个体间变异与协变量之间的相关性。一般显著的协变量在加入参数表达式之前(基础模型),与参数个体间变异的相关性较强;在加入参数表达式之后(协变量模型或最终模型),与参数个体间变异的相关性较弱
由图可见,在基础模型中,箱线图(左上)提示清除率可能与性别有关,而散点图(左下)提示清除率可能与肾小球滤过率有关。 随后尝试在模型中加入了性别和肾小球滤过率作为影响清除率的协变量,个体间变异变小,箱线图(右上)和散点图(右下)提示清除率的计算公式中加入了协变量之后,清除率个体间变异与肾小球滤过率、性别的相关性不显著,即肾小球滤过率和性别是影响清除率的重要因素。
文章评论