Roc曲线怎么做:SPSSAU软件操作步骤与结果指标解读
一、Roc曲线所属模块Roc曲线在SPSSAU中属于【可视化】模块。二、方法概述Roc曲线主要用于评估某个指标或多个指标对二分类结果的区分能力常见于医学检验、风险识别、效果判别等场景。对于想判断某个变量能否较好地区分阳性与阴性的用户来说这是一种非常直观的方法。三、变量设置规则Roc曲线需要设置2类变量分别是状态变量和检验变量。其中状态变量只可放入1项且为必填检验变量至少放入1项、最多可放入200项也为必填。1. 状态变量设置状态变量用于表示实际分类结果也就是样本最终属于哪一类。该位置必须放入1个变量不能留空。实际分析时通常需要先明确哪一类被视为阳性哪一类被视为阴性后续敏感度、特异度等结果都围绕这个分类展开。2. 检验变量设置检验变量用于放入待评估的指标。这里至少需要放入1项最多可同时放入200项适合单个指标判断也适合多个指标横向比较。若一次放入多个检验变量SPSSAU会分别给出各指标的ROC结果便于比较谁的区分效果更好。四、参数设置及解释说明1. Delong对比这是一个勾选项。勾选后系统会对多条ROC曲线进行Delong对比用来判断不同检验变量之间的AUC差异是否明显。如果数据条件不满足可能不会输出该部分结果。因此当你的重点是比较多个指标谁更优时可以勾选如果只是看单个指标的判别效果则不一定需要开启。2. 联合诊断这是一个勾选项。勾选后系统会进一步输出联合诊断结果也就是把多个检验变量组合起来看整体判别能力。适合用于多个指标联合筛查、联合识别的场景。开启后系统会自动生成新的标题来区分联合诊断结果查看时更直观。3. 分割点该参数默认取值为1默认规则是等于1视为阳性其余视为阴性。如果你的状态变量不是按1来表示阳性而是用了其他数字编码就需要在这里按实际编码修改。另一个需要注意的点是当结果出现AUC低于0.5时SPSSAU会自动进行方向调整使结果回到正常识别方向减少因编码方向相反带来的误判。五、分析结果表格及其解读Roc曲线分析后SPSSAU会输出分析样本处理、ROC结果AUC汇总、ROC最佳界值结果、AUC比较检验等表格若勾选Delong对比还会额外输出成对对比结果表。1. 表1分析样本处理该表格的作用是展示阳性、阴性样本的数量及占比情况包含频数、百分比等指标便于先判断样本分布是否失衡。●频数表示阳性或阴性样本各自的人数用于确认两类样本是否都有足够数量参与分析。一般来说两类样本都应有实际数量若某一类过少结果稳定性会受到影响。●百分比表示各类样本在总样本中的占比用于观察样本结构是否偏斜。占比过于悬殊时Roc曲线结果虽然仍可参考但解释时要更谨慎。2. 表2ROC结果AUC汇总该表格的作用是集中展示各检验变量的总体判别能力包含AUC、标准误、p值、95% CI等核心指标是判断变量识别效果的关键表格。●AUC表示检验变量区分阳性与阴性的整体能力数值越大说明区分效果越好。通常AUC高于0.9说明判别能力很强0.7到0.9说明具有较好判别力0.5到0.7说明判别能力一般接近0.5则说明区分效果较弱。●标准误表示AUC结果的稳定程度用于辅助判断估计是否可靠。一般越小越好说明AUC波动更小、结果更稳定。●p值用于判断AUC是否显著优于随机判断。通常p值小于0.05说明该检验变量具有统计意义上的判别能力大于等于0.05时说明判别效果证据不足。●95% CI表示AUC的大致可信范围用于观察结果的稳定性与不确定性。区间越窄通常越稳定若整体明显高于0.5说明该变量的区分能力更有支撑。3. 表3ROC最佳界值结果该表格的作用是帮助用户找到较合适的判别切分位置包含AUC、最佳界值、敏感度、特异度、Cut-off等指标适合用于确定实际应用中的判断标准。●最佳界值表示当前数据下较优的区分位置用于帮助确定实际判别阈值。该值越适合业务场景后续应用越方便但并不存在放之四海皆准的固定“好值”需要结合实际目标来选。●敏感度表示识别出阳性的能力用于判断真正阳性能否被尽量找出来。数值越高越好若场景更看重少漏判比如疾病筛查就应优先关注这一指标。●特异度表示识别出阴性的能力用于判断真正阴性能否被正确排除。数值越高越好若场景更看重少误判就应重点关注这一指标。●Cut-off表示最终用于区分阳性和阴性的切分值是落地应用时最直接的参考指标。实际使用中通常结合敏感度与特异度一起看而不是单独判断。4. 表4ROC曲线之AUC比较检验该表格的作用是用于手动比较两项AUC结果的差异包含AUC、SE、AUC差值、Z、p值等指标适合在需要对两个指标进行直接比较时使用。●AUC差值表示两个检验变量在整体判别能力上的差距。绝对差值越大通常说明两者差异越明显。●Z值用于衡量两者差异的显著程度通常与p值结合解读。●p值用于判断两个AUC差异是否显著。通常p值小于0.05说明两项指标的判别能力存在明显差异大于等于0.05则说明差异不明显。5. 表5ROC曲线成对对比(Delong test)该表格在勾选Delong对比后输出作用是对多个检验变量进行两两比较包含AUC之差值、标准误差、95% CI、z值、p值等指标适合在多个候选指标中筛选表现更优者。●AUC之差值表示两条ROC曲线在AUC上的差异大小用于判断谁的整体区分能力更强。差值越大说明两者表现差距越明显。●标准误差用于反映差值估计的稳定程度。一般越小越稳定。●95% CI用于判断差异范围是否稳定。若区间整体远离零通常说明差异更有支撑。●z值与p值用于判断成对差异是否显著。通常p值小于0.05说明两条ROC曲线对应指标之间存在显著差异。六、分析结果图表及其解读Roc曲线分析后SPSSAU会输出样本分布图和ROC曲线图若勾选联合诊断还会额外输出联合诊断图。1. 样本分布图该部分会围绕阳性和阴性样本占比生成可视化图形支持以饼状图、圆环图、柱形图、条形图等形式查看。它的主要用途是帮助用户快速确认样本结构是否平衡。若图中两类比例差异过大说明样本分布偏斜后续解释ROC结果时应结合这一点综合判断。2. ROC曲线图这是Roc曲线分析中最核心的图表用于直观看检验变量的判别能力。一般来说曲线越靠近左上方说明识别效果越好如果曲线整体接近对角参考线则说明判别能力较弱。对于多指标同时分析的情况还可以通过多条曲线位置高低来比较谁的识别效果更优。3. 联合诊断图该图表在勾选联合诊断后输出用于查看多个检验变量组合后的判别表现。如果联合诊断曲线较单个指标曲线更靠近左上方通常说明联合使用后的识别能力更强若提升不明显则说明组合带来的增益有限。以上就是SPSSAURoc曲线方法的相关内容更深入教程可查看SPSSAU帮助手册、教学视频、疑难解惑等资料。