手把手解读：NOTEARS论文里的评估函数（FDR/SHD）到底在算什么？

张

张建站

2026/4/22 2:19:40

10分钟阅读

因果模型评估实战从NOTEARS源码拆解FDR/SHD计算逻辑在因果推断领域评估模型性能是验证算法有效性的关键环节。NOTEARS论文中提出的count_accuracy函数实现了多种评估指标的计算其中**FDR误发现率和SHD结构汉明距离**是最常用的两种。本文将深入源码逐行解析这些指标背后的数学含义和实现细节。1. 评估指标基础概念1.1 混淆矩阵与基本术语在因果图评估中我们需要明确几个核心概念真阳性TP预测边存在且方向正确反向边Reverse预测边存在但方向相反假阳性FP预测边存在但真实图中不存在假阴性FN真实边存在但未被预测到这些概念构成了评估的基础框架。以邻接矩阵表示的有向无环图DAG为例# 真实图邻接矩阵示例 B_true np.array([ [0, 1, 0], # X1 - X2 [0, 0, 1], # X2 - X3 [0, 0, 0] # X3无出边 ]) # 预测图邻接矩阵示例 B_est np.array([ [0, 1, 1], # 正确预测X1-X2错误预测X1-X3 [1, 0, 1], # 反向预测X2-X1正确预测X2-X3 [0, 0, 0] ])1.2 常见评估指标定义指标公式解释FDR(反向边假阳性)/预测正例数错误发现的比例TPR真阳性/真实正例数召回率/敏感度FPR(反向边假阳性)/真实负例数错误预警比例SHD多余边缺失边反向边数结构差异总量2. NOTEARS评估函数深度解析2.1 输入验证与预处理count_accuracy函数首先进行严格的输入验证def count_accuracy(B_true, B_est): # 验证B_est取值合法性 if (B_est -1).any(): # CPDAG情况 if not ((B_est 0) | (B_est 1) | (B_est -1)).all(): raise ValueError(B_est should take value in {0,1,-1}) if ((B_est -1) (B_est.T -1)).any(): raise ValueError(undirected edge should only appear once) else: # DAG情况 if not ((B_est 0) | (B_est 1)).all(): raise ValueError(B_est should take value in {0,1}) if not is_dag(B_est): raise ValueError(B_est should be a DAG)注意-1表示CPDAG中的无向边需要确保无向边不会在矩阵中重复出现2.2 关键索引提取函数通过NumPy操作提取各种边的索引位置d B_true.shape[0] pred_und np.flatnonzero(B_est -1) # 无向边位置 pred np.flatnonzero(B_est 1) # 预测有向边位置 cond np.flatnonzero(B_true) # 真实有向边位置 cond_reversed np.flatnonzero(B_true.T) # 真实反向边位置 cond_skeleton np.concatenate([cond, cond_reversed]) # 无向骨架这里使用了几个关键NumPy函数flatnonzero返回扁平化数组中非零元素的索引concatenate合并多个索引数组3. 核心指标计算逻辑3.1 真阳性与假阳性识别# 真阳性预测有向边且方向正确 true_pos np.intersect1d(pred, cond, assume_uniqueTrue) # 无向边视为真阳性宽松评估 true_pos_und np.intersect1d(pred_und, cond_skeleton, assume_uniqueTrue) true_pos np.concatenate([true_pos, true_pos_und]) # 假阳性预测存在但真实不存在 false_pos np.setdiff1d(pred, cond_skeleton, assume_uniqueTrue) false_pos_und np.setdiff1d(pred_und, cond_skeleton, assume_uniqueTrue) false_pos np.concatenate([false_pos, false_pos_und])关键函数解析intersect1d求两个数组的交集setdiff1d求第一个数组有而第二个数组没有的元素3.2 反向边检测extra np.setdiff1d(pred, cond, assume_uniqueTrue) reverse np.intersect1d(extra, cond_reversed, assume_uniqueTrue)这段代码精妙地实现了反向边检测首先找出预测有但真实没有的边(extra)然后检查这些边是否是真实图中反向存在的边3.3 指标比率计算pred_size len(pred) len(pred_und) # 预测正例总数 cond_neg_size 0.5 * d * (d - 1) - len(cond) # 真实负例总数 fdr float(len(reverse) len(false_pos)) / max(pred_size, 1) tpr float(len(true_pos)) / max(len(cond), 1) fpr float(len(reverse) len(false_pos)) / max(cond_neg_size, 1)提示分母使用max(...,1)避免除以零错误4. 结构汉明距离(SHD)实现4.1 SHD计算原理SHD衡量两个图结构差异的总和包括多余边预测有但真实没有缺失边真实有但预测没有反向边方向预测错误NOTEARS中的实现pred_lower np.flatnonzero(np.tril(B_est B_est.T)) cond_lower np.flatnonzero(np.tril(B_true B_true.T)) extra_lower np.setdiff1d(pred_lower, cond_lower, assume_uniqueTrue) missing_lower np.setdiff1d(cond_lower, pred_lower, assume_uniqueTrue) shd len(extra_lower) len(missing_lower) len(reverse)4.2 关键技巧解析np.tril取矩阵的下三角部分避免重复计算邻接矩阵相加将有向图转换为无向骨架通过集合操作计算多余和缺失边实际项目中SHD计算可以这样验证from cdt.metrics import SHD import numpy as np # 生成随机邻接矩阵 np.random.seed(42) tar np.random.randint(2, size(5,5)) pred np.random.randint(2, size(5,5)) # 计算SHD print(CDT库计算结果:, SHD(tar, pred)) print(NOTEARS计算结果:, count_accuracy(tar, pred)[shd])5. 实际应用中的注意事项5.1 评估指标的选择策略不同场景下应侧重不同指标因果发现优先关注FDR控制错误发现因果效应估计关注TPR确保重要关系不被遗漏算法比较使用SHD综合评估结构差异5.2 常见陷阱与解决方案样本量影响小样本时FDR可能被高估解决方案使用bootstrap计算置信区间稠密图问题高密度图的SHD绝对值会增大解决方案考虑标准化SHD除以可能边数CPDAG评估无向边的处理需要特殊规则NOTEARS采用宽松策略视为正确# 处理CPDAG评估的实用技巧 def adjust_for_cpdag(B_true, B_est): # 将无向边视为双向边 B_est_skeleton (B_est ! 0).astype(int) B_true_skeleton (B_true ! 0).astype(int) # 计算骨架准确率 skeleton_tpr np.sum(B_est_skeleton B_true_skeleton) / np.sum(B_true_skeleton) return skeleton_tpr5.3 性能优化建议对于大规模图节点数1000原始实现可能效率低下可以考虑使用稀疏矩阵存储邻接关系并行化集合运算近似计算策略from scipy.sparse import csr_matrix def sparse_count_accuracy(B_true, B_est): # 转换为稀疏矩阵 B_true_sparse csr_matrix(B_true) B_est_sparse csr_matrix(B_est) # 使用稀疏矩阵运算优化性能 # ...后续实现类似但使用稀疏矩阵操作在实际项目中我发现对大规模基因调控网络通常有上万个节点进行评估时原始实现可能需要数小时完成而经过稀疏矩阵优化后评估时间可以缩短到几分钟。特别是在计算SHD时只比较下三角矩阵的策略可以减少近一半的计算量。

你的ImageFolder加载慢？可能是这些细节没做好（附SSD/缓存优化思路）

ImageFolder加载性能优化实战：从硬件到代码的全面提速方案当你在处理包含数万张图像的数据集时，是否经历过这样的场景——模型训练已经准备就绪，GPU资源充足，但数据加载却成了整个流程中最耗时的环节？这不是个例&…...

2026/4/22 2:19:32 阅读更多 →

保姆级教程：Windows 10/11 下 Python 3.10.6 安装与环境变量配置（含所有选项详解）

Windows 10/11 下 Python 3.10.6 安装与环境变量配置全解析第一次在Windows系统上安装Python时，面对安装向导里密密麻麻的复选框和选项，很多人会感到迷茫——这些选项到底是什么意思？勾选或不勾选会有什么影响？为什么环境变量配置…...

2026/4/22 2:17:27 阅读更多 →

EncryptHub（Larva-208）攻击618家组织：鱼叉式钓鱼+信息窃取+勒索软件全链路解析

一个名为EncryptHub（又称 Larva-208）的威胁组织，持续针对全球企业发起精密的社会工程攻击，主要通过鱼叉式网络钓鱼（spear-phishing）和短信/语音钓鱼，窃取企业网络访问权限。 What is phishing?…...

2026/4/22 2:16:51 阅读更多 →

从T3到T5：全志工控处理器性能跃迁与工业应用场景深度解析

1. 全志T3与T5处理器核心架构解析全志T3（A40I）和T5（T507）作为两代工控处理器，在核心架构上有着显著差异。T3采用四核Cortex-A7架构，主频1.2GHz，搭配Mali400MP2 GPU，属于经典的"…...

2026/4/21 5:14:24 阅读更多 →

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全图解实战）一、前言二、列出 ES 所有索引：整体流程流程图三、Elasticsearch 列出所有索引：核心命令3.1 方法1：_cat/indices（最常用、运维…...

2026/4/21 5:14:28 阅读更多 →

SAP PI/PO HTTPS接口调用实战：从SSL证书导入到彻底告别iaik.security.ssl.SSLCertificateException

1. 当SAP PI/PO遇到HTTPS接口报错时发生了什么？ 最近在帮客户调试SAP PI系统调用外部HTTPS接口时，遇到了一个让人头疼的问题。系统在调用Swagger Petstore的API时，控制台突然抛出"iaik.security.ssl.SSLCertificateException: Peer cert…...

2026/4/21 5:14:31 阅读更多 →