从“智商与收入”到“审计质量”:用PSM讲一个生动的因果推断故事(附完整Stata代码)
审计质量背后的因果密码用PSM解码四大会计师事务所的真实影响力在金融市场的迷雾中投资者常常面临一个根本性难题那些聘请四大会计师事务所审计的上市公司其财务报告质量真的更可靠吗表面数据似乎支持这一结论——四大审计的客户通常表现出更低的财务错报率和更少的报表重述。但这是否意味着四大审计直接提升了审计质量或许只是优质企业更倾向于选择四大形成了一种优质匹配现象解开这个因果谜题正是倾向得分匹配(PSM)大显身手的舞台。1. 研究设计构建一个完美的平行宇宙1.1 核心研究问题拆解我们试图回答在保持企业基本面不变的情况下选择四大审计(BIG41)相较于非四大审计(BIG40)会如何影响两个关键审计质量指标ABSACC盈余管理绝对值衡量财务操纵程度RESTATE报表重述虚拟变量反映重大错报注意研究设计必须满足可忽略性假设——即匹配后两组间不存在系统性差异除审计机构选择外1.2 数据准备与变量定义使用中国A股上市公司2010-2022年数据关键变量包括变量类型变量名定义数据来源处理变量BIG4审计师是否为四大(1/0)CSMAR结果变量ABSACC修正Jones模型计算的盈余管理绝对值自行计算结果变量RESTATE当年是否发生报表重述(1/0)CSMAR协变量LNASSET总资产自然对数CSMAR协变量LEV资产负债率CSMAR协变量ROA资产收益率CSMAR协变量GROWTH营业收入增长率CSMAR协变量BM账面市值比CSMAR协变量AGE上市年限CSMAR固定效应indcode行业虚拟变量(证监会分类)CSMAR固定效应year年度虚拟变量CSMAR// 数据预处理示例 use audit_quality.dta, clear gen LNASSET ln(asset) gen LEV liability / asset gen ROA net_income / asset gen GROWTH (rev - L.rev) / L.rev gen BM equity / market_value gen AGE year - ipo_year2. PSM实战从理论到Stata实现2.1 倾向得分估计采用probit模型估计企业选择四大审计的概率global indepvar LNASSET LEV ROA GROWTH BM AGE global fixvar i.indcode i.year probit BIG4 $indepvar $fixvar, vce(cluster stkcd) predict pscore, p关键诊断指标模型拟合Pseudo R²不宜过高(0.3可能预示协变量预测力过强)共同支撑域pscore分布需有足够重叠区域2.2 匹配执行与质量检验采用1:2有放回最近邻匹配设置卡尺为0.03psmatch2 BIG4, pscore(pscore) outcome(ABSACC RESTATE) /// common logit neighbor(2) caliper(0.03) pstest $indepvar, both graph psgraph匹配质量检验重点关注标准化偏差匹配后各变量偏差应5%t检验匹配后组间差异应不显著共同支撑域处理组与控制组的pscore分布重叠情况3. 结果解读因果效应的经济学含义3.1 匹配样本回归分析// 全样本回归 reg ABSACC BIG4 $indepvar $fixvar, cluster(stkcd) est store ABSACC_F // 匹配样本回归 reg ABSACC BIG4 $indepvar $fixvar [fweight_weight], cluster(stkcd) est store ABSACC_M // 结果对比 esttab ABSACC_F ABSACC_M, /// mtitle(Full Sample Matched Sample) /// b(%6.3f) se(%6.3f) nogap /// star(* 0.1 ** 0.05 *** 0.01)典型结果可能显示变量全样本系数匹配样本系数BIG4-0.012***-0.007**LNASSET-0.003**-0.002LEV0.018***0.015**ROA-0.025***-0.022***3.2 经济显著性评估假设匹配样本中BIG4系数为-0.007意味着四大审计使盈余管理程度降低0.7个百分点以样本均值ABSACC0.05计算相当于降低14%对于资产100亿的企业约等于减少700万盈余操纵4. 稳健性检验与陷阱规避4.1 多维度稳健性检验匹配方法对比核匹配(kernel)局部线性匹配(local linear)马氏距离匹配(mahalanobis)协变量调整加入董事会特征变量加入地区经济发展水平样本筛选剔除金融行业仅保留A股主板公司4.2 常见陷阱警示过度匹配陷阱当协变量中包含结果变量决定因素时可能低估真实效应虚假平衡陷阱匹配后平衡性检验通过但遗漏关键变量外推风险共同支撑域外的处理组样本效应可能不同// 不同匹配方法对比示例 psmatch2 BIG4, pscore(pscore) kernel bw(0.06) common reg ABSACC BIG4 $indepvar $fixvar [fweight_weight], cluster(stkcd) psmatch2 BIG4, pscore(pscore) radius(0.01) common reg ABSACC BIG4 $indepvar $fixvar [fweight_weight], cluster(stkcd)5. 研究启示与应用边界5.1 实务启示对于拟上市企业选择四大审计可能传递质量信号但需考虑成本收益对于监管机构可识别审计质量系统性差异优化监管资源配置对于投资者应穿透审计机构光环结合企业基本面判断5.2 方法论边界PSM在本研究中的适用性基于可观测选择机制企业选择四大审计主要取决于可观测特征无后期干扰审计机构选择后不存在其他干预因素稳定单元处理值某企业选择四大不影响其他企业的审计结果重要提醒PSM不能解决由审计师专业能力、职业道德等不可观测因素引起的内生性问题