06_AI审计人机分工:机器负责机械性人负责判断性
06 AI审计人机分工机器负责机械性人负责判断性摘要去年一个客户问我你们的AI审计助手能替代审计师吗我反问他如果AI判断错了谁去坐牢会议室安静了五秒钟。这个问题之后我们花了三个月重新梳理了人机分工的边界最终形成了一套法律责任决定边界的分工原则。这篇文章不讲技术细节只讲一个判断标准机器和人的分界线不是能力决定的是责任决定的。文章标签人机分工AI审计审计自动化审计师审计平台职业怀疑审计责任审计判断关键字人机分工, AI审计, 审计自动化, 审计师, 审计平台, 职业怀疑, 审计责任, 审计判断, 机器审计, 审计风险一、一个让人沉默的问题去年在一次产品演示会上客户方的技术总监问我“你们这个AI审计系统能不能全自动完成一个小型审计项目从数据采集到出具报告不需要人工干预”我当时的回答很直接“技术上可以做演示。但如果审计出错了谁承担法律责任”会议室安静了五秒钟。然后客户的财务总监接话“那如果AI出了错是AI公司赔还是事务所赔”我说“根据现行《注册会计师法》第21条审计报告由注册会计师签名并盖章注册会计师对审计报告负责。所以不管AI做了什么最终承担责任的只能是人。”客户的合伙人最后说了一句话我记到现在“那我们花几百万上这个系统意义在哪里”我说“意义在于让审计师从每天8小时的搬运工变成每天6小时的法官。那2小时省下来的时间是系统的价值。”这次对话之后我们团队花了三个月重新梳理了产品的人机分工设计。这篇文章就是这次梳理的成果。二、人机分工的第一性原理要搞清楚机器和人应该怎么分工不能只问AI能做什么而要问AI做错了谁负责。这个问题的答案决定了分工的边界。-------------------------------------------------- | 人机分工的决策逻辑 | -------------------------------------------------- | | | 这件事做错了谁来承担责任 | | │ | | ├── 法律要求必须是注册会计师 → 人做 │ | │ 审计意见、签字背书 │ | │ │ | ├── 需要职业怀疑和主观判断 → 人做 │ | │ 舞弊评估、会计估计、持续经营 │ | │ │ | ├── 有明确规则机器不会出错 → 机器做 │ | │ 数据采集、核对、计算 │ | │ │ | └── 有规则但需人工复核异常 → 机器做人复核 │ | 异常标记、样本选择、分析性程序 │ | | --------------------------------------------------原则一法律责任不可转移《中华人民共和国注册会计师法》第21条“注册会计师执行审计业务必须按照执业准则、规则确定的工作程序出具报告。”《证券法》第160条“会计师事务所出具的审计报告应当由注册会计师签名并盖章。”**审计报告上签字的是注册会计师不是AI。**如果审计失败行政处罚警告、罚款、暂停执业、吊销证书→ 由注册会计师承担民事赔偿 → 由事务所和签字注册会计师承担刑事责任出具证明文件重大失实罪→ 由注册会计师承担在现行法律框架改变之前涉及最终审计结论、审计意见、签字背书的工作都必须由人来做。AI可以辅助但不能替代。这不是技术问题这是法律问题。原则二职业怀疑不能外包审计准则要求注册会计师在整个审计过程中保持职业怀疑。职业怀疑是什么是对管理层声明的质疑是对太完美的解释的警惕是对虽然数字对上了但感觉不对劲的直觉反应。2018年我在一个项目中遇到过这样的情况客户的财务总监解释一笔异常交易时说“这是年底为了冲业绩做的关联交易已经签了补充协议明年一季度会反向操作。”数字上这笔交易有合同、有发票、有银行流水所有单据齐全。如果让AI来判断AI会分析这些单据的一致性发现单据之间没有矛盾给出未发现异常的结论。但审计师听到了冲业绩三个字立刻警觉管理层有操纵利润的动机。这笔交易虽然在形式上合规但在实质上可能是虚假交易。最终审计师追加了访谈、检查了期后反向操作的真实性发现确实有问题。机器能识别数字异常但机器识别不了动机异常。原则三规则明确的工作交给机器什么样的工作适合机器做有明确输入和输出规则不会因人而异重复性高、机械性强出错后可以明确追溯到原因这些工作机器做比人做更好不会疲劳、不会手滑、不会按错计算器、不会因为连续加班三天而出错。三、详细的人机分工清单基于上面的三个原则我整理了一份详细的审计工作人机分工清单。机器独立负责的部分工作类别具体内容为什么机器做技术实现要点数据采集从ERP导出余额表、从银行获取对账单、OCR识别发票规则明确来源固定不需要判断API对接、数据库直联、OCR引擎数据核对总账明细账、报表附注、期初上期期末数学逻辑机器不会算错规则引擎100条勾稽规则格式化调整Excel格式、统一科目编码、生成标准报表机械劳动重复性高配置化模板引擎计算折旧计算、坏账准备计算、样本量计算公式固定机器精度更高内置计算公式库勾稽检查科目间关系验证、借贷平衡检查规则明确可程序化实时/定时自动运行异常标记超出阈值的波动、不符合逻辑的数值组合基于规则可自动化统计模型规则引擎档案管理文件命名、分类、存储、检索规则明确不涉及判断自动归档策略底稿排版按模板生成格式规范的底稿模板化可配置配置化视图生成人机协作的部分工作类别机器做什么人做什么协作方式分析性程序计算比率、趋势、对比数据标记异常分析异常原因判断是否需要关注机器输出分析结果异常标记人做判断样本选择按统计方法计算样本量随机/分层选样确定抽样策略评估样本代表性机器建议样本量人确认或调整函证管理生成函证、跟踪回函、匹配回函与账面判断回函异常决定替代程序机器自动化管理流程人处理异常情况调整分录根据规则建议调整分录判断调整是否恰当是否完整机器建议人审核确认关联方识别从数据中识别潜在关联方确认关联关系评估交易合理性机器标记潜在关联人判断并确认风险识别基于规则和数据模型自动识别风险评估系统识别的风险是否 relevant机器推送风险清单人确认优先级人独立负责的部分工作类别具体内容为什么必须是人职业怀疑对管理层声明的质疑对异常的直觉反应需要经验和直觉AI不具备舞弊评估识别舞弊动机、机会、合理化借口需要理解人性和组织文化会计估计坏账比例、折旧年限、减值测试参数需要主观判断无标准答案持续经营判断评估被审计单位未来12个月的生存能力需要综合判断承担责任审计意见无保留/保留/否定/无法表示意见法律责任必须由人承担签字背书在审计报告上签字盖章法律要求-------------------------------------------------- | 审计工作人机分工图 | -------------------------------------------------- | | | ┌──────────────────────────────────────────┐ | | │ 机器负责区 │ | | │ 数据采集 数据核对 格式化 计算 │ | | │ 勾稽检查 异常标记 档案管理 底稿排版 │ | | │ 占审计时间的60-70% │ | | └──────────────────────────────────────────┘ | | ↓ 机器输出人确认 | | ┌──────────────────────────────────────────┐ | | │ 人机协作区 │ | | │ 分析性程序 样本选择 函证管理 │ | | │ 调整分录 关联方识别 风险识别 │ │ | │ 占审计时间的15-20% │ │ | └──────────────────────────────────────────┘ │ | ↓ 人做判断机器记录 │ | ┌──────────────────────────────────────────┐ │ | │ 人负责区 │ │ | │ 职业怀疑 舞弊评估 会计估计 │ │ | │ 持续经营判断 审计意见 签字背书 │ │ | │ 占审计时间的10-15% │ │ | └──────────────────────────────────────────┘ │ | │ | 目标让审计师从60%机械劳动 → 10%机械劳动 │ | 让审计师从10%判断工作 → 50%判断工作 │ | │ --------------------------------------------------四、为什么这个分工对技术团队很重要很多技术团队在设计AI审计产品时容易犯两个方向性的错误错误一让AI做判断越界“我们的AI可以自动判断坏账准备是否充分。”听起来很高级。但问题是这个判断依据是什么训练数据是什么如果AI判断错了损失怎么算审计师能不能质疑AI的判断AI的判断过程能不能被审计轨迹记录我参与过一个项目系统用机器学习模型预测客户的持续经营风险。模型准确率85%看起来不错。但问题是那15%的误判怎么办模型判断为低风险但实际破产了怎么办模型是基于什么特征做判断的可解释吗审计师在底稿里怎么写“根据AI判断持续经营风险为低”最终这个模型被降级为风险提示工具不直接参与审计结论。AI的预测仅供参考最终判断必须由人来做。判断是不能外包的。因为判断的背后是责任。错误二让人做机器该做的事浪费另一个极端是系统设计得不够自动化审计师需要做大量机械性工作。我见过一个系统审计师要手动把银行对账单的每一行数据录入系统。一个项目有20个银行账户每个账户一年几千笔交易审计师花了整整一周在录入数据。这是人力资源的极大浪费。这些工作完全可以通过银行直联API或者OCR自动完成。技术团队的职责是让机器做机器擅长的事让人做人擅长的事。而不是反过来。五、一个实际的人机交互流程设计2023年我们为一个中型事务所设计了AI审计助手的人机交互流程。以应收账款函证这个典型场景为例展示完整的人机分工。传统流程没有AI辅助-------------------------------------------------- | 传统应收账款函证流程 | -------------------------------------------------- | | | 1. 审计师从客户获取应收账款明细账 │ | 耗时半天等客户提供 │ | 2. 手工筛选发函对象通常选金额大的 │ | 耗时2小时人工判断 │ | 3. 手工制作函证Word模板邮件合并 │ | 耗时1天格式调整容易出错 │ | 4. 打印、盖章、邮寄 │ | 耗时半天等快递 │ | 5. 跟踪回函Excel表格记录人工更新 │ | 耗时每天10分钟持续2周 │ | 6. 收到回函后手工核对回函金额与账面金额 │ | 耗时1天逐笔核对 │ | 7. 对差异进行调查 │ | 耗时半天 │ | 8. 编制函证控制表 │ | 耗时半天手工汇总 │ | 9. 对未回函的客户执行替代程序 │ | 耗时1天 │ | │ | 一个中型项目这个流程需要2-3人天 │ | 其中机械性工作约80% │ | 其中判断性工作约20% │ | │ --------------------------------------------------AI辅助流程-------------------------------------------------- | AI辅助应收账款函证流程 | -------------------------------------------------- | │ | 【机器自动完成】 │ | 1. 系统从客户ERP自动获取应收账款明细账 │ | 耗时5分钟自动同步 │ | 2. 系统按审计准则要求自动计算函证样本量 │ | 耗时1秒统计公式计算 │ | 3. 系统自动生成函证PDF格式含电子签章预留位 │ | 耗时5分钟批量生成 │ | 4. 系统通过电子函证平台自动发送函证 │ | 耗时10分钟批量发送 │ | 5. 系统自动跟踪回函状态每日更新 │ | 耗时0全自动 │ | 6. 系统收到电子回函后自动核对金额与账面 │ | 耗时0全自动 │ | │ | 【人机协作】 │ | 7. 系统标记差异回函金额与账面差异50万 │ | → 审计师判断差异原因决定后续程序 │ | 耗时30分钟真正需要判断的地方 │ | │ | 【机器自动完成】 │ | 8. 系统自动生成函证控制表 │ | 耗时1分钟自动汇总 │ | 9. 系统对未回函客户自动生成替代程序建议 │ | 耗时1分钟基于规则 │ | │ | 【人做判断】 │ | 10. 审计师确认替代程序是否充分 │ | 耗时15分钟 │ | │ | 同样规模的项目 │ | 机器耗时约20分钟全自动 │ | 人工耗时约45分钟判断确认 │ | 总耗时约1小时 │ | 相比传统流程节省约90% │ | │ --------------------------------------------------分工设计的核心思想在这个流程里机器做了数据采集、计算、生成、发送、跟踪、核对、报表生成占80%时间人做了样本策略确认系统建议人确认、差异原因判断、替代程序充分性确认占20%时间审计师从2-3人天的机械劳动中解放出来只需要花不到1小时在真正需要判断的地方。六、人机交互界面的设计原则分工确定了接下来是怎么让界面体现这个分工。设计原则一机器输出要有置信度当机器完成一项任务时应该告诉用户我对这个结果有多确定。-------------------------------------------------- | 系统核对结果 | -------------------------------------------------- | | | 总账余额1,250,000.00 | | 明细账合计1,250,000.00 | | 差异0.00 | | | | ✅ 核对通过置信度100% | | 核对规则SUM(明细账) 总账余额 | | 明细账记录数1,250条 | | 核对时间2024-01-15 09:23:15 | | 核对耗时0.3秒 | | | | 【审计师确认】 | | □ 核对结果无误 | | | --------------------------------------------------设计原则二异常要醒目但不能替人判断系统发现异常时应该清晰呈现但不预设立场。-------------------------------------------------- | 异常标记 | -------------------------------------------------- | | | ⚠ 发现异常12月毛利率 45%全年平均 28% | | | | 相关证据 | | ├─ 12月销售收入5,200万 | | ├─ 12月销售成本2,860万 | | ├─ 11月毛利率27% | | └─ 去年同期12月毛利率29% | | | | 行业对比 | | ├─ 同行业平均毛利率25-30% │ | └─ 同行业12月毛利率26-31% │ | | | 【请审计师判断】 | | □ 异常可解释原因____________ │ | □ 异常需进一步调查 │ | └─ 建议追加程序________________________ │ | | | 注意系统仅基于统计数据标记异常不构成审计结论 │ | | --------------------------------------------------注意最后一句话系统仅基于统计数据标记异常不构成审计结论。这不是免责声明这是准确的人机分工描述。设计原则三人的判断要有完整记录所有由人做出的判断系统都应该完整记录-- 判断记录表审计轨迹CREATETABLEaudit_judgment(id UUIDPRIMARYKEY,project_id UUIDNOTNULL,-- 判断内容judgment_typeVARCHAR(50),-- RISK_EVALUATION / EXCEPTION_EVALUATION / PROCEDURE_DESIGNsubjectVARCHAR(200),-- 判断对象conclusionTEXT,-- 结论rationaleTEXT,-- 依据-- 关联证据evidence_ids UUID[],-- 支撑判断的证据列表-- 责任人judged_by UUIDNOTNULL,-- 判断人judged_atTIMESTAMPNOTNULLDEFAULTNOW(),-- 复核reviewed_by UUID,reviewed_atTIMESTAMP,review_commentTEXT,-- 修改记录is_revisedBOOLEANDEFAULTFALSE,previous_judgment_id UUID,revision_reasonTEXT,-- 审计轨迹ip_address INET,user_agentTEXT);这些记录本身就是审计证据的一部分。监管来检查的时候可以完整还原这个判断是怎么做出的。七、分工的边界不是固定不变的人机分工的边界不是一成不变的。它取决于三个因素因素一技术的发展十年前OCR识别发票还是一项前沿技术准确率不到70%。现在主流OCR的准确率已经超过95%。这意味着十年前需要人工核对的发票识别现在可以让机器独立完成。随着技术的发展机器负责的边界会扩大人机协作的边界会上移。因素二法律的演变如果有一天法律允许AI在审计报告上签字或者法律明确界定了AI审计错误的责任分担机制那分工的边界会完全不同。但在那之前法律边界是刚性的。因素三事务所的风险偏好不同事务所对风险的容忍度不同。有的事务所可能要求所有AI输出都必须人工复核有的可能允许AI独立完成某些低风险任务。系统设计上应该支持这种灵活性机器做什么、人做什么、哪些地方需要人确认都应该是可配置的。八、写在最后的话人机分工这个话题说到底是关于什么应该是人的什么可以是机器的。我的观点是判断是人的执行是机器的。责任是人的效率是机器的。怀疑是人的计算是机器的。AI不是来取代审计师的AI是来取代审计师工作中最无聊、最机械、最不需要动脑筋的部分。一个好的AI审计系统应该让审计师每天的工作变成这样早上打开系统看到今天需要关注的3个风险花10分钟看系统整理好的证据花2小时做分析和判断下午花1小时和客户沟通、访谈傍晚花30分钟确认系统生成的底稿准时下班而不是早上打开Excel开始复制粘贴中午还在核对数字下午发现格式不对重新调整晚上加班写审计说明凌晨还在打印签字技术团队的任务不是让AI像审计师是让审计师更像审计师。让人回归判断让机器回归执行。这就是人机分工的本质。文章声明本文仅供学习参考请勿用于商业用途。