统计学习方法1.4~1.8

张

张建站

2026/5/12 7:18:11

10分钟阅读

1.5 正则化与交叉验证范数是一个数学概念用来度量一个向量或矩阵的“大小”或“长度”。你可以把它直观地理解为从原点到该点向量的距离。范数将向量映射成一个非负的数值这个数值越大表示向量“越长”或“越大”。所以正则化项一般就是模型参数向量所有参数作为分量构成的一个向量的一个范数。它可以指示参数的“大小”进而体现模型的复杂度。奥卡姆剃刀原意是“如无必要勿增实体”——简单的解释往往比复杂的更好。应用到模型选择上就是在能正确拟合数据的前提下选那个结构更简单的模型。比如一条直线能大致拟合数据就不要用弯弯曲曲的高次曲线否则可能只是“死记硬背”了训练数据过拟合。从贝叶斯角度看模型参数不是一个固定值而是一个随机变量有自己的先验分布训练前我们对参数的已有信念。我们可以假设简单的参数值比如接近0或很多为0出现概率大复杂的参数非常大或很多非零出现概率小。这正好对应复杂模型 ↔ 较小的先验概率。贝叶斯定理告诉我们后验概率 ∝ 似然数据拟合度× 先验概率。最大化后验概率 ≈ 同时最大化拟合度最大化先验概率。参考数学基础复习那一篇取负对数后最大化后验就变成了最小化损失函数先验项的负对数。这个先验项的负对数恰好就是正则化项。1.6 泛化能力定理解读1.7 生成模型和判别模型1.8 监督学习应用分类主要考虑二分类将所求的类主要关注的类称为“正类”其他所有类称为“负类”True Positive False PositiveFalse Negative True Negative精确率P在预测为正类的数据之中正确预测的数据召回率R在实际的正类数据之中有哪些是预测正确的希望精确率和召回率都是越高越好调和值F1P和R的调和平均值标注回归

东戴河海鲜特色菜哪家靠谱

作为一个在东戴河扎根多年的本地人，也是个开了几年海鲜饭店的老板，这个问题我可能有点发言权。你问“东戴河海鲜特色菜哪家靠谱”，其实“靠谱”这两个字，里面藏着不少门道。今天咱们不整那些虚词，就聊聊你真正关心的&a…...

2026/5/12 7:09:32 阅读更多 →

AI模型选型实战：一站式性能与成本对比工具使用指南

1. 项目概述：一站式AI模型性能与成本对比工具在AI模型层出不穷的今天，无论是开发者、研究者还是产品经理，都面临一个共同的难题：如何在浩如烟海的模型库中，快速、准确地找到一个既满足性能要求，又符合成本预…...

2026/5/12 7:08:36 阅读更多 →

DAB转换器软启动技术：可变死区时间控制解析

1. DAB转换器软启动技术背景解析在电力电子系统中，双有源桥(Dual Active Bridge, DAB)转换器凭借其双向功率传输能力、高频电气隔离特性以及出色的功率密度，已成为电动汽车充电、数据中心供电等关键应用的首选拓扑。然而在实际工程应用中，启动…...

2026/5/12 7:08:35 阅读更多 →

CANN/pyasc Dump检查点功能

asc.language.basic.dump_acc_chk_point 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口，支持在昇腾AI处理器上加速计算，接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc asc.language.basi…...

2026/5/11 13:04:35 阅读更多 →