模型剪枝专栏目录

张

张建站

2026/7/6 5:45:57

10分钟阅读

01 模型剪枝是什么为什么深度模型需要剪枝博文链接02 Optimal Brain Damage 详解二阶信息剪枝的起点。博文链接03 03 Optimal Brain Surgeon 详解Hessian 剪枝为什么有效博文链接04 LeCun 时代的剪枝思想从冗余参数到敏感度。博文链接编号文章标题代表论文/方法11Optimal Brain Damage 详解二阶信息剪枝的起点OBD12Optimal Brain Surgeon 详解Hessian 剪枝为什么有效OBS13LeCun 时代的剪枝思想从冗余参数到敏感度早期理论14Han 剪枝方法详解Learning both Weights and Connections权重剪枝15Deep Compression 详解剪枝、量化和 Huffman 编码如何协同Han et al.16权重幅值剪枝为什么有效Magnitude Pruning 原理分析L1/L2 magnitude17剪枝后的微调为什么重要恢复精度的基本机制retraining18稀疏网络能否从头训练剪枝与训练初始化的关系sparse training19Lottery Ticket Hypothesis 详解稀疏子网络为何能中奖Lottery Ticket20从经典剪枝看现代大模型剪枝哪些思想仍然有效总结篇编号文章标题核心内容21非结构化剪枝详解为什么它压缩率高但不一定加速sparse weights22全局幅值剪枝代码实战用 PyTorch 剪掉最小权重实战23层内剪枝与全局剪枝对比哪个更合理策略比较24稀疏正则化剪枝L1 正则如何诱导参数变稀疏regularization25动态稀疏训练 DST边训练边剪枝边生长sparse training26SNIP 详解训练前一次性剪枝如何实现SNIP27GraSP 详解保持梯度流的训练前剪枝GraSP28SynFlow 详解无需数据的剪枝方法data-free pruning29Movement Pruning 详解为什么适合 BERT 微调NLP 剪枝30非结构化剪枝的硬件难题稀疏矩阵为什么不一定快部署分析编号文章标题核心内容31结构化剪枝是什么为什么它更适合真实部署channel/filter/layer32通道剪枝 Channel Pruning 详解CNN 通道33卷积核剪枝 Filter Pruning 详解filter pruning34层剪枝 Layer Pruning 详解什么时候可以删除整层layer pruning35BN 缩放因子剪枝Network Slimming 原理详解BN gamma36ThiNet 详解基于下一层重构误差的通道剪枝reconstruction37CP 详解Channel Pruning for Accelerating Very Deep Neural Networks经典方法38SSS 详解稀疏结构选择如何实现自动通道剪枝sparsity scaling39AMC 详解强化学习如何自动决定每层剪枝率AutoML pruning40MetaPruning 详解用元网络生成剪枝结构meta learning41结构化剪枝的残差连接问题ResNet 为什么不好剪shortcut 对齐42结构化剪枝代码实战剪 ResNet 的通道并真实加速PyTorch 实战编号文章标题核心内容43剪枝中的重要性评分到底在衡量什么score 本质44基于权重幅值的重要性评分magnitude45基于梯度的一阶重要性评分gradient46Taylor 剪枝详解一阶泰勒展开如何评估损失变化Taylor47Hessian 剪枝详解二阶信息为什么更准确second-order48Fisher 信息剪枝从概率视角理解参数重要性Fisher49激活值统计剪枝用输入数据判断通道贡献activation50重构误差剪枝剪枝后如何让特征图尽量不变reconstruction51敏感度分析剪枝不同层为什么不能剪同样比例layer sensitivity52冗余感知剪枝重要性与冗余性如何同时考虑可引出 RASS-ViT编号文章标题核心内容53VGG 剪枝实战最适合入门的结构化剪枝案例VGG54ResNet 剪枝实战残差结构如何保持维度一致ResNet55DenseNet 剪枝实战密集连接带来的剪枝难点DenseNet56MobileNet 剪枝是否有意义轻量模型还能再剪吗MobileNet57YOLO 剪枝实战目标检测模型如何压缩detection58语义分割模型剪枝Encoder-Decoder 结构怎么剪segmentation59剪枝前后特征图可视化模型到底失去了什么visualization60剪枝实验如何写得规范表格、曲线和消融实验设计论文写法61PyTorch 官方 Pruning 工具详解torch.nn.utils.prune62手写一个通道剪枝框架从 mask 到模型重构工程实现编号文章标题核心内容63Transformer 为什么难剪枝Attention、MLP 与残差结构分析Transformer64注意力头剪枝 Head Pruning 详解attention head65BERT 剪枝综述从权重剪枝到结构化剪枝BERT66LayerDrop 详解能不能直接删除 Transformer 层layer dropping67BERT-of-Theseus 详解用模块替换压缩 BERTmodule replacing68Movement Pruning 在 BERT 上的应用详解movement pruning69Adapting by Pruning剪枝能否替代微调BERT adaptation70Transformer MLP 剪枝FFN 神经元冗余如何度量FFN pruning71多头注意力真的都重要吗注意力头冗余分析redundancy72Transformer 剪枝后的蒸馏为什么通常需要 Teacherpruning KD编号文章标题核心内容73ViT 为什么需要剪枝Token 数量、注意力复杂度与部署瓶颈ViT74ViT 剪枝对象总结Token、Head、MLP、Block、Embeddingtaxonomy75Token Pruning 详解为什么删 Token 可以降低注意力计算token pruning76DynamicViT 详解动态 Token 剪枝如何实现DynamicViT77Evo-ViT 详解Slow-Fast Token Evolution 如何加速 ViTEvo-ViT78EViT 详解Token Reorganization 与推理加速EViT79A-ViT 详解自适应计算时间与动态推理adaptive inference80ViT 注意力头剪枝哪些 Head 可以删除head pruning81ViT MLP 通道剪枝FFN 层为什么冗余严重MLP pruning82ViT Block 剪枝能否直接删除 Transformer Blockdepth pruning83ViT 剪枝与知识蒸馏DeiT 给剪枝带来的启发KD84RASS-ViT 方法解读冗余感知敏感度评分如何实现免重训练弹性剪枝你的论文专题编号文章标题核心内容85大语言模型为什么需要剪枝显存、推理延迟与部署成本LLM86LLM 剪枝综述非结构化、半结构化与结构化剪枝taxonomy87SparseGPT 详解二阶近似如何实现大模型一次性剪枝SparseGPT88Wanda 详解无需重训练的大语言模型剪枝方法Wanda89Wanda 为什么快权重幅值与激活范数的结合activation-aware90LLM-Pruner 详解结构化剪枝如何删除大模型组件LLM-Pruner91LoRAPrune 详解低秩适配与剪枝如何结合LoRA pruning92大模型剪枝后的困惑度评估PPL 到底说明什么evaluation93LLM 剪枝后的下游任务评估MMLU、GSM8K、HumanEvalbenchmark94大模型剪枝与量化如何协同先剪枝还是先量化pruning quant95大模型剪枝与蒸馏如何协同Teacher 如何补偿性能pruning KD96LLaMA 剪枝实战路线从 7B 到更小模型的压缩流程practice编号文章标题核心内容97剪枝模型如何真正部署PyTorch、ONNX、TensorRT 流程deployment98为什么 FLOPs 降了但速度没变快剪枝部署中的常见坑latency gap99CPU、GPU、NPU 上剪枝模型加速差异分析hardware100结构化剪枝与硬件友好设计为什么规则稀疏更重要hardware-aware101剪枝与量化联合压缩实战从 FP32 到 INT8pruning quant102剪枝与知识蒸馏联合实战小模型如何恢复精度pruning KD103剪枝论文如何阅读从方法、公式、实验到消融paper reading104剪枝论文实验表格怎么看Params、FLOPs、Latency、Top-1experiment105如何复现一篇剪枝论文代码、数据集、超参数和日志reproduction106模型剪枝未来趋势大模型、动态剪枝、硬件协同与免重训练总结展望

C语言编译与反编译实战教程：从源代码到可执行文件及逆向分析（Windows版实例代码）

1. 引言在软件开发和安全研究领域，理解程序从源代码到可执行文件的完整生命周期至关重要。本教程将带你深入C语言编译与反编译的完整流程，通过Windows平台上的实际代码示例，让你掌握从编写源代码、编译链接生成可执行文件，到使用工…...

2026/7/6 5:45:08 阅读更多 →

RIP实验需求配置

实验合理划分网段根据要求得如图R1和R2分别有2个环回接口，有2条链路，所以一共要划分出6个独立子网且2^2<6<2^3所以需要向主机位借3位配置各个设备的IP地址及环回地址R1R2R3配置RIP协议1.启动RIP进程2.选择版本3.宣告（要求：所…...

2026/7/6 5:44:29 阅读更多 →

如何用Video2X免费AI视频增强工具：模糊视频秒变4K高清

如何用Video2X免费AI视频增强工具：模糊视频秒变4K高清【免费下载链接】video2x A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trending/vi/video…...

2026/7/6 5:42:46 阅读更多 →

2026年AI论文助手推荐：从开题到答辩的一站式智能解决方案

一、传统论文写作的痛点写论文是一场持久战。从选题到答辩，中间要经历开题报告、文献综述、论文撰写、查重降重、格式排版等多个环节。每个环节都可能成为绊脚石：选题不知道怎么选、文献看不完、写不出来、查重过不了、格式调不对…… 2026年&#xf…...

2026/7/6 5:07:59 阅读更多 →

EM3080-W条码扫描模块与PIC32MX695F512L集成指南

1. EM3080-W条形码扫描模块解析EM3080-W是新大陆自动识别技术有限公司推出的一款高性能条码解码芯片，专为嵌入式系统设计。这款芯片在工业级应用中表现出色，具有低功耗、高解码成功率的特点，特别适合集成到各种便携式和固定式扫描设备中。1.1…...

2026/7/5 0:05:34 阅读更多 →

工业级传感器控制系统硬件选型与配置实战

1. 工业级传感器控制系统的硬件选型逻辑在工业自动化领域，构建一个稳定可靠的传感器/执行器控制系统需要精心设计的硬件架构。AD74115H、ADP1034和PIC18F86K90这三款芯片的组合，恰好覆盖了信号采集、电源管理和主控计算这三个关键环节。AD74115H作为ADI公…...

2026/7/5 0:24:27 阅读更多 →

计算机Java毕设实战-美容美发门店收银台账管理系统的设计与实现基于 JavaWeb 的理发店技师排班管理系统【完整源码+LW+部署说明+演示视频，全bao一条龙等】

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…...

2026/7/5 0:32:10 阅读更多 →

更多精彩文章