【模型训练函数构建】

张

张建站

2026/6/8 6:51:00

10分钟阅读

train和val数据处理函数FashionMNIST 下载train输入大小28*28输入格式Tensorsplit 分割数据集train_data0.8trainval_data0.2trainDataLoader 打包两个数据集 batch_size32train_model 训练模型函数设置设备为GPU模式设置Adam优化器学习率0.001 用于梯度下降法损失函数为交叉熵函数将模型放入训练设备中for 循环设置20轮for循环每次读取32张图片次数train_data数据量/batch_sizemodel.train()开始训练得到输出数据是32*10矩阵torch.argmax(输出数据dim1)按照行读取最大值经过计算得到这个batch的loss累加每个batch的loss用于计算一个epoch的loss累加每个batch预测正确的个数用于计算一个epoch的计算精确度acc将梯度初始化为0反向传播梯度下降法更新参数for循环每次读取32张图片次数val_data数据量/batch_sizemodel.eval()开始验证得到输出数据是32*10矩阵torch.argmax(输出数据dim1)按照行读取最大值经过计算得到这个batch的loss累加每个batch的loss用于计算一个epoch的loss累加每个batch预测正确的个数用于计算一个epoch的计算精确度acc计算每个epoch中train和val的loss和acc用于比较最优模型和绘图保存最高精度模型参数在train_model 训练模型函数中第一个 for 循环控制训练多少个 epoch。第二个 for 循环是训练循环。如果训练集有 8000 张图片batch_size32那么每个 epoch 会循环 250 次。这 250 次不是得到 250 组参数而是对同一个模型参数连续更新 250 次。第三个 for 循环是验证循环。验证集不更新参数只用来评价当前模型参数的效果。每个 epoch 结束后用验证集准确率判断当前这套参数是不是目前最好的。如果是就用 best_model_wts 保存下来。最终得到的是验证集表现最好的那一套模型参数。流程类似于epoch 1: train loop: 8000/32 250 次模型参数被更新 250 次 val loop: 2000/32 ≈ 63 次模型参数不变只计算 val_loss 和 val_acc 如果 val_acc 是目前最高保存当前参数 epoch 2: train loop: 继续在 epoch 1 的参数基础上更新 250 次 val loop: 测试当前参数如果 val_acc 更高保存当前参数 epoch 3: train loop: 继续更新 250 次 val loop: 测试当前参数如果 val_acc 更高保存当前参数

使用RocketEbpf分析性能问题

RocketEbpf是用rust实现的一款基于ebpf的性能分析工具,具有无侵入、灵活高效、可视化等特点。十分适合生产环境使用示例监控调度延迟监控函数hz 1. 配置 Server 配置说明 rocket-ebpf server 配置文件推荐使用 YAML（.yaml / .yml），支持 # 注释；也兼容 JSON（.json，…...

2026/6/8 6:50:10 阅读更多 →

新手必看：从BUU SQL COURSE 1这道题，我总结了Web安全实战找注入点的3个关键思路

Web安全实战：从非常规入口到SQL注入的3个关键思维突破登录框、搜索栏、URL参数——这些常见的Web应用入口往往是安全测试的首选目标。但真正的漏洞猎人知道，突破点可能藏在最不起眼的角落。就像那道让无数CTF新手卡壳的BUU SQL COURSE 1题目，…...

2026/6/8 6:50:09 阅读更多 →

PyTorch手写迷你词向量：从Skip-Gram到梯度可调试的嵌入系统

1. 项目概述：为什么你需要亲手造一个“迷你词向量”，而不是直接调用现成模型“Create your Mini-Word-Embedding from Scratch using Pytorch”——这个标题乍看像教学实验，但背后藏着自然语言处理（NLP）领域最根本的认…...

2026/6/8 6:50:03 阅读更多 →

CSDN AI数字营销卡片配置手册（跳转权限解禁版）：官方未公开的3种合规跳转变通方案

更多请点击： https://codechina.net 第一章：CSDN AI 数字营销的引流卡片支持跳转官网、小程序链接吗？ CSDN AI 数字营销平台提供的引流卡片，是面向技术创作者与企业用户的核心转化组件，其核心能力之一即为外链跳转。目…...

2026/6/8 4:16:56 阅读更多 →

如何3分钟找回遗忘的压缩包密码：免费开源工具的终极指南

如何3分钟找回遗忘的压缩包密码：免费开源工具的终极指南【免费下载链接】ArchivePasswordTestTool 利用7zip测试压缩包的功能对加密压缩包进行自动化测试密码项目地址: https://gitcode.com/gh_mirrors/ar/ArchivePasswordTestTool 你是否曾经面对一个加密…...

2026/6/7 0:03:20 阅读更多 →

Linux桌面便签神器：Sticky如何让你的工作效率提升300%？

Linux桌面便签神器：Sticky如何让你的工作效率提升300%？ 【免费下载链接】sticky A sticky notes app for the linux desktop 项目地址: https://gitcode.com/gh_mirrors/stic/sticky 在Linux桌面上，你是否经常需要快速记录一闪而过的灵…...

2026/6/8 5:33:48 阅读更多 →

YOLO11部署优化：OpenVINO推理 | 在Intel CPU上利用OpenVINO异构推理加速，无需GPU也能实时检测

我在Intel i7-13700上实测，YOLO11n经过OpenVINO INT8量化后推理延迟从原始的92ms降至19ms，配合异构调度实现CPU+GPU双核并行后进一步压缩到11ms，无需独立GPU即可跑满30FPS实时检测写在前面：一个被低估的部署痛点过去两年，我在三个不同的工业视觉项目中遇到同样的困境—…...

2026/6/8 0:51:40 阅读更多 →