首先看看工具界面本教程将指导您如何在Windows 10或Windows 11的64位操作系统上使用一键训练工具来训练PaddleOCR文本检测和文本识别模型无需安装CUDA和cuDNN环境也无需配置Python环境。您只需要准备指定格式的数据集即可开始训练自己的模型。环境要求操作系统: Windows 10/Windows 11, 64位显卡: NVIDIA显卡支持RTX 20, RTX 30, RTX 40, RTX 50系列建议使用RTX 2070或更高型号。显卡驱动: 确保显卡驱动支持的最高CUDA版本≥12.9。通常更新到最新的显卡驱动即可满足条件。数据集准备在开始训练之前请确保您已经准备好了符合要求的数据集。对于文本检测和文本识别任务数据集的格式如下文本检测: 需要提供训练集和验证集的图像及其对应的标注文件。文本识别: 需要提供训练集和验证集的文本行图像及其对应的标签文件。使用步骤下载并解压工具包:下载PaddlePaddle-GPU 3.3.0 PaddleOCR 3.5.0训练工具包。解压工具包到您指定的目录。配置训练参数:打开工具包中的训练工具。选择“文本检测训练”或“文本识别训练”选项卡。文本检测训练配置:模板文件: 选择对应的检测配置文件如PP-OCRv5/PP-OCRv5_mobile_det.yml。训练集目录: 选择训练图像所在的目录。验证集目录: 选择验证图像所在的目录。训练集标注文件: 选择训练集的标注文件。验证集标注文件: 选择验证集的标注文件。批大小 (batch size): 根据您的GPU显存大小调整。迭代次数 (epoch num): 设置训练的总轮数。GPU: 选择要使用的GPU设备编号通常为0。进程数 (DataLoader workers): 设置数据加载的进程数。文本检测数据集格式示例17.jpg[{transcription:GONG CHA,points:[[415,481],[510,463],[514,487],[420,504]],difficult:false},{transcription:喝奶茶吗,points:[[65,566],[537,554],[539,680],[66,672]],difficult:false}]21.jpg[{transcription:没钱,points:[[190,560],[434,560],[434,681],[190,681]],difficult:false}]23.jpg[{transcription:终于翻了,points:[[93,77],[623,81],[622,214],[92,210]],difficult:false}]26.jpg[{transcription:你是不是没长脑子,points:[[61,540],[682,549],[679,634],[65,630]],difficult:false}]30.jpg[{transcription:你又放屁,points:[[123,17],[550,20],[558,131],[119,122]],difficult:false}]34.jpg[{transcription:对你说得对,points:[[103,442],[482,438],[474,522],[103,516]],difficult:false}]43.jpg[{transcription:呵呵,points:[[176,193],[350,194],[347,258],[179,266]],difficult:false}]44.jpg[{transcription:乖巧,points:[[248,3],[385,8],[383,78],[246,74]],difficult:false}]45.jpg[{transcription:我还能再买三天三夜,points:[[147,61],[515,43],[517,85],[149,103]],difficult:false}]48.jpg[{transcription:明天再见哦,points:[[93,269],[420,267],[420,320],[93,322]],difficult:false}]50.jpg[{transcription:求求你们了,points:[[106,18],[447,18],[447,81],[106,81]],difficult:false},{transcription:好不好,points:[[370,95],[578,95],[578,171],[370,171]],difficult:false}]文本识别训练配置:模板文件: 选择对应的识别配置文件如PP-OCRv5/PP-OCRv5_mobile_rec.yml。训练集目录: 选择训练图像所在的目录。训练集标签文件: 选择训练集的标签文件。验证集目录: 选择验证图像所在的目录。验证集标签文件: 选择验证集的标签文件。批大小 (batch size): 根据您的GPU显存大小调整。学习率: 设置初始学习率。迭代次数 (epoch num): 设置训练的总轮数。GPU: 选择要使用的GPU设备编号通常为0。进程数 (DataLoader workers): 设置数据加载的进程数。开始训练:确认所有参数配置无误后点击“开始训练”按钮。训练过程中您可以查看日志输出以监控训练进度和状态。注意事项确保您的数据集格式与工具要求一致否则可能导致训练失败。文本识别数据集格式示例crop_img/1_crop_0.jpg 智障 crop_img/2_crop_0.jpg 骄傲 crop_img/4_crop_0.jpg 约吗帅哥 crop_img/3_crop_0.jpg 别说话 crop_img/3_crop_1.jpg 辣耳朵 crop_img/5_crop_0.jpg 我的狗子打我 crop_img/7_crop_0.jpg 你再滚 crop_img/9_crop_0.jpg 惹不起惹不起 crop_img/11_crop_0.jpg 我的天哪 crop_img/13_crop_0.jpg 搞事情是吧 crop_img/15_crop_0.jpg 厉害了我的哥 crop_img/6_crop_0.jpg 皮皮狗我们走 crop_img/10_crop_0.jpg 请赐给我力量 crop_img/12_crop_0.jpg 没睡好 crop_img/12_crop_1.jpg 生气训练过程中GPU显存占用较高请确保您的显卡有足够的显存。如果遇到任何问题可以查看日志文件获取详细信息并根据日志提示进行调整。通过以上步骤您可以轻松地在Windows系统上使用PaddleOCR 3.5.0训练自己的文本检测和文本识别模型而无需复杂的安装和配置过程。祝您训练顺利