别再只下载COCO了！手把手教你用Labelme标注并转成COCO实例分割数据集（附完整代码）

张

张建站

2026/5/3 17:25:15

10分钟阅读

别再只下载COCO了！手把手教你用Labelme标注并转成COCO实例分割数据集（附完整代码）

从零构建自定义实例分割数据集Labelme标注与COCO格式转换实战指南在计算机视觉领域COCO数据集因其丰富的标注和标准化格式已成为行业基准。但现实项目中我们往往需要针对特定场景如工业质检、医疗影像或零售商品识别构建专属数据集。本文将完整演示如何通过开源工具Labelme完成图像标注并编写Python脚本将标注结果转换为COCO标准格式最终生成可直接用于模型训练的实例分割数据集。1. 工具选型与标注环境搭建1.1 标注工具对比分析不同于直接下载现成数据集自定义数据集制作需要选择合适的标注工具。以下是主流开源工具的对比工具名称标注类型支持安装复杂度导出格式交互体验Labelme多边形/矩形/关键点★★☆☆☆JSON自定义优秀CVAT全类型标注★★★★☆COCO/XML等专业LabelImg矩形框★★☆☆☆VOC/YOLO一般VGG Image Annotator多边形/点★★☆☆☆JSON良好对于实例分割任务Labelme因其轻量级和灵活的多边形标注能力成为首选。安装仅需一行命令pip install labelme1.2 标注规范制定开始标注前需明确规范类别体系预先定义所有待标注类别如工业场景的划痕、凹陷等标注精度确定多边形顶点密度一般建议物体边缘每3-5像素一个点遮挡处理约定被遮挡物体的标注方式完整轮廓或可见部分标注验证设置多人交叉验证机制提示建议创建标注手册并保存为PDF供整个团队参考执行2. Labelme标注全流程解析2.1 标注操作实战演示启动Labelme后典型工作流如下创建标注项目目录结构/dataset /raw_images # 存放原始图像 /annotations # 保存JSON标注文件执行标注命令labelme --output annotations --nodata标注界面操作要点使用Create Polygon工具沿物体边缘描点按ESC键完成当前多边形绘制右键点击已标注对象可编辑形状标注结果示例JSON片段{ version: 5.1.1, flags: {}, shapes: [ { label: defect, points: [[102,54],[115,49],[126,61],...], shape_type: polygon } ], imagePath: IMG_001.jpg }2.2 标注质量控制技巧放大标注使用滚轮放大图像至像素级进行精细标注快捷键CtrlZ撤销操作Del删除选中标注CtrlS快速保存批量检查使用预览模式快速浏览所有标注结果常见问题解决方案边缘模糊参考物体纹理走向确定边界镜面反射标注实际物体而非反射影像部分遮挡按可见部分完整轮廓标注3. COCO数据结构深度解析3.1 核心字段详解COCO格式的JSON文件包含五个关键部分info数据集元信息info: { description: Custom Industrial Defect Dataset, year: 2023, contributor: Your Team }licenses版权信息可忽略images图像基础信息images: [{ id: 1, # 唯一标识 width: 640, height: 480, file_name: IMG_001.jpg }]categories类别定义categories: [{ id: 1, name: scratch, supercategory: defect }]annotations实例标注核心annotations: [{ id: 1, # 标注ID image_id: 1, # 对应图像ID category_id: 1, # 类别ID segmentation: [[x1,y1,x2,y2,...]], # 多边形坐标 area: 245.76, # 像素面积 bbox: [x,y,w,h],# 外接矩形 iscrowd: 0 # 是否群体标注 }]3.2 关键数据结构转换Labelme到COCO的核心转换逻辑坐标系统转换Labelme使用绝对坐标COCO推荐使用相对坐标RLE编码ID映射体系建立image_name到image_id的映射字典构建category_name到category_id的对应关系面积计算import cv2 def calculate_area(points): contour np.array(points).reshape((-1,1,2)) return cv2.contourArea(contour)4. 完整转换代码实现4.1 转换脚本核心逻辑import json import os import numpy as np from tqdm import tqdm def labelme2coco(labelme_dir, output_file): # 初始化COCO结构 coco { info: {}, licenses: [], images: [], annotations: [], categories: [] } # 构建类别字典 categories {} for i, cls in enumerate(CLASSES): categories[cls] i1 coco[categories].append({ id: i1, name: cls, supercategory: object }) # 遍历标注文件 ann_id 1 for img_id, filename in enumerate(tqdm(os.listdir(labelme_dir))): if not filename.endswith(.json): continue # 解析Labelme文件 with open(os.path.join(labelme_dir, filename)) as f: labelme json.load(f) # 添加图像信息 img_info { id: img_id1, file_name: labelme[imagePath], width: labelme[imageWidth], height: labelme[imageHeight] } coco[images].append(img_info) # 转换标注 for shape in labelme[shapes]: points np.array(shape[points]).flatten().tolist() # 计算外接矩形 x_coords points[::2] y_coords points[1::2] x_min, y_min min(x_coords), min(y_coords) x_max, y_max max(x_coords), max(y_coords) width, height x_max - x_min, y_max - y_min coco[annotations].append({ id: ann_id, image_id: img_id1, category_id: categories[shape[label]], segmentation: [points], area: width * height, bbox: [x_min, y_min, width, height], iscrowd: 0 }) ann_id 1 # 保存结果 with open(output_file, w) as f: json.dump(coco, f, indent2)4.2 常见问题调试坐标越界# 坐标裁剪到图像范围内 points np.clip(points, 0, [width-1, height-1])无效多边形# 检查多边形是否闭合 if points[0] ! points[-2] or points[1] ! points[-1]: points.extend(points[:2])类别映射缺失# 动态添加新类别 if shape[label] not in categories: new_id len(categories)1 categories[shape[label]] new_id coco[categories].append(...)5. 数据集验证与优化5.1 可视化验证工具使用pycocotools检查数据集完整性from pycocotools.coco import COCO import matplotlib.pyplot as plt coco COCO(annotations.json) img_ids coco.getImgIds() for img_id in img_ids[:3]: img coco.loadImgs(img_id)[0] ann_ids coco.getAnnIds(imgIdsimg_id) anns coco.loadAnns(ann_ids) # 显示标注 plt.imshow(plt.imread(img[file_name])) coco.showAnns(anns) plt.show()5.2 数据集增强建议类别平衡统计各类别实例数对稀少类别进行过采样尺寸分布分析标注对象的面积分布确保覆盖不同尺度困难样本专门收集模糊、遮挡等挑战性样本数据清洗移除标注质量差的样本IOU0.7的重复标注工业场景下的特殊考量针对反光表面增加数据增强对微小缺陷10像素采用特殊标注策略考虑环境因素光照变化、拍摄角度等实际项目中我们发现在转换过程中最容易出错的是类别ID的映射管理。建议在脚本中加入严格的类别校验机制并在转换完成后立即进行可视化验证。对于大规模标注任务可以考虑开发简单的Web界面供多人协作标注和审核。

HS2-HF Patch终极指南：一键解决HoneySelect2汉化与MOD整合难题

HS2-HF Patch终极指南：一键解决HoneySelect2汉化与MOD整合难题【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 你是否正在为HoneySelect2的游戏体验…...

2026/5/3 17:22:26 阅读更多 →

前端新手福音：用快马平台和ccswitch轻松理解状态管理

作为一个刚接触前端状态管理的新手，我最近发现了一个特别适合入门的学习组合：ccswitch状态管理库InsCode(快马)平台。通过这个组合，我快速理解了状态管理的核心概念，而且整个过程完全不需要配置环境，特别适合像我这样刚…...

2026/5/3 17:21:27 阅读更多 →

别再乱用Jedis了！多线程场景下的正确姿势与连接池避坑指南

多线程环境下Jedis的正确使用姿势：从线程安全到连接池优化实战 Redis作为高性能键值数据库，已成为现代Java应用架构中的标配组件。而Jedis作为最基础的Redis Java客户端，其简单直接的API设计让开发者能够快速上手。但许多初级开发者往往忽视了…...

2026/5/3 17:17:53 阅读更多 →

LoopViT：结合循环机制的视觉Transformer优化架构

1. 项目概述在计算机视觉领域，Transformer架构近年来展现出惊人的潜力。LoopViT是我最近开发的一种新型视觉推理架构，它通过引入循环机制改进了传统视觉Transformer的计算效率和信息流模式。这个架构特别适合处理视频分析、医学影像分割等需要时序建模的…...

2026/5/3 0:06:07 阅读更多 →

实战指南：深度解锁微信网页版，让浏览器也能畅快聊天

实战指南：深度解锁微信网页版，让浏览器也能畅快聊天【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 还在为微信网页版频繁提示…...

2026/5/3 0:10:11 阅读更多 →

智慧树学习效率提升指南：如何用自动化工具节省80%学习时间

智慧树学习效率提升指南：如何用自动化工具节省80%学习时间【免费下载链接】zhihuishu 智慧树刷课插件，自动播放下一集、1.5倍速度、无声项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 还在为智慧树平台繁琐的视频学习流程而烦恼吗&am…...

2026/5/3 0:27:49 阅读更多 →