📦数据准备

使用公共数据集

PASCAL VOC格式

PASCAL VOC格式的目标检测任务标注文件采用XML格式，其中包含了每个目标的位置、类别、难度等信息。具体来说，标注文件中每个目标的信息包括以下几个部分：

目标类别：标注文件中，每个目标都会被赋予一个类别，例如人、狗、汽车等。在XML文件中，类别信息通常保存在<name>标签中。
目标边界框：对于目标检测任务，每个目标都会被框定一个边界框，用于表示目标在图像中的位置和大小。边界框通常由四个坐标值表示，即左上角和右下角的(x,y)坐标值。在XML文件中，边界框信息通常保存在<bndbox>标签中，其中包括<xmin>、<ymin>、<xmax>、<ymax>四个子标签，分别表示边界框的左上角和右下角的x、y坐标值。
目标难度：对于目标检测任务，标注文件中还可能包含目标的难度信息，用于表示该目标在图像中的难易程度。通常，难度信息包括三个等级：easy、medium、hard，分别表示目标在图像中的大小、遮挡程度和视角变化程度等因素的影响程度。

YOLO格式

YOLO格式的数据集特点是将图像和标注信息保存在一个文本文件中，方便数据的读取和处理。具体来说，YOLO格式数据集中的每个图像对应一个文本文件，文件名与图像文件名相同，只是后缀名为.txt。文本文件中包含了每个目标的类别、边界框位置和大小等信息。具体格式如下：

<object-class> <x> <y> <width> <height>

其中，<object-class>表示目标的类别，是一个整数值，对应于数据集中的类别标签；<x>和<y>表示目标边界框的中心点在图像中的相对位置，是一个0到1之间的浮点数；<width>和<height>表示目标边界框的宽度和高度在图像中的相对大小，也是0到1之间的浮点数。这些信息以空格分隔，每行表示一个目标。

与其他数据集格式相比，YOLO格式的数据集具有以下优点：

方便读取和处理：YOLO格式的数据集将图像和标注信息保存在同一个文本文件中，方便研究者和开发者进行数据读取和处理。
易于扩展：YOLO格式的数据集可以很容易地扩展到新的类别和数据集，只需添加新的类别标签和对应的标注信息即可。
适用于实时检测：YOLO算法本身就是一种实时目标检测算法，采用YOLO格式的数据集可以更好地适应实时检测的需求。

MS COCO格式

COCO格式的数据集主要包括以下几个文件：

train2017/和val2017/文件夹：包含训练集和验证集的图像文件，每个文件名对应一个唯一的图像ID。
annotations/instances_train2017.json和annotations/instances_val2017.json文件：包含训练集和验证集的目标实例标注信息，以JSON格式保存。
annotations/instances_train2017.json和annotations/instances_val2017.json文件：包含训练集和验证集的图像信息，以JSON格式保存。

COCO格式的数据集中的每个目标实例都包含以下信息：