YOLOV8代码阅读
YOLO 数据增强
Argument | Type | Default | Range | Description |
---|---|---|---|---|
hsv_h | float | 0.015 | 0.0 - 1.0 | 调整图像的色调,引入色彩变化。有助于模型在不同光照条件下泛化。 |
hsv_s | float | 0.7 | 0.0 - 1.0 | 通过分数改变图像的饱和度,影响色彩强度。对于模拟不同环境条件有用。 |
hsv_v | float | 0.4 | 0.0 - 1.0 | 通过分数修改图像的明度(亮度),帮助模型在各种光照条件下表现良好。 |
degrees | float | 0.0 | -180 - +180 | 在指定的角度范围内随机旋转图像,提高模型识别不同方向物体的能力。 |
translate | float | 0.1 | 0.0 - 1.0 | 按照图像大小的分数水平和垂直平移图像,有助于学习检测部分可见的物体。 |
scale | float | 0.5 | >=0.0 | 通过增益因子缩放图像,模拟不同距离下的物体。 |
shear | float | 0.0 | -180 - +180 | 通过指定角度剪切图像,模仿从不同角度观察物体的效果。 |
perspective | float | 0.0 | 0.0 - 0.001 | 对图像应用随机透视变换,增强模型理解三维空间中物体的能力。 |
flipud | float | 0.0 | 0.0 - 1.0 | 以指定概率上下翻转图像,增加数据多样性,不影响物体特征。 |
fliplr | float | 0.5 | 0.0 - 1.0 | 以指定概率左右翻转图像,对于学习对称物体和增加数据集多样性有用。 |
bgr | float | 0.0 | 0.0 - 1.0 | 以指定概率将图像通道从RGB切换到BGR,对于增加对错误通道顺序的鲁棒性有用。 |
mosaic | float | 1.0 | 0.0 - 1.0 | 将四个训练图像组合成一个,模拟不同的场景构成和物体互动。对于复杂场景理解非常有效。 |
mixup | float | 0.0 | 0.0 - 1.0 | 混合两个图像及其标签,创建复合图像。通过引入标签噪声和视觉变化,增强模型泛化能力。 |
copy_paste | float | 0.0 | 0.0 - 1.0 | 从一个图像复制物体并粘贴到另一个图像上,对于增加物体实例和学习物体遮挡有用。 |
auto_augment | str | randaugment | - | 自动应用预定义的增强策略(randaugment, autoaugment, augmix),通过多样化视觉特征优化分类任务。 |
erasing | float | 0.4 | 0.0 - 0.9 | 在分类训练期间随机擦除图像的一部分,鼓励模型关注于不太明显的特征以进行识别。 |
crop_fraction | float | 1.0 | 0.1 - 1.0 | 将分类图像裁剪为其大小的分数,强调中心特征,适应物体尺度,减少背景干扰。 |