前言
YOLOv5,v8以及v11是YOLO系列比较经典的几个版本,这里进行简单的介绍并给出自己对三个版本之间的对比的浅薄理解。
YOLO
介绍
在介绍相关版本之前,先了解一下YOLO是什么。
YOLO是把目标检测当成一个端到端的回归问题,一次前向传播同时预测类别 + 位置。YOLO 将模型将整张图像一次性输入一个深度卷积神经网络,通过主干网络(Backbone)提取多层次特征,再由颈部网络(Neck)进行特征融合以同时兼顾大目标与小目标,最后在检测头(Head)上直接对每个特征点或网格位置进行预测,输出边界框的中心位置、宽高、目标存在的置信度以及类别概率,训练时通过将预测结果与真实标注计算定位损失、置信度损失和分类损失并反向传播更新参数,推理时对预测框进行阈值筛选和非极大值抑制(NMS)以去除重复框,从而在一次前向传播中完成目标定位与分类,实现端到端、实时的目标检测。