yolov5输出的pred矩阵是一个四维张量,其形状为(batch_size, num_anchors_per_layer, grid_size, num_classes + 5),其中:
- batch_size:表示输入模型的图像数量。
- num_anchors_per_layer:表示每个检测层(如yolo层)使用的anchor box数量。
- grid_size:表示每个检测层的特征图大小,即特征图的高度和宽度。
- num_classes + 5:表示每个anchor box预测的参数数量,其中包括4个坐标值、1个objectness分数以及num_classes个类别分数。