学校网站建设方案及报价wordpress主题acg
2026/1/2 14:24:33 网站建设 项目流程
学校网站建设方案及报价,wordpress主题acg,深圳 设计,郑州房产信息网查询系统本篇博文我们来详细解释目标检测中边界框的 (x, y, w, h) 坐标表示法。这是最核心的坐标格式之一。 核心定义 (x, y, w, h) 代表一个矩形框#xff0c;通常用于标注或预测图像中物体的位置和大小。 四个参数的含义#xff1a; x#xff1a;边界框中心点的横坐标y#xff1a…本篇博文我们来详细解释目标检测中边界框的(x, y, w, h)坐标表示法。这是最核心的坐标格式之一。核心定义(x, y, w, h)代表一个矩形框通常用于标注或预测图像中物体的位置和大小。四个参数的含义x边界框中心点的横坐标y边界框中心点的纵坐标w边界框的宽度h边界框的高度1. 坐标系说明在计算机视觉中通常使用以下坐标系原点(0,0)图像的左上角x轴水平向右宽度方向y轴垂直向下高度方向(0,0)━━━━━━━━━━━━━→ x (宽度) ┃ ┃ (x, y) ← 中心点 ┃ ● ┃ ┃ ┃ ↓ ↓ 宽度 w y (高度) 高度 h2. 实际示例假设一张图像的尺寸是640×480像素宽×高。如果有一个标注框为(x320, y240, w200, h150)这意味着中心点位置从图像左上角向右320像素向下240像素处框的大小宽200像素高150像素框的实际范围左边界x - w/2 320 - 100 220右边界x w/2 320 100 420上边界y - h/2 240 - 75 165下边界y h/2 240 75 315视觉表示图像左上角(0,0) ↓ ┌─────────────────────────┐ ← 上边界 y165 │ │ │ ┌─────────────┐ │ │ │ │ │ │ │ ● (320,240) │ ← 中心点 │ │ (物体在这里) │ │ │ │ │ │ └─────────────┘ │ ← 下边界 y315 │ │ └─────────────────────────┘ 左边界← →右边界 x220 x4203. 与其他坐标格式的对比(x, y, w, h)格式需要与另一种常见格式(x1, y1, x2, y2)区分开来格式对比表格式含义示例特点中心坐标式(x, y, w, h)中心点宽高(320,240,200,150)- 便于回归任务- 对尺度变化更鲁棒- YOLO系列常用角点坐标式(x1, y1, x2, y2)左上右下角点(220,165,420,315)- 更直观- 计算IoU方便- Faster R-CNN常用相互转换公式1. 中心式 → 角点式x1 x - w/2 y1 y - h/2 x2 x w/2 y2 y h/22. 角点式 → 中心式x (x1 x2) / 2 y (y1 y2) / 2 w x2 - x1 h y2 - y14. 为什么目标检测常用(x, y, w, h)格式4.1 回归任务的优势在训练神经网络进行边界框预测时我们通常不是直接预测绝对坐标而是预测偏移量。(x, y, w, h)格式对这种设计更友好# 假设有一个预设的Anchor框(anchor_x, anchor_y, anchor_w, anchor_h)# 网络预测的是4个偏移量(tx, ty, tw, th)# 实际预测框的计算公式pred_xanchor_xtx*anchor_w pred_yanchor_yty*anchor_h pred_wanchor_w*exp(tw)# 用指数确保宽度为正pred_hanchor_h*exp(th)# 用指数确保高度为正关键点tx, ty是中心点的相对偏移比例值tw, th是宽高的对数尺度变换这种设计使得回归目标更稳定易于神经网络学习4.2 对尺度变化的稳定性如果物体放大2倍(w, h)直接变为2倍在(x1, y1, x2, y2)格式中四个坐标都会变化且变化幅度不同(x, y, w, h)的变化更一致更符合物理直觉4.3 损失函数设计回归损失函数如Smooth L1 Loss对(x, y, w, h)格式更有效# 计算回归损失简化示例loss_xsmooth_l1(pred_x-true_x)loss_ysmooth_l1(pred_y-true_y)loss_wsmooth_l1(pred_w-true_w)loss_hsmooth_l1(pred_h-true_h)total_lossloss_xloss_yloss_wloss_h由于w, h总是正数且通常用对数空间处理避免了宽高为负的问题。5. 实际应用中的归一化处理在实际训练中坐标通常会被归一化到 [0,1] 范围内5.1 归一化公式x_norm x / image_width y_norm y / image_height w_norm w / image_width h_norm h / image_height归一化后的示例图像尺寸640×480原始坐标(320, 240, 200, 150)归一化后(0.5, 0.5, 0.3125, 0.3125)5.2 归一化的好处尺度不变性无论输入图像大小如何坐标都在相同范围内训练稳定性梯度更容易控制多尺度训练方便处理不同尺寸的输入图像6. 在YOLO中的具体应用以YOLOv5为例说明这种坐标格式的实际使用6.1 标注文件格式YOLO使用的标签文件通常是.txt格式class_id x_center y_center width height其中所有值都是归一化到 [0,1] 的。示例0 0.5 0.5 0.3125 0.3125表示类别0中心点在图像中心宽高约为图像的31.25%。6.2 网络输出YOLO的输出包含每个预测框的(x, y, w, h)相对值物体置信度类别概率6.3 后处理中的坐标转换在推理时需要将网络输出转换为实际像素坐标# 假设输出是归一化的defdecode_box(pred_x,pred_y,pred_w,pred_h,img_w,img_h):# 1. 转换为绝对坐标xpred_x*img_w ypred_y*img_h wpred_w*img_w hpred_h*img_h# 2. 转换为角点格式用于显示或计算IoUx1x-w/2y1y-h/2x2xw/2y2yh/2return[x1,y1,x2,y2]7. 注意事项和常见问题7.1 边界处理当边界框靠近图像边缘时# 需要确保边界框不超出图像范围x1max(0,x1)# 不小于0y1max(0,y1)x2min(img_w-1,x2)# 不大于图像宽度y2min(img_h-1,y2)7.2 宽高比敏感性对于极端宽高比的物体如电线杆、横幅(x, y, w, h)格式可能不如旋转框表示法但在大多数通用检测任务中这种格式足够有效7.3 与(x1, y1, x2, y2)的选择训练阶段常用(x, y, w, h)便于回归评估阶段常转换为(x1, y1, x2, y2)便于计算IoU实际存储取决于框架和数据集格式总结(x, y, w, h)坐标格式优点回归友好对神经网络学习更稳定物理直观中心点尺寸的表示符合直觉尺度鲁棒对物体尺度变化更稳定广泛支持被YOLO等主流检测器采用关键点理解中心点坐标和宽高的含义掌握归一化处理的方法知道如何与角点格式相互转换了解在训练和推理中的不同使用方式

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询