400-0756-518
欢迎拨打垂询热线!
公众号:china1umv
欢迎来到1号无人车网!聚焦无人驾驶物流技术与服务!
关注我们:
MORE+
推荐品牌
蚂蚁侠  云乐智能  一清创新  新石器无人车  中惠创智无线充电  沃美诺安全触边  易迦智车  行深智能  煜禾森  驭势科技  任吾行  九识智能  文远知行  易成创新  
新闻详情    NEWS
自动驾驶汽车如何准确识别小物体?
来源:智驾最前沿 | 作者:智驾最前沿 | 发布时间: 今天 | 195 次浏览 | 分享到:
自动驾驶汽车想要在道路上安全行驶,需要识别的东西远比我们所知道的诸如红绿灯、行人、车辆等复杂得多。其中有一个是我们经常会忽略,但同样非常重要的障碍物,那就是小物体,像是地面上常见的小坑、碎石、塑料袋、纸箱角落、掉落的车载零件,甚至是一只小鸟或小猫,都可能对车辆的行驶安全与乘坐舒适性造成影响。
  自动驾驶汽车想要在道路上安全行驶,需要识别的东西远比我们所知道的诸如红绿灯、行人、车辆等复杂得多。其中有一个是我们经常会忽略,但同样非常重要的障碍物,那就是小物体,像是地面上常见的小坑、碎石、塑料袋、纸箱角落、掉落的车载零件,甚至是一只小鸟或小猫,都可能对车辆的行驶安全与乘坐舒适性造成影响。

  小物体检测听起来“小事儿一桩”,但实际难度会高很多。小物体具有目标体积小、与背景对比弱、遮挡严重、在不同光照和天气下表现各异等特征,而且在发现时已距离非常近了,常需要极低的延迟就决定躲避或减速,这给自动驾驶系统提出了非常高的要求,那自动驾驶汽车在遇到小物体的时候,是如何准确识别的?

  感知硬件的必要性

  聊到自动驾驶,一定离不开传感器,相机因为分辨率高、成本低、能提供丰富的纹理和颜色信息,是检测小物体的主力。把镜头换成更高像素、采用更窄的近距离视场或者多个短焦摄像头组合,都能增加小物体在图像中占比,从而更容易被检测器捕捉到。但相机在弱光、逆光和大雨雪中表现会急剧下降。激光雷达(LiDAR)提供了直接的深度测量,能帮助判断障碍物是否是真实物体以及其三维尺寸,但对小物体的点云回波可能稀疏或根本无回波,特别是远距离或低反射率物体,所能得到的回波更是微乎其微。毫米波雷达对小塑料、纸张等非金属目标通常无能为力,但对散落的金属碎片或车辆零件有一定补充价值。超声波在近距离(几米内)对软性或低矮物体灵敏,是泊车和低速情况下的好帮手。还有一些如红外/热成像能在夜间突出生物目标,事件相机能够对快速变化的局面以极低延迟捕捉边界,这些特殊传感器在特定场景有独特作用。

  当然,为了精确感知到小物体,在选择传感器时并不能只考虑传感器的能力,还有很多细节需要考虑,相机与LiDAR的安装高度、俯仰角会影响对近地小物体的感知覆盖;镜头选择(广角或窄角)以及畸变校正会决定小物体在图像中的形态表达;传感器清洁(挡风玻璃、LiDAR盖板)和防冻措施也会直接关系到夜间或恶劣天气的检测能力。这时就可以引入自检模块,持续监控传感器健康,当某个传感器的置信度下降时自动调整融合策略,同时告知上层决策降低速度或把驾驶权限交还给人类。

  为了实现更加精准的识别,感知融合是非常重要的一环。把LiDAR的稀疏点云投影到图像平面,可以在图像上得到稀疏深度点,作为额外通道输入给检测网络;反过来,图像检测结果可以限制点云聚焦区,从而提高点云模型对小物体的敏感度(Frustum-based方法就是这么干的)。此外,雷达数据的速度信息可以帮助区分静止的垃圾与正在滚动的障碍物,热成像能在夜间把动物与背景区分开来。多模态融合的难点在于对齐(时间戳同步、外参内参标定)、置信度建模以及在模态缺失时的退化策略。有技术提出使用一种“模态优先级”逻辑,即在视觉良好时优先以相机为主,在夜间或大雾天则把热像或雷达权重抬高,而在近距离停车/低速场景下,超声波数据被赋予最高优先级。

  算法对于识别依然重要

  想要实现精准识别,除了感知外,更重要的还有算法。曾几何时,目标检测靠手工特征+分类器,面对小目标普遍乏力。现代自动驾驶更多依赖深度学习,但直接把通用目标检测网络(比如早期的YOLO、SSD)拿来套用也不足以处理路面小物体。小目标的关键问题是,特征信息在网络传递过程中容易丢失。当输入分辨率、或特征图尺度过小,小物体的特征就被下采样吞掉了。为了弥补这一点,常用的策略包括保留高分辨率分支、使用特征金字塔(Feature Pyramid Network, FPN)来汇聚不同尺度的信息,采用空间金字塔池化、多尺度训练以及专门为小目标优化的检测头。

  近年来兴起的anchor-free方法、以及Transformer框架(如DETR类模型)也在不断改进各尺度之间的建模能力,但它们对训练数据和算力要求高。对小物体特别有效的技巧还包括,在训练时对小目标进行过抽样(让模型看到更多小目标样本)、使用焦点损失(Focal Loss)缓解正负样本不平衡、引入上下文模块(因为很多小物体难以从局部判断,周围语义和道路结构常常是重要线索)、以及用可变形卷积或注意力机制提升对不规则形态的响应能力。

  时间维度是另一个强有力的工具。单帧图像里一个不起眼的小纸袋可能看不出什么,但通过连续帧的运动信息、光流、或基于跟踪的策略,就可以把“短暂的噪点”演变为稳定的目标。常见的做法就是把检测和跟踪结合,先用检测器在每一帧产生候选,再用轻量级跟踪器(例如基于卡尔曼滤波和外观关联的SORT/DeepSORT思想)在时间上链接目标轨迹,从而用运动一致性来滤掉偶发误报并且增强小物体置信度。还有更先进的做法是构建时空网络,直接对多帧输入进行端到端推断,让模型学会把跨帧的微弱线索整合起来。

  小物体本身在自然采集中往往是长尾分布,即绝大多数帧里没有稀有的小物体,这就会导致训练数据里小物体样本不足。为此,行业里普遍使用数据增强和合成数据来补样本。有一种简单但有效的做法是“copy-paste”,也就是把标注好的小物体裁剪出来,按合理的物理规则粘贴到其他场景中,保持遮挡与阴影一致性以减少域差异。更进一步的做法就是使用模拟器生成合成数据,模拟不同天气、不同路面、不同摄像头参数下的小物体表现。还有一些技术细节会显著提升检测率,比如在训练时使用高分辨率输入、在数据增强里有意放大小物体、以及在训练损失中对小目标增加权重。标注本身对小物体也更考验审校质量,标注框要足够紧、类别标签和元数据(反光、材质、固定/移动)要准确,以便训练出能区分细微差别的模型。

  为了能够让自动驾驶汽车真实上路,对于小物体的检测还要考虑计算和延迟约束。自动驾驶系统对实时性要求极高,检测模型必须在有限算力下完成推理并输送给规划模块。常见的办法包括模型压缩(剪枝、蒸馏、量化)、把繁重的检测放在边缘GPU上而把更高层决策放在车端CPU上,以及采用多阶段流程,先用一个极轻量的快速筛查网络做高召回检测(允许较多误报),然后把筛查结果送到更精细但慢一些的网络做精确识别与分类。对于小物体尤其重要的是在保证高召回的前提下控制误报率,因为虚假避让会影响流畅性。为此,系统里常会加入置信度后处理和多模态确认策略,确保只有在至少两个模态或时间上稳定出现时才触发紧急规避动作。

  路面小坑、路面裂缝与低矮凸起这类问题,有时属于“语义级”的路面检测,与传统的物体检测有所不同。为此很多技术方案中会额外训练专门的路面质量模型,使用语义分割或深度回归来估计路面高度场与凹坑深度。这种方法往往要结合车辆自身的惯性测量单元(IMU)和悬挂传感器数据,当车轮经过坑洼引发的振动与加速度突变与视觉/摄像头检测到的路面形态相吻合时,可以更可靠地识别出“真实的坑洞”。同样地,某些车队或地图服务会长期积累路面缺陷的高精度地图,通过先验地图与在线感知对比来提示已知坑洞的位置,从而提前规划绕行或减速。

  最后的话

  从长远看,有几类技术方向会进一步提升小物体检测能力。一是传感器硬件的改进,更高分辨率的LiDAR、短距高密度固态雷达、事件相机与主动照明结合,都会直接提高小目标的可观测性。二是算法层面的专门设计,为小物体设计的微尺度检测模块、结合Transformer的时空模型、以及更好的自监督表示学习可以减少对大量标注样本的依赖。三是利用模拟与合成数据进行大规模预训练,再在真实数据上做少量微调,以实现更好的域迁移能力。四是边缘计算与异构计算协同,让复杂模型在保证延迟的同时提升检测精度。

  当然,我们一定要明白,任何感知系统都不是完美的,系统设计要假设感知会出错,并把这种不确定性纳入决策。对小物体而言,最稳妥的做法不是把所有东西都“确定检测”出来再决策,而是在检测不确定时采取保守策略,也就是立刻完成减速、拉开车距、优先保证乘客与周围人的安全。如果是在低速城市场景,可以适当放慢车速,从而换取更高的安全边际;在高速上则更可以依赖高精地图与车队协同感知来降低突发小物体的暴露概率。

  总的来说,小物体检测是个跨越硬件、数据、算法与系统工程的综合问题。靠一项单一技术很难把它完全解决,现实的做法是多模态传感器融合、时空信息整合、专门的小目标网络优化、以及将工程级的冗余与退化策略结合起来。未来,随着传感器成本的下降、模拟训练的成熟、以及更高效的时空深度学习模型出现,我们会看到自动驾驶系统在面对那些原先容易忽略的小坑小物体时变得越来越稳健。但在此之前,谨慎、分级、可解释并可验证的策略仍然是确保行驶安全的核心原则。


产品分类