• 无人车时代:用深度学习辅助行人检测


    原文:The Era of Autonomous Cars: Focus on Pedestrian Detection with Deep Learning

    作者:Thomas Beucher

    翻译:幻维天

    审校:Kaljb

    我们目前已经搞出来了许多具有潜在妨害性的科技,自动驾驶车辆就是其中之一,而且现在还特别火¯_(ツ)_/¯

    许多了不起的东西都来自于这样的革新:燃油经济、减少上路车辆、降低事故与死亡率、减少压力、减少停车占地,对环境也有益。

    政府已经在考虑这些了。美国国家公路交通安全管理局提供了一份正式的自动驾驶汽车分类。欧洲方面也开始修改《维也纳道路交通公约》和《日内瓦道路交通公约》,以便适应这种新技术。所以还是要坚强地接受这种事情,快上车吧!

    即便研究者们已经研究了这个课题好多年,但还是靠谷歌或特斯拉的投资才使得自动驾驶汽车发展到当今水平。

    所以,这究竟是怎么一回事呢?从更技术性的角度来看,自动驾驶面临着不同领域的诸多挑战,尤其是计算机视觉。这需要对象检测、图像分类、环境重构、动作预测、追踪、现场理解和其他各种方面的技术发展。

    最常被提及的就是行人检测了,那么我们就技术性探讨一下这个方面。

    要接受没有司机的汽车,我们必须要确保这些汽车不会成为对我们的威胁,也不会碾到我们。其实行人检测就是典型的对象检测的子问题。

    行人检测领域中最流行且能达到最佳表现的方式,就是使用拥有多种变体的积分通道特征检测器(Integral Channel Feature detector,ICF)(来自对象检测快速特征金字塔和积分通道特征)和使用卷积神经网络训练过的模型(深入观察行人和使用深度学习语义任务辅助的行人检测)。

    研究论文给出了不俗的表现,但撇开这个不谈,人类在这方面依然吊打最先进的AI检测器。 检测器会犯两种错误:“误报”(检测到了不存在的东西)和“漏报”(存在的东西没被检测到)

    检测器常见错误:

    把背景中的树叶或者红绿灯当成了行人

    同一个人被检测到了两次

    没有检测到(因为距离远而显得)较小的人

    没有检测到骑自行车的人

    用于训练检测算法的数据集当中,自行车骑行者的代表性不足和行人的侧面形象可以解释,为什么在大多数时候被障碍物部分遮挡的行人和自行车骑行者没能被正确检测到。

    看一下这个数据集,我们可以看到,画面中看起来较小的人一般饱和度较高而且很模糊,这也许就解释了较弱的检测度。但当对这一因素进行研究后(我们距离解决行人检测问题还有多远?),没有发现低检测程度和低对比度之间的相关性。模糊的情况也是这样。这样看来,问题就在于这些“小人“的像素数量太少了。

    像素数量过低就容易产生误会

    其他方式,比如这个用于实时行人识别的时间延迟神经网络算法就使用了一个实时的算法,可以检测并追踪可能包含行人的图像区域。之后它会使用一个基于行人腿部典型行动模式的分类算法。这些方式会假定腿部的可见性,因此只对步行的人有效! 基于形状的技术会分析对象的形状,比如人体形态学上的躯干、头部与四肢,这种技术可以识别运动或静止的行人,但行人的表现千差万别,有时会令这种方式显得不那么准确。

    像基于形状的行人检测这样的方式会使用人形的形态特征和垂直对称性。结合了立体技术的改进和后续帧之间时间相关性的运用,这种方式对于行人与其他物体(诸如摩托车,树木和交通灯)的区分效果似乎十分强大。

    有好多东西一直在运作,以保证我们能在这个无人驾驶汽车的世界中存活下来!虽然已经取得了非凡的成就,但要让无人能驾驶汽车完全进入生活,我们还有很多要做。但是与AI的其他领域一样,自主机器和计算机视觉也在不断改进,我感觉我们离成功不远了!马上就可以不用驾照了呢。

  • 相关阅读:
    深入剖析RocketMQ源码-NameServer
    Percolator模型及其在TiKV中的实现
    源码解读Dubbo分层设计思想
    vivo营销自动化技术解密|开篇
    Node.js 应用全链路追踪技术——[全链路信息获取]
    Linux系统 usermod -a -G 不重启 立即生效
    安装Docker和Docker-Compose工具
    linux 启动停止jar
    check_ffmpeg_status
    shell 的字符完全匹配
  • 原文地址:https://www.cnblogs.com/yangshunde/p/7740112.html
Copyright © 2020-2023  润新知