您当前的位置: 首页 > 汽车点评

电装开发图像识别技术:56毫秒推断出行人的朝向和距离

2017-01-23 08:04:20

电装团体开发出了利用单眼摄像头,快速实时辨认行人的身体朝向、身高和与汽车的距离等多种信息的技术(图1,图2)。已通过实验确认,在摹拟车载装备的演示环境下,处理时间只需56毫秒。电装打算将该技术利用于汽车的ADAS(高级驾驶辅助系统)。

图1:利用摄像头推断人体朝向、身高及与摄像头距离的演示。处理图像用的是英伟达的车用处理器“Tegra K1”。图1:利用摄像头推断人体朝向、身高及与摄像头距离的演示。处理图象用的是英伟达的车用途理器“Tegra K1”。

图2:实现实时图像识别的方法(右下部分)。图2:实现实时图象辨认的方法(右下部份)。

辨认多种特点时,处理的数据量庞大,因此采取原来的方法难以进行实时处理。电装此次通过调剂图象数据的处理方法缩短了计算时间。同时,计算量也降至原来的1/10左右,在计算能力有限的车载半导体上也可以使用。

调剂DNN,满足ADAS的要求

该技术由电装的子公司Denso IT Laboratory开发。图象辨认算法采取了深度学习的1种——DNN(Deep Neural Network,深度神经网络)。

之前进行图象处理时采取的是方向梯度直方图(HOG)和线性支持向量机(SVM)相组合的算法,但只能做出图象中有无人这类简单判断。不能并行求出多个特点量,因此没法肯定行人朝向、与车辆的距离等行人的状态和属性。

新开发的图象辨认方法利用DNN并行处理图象中的多种不同信息。改进了名为“图象金字塔”的方法,提高了处理速度。原来的图象辨认通过反复进行20~30次左右的“缩小分辨率-辨认”进程,确保辨认精度。此次,通过将循环次数减少到2~3次,减少了计算量。

该公司研究开发部研究员佐藤育郎介绍说,“能够以16~17帧/秒的速度(帧率)处理影象”。利用于汽车ADAS时,通常要求影象的帧率到达“10~15帧/秒左右”,此次的技术满足了这1要求。

行人检测和基于携带手机等图象特点的处理通过图象辨认进行分类。行人与汽车之间的距离可通过肯定行人站立位置,根据函数求出。身体朝向可根据角度的数值信息进行判断。电装在2016年8月25日召开的记者说明会上进行了演示,表明通过采取该技术,可实时判断行人朝向、身高及与汽车的距离。

佐藤说,采取该技术,“乃至可以推测出年龄段及是不是携带手机”。不过,做任何判断都必须要有用于深度学习的“正确数据”。电装团体还没有建立起年龄段及有没有手机等状态的正确数据,今后将建立这些数据。(作者:佐藤雅哉)

推荐阅读
图文聚焦