• 谷歌公开自动驾驶新专利:通过眼睛注视向量,精确判断注意力


    当前,我们正处在智能驾驶技术迅速发展的时代,具有智能驾驶、辅助驾驶功能的车辆正变得越来越普遍。

    但是,当前智能驾驶技术尚不完善,一些功能如果完全智能驾驶的话仍然具有一定风险,所以需要人们在驾驶时时刻保持注意力。

    在这里插入图片描述

    如何监测用户当前的行为是否集中在驾驶上就成了问题,现有的技术一般是通过用户触摸方向盘、确定驾驶员的眼睛睁开、分析面部表情或眨眼速度不同来进行识别。但是这些技术在检测效果上存在一些问题,要么不太友好,例如要求用户把手一直放在方向盘上;要么容易误判,例如通过眨眼检测等方式可能无法识别用户是否在看窗外风景的。

    12月23日,谷歌公开了一件专利《VEHICLE OCCUPANT ENGAGEMENT USING THREE-DIMENSIONAL EYE GAZE VECTORS》,根据描述,其通过眼睛的3D注视向量,可以更精确地定位用户正在查看的车辆内的相对位置,甚至是具体部件,例如可以识别到用户是否在看后视镜、仪表盘等。
    在这里插入图片描述

    其主要通过摄像机102A和102B获取乘员眼睛在3D空间内的位置。

    同时,其可以基于乘员的面部平面来确定三维眼睛注视向量。使用乘员的头部/眼睛在机舱空间内的三维位置和三维眼睛注视向量,就可以更精确地确定用户正在注视的三维机舱空间内的位置,例如后视镜、车辆的头部单元、车辆的仪表显示器、车辆的前挡风玻璃等。
    在这里插入图片描述

    该技术可以有效提升驾驶员的注意力,避免因驾驶员走神而造成的重大事故,面向驾驶员行为检测在将来的大规模应用,数据堂目前已采集有《多人种驾驶员行为数据》、《驾驶员行为标注数据》等相关数据集资源可供训练,数据堂严格遵守相关规定,所采集的数据均已获得被采集人授权,并符合通过ISO27701、ISO27001隐私信息管理体系认证以及ISO9001质量管理体系认证,数据质量值得信赖。

    多人种驾驶员行为数据集
    在这里插入图片描述
    ​数据涵盖多年龄段、多时间段、多人种(白种人、黑种人和印度人)驾驶行为包括危险驾驶行为、疲劳驾驶行为和视线偏移行为,在采集设备方面,采用了可见光和红外双目摄像头,每个采集动作准精度超过95%、标签标注准确率在95%以上,数据可用于驾驶员行为分析等任务。

    驾驶员行为标注数据集
    在这里插入图片描述

    数据涵盖多年龄段、多时间段、多种行为(危险驾驶行为、疲劳驾驶行为、视线偏移行为),对人脸72关键点(包括瞳孔)、人脸属性、手势检测框、安全带检测框、瞳孔关键点、行为类别进行标注,标注准确率不低于95%。数据可用于驾驶员行为分析等任务。​

    现阶段由于技术能力受限,智能驾驶汽车还无法独自面对复杂的路况,摆脱不了驾驶员的干预,相信在不久的将来,智能驾驶汽车能摆脱驾驶员的干预,做到真正的智能驾驶。

  • 相关阅读:
    MySQL,请用好 JSON 这张牌
    Linux文件系统及命令 | 实用操作指令汇总
    2023程序员HR面试面经
    如何使用plink进行二分类性状的GWAS分析并计算PRS得分
    Linux文件和目录常用命令
    下厨房网站月度最佳栏目菜谱数据获取及分析PLus
    详解:-bash: nohup:: command not found​​​​
    python之列表及操作相关知识
    riscv-gcc工具编译firmware进行仿真问题总结
    Latex论文写作小技巧记录,不断更新
  • 原文地址:https://blog.csdn.net/weixin_44532659/article/details/125912628