全球首个无人出租车上路:让AI学会人类的预判

2018-12-13信息快讯网

全球首个无人出租车上路:让AI学会人类的预判-信息快讯网

美国推出全球首个无人驾驶出租车服务

上周,Waymo公司在美国亚利桑那州凤凰城郊区推出了全球首个自动驾驶出租车Waymo one。当地的居民可以像叫滴滴一样,用手机APP打来一辆自动驾驶汽车。Waymo公司是Alphabet公司(谷歌母公司)旗下的子公司,专注研发自动驾驶汽车,前身是谷歌于2009年开启的一项自动驾驶汽车计划,于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。到8月,实地驾驶里程突破了1000万英里。就在上周,又推出了这款商用的自动驾驶车Waymo one。

三天前,在Medium上出现了一篇博文,名叫Mayank Bansal、Abhijit Ogale两位研究人员详细介绍了这款高度智能化的无人车所用的技术,其核心秘密是利用标注数据(即来自专业驾驶演示的Waymo数百万英里的已标注数据),通过监督学习来训练AI驾驶员。监督学习是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数/leaning model),并以此模式推出新的实例。

设计神经网络ChauffeurNet学习人类经验

“近年来,深度神经网络中的监督训练使用大量标注数据在许多领域迅速提高了当前最佳水准,尤其是在目标检测及预测领域。这些技术在Waymo得到了广泛应用,”研究人员写道。“随着感知神经网络取得成功,我们自然而然地会问自己:我们可以利用纯监督深度学习方法训练出一个熟练的自动驾驶员吗?”

在模拟环境中,Waymo的智能体能绕过一辆停泊的车;在模拟环境中,Waymo的AI系统根据前方车辆位置减速停车。为了创建一个能够模拟专业驾驶的系统,他们精心设计了一个神经网络——ChauffeurNet,该网络通过观察真实和模拟数据(包括地图、周围目标、交通灯状态和汽车过去的运动)学会了生成驾驶轨迹。一个低级的控制器将十点轨迹转化为转向和加速指令,允许AI模型驾驶真实和模拟汽车。

该模型从“相当于专业驾驶60天的驾驶数据”中得到样本,其使用的技术确保了它不会根据过去的运动推断下一步动作,而是根据环境中的变化做出反应。在测试中,它会对交通控制标识做出反应,如停车标识和交通灯。但遇到以前从未见过的情况时,它的表现不佳。

以扰动形式合成数据,通过额外损失补充模仿损失

论文里指出,我们的目标是通过模仿学习来为自动驾驶训练可用于驾驶真实汽车的鲁棒策略。我们发现通常的行为复制不足以适应复杂的驾驶环境,即使已经使用了感知系统来预处理输入,以及使用控制器来将输出执行到汽车上3000万个案例仍然是不够的。我们在本研究中提出,应该以专业驾驶数据的扰动形式向学习器展示合成数据,这会产生有趣的情况,例如碰撞和/或离开道路。我们不是纯粹模仿所有数据,而是通过额外的损失补充模仿损失,以惩罚不良事件并鼓励进步,扰动为这些损失函数提供了重要信号,并实现了学习模型的鲁棒性。

模仿学习(Imitation Learning)背后的原理是通过隐含地给学习器关于这个世界的先验信息,就能执行、学习人类行为。在模仿学习任务重,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。

用完全的机器学习代替规划器,模拟异常情况

研究人员指出,造成从未遇到的问题反应不佳的原因在于其从现实驾驶中获得的驾驶demo是有偏差的——它们只包含正常情况(无事故)下的驾驶案例。为了教网络从边缘案例中恢复,该团队合成了接近事故和与物体发生碰撞的情况,后者鼓励AI模型避开这些物体。

ChauffeurNet在模拟环境中表现较好,它将损失和合成的示例都考虑在内,甚至还能绕过停泊的车辆,在信号灯由黄变红时停下以及在其轨道上修复些微的偏差。在现实世界的私人试车跑道驾驶Waymo的克莱斯勒Pacifica小型货车时,ChauffeurNet成功地驶过了弯道,并正确判别了停止信号和转弯。

“全自动驾驶系统需要具备处理现实世界种种状况的能力,”研究人员写道。“在Waymo车辆上运行的现有规划器将机器学习与外显推理相结合,连续不断地评估大量概率变量并在多种不同的情境下做出最佳驾驶决策……因此,用完全的机器学习系统替代Waymo规划器的门槛很高,尽管这一系统的组成也可以用在Waymo规划器内,或者用于在规划器的模拟测试期间创造更加实用的‘智慧智能体’”。

内部构成的功能更侧重于对下一时间步的预测

ChauffeurNet内部由两个部分组成——FeatureNet和AgentRNN。AgentRNN的输入包括一张展示过去智能体姿态的图像、一组由卷积网络FeatureNet从展示的输入中计算的特征、一张展示过去智能体框的图像、展示预测未来智能体姿态以预测智能体下一个姿态的外显记忆,以及俯视视角下的下一个智能体框。这些预测用于更新AgentRNN的输入,从而预测下一个时间步。结果表明,ChauffeurNet模型可以处理模拟中的复杂情况,我们还提供了控制变量实验,强调我们提出的每个变化的重要性,并表明模型可以对适当的因果因素进行响应。

随着AI越来越像人一样地学习,AI的智能将远远超过人类。人类无论是喜还是忧,都无法阻挡这种势头了。

改编自“机器之心”公号

编辑:李伶

责编:李念

武科大两教授获批全球首个“CAR-T治疗艾滋病”发明专利
宁波:以全球首个“保险型城市”为目标,如何助推长三角金融发展
人类历史上第一次!“嫦娥四号”预计后天发射,“直播”月球背面是不是外星人基地
从科学家到投资人,张首晟始终坚信:一个人一生的结晶,是对整个人类的贡献
文汇早读 | AI时代的大学之道:开门办学才能跟上社会
刘慈欣:如何应对人工智能挑战?祸福系于作出正确选择 。要警惕技术安乐窝,人类应去追求星辰大海
史上最强棋类AI降临!AlphaZero今天登上Science封面:一个算法“通杀”三大棋
体检进入AI时代?用创新科技“管”起你的健康
《世界中西医结合大会宣言》在沪发布:中西医结合,为构建人类健康共同体而奋斗
“嫦娥四号”奔向了月球的背面,将首次向人类揭示我们永远看不到的秘密
AI技术来袭,财务大佬都说颠覆比想象的更猛更快
AI染指药物设计了!这个学生靠AI摘取了多靶点药物分子设计国际挑战赛冠军
这个赛事让50万青少年走近无人机
透明的头,有耳朵的章鱼,自带斧头的鱼鳍……这些奇异生灵生活在地球上最深的地方
朱晓东故意杀人案上诉,高院今天开审检方建议维持原判
公祭日|日军逼来,谁守南京?竟无人做声!当年民国军政会究竟发生了啥?
呼吁就人类基因编辑准则达成国际共识,中美科学院院长今在《科学》联合发文
批了!新近发现的黑龙江珍稀古人类头骨化石研究获立项
留住人类“最后的机会”,两周的谈判后波兰气候大会终于达成共识
“海王”因垃圾向人类开战?是的,海洋中微塑料颗粒达银河星系数目500倍!
与熊同居28年后,她神秘死亡……这个伟大女人正对人类的残忍发出无言的控诉
国际空间站来了个AI陪宇航员,没想到它居然有了“小情绪”
上海自主智能无人系统科学中心今成立,将推动上海成为人工智能创新策源高地
AI时代国际博弈:数据和算法或说了算
32年后,《壮志凌云2》归来,只是无人机时代还需要阿汤哥吗?
全球首个细胞银行在上海浦东建设。你会把健康细胞存起来以备不时之需吗?
全球首批AI双层观光车今天在沪发车,刷脸上下车、司机多语言翻译技能GET!
©2014-2024 dbsqp.com