中国工程院院士、中国人工智能学会理事长
2017-09-12 16:34:44 来源:本站原创字号:大 中 小
中国工程院院士、中国人工智能学会理事长 李德毅
无人驾驶目前是很火热的话题,火的人人都在讲,我今天的演讲题目是无人驾驶难在拟人,我把题目说的更准确一点,就是对SIE3016标准的质疑,什么叫L3,什么叫L4,什么叫L5,还是有挑战的。
什么叫做无人驾驶,我们的视野大有不同。我们一直把无人驾驶的重点放在人身上,而不是自动化的车。这需要跨界,否则掉在自动化坑里面总是出不来。人工智能不像原子弹那样惊天动地,它是默默无声的,一旦发生改变之后,会很厉害。我有句话,人工智能用它的柔软改变了整个世界,女性是柔软的,男性是阳刚的,柔软不等于没有力量。
最早,无人驾驶这个说法,大家想把驾驶替代掉,后来发现这个词不太合适,因为车里还有人,那车上的乘员算不算人,那个要干预怎么办?现在Google正在研究,现在都有这个词,Self-Driving,就是自驾驶,这个就是字面理解的不同,就是车子自己开自己跑,把最后一公里解决了,就是自主体,人工智能把以前的辅助驾驶,辅助驾驶责任人就是人,其他都是帮忙的。什么叫做自动驾驶,那就是车子自己开,车子要拿到驾照,不能有驾驶员坐里面,驾驶员坐里面怎么叫自动驾驶?
所以我们搞人工智能Autonomous Driving,就是自主驾驶,就是一个认识主体,这个不是其他人,不是机器人。这个人干预为主体,所以自主跟人工智能有一个认识。我们以前有一个智能干预,就是智能体,人是一个机器人,我们要把这几个词稍微搞好一点,我感觉很振奋。但是后来又出了一个词叫做智能网联,最后的定义是汽车,怎么把车子丢掉了,到底是智能网联车还是智能网联?讲车却把主体丢掉了。所以,要理清楚,智能网联到底是不是车。
我们看起来很类似,但是技术上很不同。如果大家都讲概念,大家知道飞机是自动驾驶的,飞行员现在很轻松了,经常把报纸盖在脸上,因为是自动化的状态,尤其平飞的时候是自动驾驶。波音说了,2025年人工智能取代飞行员,但是大多数受访者对安全心存疑虑。尽管降价10%,但是也不会坐。我想我是一个乘客,我坐不坐这样的无人驾驶飞机,L3、L4都画了一个大饼,辅助驾驶、有条件自动驾驶,全自动驾驶,我就想所谓的智能驾驶技巧越来越高,无人飞机坐不坐?我不坐,你在天上翻跟头我不关心,我只关心平安送达就可以了。所以L3、L4对我没有吸引力。
当你飞机遇到情况能不能帮我降下来,或者能不能把我送下来,要是不能我为什么坐你飞机,所以我们站在老百姓的角度想,你是特飞没有用,必须拿到驾照,真的不行要紧急迫降,紧急迫降的本领没有,再多的特殊驾驶模式也没有用。
所以,要做L3、L4的企业想想老百姓的需求,如果不能保证安全,再多的自动驾驶模式我都不感兴趣,这是我的底线。
因此,我们学术界现在遇到一个问题,无人驾驶的认知如何度量,是不是按照那些自动化的讲L3、L4,我认为不是的。“人工智能之父”讲,无人驾驶的认知相当于人一样开,如果机器人能够跟我对话,我在短时间内区分不了人还是机器人,那就是OK的,就是人工智能。用这个关联来看,2014年聊天机器人尤金•古斯特曼曾经引起轰动,现在聊天机器人已经很普遍了。
我们还有Kurzweil,他说我做了一个诗词生成器,这个就是按照图灵来了。基于驾驶的图灵测试是什么样的,我们能不能这样看看,分辨不出哪一个是机器哪一个是人的驾驶行为,那就是智能驾驶。
现在说要做每辆车开一百万公里才能为这个车拿到驾照,这会那个到什么时候?我们应该走到最基本的问题上来,计算机之父是图灵,人工智能之父也是图灵,我们应该回到这上面来,我的报告就是怎么跟车子发驾照。
L3说驾驶权要交给机器,L2是辅助驾照,交通部门要发驾照,这个怎么发是我们关心的。我们看看3010标准,我们对于3010标准提出质疑了。3010自动驾驶越来越大就变成全自动,科学问题就是这句话,甚至很大的时候就叫全自动,我的回答是不对。我在会上讲过,L3讲的是什么,人工驾驶员完成所有的工作,只不过汽车做了点预警,驾驶权在人,驾驶员可以不操心,偶尔接受一下请求干预就可以了,所以L3是要拿到驾照的,L4、L5就是高级特飞一样,所以我觉得3010标准出了问题,我不知道在座有没有参加制订的,3010标准要是出了问题就麻烦了,全世界就麻烦了。L0就是仅仅警告,L1把手放在上面脚可以离开,左脚可以放开,右脚还可以踩刹车。L3眼睛不要了,可以不关注驾驶权,所以特斯拉发生事故说我是L2,这样不行。
L3 Mind off,根本不用想驾驶的事情,就是听歌、打电话、开会。这样一来,系统怎么掌权呢?因此我们人工智能的基本问题,就是自动驾驶汽车怎么发驾照,跑多少圈才可以发驾照,这是最基本的问题。
当前在汽车行业,声音比较高的是这样一个共识:结构化道路、确定性窗口,网络协同,智能网联。很多推崇智能网联的人,都希望用网络弥补驾驶,这点要小心,这里有很多坑,自动驾驶+智能网联,走这条路最好就是高铁、地铁、飞机都是自动驾驶,最重要的是调度。
L3取得驾照是社会的自动驾驶要求的底线,我们想一下自己拿驾照的时候,你是多么的忐忑不安,大巴在你面前开车你很紧张,人怎么提高驾驶水平?真正提高水平是拿到驾照的三五年,那个时候应对了很多情况。我们希望给自动驾驶拿到驾照,美国宣布了自动驾驶试验,在试验当中改。
我们再来看看3010标准毛病出在哪了?第一自动驾驶等级展缓点如何度量?你说L3 PLUS,这个不就是新闻游戏吗。掌控权交界点如何度量,交接过程当中的事故怎么处理,自动驾驶呼叫能干预,但是人睡着了,这是不行的。所以对于3010做的质疑也是可以的,归根到底让车拿到底线,而不是开的非常完美了,和人一样。
最糟糕的是,有些自动驾驶使得我们开车的时候不需要那么注意了,越是信任自动驾驶,越容易造成注意力不集中,因此不能释放驾驶员认知的所有自动,都不能称之为自动驾驶。到底事故当中责任是车的还是人的,这个界定不清楚是不会发驾照的。
只有L2和L3,一个是辅助驾驶,一个是自动驾驶,自动驾驶应该拿到驾照,这个是好度量的,L3和L4和L5更难度量,今天雾霾不能开,明天海啸不能开,所以我的报告质疑3010怎么把事情做好。
没有驾照的车老百姓不敢乘坐,我们当时搞移动生活,让汽车无人驾驶就是解决汽车代步问题,人类就是一个移动生活,在移动生活当中享受品质,把驾驶这件事交给机器做,如果一天关心这些问题,那还不如开车,开车还有乐趣在里面。
泊车这件事情2005年有了City Park System,这个比较正常,会开车的人不一定会泊车,把泊车解决了也不错,多花几万块钱买了一个泊车系统,结果我的泊车系统提高了,它的泊车系统没有提高,这个就成为一个噱头,买的时候冲动买了,结果超过三分钟就说请转入人工泊车。有人跟我讲,先把自动泊车做好,不把自动泊车做好,自动驾驶就做不好。我最近有一个观点,把最后一公里当成最新一公里解决,我们先把泊车解决。
无人驾驶的挑战和量产,实际是应对自动驾驶车的挑战,现在号称拿到驾照已经很多了,2017年底我们看看哪个拿到驾照。我认为要拿到驾照不是靠自动化,是靠人工智能,靠对意外情况的处置,不是靠自动化程度有多高。如果路上没有自学习能力,不叫做智能车,顶多叫自动化的汽车。我们看看IG多难,就是讲的这种情况,是汽车人工智能常常遇到偶发的,常常是大概率,偶发是小概率,你碰到一次是必然,什么情况呢?大雾天、大雨天、大雪天,狭小道路、崎岖道路、傍山险路、积水、涉水、冰雪等等。第一是天气条件,第二是道路条件,第三是人文条件,能处理这样的事情才叫做人工智能,如果无人驾驶处理不了,就不能够拿到驾照。有经验的驾驶员能够灵活处置。自动驾驶如何处理?
各位不要研究特技的动作,先把这个问题解决了。如果一旦设置窗口条件,就是地理栅栏、气候栅栏、以及人文道路的栅栏会更危险。
L3是解决车的问题还是解决人的问题,如果解决车就把车做的越来越好,我认为解决人的问题,把驾驶员认知用机器人替代是有记忆决策和行为能力的认知主体,有技巧有个性。
所以我有一点感叹,汽车是从马车演变而来,作为动力工具,有时候不如马车,老马识途。自动驾驶过程中,驾驶员与环境周边车辆的交互认知哪里去了,驾驶员的经验和临场处置能力由谁来替代?
以超车换道为例,这对驾驶员来说是最简单的情况。白色车是一个无人驾驶车,红色是有人的,看到3号车挡住路,生成超车并路的动机,一看那个路权比较大,把方向盘转一转,这个时候小心了,后面的车离的很近,比较霸道,踩了一下油门,这时候怎么办,如果比较礼貌刹车就过去了。
第二种情况,超车过程中由于1号车加速,中途放弃换道,原来的一次规划做了二次规划回来了,换了半天还是在后面。所以,超车换道这样一个小事情,也有很多种不确定的情况。于是我们得到一个重要的结论,自动驾驶好在专注不会疲劳,自动驾驶难在拟人不仅在车。
人类第一杀手出在驾驶员,所以要针对于此把重点放在人上。我们的记忆认知、计算认知、交互认知应该不同于雷达传感器,驾驶脑的概念最接近。
驾驶脑自主应对驾驶过程中常常遇到偶发的各种各样的不确定性情况,这才是人工智能。这个盒子利用微电子技术,目前已完成1.0版本,我们提出来一大一小两高两低,大接口小尺寸,可利用微电子技术,最后把能力发挥起来就可以。如果用了特定场景雷达就可以少一点,如果在熙熙攘攘的生活区就要高一点,接口要大,功耗要低、性能要高,最难的是低成本。
我们比任何时候更需要研究驾驶员,学习驾驶员,分析驾驶员行为大数据、构建驾驶员的智能代理。我们看了那么多美国、欧盟的经验,我们中国人也要抱团取暖,在世界大创新过程当中有一席之地,L3、L4也不是我们国家的标准。
我们把周边感知分几个颜色,红颜色代表雷达,蓝色代表摄像头,黄色代表传感器。没有这些车辆就控制不好了,左边的太阳大,右面的太阳小说明车装偏了,这三个传感器还不够,四个颜色的传感器构成一百多个传感器,现在Google做的是感知生物学,我们做的是认知生物学。驾驶态势图是认知的,我头脑里做路径规划,我正在准备一个报告,对于SLAM的理解,如果不能做到对于地图的理解肯定就是门外汉。
我是一个二维的,感知是二维的,把三维变成二维,大数据缩水很多。人控制车就是控制线控或者数控的汽车,这样再认知再执行,所以我做的是驾驶脑,构成一个感觉记忆和不同记忆里面的相互的定位。把你驾驶经验融合在小脑里面,把技巧接口,完成感知认知和行动,再感知再认知再行动,这就是我们的驾驶网。
驾驶脑的关键是驾驶认知的形式化,是将感知大数据的缩水,并迁移认知系列。我们的创新是拿驾照,不仅能学习,还能提升技能,地图无法替代。
自动驾驶替代不了智能驾驶,只能在专用道上开,不像现在讲的无人驾驶。把人在回路中的自主驾驶让车场去模拟是难以承受之重,把机器驾驶脑的研发让车厂去做,是难以承受之重。
传统汽车仅仅是驾驶员手、脚和力量的延伸,控制车辆行为的是人,在我们看来,方向盘是一个非常好的界面,让我们成为力量延伸器。线控汽车装备了传感器之后,用驾驶脑替代驾驶员认知,并获得驾驶员的驾驶技巧,让机器彻底自己,这应该是人工智能时代最有意义的问题之一。
不同的驾驶脑认知水平可以有差异,驾驶脑有个性,有在线学习能力。
非结构化道路、不确定边界、自主交互、数据交换不是自主定义的汽车。人类发明了自动驾驶之后,有人驾驶和无人驾驶混合驾驶时间至少需要75年。所以,大数据开车不要把全球所有的道路都压在一辆车型上,不必把人类所有驾驶员的认知都浓缩在一个特定驾驶脑上,这样我们就有管控空间了。园区观光、厂区通勤、社区巡逻、城际高速最后一公里,定点物流、校车、市区定点接驳、快速公交。
这些场景下,自动驾驶汽车能否期待驾驶员掌控,取决于能否处置特定场景下的意外情况,能否发出求助信息要求人工干预,或者在迫不得已的时候做出最小损失的决策。自动驾驶实在不行,一个求助电话人就把它拖走了。
另外,无人泊车是绕不过去的,要当做最后一公里来做,这才是接地气的路线。汽车成为大数据的源泉,移动社会的传感器,驾驶脑有学习和自学习的能力。我已经在北京注册两个商标,一个是驾驶脑,一个是驾驶超脑。一旦量产自驾车上路,占比越来越大,驾驶脑就成为汽车必配。加之智能网联崛起,驾驶数据智能化程度越来越高,L3多了,L4也就多了,因此人们对于L3、L4、L5不那么介意了。
人工智能以润物无声的柔软,改变着整个世界。