礼让三分,安全十分,严格遵守交通规则,共创和谐社会。GIV2022|香港中文大学王晓刚:超大模型赋能智能汽车,可以根据不同的情况采取相应的措施,下面将详细介绍GIV2022|香港中文大学王晓刚:超大模型赋能智能汽车,希望能帮到您,帮助您,就是我们服务的开始。
2022年12月16日-17日,由安徽省发展和改革委员会作为指导单位,合肥市人民政府、中国电动汽车百人会联合主办的“2022全球智能汽车产业峰会”在安徽合肥召开。本届论坛围绕“全球新变局与智能汽车发展新战略”主题,共设置5个主题论坛和2场闭门会议,与行业机构、高校院所和领先企业代表共同探索我国智能汽车发展新路径。
其中,在12月16日举办的“科学家论坛”上,香港中文大学电子与计算机工程学系教授王晓刚发表精彩致辞。以下内容为现场演讲实录:
各位专家,各位同仁,下午好!今天非常高兴有这样一个机会跟大家一起分享在人工智能领域我们在超大模型的一些新的进展,对于推动智能汽车产业发展带来一些新的价值。
新的时代智能驾驶、智能座舱、AI云三位一体提供的智能化的服务,对于推动智能汽车的进步是非常关键的要素。我们想在未来驾乘的体验能够得到质变的这样一个点就决定于我们的智能驾驶和智能座舱有一个深度的融合,无论是在硬件的成本、开发的效率,包括安全性,各个方面都有大的提升。
另外AI云也是一个非常关键的要素。我们知道在智能汽车时代,未来的智能城市对于L3、L4智能汽车的监管责任的界定离不开强大的云控平台,同时我们的AI云也可以为智能驾驶完成数据的闭环,通过在线不断的去更新模型,去提升自动驾驶整体的解决方案。
对于智能座舱的AI云是一个非常强大的智慧的大脑,通过提供智能的推荐,千人千面等等,使我们的智能座舱能够真正成为我们第三个生活空间。
三位一体的智能化服务它的实现离不开很多人工智能技术问题的解决。比如说在自动驾驶和智能座舱领域,我们需要解决一系列场景的长尾问题,所谓长尾问题就是,出现的频率很低,但是一旦出现带来的影响或者这些价值是非常高的。去解决这些长尾问题,使我们的智能汽车有更加通用的场景,另外包括怎么去建立数据闭环,当我们大量的数据从前端的汽车回流的时候,如何去低成本的、高效率的对它进行标注,如果光靠人进行标注的话,这是不可实现的。
同时我们怎么样去挖掘各种Hard Case提升我们的体验,包括自动驾驶的仿真,如何能够通过人工智能去生成这些内容,另外还有帮助更好的人机交互的体验。
为什么说超大模型的出现对于这些核心问题的解决能够带来很好的突破,就是因为它把人工智能的天花板得到了非常大的提升,使人工智能从传统的针对于单一任务的弱人工智能向更加通用化的强人工智能实现转变。
我们想在未来这里面我们的驾驶和座舱一定会在产品层面实现深度的融合,能够自动的去识别驾驶员他的状态、他的意图,更好的实现人机共驶。现在我们说驾驶和座舱都是在不同的芯片、不同的域控制器上实现的。不论英伟达、还是高通都出现了驾舱一体的芯片,将来两种功能是在同一颗芯片上实现,一个是大幅降低了我们硬件的成本,另外是基于统一的计算平台,使开发效率也有大幅度提升,而且能够更好的去提升安全性。
我们也看到了驾驶跟AI云这样一个结合,能够去驱动我们的智能汽车和智慧城市的加速度落地。我们在智慧城市里有很多智能相机,实际在智能汽车上也有大量的传感器,像未来智慧城市和智能汽车能够互为基础设施。我们在智慧城市的这些摄像头,大概几T的算力,我们看到智能汽车上算力要提升1—2个数量级,它的传感器的数量也有1—2个数量级的提升,如何更好的去利用我们这些前端传回来的感知数据的价值,这是未来一个非常重要的核心的点。
最近工信部也推出了智能网联车的准入和上路试点工作启动的通知,各地也陆续去出台一系列的法律法规,去界定L3、L4责任的边界,要实现这一点就非常关键,后面得有一个很强大的AI云控平台,能够去界定我们网联车L3、L4的车自动驾驶的责任边界在哪里,如果出现一些危机的情况他们怎么去处理这些车。在智慧交通我们看到铺设了大量的基础设施,怎么样去实现这些基础设施的功能,能够给各个部委和城市的管理能够带来核心的价值,也是依赖于驾驶和AI云有效的结合。
人工智能在过去十几年得到非常快速的发展。从2014年,人工智能第一次突破人类肉眼的识别率,突破了工业应用的红线。最近从2020年开始,超大模型得到了非常大的关注,OpenAI发布了GPT3,上千亿的参数对于自然语言的理解,之前我们说一个模型有几百万或者几千万的参数量已经是比较大了,当达到千亿规模的时候我们就发现这个模型发生了很多质变,精度得以大幅度提升,而且能够自动去匹配人类这种精度的各种自动标注,去解决各种传统问题,不但能够实现单一的任务,一个模型可以实现多任务的融合。
从NLP自然语言理解到视觉,视觉上要实现这些大模型更多的参数就更为困难,因为这里面需要占用更多的显存,里面包括这个通信,因为视觉的模型往往是非常大的,一个GPU甚至不能够撑下一个模型,所以这里面有一系列的挑战,到目前最大的视觉模型是超过300亿的参数。
随着时间的推移,我们人工智能、深度学习对于模型的参数量,包括它的算力其实是一个指数增长的趋势,我们还没有看到它放缓的趋势,而且也不断给我们带来各种各样的惊喜和突破。
在智能汽车领域,首先特斯拉就会建立人工智能的数据中心AIDC—Dojo,这里面有大量的存储去帮助他进行数据的回流,而且它构筑了当时自己大的数据视觉模型,10亿参数的视觉模型。另外也很重要,特斯拉也是开始有自己自研的芯片,为什么要有自己的自研芯片呢,就是因为为将来超大的模型、非常复杂的模型需要特制的这些芯片去解决它显存的问题、通讯的问题、同步的问题,能够实现各种数据得病行和模型的并行。
训练一个超大模型需要有复杂庞大的支持体系来支撑的,包括底层首先有一些硬件的基础,这些芯片需要用上千块的GPU进行训练,即便有的硬件的设施,你的训练框架也是需要进行深度的优化的,因为往往一个模型用一颗GPU、一台机器都不能完整的撑下的时候,上千块GPU怎么进行通讯各种同步,包括混合精度的优化等等一系列,在此基础也还涉及到各种关键技术的突破,比如说我们网络的结构。
几年以前我们的模型很小的时候,我们就可以不断去尝试,就是说这个模型效果不好的话换一个网络结构再去试下一次,但是今天我们要去训练一个超大模型,他所消耗的硬件的资源是非常巨大的,而且完成一次训练有时候需要一个月、两个月的时间,不允许我们做这样一些尝试,所以这里面各种技术,能够以非常小的代价能够找到最优的神经网络的结构,包括我们感知大模型训练的方法,包括我们怎么去实现数据的标准化,需要把各行各业的数据汇集起来,共同训练这样的超大模型,而且很多数据,因为数据规模已经非常大了,这些数据里面有很多的噪声,我们怎么样在这样噪声的基础上训练出来。有了这样的模型可以在很多行业和垂直领域去落地,有非常好的通用性。
举个例子,基于这样的超大模型,我们就能够在自动驾驶里面实现数据回流,车的终端会传来大量的数据,传来超大模型能够超过人标注的精度,只要非常少的人工干预,大部分工作用超大模型去标注这些数据,再用这些数据去训练真正部署在我们车端的那种小模型。
一旦我们遇到某些情况,比如自动驾驶也好、座舱也好,表现不好的时候找到这种Hard Case,怎么找到相关数据更新你的模型,在我们有庞大的数据库的时候,根据你想要的Hard Case的样本,找到这样的模型进行重新训练,所以对Hard Case的挖掘也是超大模型起到的非常关键的作用。
在自动驾驶里面我们可以看到各种奇形怪状的车、各种不同的路障包括人的各种行为。我们自动驾驶为什么能够应用到各种不同的场景,就取决于我们感知的模型它的通用性能不能解决这样一些长尾的问题。
这里面我们也做过这样的实验,发现如果用超大模型去做的话,我们把我们标注的效率有几百倍的提升,大幅降低他标注的成本。用大模型标注准确的程度能够去接近或者超过人的手动标注的水平。
另外我们也提到Hard Case的挖掘,在测试或者体验的过程中,发现有一些情况下我们的自动驾驶或者是车舱表现不好,就是因为有一些非常难的感知样本,一些不规则的姿态,我们拿到一个、两个样本怎么样从我的数据库当中自动去寻找几千个、上万个与之类似的样本,靠的就是我们基于超大模型困难样本的挖掘和自动标注的体系,把这些样本找到以后,我们就能够用这些困难样本重新去训练我们部署在车端的模型,有效改善它的性能。
另外,我们也看到最近这些大模型也具备了内容生成的能够,就是AIGC,通过各种方式能够去生成更加逼真的各种图像的内容,包括人、物、场,可以通过自然语言的描述,我们的模型就自然能够去生成各种2D的、3D的模型,也可以通过一些工具和手工的敢于去做,这些都会将来我们测试的这些仿真去提供非常丰富的测试数据,也是可以根据我们这些需要生成我们理想中的数据。
最近行业里面大家讨论非常多的,像ChatGPT,自然语言理解里面基于大模型的突破,基于ChatGPT聊天机器人我们就可以跟它进行开放式的对话,它可以生成代码、不同垂直领域的文档等等一系列,让人们看到通用的人工智能未来的可能性,给人机交互带来更多的希望。
当然,我们也可以看到,由于目前一个大模型的训练需要一个月、两个月的时间,基于它训练的数据都是过往的数据,如果再问ChatGPT新近发生的事情、甚至动态更新的知识,这些目前它也是没有办法很好的解决的,怎么去把这些ChatGPT他的大模型跟我们网络上一些动态实时更新的数据相结合去提升人机交互的体验,也是未来发展的一个方向。
总之,大模型未来还是有非常大的发展空间,不断去突破人类对人工智能认知的边界和天花板,相信未来会在感知、决策、仿真、人机互动各个方面给我们带来新的价值和体验。
谢谢!
(注:本文根据现场速记整理,未经演讲嘉宾审阅)
综上所述,以上就是关于GIV2022|香港中文大学王晓刚:超大模型赋能智能汽车的全部内容了,希望能够解决你的困惑。路援帮往后会继续推荐GIV2022|香港中文大学王晓刚:超大模型赋能智能汽车相关内容。