忠于品牌,精于技术

百度AI开发者大会的技术核心点是什么?

发布时间:2018-07-05 作者:十堰网站建设 浏览:

   百度AI开发者大会(Baidu Create 2017)是全球首个专注于AI开发者的盛会,现场有近5000名开发者和生态合作伙伴出席。在此次大会上,百度宣布开放Apollo和DuerOS 两大平台和60项核心AI能力。李彦宏、陆奇在现场发表了演讲。

  DuerOS 开放平台

  陆奇的开场演讲之后,百度度秘事业部总经理景鲲上台,宣布了DuerOS 开放平台的全面开放。

  “我们的目标就是要做Freestyle,让用户最自然地跟设备进行交互。”

  DuerOS 开放平台全面开放10大类别100多项原生技能,内容与服务丰富优质,汇集最广泛的生态合作伙伴:硬件厂商、芯片厂商、模组方案商、内容商、开发者……

  通过百度工程师罗兴的现场演示可以看到,依靠智能设备开放平台的便捷性,通过17行代码、仅用1分钟的时间,百度DuerOS 便成功接入搭载Alexa 的Anker 音箱,原本只会英文的音箱变得能够听懂中国话。(点击下方视频看看一分钟之内发生了什么~)

 

 

  景鲲表示,“目前很多公司都在做智能音箱,而百度通过打造AI时代的安卓——DuerOS,让每个人,无论你是大公司还是小公司,甚至普通开发者,都能够以低门槛打造属于自己的智能语音交互设备。”

  景鲲在百度开发者大会现场宣布:百度将全资收购KITT.AI,把KITT.AI 的技术融入到百度平台中,全面、免费、正式地向百度的合作伙伴赋能开放。

  KITT.AI专注语音唤醒和自然语音交互技术,是唯一一家获得亚马逊Alexa和微软Paul Allen投资的公司,并入选了CB Insights 人工智能创业一百强。

  有了这个开放平台,一个工程师舅舅借用DuerOS 智慧芯片让外甥的乐高玩具学会了说话:

  阿波罗开放平台

  今年4月,百度发布了阿波罗计划(点击可查看详情),宣布将成熟的自动驾驶技术进行分享。而这次在开发者大会上,陆奇直接发布了阿波罗开放平台,并对大家承诺了到2020年的开放计划。

  Apollo 详细开放计划

  百度今天正式对外开放的是Apollo 1.0。这是一个重要的里程碑。百度开放了封闭场地循迹自动驾驶能力、自定位能力和端到端等非常有价值的数据。更为重要的是,Apollo 会快速地开放越来越多的能力,每周都会更新,每两个月左右都有新的版本和总体能力的提升。

  接下来百度Apollo 的具体计划是:

  到今年9月份,Apollo 将会开放固定车道自动驾驶能力和开放部分仿真数据;

  到今年年底,Apollo 将开放一系列的能力,使车辆能够在简单城市路况下,完成自动驾驶任务,同时会开放更多的仿真数据及数据上传的接口;

  2018-2020年,Apollo 会持续开放,加速创新速度,直到最后实现完全自动无人驾驶。

  有了阿波罗计划和阿波罗团队的技术支持, 国外开发者Joshua Whitley 仅用了三天时间,就把自己的车改装成了自动驾驶的循迹车:

  李彦宏:AI 时代,开发者迎来了真正改变世界的新机遇

  乘坐自动驾驶汽车由百度大厦到达国家会议中心之后,李彦宏在现场做了今天大会的主题演讲:

  PC 互联网时代的开发者,都有点像西部牛仔里面的孤胆英雄,一个人几条枪就可以震惊世界。

  移动时代,开发者群体被埋没了。

  AI 时代,开发者迎来了真正改变世界的新机遇,但另一方面,PC 互联网时代那样的个人英雄主义不再可行。不是现在开发者的技术能力不及从前,而是AI技术,是算法和数据两轮驱动的,没有人可以通过一己之力,完成一套语音、图像、自动驾驶等的研发。人工智能对数据的天然需求,决定了AI 的开发者一定要形成协作的生态,通过开放的数据、共享的代码、以及群体协作的精神,让AI技术的能力越来越强,应用的前景越来越广阔。

  古人因为空间阻隔,不能相互沟通,不能共享成果、推动应用,而不得不一遍又一遍的重新发明轮子。如果在AI时代,我们还是去封闭地造着别人早已造出来的轮子,甚至因为看到了别人在做新技术,自己就再去做一遍,那一定会被时代淘汰。在更加依赖协作和共享的AI 时代,单兵作战、重复发明轮子也跟不上技术发展的进程。

  AI 不仅是互联网发展的下一幕,也是通往未来的必由之路,而开放则能让所有人都收获更多,让所有人都能到达梦想的彼岸。怎样能让所有人都收获更多?那就是我们以最开放的态度,把我们的最核心技术能力共享出来。

百度AI开发者大会(华想科技).jpg

  一路惊喜着看完了上午的主论坛,点击下方视频,先跟着镜头逛逛会场,下午六大分论坛的精彩内容就在视频之后~

  精彩纷呈的六大分论坛

  下午的六个不同主题的分论坛同样精彩,它们分别是:

  聚焦AI基础技术

  主题:开放创新 共襄AI未来

  对话式操作系统

  主题:智语世界 创领未来

  智能驾驶

  主题:星罗云布 共享Apollo

  智能云

  主题:智能计算 智慧共享

  Web生态

  主题:共襄Web繁荣

  数据中心技术

  主题:超凡动力 赋能AI

  01、聚焦AI基础技术

  此次,百度多年打造的完整AI技术平台将全面开放。

  百度的AI能力分为4层:在基础层,是AI算法、大数据、大计算能力。感知层,包括语音、图像、视频、AR/VR等技术。认知层,有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度AI开放平台ai.baidu.com开放,与开发者共享。开放的技术能力总共有60个,是最全面的AI技术开放平台。

  语音技术+自然语言处理可以让机器听清、听懂、满足用户需求,视频分析、人脸识别和增强现实技术让机器“看懂世界”,除了发布新开放的核心技术能力,百度杰出科学家徐伟批露了PaddlePaddle 的发展路径,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个深度学习开放平台,PaddlePaddle将与开发者一起繁荣AI生态,引领行业发展。

  02、对话式操作系统

  ┇“唤醒万物”的核心三要素:

  “听清、听懂、满足”

  听清:在AI时代,我们希望把语音放到真正的场景里面,麦克风阵列、回声消除、语音唤醒等,都是我们逐渐推进的世界先进技术,将被放到各种场景中实现用户听清的需求;

  听懂:数据多、技术深是打造对话系统的必然条件,百度是具备数据量最大的公司,我们有百亿的支持、十亿的图谱。在AI时代,要做到听懂用户,实时图谱数据的力量将是一个非常重要的支撑;

  满足:听懂并满足“听一首歌”这样的用户需求还不够,真正用户想要的是复杂得多的需求,比如“电影《爱乐之城》里女主角第一次和男主角跳舞得歌曲是什么”,只有把用户在真实场景中表达的复杂请求做好,才能真正满足用户自由的表达、满足他们的需求。

  ▲ 沉浸式体验DuerOS

  DuerOS 将为开发者提供最容易上手的软硬件一体化方案,包括多样化的开发套件和完全开放的参考设计:

  1、搭载树莓派的个人版。即刻申请就可以搭载一个个人可以对话的语音设备。

  2、轻量版。把一元钱大小的芯片放在任何一个设备里面,设备就可以对话。

  3、标准版。两麦、四麦、八麦的标准版都可以即刻申请。

  4、一体化完整设计的参考设计。如开放的链路设计、开放的音响设计等等。

  03、智能驾驶

  Apollo 开放平台完整的技术架构包括软件平台、云端服务平台、参考硬件平台、参考车辆平台四大部分,通过四层架构全方位构建能够实际运行的自动驾驶系统,并将通过开放代码、开放能力和开放数据三种形式逐步赋能开发者及生态合作伙伴。

  ┇Apollo 的核心技术平台

  一、中间是软件平台。Apollo 开放了一系列重要模块,重点是以下四大模块。

  1、自定位模块:使用百度业内领先的高精地图,加上多种传感器融合,让每一辆车都可以低成本、全天候地精准定位。

  2、感知模块:感知是当前自动驾驶工业创新的重点,运用顶尖的人工智能技术能看清和看懂路况,包括每一个障碍物、行人、车辆。

  3、车辆规划控制:Apollo 模型运用AI和大数据,采取最安全的驾驶策略做到精确的车辆控制,也能适应不同国家的交通路况。

  4、运行框架:这是Apollo 的基石。核心是安全、可靠、实时控制,并能同时支持Intel和NVIDIA的芯片。

  二、上面是服务平台。Apollo 一系列重要的开放能力都汇聚于此。重点包括:

  1、高精地图服务,这是自动驾驶的千里眼。

  2、仿真引擎。百度在快速累积海量的数据,能让开发者日行百万公里。

  3、安全服务。百度将给开发者持续提供高度的安全服务。

  4、DuerOS 服务:为每一辆车提供智能化的车内体验。

  三、参考硬件平台和参考车辆平台。

  Apollo 硬件平台支持从CPU 到GPU 到FPGA 各种计算硬件,也支持从GPS、IMU、摄像头,到激光雷达等各种传感器。同时,Apollo 提供的黑盒子能够记录和保存所有的数据信号,使得合作伙伴可以更安全、有效地预防和处理车辆事故。

  目前Apollo 生态合作伙伴联盟已辐射OEM、Tier1、地图公司、芯片公司、基金投资、个人开发者、创业公司、研究机构及政府机构等,成为全球涵盖产业最为丰富、最为全面的自动驾驶生态。

  04、智能云

  百度云作为A(人工智能)B(大数据)C(云计算)三位一体的智能开发平台,具有更易学、易用、易推广的特性。通过几次简单的鼠标点击,开发者即可在百度云上快速创建属于自己的深度学习实验室。

  会上,百度推出针对于AI开发者的扶持计划:“AI Star计划”,该计划总价值1亿元人民币。通过百度云计算资源及生态资源支持等多方面的支持,促进AI开发者快速场景化应用。其中计算资源直接支持1万个AI开发者(单个礼包价值5000元),通过百度双创中心、百度资本、百度风投等AI创新项目扶持资金5000万,3年内通过百度云智学院、百度技术学院为全球培养10万名AI工程师人才。

  目前,百度云的8+ 智能服务、20+ AI服务接口,以及百度大脑能力已经向开发者全面开放。

  大数据平台、深度学习平台、数据采集和标注平台、百度效率云平台、百度MTC云测平台,这五大平台也将持续为AI 开发者输出更多的技术支持。

  05、Web生态

  在移动互联网时代,用户开始习惯通过一个一个独立的APP去解决自己遇到的问题,但APP也存在诸如占用空间大、下载使用成本高等问题。基于此,谷歌、百度等搜索引擎开始积极推进PWA(Progressive Web App),希望可以让用户在Web生态里获得更加简单便捷并且不逊于APP的体验。

  为了更好地帮助开发者去搭建PWA应用,百度在此次开发者大会Web 分论坛上正式发布了Lavas 解决方案,这是一个基于Vue的PWA 解决方案,包括工具、文档,以及对应的解决方案和建站模版。Lavas 是一个开源的解决方案,百度希望国内的开发者也能多多参与到这个项目中,共同建设和改善国内的Web App生态。

  06、数据中心技术

  会上,百度系统部高级总监刘超首先发布了百度最新的XDN计划,将覆盖全球的接入网络赋予更强大的计算能力,对图像识别加速、语音识别加速、无人车等 AI 应用提供更好的支持,进一步提升了用户体验。他表示百度基础网络通过25G服务器接入部署、GPU 100G+RDMA 方案等一系列技术升级,将数据中心单集群规模提升到5万台服务器以上,从而促进人工智能和大数据应用的快速迭代。

  ▲ 百度X-Man2.0 GPU Box服务器

  现场发布的另一款产品是百度最新的研发成果——百度定制FPGA和X-Man2.0 GPU Box服务器。定制FPGA 实现10倍性能提升和超大规模部署;X-Man2.0支持液冷设计散热效能提升45%,NVLink2.0带宽提升1倍,CPU和GPU 硬件解耦按需动态配比。

  百度希望通过这次大会,能为所有的开发者提供更便捷开放的平台,能让大家不受数据限制、“不重复造车轮”,充分发挥自己的能力和想象力为AI时代助力。正如李彦宏所说,这是开发者的黄金岁月,开放能创造最好的时代。