余凯豪言:进入深度学习时代,百度可以比Google、非死book做得更好

jopen 9年前

原文  http://www.36kr.com/p/218924.html

余凯豪言:进入深度学习时代,百度可以比Google、非死book做得更好

刚刚结束的极客公园上,百度深度学习研究员常务副院长余凯分享了深度学习技术为百度的技术和产品带来的变化。今天的未来论坛中,余凯又向 36氪 介绍了近期百度在AI和智能硬件领域的研究进展。

深度学习:百度可以比Google、非死book做得更好

过去两年里,百度在深度学习领域做了很多事情。百度大脑已经取得了相当的进展,它无时无刻不在学习、演进和进化,具有相当强的工程能力。在两个月 前我给大家介绍的时候说我们用百亿级参数构建了世界上最大的深度学习网络。今天,这个数据已经是千亿级。在此基础上我们可以做很多很多事情。

百度在搜索、广告投放、图象识别、语音识别,这些领域,都有相当的进展。

在广告投放这个领域,整个百度的凤巢广告系统已经进入深度学习的时代,广告点击率提升非常显著,具体的数字是商业秘密我不能讲,但是百分比两位数的提升,所以这对公司的营收产生了巨大贡献。

在过去几年里面,技术的发展经历了一个从量变到质变的过程。以图像分类为例,2010年的时候世界最好的成绩也并不理想,随着深度学习的发展,每年都在以很快的速度演进。

2014年底百度做到了5.9%的错误率,这是世界上最高的图象识别准确率。去年我们在物体检测上面的单个模型实验结果显示,百度是最好的,Google是第二。

在语音这块,百度语音搜索在两年时间识别率提升了很多。现在移动搜索产品中10%的搜索需求来自语音搜索,增速也很快。

我们还推出了“百度翻译”。你可以在纽约街头说句中文,马上语音识别翻译成中文文字,最后自动翻译成英文。还可以自动拍照——比如外国人来上海看到中文菜单,拍照识别成英文。

在人脸识别技术方面,去年非死book人工智能实验室宣布他们做到世界上最好的成果,准确率是97.35%。前几天,我在百度的同事取得了一个更激动人心的进展,人脸识别准确率达到99.62%。

斯坦福大学的科研人员最近用人做了一个测试,人在这个数据上达到的是99.2%。当然,必须澄清, 在一个数据极上,机器的算法做到了人的水平,但整体来讲机器比人还是有非常大差距的

Baidu Car:我们想用更好的算法和能负担的零件来完成这件事情

与Google的无人驾驶不同 ,我们认可的是人车一体化的自动驾驶。这个过程会分为几个阶段。 第一阶段是辅助安全;第二阶段是主动安全;第三阶段是特定场景下的自动驾驶 ,比如大型物流中心中的重复驾驶,高速公路上的自适应巡航;然后是高度的自动化。

我们的成本也不会像Google那么高,它们的感应器很贵。我们想用更好的算法和能负担的零件来完成这件事情。我们在车里做了仿真系统,利用深度学习开发图象识别技术,用低成本完成这个任务。

具体的落地上来看, 我们先要具备建立高精度地图的能力 ,这其实是一个基础建设。我们要做到10-20厘米量级的精度,这样的数据就会很有价值。如果能做到这样,就能提供更精准的导航。可以预见,在后面的 1-2年时间里,整个导航系统会发生翻天覆地的变化。比如说在上立交桥的时候,有的时候前面面临3-5个分杈口,看二维地图很难找准方向。而我们对车的定 位要到车道级别,这样就能更精准地导航。

Baidu Eye:今年会有令人兴奋的进展

Baidu Eye的迭代很快,与 上次向 36氪 介绍的情况 相比,已经有很大的进展。它更像是跟着你的机器人,不光定位,还能知道佩戴者在关注什么,在此基础上拓展你的信息空间。比如在博物馆的场景下,当你看到一 幅油画,它就能告诉你有关这个油画的作者、风格、历史背景等信息。电脑到手机是一次跨越,从手机到眼镜会是又一次非常重要的跨越。百度正在做一些超前的思 考和尝试,今年Baidu Eye会有令人兴奋的进展。当然,还是会在垂直领域。

[ 36氪 原创文章,作者: 厨子与剑客]