19 岁的科大讯飞,想用 AI 打开新世界的大门

摘要:按一个人的年龄计算,19 岁意味着刚刚成年,即将感受社会万千,但从企业发展时间来看,已经 19 岁的科大讯飞无疑已经经历了太多风云变化,这家市值超过 700 亿元的中国公司,在科技领域算是久经沙场。

按一个人的年龄计算,19 岁意味着刚刚成年,即将感受社会万千,但从企业发展时间来看,已经 19 岁的科大讯飞无疑已经经历了太多风云变化,这家市值超过 700 亿元的中国公司,在科技领域算是久经沙场。

从智能语音技术起步,开发智能语音平台,建立中文语音交互技术标准,科大讯飞在人工智能领域逐渐成为领军者,而伴随在消费端的产品持续输出,讯飞输入法、讯飞翻译机等则让越来越多人看到了中国科技企业在人工智能领域的跃进。

今年 5 月,曾任职微软亚洲研究院首席研究员、副院长、微软公司合伙人的李世鹏加入科大讯飞,担任科大讯飞副总裁、讯飞 AI 研究院联席院长,在业内引起不小轰动。

李世鹏于 1995 年正式进入微软,2015 年出任硬蛋科技 CTO,其主要研究领域是信号与图像处理、图像与视频编码、应用层网络技术、数字版权管理及无线通信与网络等,这些领域与人工智能技术存在很多分叉,伴随李世鹏的加入,科大讯飞的未来之路无疑引起外界更多好奇。

7 月 21 日,在极客公园 Rebuild 2018 科技商业峰会现场,李世鹏教授通过演讲和我们分享了科大讯飞将如今通过人工智能技术进一步影响不同行业,以及科大讯飞的人工智能未来会迈向何方。

以下内容来自李世鹏教授在 Rebuild 2018 科技商业峰会的演讲分享(极客公园经过编辑整理,略有删节):

从感知智迈向认知智能

我们知道人工智能有两个途径,一是现在大家习以为常,通过深度学习和大数据的方式来研究人工智能。这种方法现在是 99% 以上的公司都在做的,确实在很多领域能帮助我们提高生产效率。

但这个方法最大的瓶颈就是数据,能不能有更聪明的人工智能最后取决于能不能更有效的获得一些被标注的数据。如果你用更多的数据就能让人工智能做更多的事情。如果大家到深圳或者其他传统的生产线去看,很多生产线改成了数据标注线,很多工人在那儿标注数据。从另外一个层面反映现在大部分人工智能还是一个「人工」。

19 岁的科大讯飞,想用 AI 打开新世界的大门

另外一条路,就是对人脑的认知。通过对人脑的研究去找到一些新方法。现在有一个理论,就是通过小数据构建大模型。假如你给某人看一个杯子,他看几次就知道,下次再看到尽管不是同样形状的但这还是一个杯子。

因为人的认知不单是形状,还从功能上去认识这个杯子。怎样在人脑认知种发现人工智能一些新的认识?这是很好的研究课题,也是科大讯飞联合很多世界顶尖学校比如 MIT 等在做的事情。

现在大部分人工智能还停留在感知智能阶段。感知智能包括语音识别,就包括翻译、人脸识别等,但真正对内容的理解没有那么深。而更高一级,认知智能是更高层次的对内容的认识,这是真正人工智能的必经之路

19 岁的科大讯飞,想用 AI 打开新世界的大门

认知就是尝试理解,在 2017 年 10 月份科大讯飞参加了斯坦福大学发起的阅读理解测试,是当时的世界纪录保持者,经过这段时间进展,很多其他研究单位也赶上来了,但是我们现在还是世界上三个在阅读理解能力超过人的阅读能力的公司之一。

第二,用机器人或人工智能来对论文、作文进行评估。我们目前对中文的作文和英文的作文,都进行了很有效的评估。这一系统已经在江苏大学的入学考试中投入使用。除了更准确之外,它还比人更有一致性,这一点很重要。

过去我们通过图灵测试测试机器的认知程度,现在很多机器都可以达到这样的水平,所以就有了改进版的测试方式 Winograd Schema Challenge,它从一些常识性的知识推理来看机器是否达到了认知。

19 岁的科大讯飞,想用 AI 打开新世界的大门

比如说「爸爸没法举起儿子,因为他很重」这个问题,这里面在问谁重?我们人回答很简单,就是通过直觉肯定儿子重,所以爸爸举不起来。但机器来回答这个问题可能就没有那么容易了,因为他没有这个常识和直觉。常识性问题,是人工智能领域研究的热门课题。如果这个方面有突破的话,我相信人的认知方面就有很大的进展。

从语音向综合场景扩展

我们去年展示了语音合成声音的成果,今年又有一些进展。我们可以以任何人的口气讲任何的话,甚至是任何的语音。这听上去有点可怕,但是我们可以为人做更好的服务。比如你可以用父母的声音给小孩讲故事,或者用已经不在的老人的声音给孩子讲话,这都是有价值的应用。

2015 年,科大讯飞的机器识别速度超过了人类的速记员,今天看到后面还有速记员,如果用科大讯飞的语音识别技术的话一,很多繁杂的工作就不需要了。这是人工智能在速记上已经产生的影响。

19 岁的科大讯飞,想用 AI 打开新世界的大门

方言识别方面,科大讯飞现在能识别至少 22 种方言,这是很有用的。比如今天在成都,其实四川话的识别就和标准普通话的识别完全不同。我们可以做到用标准的四川话来讲,如果大家用科大讯飞的语音输入法就知道这项技术的方便。

讯飞翻译机和讯飞听见解决的是不同场景下的翻译问题。讯飞翻译机 2.0 上市以来就处于供不应求的状态,最近也刚刚被总理自掏腰包购买,成为国礼。这些都是我们的网红产品。但我们不单自己用自己的技术。我们也把这套技术完全开放给合作伙伴,就是 AIUI 开发系统。

截至 2018 年 6 月 30 日,讯飞开放平台开发者团队数 88 万,覆盖终端数 19 亿,日均交互服务 46 亿次,AI 大学学员 22 万。

我们还把 AI 技术应用到了医疗领域,包括医疗影像。科大讯飞不再是一个只是在语音方面有专长的公司,在视觉也有很大的进展。在去年,我们成为中国第一个通过医考的机器人,拿到 456 分的成绩,超过了 95% 的考生。利用这套技术和相关的一些数据,我们在做中国首家人工智能医院,去帮助医生提高诊断准确率。

人工智能也在改变教育领域。从古到今大家熟悉的教育方式都是一个老师在讲课,下面的学生都在听,人工智能可以做到精准教学、个性化学习。因为通过试卷和作业的分析,AI 能清楚的知道每个学生的知识薄弱点。教师通过这种数据可以进行有效的精准教学。在布置作业的时候就可以针对性出题。提高效率的同时,也省出时间去做课外兴趣,这是对人类教育的重大的突破。

人跟机器怎样进行有效的和谐交互,是我们研究的重要课题。AI 目前还是辅助人产生效率的,但我们希望人的介入会进一步加强机器的迭代,用人工智能建设美好世界,我们现在才刚刚迈出了一小步。

来自: http://www.geekpark.net/news/231302

扩展阅读

百度CEO李彦宏:AI时代开放推动技术进步
刘庆峰:今年AI将迎来分水岭,不再忽悠概念,应用效果见分晓!
2018中国人工智能报告: AI+垂直领域全面绽放,谁在领跑?
对标谷歌Deepmind,微软公布筹谋已久的新AI实验室
麒麟970国内亮相,加码NPU之外野心在于AI生态

为您推荐

腾讯宣布推出第三代高性能机器学习计算平台Angel 并于2017年全面开源
对标谷歌Deepmind,微软公布筹谋已久的新AI实验室
从新一代TPU到Google.ai,详解谷歌I/O首日人工智能五大亮点
腾讯绝艺AI下一步将学习AlphaGo zero 自对弈训练
王垠:自动编程是不可能的 我为什么不在乎人工智能

更多

科大讯飞
人工智能
IT业界