从1987到2011:Siri从幻想走向现实

jopen 13年前
     <p> 杨晓宇许悦杨樱</p>    <p> 人类从来就不吝于幻想未来,但就像所有的革命一样,只有所有需要的技术都在那里的时候,Siri 的出现才是必然。</p>    <p> 从10月14日开始,“调戏 Siri”变成了一个流行的游戏:拥有 iPhone 4S 的人们问它各种古怪的问题;没有 iPhone 4S 的人们则以围观取乐。</p>    <p> 如果有人只是把它看成一个语音搜索工具或者游戏,那就太不把 Siri 放在眼里了—乔布斯在收购时就把 Siri 定义为“人工智能公司”。</p>    <p> 人们已经为此等待很久了。</p>    <p> 回到1987年,Siri 还不叫 Siri,它叫 Jill,长了一张聪明的面孔,是一位教授的助手。这位助手—顺便说一句,他生活在一本打开的平板电脑中—为教授提供了各种帮助:搜索论文的时间;提醒他回母亲的电话;帮他接通电话,并在通话过程中提供搜索、提醒……</p>    <p> 那只是一个幻想,是1980年代末期苹果公司发布了一系列对未来展望的视频中的一段。</p>    <p> 在那之后的35年里,随着计算机技术的发展,人工智能的研究从来没有停止过:它有各种名字,有时候叫“T3”,有时候叫“深蓝”……最近它又叫 “沃森”—让人兴奋,但昂贵而且独一无二。在这35年里,个人电脑已经越来越小,iPad 出现了;移动设备功能越来越多,iPhone 让人们摆脱了键盘;移动网络的速度越来越快,3G 也将成为历史;自然语音的识别、强大的运算能力、搜索已经无处不在……一切技术都已经准备妥当。</p>    <p> 2010年4月,苹果公司收购了 Siri。Siri 一位联合创始人 Dag Kittlaus 写下了一句话:“我们忙着搞下个大事情……很大很大。”</p>    <p> 确实很大,Siri 来了。</p>    <p> 它让人们第一次有机会去测试自己的个人助理到底是否能通过“普鲁斯特测试问答”。现在,答案是“不能”。但将来,Siri 的行为是否确实符合“机器人三原则”才是真正的问题—不过,有可能那时候它的名字已经不叫 Siri 了。</p>    <p> <strong>Siri 是如何成为 Siri 的?</strong></p>    <p> Long long ago</p>    <p> 人类最初的幻想为后来的机器人提供了感性的基础。虽然那时候它还只是一个形象,但先要有足够的想象……</p>    <p> 3000多年前中国偃师的“伶人”算得上是最早有记载的“机器人”。但真正能被称为“机器人”的,还是公元前两世纪的古希腊人发明的“自动机”:它会自己开门,还可以借助蒸汽唱歌……18世纪时,对机器人的幻想越来越常见,《木偶奇遇记》、《浮士德》中都出现过机器人的形象。人们希望有那么一种机械,具有人的形象,能为自己提供各种服务—但此时,人类并没有考虑过这种可以端茶、唱歌的机械是否需要思考。</p>    <p> 1956</p>    <p> 人工智能成为科学,组成 Siri 的所有元素这个时候实际上已经全部出现了。</p>    <p> 1950年10月,图灵发表了著名的“图灵测试”,开创了计算机科学的重要分支─人工智能。但真正确定这一研究领域则是在1956年。这年,美国达特茅斯大学的青年助教麦卡锡、哈佛大学明斯基、贝尔实验室的香龙、IBM 公司信息研究中心罗切斯特一起发起了一次学术研讨会议,正式确定了人工智能(Artificial Intelligence)成为独立的研究领域。从这天起,AI 就跨越了计算机科学、哲学、心理学以及社会学,成为了综合的学科。</p>    <p> 1983</p>    <p> Siri 未来是什么形式是由 Motorola 的这次技术进步决定的。</p>    <p> 摩托罗拉 Motorola DynaTAC 8000X 成为世界上第一部手机。以手机为主的移动设备开始进入人们的日常生活。由于带宽和硬件的限制,当时的手机只能支持语音通话。就像摩尔定律所描绘的一样,随着芯片运算能力的迅速提高,以及更多的移动电话制造公司进入这一领域,手机慢慢变小,便于携带。起初那个砖头大小的手机,为人工智能提供了一个硬件平台和可能的发展方向—移动和个人化。</p>    <p> 1987</p>    <p> 运算的核心是个人电脑,PC 革命是 Siri 的核心。</p>    <p> 1980年代,电脑世界里最大的革命—个人电脑开始普及。在大型电脑最终进入个人书桌成为可能后,以前人们的幻想开始成为可能。1987年,苹果公司发布了对未来的展望视频,平板电脑和其中的 Jill—这位聪明的助理—成为人们对人工智能进入日常生活的具体设想。随着这种幻想变为现实的可能性的增加,人们开始探讨人工智能的伦理道德问题。阿西莫夫的“机器人三大定律”正式成为 AI 的道德标准。</p>    <p> 1990</p>    <p> 数据通信,数字管理让 Siri 有了具体的“工作”。</p>    <p> FCC 批准采用蜂巢网络技术,这使得移动网络不仅可以支持语音通话,还可以进行数据通信。3年后,短信开始出现。2000年5月,国际通信联盟发布了第三代移动通信技术(3G)。这一标准使得移动设备可以进行高速数据传输。此后,以黑莓为代表的 PDA 进入了人们的生活。这意味着人们不仅需要一个可以携带的电话,更需要一个可以携带的个人助理。1999年,Siri 的创始人之一 Adam Cheyer 在 SRI 开始进行与机器进行语音交流的研究项目。</p>    <p> 2003</p>    <p> 找到 Siri 发展所限制的条件:如带宽、数据通信以及处理。</p>    <p> 美国国防部高级研究所成立了一个把人工智能转化为生产助手的相关研究项目 CALO,研发一种“人格化和有认知能力的耐用辅助性机器”,而负责这一项目的是斯坦福研究院(SRI),其中“Personal Assistant that Learns”(PAL)是独立研究认知能力系统的子项目。2002年,当时的研究员 Adam Cheyer 在一份关于“无线和移动电脑的解决方案”的 PPT 中提到了移动带宽限制了智能搜索、网络服务整合的发展。</p>    <p> 2007</p>    <p> Siri 已经实现了。这个项目将以前零散的思路完整化。</p>    <p> CALO 项目结束后,负责 CALO 项目的 SRI 研究员 Adam Cheyer、Norman Winasky 以及其他伙伴共同为 PAL 技术成立了独立的开发公司 Siri。公司成立之后,Adam Cheyer 的团队继续做了大量关于机器人学习能力和信息管理能力的研究。但他此时的重点已经转移到了 AI 在移动设备上提供个人服务的应用。Adam 为 Siri 下了一个定义:它是各种技术的整合,包括对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考等等。</p>    <p> 2007</p>    <p> 带宽、处理器都还差那么一点,但 Siri 的平台搭建完毕了。</p>    <p> 苹果发布了第一款 iPhone。它不仅使手机摆脱了键盘和带宽的束缚,采取触摸屏和3G 网络技术,更大的意义是它具有强大的运算速度,使得智能手机变为真正的终端,整合各种个人服务成为可能。App Store 开创了一种全新的手机应用模式,使得更多的人加入其中,为其提供更多的服务。第二年,Siri 整合更多网络服务并进入了 APP Store,可以运行在3GS 上。联合创始人之一的 Norman 说:“Siri 的人工智能需要使用大量的数据,大量的运算能力和网络连接。”但,限于3GS 的运算速度,此时的 Siri 还不会说话,只能通过文字进行回应。</p>    <p> 2010</p>    <p> 一个成熟的产品需要强有力的推手,苹果出现了。</p>    <p> 4月,Siri 被苹果公司收购,随之宣布取消在 iPhone 手机以外所有其他系统版本的研发。虽然收购价格并没有对外公布,但当时 Siri 的估值大约在2亿美元左右。在此后,苹果公司再次扩充了 Siri 能力,使其可以使用更多的系统基本的功能,包括使用 Nuance 的语音识别技术。但 Norman 认为,对于 Siri 来说,语音只占很小的一部分,甚至并没有那么重要,一旦有更好的语音识别技术出现,Siri 可以很容易更换一个新的。</p>    <p> 2011</p>    <p> 10年之后,我们看第一代 Siri,可能跟看1984年的 Macintosh 一样—它未免太幼稚了!但好在开始了。</p>    <p> 美国当地时间10月4日,苹果公司发布 iPhone4S。在经历了最初的失望后,人们开始意识到,除了更快的运算速度之外,Siri 并不仅仅是一个语音系统或者搜索系统,它意味着整合了网络服务的人工智能开始进入人们的日常生活。短短十天的测试后,人们意识到,现在的 Siri 还只是“弱人工智能”,并未具备“真正能够推理和解决问题”的能力。但 Siri 的基础是建立在 iCloud,亦即云计算的支持上的。一周后,宝马宣布将在自己的汽车上支持 Siri 技术。在更多公司和服务加入对 Siri 的支持后,Siri—这个“个人智能助理”的雏形将会成为真正的“个人智能助理”。<br /> <br /> 来自: 第一财经周刊</p>