Sebastian Thrun 眼中的 AI 和未来世界
AI,也就是人工智能,是现在硅谷最火的话题之一。人工智能的目标,就是要让机器像人类一样聪明,甚至比人类聪明。 从历史的角度来看,大约300年前,人类发明了蒸汽机和农业设备,这些机器在物理层面上超越了人类的能力。
而 AI 要做的,是让机器从智力层面上,也要超越我们人类。 机器也可以变得很聪明,他们可以玩游戏,可以开车,可以开飞机,还有很多它们能做到的事情。而目前最有趣的人工智能相关领域,就是机器学习。
机器学习,是指机器从经验中学习的能力。同样,让我们对比着来看。当你为一台电脑编程时,你会事无巨细地告诉电脑在任何一种可能的情境下,需要做什么样的反应。现在的电脑程序,通常会有成千上万行代码,因为有成千上万种情况需要它们去处理。
而一个程序员,需要足够聪明,可以预测到所有可能的情况,从而避免你的电脑崩溃。这也是为什么软件工程师的薪水都那么高。在机器学习时代,机器不再需要被一条一条的灌输指令,它们也可以被“教育”,就像人类的小孩获得的教育一样。我们教小朋友时,不是一行一行地把所有可能的行为指令都灌输给他们,而是让他们不断去尝试,跌倒,然后站起来,从跌倒的经验中去学习。机器学习让也能够像小朋友那样,能够从经验或数据中学习,获得成长。
我在人工智能领域探索了很长一段时间。说起来你可能不信,我1993年就写了一篇关于机器学习和机器人学的硕士论文。自从那时开始,我就为一个问题深深地着迷:机器到底能不能用和人类同样的方式去学习?
2005年,距离现在十多年前,我参加了美国政府组织的 DARPA 超级挑战赛,一个无人车驾驶大赛。196个队伍参与角逐100万美元的大奖,而我当时在斯坦福大学的团队赢得了胜利。我当时是斯坦福人工智能实验室的总监,在 Google 的人工智能项目中也担任了同样的角色。在参加挑战赛时,我工作的核心,就是运用了机器学习。Stanley 是一辆会学习的机器人车。它能从数据中学习,有时它会从自己的经历和错误中学习,更多时候,它会学习人类司机的行为,使得它自己能够像人类那样去驾驶。最终,Stanley 的学习模块,让它从196个队伍中脱颖而出,早2005年,以决定性的优势赢得了 DARPA 超级挑战赛。
Google 的无人驾驶车也会学习,而我们也遇到了同样的问题:在驾驶过程中,有太多的罕见情况需要去考虑,而无人车需要能够处理好其中的任何一种情况。所以,Google 无人驾驶车最终在公路上驾驶了几百万公里来训练软件如何驾驶。人类和电脑的一个区别在于,学习的速度大不相同。举例来说,如果一个人类驾驶员犯了一个错误,他会从中吸取教训,也许下次可以不再犯错。
但是其他人并不会拥有同样的收获。如果是一辆无人驾驶车出现了错误,不但它自己会从中吸取教训,所有其他的无人驾驶车甚至是所有未来的无人驾驶车,也将从中获得新的经验。这意味着,一个错误就能训练世界上所有的无人驾驶车,无人车的学习速度远远超过了人类。这个区别将导致未来有一天,无人车驾驶将比人类驾驶要安全的多得多。这是人工智能和人类在学习上非常关键的一个区别,而且它也适用于很多别的领域。
机器学习正在被运用于很多很多很多的领域。举例来说,医疗诊断。机器学习可以比最优秀的人类医生更准确地诊断癌症。在法律领域,最资深的律师,也会在寻找资料和起草合同上输给机器学习。当然,还有互联网,Google 和百度都因为机器学习的助力,可以用超乎人类想象的准确度搜索信息。还有很多其他的领域,比如会计、驾驶飞行器和玩游戏。
前段时间,Google 的 AlphaGo 刚刚在围棋上打败了世界冠军。而而这所有的人工智能应用都有一点相同:它们都会使用机器学习,从海量的数据中学习。如果你再观察一下机器学习,比如 AlphaGo,会发现它能从成千上万个棋局中学习。没有任何人类的专家能够活那么久,去看完几百万个棋谱。这个区别,使得 AlphaGo 可以运用比人类多得多的经验数据,围棋水平最终超越地球上所有的人类。
未来,人工智能对人类生活的改变,将和农业革命、工业革命带来的改变一样,让我们可以变得更为强大。它将把我们从不需要动脑的重复性工作中解放出来,比如每天你在办公室中不断重复做着的很多工作。在未来,律师可以浪费更少的时间去寻找资料,花更多的时间去进行创意型的思考;医生的误诊将大大减少,他们可以更好地诊断人类疾病,可以花更多时间和病人交流而不是用来盯着皮肤组织样本。
精彩问答
Q: 你是如何看待计算机视觉的未来前景的?
Thrun: 计算机视觉是人工智能中最激动人心的领域之一。直到几年前,我们甚至还不能识别照相机图像中的最基本的部分,如你的脸,或者你坐的椅子,或者流动的云。但是多亏了深度学习,我们现在能够分析非常复杂的东西。
例如,汽车停在停车场中,电脑放在桌子上,甚至柔软无棱角的物体,如冰箱边上的食物。这只是个开始。计算机视觉使一种控制汽车的新方法得以实现。过去无人驾驶汽车使用雷达和激光作为感知环境的方法,现在有一种新方法是用计算机视觉和摄像机来分析行驶方向,并且进步很快。
Q: 现在业内关于自动驾驶技术和实现的完成度,各家相比会有很大的差距吗?比如 Tesla 和 Geohot ?
Thrun: 你问了无人驾驶汽车的市场和 Tesla 与 Geohot 的区别。如果你看看 Geohot 的新闻,就会得知 Geohot 已经决定终止无人驾驶汽车的项目,并转而做别的项目。这个决定回应了美国政府对于 Geohot 对用户是否真的安全的质疑。我不得不承认我今天看到这个消息很难过,因为我希望无人驾驶汽车技术短期内就有市场。相反,Tesla 已经建立了名为 Autopilot(自动导航)的无人驾驶技术。
它没有完善到你可以在开车的时候睡觉,你必须保持注意力。但是如果你保持注意力,它能够按路线行驶的非常棒。我有一辆 Tesla 并且我每天都使用 Autopilot。Tesla 的技术曾基于 Mobileye,一家以色列公司,现在换成了 Nvdia, 一家美国的公司。因此你可以看到无人驾驶性能的进步因为具体的技术在进步。在今天的市场,大部分都是非无人驾驶技术,是驾驶辅助技术,汽车只有一种功能。Tesla 是最先进的一个,因为它是个很棒的公司,发明了 Autopilot。
尽管如此,Autopilot 还不是最完美的无人驾驶汽车系统。然而,业界的进步十分迅速,接下来两三年,我期待更多主流的汽车公司也来做无人驾驶,并研发出类似的无人驾驶技术。
Q: 现在的人工智能离强人工智能还有多远?机器人什么时候能真正读懂人说的话、理解看到的东西、了解人类的情感,(深度)神经网络能做到这一点吗?
Thrun: 现在的人工智能离强人工智能还很远,现在是专业化的人工智能。每一个人工智能系统精通一项任务,但是如果要它做一个不同的任务需要从零学起。这很重要因为我们不需要无人驾驶汽车会下象棋,我们也不需要飞机会投篮,这些是不同的领域。
然而,现在的问题是机器人是否能够理解人类情感,我认为这需要很大的进步。现在在训练人工智能理解人类是高兴或沮丧,不舒服或疲惫,已经有了很大的进步。你们手机上的人工智能系统可以辨别你现在的心情,这个用最基本的人工智能系统就可以做到,只需要观察你贴图的频率,看微信的频率,走路的方式。
我想说我对人类情感很感兴趣,但是我对机器情感并不感兴趣。我不需要我的人工智能有情绪,我不希望它生气或者开心,我不想来到厨房,发现我的冰箱爱上了我的洗碗机。它不愿意为我工作因为我昨天晚上对它发了脾气。我希望机器能够稳定工作,因此我认为人工智能机器不需要情感。
Q: 基于学习的方法主导机器学习的根本原因是什么?它将如何与更传统的 AI 方法进行交互?
Thrun: 机器学习主导的根本原因是它必须做到跟人类学习的方式类似。如果你想教小孩做正确的事情,你不能坐下来把生活规则一条一条写下来,这是不可能教会他的,相反,你应该让小孩从他自己的经历中学习。
机器学习不是像我们曾经写代码一样来学习的,也是从经历中来学习,因此在很多领域都不那么做了。比如 Google 每天从数千亿的在线网页的数据集中学习,这些数据没有任何规则,但数据却存在规律。所以今天的机器学习是将人类的学习方式用在数据上得出结论,这比用常规的编程方式要更强大。
Q: 未来的硬件技术有什么新的要求,以满足AI的趋势?
Thrun: 如今人工智能发展的一大激活因素是计算机的规模。10年以前,这是不可能的。 10年前我们的计算机系统规模最大都不如老鼠的大脑,现在它们比人类的大脑更大。这使得一切都变的不同了。人工智能领域大多数发现,世界上最好的算法,在30年前就已经出现,但现在才开始兴起的原因是因为计算机变得越来越快。
展望未来,计算机必须更快,更便宜,更加关注浮点数的运算,可以大量相互连接。在所有这些事情正在发生的现在,计算机公司(比如我们知道的谷歌和亚马逊)之间最大的区别,对 AI 最重要的,是处理浮点运算的能力。因此,GPU(显卡,图形处理器) 和浮点运算能力是人工智能的必要条件和驱动力。