2020北京人工智能压轴讲:图灵奖得主对ai十年进展不买账?
“您对过去60年,尤其是过去10年的ai进展怎么看?”
当2003年图灵奖得主 alan kay 被问到这个问题时,他笑着回答道:“哦,这个问题很简单…… ai 这个词已经被偷走了。当年我们称之为人工智能的研究,现在被改作 ‘通用’人工智能(general ai)。有些人想要取得成功,于是他们决定忽略人工智能研究中较难的问题,也就是关于认知的那部分…… 我承认机器学习领域取得了醒目的成就,但我绝不会将其和真正的 ai 混淆,绝无可能。”
这是 2020 北京智源大会的压轴演讲现场,我和几千人一起在线观看了 alan kay 和华人计算机专家张宏江的对谈。看上去,alan kay 似乎对ai过去十年的发展并不买账。
在他看来,一个足够复杂的机器学习系统,就像是一只“超级鸽子”。这只超级鸽子可以做许多有用的事情。但机器学习领域的研究人员,不能用这个子领域的进展来标榜整个人工智能领域的成功。alan 指出,如果我们想要发明能够和人类自然交互的 ai 系统,就必须让 ai 学会理解人类的语境和常识。过去四十年中,这个领域几乎没有得到经费支持。
而现在,alan 表示,即便我们拥有巨量神经元构成的神经网络和专用的芯片,我们做的一切不过是 judea pearl 所说的 “曲线拟合”(curve fitting),无论是通过多项式这样的最简单的模型来完成,还是通过最复杂的深度神经网络模型来达成,曲线拟合都仅仅是在输入数据和输出数据之间找到某种固定的模式,而非 “理解” 数据。judea pearl 是贝叶斯网络的发明者,也是2012年图灵奖的获得者。他现在致力于让机器能够理解因果关系,而不仅仅是数据之间的相关性。
“我们不能用 ai 中小小子集的成功,来假装我们在整个领域里获得了激动人心的进展。我们需要来真的(get real)…… 如果我有什么话要告诉年轻人,那就是,别去管那些发论文,拿学位的废话…… 真正获得突破的人,不会在意这些。”
alan kay 的这番话,让我想到了另一个著名的“非主流” 研究者和 ai 大潮中的 “异见人士”,印第安纳大学的认知科学教授侯世达(douglas hofstadter)。略懂中文的他为自己取了侯世达这个名字。他通常以跨学科巨著《geb》闻名于世,但成名并获得终身教职后,他一直以自己的方式研究人工智能。
在2019年接受果壳网的采访中,他严厉地批评 ai 领域的机器学习路径。例如,google 翻译团队宣称他们的翻译水平已经达到了人类水平,但仍然会犯低级错误,如下图所示,在明显的上下文里,将 “shingle” 翻译为 “带状疱疹” 而非 “瓦片”。
直到成稿,google 也没有修复这个翻译问题。当然,对于黑箱算法来说,修理特定翻译错误是非常困难的。
“1950年代那会儿,说 ‘我们正在研究 ai’ 是没问题的,我们是在研究它,是在尝试理解智能,但现在人们不那么说了,人们说‘这是智能的’,‘那是智能的’。我不喜欢这样。这是过度简化扭曲,误导原意。”侯世达在采访中直言。
不难理解 alan kay,judea pearl,侯世达这些前辈,对当前 ai 领域繁荣表象的批评。图灵在那篇启发后世的论文中,提出的问题是“机器能思考吗?”(can machine think)?许多老一辈研究者关心的是从科学上理解智能,而机器学习并非人类智能的运作方式,因为人类显然不需要从巨量的数据中学习如何分辨猫狗。在他们看来,想靠机器学习实现真正的人工智能,就像那个古老的寓言,“有人想顺着一棵树往上爬,一直爬到月球”。
而如今,拥有六十年前研究者不敢想象的数据量和计算能力的 ai 研究者,会更加倾向于相信,飞机为了飞行,并不需要像鸟一样挥动翅膀。诚然我们能造出厉害的机器,在围棋领域战胜人类世界冠军。但是,我们还是不理解人类的智能是如何运作的。“我们应该严肃低对待人工智能中的‘智能’二字(we should take the word 'intelligence' seriously)。”alan kay 强调道。
80岁的 alan kay 语出惊人的背后,的确有真本事。
他1940年出生于美国麻省,父亲是生理学教授,母亲是音乐家。小时候的alan是个神童,三岁就学会了流利的阅读,上小学前,他已经读完了 150 本书。他说,“不知道是幸运还是不幸…… 小学一年级的时候,我就已经知道老师在骗我了。”
alan大学在西弗吉尼亚的 behany 学院读生物学专业,还辅修了数学。他没毕业就参加了空军,并因此接触到了计算机,成为一名ibm 1401 程序员。从空军退役后,alan 到科罗拉多大学继续读书,拿到了数学和分子生物学的本科学位。1966年,进入犹他大学工程学院读研究生,研究电气工程。1970年,alan 加入了加州的 xerox parc(palo alto research center)。
parc 是 1970 年施乐(xerox)发起的,致力于为 “未来的办公室” 做长期研究的机构。施乐靠激光打印机成为全球知名的数字与信息技术产品公司,其前身是 arpa(advanced research projects agency),互联网的原型阿帕网(apranet)就是这个机构在1966年的研究产物。
在parc, alan 发明了图形用户界面(gui)。如果没有这个发明,就不会有后来的 windows 和 macintash,我们就不会像现在这样使用鼠标和键盘,通过点击或者触摸屏幕上的图形来和电脑交互了。
图片: flickr user nobuyuki hayashi
不过这还不算什么。在施乐期间,alan kay 基于 smalltalk 语言,提出了面向对象编程(object-oriented programing)的思想。这个思想几乎应用在一切现代日常计算机应用软件的代码中,也是 c ,java,ruby 等现代编程语言的基础设计。此外,他在70年代初,他还提出了 dynabook 的原型,启发了现代笔记本电脑,平板电脑和电子书的设计。他关于 gui 和 “每个人都能用电脑” 的思想,深刻影响了比尔盖茨和乔布斯。
年少功成的 alan kay 多才多艺,曾是职业爵士吉他演奏家和业余管风琴演奏家。显然,他认为自己是名有科学背景的艺术家。“艺术家不会因为别人不接受他的想法就停止创造,他们创造并不是为了售卖,而是为了让自己的思想得以显现于世。” 他在分享中说道。
alan kay 毫无意外地提到最近40年来计算机技术的 “停滞”。
alan 曾在17年 fastcompany 的采访中表示,tim berners-lee 创造的万维网(world wide web,即www)和 html,与 douglas engelbart (超文本链接和鼠标的发明人)的思路相比格局太小,只是碰巧被其他同样头脑简单的人接受,变成了标准。而 ipad,也只是他在70年代创造的 dynabook 和后来的产品 xerox palo 的延长线,不幸的是,ipad 更加消费主义。
微型计算机 xerox palo,比 macintosh 早了足足11年,只不过售价相当于现在的 11万美元。
在他看来,最近20年只有 croquet 项目值得一提。该项目设想了一个所有参与者都可以自由互动的虚拟现实环境,像是创造一个大型多人在线网游,但人们相互交流的是整套的操作系统,应用软件和人机交互方式,这使得参与者可以随时改变各种物件的源代码。alan kay 认为,“croquet 的重要性可以和 tcp/ip 相提并论。”
croquet 是 alan kay 尚未实现的一项远景(vision)。他当年在 arpa 工作时的领导,信息处理技术办公室的负责人 j. c. r licklider 正是一个善于描绘远景的人。
1960年代,licklider 看到 “计算机命中注定要成为和未来普遍联网的人类交互的智能放大器”(computers are destined to become interactive intellectual amplifiers for all humans pervasively networked worldwide)。也就是说,他已经预言了个人计算机,基于图形界面的人机交互技术,以及互联网的诞生。更准确的说,不是预言,而是 “导演” 了这一切。
在 alan kay 看来,杰出领袖的责任在于提供远景,而不是提供目标(goal)。只有这样,才可能取得前所未有的突破。“远景给你一种感觉,一种渴望,但没有任何具体细节,没有任何你可以直接上手的问题。你需要自己从远景中寻找可以做的事情…… 远景就像磁场,研究者能够感受到这些磁场的存在,感受到北方在哪儿…… 但前往这个方向的途径可以是多种多样的。”
这些远景,alan kay 说,让当时的年轻人间获得了一种 “美学意义的联接”。“我们爱 licklider 的远景,就像爱一个情人...我们受到这远景的召唤,就像一些人被宗教召唤。”
从 arpa 到后来的 xerox parc,alan 说,他遇到的领导者没有官僚,而是科学家政客(scientist statesman)。他们尽可能地免除了种种官僚手续和文书工作,更多地凭借信任工作,放手让年轻人去尝试。他们甚至取消了同行审议(peer review)。在他看来,最顶级的工作,是无法找到同行的。
确实,两个机构的几乎每项工作,都开创了一个全新的行业,它们根本就没有竞争者。在 xerox parc,25名研究人员,5年的时间,每年1500万美元的投资,便带来了 8.5个重大发明(那0.5是互联网),科研投资带来的回报,现在已经超过了40万亿美元。
xerox parc 的8.5个研究成果
以阿帕网项目的诞生为例,alan回忆到,人类的互联网时代始于一个15分钟的谈话。1960年代初的一年,robert taylor 和当时 arpa 的负责人 charles herzfeld 进行了一场谈话,在15分钟的时间里,robert 估算出约合现在 700万美元的启动资金,charles 稍加询问后同意了。几乎在同一天,arpanet 项目开始运转,而项目申请的文书工作直到一年后才补完。
这种程度的信任和效率,无疑会让现在深陷经费申请泥潭的项目带头人心生羡慕。alan kay 认为,为了取得开创性的研究进展,就必须要有 “疯钱”(mad money),不在乎后果和回报,投资可以没有任何明确的目标收益。换言之,这些投资是 “非理性” 的。但为了创造,非理性是必要的。
在alan kay 看来,mad money 需要占到某个机构 r&d 经费的 1%~5%。如果我们认为 xerox parc 的经费—— 每年约合现在的1500万美元—— 全都是 “疯钱”,那么财富 top 418 的公司,都能供养得起自己的 xerox parc。而像中国和美国这样的大国,各自至少可以拥有超过330个 xerox parc。
也就是说,我们的科技进步速度远远没有达到应有的水平。alan kay指出,人类应该有足够的能力,去解决那些更大的挑战,例如全球变暖。
全球变暖才是 alan kay 现在最关注的问题。比起过去的科学家和工程师身份,alan kay 现在更像一个思想家。他关心的是如何用科技来应对人类面临的重大挑战,例如全球变暖带来的气候灾难。
“我们可以想象一个今年出生的孩子,在22世纪来到的时候刚好80岁。我们应该思考,如何让他度过这一生?如何让他在80岁的时候的地球看上去比现在更好,而不是更糟?” alan问道。
的确,气候变暖问题是一个远比新冠疫情危害更大的挑战。地球上的大气二氧化碳含量,一直在 200ppm~300ppm 之间震荡。但自从1950年代以来,这个数字已经上升了33%,达到了414ppm。温室气体增多会让地球气温升高,而这对环境的许多影响将是不可逆的。例如,我们的地球科学知识已经揭示,一旦格陵兰的冰帽融化到一定程度,由于白色冰帽减少导致反射的阳光减少,当地气温将进一步升高,而进入融冰的正反馈循环中。末了,地球的海平面将上升7米。
“我们不能用创造问题时的思维水平来解决问题。” alan kay引用爱因斯坦这句话,以解释解决问题和产生问题并不是对称的。他指出,打破一个系统的稳态是很容易的,但要恢复稳态就很难了。例如,推倒一个竖立的玻璃瓶,要比扶起一个平放的玻璃瓶需要的能量少得多。同样,修复地球的生态,也远比破坏生态系统要困难得多。
作者简介