一位真正的科学思想家: 纪念人工智能之父marvin minsky教授
人工智能创始人之一、认知科学家马文·明斯基(marvin minsky)。图片来源:wiki
导语:
2016年1月19日,美国科学基金会下属的国家科学与工程统计中心在美国国家科学理事会的指导下,推出了《科学与工程指标2016》。本文根据该书公布的相关数据,揭秘全球国内研发总支出前9名国家的研发活动主体(包括按经费执行部门和经费来源部门)的经费构成和研发活动类型(基础研究、应用研究和试验发展)的经费构成情况。
文 | 王飞跃(中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任)
● ● ●
为了纪念刚刚去世的人工智能创始人之一,认知科学家marvin minsky教授,ieee intelligent systems(is)杂志正组织相关领域专家及其minsky生前的学生与朋友,撰写in memeriam,以各具特色的自由风格,怀念这位在人工智能史上有着特殊重要地位的先驱和开拓者。作为is的前任主编和现任名誉主编,我自然积极响应,并邀请了人工智能另一位重要的先驱与开拓者,斯坦福人工智能实验室的nilsson教授共同参与。由于时间太短,正在夏威夷海滨度假的nilsson无法完成,但提醒我邀请minsky在mit的两位早期博士毕业生danny bobrow和bert raphael。
danny和bert都是自然语言处理的先驱,danny的博士论文是关于文字代数问题求解的student程序,bert的博士论文是关于语义信息搜索回取的sir程序。student和sir都是基于lisp写的,可以算是人工智能在早期nlp的里程碑工作。danny后来成为人工智能学会aaai以及认知科学学会的主席,曾担任《人工智能》杂志主编;bert与nilsson等发明了a*搜索方法、研发了世界上第一台可移动智能机器人shakey,还参与创办了《人工智能》杂志并任主编。
有趣的是,当年danny和bert在rpi读大学时是室友,1957年毕业后,分别去了harvard和brown读硕士;后来两人野营时相会,danny问bert在做什么。bert说正研究弹性波多散射问题;danny说这听起来没多大意思,他正研究如何用相机识别marvin的光头,只要marvin走进房间,计算机就喊:“hello,marvin!”。一周后,bert申请转到mit,成为minsky的学生,毕业后去了sri,真的开发起利用相机进行视觉识别和导航的机器人shakey!
记得我告诉bert自己也是从rpi的机器人与自动化实验室毕业时,他感慨当年rpi既无自动化,也无机器人和ai,就连计算机课程都没有。其实当年mit也没有这些,bert和danny的ai博士学位还是从数学系得到的。
邀请完两位前辈,我自己如何写却成了问题。danny和bert都与marvin有很长的交往和很深的渊源,一致认为他是一个开放、真诚、友好、幽默、具有卓越创造性的人物。我虽有幸同marvin有过几次个人交往,至少一次在物理世界,两次在cyberspace:25年前去mit面试机器人assistant professor位置时的会面,6年前因他入选“人工智能名人堂”试图举办新闻会议和4年前因他的学生、自己的前辈和朋友dave waltz去世的两次邮件,但除此之外,并无任何其他的感性认识。而且,对于minsky的学术思想,我的看法和认识也比较复杂,虽然越来越赞成并获益于其观点和概念,但仍然还处于过程中,至今还没有完全定型。
虽然如此,在我眼里minsky是一位真正意义上的科学思想家,而且其思想的深度与原始性有时远在许多人的理解范围之外,由此受到质疑并引起争议。对此我深有体会:上世纪八十年代中期,当我正挣扎着完成自己关于智能机的组织与协调理论的博士论文时,minsky发表了他著名的《the society of mind》,此书曾给我很大的希望,以为真找到通向智能机的“金光大道”了。但还没有略读完,就意识到此路对一个刚入门的研究生几乎是不可能走通的。实验室有的同学甚至声称:就是你给minsky的agents加上再漂亮的数学公式和具体的逻辑程序,答辩委员会的教授们也不会通过你的论文。rpi是一个工程思维主导的地方,客气的教授认为他的想法是“ decent speculation”或者“too philosophical”,有的直接就认为是“almost nothing to do with real ai”。
毕业之后,我才再开始重新认识minsky关于agent的想法,在nasa的火星移动机器人spiderobot项目中进行尝试,这还是在mit的r. brook教授关于机器人行为编程控制的situated ai方法有了一些成功之后。九十年代中末,当自己开始基于代理控制(agent-based control, abc)方法研究时,才真正感受到当时minsky之agent思想的大胆与深刻。
今天,计算与ai技术的处境已发生了翻天覆地的变化,这一切似乎己很自然,我个人也认为自己关于默顿系统、社会计算、基于虚实二像性的平行系统之平行智能的工作已进入minsky三十年前所设想的人工智能新世界。这恰如minsky所说的:“ you don't understand anything until you learn it more than one way”!(对于一个事物,除非从多个途径学习,否则你什么也不知道。)
除了minsky发表的《the society of mind》,1986年还出版了人工智能和认知科学发展史上的另一部与minsky非常相关的里程碑式著作,就是pdp:《parallel distributed processing》。这使我有幸,更准确地讲是个人的不幸,同时读了三本书:nilsson于1965年发表的《learning machines》,minsky和seymour papert(我一直戏称他为seemore papers教授,是一位自己十分敬重的智慧教育学家和知识机器的倡导者)于1969年发表的《perceptrons》,和rumelhart、mcclelland及pdp研究小组编著的pdp,外加rosenblatt(主要是perceptron),widrow(主要是adaline),机器学习和自己导师的learning control等方面的论文。
nilsson的书给出了当时学习机器和神经元网络的最全面的数学分析,但除了引理定理外几乎没有例子,特别是数值例子,使其成为“阳春白雪”,曲高和寡,由此失去了在工程师中传播推广神经元网络的机会。minsky和papert用一个再简单不过的xor逻辑算子差不多“判”了神经元网络的“死刑”,使其十年多几乎无人问津,直接导致了人工智能的第二个“冬天”。
而就在1986年,当minsky的《the society of mind》欲在人工智能引发另一次浪潮或更学术地讲一次paradigm shift(编者注:典范转移,又称范式转移,用来描述在科学范畴里,一种在基本理论上对根本假设的改变。后亦应用于各种其他学科方面的巨大转变。)之际,pdp中基于back-propagation的多层神经元网络揭掉了minsky和papert贴在神经元网络上的“死咒”,使其“起死回生”,也使minsky的声誉有所损失。我相信这是为什么agent和minsky的其他学术思想没有更快兴起的一个重要原因,也是为什么后来brook和agent的倡导者没有更明确更有力地阐明minsky的原始贡献的重要原因。
然而,在当时我更倾向于minsky和papert在《perceptrons》里对神经元网络(neural networks,nn)的评论,认为其基本模元有局限性和致命的缺陷,合起来的网络说不定会有这样或那样的问题,至少计算上不是很有效。特别是读mccullock-pitts神经元模型原文时,觉得内容与题目(a logical calculus of ideas immanent in nervous activity)相差太远,几乎有读boole的《laws of thought》的感觉:看懂的太简单,看不懂的觉得根本就是文学思想,不是hard science。
正在这段时间,导师的另一位学生mm,一位ibm的在职工程师,其关于boltzmann网络的工作自己觉得明明是错的,但导师仍然支持,后来论文也发表了,更使我对神经元网络nn的研究产生了偏见。
而且,minsky和papert的书使得人工智能研究的大方向稳定在以推理和逻辑编程为主的“符号”系统之上,而不是以神经元网络nn为代表的计算智能方法,对于刚从计算力学“逃出”不久的我而言,当然心里更愿意接受。一直到毕业后,我才开始改变自己的认识,九十年代初开始了关于neuro-fuzzy network (nfn)方面的工作。
回想起来,神经元网络nn乃至计算智能之所以一直游离在人工智能的主流之外,与minsky有相当的关系。这也给了ieee创办nn council,还有后来的nn学会,即改名后的计算智能学会(cis)的机会。而且,后来以nn和svm为主要起步方法的机器学习理论在广泛应用之后仍长期不被主流的人工智能接受,似乎也与minsky的影响有关。好在今天机器学习,特别是深度学习“悍然”己成为人工智能的主力,人工智能和计算智能也逐渐迈向合二为一。
其实神经元网络nn的“灾难”并不能真正地怪罪于minsky。在《perceptrons》和minsky等人于1971年撰写的关于mac项目的进展报告中,minsky等把对nn的学术指责非常严格地限制于单层和“线性阈值”网络,而不是后来的多层和“sigmoid 非线性阈值”网络。但他们的“文学性”描述却十分清楚地告诉大家:尽管他们不能证明多层nn基本上是无用的,但十分自信地认为这些网络作为计算学习器件是不够的。科学是科学,文学是文学,大家忘了mcculloch和pitts的原始文章已“证明”nn可实现所有的布尔逻辑算子,当然包括xor,nilsson的《learning machines》第6章也证明了多层网络layered machines的一般性能力,结果让minsky和papert一个小小的xor反例就使nn尘封十余年,陷人工智能于“冬天”的境地。要怪只能怪自己不动脑,盲从,把文学当科学。这点反过来回应了minsky所善长的谜语式警句:“in science, one can learn the most by studying what seems the least”。(在科学里,研究似乎最不起眼东西,往往可以学到最重要的。)
唯一让自己感觉不适的是,nn重生以后,minsky和papert声称他们过去无意也没有把他们在《perceptrons》中关于xor的结论放大到整个nn,是别人误解了其真正意图。换言之,有人愿意将其文学语言当成科学描述,怪不得他们。我在理性上认同minsky和papert的说法,但《perceptrons》明明白白往“死”里攻击当时风头正健的perceptron,其提出者正是minsky的高中校友和学术上的同事加“朋友”frank rosenblatt,就连他们书的封面也以象征perceptron无能与致命缺陷的双螺旋连通图(而且还是用了令人尴尬的色彩)示之,感性上我很难觉得他们两人是无辜的。别忘了,minsky很自豪他在自己的博士论文中提出了世界上第一个随机连接的神经元网络模型,同时认为人脑就是简单而有局限的元件组成的“人肉机器(meat machines)”。而且,minsky在此两年之前出版的一本关于形式语言和计算基础理论的大学教科书《computation: finite and infinite machines》中,还与众不同地引入了神经元模型,大力提倡利用神经元网络构造理论计算机(我上研究生形式语言课时,因无计算机专业的大学背景,老师推荐了此书自修补课,这是一本非常易读的优秀教材,特别是minsky关于post定理的证明,独出心裁,简单明晰,印象深刻)。令人宽慰的是,1971年rosenblatt英年死于意外事故(也有人说是自杀)之后,minsky和papert将修正后的新版《perceptrons》献给了frank rosenblatt。
静想一下,人工智能史上的这一“事件”有着令人“哭笑不得”的效果。nilsson是ai中力推逻辑推理的“符号”学派(所谓“纯净派”)之主力。对计算智能方法不能说有“敌视”,但起码支持不力,可他的第一本专著《learning machines》本来应兴起计算智能与机器学习的时代之“火”,却无疾而终,或者说后来被minsky和papert扑灭了。minsky是ai的认知计算和“玄妙”学派(广义的“邋遢”派)之开山,没想到其《perceptrons》却狙击了计算智能十余年,反过来成就了“符号”学派。这段历史,符合其《society of mind》的框架,活生生的一幕默顿系统动力学之戏,值得社会学家和历史学家仔细地去研究。
我隐约地感觉当年第一位ai之“父”john mccarthy离开mit去斯坦福创立新的人工智能实验室与minsky有关。按mccarthy的说法,是他召集了1956年的dartmouth会议,提出了“人工智能”一词,minsky只是应邀参会。接着,mccarthy发明了lisp语言,理所当然成了现代ai“符号”学派的开山鼻祖。而minsky一直自称也被公认是ai的“认知科学家”,更倾向于cybernetics创始人norbert wiener教授关于人工智能的想法:连续逻辑、连续信号或连续数学为主,而非离散逻辑、离散符号或离散数学。实际上,在dartmouth的夏季会议之前,wiener过去的学生和同事已经于同年的春天在mit校园里组织了一次关于认知科学的研讨会。此会是否对接下来夏天的人工智能研讨有影响,我目前无法知道,但无论如何,背后都有wiener的影响。而且,wiener与mcclelland及pitts的决裂,断送了当时计算方法引导ai发展的趋势,客观上为后来符号方法在ai的兴起创造了机会。但mac项目中ai部分,主导者却成了minsky,原因或许与项目资助人darpa的licklider博士的兴趣有关,其心理学和通信的背景,会更倾向于wiener所指明的方向,结果导致mccarthy的离开,使斯坦福成为mit mac project的竞争对手和“纯净派”的大本营。当然这一切都是我的猜想,目前并无任何材料和考证。
年初我去oregon拜访退休的nilsson教授,还谈起他的《learning machines》和minsky的《the society of mind》,希望有时间回头细读,结果得到他购赠的一本来自英国glasgow大学图书馆的1965年原版《learning machines》。没想到回到北京后,办公室送来一份湛庐文化董寰总编的礼物,minsky《emotion machines》的中译本《情感机器》。我曾略读过英文版,但当时整体上并不认同其思路,也不相信其中的一些结论,正要把中文本带在出差的路上细读的时候,传来了minsky去世的消息。两本书,一个不幸的消息,加上谷歌alphago算法大胜欧洲围棋冠军的《自然》论文和随之而来关于深度学习及“人类vs人工智能”的讨论热浪,让我顿然失去了细读《情感机器》的心情。或许,还是先看看nilsson的小册子《understanding belief》,理解相信到底为何吧。
不管belief为何,在一件事上我必须表明对minsky教授的敬佩,就是他从不与自己的学生合作写文章,但竭力为他们创造自由良好的成长环境。danny还记得minsky请他一起去教授餐厅吃饭,见一个人,他以为也是一个学生,结果竟是大名鼎鼎的wiener教授。
随思乱笔,零散的回忆,算是自己对minsky这位真正的科学与技术之思想家的怀念与致敬!