11月1日,智源人工智能研究院理事长张宏江博士与图灵奖获得者、康奈尔大学教授 john hopcroft就“人工智能:战略、研究与教育”进行了一场对话。
计算机科学是当下的热门专业,也是一门年轻的学科,历史不过60多年。作为计算机科学的先驱人物,john hopcroft见证了这门学科的建立、成长与繁荣。1987年,康奈尔大学教授 hopcroft与普林斯顿大学教授robert tarjan因为在“算法设计、分析以及数据结构方面根本性的贡献” 荣获了计算领域的最高奖图灵奖。今年80岁的hopcroft,不仅学术上成就卓越,在教书育人、服务社会方面也堪称楷模。早在数年前,他就来中国,出谋划策,身体力行,帮助中国提升教育的水平。2016年9月,他被授予“中国政府友谊奖”。2019年11月1日,智源研究院理事长张宏江博士与hopcroft就“人工智能:战略、研究与教育”进行了讨论。在40分钟的谈话中,hopcroft分享了对人工智能、中国高等教育、人才培养等方面的深刻看法。《知识分子》整理节选了两人的谈话,以及hopcroft的个人小传,以飨读者。
张宏江:你在1986年获得了图灵奖,在座的观众很多人那时候还没出生,请你谈下当时的情形?john hopcroft:那个年代,早期的计算机科学非常简单。那时,要决定一个算法是不是行,就把它在电脑里跑一遍,测一下解某个问题花费的时间,这时如果有另外做这个问题的研究者,提出另一个算法解这个问题,花的时间更少,但其实是不知道究竟为什么(花的时间少)。第二位研究者用的数据和第一位一样,但如果换做用某种随机的数据,实际上却算的更慢。我觉得我们得用数学的方法来决定一个算法会更慢的原因。我提出最坏情形的渐近分析方法,然后我发展了一些技术,比如分而治之,来开发这种形式的最优算法。这么做了以后,就将之前算法的那种教授方式转变成了一门真正的科学。张宏江:真好。你在普林斯顿教计算机科学时,实际上并没有这样一门课,你从哪找教学的资料?john hopcroft:我想我应该提一下,我获得(本科、硕士、博士)学位时,并没有计算机科学专业,我的学位是电子工程,我也是受聘于普林斯顿的电子工程系,但我倾向喜欢电子工程的计算机学科的那一面,我更喜欢数学一点。那时有少数几篇文章,我就是这些文章基础上开发了这门课,之后这门课被其他大学广泛地采用,成为了那个年代的理论课。1967年我到刚成立的康奈尔大学计算机科学系,开始在与我志趣更贴合的系里发展我的职业,这也是更好的选择,我也就有这样的机会帮助建立一所世界领先的计算机科学系。john hopcroft:人工智能像是某种工具箱,里面有各种工具,而深度学习是这些工具中的重要的一种,至少在今天是这样。不过,某种程度上,深度学习只是高维空间里的模式识别。比如,你训练了神经网络来进行图片分类,给一张特别像自行车,但却不能骑(没有自行车的功能)的照片,模型依然会认为是辆自行车。实际上,我不认为这是种智能,因为在图片分类中,并不能从图中的物体里提取出功能,我想还得等多少年才能达到这一点。当我们真的理解了功能,我们才会进入到或许是接下来的信息革命。张宏江:从算法的角度,你怎么看,是数据和参数的问题么?john hopcroft:或许我能谈一下我是如何看待做研究的。世界上有两种研究,一种是基础研究,一种是应用研究。我看到的人工智能目前的状态是应用研究:我们开发技术用到解决重要的问题中去,很成功,对推动国家的经济发展也很重要,但基础的研究有着根本上的不同。为什么要做基础研究?做基础研究单纯是因为研究者对所研究的问题感兴趣,就是这样简单。在美国,大学里是不做应用研究的,我们觉得这不是我们的使命,我们的使命是致力于基础研究。或许我该换个词,不用使命。大学真正的使命是产出下一代的人才。当我们雇佣教员的时候,他们有40年的职业生涯,我们想雇佣在整个职业生涯中能保持活力的教员。我们喜欢的一点是,是有好奇心。我们雇佣某个人,我希望,不是看他们正做什么研究,而是看他是不是对此感兴趣,而且愿意在其整个职业生涯中保持活跃。你或许说,美国这不是在盲目地资助大学的基础研究吗,没啥目标?听起来不像是一个好的投资,但实际上,这可能是美国做出的最好的投资。因为成千上万的研究者在不同的方向探索,很多人没产生什么影响,但有时有些人做了一些事就创造出了整个全新的产业,创造出几十亿的工作,几十亿的金钱。我觉得这个是非常好的投资,希望能坚持这一点。
john hopcroft:这些年来,深度学习被证明是非常有效的,但棘手的是我们尚不能解释这背后的原因。如此一来,如果你是一名教员,那么教课时你便会遇到许多困难,因为你现在教给学生的是一门实验学科,迫切需要发展出能够解释深度学习的理论,为什么有用。一个困难是,以模式识别为例,假如你有一个猫的系列或者一个狗的系列,你没有一个关于这个系列的数学定义,那或许就有研究者退一步,造出一个数学上定义清楚的类别,能帮助证明深度学习有关的定理。我之所以关心理论的发展,其中一个原因是可以让教课变的更加容易。john hopcroft:要弄清如何做无监督学习,或者如何从一张图里面学习很重要。我可以讲一个之前和我的三岁女儿的故事,我有一本看图识字的书,我曾和她坐在沙发上一起看图然后认出是什么。有一次我和她走在街上,她指着说,爸爸,消防车!她实际上只看过一次消防车的图,就认出来了。我一直想弄明白为什么,或许人学到了如何去学。她在看那一张图之前已经看了几百万张图,之后她从一张图中学会了如何去学。这意味着,关照多个学科是重要的,比如理解人脑是如何工作的,在过去的25年有很多的关于人脑的研究,也许知道人脑如何学习会帮助到机器如何学习。张宏江:了解到人脑是如何工作后,可以将其转化成数学模型或者算法么?john hopcroft:我对大脑是如何工作的知道的很少,我读过一些研究,好像刚开始的时候脑中的神经元的距离是比较远的,然后有一个转换阶段,神经元靠的近了。另一件事是,在大脑的前5年,神经会产生新的连接,然后有一个转换期,再有新的神经连接也不会有太大用处。你可以借鉴这些,然后看是不是可以用来训练神经网络。基础研究有一个特点,好几千人尝试各种的想法,但往往没什么价值,但有一两个人会有非常重要的回报。john hopcroft:这个事先是不知道的。我可以稍微谈一下美国的资助。当我提交申请书时,资助机构并不要求我按照申请书所写的来进行研究,他们之所以进行资助,是想产生下一代的人才。如果我觉得另外的研究是重要的,他们是高兴的。这可以追溯到1960年代,当我完成研究项目时,我不会写汇报,而是大学会写汇报,说明钱是怎么花的。资助机构也不指定哪些方向会得到回报,他们评判是根据下一代的人才,他们开拓了哪些方向。张宏江:我很好奇,如果你是资金管理者,会把钱投入人工智能的哪个方向上?john hopcroft:要决定方向的话,我觉得有两件事是值得考虑的。其中一件事是短期的,你想提高中国或者北京地区的国民生产总值,创造就业,这样下来你或许得帮助公司所做的事,比如人脸识别、图片识别、机器翻译,所有这些重要的事情。但你还得或许花点钱,用来产出下一代的人才,还应该着眼于长期。张宏江:现在几乎每个主要国家都有自己的ai战略,你认为近些年两届美国政府在人工智能发展上做对了什么?john hopcroft:或许我应该说一下,在我开始职业生涯时,政府甚至不相信计算机科学是重要的。政府寻求一些物理学家的意见,他们倾向于认为计算机科学是在训练程序。现在看来,一个新的领域要发展是很难的。老的领域不想让出他们所拥有的资源,但美国在这方面做的很好,在美国国家科学基金里面提高了计算机科学的资助金额,美国高等研究计划署也进行了很重要的资助。但至于你说的ai战略,从美国的版本来看,都是些很明显的东西,如果你问非科学家该怎么办,就是对人工智能进行长期的投资。我读过后,没有从中发现什么有洞见的的策略。john hopcroft:我也不确定美国是否能够在人工智能上保持领先,因为我觉得投资还不够。我真的觉得我们在进入一个信息革命的时代,社会的性质将随之改变。我想说,学生往往都会用脚投票,学生意识到将来是信息技术的时代。我相信今天的大多数美国大学,有10%的专业是与计算机科学相关的,但经费并没有按照这一趋势进行分配。john hopcroft:在这方面,中国其实有很多优势。以手机为例,当移动网络刚刚出现的时候,美国几乎所有家庭都已经安装了有线宽带,所以我们并没能足够重视它,中国则投入大量资源对这一产业进行发展,因此比美国在很多方面领先,比如中国人用手机做几乎是所有的事情,美国还没有达到这样的水平。我想在一些地方,中国没有美国那样完善的设施,发展的速率要快很多。张宏江:自动驾驶面临一些安全的问题,但也有人担心工作被代替,你怎么看?john hopcroft:要在城市的街道上驾驶是非常难的,有行人,有自行车,有汽车。但美国有洲际高速路,车就在车道里开,不会来回变道,自动驾驶的话就要容易些。我想象的,司机把车开到高速路口,然后车辆自动驾驶,出高速时再由司机来接管。这个问题就要简单的多。张宏江:我也同意,自动驾驶卡车要容易,但为什么没怎么做?john hopcroft:我不知道答案,或许是因为相对于在城市载客,可能没有多少“钱”景。在自动驾驶上,车路协同是一个好的发展方向,或许可以让道路将信号传递给车辆,再由车辆传递给彼此,把路封起来,不要让动物穿行等等来实施。可我们似乎没有朝着这个方向发展,而是试图去解决一个非常非常难的一般性的问题(让车辆自主自动驾驶)。中国可以很容易地由政府设置一条“自动驾驶专用车道”来进行试验,但在美国就几乎不可能。张宏江:现在我们看到尤其是在中国,很多大学都设立了人工智能学院,你的意见是?john hopcroft:我不太清楚为什么要创立这么多的人工智能学院,但也可能是政府限制计算机科学相关的专业,但太多学生想学这个,所以大学就建立人工智能、软件工程等专业来解决这些问题。在我看来,我们正进入一个新的信息时代,大学会想建立一个信息科学这样的系,像之前的工科、科学、艺术一样。因为这个领域的专业太大了,需要5、6 个系,或许信息科学学院可以把这些都囊括进来。这将是一个很大的工科,我想很多学校做的是对的事情。张宏江:但人工智能也有起起伏伏,如果这次人工智能的冬天来了,那这些学校再裁减人工智能的专业么?john hopcroft:当情况变的时候,事情也会随时有变化。以我曾学习研究的电气工程为例,它曾经是一门关于发电和能源传输的学问,但在近几十年的发展中将无线电和计算机也融入其中,电气工程之所以如此成功,是因为它们不断的变化,人工智能也需要如此去做,如果人工智能做的还和我们今天一样,那可能会有问题。我就是相信,我们正在进入一个信息是很关键的社会,工业革命解放了我们的身体,我们现在所做的是自动化智能,我不认为这个进程会停下来。
张宏江:除了图灵奖,你还有一个重要的荣誉就是“中国政府友谊奖”。你也曾经在教育方面给我们的总理提出过建议,在中国的高等教育上倾注了大量的时间和精力,为什么这么做?john hopcroft:一直以来,我都想做一些能够让世界更好,让尽可能多人受益的工作。在我来中国之前,我在15个不同国家(哥伦比亚、巴西、墨西哥、印度等)都曾进行过教育工作,帮助过几个教员和学生,但从未有过机会能够影响到他们的教育系统。中国教育部邀请我到中国,就跟之前这些国家有很基本的不同,政府希望对本科教学教育进行提升,我也就有机会会产生影响。其他国家的政府集中在其他事情上,努力提高教育不是他们最关心的,我觉得以前这些国家的优势是能源和材料资源,但这些别的国家也有,顶尖国家有的是人才,这才是推动国家进步的动力。中国,我想是知道这点的,如果你和中国政府谈,他们会说,我们必须提高本科生的教育,提升人才,这样公司才能不断扩张,持续的盈利。这是中国的机会,这就是为什么我要做这个。john hopcroft:我应该提一下,20年前,孩子必须有个学位才能得到一份工作,上大学的人数以每年100万的数量增长,中国要持续发展,必须有能力容纳更多的学生,相当于每年要新建50所大学。我觉得,其中的一个障碍是,在中国,一个校长的任期只有五年左右,因为他们是政府公务员,任期结束后会转到另外一个工作。为了证明他们的成绩,他要盯着大学国际排名这个指标。然而,这些排名考量指标是基于研究,发表文章的数量,而和大学的宗旨,也就是造就下一代的人才几乎没有什么关系。因此,我认为中国可以做的最重要的事情是改变对于高校校长的评价维度。我交谈过的校长都是世界水准的人,有知识,有才能,如果把本科生教育作为评价他们工作好坏的指标就好了。另一件有意思的事情是,我觉得中国顶尖学校的一年级学生质量比美国的大学好,如果清华、北大和上海交大等能提升本科教育,那就可以超过斯坦福、伯克利和mit这些机构。john hopcroft:我非常享受教育和科研,或许我可以给新刚开始职业生涯的年轻人一些建议。如果你想在职业上成功,你一定要做你喜欢的;如果你是教学生,不要仅仅教他们教室里学的,还有其他的技能。狭隘的技术教育可以带给他们第一份的工作,但你应该给予他们更宽广的教育,历史学,社会学等,促使他们成功并享受人生。张宏江:作为年轻的教员,如何在发表文章和教育之间得到平衡?john hopcroft:如果一个本科生找到我,说希望能够做些研究,我会劝告他,科研可能不是你现阶段最应该花时间的事情,除非你想要借此进入一个博士项目。因为如果你要进入一个好的博士项目,或许你得有发表。1964年,普林斯顿大学在我没发过一篇论文的情况下雇佣了我,今天我怕是连研究生都进不去。因为他们关注的是我是否在整个职业生涯长期保持活跃,而非我已经做了的研究。张宏江:在计算机领域,我们很多人都是先成为ieee fellow,之后继续做的好,成为acm fellow,可你却是先获得图灵奖,然后才有其他的荣誉和头衔,你有什么更好的建议给年轻人?john hopcroft:完成要求你的最低论文发表量,然后把精力尽可能投入到那些基本的研究上去。如果你做出了基本的发现,那你就会得到应有的承认。事实上,我认为今天世界上如此之高的研究发表量正在伤害科学的发展,如果你学一门新的学科,有太多的文章要读,无形中增加了人们筛选、检索的时间。1939年,john出生在西雅图。那时,西雅图还是一个小城市,人口不过50多万。在华盛顿湖的彼岸,也就是今天微软等公司聚集的地方,当时还是一片林木。小时候的john经常和小伙伴在林中漫步,看到一条延伸进树林深处的小径,充满好奇的他往往要一探究竟。john的家庭条件非常穷,双亲也没什么文化,高中都没毕业。父亲早年是从加拿大边境偷偷到了美国,拿着一半的最低工资,过着节俭的生活。不过幸运的是,john 的父母亲感情很好,从来没说过对方不好的话,而且一心为了john,希望他将来能过更好的生活,也希望他能接受教育,上大学。父母亲对john特别关爱,教他游泳,做各种事。john 回顾这段历程时说,这种早期的关爱、稳定的环境可能有利于孩童的大脑发育,他之后的成功很多要归功于此。上学之后的john最擅长的科目是数学,最差的是历史。那个时候的历史课就是罗列谁是将军,打了什么仗,什么时候打的,却很少解释,为什么世界是如此的走向。高中的时光,john还是很专心在学业上,不过其实没那么紧张,学校下午3点以后就放学了,下午和晚上都可以自由支配。john 印象最深的一位高中老师是教代数的,也是一位足球教练(也就是说,john的数学是体育老师教的)。但这位老师对学生特别关心,特别在乎学生能否取得成功,而john为了不让这位老师失望,也在努力的学习。在接受访谈中,john 好几次都提到,一个好老师最重要的是要在乎学生能不能取得成功。高中毕业后,john本来打算就近去华盛顿大学读,但该校的一位教员告诉john,你的学校是没有资质的,不认可。john 回过头来在老师的建议下报考了斯坦福大学被录取。在斯坦福,john 3年时间读完了硕士,博士,24岁就博士毕业,那个时候读书也不需要熬那么长的时间。不过,那个时候的斯坦福其实没有计算机科学系,john入的是电子工程,学些电线、真空管。那时华盛顿大学物理系老师有一台电脑程序不工作了,请john去找bug,那是他第一次接触电脑。直到今天,john还清楚地记得,那是一台ibm650,还有转鼓那样的东西。那时,没有编程语言,john 用的汇编语言也只有10个符号,他也从来上过编程课。作为一名电子工程系的学生,john也上实验课,但他很快意识到,自己其实并不擅长摆弄各种物理器件。他更擅长的是偏数学或者理论的东西,比如信息理论。从斯坦福博士毕业后,john本打算到华盛顿大学谋一份教职。有一天,他经过bernard widrow的门口,bernard正和普林斯顿大学的edward j. mccluskey打电话,mccluskey问是不是有合格的博士毕业生可以来做教员。john就这样因缘际会面试后去了普林斯顿。john后来说,自己的人生很多时候都是偶然的,也并没有做特别的规划。当john应聘到普林斯顿时,普林斯顿同样没有计算机科学系。他进的电子工程系,而且是一篇文章都没发就被录用,这在今天几乎不可想象。那时,计算机科学系刚刚出现,1964年美国的普渡大学建立了第一个,之后斯坦福大学,康奈尔大学等也相继建立了计算机科学系,都在招聘教员。在普林斯顿,john开设了第一门计算机科学课。当时,mccluskey叫他去教课,但却没有任何教材,john就在几篇论文的基础上写出了一本日后风行几十年、每一个计算机科学系都会用,对计算机科学领域产生巨大影响的经典教材。john写这本教材不仅是总结当时的研究成果,而是把自己创造发展的东西都写了进去,几乎是树立了业界的标杆。当时上课的学生也没有很多,只有六个人,但日后都取得了杰出的成就。在普林斯顿呆了2年半后,1967年,john去到了康奈尔大学。一直到今天,他都是该校的教授。离开的原因,john说,当时普林斯顿的电子工程系比较成熟,一有教授的空位,往往有十个合格的候选人。具有前瞻眼光的mccluskey尝试推计算方面的人,但因为没有学科设置,要难很多,而且也不好说,计算机科学正在成长,最好还是进一个这方面的人。john离开普林斯顿还有一些偶然,当时他主持一个系列研讨会,但预算只够请两个外边的人,其中一位是康奈尔大学的juris harmanis。juris harmanis是1965年康奈尔大学计算机系的创系主任。从harmanis那里,john得知,康奈尔正在招人而且助理教授的薪水要比自己高50%。john决定去康奈尔,他后来说,去一个更明白他所做的事的系比呆在一个靠斗争才能获得认同的系要好。到康奈尔后,john从之前的形式语言、自动机理论转向算法研究。他意识到,计算机科学是一个很广的领域,而算法尤其重要。他研究过分而治之、深度搜索等这些我们今天本科生都在学的算法。在斯坦福休假期间,他见到了bob tarjan,并和他共用了一间办公室。那时,bob是一名博士生,正在研究判定一个图是否是平面图,他们一起发展了一种线性的算法。这个结果也被认为是两人合作的最重要的成就之一。john说,一个人呆在办公室,隔离起来不好,别人对你研究的问题有不同的看法,通过讨论,思路慢慢的就会清晰起来。在康奈尔,john与人合写了另外一本非常有名的算法设计和分析的书。对于另外两位作者,alfred v. aho 和jeffrey d. ullman,john说其实他们两人也做出巨大的贡献,但图灵奖好像是只挑一个,对他们来说不太公平,可无奈已是事实。从1964年博士毕业到1974年,john的前十年可以说收获颇丰。也就是35岁之前,john已经做出了相当的成就。而一个人往往也是在职业生涯的早期就做出了最要紧的工作,john分析说,可能是因为年轻时候时间比较多,另外,年轻教员往往比研究生大不了几岁,都在职业的建立期,关系上比较契合。日后,当john变得“老”之后,当有学生找他做导师时,他也建议他们去找助理教授,就是因为师生关系会发生微妙的变化,他也许可以给一些建议,但可能不会“同甘共苦”。功成名就之后的john,在48岁当了5年的系主任,之后进一步做了工程学院副主任、主任。john说,其实他之前不想做行政,只是系里没有更资深的人了。不过,当了之后,他觉得还挺好,可以发挥更大的影响。john做行政也是有声有色。考虑到学校是由系组成的,他下放了很多权力给系主任——在给了系一定的预算后,雇多少教员、支付多少薪水都由系说了算,只要是在预算内。可不同的系如何分蛋糕呢?john注意到,一些系主任就是比其他的系主任好,而杰出的系主任也会招聘杰出的教员,所以在经费方面,john会相应的有所倾斜。另外,john也会根据教员教多少课以及多少学生进行综合的考量。可见,他一直重视教课。1992年,53岁的john被美国当时的总统布什委任担任美国科学委员会的成员,美国科学委员会是管理着美国国家科学基金。john说,这么年轻就被委任这么重要的职位,充分说明在一个新兴领域是多么的幸运,他曾经教了第一批计算机科学课,这让他年纪轻轻就成了比较资深的计算机科学家。当美国政府找最资深的计算机科学家时,已经没有人排在john的前面。john说,“如果我是在高能物理领域,恐怕到今天还得等高级的教员退休才能轮到我。我只是想说,计算机科学在不断变化,一个年轻人不该固守在旧的领域,应该走向新的方向,就会很快变成资深的人士。”8年之后,结束行政工作的john又重新返回了教授的职位。在经过一年集中精力搞科研后,john又能够重新捡起来,回到了研究的道路上来。他先是做了社交网络,之后又开始做机器学习,直到现在。实际上,他成为了一名人工智能的研究者。从2002年开始,john又把他的足迹深入到了巴西、智利、哥伦比亚、印度、墨西哥、沙特阿拉伯、越南等国家,当然还有中国。2016年9月29日, john在人民大会堂接受了“中国政府友谊奖”。在过去的这些年,john帮助中国的大学提升他们的本科教育,改善评价机制和招聘,培养学生,可谓尽心尽力。他曾经在上海交通大学、北大利用寒暑假时间亲自讲课,招收学生到康奈尔实习、做研究。他还担任顾问,为中国的本科教育出谋划策。最近的事情是,在2017年5月,他受聘担任了北大访问讲席教授,前沿计算研究中心主任,并主持开设图灵班。也是在中国,john感到,与之前他去过的其他国家相比,自己的作用和教育理念得到了很好的发挥。他喜欢呆在中国,帮助中国,他和中国的故事还在继续。
制版编辑 | 斯嘉丽