卡内基梅隆大学教授 :是时候打破人脑与机器之间的壁垒了
►卡内基梅隆大学计算机科学学院教授tom mitchell
编者按:
4月27日,由长城会主办的全球移动互联网大会(gmic)在北京开幕,在其中全球科学创新峰会上,美国卡内基梅隆大学计算机科学学院机器学习系主任tom mitchell做了“突破人类与机器的壁垒”的主题演讲。他认为,脑科学和人工智能在过去几十年都有了巨大的发展,现在是时候打破它们之间界限的时候了,未来将发展出更加具有人类能力的人工智能,我们对大脑的理解也将会更加计算机化。以下内容整理自嘉宾演讲,未经演讲者审阅。
演讲 | tom mitchell(卡内基梅隆大学计算机科学学院教授)
整理 | 刘美幸、刘嘉欣
责编 | 陈晓雪
●●●
智能如何在物理材料中实现突破?这是科学界一个伟大但未被解答的问题。
我们当前有两种研究的方式:研究大脑,因为我们的大脑是智能的;努力开发人工智能。这是两种研究智能的方向,而且人类对它的研究已经进行了很长一段时间了。
关于智能的这两个研究方向是不是“相差太远”了?它们就像是在互相忽视对方一样,从来没有交集,这两方面的专家对对方领域都了解得不多,是不是到了该让它们产生交集得时候了?是不是该进行一些战略改变,投入更多的资源进行两者之间的交叉研究?
实际上,这两方面在过去几十年都取得了许多显著进步。人工智能在围棋、国际象棋、扑克等方面取得了不俗的战绩,包括去年战胜围棋冠军李世石。计算机视觉进展也很快,过去十年里面,识别率从60%变成了95%。去年10月,微软已经宣布了它相应的一个数据库,也实现了主要突破,比如前面讲到了下围棋、下象棋,人工智能突破非常快,背后主要是一个深层次的机器学习。
脑科学发展也非常迅猛,我们能更好地引入功能性磁共振成像(frmi)、脑电图(eeg)等高科技,这些微创或者无创的方法使得我们可以在毫秒间分析几千个影像,查看人脑的一些活性。与人脑研究相比,动物的大脑研究更加令人欢欣鼓舞。我们对老鼠和其他一些动物进行基因改造,对它稍微放电刺激,研究动物大脑基因的一些修饰、改变,这样可以更好地管理和控制人的神经活动。当老鼠在迷宫中跑动时,我们可以扫描其脑活动,而当老鼠在一个迷宫行走的时候,我们可以通过它的神经元放电的状况来了解老鼠对自己位置的感觉。我们还发现人们社交时,大脑中管社交的部分会得到同步激活,而且自闭症患者和正常人在该区域会出现不一样状况。
无论是在人工智能方面还是脑科学方面,我们都取得了令人瞩目的巨大进展。所以,就有这样一个问题,它们为什么不聚合起来?无论脑科学还是人工智能方面都是进行交叉的研究。
首先是计算机视觉,这样的一个神经网络,可以用来预测人脑当中的神经元的活动,包括它的视觉皮层相应的活动。我们可以来看一些细节,单个神经网络当中的单元,通过输入输出可以看到相关的情况,它的输入可以进行研究,它到底是怎样的组合,我们也可以看到单个神经元组成的网络,一个输出成为另外一个输入的情况,如果对这样深层次的网络进行训练,比如把输入的影像通过输出,展现出这个影像到底是什么,实现相应的深度学习。
2014年,我们做了一些实验,训练了不同的网络,每一个点都是代表他们训练过的人工神经网络。在训练了这些神经网络之后,我们把同样的影像给另外的神经网络看。fmri扫描也在人的大脑当中相应的部分观测到神经活动,有相似的预测。这是令人一个非常称奇的结果。我们现在可以建立一种桥梁,训练人工神经网络,预测大脑的脑神经活动。这样就打开了无限的可能,可以回答很多有趣的问题。比如,人的视觉到底是怎么运作的,可以用怎样的设备设计更好的人工神经网络帮助我们做这样的预测。这样人工的神经网络可以进一步推动,一层一层地输入、输出,而大脑的确是不一样的,大脑是有前输和后输的,而我们就可以在这个桥梁当中研究,人工的大脑和人的大脑当中到底什么区别,可以相互借鉴、促进。
这里有另外一个例子,来自于最近的一个研究,自然语言的研究已经得到了很大的提升。比如谷歌翻译现在也比之前要更加精确了,为什么呢?主要是由于深层次的神经网络,甚至是因为有一些储存。通过对大脑的研究,我们来研究大脑怎么样用这个神经活动来解释相应的一些词义,这些词义给我们一些更好的回答问题的方式。对这些细节进行研究后,我们产生一种模型或者理论来帮助我们对大脑的活动进行预测,任何一个词输入人脑会出现怎样的一个词义。通过这样一个模型的结构,任何输入都可以被研究。比如说电话,首先这个模型产生一个代码,用它预测大脑的神经活动,能预测出大脑中两万多个不同的位置。进一步通过矢量预测,比如这里是“芹菜”和“飞机”两个矢量,两个矢量的特征都和相应的词对应,我们可以看到和芹菜相关联的有“吃”,“味道”一类,而对“飞机”来说,相关联的就出现很多动词,相关的一些词就出现了。
通过这样一些模型当中的编码,可以很好地反映出皮层中出现的词,有助于我们对模型进行训练。我们看到对任何词的神经活动,比如“芹菜”,把这些语义的特征组合起来,通过模型分析,关联这些特征,“吃”这个词和“芹菜”这个词是关联度最高的,通过这样的研究很有意义,给到一个新词,比如说之前没有培训过。我们发现,在83%的情况下有两个新的词,哪个是第一个关联,哪个是第二个关联,有50%的可能性是正确的,有的词从来没有出现也是有很高的识别率。词义的表达,是我们矢量表达法在词义解释上的应用。
第三个例子是强化学习,这个是非常流行的,比如相关的训练当中会出现强化学习。很多时候对动物的奖励是强化学习的一种很好的方式。
这里有张图,底部有一些横线,每一个点都是对应到猴子一个正在放电的神经元,在下面可以看到有时间的序列,给猴子一些糖,猴子的神经元就有放电的现象。神经元放电代表什么呢?可能是猴脑对这个奖励,也就是这个糖有所感应,所以放电了。
所以,实验的第二部分是,实验者培训这些猴子,让它们知道给糖之后的1秒就会开始闪光,这个图就变了。我们可以看到的就是给猴子糖以后,猴子的神经元没有任何反应,而是当闪光以后,猴子的神经元才放电,说明并不是因为给了糖神经元才反应,而是对奖励这个事情本身放电,这是很酷的情况。
第三种情况,没有给糖,只是闪光,猴子怎么反应?没有给糖,没有任何奖励,这个神经元就会怎么样来表达呢?我们发现,闪光之后没有给糖,是一种令猴子抑郁的举动。一些物质是与强化学习直接相关的。在这样的信号之下,我们可以看到的是能出现奖励和这个时间的方程式,在这样的一个情况下,很好来解释了我们能看到猴子神经元的一个表现,因此在我们的人工智能的算法和我们人的大脑之间或者动物的大脑之间,有这样一种桥梁和关系。因此强化学习的算法对机器人的控制是可以用的,或者是可以用于打败人类冠军的alphago的训练。因此,这样一些对大脑行为的观测和检测可以帮助我们进行一些人工神经网络的训练。
这就是我要讲的三个例子, 一个是计算机视觉,一个是文本含义与预测,一个是通过奖赏强化学习。
人工智能和大脑是两种研究智能的方式,二者发展都很迅速,现在到了二者融合的时间了。尽管人的大脑不是由硅组成的计算机,但是任何产生智能的物理的方式,它都是有一些信息的约束条件的,形成一种结构,这样的一种结构可以深层次地学习。在人工智能和人脑之间的学习中,我们可以找到更多的答案帮助我们推进科学的进步。
制版编辑:邓志英丨