财新传媒
位置:博客 > 集智俱乐部 > 饮水思源:漫谈人工智能与人类智慧

饮水思源:漫谈人工智能与人类智慧

文 | 王雄
 
记不得这是毕业后第几次回闵行了,感谢思源湖的邀请,也感谢我在十忙之中抽空,回到思源湖边站一站(下雨没法坐),在上中下院自习室里静静地自(wan)习(shouji)一会。不像以前在交大时年轻了,一坐一天可以看完一本书,然后感慨这些写书的人不过而已啊,现在长大了,慢慢就变成曾经鄙视的人,只能敲打敲打一下键盘,记录记录一些流云思绪,供后来的年轻人几分钟读完后鄙视一番增加其信心,这也算就是达到价值了。想说的很多,还是先聚焦在这几天讲的听的报告的一个主题上:人工智能与人类智慧。
          
饮水思源
 
入学交大就接受了这个校训的教育,当时的理解是某种感恩精神,我们要努力工作回报父母、回报母校、回报祖国的养育。后来我慢慢加深了更多的理解,对校训的理解更加丰富了,越发觉得这是很智慧的一个校训,慢慢地作为各种学习研究工作生活的指导思想。饮水思源,从人类的高度来讲,是要去思考本源,宇宙自然的本源是什么,人类智慧的本源是什么?
          
大千世界不二法门  
 
这实际上就是科学的两个方向,两个极致,一个是统一性,一个是复杂性;一个是本质规律的深刻简洁,一个是涌现现象的缤纷复杂;一个是不二法门,一个是大千世界。这篇文章是关于人工智能,那么重点谈论后者。
 
奇妙的是,统一性方向是人类把宇宙中的纷繁复杂的现象都归结为越来越深刻和统一的规律,是认识外在世界的方向,是认识宇宙起源的方向;复杂性方向则是由认识复杂系统,生命系统,慢慢开始认识人类,认识自我的过程。两个方向,一个探索宇宙起源,一个探索智慧起源,最后都统一为认知的本身。宇宙即大脑。
         
复杂性科学与人工智能
 
我认为,复杂性科学的目标是理解由统一物理规律支配的世界的多样性,理解各种尺度的复杂系统的涌现规律,终极目标是理解人脑这样的复杂系统,并解决智慧起源的问题。所以理解复杂性是从科学诞生之初就确定的目标,复杂性科学任重道远,人工智能也已经发展六十多年,那么最近兴起的诸如深度学习等,其实只是这个路径上的一个环节。
         
奇点在九天之外   
 
如果是复杂性的极致,理解了智慧起源,才算是某种奇点,那么以现在的人工智能的境界还有好几层要去突破和飞越,所以这种境界的飞越不是在现有框架内提高算力、增加数据、改进算法就能突破的,我觉得,奇点尚早。但值得强调的是,由于机器的指数级进化,所谓尚早是从境界超越的角度看,不一定是时间的角度,所以尚远可能不是那种自然进化亿万年的事情,也许也就几百年的事情。
          
阿尔法狗是人工智能的伟大胜利  
 
AlphaGo的突破,其实是以传统的蒙特卡洛树算法为骨架,以深度学习、强化学习等等为血脉,达到了一种超越目前人类棋手的围棋算法。
 
首先,这确实是人工智能的一次巨大胜利,因为围棋的可能性是如此巨大,大概超过了宇宙里的沙子的数目,任何人类能想象的巨大暴力的算力在围棋的浩渺可能性面前都是沧海一粟,即便谷歌确实动用了强大的TPU来支撑计算,且计算的耗能也是相当巨大的,但是这些对于围棋来说仍然是等价无穷小,所以你不能说这是暴力搜索,所以确实是有智能的成分在里面,而且最新的深度学习强化学习在其中确实扮演了重要作用。
        
阿尔法狗并没有终结围棋
   
其次,其实并不能说阿尔法狗已经终结了围棋,只能说已经彻底甩开了人类。在浩渺的可能性里面,理论上仍然有巨大的进步空间。但作为人类发明的游戏,已经超越了人类,那就算通关了,再去纠结,只能当做是算法练兵场了。所以deep mind功成身退,把人类彻底甩在身后,并留下了几个局狗与狗对弈的传世棋谱,供人类膜拜赏析。而deepmind公司则继续去把人工智能技术运用在医疗等等对人类福祉更有意义的领域,这种价值判断和格局,反正不是现在人工智能所能想象的。
          
阿尔法狗远不是通用人工智能  
 
第三,其实阿尔法狗远不是通用人工智能,其算法的骨架还是非常传统的蒙特卡洛树,这大概是针对棋类游戏最好的框架,流行的深度学习和强化学习只是辅助构建了落子网络和棋局判断网络,给了蒙特卡洛树更聪明的减下搜索广度和搜索深度的方法,从而大大提高了算法的效果。如果是不完全信息的牌类游戏,这个框架就没用了。另一个比较有名的德州扑克里的冷扑大事,则运用完全不同的算法框架,那个大概基于的是博弈动态优化的框架。所以deep mind,谷歌和人类的梦想远不止于阿尔法狗,是想发明通用人工智能。
          
关于阿尔法狗的盘感、大局观、灵感、美感  
 
值得一提的是人类棋手所得意的大局观、棋感,这些往往是我们引以为豪,认为是机器不可超越人类的地方。然而在解读阿尔法狗棋局时,人类顶级高手都不得不惊叹。AlphaGo对局李世石下出石破天惊的一步,棋圣聂卫平先生向AlphaGo的下法脱帽致敬,这说明深度学习算法已经能够自发创造美学价值。“AlphaGo机器人下棋的方法是人类想不出来的。它有几次小的失误,之前我认为这种失误对李世石是有利的,现在看起来AlphaGo是以小失误换取更大的胜利。”金成龙表示,他能感到机器人有全局的判断能力,“如果这是它以小失误换取最后胜利所做的取舍,那么这让我感到非常地恐惧。”许多棋手在棋盘方寸间纵横一生,所追寻的就是美轮美奂的神机妙手。如此深邃优美,玄奥抽象,一夜间变成了枯燥平淡的神经元参数,这令许多人心生幻灭。推而广之,所谓的灵光一现的艺术灵感,就其本质可能也是一些参数空间中搜索出的一个个吸引子。
          
关于人工智能创造艺术   
 
早就有人用神经网络,可以做到模仿生成任何一个风格的图画,即给定一个任意内容可以画出某种你指定的风格的图画出来,内容和风格分离开来。人类当然也有这种能力,周杰伦可以把任何一段旋律改成肖邦的风格,改成莫扎特的风格。最新的研究表明,除了附加风格,人工智能也可以像毕加索一样创造图画。这些作品给人去区分,都很难区分哪些是人哪些是机器创造的。甚至有人说,在作画这个方面,机器通过了图灵测试。这让我想起了一个电影《机械公敌》里的桥段,威尔史密斯扮演的警官在审讯机器人Sunny,警官很鄙视机器人,说你能创造伟大的交响乐吗,你能把一张白纸变成一个艺术品吗,机器人很诚恳地回答,不能,然后怼了一句警官,你可以吗?然后警官就尴尬了。没想到这个电影十几年过去了,机器人已经可以创造图画了,甚至超越了绝大多数人,而且都无法区分。所以艺术制造,绝不是人类以为的自己的保留地,机器完全可以创造出足以乱真的任何艺术品,音乐、书法、图画、雕塑、建筑等等,琴棋书画,样样精通。虽然你仍可以争辩,机器并不懂审美,但我可以想象未来有大量的机器创造的艺术品,可以给人类带来丰富多彩的艺术体验。像琴棋书画这些,任何一个具体领域内,人类渺小的那些自以为是的感觉、美感、灵感、经验都是可以被机器学会的,但这并不是叫做取代,这也并不是否认艺术大师。我想被取代的是那些作为职业的艺术工作者,而不可能取代创作的大师。我更想表达的是,既然艺术都会被机器学习,人类还有什么值得骄傲的地方?
          
人类的骄傲在于理性思辨   
 
回顾人类攻克围棋的过程,从一开始的规则驱动的暴力搜索,到特征驱动的线性模型,再到数据驱动的深度学习,越来越强的模式识别能力让“直觉”两字从神秘莫测,变成了通过大量样本能学到的模型。机器因为有了更强的直觉,才能在图像识别和围棋上打败人类。反而是,要让机器像人一样作理性推理,目前还比较困难。有效的逻辑和理性思维能力同样是依赖大量的直觉去找到正确的逻辑链条和理性判断,然后再回头验证。直觉的错误率是很高的,就像围棋的DCNN经常给出不靠谱的着法一样,需要MCTS的价值判断来纠正。逻辑思维的强弱,实际上是自我学习自我纠错的能力。人类在这方面,仍然比计算机要强得多。和人类智慧相比,人工智能的符号主义方法依然处于相对幼稚的阶段。
         
人类之光科学四重境界  
 
说到这里我就又要不厌其烦地为人类宣传一次,这是人类文明几千年里发生的最美好的事情,是人类最耀眼的一些光芒。人类的伟大就在于这种登高远望、高屋建瓴、境界的提升,以人类极其有限的经验范围体察到了远超越人类时间和空间尺度的宇宙的深刻奥秘。
 
近代科学起源于一群仰望星空的人,他们敬畏自然忠实观察记录星空,并跳出自我为中心总结出星空运行的正确范式即日心说,这些数据的积累和运动范式的理解是一切科学的基础,是科学的第一境界,代表人物是第谷与哥白尼。
 
第二重境界是,继而在纷繁复杂的数据里,建立了一个简洁的数学方程模型,模型是不依赖于数据的具体表达形式,模型是所有数据都要去遵循的,代表是开普勒为星空立法。这里再多说一下这个模型,从复杂性的角度,模型有三种。开普勒的模型是确定的数学方程,这是完美的数学模型。现实很多问题还有别的数学模型,如统计的随机的模型,神经网络出现后,通过神经网络来描述数据里蕴含的规律,连随机方程都写不出的,更少有数学的表述。这三种模型都是对现有数据的总结和归纳,都能很好的描述现有数据的规律,都有一定的外推能力,现在机器学习在做的就是这种建模,只不过是对更复杂函数的建模。模型的境界有几个问题,1、知其然不知其所以然,开普勒只知道总结出这么几个规律,所以只能把这些什么三定律当做基本假设承认,并不能探求背后的原因;2、不同的模型看不到其内在的联系和统一性,产生割裂的一个个的模型来描述本质上一样的规律,比如天上的椭圆的规律是一套东西,地上的抛物线的规律是一套东西,完全不同的数学模型;3、当然这种统一性的要求也不仅仅是理论美学的要求,也有实用的问题,如果没有统一的理解,怎么把地面上的东西送上天,你只知道地面上的东西是抛物线,上去了就一定会下来,却不知道速度足够大就可以摆脱抛物线的模型,这就是割裂看待事物的局限和可能造成的错误。
 
第三境界就是建立真正的物理学,是不依赖于模型的具体表达的,是所有子模型要遵循的,是研究事物运动的力学机理。这个工作对于引力,就是牛顿完成的,牛顿统一了天上的规律和地上的规律,建立的万有引力完美统一解释了这些,也让人类可以发射卫星登月等等。到力学层次的不多,除了牛顿力学,还有麦克斯韦的电磁力学,还有后继的弱相互作用和强相互作用。这是目前人类知道的四种相互作用,看这些仍然不够统一和深刻,所以有了第四重境界。
 
第四重境界就是原理,是不依赖于力学的具体内容,是任何力学都要遵循的法则,是最深刻的,是最普适的。到达这个层次的,只有爱因斯坦的广义相对论,还有最小作用量和局域规范性原理这些比较接近,但这两个本身不独立成体系,还需要其他外部假设输入。
 
这些都是人类的智慧之光,或者说是一般智慧生物的智慧程度的检验,如果有外星生物,我们很难去拿什么我们的商业财富什么的去和他们交流,太丢人,也很难去拿我们的艺术和他们交流炫耀,没法沟通,我们只能说,我们有爱因斯坦,我们有广义相对论,我们有核武器等等。之前有一句话说二十世纪发生了太多事情,有两次世界大战各种大的事件,但真正重要和值得被历史留下的只有相对论和量子力学。那么推而广之,人类历史发生了太多事情,真正值得被记住的,只有我说的这四重境界了。
         
人工智能的四重境界  
 
前面又回顾了一下人类的光辉历程,那是一个向外去探索宇宙的过程,另一个人类伟大的探索就是向内去认知自我,这其实就是复杂性的发展方向,人工智能就是这个方向上的工具。且不说人工智能,先把复杂性的方向也梳理一下,为以下四重境界。
 
首先第一重境界是在客观的物质世界里的复杂性,比如多体问题,比如原子分子系统,比如复杂的材料,比如光电子工程等等。现在很多人工智能的东西已经用在这个境界里了。比如量子多体问题与深度学习网络的奇妙联系,利用深度神经网络可以有效地表示几乎所有量子多体系统的波函数,神经网络和深度学习算法在量子多体问题里有天然的应用潜力。所有这些人工智能算法本质上和物理学是密不可分的。
 
复杂性的第二境界,就是生命。这个层次上的复杂性,也是已经开始被人工智能所侵占的。比如所谓层次特征( Hierarchical Features ) 猫的视觉中枢中有些神经元对于某种方向的直线敏感,另外一些神经元对于另外一种方向的直线敏感;某些初等的神经元对于简单模式敏感,另外一些高级的神经元对于复杂模式敏感,并且其敏感度和复杂模式的位置与定向无关。这证明了视觉中枢系统具有由简单模式构成复杂模式的功能。这也启发了计算机科学家发明了人工神经网络。人类具有多个视觉中枢,并且这些视觉中枢是阶梯级联,具有层次结构。人类的视觉计算是一个非常复杂的过程。将猴子的大脑皮层曲面平展在手术台表面上,人们发现从视网膜到第一级视觉中枢的大脑皮层曲面的映射( retinotopicmapping )是保角映射 (conformal mapping)。这一阶段,人类通过认识生命,特别是生命里的神经系统,来开发人工智能,来认识自己。
 
复杂性的第三境界,就是社会。人工智能在这个层面上就是研究群体涌现的智力。比如蚂蚁蜜蜂等集群动物他们涌现出来的某种智能。机器人集群之间的协同合作。
 
复杂性的最高境界,就是智慧。当个体有生命、群体有社会,才能产生智慧。一个再聪明的大脑,没有全体人类的知识积累,也很难独立完成发现。但作为站在群体智慧积累之上,巨人肩膀上的智慧,这是复杂性最高的境界。
我们看到,人工智能就是人类在认知自我的过程中的有力工具,而证明我们真的认知的东西,就是我们能有效创造出来这个东西。对于外在世界的认知,已经让我们创造了巨大的工程,卫星飞船上天,航母潜艇入海。那么对于内在自我的认知,可能会让我们创造出越来越接近人类的机器人。
推荐 1