财新传媒
位置:博客 > 集智俱乐部 > 遗传算法之父:约翰·霍兰德

遗传算法之父:约翰·霍兰德

文 | 德先生
 
前言
 
约翰·霍兰德(John H. Holland,1929-2015)复杂理论和非线性科学的先驱,遗传算法之父,又译“约翰·霍兰”。
 
约翰·霍兰德是美国约翰·霍普金斯大学心理学教授,美国著名的职业指导专家,也是著名的麦克阿瑟研究奖获得者、麦克阿瑟协会及世界经济论坛的会员、圣塔菲研究所指导委员会主席之一。1950年获得麻省理工学院学士学位。后获得密歇根大学博士,并长期任教于该校。现为心理学和电气工程与计算机科学教授。
 
约翰霍兰德于1959年提出了具有广泛社会影响的人业互择理论。这一理论首先根据劳动者的心理素质和择业倾向,将劳动者划分为6种基本类型,相应的职业也划分为6种类型:社会型、企业型、常规型、实际型、调研型和艺术型。
 
代表作有:
《自然系统和人工系统中的适应》Adaptation in Natural and Artificial Systems (1975,1992)(遗传算法开山之作,中文版由张江翻译)
《隐藏的秩序:适应性是如何产生复杂性的》 Hidden Order: How Adaptation Builds Complexity (1995) 
《涌现》Emergence: From Chaos to Order (1998)
 
人物简介:
 
John H. Holland,1929年生于美国印第安娜,在俄亥俄州西部长大。小的时候,Holland就对表现出了强烈的求知欲。他的数学和物理都非常好。高三那一年,在全州的数理考试中,他以仅比第一名低两分的成绩获得第三名,并赢得了进入麻省理工学院学习的全额奖学金。
 
Holland 的能力很大程度上从其重小爱玩游戏、发明游戏开始的。中学就迷恋上了科学,吸引他的地方在于:“科学可以告诉你,几条简单的规律是如何产生整个世界变换无穷的行为表现的。”宇宙在一个极端上十分易于理解,在另一格极端上却又永无可能理解(无穷的可能性)。
 
21岁的他参与了 IBM701(在当时 IBM 普夫吉普斯 实验室)开发,成为美国最早的编程人员之一。IBM701是计算机天才集中地,其中有约翰·麦卡锡(John McCarthy)- 人工智能创始人;阿瑟·塞缪尔(Arthur Samuel)等人。Holland研究的的计算机跳棋是人工智能研究方面的一个里程碑,他能针对对方的步骤调整自己的战术,抓住了学习和适应的某种最本质的东西。
 
1952年春,Holland听了 MIT 心理学家利克莱德(J.C.R.Licklider)介绍唐纳德·希伯(Donald O.Hebb)关于学习和记忆的新理论。希伯的理论给他打开了思想本质的窗户。在此基础上,Holland与701计算机组负责人纳撒尼尔·罗切斯特(Nathaniel Rochester)开发了一个神经网络模拟程序 “概念者”,并在1956年发表了论文。
 
就是从这时起,形成了他后来三十年的思想。他一直在思考:什么是突现?什么是思考?思想是如何进行的?什么是思想的法则?一个系统的适应究竟意味着什么?
 
1952年秋季,Holland来到密西根大学读数学博士,遇到了曾与冯诺依曼研制了第一台计算机ENIAC的阿瑟·伯克斯(Arthur Burks),1954年,死于癌症的冯诺依曼希望计算机用于两个方面,一方面是一般性功能的计算机设计;另一方面是基于自动机理论、自然和人工智能知识的计算机。
 
1959年,Holland获得博士学位,是通讯科学授予的第一个博士学位。要知道,1967年时,计算机与通讯的学科才产生!
 
菲舍尔(R.A.Fisher)于1929年发表的《自然选择的基因理论》是对Holland的影响最深一本书,该书用真正严谨细致的数学方法对自然选择如何改变了基因分布做了分析,是生物学界此类的第一本专著。到了50年代,该书仍旧代表了进化动力学理论的最高标准。Holland不认同菲舍尔的两个观点,首先,菲舍尔对自然选择的整个分析着重于一次一个基因的进化;另一方面,菲舍尔认为进化能达到稳定的均衡。Holland认为,在进化和学习中,所获(或所缺)都是给与作用着的一种反馈,以利于它们改进自我表现,如同游戏中的策略学习。Holland也认为,“均衡”并不是进化,“均衡”意味着结束。他认为进化的实质是旅程,是无穷无尽展现出来的惊异。
 
他觉得,基因是一种长期的适应性,神经是一种短期的适应性,两者的总体性理论框架是相同的。
 
1961年7月,Holland发表了48页的技术报告《适应性系统逻辑理论之非正式描述》。1962年开始,他全力投入适应性理论的研究,下决心解决多基因的选择的难题。1964年获终身教授,并开始研究遗传算法。
 
1985年,受法默的(Doyne Farmer)邀请,在洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory,LAN)的“非线性研究中心”年会(此次年会主题:“进化、游戏与学习”)上,Holland 做了“涌现”的报告。在会上,他认识了盖尔曼(Gell-mann),从而被引入了圣塔菲。1986年8月,乔治·考温(George Cowan)与斯坦福大学生物学家马克·菲尔德曼主持的《复杂的适应性系统研讨会》上,Holland 唱了主角,那次他将斯图尔特·考夫曼(Stuart Kauffman)介绍进了圣塔菲。
 
Holland是一个乐天派,一生都在做他喜欢做的事,拥有一个真正快乐的人的坦率和好脾气,大家都喜欢他。《复杂》一书里的主角-阿瑟,认为 Holland 是圣塔菲中最复杂、最吸引人的知识分子。他们合住一个房间。
 
Holland 遗传算法的思考起源
 
假设某个物种有 1000 个基因(与海藻基因数相当),每个基因含两种信息,自然选择要经过多少次尝试才能发现使海藻发展到最强壮的那组基因搭配呢?
 
如果基因之间无关联,那是2000次,如果基因之间有关联,那尝试2的1000次方次,所花时间是宇宙大爆炸到现在的好多倍还不止。因此,“这是一个向着无穷无尽的可能性的空间探索的系统,不存在哪怕为一个基因找到“最佳”点的现实希望。进化所能达到的是不断改进,而绝非尽善尽美。” 荷兰德想知道的是,进化是怎样于无穷无尽的可能性的探索中找到有用的基因组合,而不需要搜遍整个领域。
 
直觉告诉Holland,某些基因组之间能够很好地相互作用,形成统一而自我强化的整体。如果一个基因群有足够的统一性和稳定性,那么这个基因群通常就可以作为更大的基因群的建设砖块。细胞的结合形成生理组织、生理组织的结合形成器官、器官的组合形成生物体、生物体的组合形成生态系统,等等。Holland想,确实,这就是“涌现”的全部意义:一个层次上的建设砖块组合成更高层次上的建设砖块。这似乎是这个世界最根本的规律之一。这一规律当然也表现在所有复杂的适应性系统之中。它急需解释:为什么这个世界会形成这种结构呢?
 
当Holland思考这个问题时,他越来越觉得,更为重要的理由还基于更深的层次,因为这个等级分明的建设砖块结构能够彻底改变系统的学习、进化和适应能力。
 
适应性系统能够重组它的建设砖块,从而产生巨大的飞跃,而不需要总是要逐步地在可能性的无限空间中缓慢进展。他认识到,这就是解开多基因之谜的关键之所在。“进化过程中的放弃和尝试并不只是为形成一个优良的动物,而是在于发现优良的建设砖块,并将这些建设砖块结合在一起,从而产生许多优良的动物。” 于是,开始了“遗传算法”。就它的内部机制而言,它更像是一个模拟生态系统,其中所有的程序都可以相互竞争、相互交配、一代接一代地繁衍,一直朝着程序员设置的任何问题的解答方向不断演化。
 
对Holland来说,遗传算法的核心是两性交换。他认为,所有复杂的适应性系统——经济、精神、生物体等,都能建立能让自己预测世界的模型。在认知领域,任何我们称为“技术”或“专业知识”的,都是一种内含的模型,或说得更精确些,是一组长期经验积累和凝练而成的,即铭刻在神经系统的巨大而相互环扣的常规操作程序。这样的例子不尽其数。DNA本身就是一个内含的模型,基因说:“在这种条件下,我们期望我们特意选中的生物能有机会得到很好的发展。”
 
确实,模式和预测随处可见。但模式从何而来?最终的答案只能是“没人操纵这一切。”(这不就是 KK 的“失控”的真谛吗)但幸运的是,还有一个选择:从环境而来的反馈,这是达尔文的伟大洞见。在认知学上,这个过程基本上是一样的:作用者是独立的心智,反馈自老师和直接经验而来,改善被称为学习。
 
人业互择理论
 
约翰·霍兰德(John L Holland),在60年代以自己从事的职业咨询为基础,通过对自己职业生涯和他人职业发展道路的深入研究,引入人格心理学的有关理论,经过多次补充和修订,形成了一套系统的职业设计理论,其内容包括个性和职业类型的划分、职业分类、类型鉴定表等。 
 
他将职业选择看做一个人人格的延伸。他认为,职业选择也是人格的表现。同一职业团体内的人有相似的人格,因此对很多问题会有相似的反应,从而产生类似的人际环境。 
 
霍兰德提出了四个基本假设:其一,人的个性大致可分为六种类型:实际型、研究型、艺术型、社会型、企业型和常规型;其二,所有职业均可划分为相应的六大基本类型,任何一种职业大体都可以归属于六种类型中的一种或几种类型的组合;其三,人们一般都倾向于寻找与其个性类型相一致的职业类型,追求充分施展其能力与价值观,承担令人愉快的工作和角色,职业也充分寻求与其类型相一致的人;其四,个人的行为取决于其个性与所处的职业类型,可以根据有关知识对人的行为进行预测,包括职业选择、工作转换、工作绩效以及教育和社会行为等。在这四个前提的基础上,霍兰德提出了六边形模型。他强调:个人的人格与工作环境之间的适配和对应是职业满意度、职业稳定性与职业成就的基础。在我们的文化里,大多数人可以分为六种人格类型,这六种类型可以按照固定顺序排成一个六角型。
 
现实型(R):有运动机械操作的能力,喜欢机械、工具、植物或动物,偏好户外活动。 
 
传统型(C):喜欢从事资料工作,有写作或数理分析的能力,能够听从指示,完成琐细的工作。 
 
企业型(E):喜欢和人群互动,自信、有说服力、领导力,追求政治和经济上的成就。 
 
研究型(I):喜欢观察、学习、研究、分析、评估和解决问题。 
 
艺术型(A):有艺术、直觉、创造的能力,喜欢运用想像力和创造力,在自由的环境中工作。 
 
社会型(S):擅长和人相处,喜欢教导、帮助、启发或训练别人。 
 
通过测试,可以找到个人的职业代码。比如一个代码为ASI的人,在艺术型、社会型、研究型三方面得分较高,他最适合做的是艺术家、画家、记者等。
在图中,六边形的六个角分别代表霍兰德所提出的六种类型。六种类型之间具有一定的内在联系,它们按照彼此间相似程度定位,相邻两个维度在各种特征上最相近,相关程度最高。距离越远,两个维度之间的差异越大,相关程度越低。每种类型与其他五种类型存在三种关系:相近、中性和相斥,霍兰德又经过了大规模的试验,分别确定了男性和女性的各种类型之间的相关系数,如下图。 
 
根据六边形模型来理解,最为理想的职业选择就是个体能找到与其个性类型重合的职业类型,即人职协调。这时,个人最可能充分发挥自己的才能并具有较高的工作满意感。如果个人不能获得与其个性相重合的的职业,则寻找与其个性类型相近的职业。由于两种类型之间有较高的相关系数,个人经过努力和调整也能适应职业环境,达到人职次协调。最差的职业选择是个人在与其个性类型相斥的职业环境中工作。在这种情况下,个人很难适应工作,也不太能感到工作的乐趣,甚至无法胜任工作,是人职不协调的匹配方式。总之,个性类型与职业类型的相关程度越高,个人的职业适应性越好;相关程度越低,个体的职业适应性越差。因此,六边形模型有助于人们更好的理解和进行职业选择。
 
本文已获「德先生」转载授权,搜索「D-Technologies」即可关注。
推荐 1