阅读:0
听报道
导语
人类的大脑具有很多高级的功能,它能够接受信息,存储信息并交换信息,那么人类究竟是如何进行学习的呢?
2019年9月16日发表于arxiv.org的一篇预印本论文中,作者通过引入一个不断发展的跨学科领域——图学习来探索了网络结构是如何影响人类的认知的。
引言
人类的大脑具有很多高级的功能,其中之一就是根据过去的经验学习事物的规则,从而使我们能够理解语言,能够进行抽象推理,以及对视觉模式进行分类。甚至是只有8个月大的孩子也能发现口语中的统计规律,从而确定单词之间的界限。这些事件都可以看成复杂的网络结构,而人脑的这种能力使得我们快速而准确地学习这些网络结构。
论文题目:
Graph learning: How humans infer and represent networks
论文地址:
https://arxiv.org/abs/1909.07186
人类是如何学习的
为了认知人类是如何学习的,让我们从一个简单的实验开始。构建一串由四个伪单词组成的连续序列,序列中每个伪单词都由3个音节组成,如图1A所示。每个伪单词的音节顺序是固定的,而序列中每个伪单词是随机出现的,也就是说词内音节的转移概率为1,词间转移概率为1/3。
研究者让婴儿收听该序列,一段时间后,受试验的婴儿能够检测到音节过渡概率的差异,该试验揭示了在语言学习过程中的一种单词识别机制。这种发现转移概率变化的能力是人类学习的核心和普遍特征。
虽然转移概率包含了刺激序列中重要的信息,但是它们并不能代表全部信息。由于转移概率的存在,各个音节之间会形成一个复杂的网络结构,为了描述这种结构,研究者将图1A 的序列转化为图1B所示的网络结构,其中每个音节为一个节点,节点之间的边表示他们之间可能的转移关系,此时图1A中的序列就可以表示为图1B中网络的随机游走。
从图1B中看出,这些音节自然的形成了四个簇,每个簇对应一个伪单词。该现象提出了一个重要的问题:当解析单词(或执行任何其他统计学习任务)时,人们是学到了网络中单个过渡概率的差异,还是学到了网络更大尺度的特征?
网络结构对人类学习的影响
网络具有许多局部结构、中尺度结构和全局结构,如图2所示,这些结构往往与网络的节点和边有关,具体如下:
局部结构:节点的度
中尺度结构:聚类系数,模块度
全局结构:核数、中心性,传播性
为了研究网络结构对人类学习的影响,研究者设计了一系列的反映时间实验,如图3所示,在实验过程中,试验对象接受一串刺激序列,要求根据刺激在键盘上按相应的键。反映时间越短,说明对转移的预料越强烈,反之越弱。通过使用不同的网络结构,我们就可以研究局部结构、中尺度结构和全局结构对人类学习的影响。
局部结构对人类学习的影响
为了研究局部结构对人类学习的影响,研究者使用一个随机网络进行反应时间实验,如图4所示,网络中每个节点代表一个刺激,该网络的随机游走构成一个刺激序列。反应时间随转移过程中前一个节点度的变化如图4所示:前一个节点的度越大,反应时间越长。由于随机游走的转移概率可以由前一个节点的度倒数表示,因此实验结果表明了转移概率越大,反应时间越短。该结果表明人类对网络的局部结构很敏感。
中尺度和全局尺度结构对人类学习的影响
一系列的研究表明,网络的中尺度和大尺度结构对人类学习有影响。对于中尺度的结构,有研究表明,低聚类的单词在长期记忆中更容易识别;而对于大尺度的结构,在反应时间测试的实验中,人们对于具有低中介中心性的节点反应更快;更有研究表明,小孩子更容易捕获和说出低核数的单词。
但是为了建立网络结构与人类学习之间的因果关系,我们还必须证明上述的现象不受网络局部结构的影响,于是研究者采用控制变量法,设计了一组新的反应时间实验。实验过程中,采用了度相同但是拓扑结构不同的网络,将他们作为刺激序列的转移网络,如图5所示,两个网络分别为模块网络和格子网络,所有节点的度都是4,因此两个网络的局部结构相同。
在模块网络中,分别测量人们对于簇内和簇间转移的反应时间,通过计算簇间反应时间与簇内反应时间的差值,得到了图6(上半部分)的结果,即簇间反应时间比簇内反应时间长,这表明人们对簇内转移的反应更快,网络的中尺度结构对人类学习有明显的影响。此外,通过测量在格子网络和模块网络上人们的反应时间,两者的差值如图6(下半部分)所示,即格子网络的平均反应时间更长,这表明网络的全局结构对人类学习有明显的影响。
上述实验表明,人类不仅能够学习个体的转移概率,还能够发掘潜在网络的结构特征,这些特征不仅包括局部特征,还包括网络的中尺度和全局尺度的特征。但是人类是如何学习这种高阶的网络特征的呢?对人类的图学习进行建模给出了答案。
人类进行图学习的机制
首先考虑一个简单的模型,假设刺激序列的转移概率由转移矩阵Pij决定,我们可以计算刺激元 i 转移到 j 的频率,从而用频率来估计 i 到 j 的转移概率。事实上,该估计是对 Pij 的最大似然估计。然而,我们进行估计时,并没有考虑网络的拓扑结构,然而前文的实验表明网络的拓扑结构对人类学习是有影响的,因此直接使用频率的估计是无法反映人类进行图学习的机制的。
考虑网络结构的影响,研究者们提出了这样的一个机制:当接受一系列的刺激时,人类会在时间上对网络的转移结构进行积分。简单来讲,人类对刺激的反应不仅仅只与当前刺激有关,还与之前的一个、两个或更多刺激有关。该机制可以由下式表示,其中,t 代表时间点,f(t)表示在不同时间点上的积分权重,C是归一化常数,P是网络的真实转移概率矩阵,P 表示估计的转移概率矩阵。
为了进一步阐述这种学习机制,研究者进行了如图7所示的实验。当f(t)是一个冲激函数时(图7A左),学习者仅仅关注当前刺激,此时学习者简单地采用了最大似然估计,最终估计的转移结构 P 收敛至真实的转移结构 P(图7B左)。当f(t)是一个均匀分布的函数时(图7A右),学习者会对所有时间步进行积分,此时估计的转移结构 P 与真实结构偏离甚远(图7B右)。
然而,当f(t)随时间步长进行衰减时(图7A中),学习者会对转移结构进行中等时长的积分,最终估计的转移结构 P 会体现一些全局的特征(图7B中),例如紧密相连的节点所构成的社区越来越明显,而一些局部结构,例如社区和社区的边联系会退化。这种时间整合机制已被证明在生物学上是可行的,并且普遍存在于目前的认知理论中。
拓展图学习的范式
大多数图学习研究的问题,例如前文提到的反应测试研究,都可以看作是在转移网络上的随机游走。用随机过程的语言来讲,这是一个平稳的马尔科夫过程。尽管基于随机游走的图学习研究提供了一个自然研究视角,但是仍会受到3个假设的限制:(1)转移结构不随时间发生变化(平稳性);(2)未来的刺激仅仅取决于当前刺激(马尔科夫性);(3)刺激序列是预先决定的,不会受观察者的影响。通过研究这些限制问题,未来的研究将会拓展现存图学习的范式。
(1)平稳性
大多数的图学习研究都是针对静态的网络结构,但实际生活中大多数网络是随时间变化的。例如图8所示的过程,网络中的边会随着时间的推移而被重连。有研究表明,当观察一系列从一种过渡结构转变为另一种结构的刺激时,人们对第一个网络的学习表示会影响他们对第二个网络的反应,但是随着时间的流逝,这些影响会逐渐减弱。未来的图学习研究可以更多地关注时变网络结构的特性。
(2)马尔科夫性
在当前的图学习研究中,我们总是关注具有马尔可夫性的刺激序列,即未来的刺激仅仅取决于当前刺激。然而,实际中的刺激序列大多具有长时间相关性和依赖性。这种长期依赖关系可以用图9表示,由于长期依赖的存在,路径1(图9左)的下个状态有两种可能,而路径2(图9右)却有3种可能。例如,口语中每个单词不仅只和前一个词有关,而且还和句中更早的词有关,音乐的乐符之间也有复杂的长期依赖关系。那么前文提及的时间整合机制能否推断这种非马尔科夫过程呢?这些问题有待未来的图学习研究解决。
(3)信息搜寻
刺激序列往往设计成与观察者无关,但是刺激序列的结构也可以由观察者决定。例如,人们上网搜索信息时,人们会主动选择一条穿行在链路网络上的路径,在这种情况下,人们对信息的获取具有主观能动性,而不是被动的接受预先定制的信息。如图10所示,通过主动地搜寻信息,人们最终从原始网络中获取了一个新的子网络。这种主动的信息搜寻带来了许多有意思的问题:主动搜寻的路径能够让人们更有效地学习网络的拓扑结构吗?还是说这种主动搜寻的能力导致人们对真实网络的结构形成了偏见?这些问题岑需解决。
研究真实网络的结构
人类认知与网络之间存在着密切的联系,人们会依靠网络系统来执行各种各样的任务,例如使用语言进行交流(图11A),发明音乐(图11B)以及在网络上存储和检索信息(图11C),其中许多网络都会随着人类的发展而演化,或者由人类直接设计。我们不得作出怀疑:某些网络是为了支持人类的学习和认知而构建的。
图学习提供了定量模型和实验工具来研究这些问题。我们发现,许多现实世界的过渡网络具有两个明显的结构特征:(1)异构的:具有度异常高的hub节点,以及具有幂律的度分布(图12D);(2)模块化的,即存在紧密连接的簇群,而簇间的连接较为稀疏(图12E)。那么这些结构特性是否有着共同的目的,即促进人类学习和交流呢?
研究表明,模块化结构提高了人们的反应能力,而异构网络中的hub节点能够帮助人们搜寻信息。这些结果表明,图学习提供了一个独特而建设性的视角,通过它可以研究我们周围世界的过渡网络。
总结
人类的行为、认知和神经活动严重依赖于过渡网络的拓扑结构,通过图学习这一统一框架,我们能够科学地探索网络结构对人类认知的影响。图学习是一个新兴的研究领域,提供了丰富的跨学科研究机会。从新的认知建模技术,和对现有图学习范式的扩展,再到现实网络中的运用,图学习将会改变我们对人类认知,复杂网络,以及它们之间交互的思考。
作者:鄢鹏高
编辑:张爽
话题:
0
推荐
财新博客版权声明:财新博客所发布文章及图片之版权属博主本人及/或相关权利人所有,未经博主及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括财新博客的文章及图片。博客文章均为作者个人观点,不代表财新网的立场和观点。