财新传媒 财新传媒

阅读:0
听报道
导语
嵌套性是网络科学的核心议题之一。近期发表在Physics Reports上的一篇论文,对复杂网络的嵌套性进行到了从现象到机制的全面综述。本文着重分析论文中关于网络嵌套性在经济预测上的三个案例。
 
针对这篇网络嵌套综述的更多内容,以及网络结构相关问题,我们组织了线上读书会,定期线上分享,详情与参与方式见文末。
 
在编程中,嵌套指的是一个语句套在另一个语句之中,从而形成局部高度耦合的结构。在复杂网络中,嵌套性 ( Nestedness ) 指得是某个节点对与其相连的节点的相互作用模式有差异,和其中一部分本来就已充分连接的节点更容易产生相互联系。在生态系统,经济与社交网络这样截然不同的场景下,其网络结构都呈现嵌套性。
 
今年5月的一篇长达140页的综述,由来自电子科技大学、苏黎世大学、杭州师范大学阿里巴巴商学院的研究者共同执笔,详细的对网络嵌套性的相关研究进行了系统性的呈现。本文着重看经济相关的应用,先概述何为嵌套性,再比较嵌套性和其他复杂网络的基本统计性质,之后展示通过网络嵌套性对经济活动进行预测的范例,供君借鉴。需要指出的是,嵌套性是所有复杂网络普遍呈现的特性,因此其应用远不止于经济和社交网络。
 
论文题目:
Nestedness in complex networks: Observation, emergence, and implications
论文地址:
https://arxiv.org/abs/1905.07593
 
直观体验何为网络嵌套
上图中蓝色的网络是具有嵌套性的,同时也是真实世界中出现的,红色的网络是不具有嵌套性的,由程序随机生成的随机模型(Null model);左边的是无向图,右边的是二分图。直观的来看,不具有嵌套性的网络,图中的节点上平等的,连接是随机的;而真实世界中的网络,节点一和二所连接的节点远大于平均值。但不同于星型网络,不会出现一个节点和其他所有节点都连接的情况。上图左下角的,让笔者想起中学时班级里的社交网络,一个班花一个班草都是人缘很好的,偏偏俩人还有些小暧昧。
 
我们将邻接矩阵中的1变为黑点,0变为白色,可以把连接矩阵可视化的展示出来。
所有的四个网络,都展示出不同程度的网络嵌套性。
 
网络嵌套性和其他的网络特性的关系
 
具有嵌套特征的网络,还具有如下四条特性,严谨的研究者会计算不同评价指标之间的相关系数,但为了理解方便,这里只做定量的直观的描述:
 
节点之间的连接度数呈幂律分布(scale law),由少数连接多的节点和大多数连接少的节点组成
 
不相联性 disassociality-节点倾向于和和自己不类似的节点连接,在社交网络中,这意味着不同兴趣或者性别的人更容易连接,而如果只看度数,那就是同样度数的节点之间相互连接的概率低于不同度数的节点连接的概率
 
边缘-中心效应(core-periphery structure),当网络中大部分节点都只和中心节点连接,而自身很少有其它连接时,我们说该网络具有边缘中心效应,而具有嵌套结构的网络,多半也呈现出边缘中心效应
 
模块度(modulaity),网络被分成多个内部连接紧密的子网络,子网络间相互连接的概率大于网络之间的连接出现的概率。具有嵌套结构的网络,当网络间节点的密度较低时,模块度和衡量网络嵌套程度的指标正相关,而当网络的节点密度较高时,则呈现相反的趋势。
 
研究复杂系统,一个重要的目的是对网络的未来行为进行预测。下面的三个例子,展示了衡量网络嵌套程度,可以在不同的尺度上对未来进行预测。
 
在经济相关的应用场景中,网络中的每个节点代表一个公司或一个国家,或者代表一种货物,如果存在交易,网络邻接矩阵中对应位置为1,如不存在,为0。
 
公司能否生存,用对网络嵌套性的贡献度就能预测
 
对于网络中的一个节点来说,如果将该节点的连接换成是随机的连接,此时网络的嵌套性发生的变化,可以看成是该节点对于网络嵌套性的贡献程度。在生态系统中,一个物种对网络嵌套贡献度越大,其越容易还是不容易灭绝了?类似的问题,一家公司在交易网络中,如果对网络嵌套性贡献越大,是更容易还是更不容易破产了?让我们做个思想实验,下图展示的是一个具有完美嵌套性的网络:
那些节点变成随机的连接,对网络嵌套程度的影响最大?连接最多的节点不会,最上面的那个随机后很大的概率还是维持原样,最下面的也不会,该节点改为和其他节点链接,对网络的嵌套程度没有多少影响,假设这样的节点最容易灭绝,那这样的网络大多数时基本没有变化,而偶尔中心节点消失时,网络结构发生剧变。而这和我们的日常经验不符,不管是生态还是经济,网络都是即稳定又在时刻改变的。
 
 
而上图中绿色的节点,它的边如果随机连接的话,对网络的嵌套结构的影响最大,而这类节点灭绝的概率也越大。举例来说,如果你的公司是专门只做一个细分市场,那其生存的下去概率很大,如果是像阿里腾讯这样巨无霸,也不容易倒下,最危险的是在中间的那部分。
 
根据网络当下结构预测哪些连接会出现/消失
 
如果我们对实际网络具有嵌套性很有信心,那当某些节点间的连接对嵌套性有明显的负贡献度的时候,那就可以预测这样的连接可能会消失。也就是从当下找出那些国家之间未来会产生那类新的贸易连接,那些贸易种类又会消失。
上图的数据源于114个国家间772种货物贸易的多年数据,实线代表现实情况下有多少连接消失/出现,虚线代表的在随机模拟情况下,有多少连接消失/出现,纵轴是概率密度,横轴代表的是某条连接和在具有完美的嵌套结构的网络中对应连接的距离,该值越接近0,说明在理想的嵌套网络中,该节点越应该出现。左右俩图之中,实线虚线都有显著的差别。假设理想的嵌套网络中存在不该出现的连接,更容易消失。而当补充某些连接能显著提升网络的嵌套程度时,未来这些连接可能会出现。这意味着可以根据当前贸易网络中每条边对网络嵌套性的贡献度来预测未来贸易产品间的贸易关系会出现或消失。
 
根据上面两幅图,读者可以猜猜预测连接消失的AUC和预测连接出现的AUC(常用的衡量预测算法性能的指标)更高,从左右两幅图对比,左图的俩条线的差距更大;对具体场景分析,阻止不该出现的贸易连接的消失因素,要小于地缘政治等对本应该出现的贸易机会的阻碍。因此我猜测是前者更容易,而在12年的研究中,是前者的AUC达到了0.81,而后者只有0.62。
 
论文题目:
The Dynamics of Nestedness Predicts the Evolution of Industrial Ecosystems
论文地址:
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0049393
 
网络嵌套性预测国家的发展潜力及GDP增长
 
上述的应用,考虑的都是一个网络,而将一个个的网络看成一个整体,可以进行更为宏观的预测,例如预测一个国家的GDP增长,下图展示的横轴代表一个国家内部贸易网络的健壮程度,越具有嵌套性的网络该分越高,而纵轴代表该国GDP的可预测性,该图说明可以按照描述网络嵌套性的fitness打分,将各国分为经济增长可预测的和不可预测的,对于前者,可以预测其未来出呈现显著经济增长,例如1995年的中国的fitness score预测了近20年来中国经济的腾飞。
根据当下的GDP(纵轴),以及经济体的fitness打分,IMF(国际货币组织)的研究,将世界上的国家分为了以下四类:图中蓝色的是发达国家,红色的面料经济衰退风险的国家,紫色的是陷落在贫困陷阱中的国家,而绿色的是成长中的经济体。
 
熟悉网络科学的读者,会想到基于一个国家能够生产的产品的多样性,来预测该国的经济潜力。例如中国在国际贸易中参与的门类众多,因此经济潜力更大,在国际贸易网络中占据中心节点,也就意味着这些进口的出口的商品,要在国内市场进行加工处理,由此国内贸易网络也越倾向于呈现嵌套结构,而只处理低级农产品或某个细分门类的国家,其国内贸易也会相对近似随机产生的Null model,由此将网络嵌套性与之前关于国家经济潜力的研究联系起来。
 
未来的研究方向展望
 
中美的贸易争端,让人们思考这样一个问题,究竟中美间的贸易网络是不是稳定的,由于增加关税会影响网络中的部分连接,会不会对网络整体的结构产生显著的影响。在生态学中,科学家对网络鲁棒性和嵌套性的关系有过详尽的研究,但由于现实生活中的网络,不管是公司层面还是国家层面,受到的影响因素都太多了。而网络的鲁棒性这样的宏观涌现特征,不止受制于网络本身的拓扑结构,例如网络的嵌套程度,还会受到外在的因素的影响,例如法规,科技的变化,因此相比生态系统有更大的研究难度。但这个问题始终存在,并有着巨大的研究挑战和潜力。
 
对于网络嵌套性的研究来说,它始终需要解决一个最基本的问题,就是为何网络会出现嵌套结构,是哪些机制使得网络在生成过程中逐渐呈现出嵌套结构,我们能否在嵌套结构还不明显的时候,就预先检测出将要呈现嵌套结构的网络。用经济学的场景来说,就是我们都知道一个国家的贸易连接要多样,要具有嵌套性,但我该制定怎样的计划,才能达到这一目标,什么样的干预手段有效,什么样的无效,能不能做一个实验,去实地验证。
 
作者:郭瑞东
审校:崔浩川
编辑:张爽
 
话题:



0

推荐

集智俱乐部

集智俱乐部

504篇文章 2年前更新

集智俱乐部,英文名Swarma Club,成立于2003年,是一个从事学术研究、享受科学乐趣的探索者的团体。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的“没有围墙的研究所”。公众号:集智俱乐部,官网:swarma.org。

文章