财新传媒 财新传媒

阅读:0
听报道

 

文 | 张江 董磊 
 
导语
 
武汉新型冠状病毒疫情不断蔓延,抵抗病毒的传播是一场全方位的战争。经过数据分析和模型研究发现,城市间的交通流量决定了城市间的病毒传播情况。集智开放数据资源,希望能在疫情预测与预防方面提供帮助。
 
 
交流数据与病毒传播
 
最近新型冠状病毒成为了万众瞩目的观点,病毒学研究领域专家管轶却选择了当“逃兵”,他说:“身经百战,但这次感到极为无力”,因为新型冠状病毒已经广泛传播出去了,且不像SARS一样有清晰的传播链。如果我们能预知疾病在未来传播的轨迹,我们的疾病防控工作才能有的放矢。不过,疾病的传播因素异常复杂,它跟病毒携带者的身体条件、所处环境的情况、天气的情况、接触者的条件等都密切相关。
 
然而,如果我们跳出这个微观的尺度来看,把一个城市抽象为一个单点,那么我们完全有可能对城市间的疾病传播情况作出一定意义上合理的推断。当我们聚焦在城市这个尺度的时候,就会发现,城市间的交通流量决定了城市间的病毒传播情况。这是因为交通流量越大的两个城市,病毒携带者也越可能来往。
 
这一结论是有其科学依据的。比如,2013年Dirk Brockman等人在Science上发表的《由网络驱动的复杂传染现象中隐藏的几何结构》一文就指出,疾病的传播其实与城市间的地理距离没有什么关系,而与城市间的“等效距离”密切相关。这里的“等效距离”就是指根据城市间交通流量数据折合之后的距离。
 
论文题目:The Hidden Geometry of Complex, Network-Driven Contagion Phenomena
 
论文地址:https://science.sciencemag.org/content/342/6164/1337
 
如下图所示,无论从真实的病毒传播案例(2009年的H1N1和2003年的SARS)还是模型模拟的结果看,地理距离与病毒感染的时间几乎没有什么关系。因此,两个城市地理上靠的越近并不意味着病毒越容易传过去。
A图是模型模拟的一次病毒从香港爆发的情况,不同颜色的点表示不同的大陆区域,连边表示航空网络。B表示的是病毒在爆发105天以内感染到的世界各大城市。C图展示了这次病毒爆发中,病毒从开始传染到每一个目标城市所需要的时间,其中每一个数据点就是一个城市,横坐标是城市间的地理距离,纵坐标是从爆发到该城市第一个病毒病例发现的时间。D和E两个图分别表示在2009年的禽流感(H1N1)和2003年的非典(SARS)两次病毒爆发情况下,病毒传播时间(纵坐标)与地理距离(横坐标)之间的关系,其中每一个点表示一个城市。可以看出,病毒传播与地理距离基本没什么相关性。
 
反过来,如果我们重新定义城市间的有效距离为某一个乘客从A到B的最可能路径的长度,则病毒传播的规律性就异常明显了。什么叫最可能路径呢?就是说我们可以把一个乘客当作一个随机游走粒子,它按照流量的大小随机访问周围的城市,到了下一个城市后,他再次按照流量大小折合为概率访问下一个城市的临近城市……于是这样的粒子从A到B最有可能走的那条路径就是最可能路径。
图A展示的是模拟的病毒传播中,按照等效距离大小对各个城市的排列情况,即中心为香港,到中心的距离即为等效距离,不同的极角按照地理距离排布,即地理越靠近的城市,极角越相似。B图则展示了在这样的城市排布下,病毒在72天内的扩散情况。C图展示的是疾病感染时间与等效距离之间的关系,D、E两图展示的则是2009年的禽流感和2003年的SARS两次爆发中每个城市的感染时间与有效距离之间的关系。可以看出,我们可以利用这样的有效距离比较准确地推测出病毒在某个城市爆发的日期。
 
现在正值春运高峰期,交通枢纽网络会承载比往常更大的压力。武汉市新型肺炎疫情牵动着大家的心,作为一个城市数据领域的研究者和从业者,我们发现,有一些可能尚未被披露的「事实」。
 
在这里,我们想共享一些数据和对数据统计的结果,希望可以对疫情的防治提供一些帮助。
 
 
从丁香园汇总发布的地图来看,主要病例集中在湖北省、广东省、北京市和上海市,这比较符合常识,也符合我们的数据和模型判断。因为广东、北京和上海是与湖北联系最为紧密的区域。
 
但其中有一点与我们的数据和经验差别较大,那就是湖北省内的疫情都在武汉市。而根据人口流动的规律,相邻城市且人口规模比较大的城市人口流动会更加频繁。疾病的传播也会遵从这个人口流动规律进行传播。
 
我们根据 2015-16 年的人口流动数据计算了武汉市与全国各城市的联系,可以看到,前 20 名的城市里面,大部分集中在湖北省。出现在列表里的省外城市大部分已经有了疫情的出现(符合人口流动的规律),那么湖北省市其它城市的情况如何,值得我们重点关注!(标红的为湖北省内城市)
 
特别是,作为全国城市网络中的重要节点,武汉的辐射能力非常强。
 
利用 2015-16 年人口迁徙数据(基于手机位置)绘制的武汉市与其它城市的联系,线段宽度代表流动量,蓝色圆圈代表城市人口规模,位于中心地带的就是武汉。
 
 
从武汉市出发的目的地前20城市列表
 
城市代号:城市名称
 
4209:孝感市
 
4211:黄冈市
 
4403:深圳市(有病例)
 
4210:荆州市
 
4206:襄阳市
 
3100:上海市(有病例)
 
1100:北京市(有病例)
 
4202:黄石市
 
4401:广州市
 
4212:咸宁市
 
4205:宜昌市
 
4290:仙桃市/潜江市/天门市
 
4207:鄂州市
 
4208:荆门市
 
4419:东莞市
 
4203:十堰市
 
4213:随州市
 
4228:恩施土家族苗族自治州
 
3301:杭州市(有病例)
 
5000:重庆市
 
注:病例情况来源为丁香园,截至2020年1月21日上午。
 
最后,我们集智俱乐部公开了一个数据集,即武汉到全国各大城市之间的流量数据,希望有志于运用大数据的方式精准推断这次病毒传播情况的朋友们可以动手操作起来。这是一次很好的实操机会。
 
以上数据和分析结果均已开源,希望能为这次疫情防止贡献出我们的力量。
 
下载链接:https://github.com/leiii/population_flow
 
这次疫情引起了大家的高度关注,也希望有关部门能披露更多数据(包括武汉周边县市区的情况),能让大家更好的抵御潜在风险。
话题:



0

推荐

集智俱乐部

集智俱乐部

504篇文章 2年前更新

集智俱乐部,英文名Swarma Club,成立于2003年,是一个从事学术研究、享受科学乐趣的探索者的团体。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的“没有围墙的研究所”。公众号:集智俱乐部,官网:swarma.org。

文章