财新传媒 财新传媒

阅读:0
听报道



心速递


  • 维基百科研究的图结构数据集;

  • 难民迁移数据的马尔可夫链模型;

  • 一种识别电力系统关键部件的状态失效网络方法;

  • 激进化与恐怖主义的数学模型;

  • 现实启发投票模型:小型综述;

  • 使用自我中心聚类在LinkedIn测量网络效果;

  • 使用双曲几何的链路预测;

  • 含时图的节点嵌入;

  • 子图网络在结构特征空间扩展中的应用;

  • 网络共识模型的可控性Gramian子矩阵;



用于维基百科研究的图结构数据集


原文标题: 

A Graph-structured Dataset for Wikipedia Research

地址: 

http://arxiv.org/abs/1903.08597

作者: 

Nicolas Aspert, Volodymyr Miz, Benjamin Ricaud, Pierre Vandergheynst


摘要: 维基百科是一个丰富而宝贵的信息来源。它在网络上的中心位置使其成为科学家特别有趣的研究对象。来自不同领域的研究人员使用与维基百科相关的各种复杂数据集来研究语言,社会行为,知识组织和网络理论。作为一种科学宝藏,大尺寸的数据集阻碍了预处理,可能成为潜在新研究的一个具有挑战性的障碍。这个问题在科学领域尤其严重,研究人员可能不具备技术和数据处理能力。


一方面,维基百科转储的规模很大。它使得相关信息的解析和提取变得麻烦。另一方面,API 易于使用,但仅限于相对较少的请求。当研究人员需要维基百科的一个子集(从数千到数十万页)时,中间层处于介观尺度,但在这种规模上没有有效的解决方案。在这项工作中,我们提出了一个有效的数据结构来发出请求和访问维基百科页面和类别的子网。


我们提供便捷的工具来访问和过滤维基百科网页的收视率统计数据或“页面数量”。数据集组织利用图数据库的原理,允许快速直观地访问维基百科文章和类别的子图。数据集和部署指南可在LTS2网站上找到(https://lts2.epfl.ch/Datasets/Wikipedia/)。



难民迁移数据的马尔可夫链模型


原文标题: 

Markov Chain Models of Refugee Migration Data

地址: 

http://arxiv.org/abs/1903.08255

作者: 

Vincent Huang, James Unwin


摘要: 本文探讨了马尔可夫链在模拟难民危机中的应用,重点是城市和城市层面的个人本地移民。作为一个明确的例子,我们将这里开发的马尔可夫链迁移模型应用于难民署关于布隆迪难民危机的数据。我们将我们的方法与布隆迪难民运动的最先进的“基于主体人”的模型进行比较,并强调这里提出的马尔可夫链方法可以改善与数据的匹配,同时具有更高的算法效率。



一种识别电力系统关键

部件的状态失效网络方法


原文标题: 

A State-Failure—Network Method to Identify Critical Components in Power Systems

地址: 

http://arxiv.org/abs/1903.08471

作者: 

Linzhi Li, Hao Wu, Yonghua Song, Yi Liu


摘要: 为了减轻电力系统中的级联故障停电风险,应确定其故障导致高停电风险的关键部件。在本文中,这些关键组件由级联故障链和损耗数据形成的状态故障网络( SF 网络)识别,可以从公用事业或模拟中收集。


链中的故障在 SF 网络中重新组合,其中每个故障被分配一个值,该值可以揭示其发生后的停电风险。因此,可以在 SF 网络中识别关键故障,其中故障引起中断风险,因此可以基于其关键故障风险找到关键组件。仿真结果验证了该方法的有效性。




激进化与恐怖主义的数学模型


原文标题: 

Mathematical Models of Radicalization and Terrorism

地址: 

http://arxiv.org/abs/1903.08485

作者: 

Yao-li Chuang, Maria R. D’Orsogna


摘要: 近年来,激进意识形态的迅速蔓延导致了世界范围内的恐怖主义袭击。从文化的角度来看,了解极端主义倾向如何发芽,发展和推动个人行动是重要的,同时也有助于制定应对和预防策略。人口学研究,对激进主题的访谈,对恐怖主义数据库的分析,揭示了激进化的道路沿着渐进步骤发生,其中年龄,社会背景和点对点交流发挥了重要作用。为了实施恐怖袭击,激进分子必须在保持秘密的同时有效地相互沟通;他们还受到反恐机构,公众舆论和物质资源需求的压力。同样,政府实体必须衡量哪种干预方法最有效。


虽然仍然缺乏对导致极端主义和暴力以及其中最佳威慑的过程的完整理解,但数学建模者通过使用统计力学和应用数学的工具来描述现有的和新颖的范式,从而为话语做出了贡献,并且提出新的反恐战略。我们回顾了他们在这项工作中的一些方法,包括日益极端观点人群的隔室模型,年龄结构激进人口的连续时间模型,格子和社会网络上的社会传染过程的激进化,基于主体的模型,博弈论公式。我们强调通过定量框架分析激进化和恐怖主义所提供的有用见解。最后,我们讨论了制度干预的作用以及去激进化战略可能最有效的阶段。



现实启发投票模型:小型综述


原文标题: 

Reality Inspired Voter Models: A Mini-Review

地址: 

http://arxiv.org/abs/1811.11888

作者: 

S. Redner


摘要: 这篇小型综述展示了投票模型的扩展,其中包含了个人真实决策过程的各种合理特征。虽然这些概括不是通过经验数据校准的,但由此产生的动态暗示了现实的集体社会行为。



使用自我中心聚类

在 LinkedIn 测量网络效果


原文标题: 

Using Ego-Clusters to Measure Network Effects at LinkedIn

地址: 

http://arxiv.org/abs/1903.08755

作者: 

Guillaume Saint-Jacques, Maneesh Varshney, Jeremy Simpson, Ya Xu


摘要: 当新功能不仅影响接收它的人,而且影响平台的其他用户,例如他们的连接或跟随他们的人时,就会发生网络效应。这种非常普遍的现象违反了支撑几乎所有企业实验系统的基本假设,稳定的单位处理价值假设( SUTVA )。当这个假设被打破时,一个典型的实验平台,依靠伯努利随机分配和双样本t检验来评估显著性,不仅不能解释网络效应,而且可能产生高度偏向的结果。


本文概述了一种简单且可扩展的测量网络效应的解决方案,使用自我网络随机化,其中群集由“自我”(焦点个体)和她“改变”(她立即连接的个体)组成。与传统的基于群集的随机化相比,我们的方法旨在保持群集的代表性,避免强大的建模假设,并显著提高功率。特别是,它不需要特定产品的实验设计,也不需要工程团队的高水平投资,也不需要对实验和分析平台进行任何更改,因为它只需要将治疗分配到个人层面。


每个用户具有或不具有该功能,并且不需要对用户之间的交互进行复杂的操作。它侧重于测量一次性网络效应(即我的直接连接处理对我的影响),并以非常低的设置成本给出合理的估计,允许我们每年进行数十次这样的实验。



使用双曲几何的链路预测


原文标题: 

Link prediction with hyperbolic geometry

地址: 

http://arxiv.org/abs/1903.08810

作者: 

Maksim Kitsak, Ivan Voitalov, Dmitri Krioukov


摘要: 链路预测是网络科学中具有各种应用的范例问题。在潜在空间网络模型中,这个问题归结为按照增加它们之间的潜在距离的顺序对节点对进行排序。具有双曲线潜在空间的网络模型具有许多吸引人的特性,这表明它必须是预测链接的有力工具,但过去在这方面的工作报告了不同的结果。在这里,我们对潜在双曲几何在网络中进行链路预测的效用进行系统研究。


我们首先表明,链路预测精度的一些测量对于节点潜在双曲线坐标推断的不准确性是极其敏感的,因此我们开发了一种新的坐标推理方法,该方法最大化了这种推理的准确性。将这种方法应用于合成和真实网络,我们发现尽管存在大量竞争方法来预测明显的易于预测的链接,其中双曲线链路预测很少是最好的但通常是竞争性的,它是最好的,通常到目前为止,当任务是预测不太明显的缺失链接时,真的很难预测。


这些链接包括缺失链接,缺少链接的大部分缺失链接,缺少任何公共邻居的节点之间缺少链接,以及大潜在距离的不同节点之间缺少链接。总体而言,这些结果表明特定链路预测任务越难,应该考虑使用双曲线几何越严重。



含时图的节点嵌入


原文标题: 

Node Embedding over Temporal Graphs

地址: 

http://arxiv.org/abs/1903.08889

作者: 

Uriel Singer, Ido Guy, Kira Radinsky


摘要: 在这项工作中,我们提出了一种在含时图中嵌入节点的方法。我们提出了一种算法,该算法随时间学习含时图的节点和边的演化,并将该动态结合在用于不同图预测任务的时间节点嵌入框架中。我们提出了联合损失函数,其通过学习组合其历史时间嵌入来创建节点的时间嵌入,使得其优化每个给定任务(例如,链路预测)。


使用静态节点嵌入来初始化算法,然后在不同时间点对节点的表示进行对齐,并最终在联合优化中适应给定任务。我们评估了我们的方法相对于竞争基线和算法替代方案的时间链路预测和多标签节点分类这两个基本任务的各种含时图的有效性。我们的算法显示了许多数据集和基线的性能改进,并且对于具有较低内聚性和较低聚类系数的图表尤其有效。



子图网络在结构特

征空间扩展中的应用


原文标题: 

Subgraph Networks with Application to Structural Feature Space Expansion

地址: 

http://arxiv.org/abs/1903.09022

作者: 

Qi Xuan, Jinhuan Wang, Minghao Zhao, Junkun Yuan, Chenbo Fu, Zhongyuan Ruan, Guanrong Chen


摘要: 本文引入子图网络( SGN )的概念,然后应用于网络模型,设计用于构造一阶和二阶 SGN 的算法,可以很容易地扩展到构建高阶网络模型。此外,这些  SGN 用于扩展底层网络的结构特征空间,有利于网络分类。数值实验表明,与仅基于一个或两个这样的网络的模型相比,基于原始网络的结构特征以及一阶和二阶 SGN 的网络分类模型总是表现最佳。


换句话说,无论使用何种特征提取方法,例如手工,网络嵌入和基于内核的方法,  SGN 的结构特征都可以补充原始网络的结构特征以实现更好的网络分类。更有趣的是,发现基于手工制作的特征的模型比基于自动生成的特征的模型表现得更好,至少对于本研究中测试的大多数数据集而言。这表明,通常,正确选择的结构特征不仅由于其明确的物理意义而更易于解释,而且在设计基于结构的网络分类算法方面也是有效的。



网络共识模型的可

控性 Gramian 子矩阵


原文标题: 

Controllability-Gramian Submatrices for a Network Consensus Model

地址: 

http://arxiv.org/abs/1903.09125

作者: 

Sandip Roy, Mengran Xue


摘要: 对于具有网络节点子集输入的网络共识模型,检查可控性 Gramian 的主要子矩阵及其逆。具体而言,Gramian 子矩阵的几个性质及其反转 - 包括主要特征值和特征向量,对角线条目和符号模式 - 的特征在于利用矩阵的特殊双非负结构。此外,基于模型的扩散形式,根据网络图中的割集来获得这些属性的主要化。还分析了可控性 Gramian 的渐近(长时间范围)结构。 Gramian 的结果用于研究网络共识模型的目标控制的度量。




来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


新型异构图注意网络 等24篇

利用数据科学了解电影业的性别差距 等8篇

无标度特性促进脑网络交叉频率相互作用 等19篇

如何自动化地评估科技新闻的质量 等15篇

在线分工:开源软件中的涌现结构 等18篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

话题:



0

推荐

集智俱乐部

集智俱乐部

504篇文章 2年前更新

集智俱乐部,英文名Swarma Club,成立于2003年,是一个从事学术研究、享受科学乐趣的探索者的团体。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的“没有围墙的研究所”。公众号:集智俱乐部,官网:swarma.org。

文章