财新传媒
位置:博客 > 集智俱乐部 > 计算社会经济学:行为数据驱动预测性管理

计算社会经济学:行为数据驱动预测性管理

导语
大数据时代来临,经济和社会数据在人们不经意间就被大量记录。特别地,非干预的、高时空分辨率的行为数据,在预测性管理方面展露出很大的应用前景。本文整理自周涛教授在 AI&Society 第十三期上的演讲。
 
一 、行为规律性预测学习成绩
 
相比于高中,大学阶段有了更为宽松的学习环境。自由的氛围,本应有利于大学生培养个人兴趣,选择自己喜欢的发展方向。然而,宽松的环境很大程度上放任了大学生对自我管理的缺失。部分学生因为沉迷于网络游戏,终日无心课业,期末考试接连挂科。最终因无法完成学业,遗憾退学,自毁前程。
 
当教育管理者得知学生期末考试挂科的时候,其实就已经晚了。如果有心观察,沉迷游戏的学生,早在平时的行为就区别于其他学生。比如,他们可能晚出早归,经常逃课,在宿舍通宵玩游戏,总让室友帮忙带盒饭, 等等。如果能及时发觉学生的异常行为,就能提早采取干预措施,避免严重学业问题的出现。
 
相关论文:
Orderliness predicts academic performance: behavioural analysis on campus lifestyle
论文地址:
http://rsif.royalsocietypublishing.org/content/15/146/20180210
 
不同于西方教育的理念里所推崇的自由氛围,东亚国家的教育文化对纪律性和规律性特别强调。父母更是从小告诉我们,要按时起床,要按时吃饭,要遵守课堂纪律。已有一些实证研究发现,课堂纪律与学生成绩显著相关。然而,行为的规律性与学习成绩的关系,还很少被大规模数据分析验证过。
       
       
基于近两万名大学生的校园刷卡记录数据,包括食堂吃饭、寝室洗澡、教学楼打水和图书馆进出4种行为约3000万条刷卡记录,可以构建出两类高阶的行为特征(有序性和努力程度),并与学习成绩形成关联。最终,利用机器学习算法,根据学生的行为特征预测他们的学习成绩。
       
图1:洗澡和吃饭规律性示意图。(a)中深蓝色代表前5%有规律的,浅蓝色是前5%没规律的。举例而言,(c)图是开始洗澡的时间在一天24小时中的分布,大家容易看到,某位有规律的同学主要在晚上21点左右洗澡,而没有规律的某位同学除了凌晨02:30到05:30,随时都可以去洗澡。| 图片来源:Y. Cao, et al., J. R. Soc. Interface 15 (2018) 20180210
       
有序性(Orderliness),衡量学生行为的规律程度。基于寝室洗澡和食堂吃饭的刷卡时间序列,使用真实熵(Actual Entropy)来计算。将行为时刻划分到一天内的48个区间内,行为越集中(熵越小)则有序性越大,行为越分散(熵越大)则有序性越小。如图中,深色曲线代表的学生,有序性更大。
 
将有序性作为重要特征引入机器学习模型,能够显著提高对成绩的预测能力。
 
 
努力程度(Diligence),通过教学楼打水和进出图书馆的次数来估计,记录数越多,努力程度越大。
       
       
将有序性和努力程度与学习成绩关联起来,结果发现,有序性与学习成绩显著正相关。努力程度与学习成绩的关联性,稍微强于有序性与学习成绩的关联性。有序性与努力程度不显著相关,说明他们对学习成绩的独立解释能力。
 
二 、宗教的在线社交网络隔离
 
宗教信仰能够促进人类合作,提高公民参与,提升生活满意度,还能引领经济发展。不同宗教和文化团体,因内部倡导文化不同,会表现出不同的社会连接。
 
一般而言,越小众的亚文化团体,内部成员连接越紧密,更有利于获得团体成员的社会支持。宗教亦是如此。有些宗教可能比较包容,愿意跨宗教交流。也有些宗教可能相对保守,不太倾向于外部沟通。那么,宗教成员之间是怎样连接呢?
        
       
以关键词检索和人工核验的方式,研究者在新浪微博平台收集到6875个宗教信仰者账号,包含基督教、佛教、伊斯兰教和道教。分析这些宗教信仰者之间的社会网络,发现节点的出度和入度分布都有很强的异质性。而且,网络有非常清晰的社团结构,仅有1.6%的跨宗教连边。
 
这说明,宗教网络存在高度隔离的现象,宗教信仰者更倾向于跟同宗教信仰的人连接。这种隔离程度,远高于已知的种族和政治党派的隔离程度。
       
       
剔除掉规模效应的影响,将宗教信仰者之间连边的混合模式,与随机置乱模型下的情况做比较。结果发现,宗教信仰者仍然显著地倾向于与同宗教信仰者相连。其中,伊斯兰教和道教的同质性最为突出。佛教信仰者连接其他宗教信仰者的倾向性最大,这暗示佛教在中国的跨宗教交流中扮演重要角色。
 
慈善活动有助宗教间交流
 
宗教网络中仅有的一小部分跨宗教连边,为不同宗教信仰者架起沟通的桥梁,对维持宗教网络全局连通性非常重要。通过边渗流动力学,定量刻画跨宗教连边的重要程度。结果发现,跨宗教连边在维系网络联通性方面,比介数中心性、桥接性和节点度起到更显著的作用。
       
 
如此重要的跨宗教连边,是如何形成的,又包含哪些连接模式呢?
 
将跨宗教连边细分为四种类型,结果发现,具有被关注但不关注别人模式的节点(Type 3),其入度是平均水平的十倍以上。进一步分析这些宗教信仰者的账号信息,发现10%左右账号是慈善相关的团体。
 
在宗教网络中,绝大多数与慈善相关的节点都归属于佛教,这与佛教所倡导的包容和宽容非常契合。值得注意的是,与慈善相关的节点吸引了将近50%的跨宗教连边。这表明,慈善团体在促进宗教彼此交流方面有重要作用,慈善活动或将有助于增进宗教间的合作。
 
作者:高见
编辑:王怡蔺
推荐 0