财新传媒
位置:博客 > 集智俱乐部 > 人类行为预测:从社会物理学到机器学习

人类行为预测:从社会物理学到机器学习

导语

社会物理学,是一门受物理学启发,利用数学工具理解人类群体行为的学科。在短时间内“少量多次”地收集数据信息流,或许你就是这样“被预测”的。

编译:集智俱乐部翻译组

来源:blogs.wsj

原题:Social Physics: Reinventing Analytics to Better Predict Human Behaviors

200多年前,社会物理学(Social Physics)就诞生了(该词最早由19世纪法国社会学家奥古斯特·孔德提出)。这个学科试图利用物理学的原理来解释人类社会的行为。但直到近20年,我们才拥有了足够的数据,强大的计算能力和复杂的算法,来为人类的社会行为构建定量的理论。

现在,通过分析人与人之间的数据信息流,我们可以可靠地预测出某些群体即将作出的决策。

智慧社会:

大数据与社会物理学

麻省理工学院的教授阿莱克斯·彭特兰(Alex Pentland)在他于2014年出版的著作 Social Physics: How Good Ideas Spread - The Lessons from a New Science 中写道:

驱动社会物理学的引擎是大数据——近来无所不在的、关于人类生活的各个方面的数据。社会物理学的作用体现在分析人类活动的规律,以及人类活动所留下的数字“面包屑”(通话记录、信用卡交易记录和GPS 定位等)里包含的想法中。

这些数据通过记录每个人做出的行为决定来描述其日常生活。这和人们写在 Facebook 上的内容有很大不同,Facebook 上的“状态”是人们选择告诉他人的内容,而且这些内容是根据当时的标准编辑过的。

但是,我们究竟是怎样的一个人不是通过我们声称自己做了什么,而是通过我们去过的地点以及我们购买的物品等痕迹更为确切地定义的。

这本书涵盖了麻省理工学院媒体实验室人类动力学小组十多年来的研究成果。彭特兰和他的研究生以及研究助理一道与公司进行合作,获取并分析真实世界的数据。(为了保护数据中的用户隐私,这些数据都被匿名化处理过)

最终,他们发现——能代表人类活动的所有事件数据,都包含着特殊的社交活动模式,无论什么数据都是如此。

这种模式非常常见,在所有人类活动和人口统计中都能发现。在新的人类行为趋势能够被其他任何技术检测出来之前,就能够使用这种模式去检测当前人类行为的趋势。

eToro:

提高在线金融交易用户业绩

例如,彭特兰教授和他的博士后扬尼弗·阿特舒勒(Yaniv Altshuler)、博士生潘巍(Wei Pan)根据社交投资平台 eToro 的数据设计了一个研究项目。

https://www.etoro.com/

这项研究,以《超越回音室》(Beyond the Echo Chamber)为题发表在《哈佛商业评论》(Harvard Business Review)上。

eToro 是一个面向普通交易员的在线金融交易平台,其最有趣的地方在它融合了一个叫作 OpenBook 的社交网络平台。社交网络用户可以在 OpenBook 上方便地查询其他用户的交易、投资组合和历史表现,但是却不能看到其他用户在效仿谁。

以下是用户可以在 eToro 上进行的两种主要交易类型。

  • 单次交易:本人进行一次普通交易。

  • 社会交易:完全效仿另一个用户的单次交易,或者自动效仿另一个用户的全部交易。

许多用户公开他们的交易想法以让他人效仿。因为每当有人决定效仿另一个用户在 OpenBook 公开的交易记录时,后者就会从 eToro 获得一小笔钱。一个用户往往会选择效仿好几个用户。

社会学习带来巨大效益

2011年,彭特兰教授的团队收集了 eToro 上 160 万用户的欧元/美元交易数据,以此考察近千万次的金融交易。

这一例子的有趣和重要之处在于:我们能够确确实实地观察到社会学习进行的过程,跟踪这种学习对于人们决策的影响,并评估这些决策是否会获利。他们发现交易员的行为呈现出连续的分布模式。

我们会发现,在一个极端,一些交易探险家不怎么关注别人,或者说关注的量很少。而在另一个极端,一些社交大人型的交易员,彼此之间有着紧密的关联。而其他的交易员则位于这二者之间,不仅有从社交中学习的交易,也有自己进行的交易。

如果运用得当,社会学习能带来巨大的效果。

我们清楚地看到社会学习的效果是非常巨大的。当社交网络内的交易员的想法达到适当的平衡和多样化时,与个体交易员相比,他们的投资回报能提高30%。

在这种数字交易环境中,最佳地点(Sweet Spot)就落在两个极端之间。这个中间地带就是社会学习的地方:模仿成功人士并带来实际的收益。

这种社会物理模式已经在各种涉及人的活动应用中得到了测试,其中包括商业战略的制定、都市经济活动、甚至与情报机构的合作:基于 Twitter 数据的潜在恐怖活动检测。只要数据中包含人类的活动,就可以应用类似的行为动力学。

原理探究

这种普遍存在的社会物理学的原理是什么?

答案可能存在于演化生物学和自然选择。演化的关键是生存,因此在不断变化的环境中生存,显然需要去结合社会学习和新的思想。

我们通过物理学的镜头,去更好地欣赏社会物理学。举个例子:探测宇宙非常小的变化来发现和跟踪快速移动且具有潜在的危险的近地物体,或者通过探测行星快速经过而引起的恒星光线的微弱变化,来寻找太阳系以外和地球体积相近的行星。

如果没有过去几百年发展出的物理学原理和模型,那么无论我们现在拿到多少数据,都几乎不可能检测出与任何一个目标相关的信号。

机器学习助攻

人工智能正在快速地发展,成为了我们这个时代一项重要的技术。在近期的人工智能新浪潮中,机器学习及相关的深度学习起到了重要的作用。计算机可以通过获取和分析大量的数据来学习,而非显式编程。

现在,已经完成了机器学习算法的构建,这些算法可以从大量的输入样本中学习,然后应用于复杂的问题,例如翻译、自然语言处理和围棋比赛。

人类的行为和互动是复杂多变、难以预测的。总体的行为可能和个体的行为有所不同,因此为了预测人类的行为,需要高频率地分析在短时间之内收集到的小量数据集。

总部位于以色列的创业公司 Endor 成立于 2014 年。彭特兰教授是 Endor 的共同创始人。Endor 致力于使用人类行为数据得出快速、准确的预测。

通过把社会物理学的技术应用与数据分析,构建出了预测算法。这样就能提取出存在于原始数据中的社交信息特征。可口可乐,万事达卡,沃尔玛和 BCG 都是 Endor 的客户。

www.endor.com

社会新驱动力

社会物理学仍然是一门新的学科,需要做很多的工作并在现实世界中进行验证,去证明它的价值。

正如彭特兰教授在《智慧社会》的最后章节所讲的:

最后,我认为基于社会物理学原理、数据驱动的社会,是值得我们努力构建的。期待未来——我们可以预测和减轻金融危机的影响,检测和预防传染病,更明智地使用自然资源、促进创新和减少贫困。

这些目标曾经是科幻小说的素材,但是这一目标可以成为现实——我们的现实,只要我们能小心避开陷阱。这就是由社会物理学和数据驱动的社会给出的回报承诺。

翻译:Leo

审校:李周园

编辑:王怡蔺

原文地址:

https://dwz.cn/QXZo4iV3

推荐 0