开源科学：集智俱乐部与科学的未来

作者： K 集智俱乐部

1612年12月8日伽利略日记，图左标记“fixa”的是被人类首次发现的海王星

1610年夏的字谜游戏

左：伽利略；右：17世纪画家Johannes Hevelius笔下的天文观察者

1610年7月25日，伽利略给开普勒写了一份信，全文如下：

“smaismrmilmepoetaleumibunenugttauiras.”

很难看明白是什么意思。如果你恰好出生在伽利略的年代，并且恰好具备只有伽利略自己才懂得的解密技巧，你就知道这其实是一个字谜，它应该重新排列成

“Altissimum planetam tergeminum observavi.”

这是拉丁文。翻译成英文就是

“I have observed the highest of the planets three-formed.”

句中“the highest of the planets”（天顶最高的星）特指土星。伽利略用他刚刚制造出来的望远镜观察夜空，发现土星周围有两个亮点，因此认为这是一个三体星系。今天我们知道，其实伽利略看见的是土星的光环，因为望远镜的倍数不够，误认为是两颗伴星。

伽利略以字谜来宣布科学发现的做法，在当时的欧洲并不罕见。55年后，第一份科学期刊才出现。在那以前，科学家们并没有一个合适的地方公布成果。于是他们使用字谜，在彼此的通信中隐藏自己的发现。一旦别人得到类似结果，则揭开谜底来捍卫名声。这也是为什么牛顿和莱布尼茨会有微积分发明权之争 - 前者说自己早就发明了微积分，只是秘而不宣而已；后者则表示难以信服。另一个例子是胡克，他发现胡克定律时也是通过一个字谜来宣布，直到两年后才公开谜底。

今天的人们提起17世纪的科学往事，认为这些伟大科学家们有着与其智慧不相称的私德，给人类理性之光带来一缕阴影。其实还可以有另外一种理解：几千年来人类的本性变化不大：自私与奉献的意愿相伴，合作与背叛的可能并存。问题在于，一时一地的科学制度，是否能够有效激励知识的公开交流。

那么，到底开普勒是否明白伽利略的发现呢？

开普勒与伽利略相识已久，自然知道这是一个字谜。他难掩心中激动，经过反复考虑，自认为终于找到字谜的应有的排列方式

“Salve, umbistineum geminatum Martia proles.”

英文应为

“Mars has two moons.”

火星的的确有两个卫星，但是这个发现直到两百多年后，在1877年才为人确认。当时的开普勒依据自己的占星学知识和直觉，坚定不移地认为火星有两个卫星。成功解开伽利略的字谜，这令开普勒欣喜落狂。

当然，这份喜悦并没有持续太久。

万能细胞

2014年1月，日本理化学研究所（RIKEN ）研究员小保方晴子在Nature上就同一个主题发表了两篇极具轰动性的文章。

在哺乳动物的发育过程中，所有的细胞个体都是从受精卵分化而来。因此早期的胚胎细胞可以称为“万能细胞” （STAP），因为他们可以变成任何细胞，构成任何器官。但在胚胎发育成熟后，已分化的细胞很难从一种类型向另一种转变。2006年，日本的山中伸弥团队发现，如果对细胞进行“重新编程”，也就是对细胞注入某些转录因子，研究者可以改变细胞的特化程度。这个发现获得2012年诺贝尔生理学奖。

小保方晴子在文章中指出，根本无需基因操作，及其低成本的物理刺激就能令已经分化的细胞“退回”到早期胚胎的状态，变回“万能细胞”。她使用老鼠的淋巴细胞做实验，发现将其在弱酸性溶液中浸泡半个小时后再放回老鼠体内，该细胞可以演变为皮肤等其他细胞。

如果这个结果是真实的，小保方晴子将成为诺贝尔生理学奖的热门人选。但是就在论文上线的当天，美国科学家Paul Knoepfler就提出若干质疑，并认为实验不可重复。Paul在论文中挑的毛病比较琐屑，并不能完全击倒这篇论文，但他成功引发了更多质疑。日本一个专门监督学术不端的账号发现，小保方晴子论文中的胚胎细胞图，在她三年前的博士论文中描述另一个实验结果时就使用过。这成为了小保方晴子论文造假的关键证据。

2014年4月9日，小保方晴子在大阪市召开记者会，坚持自己实验没有问题，曾成功获得STAP细胞200多次。6月4日在理化研究所的压力下，小保方晴子签署书面意见，同意Nature撤回论文（7月2日正式撤回）。8月5日小保方晴子的导师和论文共同作者，世界著名干细胞和发育生物学家笹井芳树上吊自杀。9月1日论文共同作者，哈佛大学教授Charles Vacanti 宣布休假一年。

笹井芳树死之前给小保方晴子留了一份遗书：

我的死与你没有关系，请一定将STAP细胞再现出来。

笹井芳树在事发后第一时间就要求承担全部责任，请求辞职。但理化研究所管理层没有批准。他死后，原本已经禁止小保方晴子出入实验室的理化研究所松口，同意她在第三方人员在场和三台摄像机24小时监控的情况下进行STAP细胞的重复实验。

有人认为，笹井芳树是在一命换一命，以自己的死，为学生争取最后的证明研究团队清白的机会。

实验中的小保方晴子

小保方晴子等人召开记者招待会宣布获得STAP细胞，背后站的就是笹井芳树

小保方晴子在记者会上道歉，但仍然坚持STAP细胞实验没有问题

互联网之子

最近十年，一个叫Markdown的语言在世界范围内兴起了一个风潮，逐渐流行。一大堆著名网站例如GitHub、reddit、Diaspora、Stack Exchange、OpenStreetMap 和 SourceForge，都采取了这种语言以方便用户评论。同时人们还把它与计算语言如R等结合起来，创造了R Markdown，使得程序员可以轻易地发布记录了计算过程的笔记。

一直以来，html是主要的网页语言。但是html不是为人类设计的，是为机器设计的。只有经过浏览器引擎的解析，才能显示人类可理解的网页，例如颜色，文字，动画等。由于历史原因，html还需要与css，javascript等配套使用才能达到最好效果。这使得普通用户要想设计、制造网页，必须先接受专门训练。

于是人们开始考虑这样的问题，能不能有一种网页语言，简单到使人类可以直接书写“网页源代码”，又强大到运行效果与现有网页没有太大分别。正是出于这种思路， John Gruber 和 Aaron Swartz在2004年创造了Markdown。

更精确一点说，Markdown并不是html的替代品，而是后者的极简化版本。前者在浏览器解析时，最终会被重新编码成“完整”的html，并且在Markdown中，也可以直接嵌入html语句。在html已经是互联网的普遍语言的今天，对它进行简化使之更易写，而不是试图取而代之，显然是非常聪明的方法。

2008年2月9日Aaron Swartz在纽约

出生于1986年的Aaron Swartz曾是一个极其活跃的维基百科参与者。有人认为维基百科的大部分贡献其实来源于一小部分活跃用户，特别是编辑，他坚决反对这种意见。他认为，大多数用户的贡献才是最重要的，因为他们的活动中包含了大量原创行为。而少数活跃用户，例如一些编辑，主要是在反复处理一些文字细节，虽然频率高数量大，但并没有看起来那么重要。

无论是在维基百科还是别的事务上，Aaron的观念总是如此鲜明。他对互联网的开源、免费精神能够促进人类合作以及知识的创造坚信不疑。他参与开发Markdown的主要原因，也正是希望能为普通用户降低互联网书写的门槛。

Markdown开发只是Aaron为了贯彻他的开源理念所做的无数尝试中的一个。这些尝试还包括非盈利组织Creative Commons，基于python的服务器端框架, 鼓励用户自主创造有趣内容的网站reddit和互联网媒体聚合标准RSS等。

2010年底和2011年初，Aaron利用MIT的服务器，从科学期刊出版巨头JSTOR的网站上下载了400万篇期刊文章，并上传到p2p网站上公之于众。2011年1月6日他在波士顿被捕，被控以通信诈骗，电脑诈骗及从受保护的电脑非法获取数据等罪名。如果所有罪名都成立，他将面临35年的监禁及高达100万美元的罚款。

旷日持久的诉讼和审讯给Aaron带来极大精神压力。2013年1月初，辩护律师促成Aaron和JSTOR的庭外和解意向，却被MIT管理层拒绝。1月11日，Aaron在他女朋友于布鲁克林区的公寓内上吊自杀，死时27岁。

Aaron的死在互联网世界掀起轩然大波。他支持者中的美国公民在白宫网站上发起要求罢免Aaron一案检察官Ortiz的请愿书，三天内就获得两万七千个签名，超过法定的两万五千票要求。Ortiz团队在1月14日日紧急宣布，撤销对Aaron的一切指控，并对案件不再做任何评论。同时JSTOR宣布，对公众开放超过450万份文章。

因为Aaron传奇、悲剧而短暂的一生，他被媒体和他的支持者们称为“互联网之子” 。

今天，几乎Aaron所参与的每一个项目都仍然发挥着影响。所有这些影响的方向都是一致的：令人类社会通过互联网技术变得更加透明和开放。此时此刻，我们写这篇文章所使用的语言，正是Markdown。

DHJ定理证明

量子信息学家Michael Nielsen关于Open science的书

2009年2月1日，数学家Timothy Gowers在他的博客上宣布了一个叫Polymath的计划。其目的是寻找组合数学中the density Hales–Jewett (DHJ) 定理的一类特殊案例的完整证明。

这个任务目标并不新奇，新奇的是其实现方式。Timothy建议所有看到这个博客的网友采取共同讨论的方式完成证明。

虽然在此之前，Luis von Ahn等人已经提出“human computation”的概念，通过实际项目证明了“众包”方式的巨大潜力，但此前众包还仅限于一些简单任务。没有人能想到，被认为是科研中最难以拆解的数学证明任务，也能以众包的方式完成。

这个项目取得了空前的成功。先后有27个世界各地的网友，包括教授、研究生和高中生，在没有收到任何邀请的情况下，看到博客后主动参与了项目，给出了800个总计17万字的评论。Timothy在3月10日宣布，不但DHJ的一类特殊案例已经得到证明，而且网友讨论实际上已经导出了DHJ定理的一般证明。

Timothy Gowers和他的朋友，量子信息学家Michael Nielsen把这件事的经过记录下来，发表在Nature上，题目为基于大规模人类合作的数学研究。

在Michael Nielsen的新书Reinventing Discovery: The New Era of Networked Science中，他回顾了人类科学史是如何一步步变得愈来愈开放的。本文第一部分的伽利略的故事，就出自他的书。为了贯彻Open Science的思想，摆脱体制的束缚，Michael Nielsen辞去了澳大利亚昆士兰大学物理系的职位，成为一个独立研究的科学家和作家。

集智传奇

2002年的集智俱乐部首页

2014年的集智俱乐部首页

十二年前，北京还不像现在这样熙熙攘攘。冬天的夜里，低低的天空，在幽蓝的边上透出一些橙色的光，压在北京交通大学的操场上。有个年轻学生穿着棉袄，孤零零地在操场上踩着吱吱呀呀的积雪走了一圈又一圈，鞋上占了厚厚的煤渣和雪粉。

十二年前，如果你熟悉西直门一代卖打口碟的地方，你会遇到一个留着分头，带着眼镜的年轻人。他不是特别爱和陌生人说话，但如果你和他讨论科学，讨论互联网，那你们就会很快成为朋友。他会告诉他的网名叫Jake，最爱的乐队是《涅槃》，他刚刚建了一个网站，叫做集智俱乐部。他还会告诉你，集智的意思，就是swarm agents，一堆接近零智商的小生命，在虚拟世界里聚集起来，就能涌现出高度智能的结构。他怀疑人类社会也是如此。

如果你登陆这个网站，就会发现一些稀奇古怪的东西，比如有一堆基于Java代码的虚拟小蚂蚁，在网站上跑来跑去。还有曼德布罗分形，元胞自动机等等。

网站上有一篇他写的文章，叫做

《还我聪明》

这篇文章的意思是，本来大家都是很聪明的，对世界充满了热情和好奇。不知道为什么，受完教育以后，就变得又冷漠又麻木。所以他呼吁大家不要被大学教育摧残，要保持自己原有的对世界的敏锐洞察力和好奇。

十二年过去，当年和Jake一起做网站的人，早已纷纷离开，各自走进自己的生活轨道。只有他一直站在原地坚持着，继续在网站上日复一日地写博客。他也已经从买打口碟的年轻学生变成了北京师范大学系统科学系的副教授。

2008年左右，Jake开始陆续遇到新的同路人。他们修改了网站，并开始组织线下活动。他们有一种隐隐约约的感觉，人类科学正在面临转型，将会变得更加开放，透明。从只分享科研发现的结果到全面分享科研探索的思路，代码，文献，公式，并进行跨学科、无疆界的合作，是科研体制的必然趋势。他们称这种未来为“开源科学”，或者“科学2.0”。

经过六年的快速发展，现在的集智俱乐部已经成为中国独一无二的非官方科研团体，正在开源科学的愿景下，朝着成为世界顶级科研团体的目标努力。现在的集智俱乐部有两个部分，集核和集智科学委员会。

集核由11个来自各大学，公司和研究所的科学家和工程师组成，在罗伯特议事规则的指导下主持俱乐部的日常事务，包括维护邮件组和集智百科，召开读书小组，举办专题讲座等。所有的公开活动都在官网和豆瓣上发布，不设任何门槛，不收取任何费用，任何人都可以前来一起讨论科学。

集智豆瓣主页上记录的部分专题讲座

线下活动仅仅体现了集智的一小部分影响力。集智更大的影响力还在虚拟空间中，这也符合它对自己的定位。仅仅是AI人工智能邮件组就有近五百个参与者。申请加入邮件组要求具备英文文献阅读能力和基本的编程能力，但背景不限，并且在申请加入时必须说明专业背景和兴趣。

2014年，在全体集核的一致同意下，决定在全球范围内成立集智科学委员会。科学委员除了给集智的日常科研活动提供建议以外，还可以在北京以外的地方举办读书会。将来，科学委员有可能在集智框架下跨学科指导研究生。首批被提名并通过的集智科学委员有三个：

王雄（深圳大学高等研究院研究员）
王成军（南京大学新闻传播学院讲师）
尤亦庄（Post-doc Scholar, Kavli Institute for Theoretical Physics, UC Santa Barbara）

他们共同点是，已完成系统的科学训练并在三十岁以下，与集核成员有着密切联系和信任关系，对开源科学的理念有着强烈认同。

虽然集智俱乐部的使命是改变现有科学的合作方式，但并不意味着集智成员缺乏融入现有科研体制的能力。恰恰相反，集智的目标是，寻找和帮助那些对于现有科研体制来说over-qualified的年轻人，让他们知道，他们并不孤独。集智帮助这些年轻人离开限制他们真正的科学兴趣和才智的专业和实验室，选择自己更愿意从事研究的方向，并且在新的方向上找到愿意与之合作，帮助其完成专业训练的科学家。

现在集智的成员们每年都在各个领域的专业期刊和会议上发表文章，如综合类的PloS ONE，物理类的Physical review letters, Physical Review B/E，计算机类的CVPR，ICCV，ECCV等会议，社科类的Cyberpsychology, Behavior, and Social Networking 等期刊等。最可贵的是，许多科研成果，是在集智框架下实现的合作结晶。

同时，集智混杂工程师和科学家的风格使得它不仅能够产出paper，而且能产出切实改变人们生活的产品。集核袁行远等人创建的彩云天气App，使用机器学习和图像识别的方法对已有天气数据进行挖掘，实现了分钟级的天气预报。不仅被各大网络媒体推荐，成为最热门的天气类App之一，而且成为建国五十多年以来中国气象局首个伸出橄榄枝进行合作的私人团队：前者甚至特地为彩云天气团队在气象局设立了联络处办公室。

结语

当今世界，科学家是高度专业化的职业。他们乐于在期刊上第一时间公布自己的发现，并不是因为他们比文艺复兴时期的前辈们更高尚，而是这样做可以使他们在科学体制内获得回馈。科学家们取得专业学位，获得资金支持，求职，晋升，无一不与他们对大众公开的科研发现的数量和重要程度直接相关。

政府从公众那里获得税收以支持科研；科学家及时公布发现以造福社会，这个理想循环是现代科研体制的基本逻辑。比起十七世纪的贵族体制，这个逻辑是个进步，它曾促进了人类知识的创造和交流。然而，随着技术进一步发展，现有体制积弊渐深。职业压力导致科学家进行学术造假，利润驱使出版集团为了收取高昂的订阅费用，不愿意公开原本应该免费的知识。

毫无疑问，未来的世界，所有的科学知识都应该开源地被创造，免费地被获取。注意力本身，才真正具备价值的资源。人类离这个愿景的最终实现，也许还有很长一段路要走，然而这个趋势，已经被像MOOC这样的网络公开课程和PloS ONE这样的公开免费期刊所证明。所以，我们对这个未来持乐观态度。

你可以通过以下方式参与和支持集智的活动：

关注@集智俱乐部和@集智科学家，参与我们在官网和豆瓣上发布的线下活动；
给集智俱乐部发展基金捐款;
与集核联系，申请加入集智科学委员会。

扫描下方二维码，关注集智俱乐部，让我们离科学探索更近一步。

话题：