eLife是一个刊登生命和生物医学各领域高水平论文的开源在线期刊,开创性地推出了新的原型——允许科学家修改论文中的底层代码来调整图表,以方便科研工作者们验证,重构或更好地理解彼此的工作。
编译:集智俱乐部翻译组
来源:nature
原题:
Pioneering ‘live-code’ article allows scientists to play with each other’s results
在线期刊eLife发布了第一篇“计算结果可复现”的文章,其中的图表(figure)与生成它们所需的软件、数据和运行环境是一个有机整体。
读者可以更改底层代码并生成修改后的图表,以便更好地理解、验证或重构相关工作。 例如,他们可以重新运行代码以查看去除异常值后的图形,或者使用不同类型的图表来更有效地显示趋势。
2018年,eLife首次发布了一篇可复现文章,这是迈向未来的重要一步,其中的论文不再只有静态页面。
发表于 eLife 的这篇交互式论文:
https://repro.elifesciences.org/example.html#
关于这篇交互式论文的更多介绍:
https://elifesciences.org/labs/ad58f08d/introducing-elife-s-first-computationally-reproducible-article
“未来的论文”
“eLife目前正在做的是实践对论文进行升级的承诺,使其不仅由书面文字组成,而且能够成为包括数据和代码作为不可或缺的部分的多面通信媒介。”Lorena Barba说道。他是华盛顿特区乔治华盛顿大学的机械工程师、航空航天工程师和可再现性领域的专家。
Giuliano Maciocci表示,该文章是该期刊现在计划大规模推广的技术原型; 想要开发类似功能的作者可以考虑与该期刊取得联系。
这些技术将来可以让研究人员更容易地使用彼此的代码。 用户无法上传他们自己的数据并将其添加到图标中,但是Maciocci表示,他们预设的是,用户最终可以下载这些文章并在自己的计算机上运行它们,以便使用作者的代码来对他们自己的研究进行。
复用此类软件通常很困难,因为他们包含令人困惑的相互依赖的工具集,而每个工具都必须下载和安装。 eLife发布的概念验证允许用户直接在文章正文中查看和运行代码,无需安装。 “读者将轻松地运行代码并使用数据。”Barba解释道。
在Twitter上,纽约洛克菲勒大学的神经生物学家Cori Bargmann将这一进展描述为“未来的论文”—— “新的eLife格式提供了更多共享数据与分析成果的机会,从而实现共赢。”
实现文档可复现的功能并不新鲜,加州大学戴维斯分校的生物信息学家Titus Brown表示,研究人员可以通过将提供交互式实验室笔记本,如Jupyter Notebook等工具,与基于云的允许其他人执行代码的软件Binder相结合来自行完成。 “缺乏的是与发行商方面的整合,” Brown说。
论文地址:
https://repro.elifesciences.org/example.html#
计算胶囊
(Compute capsules)
一些期刊,例如F1000Research,GigaScience和Cell Press系列,已经允许作者在他们的文章中从云平台Code Ocean嵌入可执行的“计算胶囊”(Compute capsules),代码和运行环境以交互式组件的形式呈现。2018年8月,Nature Methods,Nature Biotechnology,Nature Machine Intelligence与Code Ocean一起组织了一项正在进行的试点项目,使用该公司的计算胶囊进行同行评审。
什么是计算胶囊(Compute capsules)?
https://help.codeocean.com/getting-started/what-is-a-compute-capsule
eLife是第一个使代码成为文章本身一部分的期刊。
2月20日发布的增强版eLife文章尝试复现了2012年的一篇关于癌细胞中经常发生突变的基因如何影响其他基因的表达论文。该研究是作为一个可再现性项目的一部分进行的:癌症生物学(一项评估肿瘤学研究结果可复现性的系统性工作) ,该项目由弗吉尼亚州的夏洛茨维尔开放科学中心(the Center for Open Science in Charlottesville, Virginia)和加利福尼亚州帕洛阿尔托的科学交流中心(the Science Exchange in Palo Alto, California)领导。
可复现的文章使用一系列名为eLife可复现文档栈的开源工具创建,其中包括Binder和一个名为Stencila Desktop的专用文档编辑器,除了每个图表都装饰有一个小蓝色箭头外,可复现的文章看起来与其他任何文章一样。当用户单击这一图标时,用于生成图表的代码将在实时的内联文本编辑器中显示。当用户更改代码时,图表将会更新,允许用户调整数据的呈现方式(参见“计算可复现性”)或测试删除异常值后的效果。
炸药图
(Dynamite plots)
宾夕法尼亚大学佩雷尔曼医学院的生物信息学家Casey Greene指出,比如,这篇文章使用带有误差线的条形图总结了一些数据。这种图有时被戏称为炸药图,因为它与狂野的西式爆炸物雷管相似,并且它有可能掩盖底层数据。使用这篇可复现的文章,读者可以用另一种风格重新创建图表,来更有效地揭示趋势。然而,他们目前还不能与其他读者分享他们所做的修改,但这是Greene希望能够被实现的一个特征。 “在我看来,这对于可复现技术来说将是显著的胜利。”他说。
根据Maciocci的说法,发布这篇文章的博客是该出版商点击量最高的一篇,自2月20日以来有超过7,500个不同的浏览者,而该文章本身只有不到2,000名用户。 “我们绝对有责任继续推进内容。”他指出,该文章使用的所有软件都是开源的,可供任何感兴趣的出版商使用,但目前还没人与该期刊联系。
作为原型,该文章目前缺少参考文献和补充数据,但Maciocci说这些在以后类似的文章中将被提供。
对于开放科学中心研究主任,同时也是这项研究的发起人Tim Errington来说,这篇文章代表了研究型文章本身的演变。 “这可能是更有利的,作为研究人员,我不必将我的研究从我可复用的工作流程转换为扁平化的版本来使它们便于阅读——实际上我有可能呈现出我所做的一切。”
Tim Errington坦言,目前eLife还不够好,但这是一个良好的开始。 “问题是,现在我们该做些什么? 我们如何继续把它做得更好?”
翻译:惠惠 Freya
审校:刘培源
编辑:王怡蔺
阅读原文:
https://www.nature.com/articles/d41586-019-00724-7
0
推荐