数据共享
数据共享越来越被视为提高研究透明度和可重复性的必要步骤(Taichman等人,2016;维克斯,2006)。关于生物医学领域数据共享的必要性,特别是公共资助的研究,有很多讨论。因此,有许多学科正在讨论数据共享的建议。
出版商,包括公共科学图书馆和英国医学杂志出版集团,已经实施了数据共享要求的公司发现,做到这一点并非易事。最近一篇关于“学术厨房”的文章(http://scholarlykitchen.sspnet.org/2016/01/13/what-price-progress-the-costs-of-an-effective-data-publishing-policy/)讨论了将数据共享作为发表研究成果的一项要求可能带来的成本和劳动力问题。提出的一些问题涉及到出版商以外的数据档案和基础设施的可用性,以及期刊的执行政策,以确保数据存档和共享的遵守。如果没有数据共享政策的执行,并且缺乏支持数据共享的基础设施(例如,尽管在澳大利亚发展得很好,但目前还不完善),编辑们没有在论文被接受之前对数据进行同行评审的政策,那么要求数据共享实际上如何提高研究的完整性呢?其他问题包括数据应该保持多长时间可用,谁应该管理数据的可用性和共享,以及这些需求的成本是多少?此外,需要确保那些数据被重用的人得到足够的信任——这不是常规的做法,但Force 11和其他组织(https://www.force11.org/group/joint-declaration-data-citation-principles-final)正在努力。最近,莱万多夫斯基和毕晓普(2016)对数据的合法请求和重用问题进行了系统和深入的探讨。
鉴于上述对实施数据共享政策的关注,本中心诚邀就以下问题进行讨论:
- 现在是否应该要求研究人员公开他们的数据作为发表的条件?
- 谁应传播准则和/或监测数据共享实践?bob官方app
- 关于重用已发布数据的问题是什么?
- 作者提交的数据是否应接受同行评审?在出版之前?解决关于结果的争议?用于系统回顾和荟萃分析?
- 哪些最佳实践已经被期刊、出版商和数据仓库所使用,并可以被其他考虑数据共享需求的机构采用?
- 既然过去的做法往往不能以任何容易的方式实现数据共享,是否应该对旧工作“特赦”,而对正在进行的工作适用更严格的标准?
参考文献
莱万多夫斯基,主教D.(2016)。研究诚信:不要让透明度破坏科学。自然, 1月25日,第529卷;http://www.nature.com/news/research-integrity-don-t-let-transparency-damage-science-1.19219
Taichman DB等(2016)。共享临床试验数据——来自国际医学期刊编辑委员会的提案。新英格兰医学杂志1月20日。DOI: 10.1056 / NEJMe1515172
张志强,张志强(2006)。这到底是谁的数据集?分享随机试验的原始数据。试用7;15.DOI: 10.1186 / 1745-6215-7-15
韦格,E.(2016)。共享数据是一件好事。但我们需要考虑成本。撤回观察,2016年1月28日;http://retractionwatch.com/2016/01/28/sharing-data-is-a-good-thing-but-we-need-to-consider-the-costs/
评论
没有数据和代码,可复制性就是一场闹剧。因此,应该尽可能多地提供数据和代码。关于努力的争论是无稽之谈。如果对数据进行了充分的组织以进行分析,那么将文件上传到某个存储库中就需要做一些额外的工作。
我不同意莱万多夫斯基和毕夏普的观点。除了讽刺之外——莱万多夫斯基以隐瞒草率的研究而闻名,毕晓普在骚扰蒂姆·亨特的事件中起了很小但关键的作用——他们主张降低透明度,以保护研究人员免受顽皮的外人的伤害。这是行不通的。如果他们想打你,他们会找根棍子。隐藏你的数据只会给他们更大的压力。与此同时,降低透明度有效地保护了不守规矩的研究人员。
发表评论
“最近,莱万多夫斯基和毕晓普(2016)对数据的合法请求和重用问题进行了系统和深思熟虑的探索。”
这是来自写这篇文章的匿名COPE代表的令人瞠目的和相当令人担忧的评论。
如果这是COPE的观点,那么参加你的网络研讨会就没有意义了。
请阅读《自然》杂志文章下方的评论,以及以下四位学者的博客文章:
妮可Janz
完全错误地理解了透明度的概念
Judith咖喱
违反科学的规范和精神
詹姆斯·科因
对数据共享战争的进一步洞察:科学媒体中心给英国议会的写信运动
和我自己
Nature on research integrity?
(链接被删除,因为它们触发了(电子邮件保护)陷阱)
发表评论
1.我会区分数据源和数据——这在定性研究中尤其重要。数据是用来支持索赔的,而视频或文字记录是数据源,可以提取不同的片段来支持非常不同的索赔。
2.在PISA和其他社会科学数据的统计分析中,多次使用大数据集已经很常见。无论如何,使用这样的数据集,至少在加拿大,必须得到当地研究伦理委员会的批准。
3.在招募和知情同意期间需要规定,数据一旦发布,就不能再像目前的做法那样撤回(“可随时撤回”)
发表评论
三个问题;首先,什么是“临床试验”?——只有公共资助的试验?许多住院医师和研究员进行的试验可以被理解为临床试验(对照组、干预措施、具体的结果措施)。这些试验的数量通常很少,这使得潜在患者的识别更加困难。还不确定这些试验是否能足够盲化以保护患者。
第二,谁“拥有”这些数据?是什么阻止了另一个人的职业生涯在这些公共数据集中跋涉,疯狂地发布数据,以数据从未打算过的方式不恰当地使用数据?
第三,共享数据的时间限制。由于该领域的进步,一些数据显然会有保质期,并将变得过时或不合适。是什么阻止人们使用旧数据?
发表评论
我很欣赏沃尔夫-迈克尔·罗斯关于数据源和数据之间区别的评论,但我认为,对于一些定性研究,许多人对数据源仍然缺乏信心。例如,卡洛斯·卡斯塔内达在加州大学洛杉矶分校的人类学博士学位是基于他对萨满教和peyote经历的“实地记录”,并继续写了许多关于雅基萨满Don Juan Matus (https://en.wikipedia.org/wiki/Carlos_Castaneda).批评人士大多声称卡斯塔涅达的作品是小说,而不是民族志,尽管他的博士学位从未被撤销,但耶鲁大学人类学系的一位前主任声称:“对我来说,这仍然是令人不安的、不可原谅的道德违背”(http://www.salon.com/2007/04/12/castaneda/).也许这不会发生在今天的学术氛围中,也许更严格的同行评议会注意到卡斯塔内达的工作中的差异,但数据和数据源可能很难消除歧义,如果不是不可能的话。
发表评论
从计算机科学的角度,我想补充:
1.发布软件应该与发布数据分开。这里有一些分享软件的实验和检查的信息:http://cacm.acm.org/magazines/2015/3/183593-the-real-software-crisis/
2.当我们转向其他学科(例如,计算机科学)时,正式的同行评议会议记录发挥着非常重要的作用,甚至可能比许多期刊的作用更大。因此,数据共享也应该支持会议和论文集,而不仅仅是期刊。
Aliaksandr Birukou
的名字。姓AT springer.com
发表评论
我知道论坛的日期是上周五,但我希望您仍然可以发表评论。
我感兴趣的是,期刊是否应该要求审稿人审查已存的数据。由于我们已经向审稿人提出了如此多的要求,我担心让他们审查大型数据集将占用他们更多的时间,可能会使编辑更难找到愿意的审稿人。我当然不反对分享数据,我只是想了解其他人对数据应该被审查的看法。
发表评论