为什么数据发表不容忽视

美国期刊专家AJE跟您一起聊聊数据发表和数据共享。

更新于2012年1月1日

现存数据

大数据的时代势不可挡的已经到来。地球大数据、生物大数据和医学大数据频频在耳边出现。对于任何一个科研人员而言,数据(Data),其实就是科学研究的生命线。科学研究中的一个关键的环节就是为你的学术论点寻求并提供有力的证据。早在700多年前,被称为“万能博士”的罗杰▪培根就在他的学术著作中明确指出,没有感官数据、实验数据及可靠数据支撑的任何学术理论都是站不住脚的。再激烈的学术争论没有通过实践来证实都是没用的。可见,数据对于我们的研究工作和学术论文而言就是一个核心的灵魂。

事实上,一篇论文是否可以被同行认可、被期刊接受发表,一篇论文的结论或新发现是否会引起其他研究人员的兴趣而被引用或利用来重复试验或开展新研究,在很大程度上取决于为这些研究提供支持的数据的可获取性和可靠性。根据一项对科研人员关于数据共享途径的调查结果显示,目前科研人员获取和分享数据的最主要途径是根据需要直接联系,其次是通过访问已有数据库。但是,即便一篇新近发表的论文,其中的数据最多也只有30%多(参见下图论文发表后的数据保存率,原始数据来自Vine et al. Current Biology 2014)可以被保存和重复利用。随着时间的推移,20年后,一篇论文的数据保留比例可能几乎为“零”。这样的调查统计结果可能会令科学家自己都感觉诧异和遗憾。因为,这意味着,科学家们千辛万苦、夜以继日的在实验室工作产生的大量一手数据最终都以“被淹没”终结他们的生命。科研人员都很清楚,为了让一篇论文看上去或深究起来是一个完整的无懈可击的故事,庞大的第一手原始数据中只有很小比例的一部分数据被筛选出用以佐证我们的论点。大部分的数据最终都成为了黑箱数据“Dark Data”。

与论文发表本质不同的地方在于,数据发表强调对数据本身的记录和详尽描述。拿一个测试样本来说,在什么地方获取,什么样本,进行了什么处理和测试,数据结果存储在什么地方,是让别人有效获取数据的关键信息。因而,关于数据的表述,数据论文(Data Paper)或者更确切的说数据描述文稿(Data Descriptor)便是作者提供的详尽的关于数据描述的文稿,这样的文稿在公开发表之后是可以被科学引用的(如自然科研旗下的期刊Scientific Data)。与此同时,Data要求被存储在全球已有的涉及众多学科领域的专业数据库,大概90多个。在Data paper正式发表的同时,这些数据被要求在CCBY开放获取协议下可以免费下载、修改和重复利用。有了这样的公开发表和获取的期刊平台,科研人员可以将不足以作为论文发表的大量数据以数据论文的形式公开发表,告诉同行做了什么,怎么做的,获得了什么,可以分享什么。从而可以使数据本身得到最大限度的引用、使用和为未来创新研究提供基础贡献,使某项研究得到更广泛的传播,更好的发挥数据的重复使用价值,不至于最终被“湮没”。数据发表的另一个特点在于,由于数据量的庞大,数据的结构、标准或形式对于数据的有效获取显得尤为重要。为了方便作者发表数据,某些期刊也为作者提供了数据格式的编辑支持。AJE也为作者提供了关于数据和论文的格式编辑服务

撰稿人
标签
数据发表 数据库格式编辑大数据论文数据实验数据数据共享
目录
订阅邮件
订阅我们的邮箱后可提前获得AJE作者资源的文章,享受AJE服务的折扣,以及更多的优惠

查看 "隐私协议"