保存和规划好你的研究数据,避免数据灾难!

数据管理至关重要,需制定有效计划来确保数据安全,避免数据灾难。计划应涉及数据收集、存储、验证、备份、位置跟踪、登录信息管理和数据沿袭。数据应安全存储并定期备份,同时明确收集程序,确保质量。跟踪数据位置和登录详情,避免覆盖旧版本,以保留重要资料。这些措施提升数据安全和项目质量。

更新于2024年4月15日

保存和规划好你的研究数据,避免数据灾难!

为了避免数据可能带来的 "灾难",了解如何管理数据非常重要。数据管理最重要的一个方面就是制定有效的数据管理计划。一旦以物理或数字形式收集了数据,计划如何存储这些数据就至关重要。对于所有研究项目来说,进一步规划对数据采用何种程序以及如何管理数据的可访问性都是至关重要的。

保存和规划好你的研究数据,避免数据灾难!

在研究项目需要数据之前,一定要计划好如何存储和保护数据。以下是避免数据灾难的六个重要数据提示:

数据管理计划应形成文件。该计划应是一份明确的文件,包含如何收集、存储、分析、保存和保护数据的所有相关信息。

应明确数据收集程序。这意味着要准确了解哪些收集方法可用于进一步的数据管理。验证程序可能很复杂,应妥善记录。有效的数据管理计划侧重于如何验证数据在不同步骤中得到妥善管理。

在数据管理计划中,跟踪不同步骤和数据脉络的能力至关重要。本文AJE将进一步阐述所有这些细节。

1. 安全地管理和存储数据

数据管理文档应包含一份明确的计划,说明如何将数据存储在安全的位置或设备中,以确保部分或全部数据不会丢失、被未经授权的用户访问或窃取。将安全数据存储作为研究项目的正式步骤。我所说的 "安全 "是指确保防止任何未经授权的数据访问。任何敏感数据都要得到妥善保护。

根据FAIR 原则,任何管理数据的数据存储库都应明确定义数据访问权限;登录详情和授权程序也应明确定义。无论数据的授权和开放程度如何,确保潜在用户非常清楚地了解访问数据的原则是最重要的事情之一。

要实现安全的数据管理,请检查数据的存储位置。如果数据存储在在线数据库中,应制定计划检查存储库的可信度。如果数据存储在物理设备上,则必须制定安全存储计划。

2. 数据验证和质量控制管理

首先,要明确定义数据的指标和质量特征。此外,管理计划应制定标准,规定哪些数据可以纳入项目。

有许多细节可以用来评估和衡量数据质量。数据准确性就是其中之一。这一特性可能取决于仪器的准确性、研究观测的标准或其他技术方面。

数据准确性可能取决于数据中存储的信息水平。数字数据的小数点位数就是一个例子。另一个例子是科学图像的像素数量。像素越高,数据的信息量和准确性就越高。

保存和规划好你的研究数据,避免数据灾难!

所有这些数据特征都应在数据管理计划中明确定义。

技术特征对于确保数据的可用性和可管理性非常重要。

质量标准确保存储的数据具有足够的质量和完整性。

在制定数据管理计划时,应确定确保数据与研究问题相关所需的步骤。数据应以完整的形式存储。

最后,确保数据的存储日期符合研究目标。

3. 数据存储

你的数据管理文件应包含安全备份数据的指导原则。备份数据可以存储在移动硬盘、云盘、光盘(不太常见,但仍在使用)、扫描或数据的物理打印件上。

备份数据是防止数据丢失的主要措施。在没有某种形式备份的情况下丢失数据,是研究人员面临的最常见也是最容易避免的错误之一。备份数据的每一个有用部分,避免敏感数据。

理想情况下,数据备份计划的一部分应说明至少两个不同的位置,一个是主要数据位置,另一个是备份位置。就数据保存和安全性而言,多个备份比一个备份要好得多,但可能需要更多资源。根据可用资源(如存储设备中的可用内存)或资金情况调整备份程序。

保存和规划好你的研究数据,避免数据灾难!

如果主数据和备份数据存储在同一位置,数据丢失的风险就会增加。避免在与原始数据相同的位置备份数据。

为备份制定部分数据管理计划与主数据计划同等重要。如果在线存储备份数据,则需要授权程序。为任何备份填写数据管理计划中的登录详细信息部分。

4. 数据位置管理--跟踪数据存储位置的计划

跟踪你是以物理方式还是在线方式存储数据。数据可以存储在许多物理位置,如移动硬盘和个人电脑。数据也可以在线存储在数据库和云端等。

记录数据的存储位置至关重要。某些研究项目可能包含许多不同类型的数据。很容易忘记数据的位置。

将此策略视为存储位置蓝图。可以简单到将数据存储在笔记本电脑或 USB 设备上,作为研究项目的备份。

在数据管理计划中创建一个部分。它应准确定义数据的存储位置,以便于定位和访问这些存储设备或数据库。该部分应包括存储库或云存储的名称、URL 以及最大存储空间和登录详情等详细信息。

5. 登录详细信息的管理

确保对如何存储用户名、密码和其他登录信息有一个计划,以保护你的数据。数据库甚至个人电脑通常都有登录程序。如果忘记登录信息,数据将无法访问。

在处理数据存储库和大型项目时,这一点尤为重要。登录凭证可能包括数据管理人员和其他处理数据的人员。不在文件中注明这一点可能会导致访问权丢失,如果这种情况持续下去,可能会拖慢大型项目的进度。

此外,保存登录详细信息有助于保护敏感数据和整体数据安全。

6. 数据沿袭管理

最需要避免的错误之一: 如果创建了更新或更简洁的数据版本,应避免覆盖旧文件。

为什么?

旧版本是重要的参考资料,可用于回溯之前的版本,查看增添/更改的内容。此外,你的原始数据(第一个版本)对整体数据完整性也有贡献。

所有以前的版本不仅可以让你跟踪版本历史,还可以跟踪所应用的程序。在保存以前版本的数据时,计划中应包含如何保存每个新版本数据的元数据的部分。

保存和规划好你的研究数据,避免数据灾难!

定义这一部分是数据管理计划--数据脉络--不可分割的一部分。它包括从原始版本到最终版本的所有版本。

数据管理计划中应包含以下部分,以跟踪数据的流向:

  1. 原始数据
  2. 原始数据存储后创建的版本
  3. 对原始数据所做的更改
  4. 对数据使用方法的描述
  5. 每个版本的元数据,包括原始数据
  6. 与每个版本相关的数据量(如样本数)
  7. 与每个版本相关的内存消耗(如兆字节、千兆字节)
  8. 与每个版本相关的日期
  9. 显示随时间推移版本变化的脉络图

7. 数据管理的财务问题

考虑数据管理的财务问题,特别是在研究项目中使用补助金或编制预算时。研究经费的很大一部分与数据管理有关。

云计算和科研数据存储库通常为大型项目提供免费存储或付费存储,确定需要多大的存储量以及此类项目的资金需求。如果研究项目不需要太大的空间,则有大量免费选项,应将其作为数据管理计划的一部分加以考虑。另一方面,如果所需的存储空间较大,且需要复杂的维护,则应尽量详细确定所有方面,包括预算。如果没有明确计算数据维护的预算需求,可能会导致项目停止甚至取消。

撰稿人
标签
研究数据论文数据论文数据统计
目录
订阅邮件
订阅我们的邮箱后可提前获得AJE作者资源的文章,享受AJE服务的折扣,以及更多的优惠

查看 "隐私协议"

AJE英文润色帮您彻底解决论文语言问题!

来自Nature的实验数据表明, 使用AJE的润色服务之后,来自中国的稿件接收率平均由28%提高到了42%。