大学的政策是,通过资助项目产生的研究数据以及任何相关记录都应该保留,只要它们对研究人员和更广泛的研究界具有持续价值,只要研究资助者、专利法、立法和其他监管要求明确规定。

一般来说,正如RCUK“研究数据管理最佳实践指南”中所规定的那样,英国研究理事会希望支撑出版物中发现的数据在发表后至少10年内都可以访问。

个别研究委员会和其他资助者的数据政策和良好的研究实践指导提供了额外的要求,应在每个研究数据管理计划中咨询和规定保留期限。在许多情况下,研究人员将决定保留研究数据和记录的时间超过最低要求

保存是指以一种方式存储项目的数字输出,使其在资助结束后仍然可用、可理解和可访问。因此,在实践中,通常通过在项目期间或之后不久将数字材料存入存档/存储库来实现保存。通常,档案为准备和摄取数据而收取的费用可以直接计入你的拨款申请(注意。这些费用通常需要在项目的生命周期内支付,而不是在项目完成后支付)。

在你的研究项目开始时考虑保存问题——你将使用什么数据,将产生什么数字输出,将在哪里存储,以何种方式存储以及保存多长时间。在项目早期联系RIES寻求建议。

积极的数据保存措施通常还能使学术界更广泛地共享数据,从而在研究影响和可见性方面带来相关好处。

一个安全地保存任何类型的数字研究材料(数据)以及有助于解释它们是什么以及如何使用它们的文档(元数据)的地方。一致的归档策略、保存技术和发现工具的应用进一步提高了数据的长期可用性和有用性。这是数据存储和归档之间的主要区别。

存档是数据的稳定(完整)版本,而不是研究工作区。一旦数据被存入,它们将保持该状态,并通过持久标识符进行归因。不断被处理的活动(“活动”)数据不应保存在存档中。可以保存纵向数据的稳定快照。

你应该总是在第一个实例中寻求将你的数据存入国家数据档案(在UWTSD研究数据中维护元数据记录)。在许多情况下,你的研究资助者会维护一个国家档案,并指定必须使用它。当没有合适的外部存储库时,可以使用UWTSD数据存储库。

存款流程:我需要存入我的数据吗?

UWTSD数据存储决策树概述了在选择保存哪些研究数据和确定合适的存储库时所涉及的一些问题

已经有适合你的主题领域的档案了吗?

一些学科由已建立和知名的数据档案很好地服务。例子包括英国数据档案馆、Dryad、GenBank、EMBL-EBI、自然环境研究委员会(NERC)开放研究档案。有些档案的存放取决于资助机构或出版商。超过一千份的专家档案被列入研究数据存储库.然而,事实仍然是一些学科没有明显的数据存档位置。如果是这种情况,可以使用UWTSD数据存档。

长期可访问性?

数据归档应该同意在相当长的一段时间内存储数据。它还应保证在此期间数据仍可查找和访问。它应详细说明数据将被删除或删除的场景和程序。仔细检查存档的政策和条款和条件,以确保它将保留您的数据,只要您需要,或至少给您足够的删除通知。

数据的记录

资助者和期刊出版商对数据集的两个最低要求是数据集可以被引用和查找。为此,数据集应该具有持久的、有意义的和可发现的记录。描述数据集的元数据应该符合通用标准。这可能包括用于数据引用的Datacite最小元数据集。

数字对象标识符(DOIs)

数据集需要DOI (ISBN的数字等价物)才能被引用和查找,这正迅速成为一种规范。一些主要资助者建议(尽管不要求)使用DOI作为唯一标识符。您选择的存档是否将doi分配给存储的数据集?

满足资助者的要求

档案是否能让你满足投资人的要求?这些需求可能包括以下要素:

  • 确保在特定时期内(例如在最后一次访问后10年)进行访问
  • 分配足够的元数据来描述和定位数据
  • DOI或其他唯一标识符的分配

保存的成本是什么?

就所需的时间和资源而言,数据管理和共享活动需要纳入研究。数据管理的早期规划可以显著降低成本。的英国数据档案有一个非常有用的工具,以协助确定成本的数据管理在社会科学。

不应该用的:

外接硬盘上的个人存储空间

外部硬盘驱动器价格便宜,但只能被视为临时或短期存储选择。UWTSD RDM政策规定,所有研究数据都应存储在大学管理的IT环境中,如果您是远程工作,则应尽早转移。将数据存储在驱动器和信誉良好的存档之间的区别是:

  • 驱动器不能从多个位置的多个备份中受益
  • 将不会执行保存和管理行动以确保内容随时间的持续可访问性
  • 使用驱动器将所有责任都放在驱动器所有者身上,以正确地执行此操作
  • 数据创建者将承担未分配DOI的后果
  • 数据创建者将承担数据无法被发现的后果
  • 所有硬盘最终都会失效

云存储

这应该被视为硬盘存储的在线等效,而不是档案保存的替代方案。价格和使用便利性可能具有吸引力,但应详细审查每个供应商的条款和条件。这类服务通常会明确表示,他们不对安全漏洞或数据丢失承担任何责任。此外,大多数云存储服务不提供适当的引用或访问选项。

我是否可以将资料保存在大学体育学院?

  • 是的。UWTSD研究数据存储库可用于简单存储和长期保存数据集。但是,只有当您的数据集不能提供给外部存储库时,才应该使用此方法。但是,您应该始终向UWTSD存储库提交元数据记录。如果您对在UWTSD存入数据有任何疑问,请与RIES或LLC联系
  • 资助者可能会要求您将数据长期保存在特定的数据中心。但是,作为获奖者,您需要处理与您的研究有关的版权/第三方问题。
  • 有许多可用的服务可以为您处理研究成果的保存,包括存储库和数据中心/档案。有关这些服务的更多信息,请参阅我们的如何分享页面
  • 许多期刊要求支撑一篇文章的数据被引用,并存储在数据存档中,以便长期可访问。还建议使用持久标识符(如DOI)引用数据。如果您没有使用已建立的主题或国家数据存档,UWTSD图书馆和学习资源中心可以为您的存档数据分配DOI。

我正在与海外的一所大学合作一个项目,我的数据不在英国-我需要考虑什么?

  • 如果您的数据没有存储在英国,您将需要确保它没有存储在法律保障低于英国的地方。如果您正在使用云存储解决方案,则需要了解云存储提供商的法律管辖范围。

我必须保存我的研究中的所有数字数据吗?还是只保存那些支撑论文发表的数据?

  • 这因资助者而异。检查您的资助者数据政策或参阅资助者要求部分。可能不是所有东西都可以或应该保存,因为这样做可能存在伦理问题或成本太高。很简单,你应该致力于证明任何放弃数字输出的决定是正确的。有关进一步指导,请参阅:
  • 链接到分享还是不分享
  • 链接到数据保护中的伦理问题

数据应该以什么格式保存?

Data Archive将为不同的目的使用不同的数据格式。然而,存在用于长期保存数据的最佳数据格式。英国数据档案馆有一个关于最佳文件格式的有用总结长期保存资料,请查阅。

关于数据保留的伦理和法律问题呢?这与保护有什么冲突?

  • 数据可能需要匿名化,以使个人、组织或企业无法识别。此外,可通过规范或控制对数据的访问或使用,有效地保护敏感和机密数据。一些存储库将允许您在项目结束时提交数据(此时最容易将数据组合在一起),但禁止(限制访问)它的发布数年。
  • 在某些情况下,存储库可能允许您公开存储一组材料的一部分,并在保持隐藏和不可访问的同时维护其他更专有的部分。有关更多信息,请参见英国数据档案馆关于访问控制的建议
  • 然而,在所有情况下,您必须确保您遵守《数据保护法》(1988)的条款。的英国数据档案馆有非常好的建议.一般而言,你应考虑:

我如何确保我的数据在未来是可理解的和可用的?

  • 确保收集了有效的文档,不仅描述了数据类型,而且还描述了任何文件命名背后的决策。如果在研究项目的过程中,工作实践中发生了变化,也需要记录下来。参见文档和组织部分。

我如何保存要共享的数据-是否需要额外的数据准备阶段以允许其他人重用?

  • 英国数据档案馆对“共享规划”。这个封面
    • 为什么要共享数据
    • 角色和职责
    • 成本核算
    • 如何共享数据

如何支付数据保存的费用?

  • 大多数资助者将承担在资助期内产生的数字输出的准备和消化的适当费用。因此,从项目一开始(在数据管理计划中)就解决数据保存问题并在补助金申请中包括成本是很重要的。

英国数据档案馆制作了这份清单,可以帮助您确定哪些是良好的数据实践,以及采取哪些行动来优化数据共享。

  • 您是否使用标准化和一致的程序来收集、处理、检查、验证和验证数据?
  • 你的结构化数据在变量名、代码和使用的缩写方面是否不言自明?
  • 哪些描述和上下文文档可以解释您的数据的含义、它们是如何收集的以及用于创建它们的方法?
  • 你将如何标记和组织数据、记录和文件?
  • 你会在数据编目、转录和组织方面采用一致性吗,例如标准模板或输入表格?
  • 您将使用哪种数据格式?格式和软件是否支持数据的共享和长期有效性,例如非专有软件和基于开放标准的软件?
  • 在跨格式转换数据时,是否检查没有数据或内部元数据丢失或更改?
  • 您的数字和非数字数据以及任何副本是否保存在安全可靠的位置?
  • 你是否需要安全地储存个人或敏感资料?
  • 如果数据是通过移动设备收集的,您将如何传输和存储数据?
  • 如果数据保存在不同的地方,您将如何跟踪版本?
  • 你的档案是否有足够及定期的备份,以及备份文件是否安全存放?
  • 您知道数据文件的主版本是什么吗?
  • 您的数据是否包含机密或敏感信息?如果有,您是否与您收集数据的受访者讨论过数据共享?
  • 你是否获得了受访者的(书面)同意分享你研究之外的数据?
  • 在研究或准备分享资料时,是否需要将资料匿名化,例如删除识别资料或个人资料?
  • 你是否已确定谁拥有你的资料的版权?会有共同版权吗?
  • 在研究期间和研究结束后,谁可以访问哪些数据?是否需要各种访问规则?
  • 数据管理的哪一部分由谁负责?
  • 您是否需要额外的资源来管理数据,例如人员、时间或硬件?

培训

  • RIES和LLC可以提供关于研究数据管理的定制课程的建议。如果您希望与您的教师、学校或研究小组安排研讨会,请与RIES联系。
  • 2015-16年CPD会议的资源将很快在这里提供。
  • 就所需的时间和资源而言,数据管理和共享活动需要纳入研究。数据管理的早期规划可以显著降低成本。英国数据档案馆有一个非常帮助确定数据管理成本的有用工具在社会科学领域。
  • 保存、共享和许可是爱丁堡大学MANTRA项目的在线互动培训模块。
  • DataCite和Databib都提供了研究数据存储库的列表。

re3data.org

Re3data.org是一个研究数据存储库的全球注册表,涵盖了广泛的学科。该注册中心提供了用于永久存储和访问研究数据集的存储库的详细信息,旨在促进共享、增加访问和提高研究数据的可见性的文化。

开放存取目录

来自开放存取目录的开放数据的存储库和数据库列表。

DataCite

DataCite的目标是让数据更容易获取、更有用。它的目的是开发和支持定位、识别和引用数据和其他研究对象的方法。具体来说,它开发和支持数据持久标识符背后的标准,并由其成员分配这些标准。DataCite将来自研究界的参与者聚集在一起,以解决使研究对象可见和可访问的挑战。他们共同构成了一个数据集研究人员的全球网络。

数码策展中心

数字管理中心(DCC)是世界领先的数字信息管理专业知识中心,专注于在英国高等教育研究界建设研究数据管理的能力、能力和技能。数字管理中心为英国高等教育和研究领域想要存储、管理、保护和共享数字研究数据的任何人提供专家建议和实际帮助。

发展局提供的资源包括:

英国数据档案

英国数据档案馆从英国最大的社会科学和人文科学数据档案馆提供广泛的良好实践建议。英国数据档案馆网站提供了以下建议:

BioSharing

BioSharing是一个在生命、环境和生物医学科学中相互关联的数据标准、数据库和政策的策划、可搜索门户

夏尔巴人/朱丽叶

研究资助者关于开放获取数据归档和开放获取出版的政策。

考古数据服务

来自考古数据服务的建议,涵盖整个数据生命周期。

这些良好实践指南涵盖了广泛的主题,包括:

  • 数字数据创建规划
  • 项目文档
  • 项目元数据
  • 数据选择:保存干预点
  • 版权和知识产权
  • 数据库和电子表格
  • 数据收集和实地工作
  • 数据分析与可视化
  • 准备和存放您的档案

Dataverse

一个用于共享、保存、引用、探索和分析研究数据的开源web应用程序。“数据厌恶项目”位于哈佛大学。哈佛Dataverse存储库向所有学科(以及世界各地)的研究人员开放,他们希望存储数据并使其可供他人使用。


创作共用图形
改编自牛津大学下创作共用属性3.0未移植许可(cc by 3.0)。原创内容:http://researchdata.ox.ac.uk/

聊天加载…