发表在《全球生态学与生物地理学》上的一项新研究提供了一个分步指南,可将大量化石花粉数据集编译成用户特定的、标准化的和干净的汇编——为进一步分析做好准备。
(资料图片)
古生态学(“过去的研究”)对于了解生物多样性的历史和生物圈随时间的变化非常重要。通过使用化石花粉等古生态数据,科学家们试图了解生态系统和植被如何随时间变化,以及人类在整个历史过程中如何影响环境。
在过去十年中,开放存取数据库中来自世界各地的化石花粉数据大幅增加,开辟了新的研究途径。但是,将这些信息以一种科学家可以用来研究生物多样性变化的方式整合起来存在一些挑战。UiB 生物科学系研究员和论文“使用化石花粉进行大规模合成的全球古生态数据处理和标准化指南” 的主要第一作者Suzette Flantua一直在研究这些数据集。
在过去十年中,开放存取数据库中来自世界各地的化石花粉数据大幅增加。开辟新的研究途径。但是,将这些信息以一种科学家可以用来研究生物多样性变化的方式整合起来存在一些挑战。UiB 生物科学系研究员和论文“使用化石花粉进行大规模合成的全球古生态数据处理和标准化指南”的主要第一作者 Suzette Flantua 一直在研究这些数据 集。
“几年来,我们一直在汇总数以千计的化石花粉数据集,并且在此过程中我们意识到存在许多关键步骤,任何使用这些数据的研究人员都应该注意这些步骤,但在任何地方都没有明确的指导方针。它是也常常不清楚其他人如何处理他们的数据”,Flantua 说。
为确保化石花粉数据的标准化使用并最大限度地降低错误解释的风险,Flantua 和她的同事创建了一份指南,其中包含汇编化石花粉数据的技巧和窍门。
“这些数据集来自世界各地的许多不同环境,由许多不同的研究人员取芯和分析,它们代表了高度多样化的植物组合。在进行任何分析之前,需要仔细选择此类汇编以保证良好的数据质量。这就是为什么我们制定了关于如何标准化这些数据的指南,现在不同领域的许多研究人员都可以访问这些数据”,Flantua 说。
处理化石花粉数据的纪律友好指南
Ondřej Mottl是该指南中软件的主要开发人员,也是该论文的共同主要第一作者,他说该指南旨在使每个人都可以轻松和访问数据准备,无论他们的编码技能如何。
“我们知道处理所有数据准备步骤在技术上可能具有挑战性,这就是为什么我们逐步构建我们的工作流程并在每个关键时刻提供明确的路标。我们的软件在整个过程中与用户互动,引导他们走向目标所需的分析数据集”,Mottl 说。
化石花粉数据集指南包括一个 名为 FOSSILPOL 的工作流程、一个 R 包 (RFossilpol) 和一个 网站。FOSSILPOL 工作流程处理大部分处理步骤(与沉积环境、年表、过滤和分类协调相关,图 3),同时在某些步骤需要用户输入。所有标准和配置都在一个主配置文件中定义,并且在整个工作流程中使用了多个 R 包。工作流的最终输出包括分类协调的化石花粉数据的标准化汇编、建模的年龄深度曲线图和每个记录的花粉图,以及几个概览图和地图。
共同主要第一作者 Vivian Felde 和 Kuber Bhatta 强调了该指南在提高可重复性和透明度方面的潜力。
“它也可以被视为一种允许主要数据分析完全重现的工具,因为整个数据处理步骤中的所有决策都是透明的、有据可查的,并且很容易在研究中报告。此外,数据汇编是动态的,并且会随着数据的变化而变化。随着越来越多的数据变得可用,开放访问数据库。这都归功于研究团体内部和之间的持续数据共享,我们对此感到非常兴奋”,Felde 和 Bhatta 表示赞同。