生物多样性数据论文发表趋势分析

更新时间:2020-02-28 来源:论文发表 点击:

【www.rjdtv.com--论文发表】

大科学时代的来临以及人类所面临的环境问题对生物多样性和生态学提出了新的要求, 科学家不但要通过大尺度研究来理解众多全球性问题(如多样性丧失、气候变化、粮食安全), 而且要基于科学证据提出相应的对策(Michener & Jones, 2012;Hampton et al, 2013)。然而, 如何有效地共享及整合生物多样性数据成为解决这些重要生物多样性和生态学问题所面临的重要挑战(黄晓磊和乔格侠,2014)。生物多样性数据共享不但是提升生物多样性研究的深度和广度、开展整合性研究的需要(Reichman et al, 2011; Hampton et al, 2013), 而且是检验生态学研究可重复性(Cassey & Blackburn,2006; Ryan, 2011; Shapiro & Báldi, 2012)和科学制定生物多样性和环境政策的重要基础(Pullin &Salafsky, 2010; Haddaway & Pullin, 2013)。
  
  作为最主要的数据生产者、分享者和使用者,科学家群体的态度和行为在很大程度上决定了数据共享的效果。Vines等(2014)调查了1991–2011年间发表的516篇生态学论文, 结果发现这些论文数据的可获得性受到文章已发表时长的严重影响, 且以每年17%的速度递减。这项研究体现了科学数据共享的重要性, 也说明科学数据的长期保存需要公共数据库和数据政策的支持。Huang等(2012)开展的一项国际调研发现, 生物多样性领域的数据分享文化并不发达, 科学家面临一些技术和认知上的障碍(比如同行竞争、不熟悉数据保存机构、缺少时间和经费来管理数据等), 而且科学家希望能从数据共享中获得相应的回报。最近由Digital Science、Springer Nature和Figshare联合发布的一份有关科学数据共享的报告也反映了研究者面临的技术和认知障碍, 而且近70%的研究者认为数据引用和论文引用应该具有同等价值(Fane et al, 2016)。
  
  推进生物多样性数据共享仅仅靠增强生物多样性数据所有利益方(科研工作者、研究和资助机构、期刊等)对于数据共享价值的认识是远远不够的, 同时也需要所有利益方积极采取有效的共享策略。近年来新出现了几种数据共享策略, 包括Dryad)和Figshare等数据保存机构集中保存论文数据、生物多样性数据论文和数据期刊(Chavan & Penev, 2011; Costelloet al, 2013)、期刊和数据保存机构间的联合数据保存政策(Huang & Qiao, 2011; De Wever et al, 2012)等。这些数据共享策略大多从增加数据共享者的收益(如数据集的所有权和可引用性)出发, 取得了一定的效果。这其中, 生物多样性数据论文采用科研工作者熟知的学术出版形式, 与科研工作的关系密切, 是本文关注的对象。
  
  生物多样性数据论文由全球生物多样性信息网络(Global Biodiversity Information Facility, GBIF)和学术出版商Pensoft在2011年联合提出, 主要目的是“用于网络共享的数据集的元数据文件可以采用学术论文的形式发表”, 从而为数据共享、数据质量控制和改善科研评价提供一个有效的方法。2013年9月, Pensoft创办了数据期刊Biodiversity Data Jour-nal , 专门用于发表生物多样性数据论文, 论文的数据集则可以无缝分享到GBIF.近两三年在生物医学、地球科学、基因组学等领域也出现了专门发表数据论文的数据期刊。最为突出的是, 自然出版集团(Nature PublishingGroup)也于2014年3月开始正式出版综合性数据期 刊 Scientific Data 。
  
  作为较新的数据共享方式, 生物多样性数据论文被研究者接受的程度如何?数据期刊发表论文的数量有什么趋势?数据论文被使用或引用的情况如何?回答这些问题有助于增进研究者对数据论文的认识和理解。为此, 本文选择了两本代表性数 据 期 刊 (Biodiversity Data Journal 和 ScientificData), 分析了它们创刊以来的发文数量、涉及生物类群、文章浏览量和被引用次数等指标, 以期基于实证数据揭示数据论文的发表趋势。
  
  1 资料来源与研究方法。
  
  1.1 研究对象。
  
  本研究主要关注发表生物多样性相关数据论文的两本代表性数据期刊Biodiversity Data Journal(BDJ)和Scientific Data (SD)。BDJ自2013年9月16日开始出版, 旨在基于同行评审的学术出版模式, 快速发表生物多样性数据。BDJ发表的文章类型主要包括Data Paper (数据论文)、Taxonomic Paper (分类论文)、General Article (综合论文)、Software De-scription (软件描述)、Species Inventory (物种目录)、Interactive Key (交互式检索表)等。BDJ要求所有基于原始数据的论文以符合规范的形式共享数据, 因此虽然有文章类型的人为划分, 它们(除SoftwareDescription外)的区别更多的只是所共享数据的类型和多少, 实际上都属于数据论文的范畴。BDJ发表的文章涉及物种分类和标本信息、生物区系数据库、植被组成、形态特征、鸣声记录、DNA条形码等多种生物多样性数据类型。SD自2014年3月11日开始出版, 作为自然出版集团力推的综合性数据期刊, 主要发表具有重要科学价值、数据量大的原始数据集及其分析(Data Descriptor), 面向众多科学领域。
  
  本研究期望基于对BDJ的分析揭示生物多样性数据论文的发表和使用趋势, 对SD的分析则可以从更广泛的角度揭示数据论文的发表情况, 因此未单独提取生物多样性相关领域文章。
  
  1.2 数据收集。
  
  BDJ和SD均为在线出版期刊, 本研究的数据主要基于两本期刊网站提供的文献计量指标, 收集了两本期刊自创刊截止到2016年6月17日的文献信息。BDJ文章信息包括每篇文章的出版时间、文章类型、涉及生物类群、作者国别、文章内容、浏览量等6个方面; SD文章信息包括每篇文章的出版时间、文章类型、浏览量、引用量等4个指标。使用微软Excel软件对以上信息进行分类整理及校对,最终获得的BDJ原始数据集包含313条文献、1,878个数据项, SD数据集包含174条文献、696个数据项。
  
  1.3 数据分析。
  
  基于所获得的原始数据集, 主要开展了4个方面的分析:
  
  (1) BDJ和SD两本数据期刊在时间序列上的发文量趋势。为更好地揭示发文趋势, 最初比较分析了按“每月”和“每2月”绘制的折线图, 发现以每2月为划分标准能更好地反映发文量趋势。由于BDJ有些文章类型的发文数量极少, 最终反映发文趋势的折线图中主要呈现Taxonomic Paper、Data Paper、General Article、Software Description 4种文章类型以及它们的总和。对于SD来说, Data Descriptor是其主要发文类型(占93.7%), 因此发文趋势对Data De-scriptor文章进行了分析。另外值得指出的是, 按照本文对两本期刊统计的时间范围, 趋势图中最后一个时间段仅约为1个月。
  
  (2) BDJ发表论文所涉及生物类群的多样性。BDJ发文数量前三位的Taxonomic Paper、Data Pa-per、General Article均报道生物多样性原始数据, 因此对这些文章进行了生物类群多样性分析。依次提取每篇文章提及的生物类群, 并确定其所属的纲。由于昆虫纲所占比例较大, 进而将昆虫类群具体到目开展分析。
  
  (3) BDJ发表论文的作者国别。作者国别的统计有助于了解不同地区研究者对于数据论文及数据共享的态度, 以论文作者单位地址为数据源统计了BDJ文章作者国别信息, 并按发文数量进行排序。
  
  (4) BDJ和SD发表论文的被使用情况。考虑到BDJ和SD网站均提供了文章浏览量信息, SD网站还提供了文章被引用数据, 本文主要分析了两本期刊文章的浏览量和SD文章的被引次数, 以此来了解数据论文被使用的情况。采用网站提供的唯一身份浏览量(unique view)对不同类型文章的浏览量进行了分析, 该指标比总访问量(total view)更能客观揭示论文被使用的情况。结果中主要呈现BDJ发文量较多的4种文章类型(Taxonomic Paper, Data Paper,General Article, Software Description)。SD网站提供了分别来自CrossRef和Scopus的文章引用数据, 由于这两个数据库覆盖的期刊范围有所差别, 引文数据也略有差别, 但总体引用量常基本一致。我们比较分析了每篇Data Descriptor来自这两个数据库的引用情况。
  
  2 结果。
  
  2.1 BDJ和SD在时间序列上的发文趋势。
  
  在本文统计的时间范围内 , BDJ 共发表Taxonomic Paper 218篇、Data Paper 38篇、GeneralArticle 36篇、Software Description 11篇、SpeciesInventory 3篇、Corrigendum 3篇、Editorial 3篇、Interactive Key 1篇。由图1a可以看出, 自创刊以来,BDJ不同类型文章数量虽有波动, 但总体发文量(红线)呈上升趋势, 2014、2015、2016年(截至6月中旬)每2月平均发文数量分别为13.3篇、18.6篇、25.5篇。
  
  统计时间内, SD共发表Data Descriptor 163篇, 发文数量总体呈稳步增加趋势(图1b), 2014、2015、2016年(截至6月中旬)每2月平均发文数量分别为10篇、12.3篇、15篇。
  
  2.2 BDJ论文涵盖的生物类群。
  
  BDJ所发表的报道生物多样性原始数据的文章(Taxonomic Paper、Data Paper、General Article)共涉及动物界的26纲、植物界的3纲、真菌界的2纲(图2a)。其中报道昆虫纲的文章远多于其他类群, 达185篇; 其次为蛛形纲14篇, 双子叶植物纲10篇。基于目级单元对昆虫纲185篇文章进一步分析发现(图2b), 报道膜翅目和双翅目的文章占一半以上, 有关鞘翅目和半翅目的文章也较多。按文章数量多少排序依次为: 膜翅目63篇, 双翅目47篇, 鞘翅目24篇,半翅目18篇, 鳞翅目10篇, 脉翅目4篇, 直翅目和螳螂目各3篇, 蜻蜓目、蜉蝣目和毛翅目各2篇, 缨翅目、石蛃目、广翅目、革翅目、蜚蠊目、纺足目、弹尾目(本文仍将弹尾目归于广义昆虫纲)各1篇。
  
  2.3 BDJ论文作者国别。
  
  经统计, BDJ文章的作者来自69个国家或地区。发文量前10位依次是美国64篇、英国48篇、德国40篇、印度29篇、巴西29篇、荷兰23篇、加拿大23篇、芬兰23篇、意大利22篇、瑞典22篇(图3)。另外法国、保加利亚、瑞士、俄罗斯、新西兰、比利时、捷克、澳大利亚、葡萄牙、丹麦等国家的发文数量均在10篇以上。这些国家中, 经济和科技发达国家占大多数。涉及中国研究者的论文共5篇, 其中中国研究者为主要作者的2篇, 为合作作者的3篇; 从内容来看,一篇报道石蜈蚣科1新种, 一篇报道蝶角蛉科2新记录种, 3篇涉及膜翅目部分类群的物种名录和物种鉴定。
  
  2.4 BDJ和SD论文浏览量和被引用次数。
  
  两本期刊文章浏览量的分布如图4所示。BDJ发文数量较多的4类文章(Taxonomic Paper, DataPaper, General Article, Software Description)浏览量平均为1,189次。分别来看, Taxonomic Paper浏览量平均1,065次; Data Paper平均1,177次; General Arti-cle平均1,221次; Software Description平均2,912次。
  
  总体而言, 涉及生物多样性和生态学科学问题讨论的General Article和涉及生物多样性信息学软件的Software Description浏览量普遍较高, 其中一篇软件类文章的浏览量达到近10,000次, 反映出读者对于软件的关注度较高。相较而言, SD文章平均浏览量较BDJ高, 所发表的163篇Data Descriptor的浏览量平均为5,741次, 其中23篇文章浏览量大于10,000次, 更有5篇文章大于20,000次。对浏览量突出的SD论文内容进行分析发现, 这些论文均报道了数据量大的全球性数据集, 比如全球综合干旱监测和预测系统、埃博拉病毒在人类传播暴发的地理综合数据库、湖面温度全球数据集、病原体–宿主物种关系全球分布数据集、全球城市化历史数据集等。相关性检验显示, 对于这两本创刊时间并不长的数据期刊来说, 其文章浏览量与发表时长总体上具有一定的正相关关系, 即发表时间越长, 浏览量可能越大。
  
  SD所发表的163篇Data Descriptor文章中, 有103篇(63.2%)被引用, 来自CrossRef和Scopus的引用量分布如表1所示, CrossRef和Scopus数据反映的趋势总体一致。据统计, 103篇文章共被引用515次,篇均被引5次; 引用排名前30%的文章贡献了约70%的引用次数。总体来说, 论文引用数和论文数量呈指数分布关系, 符合期刊论文引用分布的一般性规律(Chatterjee et al, 2016)。对比分析SD文章的浏览数和被引次数, 虽然发现部分被引次数高的论文往往也有较大的浏览量, 但两者之间并无明显的关联。
  
  3 讨论。
  
  虽然科学数据共享包括生物多样性数据共享在近几年被广泛关注和推动, 但不同领域、不同地区研究者的数据共享意识和意愿仍很不均衡且有待提高(Alsheikh-Ali et al, 2011; Tenopir et al, 2011;Huang et al, 2012; Fane et al, 2016)。生物多样性数据论文之所以被提出, 核心目的是让研究者能够采用熟悉的、基于同行评审的学术出版形式, 一方面可以促进生物多样性数据共享, 另一方面可以应对现行的以论文为主的科研评价模式。我们对BDJ和SD的分析发现, 这两本数据期刊自创刊以来的发文量都呈增长趋势, 说明数据论文这种较新的数据共享方式正在被越来越多的研究者所接受。除了BDJ和SD等专门发表数据论文的数据期刊, 数据论文这种形式也越来越被更多学术期刊认可。比如, Fac-ulty of 1000旗下的F1000 Research, BioMed Central旗下的BMC Research Notes、GigaScience等发表“Data Note”, Frontiers旗下期刊Frontiers in Ecologyand Evolution和Frontiers in Plant Science等发表“Data Report”. 国内一些相关领域期刊也开设了重在数据发表的栏目, 比如《生物多样性》的“生物编目”栏目, 《植物生态学报》的“资料论文”栏目。但总体来看, 国内期刊在数据论文发表数量、数据共享方式等方面需要提高。
  
  研究发现, 数据论文(基于BDJ的分析)所报道的生物多样性数据已经覆盖了众多生物类群, 包括动物界26纲、植物界3纲、真菌界2纲, 暗示不同领域、不同类群的研究者均开始尝试这种新的发表形式。然而, 类群的总体覆盖度和均匀度仍需要提高,比如目前植物和微生物类群数据报告偏少, 不同昆虫类群的数据发表也不均衡。基于文章内容的分析也发现, BDJ所发表的部分文章存在数据量过少的问题。相较而言, SD所发表的文章都为较大数据集。
  
  Huang等(2013)曾讨论过生物多样性数据论文应当报道多少数据量的问题, 认为虽然数据论文是否值得发表取决于对数据量、类群的重要性、研究地区等不同因素的综合判断, 但一篇数据论文还是应当达到一定的数据量才更有价值,同时发挥激励研究者共享的作用。
  
  浏览量和被引次数分析说明, 数据论文能够获得足够的关注和使用。BDJ文章的平均浏览量与同为Pensoft出版的SCI期刊ZooKeys和PhytoKeys相当甚至更高。SD文章平均浏览量较高, 可能与该刊为综合性数据期刊, 以及由知名度高的自然出版集团出版有关。截至本文数据采集时间, SD文章的平均被引次数为5次, 已高于很多生物多样性和生态学领域期刊同时期发表的研究论文。浏览量和被引数据均表明数据论文有足够的价值以获得相当数量的使用, 近期的一项调研也说明了研究者对于数据引用价值的认可(Fane et al, 2016)。对浏览量和被引次数都很突出的论文数据集进行分析发现, 具有较广泛意义、数据量大的综合数据集更能引起关注,这对科学家基于数据论文的数据共享实践有重要的启示。
  
  数据论文的数量可以在某种程度上反映出不同国家或地区的研究者对生物多样性数据共享的态度。分析BDJ文章作者的国别发现, 经济和科技都较为发达的北美和欧洲地区的研究者更倾向于共享生物多样性数据。虽然中国是生物多样性大国,但有中国作者署名的BDJ文章仅为5篇, 而同为生物多样性大国、经济发展水平处于类似阶段的巴西和印度的研究者在生物多样性数据论文发表方面多于中国研究者。这一方面反映了中国研究者对生物多样性数据论文这种新的数据共享方式尚不了解, 相关领域的中国期刊可以做些推进工作; 另一方面反映出中国相关领域的数据共享文化有待普及。之前有关生物多样性领域科学家对数据共享态度的一项国际调研(Huang et al, 2012), 以及最近一份有关科学数据共享的报告(Fane et al, 2016), 均显示亚洲地区研究者的数据共享意愿较低, 这也可能与部分亚洲国家普遍采用以SCI论文作为科研评价的主要指标有关。
  
  对BDJ和SD两本数据期刊的分析, 为理解生物多样性数据论文的发表趋势提供了实证数据, 也说明了数据论文对于生物多样性领域的研究和数据共享实践具有重要价值。近期, Ecology Letters等期刊联合发表社论, 呼吁生态进化领域的科学家应该通过数据共享等增加研究的透明性和可靠性, 并称将开始实施有关数据共享等的新举措(Parker et al,2016)。我们建议中国生物多样性领域的研究者和期刊关注生物多样性论文和生态进化领域期刊有关数据共享政策的进展, 并更多地践行生物多样性数据共享。

本文来源:http://www.rjdtv.com/lunwenfabiao/3255.html