《中国开放数据白皮书2024》于12月23日发布,白皮书通过深入分析从中国学者收集的调研问卷,全面梳理了中国开放数据的现状、问题和发展趋势。白皮书显示,中国学者对开放数据的支持度保持在高位,今年赞成 “公开研究数据成为学术惯例” 的受访者比例为78%。
中国开放数据白皮书。施普林格·自然集团供图今年是施普林格·自然集团连续第九年与数字科研公司、Figshare 知识库联合开展有关开放数据的年度全球调查。中国科学院计算机网络信息中心对其中来自中国研究人员的调查结果,即414份有效问卷进行分析,并撰写了这份《中国开放数据白皮书2024》。
白皮书显示,中国学者对开放数据的支持度保持在高位,并呈逐年增长态势。近三年来,中国受访者对于“让研究数据开放获取成为学术惯例”持同意态度的比例稳定在六至七成,但仍普遍低于对论文开放获取的认可度。中国学者对于“让论文开放获取成为学术惯例”的支持率,在2023年和2024年均超八成,分别为83%和85%。
同时,中国学者对于开放数据相关概念的了解程度在逐步提高。2018至2024年,熟悉或听说过FAIR(可查找、可访问、可互操作、可重复使用)原则的中国学者比例呈上升趋势,从未听说过的学者比例呈下降趋势。
数据引用仍是中国学者共享科研数据的最主要动因。在中国受访者的数据共享动因分析中,“数据引用”在2022至2024年都是第一动力,且均超60%。这与全球学者的数据共享动因一致。不过,现实情况是,中国受访者认为自己在数据共享方面的贡献并未获得足够认可。
白皮书还显示,期刊和出版机构的数据政策对中国学者数据共享行为的影响力在增强。2024年,将其列为驱动因素的中国受访者比例已增至69%,其主要原因在于越来越多的国内外期刊要求或鼓励数据共享,推动了更多中国学者在论文发表过程中参与其中。同时,“资金资助方要求”“单位/机构要求”的影响力占比也较之前有明显提升。
面对数据共享,中国学者有哪些顾虑?根据白皮书,成果被“抢发”、数据滥用,以及涉敏感信息问题成为中国学者数据共享时的主要担忧。2024年的统计结果显示,“成果被‘抢发’”“数据滥用”“包含敏感信息或数据共享前须获研究对象允许”是占比最高的几项顾虑,分别占比42%、39%、36%。
在数据共享实践方面,更多中国科研人员倾向于选择数据存储库。2024年,中国科研人员分享数据的最主要方式是机构存储库(60%),其次是论文附加信息(51%)、资金资助方存储库(32%)和外部存储库(27%)。
伴随人工智能技术的快速发展,AI工具正被更多地用于辅助数据管理。2024年,中国科研人员更加积极地使用ChatGPT等AI工具进行数据收集、数据处理和元数据创建,已经和经常使用的共占比24%、计划使用的占比36%,人数较去年都有一定程度上升,不考虑使用的人数则明显下降。
在参与本次调查的中国受访者中,70%来自高校,同时,来自科研机构和医学院的受访者分别占比13%、8%(部分受访者来源机构有重合)。在学科分布上,排在前三的分别是医学、生物学和工程科学,占比分别为21%、19%、13%,今年来自社会科学领域的受访者明显增加,居第四位。
来源:北京日报客户端
记者:赵语涵