跳至主内容
研究论文

数据可按请求提供(但请求不会被满足)

I3E TRPII· 卷 1 , 期 1 · 页码 1-11 ·
DOI: 10.I3E/trpii.2026.00045 已复制!
检查访问权限

编辑摘要

编辑部曾请求获取本文底层数据。作者回复称“可在合理请求下提供”。编辑部认为这一做法非常契合 I3E TRPII 的办刊风格。

摘要

“数据可在合理请求下提供”这句话已成为科学出版中的标准承诺,在我们目标期刊中出现于 34% 的论文。我们通过向 400 篇此类论文的通讯作者发送数据请求,对这一承诺进行了系统检验。38% 的作者给出了某种形式回复;3.5% 提供了可正常使用的数据;7.2% 给出的回复可被归类为敌对。剩余 62% 没有回复。我们认为,“可在合理请求下提供”本质上是一种修辞装置,而非数据访问政策,并建议期刊改用更准确表述,例如“不可提供”。

正文

引言

过去十年里,科学界的数据共享规范发生了显著变化。期刊、资助方与机构越来越多地要求研究者要么将数据存入公共仓库,要么承诺在请求时共享。对公共仓库存储这一要求,执行情况还算有一定一致性;而“按请求提供”的替代方案,正是本文研究对象。

“按请求提供”式数据可用性的运作机制如下:研究者投稿并声明数据可在合理请求下提供;期刊在不核验的情况下接受该声明;论文发表;希望复现实验的读者给通讯作者发邮件;然后某种事情发生。我们研究的就是这个“某种事情”到底是什么。

方法学

我们识别出 2022 至 2025 年间发表在要求填写数据可用性声明的期刊中的 400 篇论文,每篇都包含“available upon reasonable request”或其近似变体。通讯作者信息来自论文正文。我们在论文发表 6 个月内向作者发送标准化数据请求邮件,说明我们是尝试复现实验的研究者,并明确所需数据集。

若两周内未收到回复,我们会发送一次跟进邮件。我们不发送更多跟进,因为试点研究显示,第三次请求带来的“对抗性回复”比例高于数据本身所能支持的程度。

结果

400 次请求中,152 次(38%)在 90 天内收到某种回复。我们将回复编码为七类。最大类别(占回复的 29.4%)是“数据正在整理中,会很快发送”,其次是没有附件的邮件,由此我们推断数据整理是一个比本研究周期更长的过程。第二大类别(24.3%)是一个 GitHub 仓库链接,仓库里只有代码和一份 README,内容写着数据可在合理请求下提供。

14 次请求(3.5%)得到功能正常、可使用的数据集,使我们能够尝试复现。在这 14 次中,7 次得到的结果与原文一致(在我们认为可接受的误差范围内);3 次得到的结果与原文存在差异,而原作者拒绝解释;另有 4 次得到的结果与原文完全一致,这种一致性只有在我们运行的是“原代码 + 原数据”而不是独立复现时才可能出现,但我们并非如此。我们尚未解决这一最后发现。

“合理”问题

在数据请求中,我们明确表明自己是进行学术复现的研究者。因此按任何定义,我们都属于合理请求者。但在 29 个案例中,作者回复称我们的请求未达到其“合理”门槛。我们在其中 15 个案例中追问何种门槛才算合理,收到解释的数量为 0。

References

  1. Available, D. (2024). “按请求提供。” 未经核验承诺期刊, 1(1), pp. 1-1.
  2. Wilkinson, M., et al. (2016). “科学数据管理 FAIR 指导原则。” Scientific Data, 3, 160018.(真论文,问题仍在持续。)
  3. GitHub, G. (2023). “代码不是数据:一条没人要求但确实需要的提醒。” 复现季刊, 7(2), pp. 33-40.
  4. Hypothesis, N. (2026). “本文数据可按请求提供。” I3E 虚构机构可复现性问题汇刊, 1(1), pp. 12-12.

作者单位

1. Replication Crisis Documentation Unit, Institute for Phantom Data

参考文献

电子来信