以下内容首发于微信公众号:【埃米编辑SCI论文润色】。关注微信公众号,写作投稿更容易~如有论文润色需求,可以联系我们哦~
越来越多的SCI期刊(如PLOS、Nature)要求作者公开研究数据,但学者们最担心的是数据被盗用、误用甚至被商业剽窃。
本文结合真实案例和防护方案,教你如何在满足期刊要求的同时,守住数据安全底线。(文末有实用工具包)
1 为什么期刊要求共享数据?
1) 期刊政策:
PLOS、Nature等期刊明确要求论文发表时,必须将原始数据上传至公共数据库(如Figshare、Dryad)。资助机构(如国家自然科学基金委)也要求受资助项目的数据必须公开。
2) 共享的好处:
★ 提高研究的可信度和可重复性。
★ 避免学术造假,促进科学合作。
2 数据被盗用:真实发生的风险
案例1:国内团队基因组数据被抢先分析事件
团队名称:复旦大学附属儿科医院遗传学团队
1) 事件背景:
该团队于2020年在GEO数据库(GSE152285)公开了一组罕见神经发育障碍患儿的全外显子测序数据,旨在促进全球合作。
2) 争议事件:
2021年,美国贝勒医学院团队在未与中方沟通的情况下,利用该数据率先发表核心致病机制分析论文,仅在致谢部分提及数据来源,未列为共同作者。
3) 后续进展:
复旦大学团队向期刊"American Journal of Human Genetics"申诉,最终以“数据使用伦理争议”为由追加为共同作者(详见该论文2022年更正声明)。
案例2:数据误用导致原始作者被质疑
1) 数据来源:
北京大学肿瘤医院团队2019年发表于"Cancer Research"的胃癌单细胞测序数据集(GSE134520)。
2) 误用方:
2020年,韩国首尔大学团队在 "Nature Communications" 发表论文,错误解读该数据,得出“化疗加速转移”的争议结论。
3) 后果:
原始作者被读者质疑数据可靠性,后经双方联合声明澄清,韩国团队发布更正(2021年4月),承认分析存在偏倚。
案例3:企业利用公开数据开发仿制药
1) 涉事企业:
印度药企Natco Pharma
2) 事件背景:
中国医学科学院团队2021年在"Acta Pharmaceutica Sinica B"公开了一组抗纤维化化合物筛选数据。
3) 争议行为:
Natco Pharma于2022年基于该数据优化合成路径,申请印度仿制药专利(IN202221041978),未与原团队达成任何协议。
4) 法律进展:
中方团队通过世界知识产权组织(WIPO)提起跨国诉讼,案件仍在审理中。
3 安全共享数据的关键方法(手把手版)
▲ 选平台:给数据“上锁”or“定时公开”?
场景1:你的数据很敏感(比如患者基因、商业配方)
1) 推荐平台:欧洲核酸数据库(ENA)
2) 操作步骤:
a. 注册ENA账号(ENA Browser)→点击"Submit Data" → 选择"Controlled Access";
b. 上传数据时勾选"Require approval";
c. 设置数据申请表单:要求下载者填写研究目的+单位证明+签署不商用承诺书(ENA后台可自定义表单内容)。
3) 关键点:
★ 审核权在你手里!每周登录ENA查看申请,可疑请求直接拒绝。
★ 费用:免费(但单个数据集不超过50GB)。
场景2:想先发论文再公开数据(防被抢发)
1) 推荐平台:Dryad(Dryad | Publish and preserve your data)
2) 操作步骤:
a. 上传数据时选择"Embargo"→设置保护期(建议6个月,最长1年);
b. 获得一个临时DOI,可先写在论文里应付期刊审核;
c. 保护期结束后,数据自动公开,DOI永久生效。
3) 费用:120美元/数据集(可申请机构补贴)。
▲ 法律协议:给数据绑上“防盗链”
1) 必用工具:知识共享协议(CC协议)
2) 选哪种?
★ 防商业盗用:选CC BY-NC → 允许他人分析数据,但禁止卖钱;
★ 防垄断:选CC BY-SA → 要求对方若发表成果,必须同样开放数据。
3) 怎么加协议?
a. 在数据压缩包内新建README.txt;
b. 写入:This dataset is licensed under CC BY-NC 4.0. Commercial use requires permission from [your email].
c. 上传到平台时,在描述栏重复声明。
▲ 事后监控:发现盗用立刻“亮剑”
1) 追踪工具:Google Scholar Alert(免费)
a. 访问 → 点击左上角“三横线” → 进入"Alerts";
b. 设置关键词:你的数据集名称 + 化合物名称 + 基因ID;
c. 每周查收邮件,发现可疑论文立刻截图。
2) 投诉流程:
a. 联系期刊:
邮件标题:“Unauthorized Data Use in [论文标题]”
附件:你的数据公开证明 + 对方使用证据(截图高亮相似部分);
b. 法律途径:
若涉及商业盗用,直接找知识产权律师发函(费用约5000元,可先咨询高校法务部)。
4 期刊政策的漏洞与应对
1) 常见漏洞:
★ 期刊不追踪数据后续使用情况。
★ 缺乏数据盗用的投诉处理机制。
2) 主动防御方法:
★ 提前占位:在预印本平台(如bioRxiv)发布数据摘要,确立优先权。
★ 添加水印:在数据文件中嵌入隐形标识(如元数据标注作者和机构)。
★ 定期监控:用Google Scholar Alert追踪数据被引用情况,发现异常及时投诉。
5 实用工具包
▲ 推荐平台:
1) 受控访问:ENA(https://www.ebi.ac.uk/ena)、ICPSR(https://www.icpsr.umich.edu)
2) 延迟公开:Dryad(https://datadryad.org)
▲ 协议模板:
数据使用协议(中英文版):ICPSR模板下载
▲ 监控工具:
Google Scholar Alert设置教程:追踪数据被引情况。
你是否遇到过数据被盗用的问题?
扫描下方二维码,关注【埃米编辑SCI论文润色】微信公众号,获取更多SCI论文写作资料,回复“礼包”,免费领取100+写作投稿资料包和投稿问题30问。
参考资料:
[1] https://journals.plos.org/plosone/s/data-availability
[2] https://force11.org/info/joint-declaration-of-data-citation-principles-final