李志民专栏
美国禁止中国等六国获取”敏感数据“,生物科研领域或遭“学术封锁”
文 / 李志民
2025-04-11
  根据最新消息,4月5日,已有国内研究员报告SEER公共数据库禁止中国作者使用!之前注册过的账号也会失效。
 
  此事起因于2024年2月28日,美国白宫发布了14117号行政命令,时任总统拜登正式签署了《关于防止关注国家获取美国公民大量敏感个人数据和美国政府相关数据的行政命令》,限制中国(包括香港和澳门)、古巴、伊朗、朝鲜、俄罗斯和委内瑞拉等六个“关注国家”以及与其有关的实体/人员访问和利用美国公民与政府的“敏感数据”,包括基因组数据、生物识别数据、个人健康数据、地理位置数据、财务数据和特定种类的个人识别信息,以及与政府有关的敏感数据。据悉,这是美国历史上首次禁止向中国跨境传输数据。
 
  尤为值得一提的是,在拜登列举的“敏感数据”案例中,生物技术领域堪称“重灾区”。拜登提到,未来将采取措施防止外国参与方获取美国人的大量敏感个人数据,包括卫生和人类基因组数据,并对涉及这些数据的合作伙伴和协议进行审查。
 
  对于中国科研人员来说,最直接的影响体现在相关数据库访问上。
 
  例如,隶属于美国国立卫生研究院(NIH)的NCBI(National Center for Biotechnology Information)美国国立生物技术信息中心,旗下运营若干核心数据库,包括全球最大的癌症基因数据(TCGA)、基因表达数据(GEO)及医学文献(PubMed),是生物医学研究的基础资源。
 
  其中科研人员用的最多的PubMed就是NCBI开发的生物医学文献免费检索系统,包含1966年以来的来源于70多个国家和地区的4000多种生物医学期刊的文献。
 
  此外,NCBI数据库包括海量的病例数据和基因组数据,如GEO和TCGA。
 
  GEO(Gene Expression Omnibus),是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。收录了世界各国研究机构提交的高通量基因表达数据,基因芯片表达数据等等,论文中涉及到的基因表达检测的数据几乎都提交到了这个数据库。
 
  癌症基因组图谱(TCGA)是由美国国家癌症研究所和国家人类基因组研究所2005年共同发起的癌症基因组计划,目前已经成为全世界最大的癌症基因数据库之一。
 
  此外,还有肿瘤数据库SEER(Surveillance, Epidemiology, and End Results)。该数据库收集和存储了全美范围内的癌症发病率、生存率和治疗数据,以支持癌症研究和流行病学调查。这些数据对于研究癌症的流行病学、病因学、诊断和治疗方面的问题非常有价值。
 
  美国司法部于2025年2月27日发布了《关于防止中国、俄罗斯和伊朗等国访问美国敏感个人数据和政府相关数据的最终规则》,以执行第14117 号行政命令。该规则禁止向相关国家发送数据的企业开展交易,还禁止美国公司在某些涵盖的数据交易中与外国个人或实体接触。如果涉及自然人,处罚包括潜在的巨额罚款或监禁。该规则将于2025 年 4 月 8 日生效,针对从事相关交易的美国人的其他合规规定将于 2025 年 10 月 6 日生效。
 
简介
李志民,中国教育发展战略学会副会长兼人才发展专业委员会理事长。
联系
手 机 扫 码 查 看