华大基因被指外泄中国人遗传数据 CEO怒斥:把我们往卖国贼写

华大基因CEO尹烨。(受访者供图/图)

(本文首发于2018年11月8日《南方周末》)

沸沸扬扬的基因资源外泄风波之后,华大基因一纸诉状将自媒体告上法庭。

2018年10月26日,华大基因在官方微博发布《致自媒体“记者金微”律师函的说明》(以下简称“说明”),公布了给“记者金微”实际运营者金微递交的律师函,认为其在公众号上发表的《华大基因被罚!14万孕妇基因组已流出国外,细思极恐!》一文“包含恶意捏造的事实,公然散播研究项目的不实信息,造成了极其恶劣的影响,对公众具有极大的误导性”。

此前,金微在其自媒体文中以科技部在10月24日的一组处罚通告为由,将华大基因在2015年被处罚事宜和不久前对外公布的一项“14万中国孕妇大基因数据的研究”进行关联,暗指华大基因可能大量外泄中国人遗传资源数据,引发国内不少媒体和公众揣测。很快,该文阅读量就达到10万+。当晚,华大基因收到了来自创业板公司管理部的问询函。

随后华大回应,研究全部在境内完成,样本及数据保留在深圳国家基因库,不存在遗传资源数据出境的情况。这点得到了科技部相关人员的确认。

针对起诉书,10月30日,金微在微博上称,这是“华大基因借整治自媒体之机,打击报复,对其质疑者进行栽赃陷害”。按照金微的说法,自己是合理质疑,没有造谣,而华大基因则刻意歪曲,让其封口。

南方周末发现,被提起诉讼后,该文标题被微信系统改为了“此文含有争议”。

“这把我们往卖国贼的方向去写,我们能不生气吗?”华大基因CEO尹烨直言最近很苦恼,他们是逼不得已才起诉自媒体。

牵头多项基因组学研究的尹烨是生物医疗界“名嘴”。科普是他的日常工作之一,不仅开设“天方烨谈”电台节目,还受邀出席不少媒体活动,为公众讲述“听得懂的生命科学”。2018年11月4日,南方周末将相关研究疑问一一抛给尹烨。

“我觉得挺冤”

南方周末:14万孕妇数据的研究存不存在外流问题?

尹烨:“14万中国人基因大数据”项目无外方合作机构,研究全部在境内完成,样本及数据全部保留在深圳国家基因库,不存在任何遗传资源数据出境的情况。但是那篇文章(指“记者金微”文章)强行联系到科技部的处罚上去。

南方周末:但发表的论文有外方作者,外方参与了研究吗?

尹烨:论文署名的国外作者系学术顾问,未参与到任何接触到原始数据的分析工作,仅在科研思路、算法设计方面给予智力贡献。之后我们将结果发表在国际学术期刊《细胞》(cell)上,题为《无创产前基因组学研究揭示多种复杂形状的遗传关联,病毒感染模式以及中国人群历史》。

南方周末:发表在顶级期刊上都需要将原始数据上传,为什么你们可以不分享数据?

尹烨:这是我们当时发表的前提条件。《cell》一开始也要求我们全部上传,至少上传到国际认可的数据库中。但我们说,如果要求上传,我们就放弃发表文章。但最终他们同意了,所以文章得以发表。

南方周末:这么多样本量都征得个人同意了吗?为什么可以用这么大样本的数据做研究?

尹烨:14万中国人基因大数据都来自同意将样本和数据供科学研究的受检者,研究披露的是群体分析结果,不包含任何可识别个人身份信息,也不存在泄露个人隐私的风险。

南方周末:那被科技部处罚的事情又是怎么回事呢?

尹烨:被科技部处罚的项目是华山医院等机构的“抑郁症项目”。2011年,项目方包括国内医院找到我们,希望能对他们所提供的样本进行检测。项目分为两部分:第一部分是样本及表型数据收集,华大未参与;第二部分是对收集样本进行基因组学分析,通过病例对照研究揭示抑郁症致病机理。华大科技为项目提供了检测分析服务,其实是作为一个科技服务方,并非项目申报方。如果之后有研究成果,发表文章会署名相关的项目参与方。

南方周末:那时候你知道与外方合作需要进行申报吗?

尹烨:项目开展前,华大工作人员与项目合作方确认过,国内医院也提供了审批通过的证明,即批件盖章页的传真件。所以一开始被查到说有问题,华大科技的工作人员懵了。后来了解到,项目方申请的采集样本数和最终测序的样本数不符,合作方出示给华大科技的批件页上只有同意,没有显示具体数据。事实上,最终交付给华大科技测序的样本数,超过了合作方获批的采集样本数。

虽然华大科技也是受害方,没有违法的故意,但我们确实有对项目合作方审核不严的疏忽过失,这点我们知错就改,随后开展了整改,对合作方的资质审核、合作流程、效果评价进行了全面梳理和规范,并且已经通过整改,恢复了华大科技关于人遗项目的国际合作,对外说得很清楚。

南方周末:外方使用了这些数据吗?

尹烨:2015年,项目组用部分交付的数据发了学术论文,刊登在《自然》杂志上,当时引起了很大反响。之后,我们受到了科技部的处罚,立即停止了之后的研究。

南方周末:但是2017年,又有基于这批数据的新研究发表在《自然》杂志子刊上,没有任何中国作者,这件事也引起了大家的关注。

尹烨:是的,因为我们当时强烈反对再利用这批数据发表新的研究,也写信给了杂志要求撤稿,现在还保留着当时要求撤稿的邮件。但外方坚持要做,所以中方全部放弃署名。你们看那篇文章也会知道很不正常,用的全部是中国数据,但是没有一个中国人和单位署名。

做生物武器可能性极低

南方周末:这是科技部第一次公布处罚结果,如何看这两年的监管变化?

尹烨:这两年国家监管开始严格了。这次对全行业是一个警醒。这不意味着真的有多少出境做坏事的,但让大家都能意识到这件事的意义。

南方周末:国际上也是如此吗?有人说美国就不做这些审查?

尹烨:全世界目前都是逐步趋向规范和严格。不久前,美国仅一个半月时间便快速通过了《澄清域外合法使用数据法》。而2018年5月25日,欧盟也出台了《通用数据保护条例》,都是旨在保护本区域内的数据,防止境外不当使用。欧盟处罚很重,第一张罚单是针对加拿大数据公司Aggregate IQ,要求30天整改,逾期未合规,将面临2000万欧元罚款。

南方周末:目前管理集中在科研合作项目和国际合作的临床试验,还有哪些监管盲区?

尹烨:可能存在风险的是直接面向消费者个人的自取样检测,比如通过快递邮寄样品,获得个人基因检测祖源、个性化特征等信息,这部分检测的数据用途,以及是否参与对外合作,都存在不确定性。

南方周末:遗传数据外泄最大的威胁是什么?真的会被国外做成生物武器吗?

尹烨:从理论上讲,做成生物武器的可能性极低。千人基因组项目的数据告诉我们,不同种群间人类的基因序列相似度超过99%甚至更高,且全球“混血人种”在不断增多,是做不出只针对中国人的生物武器的。退一万步讲,如果真要开发基因武器,那么海外华人那么多,也不需要从中国这样大费周章来做。此外,从理论上讲,“人种”这个概念在遗传学领域也颇有争议,因为我们所说的白种人、黄种人、黑种人,更多的是从肤色角度,而不是基因角度来定义。我个人的观点,针对某一“人种”的基因武器不太可能实现。

南方周末:那么中国人的人类遗传资源就不该保护了吗?

尹烨:当然不是,我们在精准医学的实践中的确看到了预防、诊断、治疗上都存在一定的种群特异性,特别是在我们综合研发能力还不够强的情况下,需要提前做好保护,以免未来所有的研究和产业都受制于人。

南方周末:但是在临床界大家争论还是很多,认为会影响新药临床试验。

尹烨:这个一直在争论。对于流程,我想规范和细则都全面建立之后,国家是不是能考虑出台一个正面清单,比如免申报的项目?这在规范化之后,能减少一些(新药临床试验)手续。

最难是资源保藏

南方周末:有人说其实更重要的是要建立自己的资源库,而不是把重心放在监管上,你怎么看?

尹烨:我同意,最难的不是在管理,而是保藏。都说中国人拥有世界上最丰富的遗传资源,但是现在大型的生物信息数据库都是国际的,没有中国自己的。一旦国际上对我们关闭了数据库,中国的科研工作者就什么都查询不到了。如果我们有一个国家层面的数据联盟获得国际认可,那么我们也不需要所有的数据都上传到境外平台了。

南方周末:国际上人类遗传资源库有哪些?

尹烨:说说目前已经公开的人类基因数据库:1990年发起的国际人类基因组计划,完成的就是基于白人基因信息的参考基因组。这一计划由美、英、日、法、德、中等6个国家的科学家共同完成,华大基因是代表中国完成人类基因组计划1%中国卷的机构之一。此外,最著名的是2008年发起的千人基因组项目,目前已经公开了2504个人的全基因组数据,这其中包括了各个人种的26个人类种群。

从国家来看,公开基因数据最多的还是以白人为主的欧美国家,以英国和美国为主要代表。其中,以英国生物样本库UK BioBank为代表的大人群、大数据研究是目前最大规模的项目,已经完成并向全世界依申请开放了50万英国人的全基因组遗传数据、临床测量及健康记录,全球已有上千个科研团队申请和使用其数据开展研究,显示了大数据、大合作对于全人类的价值。美国GnomAD项目也公开了14万余美国人的基因数据,相关信息均可以公开查阅。

南方周末:这些信息安全吗?

尹烨:上述公布的都是群体数据,不包含任何可识别的个人身份信息,也无法反推出任何原始数据与个体信息,对个人隐私来讲是安全的。

南方周末:中国没有自己的遗传资源库吗?

尹烨:国内目前有很一些小型的,分散在各个地区。目前,深圳国家基因库算是大规模的,今后如何把这些小资源库建立起数据共享和索引很重要。

南方周末:还需要什么?

尹烨:测序仪、测序核心技术都需要自己掌握,才能真正做到数据保护,不然每年中国用的测序数量很容易被推断出来。深圳国家基因库,都是国产测序仪,世界上至少有五个国家能造航母,但目前只有三个国家能造测序仪,只有两家公司能造人全基因组测序的测序仪。只有把这些工具自主可控了,老百姓才能做得安心,做得起。而不像以前,(基因检测)就只能是去最好的医院,最有钱的人才能做。