您的位置:首页>事迹发布榜>团队事迹
“拼命三郎”和他的“最美”团队
来源:北京基因组所 【字号:  

在中国科学院北京基因组研究所(以下简称北京基因组所)一楼的机房里,伴随着大型计算机运转的嗡鸣声,大大小小的红绿色指示灯不停闪烁着。

这里有两块沉甸甸的“国字头”招牌——国家生物信息中心和国家基因组科学数据中心(NGDC)。

建成国际一流生物信息中心,是我国几代生命科学研究者30年来的梦想。北京基因组所研究员、NGDC主任鲍一明和团队在短短7年内初步实现了这个梦想。为了共同的目标,研究团队的每位成员都在全力以赴。

作为团队带头人,鲍一明有着“拼命三郎”的绰号。北京基因组所一位负责人向《中国科学报》记者透露,有一次她去鲍一明家中拜访,不经意间发现了冰箱里的一个“秘密”。“为了节省时间,他一次煮十几个鸡蛋放在冰箱里,每天早上拿出来吃两个就上班。”

因在基因组学数据库建设方面作出突出贡献,鲍一明和团队获评2023年北京市朝阳区“最美科技创新团队”,他本人也荣获“全国归侨侨眷先进个人”荣誉称号。

圆一个持续30年的中国梦

自上世纪八九十年代基因组学诞生以来,全球基因组学研究数据逐渐汇交至三大数据中心——美国国家生物技术信息中心、欧洲生物信息学研究所、日本核酸数据库。三大中心又建立了国际核酸序列共享联盟(INSDC),形成领域内数据存储和共享使用的标准。

很长时间内,中国科学家不得不把自己的数据送往国外的数据库,同时在获取数据上也严重依赖国外数据库。

对标国际三大数据中心,建成一流生物信息中心,是我国几代生命科学研究者30年的梦想。郝柏林、陈润生、赵国屏等多位院士曾多次为此奔走呼吁。

2016年2月,北京基因组所成立生命与健康大数据中心,并构建了组学原始数据存储归档系统(GSA),其目标是立足国内、服务全球。

2017年,在美国国家生物技术信息中心工作了16年的鲍一明,在时任北京基因组所所长薛勇彪的邀请下加入北京基因组所,将国际一流生物数据库建设经验带回国内。

鲍一明和生命与健康大数据中心原有科研骨干章张、赵文明、肖景发一起,被大家亲切地称为“四大金刚”,团队里的每一项任务,他们总是冲在第一线。在他们的带领下,团队的凝聚力和战斗力不断提高。

经过团队不断努力,GSA先后被威立、爱思唯尔、施普林格·自然等全球主要出版集团认可。2017年,他们受到INSDC邀请,作为国际三大数据中心之外唯一一家机构参加联盟年会并在会上作报告。

2019年,生命与健康大数据中心迎来了里程碑的时刻:这艘生命科学数据的“小舟”成为20个国家科学数据中心之一,NGDC这艘“旗舰”应运而生。

同年,北京基因组所挂上了“国家生物信息中心”的招牌,依托NGDC承担国家生物信息大数据统一汇交、集中存储、安全管理与开放共享,以及前沿交叉研究和转化应用等工作。

临危受命 火速完成任务

2020年1月,突如其来的新冠疫情,给刚成立不久的NGDC带来了一次考验。北京基因组所迅速部署开发新冠病毒信息库,鲍一明与团队临危受命,火速完成了任务。

彼时正值春节关口,青年科学家邹东在回老家的火车上接到电话,不等下车,他就开始了数据库测试版的开发工作。青年科研骨干陈旭、陈梅丽同时参与了信息库开发工作。大年三十那天,这对夫妇依然坚守岗位,只能抽空给年幼的孩子煮一碗速冻水饺当年夜饭。

作为团队的“领头羊”,鲍一明的拼劲儿更是出了名。“他经常加班到凌晨两点,早上又第一个到数据中心。”“开发新冠病毒信息库期间,我好几次在凌晨给鲍老师发信息,他都是速回。”“他为了节省时间,中午有时候连食堂都不去,就在办公室胡乱对付一口零食……”北京基因组所多位青年科研人员对《中国科学报》说。

那段时间,NGDC团队里的很多人都把实验室当成了家。他们加班加点更新数据,白天黑夜连轴转。

在短短10天内,研究团队就开发上线了集全球新冠病毒基因组序列整合、质控、变异分析等为一体的综合性新冠病毒信息库(RCoV19),并与国际实现数据同步共享。国外科学家来信称:“NGDC在极短时间内建立了一个十分优秀、令人印象深刻的信息库。”

截至今年5月,RCoV19已收录全球1500多万条新冠病毒基因组序列信息,服务全球181个国家/地区280多万名访客,累计数据下载超118亿条,为推动中国和全球新冠病毒生物信息数据汇交与共享、服务科技抗疫发挥了重要作用。

在鲍一明和同事的努力下,NGDC收录的新冠基因组数据有了国内与国际“双重身份证号码”,在标注NGDC编号的条件下与INSDC实现共享。这也为NGDC与INSDC的进一步合作打下了基础。

这些成果让RCoV19被列入《抗击新冠肺炎疫情的中国行动》白皮书,入选国家“十三五”科技创新成就展,研究团队也被科技部授予“全国科技系统抗击新冠肺炎疫情先进集体”称号。

数据是原材料

迄今,NGDC已经建立了包含九大数据类型的63个数据库,形成“数据-信息-知识”一体化数据资源体系。依托这一数据库,我国科学家在国际生物数据库期刊《核酸研究》上集中发表了一批前沿成果,NGDC连续多年被该刊评价为与国际三大数据库并列的全球主要生物数据中心。

目前,这里拥有的生物数据资源总量已超过34PB,支持各类科技项目1.5万多个,为国家重点研发计划、国家自然科学基金、中国科学院战略性先导科技专项等国家重大、重点研究计划及任务的科学数据安全管理和开放共享提供了重要支撑。

在“一带一路”国际科学组织联盟的支持下,北京基因组所还依托NGDC建立了以我国为主的国际生物多样性和健康大数据共享联盟,当前已与12个国家的28个机构建立了数据共享和科研合作关系。

谈到未来,北京基因组所研究员肖景发向《中国科学报》表示:“工作的重心还是数据存储,数据是中心发展的基石和原材料,有了它才能做出更好的‘菜’,才能实现‘存管用’一体化。”

“虽然我们起跑的时间晚了点,但只要努力慢慢接近,一定能够赶上国际一流水平。”鲍一明说。


关闭窗口
© 中国科学院 版权所有 京ICP备05002857号 京公网安备110402500047号