北京基因组所生命与康健大数据钻研获进展

1月4日,《国际核酸钻研》(Nucleic Acids Research)数据库专刊,连登四篇中国科学院北京基因组钻研所生命与康健大数据钻研功效,包罗生命组学数据资本扶植功效(D14-20)、及时定量PCR内参基因学问库——ICG(Internal Control Genes;D121-126),甲基化数据库Methbank升级版(D288-295)以及基因组序列变异库——GVM(Genome Variation Map;D944-949)。四篇文章的颁发,标记取我国分析型生物消息资本库扶植得到国际同业进一步承认。

自上世纪60年代以来,国际生物消息学家成立了一系列的数据库。出格是上世纪90年代,跟着人类基因组打算的展开以及收集在环球普及,数据库数量和体量迅猛添加,构成了以NCBI、EBI、DDBJ等为代表的多个国际大数据核心。跟着测序手艺不竭成长,我国已成为国际基因组数据最大产出国之一,但我国产出的组学数据绝大部门必需提交到外洋数据库才能获得承认。据Database Commons数据库统计,我国数据库资本总数已位居世界第二,但大部门数据库没有进行持久运转维护,严峻缺乏深度人工审编,数据库内容边沿化,最终成果是大量数据库资素品质不高,操纵率低。

北京基因组所面向国度大数据成长计谋和科技立异计谋,建立生命与康健大数据核心,成立生物大数据贮存、整合与发掘阐发钻研系统,建立的GSA(Genome Sequence Archive)数据库已开展原始组学数据存储与共享办事,并与国际接轨,存储的数据已支撑Cell、Nature Communications、PNAS、Genome Research等杂志文章颁发,建成我国生物大数据汇交共享平台,成为继NCBI、EBI、DDBJ之后第四个分析基因组权势巨子数据库。同时,建成生物大数据多条理组学层面的数据资本系统,包罗基因组归档数据库Genome Warehouse、基因组变异数据库Genome Variation Map、基因表达数据库Gene Expression Nebulas、甲基化数据库Methylation Bank、生物学问库Science Wikis,对我国科学钻研和财产立异成长起到了主要支持感化。

发表评论

电子邮件地址不会被公开。 必填项已用*标注