[ "赵文明(1977-),男,中国科学院北京基因组研究所生命与健康大数据中心高级工程师,主要研究方向为生物组学大数据整合与挖掘、高性能计算。" ]
[ "张思思(1985-),女,博士,中国科学院北京基因组研究所生命与健康大数据中心工程师,主要研究方向为组学大数据整合与审编。" ]
[ "唐碧霞(1984-),女,中国科学院北京基因组研究所生命与健康大数据中心工程师,主要研究方向为三维基因组的可视化。" ]
[ "陈婷婷(1986-),女,中国科学院北京基因组研究所生命与健康大数据中心工程师,主要研究方向为组学大数据整合与审编。" ]
[ "郝丽丽(1983-),女,博士,中国科学院北京基因组研究所生命与健康大数据中心助理研究员,主要研究方向为转录组数据整合与挖掘分析。" ]
[ "桑健(1989-),男,中国科学院北京基因组研究所生命与健康大数据中心博士生,主要研究方向为组学大数据整合与挖掘。" ]
[ "李茹姣(1976-),女,博士,中国科学院北京基因组研究所生命与健康大数据中心高级工程师,主要研究方向为表观遗传学相关大数据整合和深度挖掘。" ]
[ "肖景发(1973-),男,博士,中国科学院北京基因组研究所生命与健康大数据中心研究员,主要研究方向为生命与健康相关组学大数据整合和深度挖掘。" ]
[ "章张(1980-),男,博士,中国科学院北京基因组研究所生命与健康大数据中心研究员,主要研究方向为分子进化建模和选择压力检测、序列组分建模分析。" ]
网络首发:2016-11,
纸质出版:2016-11-20
移动端阅览
赵文明, 张思思, 唐碧霞, 等. 面向国际的生命组学大数据管理体系建设[J]. 大数据, 2016,2(6):2016065.
Wenming ZHAO, Sisi ZHANG, Bixia TANG, et al. Constructing the international database management system for omics big data[J]. Big data research, 2016, 2(6): 2016065.
赵文明, 张思思, 唐碧霞, 等. 面向国际的生命组学大数据管理体系建设[J]. 大数据, 2016,2(6):2016065. DOI: 10.11959/j.issn.2096-0271.2016065.
Wenming ZHAO, Sisi ZHANG, Bixia TANG, et al. Constructing the international database management system for omics big data[J]. Big data research, 2016, 2(6): 2016065. DOI: 10.11959/j.issn.2096-0271.2016065.
组学数据是生命科学研究中的一类极其重要的大数据,特别是二代测序技术的发展推动了组学大数据的爆炸式增长。通过借鉴国际数据中心建设的成功经验,分析国内组学产出数据及数据库建设、数据管理现状及应用需求,构建了面向国际的生命组学大数据管理体系,涵盖组学原始序列归档库、基因组序列数据库、基因表达数据库、基因组变异数据库、DNA甲基化数据库系统等,初步形成中国组学数据资源的存储、共享与应用体系。
Omics data are the important elements of the biosciences
in recent years
with the rapid progress of the next generation sequencing (NGS) technology
the omics data show the explosive increasement.Drawing on the successful experiences from the international data centers
and considering the domestic requirements
lots of databases including genome sequencing archive
genome warehouse
gene expression nebulas
genome variation map
DNA methylation databank were constructed.These databases constitute the domestic omics data resources and provide the free service for all the scientists for the data storing
sharing and management.
BENNETT S T , BARNES C , COX A , et al . Toward the $1000 human genome [J ] . Future Medicine , 2005 , 6 ( 4 ): 373 - 382 .
HAYDEN C . Technology:the $1,000 genome [J ] . Nature , 2014 , 507 ( 7492 ): 294 - 295 .
WHEELER D L , CHAPPEY C , LASH A E , et al . Database resources of the mational center for biotechnology information [J ] . Nucleic Acids Research , 2015 , 43 ( Database ): D6 - D17 .
STOESSER G , STERK P , TULI M , et al . The EMBL nucleotide sequence database [J ] . Nucleic Acids Research , 1997 , 25 ( 1 ): 7 - 13 .
COCHRANE G , AKHTAR R , ALDEBERT P , et al . Priorities for nucleotide trace,sequence and annotation data capture at the ensemble trace archive and the EMBL nucleotide sequence database [J ] . Nucleic Acids Research , 2007 , 36 ( Database ): D5 - D12 .
MASHIMA J , KODAMA Y , KOSUGE T , et al . DNA data bank of Japan (DDBJ) progress report [J ] . Nucleic Acids Research , 2016 , 44 ( Database ): D51 - D57 .
TATENO Y , IMANISHI T , MIYAZAKI S , et al . DNA data bank of Japan (DDBJ) for genome scale research in life science [J ] . Nucleic Acids Research , 2002 , 30 ( 1 ): 27 - 30 .
COCHRANE G , KARSCH-MIZRACHI I , TAKAGI T . The international nucleotide sequence database collaboration [J ] . Nucleic Acids Research , 2016 , 44 ( Database ): D48 - D50 .
WAN Y H , HE L M . Bioinformatics database resources on internet [J ] . Journal of the China Society for Scientific and Technical Information , 2002 , 21 ( 4 ): 497 - 512 .
0
浏览量
1136
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621