TCGA及SEER公共数据库挖掘与应用研

课程背景

随着大数据时代的到来,各种生物类公共数据库井喷,其中就包括癌症领域熟为人知的癌症基因图谱TheCancerGenomeAtlas(TCGA)数据库,临床科研人员有没有一种方法可以不做实验不查病史,直接调用现有数据发表SCI论文呢?癌症公共数据库即提供了这样的可能。本次学习班讲授癌症领域熟为人知的癌症基因图谱TheCancerGenomeAtlas(TCGA)数据库和癌症监测、流行病学和结果(SEER)数据库。TCGA由NCI牵头,作为美国攻克癌计划的一个大项目,系统提供了癌症多组学测序和芯片数据,包括Geneexpression,DNAmethylation,CopyNumberVariation,Mutation等结果,同时也附有相应各测序样本的完整临床资料。TCGA为肿瘤基础医学和转化医学研究者提供了海量的基因组数据和与其关联的临床数据,这为挖掘有意义的基因组变化和发现影响肿瘤起始、发展、分化、转移等生物学机制提供了海量数据基础。美国的SEER数据库由美国国立癌症研究所(NationalCancerInstitute,NCI)于年所建立,其后每年定期更新,是北美最具代表性的大型临床肿瘤登记注册数据库之一,收集了各个癌种的临床病理信息和预后数据,并向全世界开放,为临床医师的循证实践及临床肿瘤学研究提供了宝贵的第一手资料然而传统的基础医学和临床医学研究者缺乏信息学基础来处理这些大规模癌症数据,因而在面对这些极其有价值的公共数据时,往往心有余而力不足。作为医学信息领域研究者,我们需要将信息学和统计学知识运用到癌症公共数据分析的研究当中,作为连接大数据与肿瘤研究者之间的一个纽带,帮助研究者去更好地挖掘利用这些数据。

课程内容、目标与特色

本次培训提供了一次系统了解TCGA和SEER数据产生,糅合、分析及挖掘的课程,使基础医学和临床医学研究者能更好地挖掘这些公共数据,以便为自身科研项目服务。

本次培训涵盖拟解决的问题包括:

1、TCGA各组学数据下载。

2、差异表达基因鉴定、共表达分析及聚类、差异甲基化区域鉴定及分析。

3、基于TCGA数据挖掘癌症预后相关的甲基化位点和基因。

4、SEER数据库的基本情况、获取方式、数据库结构及基本统计方法。

5、近年来国内外基于TCGA和SEER数据挖掘的经典案例,重点对基于TCGA和SEER数据库的数据挖掘和课题设计进行讨论。

授课老师

本次培训邀请两位主讲老师。一位来自科研院所,医院临床医生。两位授课老师将分别从TCGA数据下载,数据整合,清洗及SCI文章常规思路对这些数据进行分析,并从临床角度出发,把测序数据与临床资料整合,为临床医生提供科研思路,为自身科研服务。

课程安排

第一天上午:TCGA概论及相关数据下载介绍

(一)TCGA数据库基本概念介绍

①TCGA项目的由来及发展始末;

②TCGA包含的癌种和数据类型解析;

③GEO数据库及数据下载,On







































北京哪个专家治疗白癜风好
北京白癜风大概需要多少钱



转载请注明:http://www.xcqg58.com/jbjj/7579.html