『壹』 目前常用生物信息学分析方法有哪些
现在比较热门的数据库包括GEO、TCGA
GEO分析主要是芯片做差异分析,得到差异基因,差异基因可以做GO、KEGG功能富集分析
TCGA数据库是癌症分析的利器,可以做差异基因,差异miRNA,差异lncRNA,下载和整理临床数据,做生存分析,高难度的COX分析
这两个数据库可以发到不错的文章
『贰』 geo数据库的优点
免费且只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。
GEO数据库是一个储存芯片、二代测序以及其他高通量测序数据的一个数据库。利用这个数据库,我们可以检索到其他一些人上传的一些实验测序数据。
不涉及任何检测原理的角度来说的话,所谓的高通量检测,其实就是一次性检测很多指标变化的技术。例如我们说的表达谱数据,就是来检测基因表达水平。比如我们要对一个人来进行高通量检测的话,就能知道这个人上万个基因的表达水平了。
由于GEO数据库和我们之前介绍的gene数据库 [数据库推荐]gene:基因相关信息查询 以及我们常用来搜索文献的pubmed都是一个机构的。使用这个数据库,我们需要做的就是就是就是提供检索式。检索式可以是简单的几个关键词,也可以是制定特殊的检索式。
『叁』 如何对GEO数据库中已有的数据进行分析
差异表达基因的筛选(阀值)以及后面的生物信息分析都可以做的。
差异表达基因筛选步骤:选择GEO数据——下载芯片数据——差异分析(方法有很多:SAM法,R包处理,T-test检验等)——选择想要的阈值(Fold change >4)