❶ 转录组差异表达分析(NCBI中的GEO数据)
生信小盆的不定期分享
转录组的差异表达分析,即寻找差异。例如,探究一个病人与正常人的基因或功能变化,导致正常人体质转变为病患。因此,我们需要寻找差异表达的基因和功能。
在生信分析中,差异表达分析有多种工具,类似于多条道路通向罗马。使用不同工具进行差异分析时,参数或阈值不同可能导致结果略有差异,但这不会影响后续分析。以下是我做差异表达的一个简单流程。
1. 数据下载(针对GEO数据库中的数据分析)
转录组数据通常保存在NCBI的GEO数据库或TCGA数据库中。以下是GEO数据库中的数据下载方法。例如,研究某种疾病时,我们需要找出数据的独特之处,如样本量、数据新颖性等。
2. 数据分析
常用的数据分析软件有GEO2R和limma。NCBI数据库中的GEO2R软件可直接在线分析并得到差异基因。
分析时,需进行分组并划分数据颜色(如tumor和normal)。分组完成中握迟后,即可进行分析。若使用R语言,可提供R代码。注意保存为txt格式,避免乱码。
分析时,通常选择三个以上的GEO数据进行差异分析,然后通过韦恩图找到共同基因进行后续分析。
3. 功能富集分析(GO和KEGG)
GO和KEGG分析用于功能分析和基因注释。一般可在DAVID在线数据库中完成。GO分析包括细胞成分、分子功能和生物学过程。我们通常选择富集因子选择排名靠前的GO和KEGG注释情况。
4. PPI网络构建
为了检测基因之间的潜在关系,我们使用PPI网络分析。在string数据库中输入基因,然后用cytoscape软件进行可视化皮森分析。cytoscape软件中有许多筛选差异基因的小软件,如模块分析或degree等值分析。
5. 生存分析
对关键基因进行生存分析,查看其在正常和疾病组织中的治疗情况。GEPIA网站可提供相关卖李信息。
总体来说,简单的生信分析可用在线软件得到结果,科研相对轻松。后续将详细介绍软件和分析代码。