❶ 轉錄組差異表達分析(NCBI中的GEO數據)
生信小盆的不定期分享
轉錄組的差異表達分析,即尋找差異。例如,探究一個病人與正常人的基因或功能變化,導致正常人體質轉變為病患。因此,我們需要尋找差異表達的基因和功能。
在生信分析中,差異表達分析有多種工具,類似於多條道路通向羅馬。使用不同工具進行差異分析時,參數或閾值不同可能導致結果略有差異,但這不會影響後續分析。以下是我做差異表達的一個簡單流程。
1. 數據下載(針對GEO資料庫中的數據分析)
轉錄組數據通常保存在NCBI的GEO資料庫或TCGA資料庫中。以下是GEO資料庫中的數據下載方法。例如,研究某種疾病時,我們需要找出數據的獨特之處,如樣本量、數據新穎性等。
2. 數據分析
常用的數據分析軟體有GEO2R和limma。NCBI資料庫中的GEO2R軟體可直接在線分析並得到差異基因。
分析時,需進行分組並劃分數據顏色(如tumor和normal)。分組完成中握遲後,即可進行分析。若使用R語言,可提供R代碼。注意保存為txt格式,避免亂碼。
分析時,通常選擇三個以上的GEO數據進行差異分析,然後通過韋恩圖找到共同基因進行後續分析。
3. 功能富集分析(GO和KEGG)
GO和KEGG分析用於功能分析和基因注釋。一般可在DAVID在線資料庫中完成。GO分析包括細胞成分、分子功能和生物學過程。我們通常選擇富集因子選擇排名靠前的GO和KEGG注釋情況。
4. PPI網路構建
為了檢測基因之間的潛在關系,我們使用PPI網路分析。在string資料庫中輸入基因,然後用cytoscape軟體進行可視化皮森分析。cytoscape軟體中有許多篩選差異基因的小軟體,如模塊分析或degree等值分析。
5. 生存分析
對關鍵基因進行生存分析,查看其在正常和疾病組織中的治療情況。GEPIA網站可提供相關賣李信息。
總體來說,簡單的生信分析可用在線軟體得到結果,科研相對輕松。後續將詳細介紹軟體和分析代碼。