⑴ 怎样用CSCD预测circRNA的下游miRNA
1、筛选PTC中潜在的circRNA,GEO数据库中查找甲状腺乳头状癌相关的数据集,最终找到GSE93522。通过GEO2R在线差异分析工具进行差异分析,此处组别的设置为:(正常vs良性);(正常vs恶性)。在挑选候选circRNA分子时,只挑选在(正常vs恶性)中的差异分子,排除在(正常vs良性)中上调或者下调的circRNA。最终找到13个上调和1个下调的PTC发生和进展相关的circRNA分子。随后,我们通过circBase数据库找到这14个circRNA分子的亲本基因以及在基因组中的座位。为了绘制circRNA圈图,我们在CSCD数据库中查找这14个circRNA,最终找到11个circRNA,并用其中的数据绘制圈图。
2、预测和分析PTC中与潜在circRNA分子结合的miRNA,circRNA分子发挥作用存在三种比较常见的机制:作为miRNA的海绵;与RBP结合;翻译为短肽或者蛋白质。从绘制的圈图看,这11个miRNA均存在MRE元件,可能可以与相应的miRNA相互作用。因此,我们使用CSCD和CRI数据库来预测相应的结合miRNA,并用Cytoscape软件构建相应的circRNA-miRNA网络图。随后,通过使用TCGA数据库中的数据,分析上述miRNA在甲状腺乳头状癌中的表达和预后价值。3、预测和分析PTC中上述miRNA下游的靶基因,通过上述的表达分析和预后分析,符合筛选要求的只有miR-605-5p和miR-876-3p两个miRNA。接着,我们使用综合性靶基因预测数据库miRNet,预测这两个miRNA下游的靶基因。通过蛋白互作网络分析,我们构建靶基因PPI网络,并结合CytoHubba中的算法(Cytoscape中的插件),最终筛选出20个hub基因。同时,使用STRING数据库,我们对预测出的靶基因进行GO和KEGG富集分析。
4、构建PTC中潜在的信号通路:hsa_circ_0088494-miR-876-3p-CTNNB1/CCND1,还是通过Cytoscape,我们构建miRNA-hub基因网。使用starBase数据库,我们对miRNA-hubgene关系对作表达相关性分析,从中筛选呈显著负相关的关系对(3个关系对符合)。最后,对三个关系对中的hub基因作表达分析,发现只有CTNNB1和CCND1在甲状腺乳头状癌中显著高表达,符合要求。
⑵ 如何在geo数据库找想要的数据库
1、首先GEO数据库是个什么鬼呢?
GEO数据库全称GENE EXPRESSION
OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。
2、那GEO数据库有哪些检索入口呢?
最常用的有两种方式,如果你知道GSE编号可以通过网址http://www.ncbi.nlm.nih.gov/geo直接进入,具体编号介绍文件下载方法见:https://www.omicsclass.com/article/1100
另外一种就是通过NCBI主页的入口基因搜索下载。通常是不知道GEO编号,通过样品类型,实验处理,平台信息等搜索筛选想要的GEO数据:https://www.ncbi.nlm.nih.gov/,进入NCBI主页,搜索数据选择GEO DataSets,如果搜索某个基因表达量可选择GEO Profiles。