① 為什麼要做ppi網路
蛋白質互作網路是由單獨蛋白通過彼此之間的相互作用構成,來參與生物信號傳遞、基因表達調節、能量和物質代謝及細胞周期調控等生命過程的各個環節。系統分析大量蛋白在生物系統中的相互作用關系,對於了解生物系統中蛋白質的工作原理,了解疾病等特殊生理狀態下生物信號和能量物質代謝的反應機制,以及了解蛋白之間的功能聯系都有重要意義。
相關原理:
蛋白質相互作用通常可以分為物理互作和遺傳互作。物理互作是指蛋白質間通過空間構象或化學鍵彼此發生的結合或化學反應,是蛋白質互作的主要研究對象。
而遺傳互作則是指在特殊環境下,蛋白質或編碼基因收到其他蛋白質或基因的影響,常常表現為表型變化之間的相互關系。蛋白質互作網路包括:蛋白質互作檢測技術(免疫共沉澱技術、酵母雙雜交技術、串聯親和純化-質譜分析技術、蛋白質互作預測技術、遺傳互作檢測技術)蛋白質互作資料庫、蛋白質互作網路。
以上內容參考:網路-蛋白質互作網路
② uniprot蛋白質序列資料庫由哪幾部分組成各有什麼特點
將PIR、SWISS-PROT和TrEMBL3個蛋白質資料庫統一-起來組建而成,包含3個部分:
(1) UniProt Knowledgebase (UniProtKB) ,這是蛋白回質序列、功能答、分類、交叉引用等蛋白質知識庫,記錄經過人工篩選和注釋;
■ (2) UniRef ( UniProt Non-rendant Reference )
資料庫,將密切相關的蛋白質序列組合到一條記錄中,以便提高搜索速度;目前,根據序列相似程度形成3個子庫,即UniRef100、UniRef90和UniRef50;
■ (3) UniParc (UniProt Archive),是UniProt存檔庫 ,
收錄所有蛋白質序列。用戶可以通過文本查詢資料庫,可以利用BLAST程序搜索資料庫,也可以直接通過FTP下載數據。
③ 如何使用string資料庫預測蛋白質相互作用
蛋白質相互作用資料庫見下表所示: 資料庫名
BIND
DIP
IntAct
InterDom
MINT
STRING
HPRD
HPID
MPPI
蛋白質相互作用的預測方法很非常多,以下作了簡單的介紹
1) 系統發生譜
這個方法基於如下假定:功能相關的(functionally related)基因,在一組完全測序的基因組中預期同時存在或不存在,這種存在或不存在的模式(pattern)被稱作系統發育譜;如果兩個基因,它們的序列沒有同源性,但它們的系統發育譜一致或相似.可以推斷它們在功能上是相關的。
2
2) 基因鄰接
這個方法的依據是,在細菌基因組中,功能相關的基因緊密連鎖地存在於一個特定區域,構成一個操縱子,這種基因之間的鄰接關系,在物種演化過程種具有保守性,可以作為基因產物之間功能關系的指示。這個方法似乎只能適用於進化早期的結構簡單的微生物。所以在人的蛋白質相互作用預測時不採用這個方法。
3) 基因融合事件
這個方法基於如下假定:由於在物種演化過程中發生了基因融合事件,一個物種的兩個(或多個)相互作用的蛋白,在另一個物種中融合成為一條多肽鏈, 因而基因融合事件可以作為蛋白質功能相關或相互作用的指示。
4) 鏡像樹
這個方法的思想是,功能相關的蛋白質或同一個蛋白的域之間,受功能約束,其進化過程應該保持一致, 即呈現共進化(CO—evolution)特徵,通過構建和比較它們的系統發育樹,如果發現樹的拓撲結構顯示相似性,這種相似的樹被稱作鏡像樹,那麼,可以推測建樹基因的功能是相關的。
5) 突變關聯
物理上相互接觸的蛋白質, 比如處在同一個結構復合物中的蛋白質,其中一個蛋白質在進化過程中累計的殘基變化,通過在另一個蛋白質中發生相應的變化予以補償,這種現象被稱作關聯突變。
6)
序列信號關聯
3
通過檢查實驗上已經證實的相互作用蛋白質對,發現序列特徵信號
(sequence-signatures)在不同對的相互作用蛋白中重復地出現,這一現象被稱作序列信號關聯。利用序列域信號關聯作為相互作用蛋白質的識別指示,可以預測未知功能蛋白與已知蛋白的相互作用,減少直接實驗的搜索空間。
7) 保守的蛋白間相互作用
相互作用的蛋白質在物種演化過程中具有保守性,因此,可以通過在一個物種中建立的蛋白質相互作用網路,預測其它物種的蛋白質間相互作用。這是後基因組時代產生的一個分子進化概念,使人們聯想到直系同源基因(orthologs)和平行同源基因(paralogs)兩個概念。Walhout首先提出了」interologs」這個新概念,後由Matthews等利用酵母雙雜交法分析了1195個釀酒酵母相互作用蛋白在線蟲(C.elegans)中的保守性,獲得了
16%-31%線蟲保守相互作用蛋白,它們主要集中在核心代謝過程(core metabolic processes)並預期隨著親緣關系的遠近,保守性作相應變化。
8) 同源結構復合物
設想三維結構已知的蛋白質復合物,各自的同家族成員以同樣的方式發生相互作用.
9) 進化速率關聯
蛋白質的進化速率由這個蛋白質同其它蛋白質發生相互作用的數量決定,並呈負相關,即相互作用的數量越多進化速率越低,而不是通常設想的蛋白質的進化速率由這個蛋白質對機體的重要性決定,這是一個極重要的概念。Fraser等13Ol利用一組實驗上證實的酵母相互作用蛋白,量化分析了進化速率、適合度(fitness)和序列共進化(sequence CO—evolution)之間的關系;統計分析顯示,在酵母蛋白質相互作用網路中,連接點越多的蛋白質進化速率進化越低,可能的原因是,這些蛋白質需要與更多的相互作用伴體(partner)共進化。
10) 共鳴識別模型MRRM預測蛋白質相互作用
從蛋白質一級結構預測蛋白質相互作用,它假設生物分子(包括蛋白質和DNA)之間的相互作用是通過共鳴能量的傳遞來實現的,RRM恰當地引入了一些蛋白質的物理參數,並且運用了信號分析方法(Digital Signal Analysis,DSP)使得對於蛋白質和基因的分析脫離了局部性。
11) 通過Domain相互作用來預測蛋白質相互作用
Domain是蛋白質最小的功能單元,它們之間的相互作用一定程度上就決定了蛋白質之間的相互作用。按照這個方法將所有的氨基酸序列進行聚類,如果類與類之間的相互作用的序列對的個數超過了一定閾值,則表示與兩個類的代表序列同源的蛋白質之間都可能會發生相互作用。
12) 根據蛋白結構來預測蛋白相互作用
Lappe等人認為,雖然蛋白質之間的相互作用並不能直接用作預測,但是在結構上相似的蛋白質將有可能具有相似的功能,至少會給出一定的功能提示。分類的原則可按照SCOP給出的層次進行,分類方法是將已知序列的蛋白質相互作用對分別與SCOP的典型結構進行匹配,使之對應到每一個類中。預測已知與其他蛋白相互作用關系的蛋白的序列結構可以列出該蛋白結構組成的最大可能情況。
④ DIP具體意思是什麼,是英文的縮寫嗎
DIP有多個不同的釋義,具體如下:
1、DIP:數字圖像處理
數字圖像處理(Digital Image Processing)是通過計算機對圖像進行去除雜訊、增強、復原、分割、提取特徵等處理的方法和技術。數字圖像處理的產生和迅速發展主要受三個因素的影響:
一是計算機的發展;二是數學的發展(特別是離散數學理論的創立和完善);三是廣泛的農牧業、林業、環境、軍事、工業和醫學等方面的應用需求的增長。
2、DIP:軟體設計原則
DIP是依賴倒轉原則,依賴倒轉原則的一種表述是:細節應當依賴於抽象,抽象不應當依賴於細節。另一種描述是:要針對介面編程,不要針對實現編程。
意思就是應當使用介面和抽象類而不是具體類進行變數的類型聲明、參數的類型聲明、方法的返回類型聲明以及數據類型的轉換等。要保證這一點,一個具體java類應當只實現java介面和抽象java類中聲明過的方法,而不應當給出多餘的方法。
3、DIP:蛋白相互作用資料庫
DIP(Database of Interacting Protein),也叫蛋白互作資料庫,是研究生物反應機制的重要工具。DIP 可以用基因的名字等關鍵詞查詢,使用上較方便。至2002 年6 月,已收錄了約一萬八千個蛋白質間的相互作用信息條目。
4、DIP:金屬製品
DIP一種特殊合金材料,經過特殊熱處理工藝及在工藝過程溫度1000-1500范圍調節,在表面可生成一層20微米厚的優質絕緣層,此材料可加工成銷、管及各種形狀,主要用於高溫、絕緣環境下保護某些產品部位,像汽車工業中螺栓、螺帽的焊接。
5、DIP:英文單詞
DIP,英語單詞,動詞、名詞,作動詞時意為「 浸,蘸;(使)下降,下沉,減少;(把手、工具)伸入(袋子、容器);扒竊;動用(資金);瀏覽(書籍);(給牲畜)洗葯浴;製作(蠟燭);給某人施洗禮;(道路、地面)向下傾斜;放下,下移。
⑤ 國際著名的三大蛋白質資料庫
國際著名的三大蛋白質資料庫有UniProt資料庫、The Human Protein Atlas資料庫、PhosphoSitePlus資料庫。
1、UniProt資料庫
蛋白組學常用資料庫UniProt(全稱UniProt Protein Resource),建立於1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白質資料庫聯合成立的,其信息量豐富、資源廣泛,是目前公認的首選免費蛋白質資料庫。
2、The Human Protein Atlas資料庫
The Human Protein Atlas內含近30000種人類蛋白質的組織和細胞分布信息,並提供免費查詢。
瑞典Knut&Alice Wallenberg基金會利用免疫組化技術,檢查每一種蛋白質在人類48種正常組織,20種腫瘤組織,47個細胞系和12種血液細胞內的分布和表達,其結果用至少576張免疫組化染色圖表示,並經專業人員校對和標引,保證染色結果具有充分的代表性。
3、PhosphoSitePlus資料庫
PhosphoSitePlus資料庫是一個由CST和NIH聯合開發的免費資源資料庫,總結歸納了海量通過科學研究發現的蛋白修飾位點,包括磷酸化、甲基化、乙醯化、泛素化等,並且包括一些CST公司發現但未發表的蛋白修飾位點。
該資料庫是動態的、開放的、高度互動並持續更新的。它有助於研究PTMs在正常和病理細胞/組織中的作用,同時它也是發現新的疾病標志物和葯物靶點的有力工具。
性能及歷史
蛋白質資料庫(HPDB),建於2005年5月,動態展示生物大分子立體結構,滑鼠點擊放大分子結構、原子定位、測定原子之間距離,可用於教學或科研。服務對象是能夠熟練使用中文的生命科學、醫學、葯學、農學、林學等領域的大中專學生、教師及科技工作者。
分子結構特徵描述採用漢語,同時提供英文原文以供考證。對於善於使用英文的讀者,我們提倡直接訪問RCSB PDB,一來可以減少網路擁擠,二來可以減少由於HPDB的翻譯不妥帶來的不便。
蛋白質資料庫(HPDB)對每個蛋白質分子結構說明部分做了中文翻譯(最新加入資料庫的分子除外),內容包括分子結構定性描述、樣品的來源、表達載體、宿主、化學分析方法、分子結構組成成分等。這些信息並同蛋白質分子結構數據存儲於資料庫,因此HPDB支持中文查詢。
蛋白質資料庫(HPDB)雖然翻譯了「分子結構說明」部分,但為了保證數據的可靠性和准確性,HPDB對一級結構序列及大分子結構坐標數據等未做任何改動,資料庫保持RCSB PDB核實後的原始實驗數據文件,並保持PDB文件格式和蛋白質分子編號。
⑥ 常用的查詢蛋白質結構以及序列的資料庫主要有哪些
1. PIR和PSD
PIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫,可在這里下載。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。