『壹』 構建蛋白質二級資料庫的基本原則是什麼
生物大分子三維空間結構資料庫是一類重要的生物信息學資料庫。蛋白質結構資料庫專(ProreinData Bank,PDB)是屬1971年創建的國際上最著名、最完整的蛋白質三維結構資料庫。另外還有蛋白質分類資料庫SCOP和CATH。
『貳』 編號scop是什麼 系列的作品求告知
C是食品穗運生產許可證編號中的生產的漢語拼音字母縮寫。
國家食品葯品監督管理總局令第16號《食品生產許可管理辦法》(自2015年10月1日起施行。)其中第四章許可證管理第二十九條規定:食品生產許可證編號由SC(「生產」的漢語拼音字母縮寫)和14位阿拉培族羨伯數字組成。數字從配拍左至右依次為:3位食品類別編碼、2位省(自治區、直轄市)代碼、2位市(地)代碼、2位縣(區)代碼、4位順序碼、1位校驗碼。
『叄』 試述SCOP蛋白質分類方案
SCOP將PDB資料庫中的蛋白質按傳統分類方法分成α型、β型、α/β型、α+β型,並將多結構域蛋白、膜蛋白和細胞表面蛋白、N蛋白單獨分類,一共分成7種類型,並在此基礎上,按折疊類型、超仔汪蠢家族、家族三個層次逐級分類。對於具有不同種屬來源的同源蛋白家族,SCOP資料庫陵昌按照種屬名稱將它們分成若干念陪子類,一直到蛋白質分子的亞基
『肆』 常用的查詢蛋白質結構以及序列的資料庫主要有哪些
1. PIR和PSD
PIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫,可在這里下載。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。
『伍』 蛋白質資料庫的內容
Protein Sequence Databases: Antibodies: Sequence and Structure
BRENDA: Enzyme database
CD Antigens: Database of CD antigens
dbCFC: Cytokine family database
Histons: Histone sequence database
HPRD: Human protein reference database
InterPro: Intergrated documentation 5resources for protein families
iProClass: An integrated protein classification database
KIND: A non-rendant protein sequence database
MHCPEP: Database of MHC binding peptides
MIPS: Munich information centre for protein sequences
PIR: Annotated, and non-rendant protein sequence database
PIR-ALN: Curated database of protein sequence alignments
PIR-NREF: PIR nonrendent reference protein database
PMD: Protein mutant database
PRF: Protein research foundation, Japan
ProClass: Non-rendant protein database
ProtoMap: Hierarchical classification of swissprot proteins
REBASE: Restriction enzyme database
RefSeq: Reference sequence database at NCBI
SwissProt: Curated protein sequence database
SPTR: Comprehensive protein sequence database
Transfac: Transcription factor database
TrEMBL: Annotated translations of EMBL nucleotide sequences
Tumor gene database: Genes with cancer-causing mutations
WD repeats: WD-repeat family of proteins Protein Structure Databases: Cath: Protein structure classification
HIV Protease: HIV protease database 3D structure
PDB: 3-D macromolecular structure data
PSI: Protein structure initiative
S2F: Structure to function project
Scop: Structural Classification of Proteins Protein Domains, Motifs & Signatures: BLOCKS: Multipe aligned segments of conserved protein regions
CCD: Conserved domain database and search service
DOMO: Homologous protein domain families
Pfam: Database of protein domains and HMMs
ProDom: Protein domain database
Prints: Protein motif fingerprint database
Prosite: Database of protein families and domains
SMART: Simple molar architecture research tool
TIGRFAM: Protein families based on HMMs Others: Phospho Site: Database of phosphorylation sites
『陸』 蛋白質結構和功能多樣性的直接和根本原因是什麼
蛋白質多樣性的直接原因是組成蛋白質的氨基酸的種類、數目、排列順序不同,直接造成了形成的肽鏈折疊方式不一樣,在肽鏈基礎上的形成的蛋白質空間結構也就不一樣,所以形成了蛋白質的多樣性。
根本原因是由於基因的多樣性和基因選擇性表達。
蛋白質和多肽之間的界限並不是很清晰,有人基於發揮功能性作用的結構域所需的殘基數認為,若殘基數少於40,就稱之為多肽或肽。要發揮生物學功能,蛋白質需要正確折疊為一個特定構型,主要是通過大量的非共價相互作用(如氫鍵,離子鍵,范德華力和疏水作用)來實現。
此外,在一些蛋白質(特別是分泌性蛋白質)折疊中,二硫鍵也起到關鍵作用。為了從分子水平上了解蛋白質的作用機制,常常需要測定蛋白質的三維結構。由研究蛋白質結構而發展起來了結構生物學,採用了包括X射線晶體學、核磁共振等技術來解析蛋白質結構。
(6)scop分類資料庫擴展閱讀:
蛋滲族渣白質的分子結構可劃分為四級,以描述其不同的方面:
1、一級結構:組成蛋白質多肽鏈的線性氨基酸序列。
2、二級結構:依靠不同氨基酸之間的C=O和N-H基團間的氫鍵形成的穩定結構,主要為α螺旋和β折疊。
3、三級結構:通過多個二級結構元素在三維空間的排列所形成的一個蛋白質分子的三維結構。
4、四級結構:用於描述由不同多肽叢悄鏈(亞基)間相互作用穗鄭形成具有功能的蛋白質復合物分子。
蛋白質設計的目標是通過計算機輔助的演算法以生成符合目標蛋白質三維結構的氨基酸序列,經過漫長的進化,自然界已經篩選出了數量眾多的蛋白質,但天然蛋白質只有在自然條件下才發揮最佳功能,這使得人們利用這些蛋白質受到了限制,因此需要對蛋白質進行改造使其能適應特定條件發揮特定的功能。蛋白質分子的設計分為3類:小改、中改和大改。