『壹』 构建蛋白质二级数据库的基本原则是什么
生物大分子三维空间结构数据库是一类重要的生物信息学数据库。蛋白质结构数据库专(ProreinData Bank,PDB)是属1971年创建的国际上最著名、最完整的蛋白质三维结构数据库。另外还有蛋白质分类数据库SCOP和CATH。
『贰』 编号scop是什么 系列的作品求告知
C是食品穗运生产许可证编号中的生产的汉语拼音字母缩写。
国家食品药品监督管理总局令第16号《食品生产许可管理办法》(自2015年10月1日起施行。)其中第四章许可证管理第二十九条规定:食品生产许可证编号由SC(“生产”的汉语拼音字母缩写)和14位阿拉培族羡伯数字组成。数字从配拍左至右依次为:3位食品类别编码、2位省(自治区、直辖市)代码、2位市(地)代码、2位县(区)代码、4位顺序码、1位校验码。
『叁』 试述SCOP蛋白质分类方案
SCOP将PDB数据库中的蛋白质按传统分类方法分成α型、β型、α/β型、α+β型,并将多结构域蛋白、膜蛋白和细胞表面蛋白、N蛋白单独分类,一共分成7种类型,并在此基础上,按折叠类型、超仔汪蠢家族、家族三个层次逐级分类。对于具有不同种属来源的同源蛋白家族,SCOP数据库陵昌按照种属名称将它们分成若干念陪子类,一直到蛋白质分子的亚基
『肆』 常用的查询蛋白质结构以及序列的数据库主要有哪些
1. PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3. PROSITE
PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
『伍』 蛋白质数据库的内容
Protein Sequence Databases: Antibodies: Sequence and Structure
BRENDA: Enzyme database
CD Antigens: Database of CD antigens
dbCFC: Cytokine family database
Histons: Histone sequence database
HPRD: Human protein reference database
InterPro: Intergrated documentation 5resources for protein families
iProClass: An integrated protein classification database
KIND: A non-rendant protein sequence database
MHCPEP: Database of MHC binding peptides
MIPS: Munich information centre for protein sequences
PIR: Annotated, and non-rendant protein sequence database
PIR-ALN: Curated database of protein sequence alignments
PIR-NREF: PIR nonrendent reference protein database
PMD: Protein mutant database
PRF: Protein research foundation, Japan
ProClass: Non-rendant protein database
ProtoMap: Hierarchical classification of swissprot proteins
REBASE: Restriction enzyme database
RefSeq: Reference sequence database at NCBI
SwissProt: Curated protein sequence database
SPTR: Comprehensive protein sequence database
Transfac: Transcription factor database
TrEMBL: Annotated translations of EMBL nucleotide sequences
Tumor gene database: Genes with cancer-causing mutations
WD repeats: WD-repeat family of proteins Protein Structure Databases: Cath: Protein structure classification
HIV Protease: HIV protease database 3D structure
PDB: 3-D macromolecular structure data
PSI: Protein structure initiative
S2F: Structure to function project
Scop: Structural Classification of Proteins Protein Domains, Motifs & Signatures: BLOCKS: Multipe aligned segments of conserved protein regions
CCD: Conserved domain database and search service
DOMO: Homologous protein domain families
Pfam: Database of protein domains and HMMs
ProDom: Protein domain database
Prints: Protein motif fingerprint database
Prosite: Database of protein families and domains
SMART: Simple molar architecture research tool
TIGRFAM: Protein families based on HMMs Others: Phospho Site: Database of phosphorylation sites
『陆』 蛋白质结构和功能多样性的直接和根本原因是什么
蛋白质多样性的直接原因是组成蛋白质的氨基酸的种类、数目、排列顺序不同,直接造成了形成的肽链折叠方式不一样,在肽链基础上的形成的蛋白质空间结构也就不一样,所以形成了蛋白质的多样性。
根本原因是由于基因的多样性和基因选择性表达。
蛋白质和多肽之间的界限并不是很清晰,有人基于发挥功能性作用的结构域所需的残基数认为,若残基数少于40,就称之为多肽或肽。要发挥生物学功能,蛋白质需要正确折叠为一个特定构型,主要是通过大量的非共价相互作用(如氢键,离子键,范德华力和疏水作用)来实现。
此外,在一些蛋白质(特别是分泌性蛋白质)折叠中,二硫键也起到关键作用。为了从分子水平上了解蛋白质的作用机制,常常需要测定蛋白质的三维结构。由研究蛋白质结构而发展起来了结构生物学,采用了包括X射线晶体学、核磁共振等技术来解析蛋白质结构。
(6)scop分类数据库扩展阅读:
蛋渗族渣白质的分子结构可划分为四级,以描述其不同的方面:
1、一级结构:组成蛋白质多肽链的线性氨基酸序列。
2、二级结构:依靠不同氨基酸之间的C=O和N-H基团间的氢键形成的稳定结构,主要为α螺旋和β折叠。
3、三级结构:通过多个二级结构元素在三维空间的排列所形成的一个蛋白质分子的三维结构。
4、四级结构:用于描述由不同多肽丛悄链(亚基)间相互作用穗郑形成具有功能的蛋白质复合物分子。
蛋白质设计的目标是通过计算机辅助的算法以生成符合目标蛋白质三维结构的氨基酸序列,经过漫长的进化,自然界已经筛选出了数量众多的蛋白质,但天然蛋白质只有在自然条件下才发挥最佳功能,这使得人们利用这些蛋白质受到了限制,因此需要对蛋白质进行改造使其能适应特定条件发挥特定的功能。蛋白质分子的设计分为3类:小改、中改和大改。