A. IDS有许多不同类型的,都指哪些求大神帮助
IDS分类 IDS有许多不同类型的,以下分别列出: ●IDS分类1-Application IDS(应用程序IDS):应用程序IDS为一些特殊的应用程序发现入侵信号,这些应用程序通常是指那些比较易受攻击的应用程序,如Web服务器、数据库等。有许多原本着眼于操作系统的基于主机的IDS,虽然在默认状态下并不针对应用程序,但也可以经过训练,应用于应用程序。例如,KSE(一个基于主机的IDS)可以告诉我们在事件日志中正在进行的一切,包括事件日志报告中有关应用程序的输出内容。应用程序IDS的一个例子是Entercept的Web Server Edition。 ●IDS分类2-Consoles IDS(控制台IDS):为了使IDS适用于协同环境,分布式IDS代理需要向中心控制台报告信息。现在的许多中心控制台还可以接收其它来源的数据,如其它产商的IDS、防火墙、路由器等。将这些信息综合在一起就可以呈现出一幅更完整的攻击图景。有些控制台还将它们自己的攻击特征添加到代理级别的控制台,并提供远程管理功能。这种IDS产品有Intellitactics Network Security Monitor和Open Esecurity Platform。 ●IDS分类3-File Integrity Checkers(文件完整性检查器):当一个系统受到攻击者的威胁时,它经常会改变某些关键文件来提供持续的访问和预防检测。通过为关键文件附加信息摘要(加密的杂乱信号),就可以定时地检查文件,查看它们是否被改变,这样就在某种程度上提供了保证。一旦检测到了这样一个变化,完整性检查器就会发出一个警报。而且,当一个系统已经受到攻击后,系统管理员也可以使用同样的方法来确定系统受到危害的程度。以前的文件检查器在事件发生好久之后才能将入侵检测出来,是“事后诸葛亮”,最近出现的许多产品能在文件被访问的同时就进行检查,可以看做是实时IDS产品了。该类产品有Tripwire和Intact。 ●IDS分类4-Honeypots(蜜罐):关于蜜罐,前面已经介绍过。蜜罐的例子包括Mantrap和Sting。 ●IDS分类5-Host-based IDS(基于主机的IDS):这类IDS对多种来源的系统和事件日志进行监控,发现可疑活动。基于主机的IDS也叫做主机IDS,最适合于检测那些可以信赖的内部人员的误用以及已经避开了传统的检测方法而渗透到网络中的活动。除了完成类似事件日志阅读器的功能,主机IDS还对“事件/日志/时间”进行签名分析。许多产品中还包含了启发式功能。因为主机IDS几乎是实时工作的,系统的错误就可以很快地检测出来,技术人员和安全人士都非常喜欢它。现在,基于主机的IDS就是指基于服务器/工作站主机的所有类型的入侵检测系统。该类产品包括Kane Secure Enterprise和Dragon Squire。 ●IDS分类6-Hybrid IDS(混合IDS):现代交换网络的结构给入侵检测操作带来了一些问题。首先,默认状态下的交换网络不允许网卡以混杂模式工作,这使传统网络IDS的安装非常困难。其次,很高的网络速度意味着很多信息包都会被NIDS所丢弃。Hybrid IDS(混合IDS)正是解决这些问题的一个方案,它将IDS提升了一个层次,组合了网络节点IDS和Host IDS(主机IDS)。虽然这种解决方案覆盖面极大,但同时要考虑到由此引起的巨大数据量和费用。许多网络只为非常关键的服务器保留混合IDS。有些产商把完成一种以上任务的IDS都叫做Hybrid IDS,实际上这只是为了广告的效应。混合IDS产品有CentraxICE和RealSecure Server Sensor。 ●IDS分类7-Network IDS(NIDS,网络IDS):NIDS对所有流经监测代理的网络通信量进行监控,对可疑的异常活动和包含攻击特征的活动作出反应。NIDS原本就是带有IDS过滤器的混合信息包嗅探器,但是近来它们变得更加智能化,可以破译协议并维护状态。NIDS存在基于应用程序的产品,只需要安装到主机上就可应用。NIDS对每个信息包进行攻击特征的分析,但是在网络高负载下,还是要丢弃些信息包。网络IDS的产品有SecureNetPro和Snort。 ●IDS分类8-Network Node IDS(NNIDS,网络节点IDS):有些网络IDS在高速下是不可靠的,装载之后它们会丢弃很高比例的网络信息包,而且交换网络经常会防碍网络IDS看到混合传送的信息包。NNIDS将NIDS的功能委托给单独的主机,从而缓解了高速和交换的问题。虽然NNIDS与个人防火墙功能相似,但它们之间还有区别。对于被归类为NNIDS的个人防火墙,应该对企图的连接做分析。例如,不像在许多个人防火墙上发现的“试图连接到端口xxx”,一个NNIDS会对任何的探测都做特征分析。另外,NNIDS还会将主机接收到的事件发送到一个中心控制台。NNIDS产品有BlackICE Agent和Tiny CMDS。 ●IDS分类9-Personal Firewall(个人防火墙):个人防火墙安装在单独的系统中,防止不受欢迎的连接,无论是进来的还是出去的,从而保护主机系统。注意不要将它与NNIDS混淆。个人防火墙有ZoneAlarm和Sybergen。 ●IDS分类10-Target-Based IDS(基于目标的IDS):这是不明确的IDS术语中的一个,对不同的人有不同的意义。可能的一个定义是文件完整性检查器,而另一个定义则是网络IDS,后者所寻找的只是对那些由于易受攻击而受到保护的网络所进行的攻击特征。后面这个定义的目的是为了提高IDS的速度,因为它不搜寻那些不必要的攻击。
B. 如何用SQL语句向一个表中插入多行记录
insert一般是用来给表插入一条指定的列值的,但是,insert还存在另一种形式,可以利用它将一条select语句的结果插入表中。
这就是所谓的insert select,顾名思义,它是由一条insert语句和一条select语句组成的。假如你从另一张表中合并客户列表到你的Custumers表,不需要每次读取一行,然后再将它用insert插入,可以如下进行:
insert into Custumer(cust_id,
cust_cintact,
cust_name,
cust_email,
cust_address,
cust_country)
select cust_id,
cust_cintact,
cust_name,
cust_email,
cust_address,
cust_country
from CustNew;
(2)intact数据库扩展阅读
insert select中的列名为简单起见,这个例子在insert和select语句中使用了相同的列名,但是,不一定要求列名匹配。事实上,DBMS甚至不关心select返回的列名,它使用的是列的位置。
因此,select中的第一列(不管其列名)将用来填充表列中的指定的第一个列,第二列将用来填充表列中指定的第二个列,如此等等。
C. 如何使用string数据库预测蛋白质相互作用
蛋白质相互作用数据库见下表所示: 数据库名
BIND
DIP
IntAct
InterDom
MINT
STRING
HPRD
HPID
MPPI
蛋白质相互作用的预测方法很非常多,以下作了简单的介绍
1) 系统发生谱
这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。
2
2) 基因邻接
这个方法的依据是,在细菌基因组中,功能相关的基因紧密连锁地存在于一个特定区域,构成一个操纵子,这种基因之间的邻接关系,在物种演化过程种具有保守性,可以作为基因产物之间功能关系的指示。这个方法似乎只能适用于进化早期的结构简单的微生物。所以在人的蛋白质相互作用预测时不采用这个方法。
3) 基因融合事件
这个方法基于如下假定:由于在物种演化过程中发生了基因融合事件,一个物种的两个(或多个)相互作用的蛋白,在另一个物种中融合成为一条多肽链, 因而基因融合事件可以作为蛋白质功能相关或相互作用的指示。
4) 镜像树
这个方法的思想是,功能相关的蛋白质或同一个蛋白的域之间,受功能约束,其进化过程应该保持一致, 即呈现共进化(CO—evolution)特征,通过构建和比较它们的系统发育树,如果发现树的拓扑结构显示相似性,这种相似的树被称作镜像树,那么,可以推测建树基因的功能是相关的。
5) 突变关联
物理上相互接触的蛋白质, 比如处在同一个结构复合物中的蛋白质,其中一个蛋白质在进化过程中累计的残基变化,通过在另一个蛋白质中发生相应的变化予以补偿,这种现象被称作关联突变。
6)
序列信号关联
3
通过检查实验上已经证实的相互作用蛋白质对,发现序列特征信号
(sequence-signatures)在不同对的相互作用蛋白中重复地出现,这一现象被称作序列信号关联。利用序列域信号关联作为相互作用蛋白质的识别指示,可以预测未知功能蛋白与已知蛋白的相互作用,减少直接实验的搜索空间。
7) 保守的蛋白间相互作用
相互作用的蛋白质在物种演化过程中具有保守性,因此,可以通过在一个物种中建立的蛋白质相互作用网络,预测其它物种的蛋白质间相互作用。这是后基因组时代产生的一个分子进化概念,使人们联想到直系同源基因(orthologs)和平行同源基因(paralogs)两个概念。Walhout首先提出了”interologs”这个新概念,后由Matthews等利用酵母双杂交法分析了1195个酿酒酵母相互作用蛋白在线虫(C.elegans)中的保守性,获得了
16%-31%线虫保守相互作用蛋白,它们主要集中在核心代谢过程(core metabolic processes)并预期随着亲缘关系的远近,保守性作相应变化。
8) 同源结构复合物
设想三维结构已知的蛋白质复合物,各自的同家族成员以同样的方式发生相互作用.
9) 进化速率关联
蛋白质的进化速率由这个蛋白质同其它蛋白质发生相互作用的数量决定,并呈负相关,即相互作用的数量越多进化速率越低,而不是通常设想的蛋白质的进化速率由这个蛋白质对机体的重要性决定,这是一个极重要的概念。Fraser等13Ol利用一组实验上证实的酵母相互作用蛋白,量化分析了进化速率、适合度(fitness)和序列共进化(sequence CO—evolution)之间的关系;统计分析显示,在酵母蛋白质相互作用网络中,连接点越多的蛋白质进化速率进化越低,可能的原因是,这些蛋白质需要与更多的相互作用伴体(partner)共进化。
10) 共鸣识别模型MRRM预测蛋白质相互作用
从蛋白质一级结构预测蛋白质相互作用,它假设生物分子(包括蛋白质和DNA)之间的相互作用是通过共鸣能量的传递来实现的,RRM恰当地引入了一些蛋白质的物理参数,并且运用了信号分析方法(Digital Signal Analysis,DSP)使得对于蛋白质和基因的分析脱离了局部性。
11) 通过Domain相互作用来预测蛋白质相互作用
Domain是蛋白质最小的功能单元,它们之间的相互作用一定程度上就决定了蛋白质之间的相互作用。按照这个方法将所有的氨基酸序列进行聚类,如果类与类之间的相互作用的序列对的个数超过了一定阈值,则表示与两个类的代表序列同源的蛋白质之间都可能会发生相互作用。
12) 根据蛋白结构来预测蛋白相互作用
Lappe等人认为,虽然蛋白质之间的相互作用并不能直接用作预测,但是在结构上相似的蛋白质将有可能具有相似的功能,至少会给出一定的功能提示。分类的原则可按照SCOP给出的层次进行,分类方法是将已知序列的蛋白质相互作用对分别与SCOP的典型结构进行匹配,使之对应到每一个类中。预测已知与其他蛋白相互作用关系的蛋白的序列结构可以列出该蛋白结构组成的最大可能情况。
D. MySQL如何复制表中的一条记录并插入
1、打开navicat软件,打开要复制表的数据库,如下图所示:
E. 什么是“人胎脑文库”及
Bax Inhibitor�1与Herp的相互作用
中国生物工程杂志China Biotechnology, 2005, 25(11):16~20
李斌元1何淑雅1**王桂良1马云1肖卫纯1李洁1
孙春丽1闵凌峰1虞佳1Nanbert Zhong2
(1 南华大学生物化学与分子生物学研究室衡阳4210012 纽约州立基础研究所人类遗传研究室纽约NY10314)
摘要应用酵母双杂交技术筛选Herp的相互作用蛋白。构建编码Herp的基因HERPUD1真核表达载体HERPUD1�plexA,应用MATCHMAKER LexA酵母双杂交系统筛选人胎脑cDNA文库,获得的阳性克隆的插入子为Herp的候选相互作用蛋白质,将Herp与筛选到的相互作用蛋白再一对一回复进行酵母双杂交实验,去除假阳性。对阳性克隆插入子的DNA序列测序,在GenBank中作匹配及生物信息学分析。结果得到其中1个阳性克隆的插入子序列与TEGT基因序列一致,编码蛋白为Bax inhibitor�1。得出结论:Herp与Bax inhibitor�1相互作用,Bax inhibitor�1具有调节凋亡特性,提示Herp可能参与凋亡调节。
关键词神经病学神经元蜡样脂褐质沉积症蛋白质相互作用酵母双杂交Herp
Bax inhibitor�1
收稿日期:2005�05�17修回日期:2005�07�22
*国家自然科学基金资助项目(30370795)
** 通讯作者,电子信箱:[email protected]神经元蜡样脂褐质沉积症 (neuronal ceroid lipofuscinoses, NCLs)是一组人类进行性神经元变性疾病,多为常染色体隐性遗传。临床上以快速的视力恶化、癫痫发作、进行性智力障碍、运动失调和行为变化为主要特征〔1〕。NCLs至少可分为10种疾病亚型。共同病理特征主要为溶酶体内蜡样脂褐质以颗粒状、曲线状、指纹状、直线状和混合状样沉积,导致以神经细胞和视网膜细胞为主的细胞凋亡。细胞中溶酶体水解酶出现生化异常,线粒体ATP酶的亚基C在多型NCLs中显著沉积,另外,在沉积的脂褐质中还可以发现磷脂、中性脂质、2�磷酸多萜醇低聚糖和其他物质,包括金属和蛋白质等〔2〕。根据溶酶体蛋白酶基因缺陷和结构蛋白的功能失调〔3〕,这组神经变性疾病被认为是一种新的溶酶体脂褐质沉积疾病。目前,已经鉴定了6个致病基因(CLN1~3,5,6,8),所致疾病分别为NCL1~3,5,6,8〔4,5〕。CLN3编码的Battenin蛋白被认为是跨膜蛋白〔6,7〕。Battenin存在于溶酶体和线粒体中,其功能尚不清楚。Zhong等〔8~10〕研究发现Herp能与Battenin相互作用,Herp是定位于内质网的高半胱氨酸应答的类似泛素的区域构件蛋白1,编码该蛋白的基因为HERPUD1,其主要功能也不清楚。
本研究采用MATCHMAKER LexA 双杂交系统(MATCHMAKER LexA Two�Hybrid System),以基因HERPUD1的编码序列(coding sequence)为诱饵(t),从人胎脑cDNA文库筛选与Herp有相互作用的蛋白质,以研究Herp的功能,探讨编码该蛋白的基因HERPUD1的调节机制,为研究NCLs发病的分子机理提供依据。
1材料与方法1.1材料
胎脑MATCHMAKER LexA cDNA文库,MATCHMAKER LexA酵母双杂交系统,酵母SD培养基,SD/�Trp培养基,SD/�Ura, SD/�Ura/His, SD/�Ura/�His�Trp , SD/�Ura/His�Trp/�Leu培养基,X�α�gal等购自Clontech公司;半乳糖(Gal),棉子糖(Raf),醋酸锂等购自Sigma公司; QIAGEN Plasmid Mega Kit 购自 QIAGEN公司;kc8大肠杆菌,EGY48(p8op�lacZ),HERPUD1基因序列由美国纽约州立发育不全研究所Nanbert Zhong博士惠赠,其它化学试剂均为国内购买。测序公司为上海生工生物工程技术服务有限公司。
1.2方法
1.2.1诱饵质粒pLexA�HERPUD1的构建PCR扩增HERPUD1编码区,正反向引物分别为5′�TTCGAATTC
ATGGAGTCCGAGACCGAACC�3′, 5′�GGTGAATTCGTT
TGCGATGGCTGGGGGGCCTTC�3′,HERPUD1插入T载体,T� HERPUD1与pLexA分别用EcoRI酶切,低熔点琼脂糖回收目的带,用T4 DNA连接酶将HERPUD1插入pLexA。用pLexA的5′和3′端载体臂引物测序,证实插入子HERPUD1读码框正确、无碱基突变。
1.2.2人胎脑文库扩增及质粒DNA的提取Human Fetail Brain MATCHMAKER cDNA文库构建于pB42AD质粒载体,文库独立克隆数(cfu)是3.5×106。根据滴度和独立克隆数计算所需文库原始菌液体积和铺皿个数。液体培养液(Amp+)稀释文库原始菌液,铺于150mm的LB皿(Amp+),共铺皿80个。37℃培养12h,根据克隆的生长数计算文库滴度。每皿加LB培养液10ml,刮下菌落,收集于锥形瓶中。用QIANGEN Plasmid Mega Kit 抽提质粒,置-20℃保存待用。
1.2.3诱饵质粒的毒性和自激活性检测采用小规模共转化法,Bait质粒(pLexA�HERPUD1)与pB42AD共转EGY48(p8op�LacZ),铺于SD�HTU+X�α�gal皿,30℃倒置培养4~6d。如Bait有毒性则无菌落生长,有自激活性,则菌落成蓝色,否则为白色。
1.2.4Bait质粒+EGY48(p8op�LacZ)融合菌株的建立小量分步转化法将已经构建的Bait质粒pLexA�HERPUD1全部转化EGY48(p8op�LacZ)储备待用。
2005, 25(11)李斌元 等:Bax Inhibitor�1与Herp的相互作用
中国生物工程杂志 China Biotechnology Vol.25 No.11 2005
1.2.5文库的转化与筛选制备酵母菌(已经转化pLexA�HERPUD1表达质粒)感受态,醋酸锂法转入文库质粒,铺于SD /� Ura/�His�Trp,培养 4~6d。刮取菌液铺于SD/� Ura/�His/�Trp/�Leu/Raf/Gal,培养4~6d,X�gal滤膜分析克隆变为蓝色者初步认为是阳性克隆(设为pB42AD�Y)。
1.2.6阳性克隆质粒的分离抽提阳性酵母克隆质粒,电转化至大肠杆菌kc8中,在M9/Amp+/Trp�培养基上筛选分离得到靶质粒。
1.2.7重建Herp和相互作用蛋白的相互关系消除假阳性按相互作用重建阳性和阴性对照的4组合:(1)pLexA�HERPUD1+pB42AD�Y;(2)pB42AD�Y自激活性检测:pLexA + pB42AD�Y ;(3)相互作用阳性对照pLexA�Pos+ pB42AD�T;(4)相互作用阴性对照pLexA�Lam+pB42AD。初步验证其相互作用,其中再次变蓝色者进行测序。
1.2.8相互作用蛋白基因Y的DNA测序和生物信息学分析以pB42AD的5′端和3′端载体臂引物测序,对重建相互作用仍为阳性的pB42AD�Y测序,测序结果在互联网上与NCBI GenBank,EMBL等生物信息数据库做BLAST分析,应用GCG软件分析可能的阅读框。
2结果2.1诱饵质粒的验证
pLexA�HERPUD1转化大肠杆菌DH5α培养后提取质粒,对质粒进行PCR扩增,产生约925bp的条带(图1),经EcoRI酶切,也产生约925bp的条带(图2)。
图1pLexA�HERPUD1 PCR产物电泳图
Fig. 1Electrophoretic map of PCR proct
of pLexA�HERPUD 1
1: Proct of PCR; M: 200bp DNA step ladder DNA marker
图2pLexA�HERPUD1经EcoRI酶切产物电泳图
Fig. 2Electrophoretic map of proct of
pLexA�HERPUD 1 by EcoRI digestion
M:Lambda DNA/EcoRI+HindIII marker;1: pLexA�HERPUD1;
2: pLexA;3: Proct of pLexA�HERPUD1 digested by EcoRI
pLexA�HERPUD1测序结果证实诱饵质粒的插入子无突变、阅读框正确。测序结果见图3。
2.2阳性克隆的DNA测序及生物信息学分析
对反复检测Leu和LacZ 2个报告基因呈阳性表达的1个相互作用蛋白克隆DNA测序,测序获得680bp序列(图4),在GenBank做BLAST分析,发现与TEGT基因的序列一致,GCG软件分析编码区读框正确,TEGT基因编码蛋白为Bax inhibitor�1,生物信息学分析Bax inhibitor�1是一种基因增强转录因子,与BCL2和BCL�X相互作用,调节细胞凋亡。图3pLexA�HERPUD1融合质粒部分序列
Fig. 3Partial sequence of pLexA�HERPUD1 fusion plasmid
图4从人胎脑cDNA文库筛选得到的一个阳性克隆质粒的插入子DNA部分测序结果
Fig. 4Partial sequencing result of one positive clone screened from the human fetal cDNA library
3讨论NCLs是一组致死性疾病,目前尚无有效的治疗方法。了解CLN基因及其编码蛋白的功能,对阐明病理、遗传及发病的分子机制具有重要意义。目前已知NCLs至少由8种不同的基因(CLN1~8)发生突变引起。青少年型(JNCL,NCL3)的致病基因为CLN3。CLN3编码蛋白Battenin位于溶酶体膜,为溶酶体必需的膜糖蛋白,参与哺乳动物细胞溶酶体pH的调节并且具有营养神经作用〔11〕。Herp是Battenin的相互作用蛋白质,Sai等〔12〕发现Herp与早老素(presenilin)相互作用,增加淀粉β蛋白(amyloid beta�protein,Abeta)的退化,说明Herp与细胞生长发育相关,因此研究Herp的功能对阐明NCLs的发病机理有重要意义。
体内许多生化反应及代谢过程都存在蛋白质与蛋白质之间的相互作用,蛋白质之间的互作在生命过程中起着极其重要的作用,本研究应用酵母双杂交体系筛选得到一个与Herp相互作用的蛋白——Bax inhibitor�1,经查阅相互作用蛋白数据库IntAct和DIP,发现它是一种新的Herp互作蛋白。Chae等〔13〕研究发现Bax inhibitor�1调节与内质网应激相关的凋亡途径,在内质网诱导的凋亡中通过抑制Bax活化和线粒体移位介导保护、稳定线粒体膜电压,抑制Caspase活化。Bax inhibitor�1是一个进化保守的内质网蛋白,是一种凋亡调节因子,与BCL2(B细胞淋巴瘤/白血病�2)和BCL�X (B细胞淋巴瘤/白血病�X)相互作用,BCL2和BCL�X这2种基因是凋亡相关基因,Herp能与Bax inhibitor�1相互作用,提示Herp与凋亡调节相关。NCLs是一种神经元退行性病变,Herp、Bax inhibitor�1、BCL2、BCL�X在NCLs的发病过程中通过相互协调或拮抗促进神经细胞凋亡或死亡,但其中具体机制,如基因表达调控网络、细胞信号传导通路的改变、细胞离子的具体变化等机制仍需进一步探索。参考文献
〔1〕 Wisniewski K E, Kida E, Connell F, et al. Neuronal ceroid lipofuscinoses: research update. Neurol Sci, 2000, 21(Suppl): 49~56
〔2〕 Prasal V V, Pullarkat R K. Brain lysosomal hydrolases in neuronal ceroid lipofuscinoses. Mol Chem Neuropathol, 1996,29(2�3):169~179
〔3〕 Mole S, Zhong N, Sarpong A, et al. New mutations in the neuronal ceroid lipofuscinosis genes. Eur J Pediatr Neurol, 2001,5 (Suppl):7~10
〔4〕 Goebel H H. The neuronal ceroid lipofuscinosis. J Child Neurol,1995,10:424~437
〔5〕 Mole S E. The genetic spectrum of human neuronal ceroid lipofuscinoses. Brain Pathol, 2004, 14(1):70~76
〔6〕 Sohar I, Sleat D E, Jadot M, et al. Biochemical characterization of a lysosomal protease deficient in classical late infantile neuronal ceriod lipofuscinoses(LINCL) and development of an enzyme�based assay for diagnosis and exclusion of LINCL in human specimens and animal models. J Neurochem, 1997,73:700~711
〔7〕 Ranta S, Savukoski M, Santavuori P, et al. Studies of homogenous populations∶CLN5 and CLN8. Adv Genet, 2001,45:123~140
〔8〕 Zhong N, Ju W, Moroziewicz D N, et al. Molecular pathogenic studies of Batten disease: identification and charaterization of Battenin�interactive proteins (Herp). J Mol Diag, 1999,1(1):G23
〔9〕 Zhong N, Ju W, Moroziewicz D, et al. Prenatal diagnostic testing for infantile and late\|infantile neuronal ceroid lipofusinoses(NCL) using allele specific primer extension(ASPE). Journal of Peking University(Health Sciences), 2005,37(1):20~25
〔10〕 Zhong N, Ju W, Moroziewicz D, et al. Finding of Battenin�interactive protein (BIP) may lead to understanding the pathogenic mechanism for neuronal ceroid lipofuscinoses. Genet Med, 2001, 3(3):140
〔11〕 Puranam K L ,Guo W X, Qian W H,et al. CLN3 defines a novel antiapototic pathway operative in neurodegeneration and mediated by ceramide. Mol Genet Metab, 1999, 66:294~308
〔12〕 Sai X, Kokame K, Shiraishi H, et al. The ubiquitin�like domain of Herp is involved in Herp degradation, but not necessary for its enhancement of amyloid beta�protein generation. FEBS Lett, 2003,553(1�2):151~156
〔13〕 Chae H J, Kim H R, Xu C, et al. BI�1 regulates an apoptosis pathway linked to endoplasmic reticulum stress. Mol Cell, 2004,15(3):355~366
Screening and Bioinformatic Analysis of the Proteins Interacting With Herp
LI Bin�yuan1HE Shu�ya1WANG Gui�liang1MA Yun1XIAO Wei�chun1
LI Jie1SUN Chun�li1MIN Ling�feng1YU Jia1Nanbert Zhong2
(1 Department of Biochemistry and Molecular Biology, Nanhua UniversityHengyang421001, China)
(2 Department of Human Genetics, New York State Institute for Basic ResearchNew YorkNY10314, USA )
AbstractThe aim is to screen the interactive proteins of Herp by yeast two hybrid system. The eukaryotic expression vector,pLexA HERPUD1, was constructed, MATCHMAKER LexA was used to screen the human fetal cDNA library, and the inserts of positive clones were regarded as the candidate interactive proteins of Herp. The yeast two hybrid was repeated to screen the proteins and remove the false positive clones. One positive inserted fragment is accordant with the sequence of TEGT which codes Bax inhibitor�1. Herp interacts with Bax inhibitor�1 with the characteristic of regulating apoptosis, hinting that Herp is involved in regulating apoptosis.
Key wordsNeurologyNeuronal ceroid lipofuscinosesProtein interactionYeast two hybrid systemHerpBax inhibitor�1
F. 网上的生物信息学资源都有哪些
生物信息资源简介
生物信息(bioinformatics)中的“信息(-informatics)”指的是从海量的数据中进行挖掘,从而得到知识的过程,如下图所示。在这个过程中,会涉及到数据的管理,数据的运算,数据挖掘和建模仿真。其中,数据管理部分主要是数据库(database),数据的运算部分主要是指各种生物信息的软件(software tools)。这两部分是生物信息研究非常重要的资源,也是生信入门需要了解的基础知识。下面简要介绍一下这些资源。(本文根据北京大学生物信息学公开课程视频整理,图片来自视频截图)
根据不同的特点,可以把这些资源分成不同的类别。比如根据数据性质可以将database分为原始数据(Original data)数据库和二级数据(Secondary data)数据库。再比如根据软件是独立的工具还是网络服务器,可以将software tools分为standalone programs和web servers。
根据发布者的类别可以分为centralized resources和indivial resources。比较大的centralized resources主要有NCBI(National Center for Biotechnology Information), EBI(European Bioinformatics Institute)和UCSC(University of California Santa Cruz)Genome Browser。下面将分别介绍这三个最大的数据库以及其他的生物信息学数据资源。
1.NCBI简介
NCBI-Genome Database:
存储了目前绝大多数的被测序出来的基因组,目前有1000+基因组被测序出来。
NCBI-Nucleotide/protein (RefSeq):
将不同的版本作了整合之后的参考序列。其中NM_*表示核酸序列,NP_*表示蛋白序列。其中核酸给出了ID号,名称,物种,特征,编码区,序列等信息。蛋白还给出了功能区间信息。
NCBI-Gene:
以基因为单位,整合了pathway、variations、phenotype等信息。
对于Human genes而言,GeneCards比NCBI有更好的对人类基因、蛋白的注释(表达、相互作用、同源蛋白、功能、遗传变异等)。
NCBI-SRA
新一代测序技术的短序列database,每5个月数据就会翻倍。
NCBI-Taxonomy
把所有至少有一个基因被测序过的物种做的物种分类树,在所有被描述过的物种中有10%被测序过。
NCBI-PubMed
用于查阅文献。
NCBI-MeSH
(Medical Subject Heading)controlled vocabulary used for indexing articles for PubMed 结构化的词库。
NCBI-My NCBI
对于感兴趣的关键词,在NBCI设定之后,每周会推送相关文献,对于项目中跟踪文献非常有用。
NCBI-BLAST
NCBI最著名的工具,关于BLAST的两篇文章已经被引用了四万两千多次。不同版本的BLAST包括:
Online:NCBI-BLAST
Standalone:BLAST+
Embedded in webpage:wwwblast
2. EBI简介
EBI中的一些资源如表中所示:
EBI-Ensembl:
介于NCBI和UCSC之间的资源,整合很多物种的不同的资源。Ensembl中数量的类型包括:
EBI-UniProtKB
The Universal Protein Resource (UniProt) is a comprehensive resource for protein sequence and annotation data.
(The UniProt Knowledgebase (UniProtKB) is the central hub for the collection of functional information on proteins, with accurate, consistent and rich annotation. )
UniProtKB -Swiss-Prot(已经过人工校对)
UniProtKB -TrEMBL(无人工校对)
EBI-IntAct
分子之间相互作用
EBI-Clustal Omega
多序列比对
EBI-InterProScan
输入一个序列,看是否包含目前已经知道功能的蛋白的区域
3 UCSC简介
以基因组为坐标。包含很多的track,包括:SNP,mRNA,剪切的EST,没剪切的EST,高通量的,通过Chi
G. GBase 8a数据库通过LOAD方式加载时,如果出现功能报错,如何排查
前提参数设置
// 默认值是3,这个是session级别的,无需恢复
gbase> set gcluster_log_level=7;
Query OK, 0 rows affected (Elapsed: 00:00:00.00)
// 默认值是0,建议先show一下原始值,排查完了记得改回去。
gbase> set global gbase_sql_trace_level=15;
Query OK, 0 rows affected (Elapsed: 00:00:00.12)
// 默认值是0,这个是session级别,无需恢复
gbase> set gbase_sql_trace=1;
Query OK, 0 rows affected (Elapsed: 00:00:00.01)
执行语句
gbase> load data infile ‘ftp://gbase:[email protected]/t1.txt’ into table testdb.t1;
Query OK, 4 rows affected (Elapsed: 00:00:00.35)
Task 394392 finished, Loaded 4 records, Skipped 0 records
查看日志
/opt/gbase/gcluster/log/gcluster/express.log
# SQL处于check permission状态
# 获得表的锁
# 如果长时间无法拿到锁,通过gcadmin showlock 看看对应的表的锁在哪个节点哪个ID持有
2019-07-03 15:02:41.352 [LOCK][INFO ][S:2108][Q:13221]:acquired WRITE lock: testdb.t1580D5F90-B287-4199-B057-E6FBD44B5BFA, lwp:35693
2019-07-03 15:02:41.352 [LOCK][INFO ][S:2108][Q:13221]:acquired READ lock: testdb.t1, lwp:35693
2019-07-03 15:02:41.353 [LOCK][INFO ][S:2108][Q:13221]:acquired READ lock: testdb.t1.rsync, lwp:35693
# 读取数据源ftp文件信息
# 检查数据库和FTP之间的性能问题,包括网络和FTP服务器的设置
2019-07-03 15:02:41.354 [LOAD][INFO ][S:2108][Q:13221]:Start cluster load
2019-07-03 15:02:41.358 == Information : Trying 192.168.163.100...
2019-07-03 15:02:41.362 == Information : Connected to 192.168.163.100 (192.168.163.100) port 21 (#0)
2019-07-03 15:02:41.370 <= Recv header : 220 (vsFTPd 3.0.2)
2019-07-03 15:02:41.371 => Send header : USER gbase
2019-07-03 15:02:41.371 <= Recv header : 331 Please specify the password.
2019-07-03 15:02:41.371 => Send header : PASS gbase1234
2019-07-03 15:02:41.419 <= Recv header : 230 Login successful.
2019-07-03 15:02:41.419 => Send header : PWD
2019-07-03 15:02:41.419 <= Recv header : 257 "/home/gbase"
2019-07-03 15:02:41.419 == Information : Entry path is '/home/gbase'
2019-07-03 15:02:41.419 => Send header : TYPE I
2019-07-03 15:02:41.419 == Information : ftp_perform ends with SECONDARY: 0
2019-07-03 15:02:41.420 <= Recv header : 200 Switching to Binary mode.
2019-07-03 15:02:41.420 => Send header : SIZE t1.txt
2019-07-03 15:02:41.420 <= Recv header : 213 8
2019-07-03 15:02:41.420 => Send header : REST 0
2019-07-03 15:02:41.420 <= Recv header : 350 Restart position accepted (0).
2019-07-03 15:02:41.421 == Information : Remembering we are in dir ""
2019-07-03 15:02:41.421 == Information : Connection #0 to host 192.168.163.100 left intact
2019-07-03 15:02:41.422 == Information : Trying 192.168.163.100...
2019-07-03 15:02:41.422 == Information : Connected to 192.168.163.100 (192.168.163.100) port 21 (#0)
2019-07-03 15:02:41.424 <= Recv header : 220 (vsFTPd 3.0.2)
2019-07-03 15:02:41.424 => Send header : USER gbase
2019-07-03 15:02:41.425 <= Recv header : 331 Please specify the password.
2019-07-03 15:02:41.425 => Send header : PASS gbase1234
2019-07-03 15:02:41.465 <= Recv header : 230 Login successful.
2019-07-03 15:02:41.465 => Send header : PWD
2019-07-03 15:02:41.465 <= Recv header : 257 "/home/gbase"
2019-07-03 15:02:41.465 == Information : Entry path is '/home/gbase'
2019-07-03 15:02:41.465 => Send header : TYPE I
2019-07-03 15:02:41.465 == Information : ftp_perform ends with SECONDARY: 0
2019-07-03 15:02:41.465 <= Recv header : 200 Switching to Binary mode.
2019-07-03 15:02:41.465 => Send header : SIZE t1_2.txt
2019-07-03 15:02:41.466 <= Recv header : 213 8
2019-07-03 15:02:41.466 => Send header : REST 0
2019-07-03 15:02:41.466 <= Recv header : 350 Restart position accepted (0).
2019-07-03 15:02:41.466 == Information : Remembering we are in dir ""
2019-07-03 15:02:41.466 == Information : Connection #0 to host 192.168.163.100 left intact
#准备分派任务
2019-07-03 15:02:41.467 [LOAD][INFO ][S:2108][Q:13221]:AddNodeLoadFileNum host[::ffff:192.168.163.101]add num [1].
2019-07-03 15:02:41.474 [LOCK][INFO ][S:2108][Q:13221]:unlocked: testdb.t1
2019-07-03 15:02:41.474 [LOCK][INFO ][S:2108][Q:13221]:acquired WRITE lock: testdb.t16ef6f8a9-87f0-4d6c-8043-899367d02df3, lwp:35693
2019-07-03 15:02:41.475 [LOAD][INFO ][S:2108][Q:13221]:AddNodeLoadFileNum cur node state:[ip:::ffff:192.168.163.100:num:0][ip:::ffff:192.168.163.101:num:1].
# 此时SQL已经在loading状态,
# 开始下发任务。一般是某个节点性能导致,或者数据非常倾斜。
# a) 可以测试从每个数据库的数据节点,用ftp直接获取数据文件的性能
# 比如 curl ftp://XXXXX/XX.csv > 1.txt
# 多跑几次,看看哪个节点比较慢
# b) 排查机器的内存是否出现SWAP, 操作系统/var/log/messages是否有磁盘报错
# c) 查看CPUINFO是否有异常降频
# d) 用top、iotop、nmon等工具观察一段时间系统资源,是否有资源紧张
#
2019-07-03 15:02:41.476 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:set scn = 395447.
2019-07-03 15:02:41.521 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:LOAD DATA INFILE 'ftp://gbase:*********@192.168.163.100/t1.txt#offset=0&length=8&firstblock&ffsize=8,ftp://gbase:*********@192.168.163.100/t1_2.txt#offset=0&length=8&firstblock&ffsize=8' INTO TABLE `testdb`.`t1_n1` DATA_FORMAT 3 FILE_FORMAT UNDEFINED HOST '::ffff:192.168.163.101' CURRENT_TIMESTAMP 1562137361 SCN_NUMBER 395447 GCLUSTER_PORT 5258 INTO SERVER (HOST '::ffff:192.168.163.100, ::ffff:192.168.163.101', PORT '5050', USER 'root', DATABASE 'testdb', TABLE 't1_n1, t1_n2', COMMENT 'table_host 0 1 0 # 1 0 1, scn 395447, group -1').
2019-07-03 15:02:42.004 [LOAD][INFO ][S:2108][Q:13221]:ReceNodeLoadFileNum host[::ffff:192.168.163.100] rece num [0].
2019-07-03 15:02:42.004 [LOAD][INFO ][S:2108][Q:13221]:ReceNodeLoadFileNum host[::ffff:192.168.163.101] rece num [1].
2019-07-03 15:02:42.004 [LOAD][INFO ][S:2108][Q:13221]:ReceNodeLoadFileNum cur node state:[ip:::ffff:192.168.163.100:num:0][ip:::ffff:192.168.163.101:num:0].
2019-07-03 15:02:42.004 [LOAD][INFO ][S:2108][Q:13221]:Task 395447 finished, Loaded 8 records, Skipped 0 records
# 拿到排它锁,要切换版本了。
2019-07-03 15:02:42.008 [LOCK][INFO ][S:2108][Q:13221]:acquired WRITE lock: testdb.t1.09B5BEEC-1EF7-4FA6-9850-C4217A781E0F, lwp:35693
# 设置SCN
2019-07-03 15:02:42.008 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:SET SELF SCN = 395447.
2019-07-03 15:02:42.009 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:SET SELF SCN = 395447.
2019-07-03 15:02:42.009 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:SET SELF SCN = 395447.
2019-07-03 15:02:42.009 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:SET SELF SCN = 395447.
# 以指定的SCN来刷新数据
2019-07-03 15:02:42.011 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:flush commit "testdb"."t1_n1" scn_number 395447.
2019-07-03 15:02:42.011 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:flush commit "testdb"."t1_n2" scn_number 395447.
2019-07-03 15:02:42.019 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:flush commit "testdb"."t1_n2" scn_number 395447.
2019-07-03 15:02:42.055 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:flush commit "testdb"."t1_n1" scn_number 395447.
# 验证SCN
2019-07-03 15:02:42.060 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:select scn from information_schema.tables where table_schema = 'testdb' and table_name = 't1_n1'.
2019-07-03 15:02:42.061 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:select scn from information_schema.tables where table_schema = 'testdb' and table_name = 't1_n1'.
2019-07-03 15:02:42.061 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:select scn from information_schema.tables where table_schema = 'testdb' and table_name = 't1_n2'.
2019-07-03 15:02:42.061 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:select scn from information_schema.tables where table_schema = 'testdb' and table_name = 't1_n2'.
2019-07-03 15:02:42.063 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:set autocommit=1.
2019-07-03 15:02:42.063 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:set autocommit=1.
2019-07-03 15:02:42.063 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.100, SQL:set autocommit=1.
2019-07-03 15:02:42.063 [SQLDISP][INFO ][S:2108][Q:13221]:Target:::ffff:192.168.163.101, SQL:set autocommit=1.
# SQL处于commit阶段 或者 rollback阶段
# 提交commit成功
2019-07-03 15:02:42.067 [COMMIT][INFO ][S:2108][Q:13221]:commit table(testdb.t1) success for scn:395447.
2019-07-03 15:02:42.068 [LOAD][INFO ][S:2108][Q:13221]:successful to cluster load
# 释放锁
2019-07-03 15:02:42.068 [LOCK][INFO ][S:2108][Q:13221]:unlocked: testdb
2019-07-03 15:02:42.069 [LOCK][INFO ][S:2108][Q:13221]:unlocked: testdb.t1.09B5BEEC-1EF7-4FA6-9850-C4217A781E0F
2019-07-03 15:02:42.070 [LOCK][INFO ][S:2108][Q:13221]:unlocked: testdb.t1.rsync
2019-07-03 15:02:42.071 [LOCK][INFO ][S:2108][Q:13221]:unlocked: testdb.t1580D5F90-B287-4199-B057-E6FBD44B5BFA
2019-07-03 15:02:42.072 [LOCK][INFO ][S:2108][Q:13221]:unlocked: testdb.t16ef6f8a9-87f0-4d6c-8043-899367d02df3