如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
第四节蛋白质三维结构预测假设待预测三维结构的目标蛋白质为U(Unknown),利用同源模型化方法建立结构模型的过程包括下述6个步骤:(1)搜索结构模型的模板(T)(2)序列比对(3)建立骨架(4)构建目标蛋白质的侧链(5)构建目标蛋白质的环区(6)优化模型构建目标蛋白质的侧链预测结果准确率:对于具有60%等同的序列,用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%,则预测结果将接近于实验得到的测试结果。一般如果序列的等同部分大于30%,则可以期望得到比较好的预测结果。2、线索化方法(折叠识别方法)有很多蛋白质具有相似的空间结构,但它们的序列等同部分小于25%,即远程同源。对于这类蛋白质,很难通过序列比对找出它们之间的关系,必须设计新的分析方法。对于一个未知结构的蛋白质(U),如果找到一个已知结构的远程同源蛋白质(T),那么可以根据T的结构模板通过远程同源模型化方法建立U的三维结构模型。一个远程同源模型化方法要解决三个问题:(1)检测远程同源蛋白质(T);(2)U和T的序列必须被正确地对比排列;(3)修改一般的同源模型化过程,以应用于相似度非常低的情况,即处理更多的环区,建立合理的三维结构模型。如何解决第一个和第二个问题?基本思想是建立一个从U到已知结构T的线索,并通过一些基于环境或基于知识的势,评价序列与结构的适应性。至于最后建立三维结构模型则是非常困难的线索化的主要思想:利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。线索化或者折叠识别的目标是为目标蛋白质U寻找合适的蛋白质模板,这些模板蛋白质与U没有显著的序列相似性,但却是远程同源的。线索化方法一般有5个基本组成部分:(1)已知三维折叠结构的数据库;(2)一种适合于进行序列-结构比对的三维折叠信息的表示方法;(3)一个序列-结构匹配函数,该函数对匹配程度进行打分;(4)建立最优线索的策略,或者是进行序列-结构比对的策略;(5)一种评价序列-结构比对显著性的方法。假设存在有限数目的核心折叠(corefolds)核心折叠实际上是构成蛋白质空间形状的基本模式。建立核心折叠数据库预测----建立线索一种基于序列与结构比对的最优线索化算法令:s1,s2,…,sn为蛋白质序列S的n个元素C1,C2,…,Cm为数据库中核心折叠C的m个核心区域Cij为第i个核心区域第j个氨基酸位置每一个核心区域由若干个氨基酸残基构成设t是一个从序列到核心折叠的线索,那么t说明了序列S的哪些元素si,sj,sk,…代表核心区域C1,C2,C3,…的起始位置。这实际上是一种从序列S到核心折叠C的比对令代表核心折叠C中的环到序列S中空位的映射,显然是通过线索化而确定的。令f(t)是进行比对的得分函数,其定义如下:f(t)=g1(v,t)+g2(u,v,t)+g3(,t)g1(v,t)评价氨基酸残基v所处的位置g2(u,v,t)评价残基u和v的相对位置,如果u和v键合,则得分高;g3(,t)评价环区,根据环区的大小进行打分。线索化问题:对于给定的序列S和核心折叠C,选择一个线索t,使得f(t)的值最小,即寻找一个从S到C的最佳映射。3、从头预测方法在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法,即(直接)仅仅根据序列本身来预测其结构。从头预测方法一般由下列3个部分组成:(1)一种蛋白质几何的表示方法由于表示和处理所有原子和溶剂环境的计算开销非常大,因此需要对蛋白质和溶剂的表示形式作近似处理。(2)一种势函数及其参数通过对已知结构的蛋白质进行统计分析确定势函数中的各个参数(3)一种构象空间搜索技术构象空间搜索和势函数的建立是从头预测方法的关键N端的氨基酸位于坐标系统的原点第二个氨基酸位于坐标的(1,0)或(1,0,0)处。基于疏水残基之间的接触进行打分每一个H和H的接触(非相邻残基)对能量的贡献都为-1最优的构象就是所有可能的构象中具有最多H和H接触的那个构象图中的二维和三维构象的得分都是-3绝对方向表示法:每一个位置上可选择的方向:上、右、左和下(U、R、L、D);而对于三维模型:上、右、左、下、后和前(U、R、L、D、B、F)。相对方向表示法:利用每个氨基酸残基主链的转动方向来表示每个位置上的残基的方向二维网格模型:每个残基位置上可选择的方向有三个左、右和前(L、R和F)三维网格模型:左、右、前、