序列特征分析Analysis of Sequence Characterristics
一、蛋白质结构蛋白质的一级结构
蛋白质的一级结构决定二级结构 蛋白质的二级结构决定三级结构
蛋白质的二级结构
H表示螺旋
E表示折叠
B表示β桥
G表示3-螺旋S代表转向
I表示π螺旋
T表示氢键转角
蛋白质空间结构
蛋白质分子只有处于它自己特定的空间结构情况下,才能获得 它特定的生物活性,空间结构稍有破坏,就很可能会导致蛋白 质生物活性的降低甚至丧失,因为它们的特定的结构允许它们 结合特定的配体分子。
对DNA序列和蛋白质序列进行序列特征分析, 能够使我们从分子层次上了解基因的结构特点,
了解与基因表达调控相关的信息,了解DNA序列与蛋白质序列之间的编码,了解蛋白质序列与蛋白
质空间结构之间的关系和规律,为进一步研究了解蛋白质功能与蛋白质结构之间的关系提供理论
依据。
二、蛋白质序列特征分析基本假设:蛋白质的空间结构由蛋白质序列所决定。 即我们可以根据蛋白质序列预测蛋白质结构。
复杂程度远高于对DNA序列的分析
1、蛋白质的理化性质蛋白质是由氨基酸组成的大分子化合物,对组成蛋白质的氨基酸进行理化性质的统计分析是对一 个未知蛋白质进行分析的基础。蛋白质的理化性质 包括蛋白质的分子量、氨基酸的组成、等电点、消 光系数、亲水性和疏水性、跨膜区、信号肽、翻译
后修饰位点等。
利用PROTPARAM分析蛋白质的理化性质ExPASy(Expert Protein Analysis System)是由瑞士生 物信息学中心维护,并与欧洲生物信息学中心(EBI)及蛋 白质信息资源(protein in formation resource,PIR)组成 Universal Protein Knowledgebase联盟。ExPASy数据库提供 了一系列蛋白质理化分析工具,以便于检索未知蛋白质的理 化性质,并基于这些理化性质鉴别未知蛋白质的类别,为后 续实验提供帮助。其中ProtParam(physico-chemical parameters of a protein sequence )就是计算氨基酸理化参 数常用的在线工具。 其网址为: /tools/protparam.html
PROTPARAM在线页面
用PROTPARAM分析G00016序列理化性质的结果
2、蛋白质的亲水性或疏水性蛋白质的基本组成单元是氨基酸。氨基酸通常被分为三类:
1. 疏水氨基酸(hydrophobic amino acid),其侧链大部分 或者全部由碳原子和氢原子组成,因此这类氨基酸不太可 能与水分子形成氢键; 2. 极性氨基酸(polar amino acid),其测链通常由氧原子或 氮原子组成,它们比较容易与水分子形成氢键,因此也称 为亲水氨基酸; 3. 带电氨基酸(charged amino acids),这类氨基酸在生物 pH环境中带有正电或负电。
蛋白质的亲水性或疏水性氨基酸的
亲疏水性是构成蛋白质折叠的主要驱 动力,一般通过亲水性分布图(hydropathy profile)
反映蛋白质的折叠情况。蛋白质折叠时会形成疏水内核和亲水表面,同时在潜在跨膜区出现高疏水值 区域,据此可以测定跨膜螺旋等二级结构和蛋白质
表面氨基酸分布。
利用PROTSCALE分析蛋白质的亲水性或疏水性ExPASy的ProtScale程序是计算蛋白质亲疏水性分析的在线工具。 其网址为: /tools/protscale.html
PROTSCALE在线页面
提供了57种 标度
用PROTSCALE分析P02699序列疏水性结果的图形显示高疏水区域
高亲水区域
HOHOB./KYTE & DOOLITTLE标度
括号内为原标度值,括号外为标准化的标度值
用WINDOW SIZE=13时计算窗口内每个 位置上氨基酸的标度权值
3、蛋白质的跨膜区生物膜所含的蛋白质叫膜蛋白,是生物膜功能的主要承 担者。根据蛋白质分离的难易及在膜中分布的位臵,膜蛋白 基本可分为两大类:外在膜蛋白和内在膜蛋白。 外在膜蛋白约占膜蛋白的20%~30%,分布在膜的内外 表面,主要在内表面,为水溶性蛋白,它通过离子键、氢键 与膜脂分子的极性头部相结合,或通过与内在蛋白质的相互 作用间接与膜结合; 内在膜蛋白约占膜蛋白的70%~80%,是双亲媒性分子, 可不同程度的嵌入脂双层分子中。有的贯穿整个脂双层,两 端暴露于膜的内外表面,这种类型的膜蛋白又称跨膜蛋白。
蛋白质的跨膜区内在膜蛋白露出膜外的部分含较多的极性氨基酸,属 亲水性,与磷脂分子的亲水头部邻近;嵌入脂双层内部的 膜蛋白由一些非极性的氨基酸组成,与脂质分子的疏水尾 部相互结合,因此与膜结合非常紧密。所以,对膜蛋白的 跨膜区进行预测是生物信息学的重要应用。