跳到主要内容

话题

同步科学

同步科学

蛋白质晶体学:3-D中的人类基因组

01 May 1998

在Synchrotron辐射源的X射线晶体中的最新进展和良好质量的蛋白质晶体的进展导致我们对蛋白质结构和功能的了解的重要进步。 Naomi Chayen.John Helliwell. 描述蛋白质晶体学的最近进展如何为其结构和性质提供新的见解。

蛋白质Apocrustacyanin C的水晶1

夸大蛋白质对植物和动物生活的重要性是不可能的。人体中的大部分组织是由蛋白质制成的,也是催化体内反应的所有酶,剥离氧化氧气,负责身体的抗体’S免疫应答和胰岛素等激素。

蛋白质是由20种天然存在的氨基酸的组合制成的大分子。典型的蛋白质含有约300个氨基酸,尽管一些蛋白质可以含有多达1000,并且多重微分子蛋白质和核酸复合物代表了进一步的复杂程度。氨基酸是大多数由碳,氢,氮和氧的小分子,尽管两个氨基酸也含有硫。

蛋白质中的氨基酸的顺序由序列测定“base pairs”在每个活细胞内发现的脱氧核糖核酸(DNA)。在人类中,该DNA分为23对染色体,其共同构成称为人类基因组的内容。基因是携带单个蛋白质的代码的碱基对序列,并且在人类基因组中存在约100,000个基因。来自世界各地的科学家都加入了力量来确定人类基因组和物理学技术中的基对的顺序正在努力打击它们的努力(见“物理学和人类基因组项目”由Norman Dovichi in 物理世界 September 1997).

然而,与化学成分一样重要,是蛋白质的形状或构象,因为这决定了其详细的化学和生物学功能–是酶催化,病毒感染,氧气转运或免疫应答。该形状由每个氨基酸相对于其两个邻居的取向决定,氨基酸以能量上的方式连接“comfortable”。虽然每对氨基酸只有三种或如此的空间上可接受的取向,但是含有300个氨基酸的典型蛋白质可以巨大的典型蛋白质的总数是大约3 300.

蛋白质挑战

生物学的一个伟大的奥秘之一是多么长的氨基酸链“folds”在几秒钟内进入其最终工作(即主动)形状 –如果蛋白质遵循随机步行到最终结构,那将需要更长时间。这是一个问题,它引起了许多物理学家的注意,因为它具有在统计力学中研究的系统具有相似之处。

在蛋白质内的二级结构方面取得了进展:两个常见的子结构是所谓的α螺旋和β薄片。然而,无法预测结构的大部分。此外,即使对于可以预测的螺旋等螺旋等的那些子结构,即使是蛋白质中的原子或化学基团的精确放置’S功能不能。这些侧链确定反应性和分子间“recognition” of the proteins.

Figure 1

因此,对快速和有效的技术有很大的需求,以确定粘合距离和角度方面的蛋白质的三维结构。为此目的开发了许多基于物理的技术。例如,核磁共振不需要蛋白质以晶体形式可用,但仅限于小蛋白质。当仅获得2-D蛋白阵列时使用电子显微镜,例如用于膜结合的蛋白质,这通常难以结晶。基因组中的约40%的蛋白质结构是膜结合。

然而,最精确的技术和能够处理最大分子的技术是X射线晶体学。此外,大约60%的蛋白质(非膜结合)非常适合晶体学。这种技术具有悠久的历史,最近通过在X射线波长下运行的同步辐射源的发展而彻底改变了。研究人员还取得了进展克服了这两个任务中的两个主要瓶颈:高质量晶体的生长和众所周知的晶体相位问题。

要以挑战为视角,应该注意的是,人类基因组中有大约100,000个蛋白质。酵母基因组包含约10,000个蛋白质并已经测序,告诉我们更多关于技术挑战。典型的蛋白质含有约2300个非氢原子(即300个氨基酸残基),但是一些蛋白质含有多达7000个非氢原子(图1)。预期人类基因组中的蛋白质遵循类似的分布。

迄今为止有一些7000个蛋白质结构 蛋白质数据库 在美国布鲁克海文国家实验室举行,这个数字大约每两年加倍,虽然并非所有这些结构都是如此“new”由于还沉积了给定蛋白质结构的变体(例如突变体)的蛋白质。 7000个结构中的约1400个是人,通过X射线衍射确定6000。

在当前成就的基础上,全基因组中许多蛋白质的三维结构的测定已成为一个现实的前景。作为可能的基因组3D结构确定项目的一部分,在世界上同步辐射设施中的最高水平讨论了这样的目标。

基本晶体学

蛋白质晶体与由大多数物理学家研究的晶体不同。蛋白质晶体通常具有〜0.5mm的尺寸,含有约1015 在周期性阵列中的蛋白质分子。然而,蛋白质晶体计晶体主要对蛋白质分子内的原子的布置主要感兴趣,而不是晶体内的分子的布置。

大约一半的蛋白质晶体实际上是由液体制成的:实际上,如果使其干燥,蛋白质晶体变得无序。溶剂的一小部分与蛋白质结合,形成有序的壳(或壳),但其中大部分都被发现“散装溶剂渠道”。这些通道允许扩散较小的分子或“ligands”进入晶体(例如,其反应被酶催化的分子,或者与抑制酶作用的重要分子)。这些蛋白质 - 配体复合物也可以通过X射线晶体学研究,并且这种作品越来越多地用于制药工业,用于理性药物设计。

Figure 2

X射线晶体术依赖于由包含单晶的周期性的原子和分子阵列散射X射线。散射的X射线干扰产生衍射图案,该衍射图案包含常规位置的大量斑点(参见右)。每个斑点或反思受到布拉格的管辖’s law l = 2d sinq, 在哪里 l 是X射线波长, d 是晶体和2的平面间距q 是关于入射X射线束的散射角度。对于在一个特定波长的X射线束中连续旋转的晶体,随着晶体瞬间反射然后消失。可以测量一组完整的衍射斑点,用于晶体的完整360°旋转。实际上,发现图案通常由于晶体的内部对称而在较小的旋转(例如90°)之后经常重复。

待解决的第一晶体结构是1913年氯化钠(NaCl),劳伦斯布拉格爵士与他的父亲共享1915年诺贝尔奖的成就。 Lawrence Bragg通过将晶体的衍射图谱与具有相似组合物,特别是氯化钠和氯化钾(KCl)的衍射图谱进行了比较了NaCl的结构。虽然许多斑点具有相似的强度,但在KCL模式中缺少NACL模式中的一些。

布拉格依赖于两个晶体实际上衍射光栅,因此X射线因此将分别经过原子电子的建设性或破坏性干扰,产生强大斑点。特别地,布拉格意识到,由于钾和氯离子都具有18个电子,如果晶体包含三维钾和氯离子的交替阵列,则破坏性干扰会导致缺失的斑点。氯化钠具有类似的结构。

这种直观的方法已被基于傅里叶变换的方法所取代(图2)。为了重建与这种技术负责衍射图案的原子和分子的三维布置,我们需要了解模式中每个点的幅度和相位(相对于入射光束)(参见框“多波长晶体学”)。然而,基本问题是,尽管可以测量每个光斑的强度,但精确的阶段不能。这是一个技术而不是基本限制。问题在于,需要具有极短波长(〜埃)的辐射来探测内部距离(也是几),并且极难测量这种短波长的阶段。

多波长晶体学

电子密度,ρ(x,y,z),晶体中的单元电池由傅立叶系列与衍射数据有关

ρ(x,y,z)=1VhklFhkleiαhkle2πi(hx + ky + lz)

其中ρ以电子电荷为单位3, V 是单位细胞的体积, h, kl 是用于在三维中标记衍射斑点的整数,|FHKL.|是幅度的 HKL. - 斑点和αHKL. 是它的相位角。如文中所述,X射线晶体学中的大挑战是确定这些相角,具有用于不同尺寸的分子的各种方法。

用于蛋白质晶体的传统方法已经多次同胞替代。在该技术中,针对天然蛋白质和两种衍生蛋白质的衍射模式收集衍射图,其中一些原子已经由较重的原子化学替换。然而,它可能是困难的,有时不可能找到合适的重物替代,因为替代原子不能干扰晶格或蛋白质结构。它也是劳动密集型的。

然而,具有现代多波长异常的分散体(MAD)技术,可以将诸如硒或氙的金属原子直接引入蛋白质中,并作为同步辐射波长的函数利用原子的散射性能的变化。这意味着需要更少的晶体 - 只有硒使用硒,只有两个用于氙。

疯狂的方法依赖于由金属原子引起的衍射点的变化。为此工作,必须在非常精细的步骤中在感兴趣的吸收边缘处调谐X射线波长,小于0.0001埃。这自然需要连续X射线源,因此只有高亮度同步辐射源和改进的区域检测器的可用性才能实现。探测器必须能够高精度地有效地收集数万个衍射点。

那么我们如何用硒代替蛋白质晶体中的硫原子?从蛋白质晶体开始浸泡在重型原子溶液中,但这种技术现在已经更加可靠地取代“biotech”方法。含硒的人蛋白可以用溶质制备“splicing”人DNA进入细菌然后在含有Seleno-甲硫氨酸的基材上培养细菌,其中硒代替硫的人工氨基酸。然后生长硒标记的蛋白质的晶体。通过简单地改变入射波长引起的衍射强度变化“activate”硒原子可以用现代电子区域检测器精确测量;已经取代了摄影胶片。

另一种方法称为单一同构替代,具有优化的异常散射(Siroas)。在该方法中,例如,通过在氙气中的高压下将蛋白质晶体保持蛋白质晶体,氙原子被迫进入蛋白质表面上的袋。氙气的X射线吸收边缘在0.35埃,因此氙原子可以通过径低于该波长的辐射来激活。在这些实验中,数据在标准压力下收集 - 当蛋白质在其时“native”形式,不含氙气 - 在含有氙气时再次高压。因此,在一个波长下测量两个数据集。

尽管Siroas信号比来自多波长技术强大,但氙边缘的短波长意味着只有少数同步辐射源提供所需的高光子通量。使用氙中的2.27Å吸收边缘可能会克服这个问题,但尚未尝试过这个问题。另一种可能性是使用碘,其在0.33Å和2.39Å处具有吸收边缘。氙技术的另一个缺点是需要两个晶体,与只需要一个晶体的硒技术不同。

在蛋白质晶体中,用简单化合物的试验和误差技术不实用。相反,已经开发了各种方法,其中具有对X射线的特征反应的重物掺入蛋白质晶体中。由这些重原子引起的衍射图案中的强度变化允许估计每个和每次反射的阶段。然而,它可能是困难的,有时不可能,找到不干扰晶格或蛋白质结构的合适的重物。这些技术在多个同义替代的一般名称下。

一种特别生产的技术是用硒代替甲硫氨酸中的硫原子,其中含硒的两个氨基酸中的一种(参见Hendrickson进一步阅读)。通过在0.97Å周围调谐周围的同步辐射的波长,可以“activate”硒原子(见前图),这导致衍射图案的强度变化。可以确定每个反射的相位角度从强度的变化确定。

蛋白质晶体学的大部分仪器和方法已经使用了我们中的一个(JRH) Daresbury实验室的同步辐射源 在英国,韦恩亨德里克森在 国家同步光源 在布鲁克海文和罗格特四牛 在巴黎的诱饵同步rotron。最近,这些技术已经扩展到世界’s first “third-generation” source, the 欧洲同步辐射源(ESRF) 在格勒诺布尔,法国,jrh和安德鲁汤普森 欧洲分子生物学实验室(EMBL),也在格勒诺布尔。

理论家也一直在开发40岁以上解决蛋白质结构的技术。但是,在可以正确地利用这些技术,直到可以使用同步辐射的X射线波长的微调可能(参见框“什么是同步辐射?”).

同步辐射和多波长晶体的组合意味着现在应该更快地确定人类基因组中约60%蛋白质的结构–提供我们可以种植晶体。

什么是同步辐射?

当通过磁场弯曲带电粒子时产生同步辐射。在大多数源中,光束被磁场限制在圆形或近圆形轨道中,并且发射高度平行的光束。 (通过同步辐射丢失的能量被射频电场取代。)如果光束能量足够高,光谱是连续的并且延伸到X射线区域中。总的来说,同步辐射源在实验室X射线源上具有许多优点。它更加激烈,更加准直,提供了一个波长的连续性可供选择。在更技术性的术语中,X射线具有更高的通量(每秒光子),在该广谱上具有更高的亮度(每单位固体角度的磁通量)和更高的亮度(亮度为每单位源区域)。

除了弯曲磁铁外,所谓的第三代源使用“insertion devices” –磁铁的直线部分–在更短波长的较短波长和更高的亮度和亮度下产生辐射。目前欧洲最辉煌的源是格勒诺布尔,法国格勒诺布尔的欧洲同步辐射设施 - 12个欧洲国家之间的合资企业。相似的高白光源也最近在美国和日本来到线上。

Daresbury实验室的同步辐射源(SRS)在这篇文章中描述的大部分工作中进行了许多工作,是第二代来源,现在迫切需要更换。英国同步罗朗社区目前正在努力为拟议的替代来源提供资金,称为钻石。与此同时,两种新的蛋白质结晶谱线线目前被Colin Nave和他的团队在SRS上建造。这将在达斯伯里共提供五种蛋白质晶体学横梁,并帮助在实验室上建立’在这一领域的强大轨道记录。该谱系包括对非常大的多蛋白酶(F1-ATPase)为剑桥分享1997年诺贝尔化学奖的分子生物学实验室的John Walker。

首先种植你的水晶

蛋白质结晶术中的主要瓶颈是生产合适的单晶。与任何其他结晶过程一样,生物晶体涉及核心和生长的经典步骤,该分子必须被纳入超饱和的热力学上不稳定状态,用于形成晶体。

蛋白质的结晶呈现出困难且艰苦的任务,因为这些物质对外部条件非常敏感。通常的蒸发方法,高压,剧烈温度变化或添加强的有机溶剂,用于生长半导体,超导体,金刚石等的晶体,根本不适用于蛋白质。需要诸如扩散,透析和批量结晶的温和技术(参见盒子“蛋白质晶体生长”)。所有这些技术的目的是将蛋白质轻轻地引导溶液并进入晶体中。

从来没有是一个设置的规则或食谱,用于解释如何结晶新蛋白质。实际上,通常没有指示靠近结晶条件,直至出现结晶沉淀物或第一个晶体。因此,需要有效的方法来帮助实验者找到铅,这允许优化结晶条件。因此结晶因此分为两个阶段:“screening”,其中尝试获得各种不同的实验条件以获得任何描述的晶体;和优化,其中一个人试图提高晶体的尺寸和质量。

虽然自20世纪70年代后期以来筛选的想法已经存在,但它没有变得流行,因为它基本上是,艰苦,耗时和无聊。然而,由于自动化的发展,筛选已经变得更广泛使用,这显着提高了获得各种蛋白质的合适晶体的成功率。

然而,必须在正确的条件范围内击中的大量实验消耗大量的材料,并且许多更有趣的蛋白质仅在有限的供应中可用。平均筛选5毫克纯蛋白质,但有时只有1或2mg可用。通过统计装置可以提高搜索效率,这有助于最小化所用蛋白质的量,但仍然需要在使用最小量材料的同时在蛋白质上快速获得尽可能多的信息的技术。

通过使用较小的蛋白质溶液可以减少所需的材料量,但蒸发有时会使样品在结晶前干燥。可以通过在油(石蜡,硅油及其组合)下浸润和孵育样品来克服蒸发问题。仅含有1-2微升蛋白质和各种结晶剂混合物的小滴通过将非常细的尖端分配到油中,在那里它们免受蒸发的影响。这种方法,由之间的合作开发 帝国学院道格拉斯仪器,在伦敦,都导致了巨大的蛋白质节约。

除防止蒸发外,还有其他益处。例如,它保护样品免受空气污染(可导致过量的核切割)。这也增强了试验的清洁度,从而导致更准确和可重复的实验。此外,一旦形成晶体,它们被粘性油稳定。这使得晶体抵抗物理休克,更容易运输(例如往返同步辐射源)。

尽管筛选成功,但很明显,即使是最成功的结晶方法仍然依赖于试验和误差而不是在分析方法上。然而,通过用诊断仪器监测结晶,应该可以理解和优化生长过程。在理想情况下,研究人员可以在进行时干预结晶过程,允许实验转向所需的结果。例如,成核和生长需要不同的条件,因此如果在实验期间改变条件以反映这种情况,可以大大提高结果。

可以使用各种技术来监测成核和生长,特别是光散射和干涉测量,以及我们对增长最佳条件的理解正在增加。虽然这种诊断实验是耗时的,但像筛选一样,消耗大量材料,它们具有重要意义,并且与当前的经验方法并行进行。

蛋白质晶体生长

有四种主要技术用于种植蛋白质:批晶,蒸气扩散,液液扩散和透析。蛋白质晶体生长的典型时间是1至3周,但时间钟从数小时变化到一年。批量结晶是最古老,最简单的方法:将要结晶的蛋白质与实验开始时所需浓度的结晶剂混合,并留下结晶。

图3.

各种扩散/透析方法是动态系统,涉及涉及含有蛋白质溶液的水滴与含有结晶剂的储存器(即缓冲液,沉淀剂,添加剂)之间的平衡。逐渐改变条件的途径途径到平衡,通常导致晶体的形成。

没有一种方法被认为优于另一种方法。方法的选择取决于所涉及的蛋白质,其数量,主要是在实验者的偏好上。蒸气扩散和批量是最广泛的

二手技术主要是由于与其他方法相比可以设置的容易性。此外,已经为两者开发了自动化。

另一种方法是采用微匍匐条件来消除对流和沉降。这允许建立仅仅是扩散驱动的条件。这些被认为是高质量的晶体生长的理想选择,尤其是具有弱分子间力和晶格相互作用的晶体的生长。通过在油中生长晶体,可以部分地模拟结晶的微匍匐条件。

这种方法在帝国学院开创,涉及“containerless”含有蛋白质的液滴和悬浮在两种不同的油之间的结晶剂的生长(见图)。底层是高密度(1.27克厘米–3)氟化硅氧烷流体和顶层含有低密度标准硅氧烷液(0.92g cm–3)。

实验挑战

如果在室温或接近室温下进行的实际X射线数据收集,由于其高含水量,可能导致晶体的严重辐射损坏。 X射线产生自由基,其穿过散发晶体的溶剂通道,并攻击相邻蛋白质分子之间的分子间接触。这最终导致水晶分裂。然而,该通道也可用于将小分子弥漫于蛋白质上的活性位点。这构成了日常分辨高分子晶体学的生长场的基础。

高速数据收集和短波长确实显着降低损伤,但最好的方法是通过将其灌注到液氮或丙烷来冻结晶体。有可能认为将水冻结成冰会损坏晶体的膨胀,但如果温度足够减小,可以避免这种情况。 Elspeth Garman的 牛津大学的分子生物物理学部 在英国是一种这些技术的先驱,而Mike Glazer则 牛津物理系 已经开发出经济运行的液氮设备,现在销售 牛津低温系统.

到目前为止,使用非常小的晶体(小于300微米)获得了最佳结果。然而,这不是问题,因为同步X射线束的高亮度仍然允许从这种小晶体收集的优异数据。

冻结略微改变蛋白质结构,在使用在室温下工作的药物设计中使用此类结构时,将其视为很重要。然而,这种轻微的并发症被晶体样品的辐射损伤的减少大大超过了较大的。

位置敏感的X射线探测器是另一个主动研究领域。例如,在英国, 牛津仪器 领导多百万英镑 影响(创新的微电子像素传感器和高级CCD技术) 开发新颖的X射线检测器的程序,该X射线探测器组合电荷耦合器件和像素硅探测器。影响的目的,涉及一些英国’最成功的仪器公司与学术研究界合作,是为商业和科学应用开发新的探测器。其他努力是以中心为中心的 棋同步罗朗 在美国的康奈尔大学,加州大学圣地亚哥和 先进的光源 在加利福尼亚州的劳伦斯伯克利国家实验室。

冷冻蛋白质晶体的组合是辐射的,非常强烈的X射线束和诸如电荷耦合装置(CCD)的敏感区域检测器已经在确定蛋白质结构方面打开了新的遗迹。例如,在曼彻斯特,我们与国际象棋同步罗朗的研究人员密切合作,以及来自以色列的Weizmann Institute的结构生物学家,以确定康丹犬A的结构,分辨率分离出从植物中分离的25 000分子量蛋白质0.94Å。在这一领域的研究和发展已经进行了 Embl Outstation在汉堡 通过Keith Wilson和Zbyszek Dauter。

这些实验还允许直接观察蛋白质中许多氢原子的结构和粘合细节,即使是水分子中的那些,传统上是中子蛋白质晶体学的专业。但是,如果我们希望使用含水介质研究这些氢原子的交换–例如,在催化中相关,例如–我们需要使用中子。有一次认为,蛋白酶A等蛋白质刚刚与中子蛋白质晶体学进行过大。但是,试验实验 Institut Laue-Langevin中子源 在格林孔中表明,如果使用范围的中子波长和大面积图像板检测器,则可以收集足够的数据以研究质子交换过程。实验还证明了有时需要了解仅一种蛋白质的功能的广泛技术。

蛋白质也具有相当大的工业和医学利益。例如,Concanavalin A结合葡萄糖,并且该综合体的结构也在曼彻斯特确定,现在是由威尔士大学斯旺西和行业发展的糖尿病患者的基于葡萄糖的生物传感器的基础。类似的植物蛋白质,称为章参,可能能够通过与艾滋病毒病毒竞争,以防止艾滋病毒感染,因为它试图将其固定在细胞上。达斯伯里和科林雷诺的皮埃尔里兹卡拉地区正在调查这种方法 利物浦John Moores大学 in the UK.

未来

近年来蛋白质晶体学中存在显着进展。实际上,人类基因组中所有蛋白质结构的测定现在是一个现实的前景。这可能需要多长时间?如果我们假设在技术方面没有进一步突破,则在同步辐射源处需要一个或两个天的光束时间,以获取将允许确定典型蛋白质结构的衍射数据。第二十个仪器以协调的方式工作,然后需要大约10,000天或近30年的工作。

然而,改进的位置敏感的X射线探测器可以极大地加速这一过程。例如,像素检测器将为分钟而不是小时或天的两个波长或晶体中的每一个产生数据集。

因此,确定基因组水平结构的测定可能很少超过30年,假设我们可以足够快地生长晶体。改善药物设计和对遗传疾病的理解将产生巨大的重要影响。总体而言,这将是物理学,化学和生物物理学,以其最佳应用。

版权©2021由IOP Publishing Ltd和个人贡献者