跳到主要内容

话题

显微镜检查

显微镜检查

新型显微镜技术在‘big data’ haystacks

27 Aug 2019
本文首次发表于2019年 物理世界关注仪器和真空 标题为“大海捞针”

马丁·琼斯 描述了电子显微镜的新方法如何帮助生物医学科学家从不断增长的数据流中获得最大收益

聚焦离子束扫描电子显微镜(FIB SEM)。薄的切片 这款聚焦离子束扫描电子显微镜(FIB SEM)使用镓离子束以仅几纳米的步长将样品切片,从而使研究人员可以收集3D图像。 (礼貌:克里克学院的露西·科林森)" />
薄的切片 这款聚焦离子束扫描电子显微镜(FIB SEM)使用镓离子束以仅几纳米的步长将样品切片,从而使研究人员可以收集3D图像。 (礼貌:克里克学院的露西·科林森)

你们大多数人可能至少熟悉生物医学研究中涉及的某些“大数据”。自人类基因组计划绘制人类DNA中30亿个左右碱基对的序列以来的十年半中,基因组学研究(人类和其他生物)的数据集已扩展到TB级。这些数据集通常由专业的“生物信息学家”来处理,而这个职位暗示着数学和信息学的核心作用,而不是由生物医学专家本身来处理。

近年来,在大数据时代,各种成像方法已加入生物信息学。成像方式的范围不断扩大,包括各种口味的光学显微镜,电子显微镜,X射线显微镜,成像质量细胞仪及其他,目前正致力于生物医学问题的研究。这些新技术带来了新的数据挑战,包括以下情况:数据的产生速度快于标准硬盘驱动器可以写入的速度,而单个实验中的大容量高分辨率图像可能占用许多TB的存储空间。这就需要像我这样专门致力于开发定制系统和技术的仪器科学家,而这种情况一度无法满足所有商业解决方案的需求。

生物医学显微镜的发展

当罗伯特·胡克(Robert Hooke)和安东尼·范·列文虎克(Antonie van Leeuwenhoek)等人在17世纪开始对生物样品和光学显微镜进行实验时,他们的“成像过程”包括手工绘制样品,并通过他们的自制示波器对其进行观察。激光和数码相机等现代技术使成像过程更加自动化,而光学显微镜的进步极大地扩大了可成像结构的范围。最近最重要的进展之一是能够用荧光标记物标记感兴趣的结构。例如,绿色荧光蛋白(一种最初从海ly中克隆的物质,并获得了2008年诺贝尔化学奖的发现者)使科学家能够“标记”感兴趣的物体,以便在用特定的照明照射时它们像灯塔一样发光光的波长。这提供了有关样品的功能信息,并且可以在同一样品中用不同的颜色标记多个不同的对象(例如亚细胞器或病毒颗粒)。

A 3D reconstruction of a HeLa cell.

但是,即使是最先进的光学显微镜所能看到的也受到限制。瑞利准则(或在生物学中更常用的类似阿贝限度)规定,如果两个物体之间的距离小于光波长的一半(对于典型实验而言约为200纳米),则无法解析。由于许多重要的生物结构和分子远小于此,我们必须转向其他方法来探测它们。一种解决方案是“超分辨率”荧光技术家族,例如 受激发射损耗 (STED)和单分子定位( 2014年诺贝尔化学奖)。另一个是电子显微镜,其中电子束的短德布罗意波长比可见光显微镜具有更高的分辨率。这可以精确地揭示样品的超微结构,但是如果没有功能特异性的标记,我们就可以通过荧光显微镜实现。

电子显微镜的另一个缺点是,传统上它是一种通量较低的方法,每个2D快照都需要大量且费时的样品制备。例如,如透射电子显微镜(TEM)中所发生的那样,将样品切成足够薄的部分以使电子束能够通过它们,这涉及将软生物材料嵌入诸如树脂的硬质物质中。这允许使用称为超薄切片机的设备将样品切成100纳米厚的切片。然后将这些切片收集在微小的金属网格上,并装入显微镜中。

相反,较新的电子显微镜技术将切割机制结合到显微镜本身的真空室中。在这些系统中,样品表面通过扫描电子显微镜(SEM)成像。接下来,将一根细小的银条刮掉,露出一个更深几纳米的新表面。切割机理可以是金刚石刀(在连续块面扫描电子显微镜– SBF SEM中)或高能离子束(在聚焦离子束扫描电子显微镜– FIB SEM中),如图像所示。本文的开头。自动重复此过程每天可以产生TB级的密集3D图像数据。例如,上图所示的单个HeLa单元的重建是根据FIB SEM系统中捕获的TB级数据(每像素5?nm)创建的。但是,高精确度并不能很快实现:创建单个图像需要几天的时间。

分析数据

我们执行的许多分析任务大致可归为“大海捞针”类别。通常,当我们从包含许多细胞的样本中获取数据时,只有一个或几个细胞表现出感兴趣的行为或结构。一个例子可能是罕见的事件,例如短暂的初始相互作用和产生血管的细胞融合(2009 PLOS一 4 e7716)。该过程特别令人感兴趣,因为癌性肿瘤有时会选择新血管的形成以使其生长。出于实际目的,在研究此类事件时,通常需要对相对较大的组织区域成像以确保完全捕获目标结构。但是,这给我们带来了一个问题,那就是在它的海域中找到一个感兴趣的单元格,该单元格更为丰富,但相关性却不高。

通常,EM图像分析对自动计算处理具有顽强的抵抗力。因此,这通常是手动完成的,研究人员在图像中进行筛选并在不同的结构周围进行追踪(称为“分段”的过程),以确定要研究的许多相似细胞中的哪个。这需要大量时间-分析图像的时间通常比获取图像的时间长很多倍。

Screen capture of the 蚀刻细胞 web  在 terface.

如果这个问题听起来很耳熟,可能是因为物理学家多年来一直在处理类似的数据过剩问题。粒子物理学家和天文学家尤其擅长于数据约简技术,这有助于确保不感兴趣的数据不会不必要地困扰进行分析的计算机处理器。在生物医学成像中,我们可以执行类似的技巧。例如,我们可以将荧光显微镜(功能定位)和电子显微镜(超结构分辨率)的优势结合在一起,称为相关光电子显微镜(CLEM)。通过使用荧光标记突出显示感兴趣的对象,我们可以确定应该在电子显微镜中以高分辨率成像的区域。这可以在过程的不同阶段执行,既可以在准备电子成像之前,也可以在使用新的“树脂内荧光”方法将树脂包埋之后。

要利用此附加信息, 我们的组 伦敦的弗朗西斯·克里克研究所(Francis Crick Institute)研发了定制的微型显微镜,使我们能够对这些荧​​光区域成像(2016 惠康开放资源. 1 26)。第一台显微镜(现已由 RMC Boeckeler)附着在超薄切片机上,以使我们能够监控切割过程并仅收集包含荧光信号的样品切片,从而限制了我们需要加载到显微镜中进行成像的切片的数量。第二个是安装在SBF SEM内的微型设备(直径小于3mm),可以在去除每个细条后监视荧光信号。这使我们能够识别哪些区域包含荧光标记的对象,以便我们仅对那些感兴趣的区域成像,从而最大化数据的有用信息内容。这些方法可以大大减少数据占用空间,节省存储成本,并减少相关的分析复杂性,节省时间。

当然,有时候不可避免的是大数据。并非总是能够以适合有效CLEM成像的形式制备样品,因此有时我们仍然必须使用蛮力处理来处理大量数据。在这种情况下,手动注释数据仍然是黄金标准,因此通常是首选的方法,但是工作的艰辛性意味着对数据的分析比获取数据要慢得多。

分担负载

但是,对于某些结构,可能会训练生物学知识有限的人识别和追踪所需的对象,即使最好的计算方法也难以解决。此类“人为易上手-电脑难”图像处理问题并非生物学独有。天文学家从2007年开始对此类问题应用“公民科学”方法,呼吁公众使用名为“网络”的项目,帮助他们对望远镜影像群山进行分类 银河动物园。此项目已发展成为一个名为 人畜共患病 开展了许多其他公民科学工作-包括一项 蚀刻细胞,它的建立是为了在某些细分任务中争取公众的帮助,如上图所示,在他们的网络浏览器中追踪核子的轮廓。通过汇总几位公民科学家对数据的每个切片的贡献,我们可以构建与专家所做的注释一样准确的注释。

当然,在不提及机器学习的情况下,关于大数据的讨论是不完整的,这无疑是生物医学成像领域快速发展的另一个领域。许多深度学习方法非常适合图像分析问题,例如对象检测和分割。实际上,自动驾驶汽车和机器人技术等技术都广泛使用了非常相似的图像处理方法。监督卷积神经网络体系结构的几种变体已证明在自动化生物医学图像分析方面非常成功。

但是,将图像分析任务移交给机器的过程中存在一个瓶颈,那就是用于训练它们的“地面真相”数据。此类数据通常采用专家创建的手动注释的形式。考虑到图像的复杂性,我们通常需要大量的培训数据才能取得良好的效果,通常远远超出专家提供的效果。来自公民科学家的汇总注释为我们提供了在各种图像上稳健地训练系统所需的数据集。训练有素的深度学习系统可以快速生成图像分割。原则上,它甚至可以用于实时引导电子显微镜,因此即使没有荧光信标,它也只能记录有趣的图像区域。

所有这些工作背后的原理都可以用一句老话“聪明一点,而不是更努力”来概括。通过从纯粹的计算方面来看大数据问题,即通过将新的样品制备技术与定制硬件以及新的计算管线相结合,我们可以减少在大海捞针中寻找针头所需的工作量和资源。大大减少了计算基础设施的负担和研究人员的分析负担。请记住,大数据俱乐部的第一条规则是:“不要获取大数据!”

  • 享受2019年的剩余时间 物理世界关注仪器和真空 in 我们的数字杂志 或通过物理世界 适用于任何iOS或Android智能手机或平板电脑的应用程序。
版权©2020年由IOP 出版 Ltd和个人贡献者