跳到主要内容

话题

数学和计算

数学和计算

(礼貌:Victor de Schanberg / Science Photo Library)
04 Mar 2019
从2019年3月起拍摄的 物理世界 它在标题“学习革命”之下。物理研究所成员可以享受全部问题 通过这一点 物理世界 app.

在上世纪中期,机器学习的基础奠定了下来。但越来越强大的计算机 - 利用过去十年来精致的算法 - 从医学物理到材料的一切中推动应用程序的爆炸,如 玛丽斯斯蒂芬斯 discovers

当您的银行呼吁在您的信用卡上询问有可疑的大型购买时,奇怪的时间内,这是一个员工的员工人员在您的帐户中致力于梳理。相反,它更有可能学会了与犯罪活动相关联的行为 - 并且它在您的陈述中发现了意外的东西。默默于和有效地,银行的计算机一直在使用算法来观看您的帐户以获得盗窃迹象。

以这种方式监控信用卡是“机器学习”的示例 - 计算机系统在给定的一组示例上培训的过程,开发了灵活和自主地执行任务的能力。作为人工智能(AI)更通用的领域的子集,可以在任何有大型且复杂的数据集中施加机器学习技术,这些数据集可以用于输入和输出之间的关联。就您的银行而言,该算法将分析了庞大的合法和非法交易池,以从给定的输入产生产出(“疑似欺诈”)(“下午3点的高价值订单”)。

但机器学习不仅用于金融。它也在许多其他领域应用,从医疗保健和运输到刑事司法系统。确实, 葛王 - 来自的生物医学工程师 君瑞工业研究所 在美国,谁是其在医学成像中使用的人之一 - 相信,当谈到机器学习时,我们就在革命的尖端上。

内部的故事

王的研究涉及从人类患者的扫描(输入)和“重建”真实形象(输出)中占据不完整的数据。图像重建基本上是机器学习算法的更常见应用的倒数,由此计算机被培训以发现并分类现有图像。例如,您的智能手机可能会使用这些算法来识别您的笔迹,而自动驾驶汽车部署它们以识别车辆和其他潜在危险。

图像重建不仅仅是一种医疗技术 - 它位于港口和机场,允许安全人员在密封容器内使用X射线。它对3D超声图像在故障之前,3D超声图像可以揭示结构中危险缺陷的建筑和材料行业也很有价值。但对于王来说,他的目标是克服基于不完美和不完整的医疗物理数据重建对象(例如患者心脏)的体积图像时出现的噪音和人工制品。

MRI scan

尽可能少的数据制作有充分的理由。例如,在磁共振成像(MRI)中,扫描速度避免了患者心脏和肺的不需要的运动,否则将无法接受地涂抹所得到的图像。同时,在X射线计算断层扫描(CT)中,您希望将辐射剂量最小化到患者,这意味着捕获足够的数据以产生图像 - 而且不再是。

传统的“分析”重建方法通过组合由患者周围的各个角度进行的测量来产生图像,这很难,因为它意味着完成数据集。虽然近年来的“迭代重建”算法更好地宽容,但它们需要大量的计算机电源。这是因为这些算法产生多个候选图像,每个候选图像必须与“校正”数据进行比较,从而逐渐到达最终重建。

在短期内,王设想更换重建过程的特定单独组件的机器学习技术。该技术基于“人工神经网络”(参见下面的盒子),其大致模拟生物脑的工作,每个输入由一个或多个“隐藏”层的人工神经元处理。层之间的相互作用是加权,使得过程是非线性的,并且这些参数随着系统学习而改变,相应地修改输出。所谓的“深度学习”方法是在有许多隐藏层时利用“深度”网络的方法。

首先,王认为改善将是边缘而不是革命性。例如,在迭代重建中,例如,使用神经网络基于大数据集来使图像的初始“猜测”是使整个过程更有效。另一种替代是一种神经网络,取决于已经进行了足够的迭代以产生足够的输出时的作用。

然而,长期来看,王更雄心勃勃。他呼吁一个完全集成的系统,其中机器学习算法 - 使用原始成像数据作为输入 - 重建图像,然后提取并分类病理特征,如癌症和神经疾病等病理特征。这种系统甚至可以扩展到包含治疗计划,从数据采集茶处自动化整个过程。

然而,王说,尽管取得了成就及其承诺,但深入学习缺乏一个体面的总体理论,这意味着技术的不一致仍然是神秘的。 “通过改变一个小像素的值,人工神经网络可以返回奇怪的结果。它并不总是对的,“王说。然后,未来的目标是开发更容易解释的,可解释的ai,打开黑匣子,王笑 - “仍然是一个灰色的盒子”。

量子问题

机器学习也可能对量子物理学产生深远的影响,尤其是解决“量子数量的问题”。当您拥有一组只能通过计算它们的量子性质来理解的相互作用对象时出现此类问题。 “这些问题的共同点是研究他们的性质的事实原则上是全面了解的许多体波功能,” Giuseppe Carleo.,一个物理学家 西蒙斯基金会的Flatiron Institute in New York, US.

许多身体波浪功能是在Carleo的话语中,“一个怪物,其复杂性与成分的数量呈指数级。例如,例如,可以各自旋转或逆时针旋转的颗粒系统。有两个粒子,你有四个可能的状态。有三个颗粒,八个州,仍然可管理。然而,进一步走得更远,事情很快就会失控。

传统方法在解决超过几个组件的问题时无效,所以carleo和 Matthias Treyer. - 谁是同事们 埃尔希希 在瑞士 - 应用机器学习方法。该对发现相对“浅”神经网络架构 - 仅使用单个隐藏层 - 可以有效地“学习”波浪函数的表示,用于1D或2D格子上的旋转的示例问题。

在“量子断层扫描”中出现了求解量子的难题相同的困难。正如断层摄影成像重建从没有,所以量子断层扫描从其更少量的测量确定系统的量子状态,从而从其更易于的零件上进行了决定。与量子的数量问题一样,波浪函数中编码的信息以系统中的组件数量呈指数级增长。

描述可用于描述的量子状态是Qubits在量子计算机中缠绕的方式,使量子区断层扫描至关重要了解这种计算机如何应对噪音和相干丧失。问题是,任何值得拥有的量子计算机将包括几十个或数百个Qubits,因此确定其量子状态的蛮力方法是不充分的。这就是人工神经网络来救援的地方,使得可以 - Carleo发现 - 以有效地重建包含100 Qubits的量子计算机的状态。相比之下,标准方法仅限于大约八个Qubits。

人工神经网络

还有更多的来。最近仅应用于该领域的机器学习方法,这意味着研究人员使用的技术仍处于原则上的原则上。实际上,Carleo和同事展示的方法通常涉及只有一个或两个隐藏层的神经网络,而更成熟的商业应用程序 - 例如谷歌和Facebook的喜欢使用的商业应用程序 - 可以采用更深层次的架构,并在专用硬件上运行已经针对工作进行了优化。

不幸的是,量子物理学的臭名昭着的奇怪性意味着这些更复杂的神经网络不能简单地将直接转化为量子制度; Carleo和其他人不得不从头开始重写算法,并且尚未与机器学习应用的切削刃看到的复杂性相匹配。赶上那些成熟系统将允许人工神经网络解决更复杂的量子问题。 “我认为未来几年会看到这种方法和技术差距越来越缩小,导致我们甚至无法想象的应用程序,”卡莱洛说。

人工神经网络将能够在未来几年内解决更复杂的量子问题

寻找新材料

虽然人工神经网络通常必须在它们产生有用的结果之前喂食大数据集。 弗吉尼亚大学 在美国, 普拉斯娜巴兰德兰 采用没有如此数据饥饿的工具。他的研究目的是从广阔的多维可能性空间中识别,相对较少的配方,屈服于有利的性质。为了通过试验探索这样的空间,误差将花费太长,而映射区域 - 对应于其特性所知的材料 - 这是整体的消失的小部分。

Material structures

Balachandran用于解决这个问题的方法是一种特定形式的机器学习,称为统计学习。通过假设数据中的模式遵循严格的统计规则,这种方法绕过了对大型培训集的需求。 “我们训练机器学习模型来了解我们已经知道的事情,我们将这些模型应用于预测我们不知道的事情,”Heexplains。

在这种情况下,我们知道某些材料组合的行为,以及我们基本上想要预测的是每种可能配方的性质。然而,可以预测给定材料的特性的置信度取决于已知的周围邻域的程度,因此 - 对于每个预测 - Balachandran也定量了与每个预期值相关联的误差条。

因此可以识别知识缺乏的地区,系统可以建议下一步的最有利可图的实验。这是一种新的方法。 “一般来说,在材料科学中,正在进行的实验的方式被运行他们的科学家的直觉偏见,”巴拉邦德兰说。

美国和中国的同事最近通过发现一套高性能的“形状记忆合金”,从近一百万可能的组成( 自然环境 7 11241)。这些材料是有用的,因为它们在加热或冷却时改变相位的变形。相变温度取决于过渡的方向,具有这种差异 - 热滞后 - 确定合金适合于的应用。 Balachandran的集团特别热衷于具有最小可能的热滞后的材料,发现几乎一半的合金,它们在机器的预测基础上合成了最佳的样本到目前为止。

探索物质属性的无限空间可能是欧内斯特卢瑟福的活动之一,因为欧内斯特卢瑟福只是“邮票收集”,但它可能是发现新物理学的关键。 “在接下来的五到十年中,我们希望超越相关性并开始考虑因果关系,”巴拉邦德兰说。 “您需要拥有合适的数据来探索因果关系本身的概念。在我看来,我们有解决这个部分难题的解决方案,我们知道如何找到任何对我们感兴趣的给定问题的代表性样本 - 快速。“

统计,统计,统计

虽然机器学习技术已经产生了具体的结果和洞察力,但否则无法进行的医疗,量子和材料物理学,统计物理学中的进展较小。 “我们仍在等待社区意见我们在没有机器学习的情况下不同意的重要例子,”承认 LenkaZdeborová.,谁研究机器学习理论 大学巴黎 - 萨莱 in France.

当然,统计物理学已经有希望的发展,但Zdeborová表示,这项技术迄今未被部署在该领域的边界。她指出了几十篇论文,这些论文利用神经网络研究了2D ising模型的模型,这描述了2D格子上的旋转粒子之间的相互作用,但到目前为止表示没有任何根本新的东西。

机器学习尚未驾驶统计物理学的进步可能会令人失望,但知识和洞察力肯定会以另一种方式流动。例如,识别图像所需的神经网络。每个图像都包含大量数据(像素),并且是嘈杂的(因为任何给定的图像都将被无关的功能掩盖);并且在随后的不同权重之间也会存在相关性。

愉快地,多维,嘈杂和相关的问题只是统计物理学家自上世纪中叶以来如何应对的那种问题。 “只想考虑物理在无序系统中发展的理论,”Zdeborová说,他自己的背景是一种称为旋转眼镜的特定类型的无序磁体。这种系统具有大量的颗粒(即尺寸尺寸),具有有限温度(即热噪声)和许多颗粒间相互作用(即大量相关性)。实际上,在某些情况下,描述机器学习模型的方程与用于处理统计物理学中的系统的方程式完全相同。

这种洞察力可能是开发一个综合理论的关键,该理论解释了为什么这些方法工作得很好。几十年前,机器学习可能进一步推进,但其成功仍然主要来自经验试验和误差方法。 “我们希望能够预测最佳架构,我们应该如何设置参数,以及算法应该是什么,”Zdeborová总结。 “目前,我们没有如何让那些没有巨大的人类脱口所。”

机器学习术语巴斯特

人工智能(AI)

机器展示的智能行为。但智力的定义是争议的,因此对最满足的AI的更全面描述是:一个系统的行为,以应对其环境和事先经验。

机器学习

作为赋予人工智能机器的一组方法,机器学习本身就是广泛的类别。从本质上讲,系统从培训集中学习的过程,以便它可以自主地为新数据提供适当的响应。

人工神经网络

一种机器学习的子集,其中学习机制是对生物脑的行为建模的。在新兴作为输出之前,将输入信号经过通过网络层通过网络层。通过改变网络中神经元之间的相互作用的强度来编码经验。

  • 一个新的IOP发布电子书 机器学习断层图像成像 由葛王,易张,萧井烨和宣勤谅解备忘录将于今年晚些时候发布。
版权©2021由IOP Publishing Ltd和个人贡献者