跳到主要内容

话题

数据采集​​与分析

数据采集​​与分析

本质上,第一名占主导地位

20 Oct 2010
本福德的法律由各国的人口说明

 

曾经被视为的东西只是一种数学好奇心可能成为一个强大的科学工具。这就是一群地球物理学家的看法,他们发现本福德’法律 - 预测现实世界观察中的第一位的不均匀分布 - 事实上,横跨各种不同类型的科学数据确实存在真实。研究人员认为,在观察数据中寻找从这种分布的偏离可能会增加地震识别,改善气候的计算机模拟。

1938年,弗兰克本福德概括了由19世纪的天文学家Simon Newcomb提出的一个命题,即通过概率日志发生了现实观测产生的第一个数字的数字的第一位数10(1 + 1 /D), 在哪里 D 是数字的值。这意味着与数字1开始的数字应该发生大约30%的时间,而具有2开始的级分为约17%,而且以9只为4%。 Benford表示,无论数字写入哪个基础并继续展示现在承担他的名字的法律,较低的数字的普遍性都适用于从城市人群到河流长度的数据。

堪培拉澳大利亚国立大学的地震学家Malcolm Sambridge表示,一般法律适用于某种添加剂过程形成的数字列表,其中较大的数量不太可能发生比较小的添加更大的数量。藐视许多人’直观的期望,第一位数的分布是统一的,本福德’事实上,法律实际上发现了实际应用作为检测欺诈的手段(因为致密的数字往往不遵守法律)。“当我第一次告诉别人的法律时,他们经常反应是它必须是骗局,” says Sambridge. “It’s so simple that it’s奇怪,但实际上是真的。”

Gamma射线到温室排放

在最新工作中,与澳大利亚国家大学同事HRVoje Tkalcic和Andrew jackson的Ethzürich一起研究了从包含超过750,000个数字的组合总共的15套数据分发了第一位数的分布。这些数据从整个科学中得出,从远处伽马射源到国家温室 - 气体排放的光子通量和感染各种疾病的人数。发现每个数据集都被发现跟随Benford’s law.

根据Sambridge的说法,法律可用于改善计算机模拟的复杂物理过程,其数据遵循本福德分布,例如地球下面的底层’气候。研究人员还认为法律可以帮助区分地震和其他震颤等来源,如核爆炸。他们发现,从2004年12月的亚洲海啸后面收集的地震数据,秘鲁收集,遵循了本福德分布,而在地震前的背景噪音没有。

此外,通过分析在堪培拉中的地震表收集的数据,他们能够在亚洲地震的同时识别澳大利亚资本中发生的先前未观察到的小地震。“事实证明,您可能不需要详细研究地震波形,” adds Sambridge. “只需位移数据的第一个数字即可。”

它可以适用于您的数据

Sambridge和同事敦促其他科学家们还审查他们的数据,以便讲述秘密盈余。事实上,他们说,本福德’s law “很可能持有通过足够动态范围的数据集的科学”;换句话说,那些跨越至少几个数量级的值的那些,与他们研究的数据一样。

然而,Mathematician Theodore山在美国佐治亚州理工学院的山区听起来有谨慎。他说Sambridge’s group provides “额外的令人信服的证据表明本福德’法律适用于大部分科学”,但他不相信动态范围足以确定数据集是否将遵循法律。山上在数学上证明了1995年的本福德’S法是描述在规模变化下不变的数字分布的唯一可能的普遍法法(例如,它’无论单位是否在米或公里处陈述)。但他和其他人都没有发现可以预测的一般原则 先验 哪种数据集应该遵守法律。“本福德的笨蛋’s law,” he says, “特别是在现实生活中,仍然是神秘的。”

该研究在最近被接受的纸上描述了 喧闹。 res。吧。

版权©2021由IOP Publishing Ltd和个人贡献者