2024年4月30日发(作者:)
神奇的本福特定律——学会计的该懂的
数字统计的一种内在规律,指所有自然随机变量,只要样本空间
足够大,每一样本首位数字为1至9各数字的概率在一定范围内具有
稳定性。见右图。即以1开首的样本占样本空间的0.3,以2开首的样
本占样本空间0.17-0.19,而以9或8开首的样本始终只占0.05左右。
世界上千千万万的数据的开头数字是1到9中的任何一个数字,
而且每个数字打头的概率本应该差不多,但如果你统计的数据足够多,
就会惊讶地发现,打头数字是1的数据最多。
1935年,美国的一位叫做本福特的物理学家在图书馆翻阅对数表
时发现,对数表的头几页比后面的页更脏一些,这说明头几页在平时
被更多的人翻阅。
本福特再进一步研究后发现,只要数据的样本足够多,数据中以1
为开头的数字出现的频率并不是1/9,而是30.1%。而以2为首的数
字出现的频率是17.6%,往后出现频率依次减少,9的出现频率最低,
只有4.6%。
本福特开始对其它数字进行调查,发现各种完全不相同的数据,
比如人口、物理和化学常数、棒球统计表以及斐波纳契数列数字中,
均有这个定律的身影。
1961年,一位美国科学家提出,本福特定律其实是数字累加造成
的现象,即使没有单位的数字。比如,假设股票市场上的指数一开始
是1000点,并以每年10%的程度上升,那么要用7年多时间,这个
指数才能从1000点上升到2000点的水平;而由2000点上升到3000
点只需要4年多时间;但是,如果要让指数从10000点上升到20000
点,还需要等7年多的时间。因此我们看到,以1为开头的指数数据
比以其他数字打头的指数数据要高很多。
2001年,美国最大的能源交易商安然公司宣布破产,当时传出了
该公司高层管理人员涉嫌做假账的传闻。事后人们发现,安然公司在
2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证
明了安然的高层领导确实改动过这些数据。
第一数字定律描述的是自然数1到9的使用频率,公式为F(d) =
log[1 + (1/d)](d为自然数),其中1使用最多接近三分之一,2为
17.6%,3为12.5%,依次递减,9的频率是4.6%。科学家们仔细研
究第一数字定律后,无法对这种现象做出合理解释。定律的主要奠基
人Frank Benford对人口出生率、死亡率、物理和化学常数、素数数
字等各种现象进行统计分析后发现,由度量单位制获得的数据都符合
第一数字定律。当然彩票上随机数据并不符合。第一数字定律在许多
方面都得到了应用,但对于这种数字奇异现象人们依旧是迷惑不解。
上图表中的几个数据范例来自于西班牙国家统计局,数据是按照
本福特对数定律统计的。然而,按照彩票获得的数据是随机的和统一
的。
您住宅地址号码是以a 1开始的吗?根据一个奇特的数学定律统
计,约三分之一的住宅号码是以1作为其首个数字的。其它许多几乎
没有任何共通性的地区也有相同的情况:比如道琼斯指数的历史数据、
个人电脑中文件储存的大小排列顺序、世界主要河流的长度、报纸头
版头条的数字及其它许多事情。
该定律根据其第二位奠基人弗兰克.本福特的名字被命名为本福特
定律。通用电气公司物理学家本福特于1935年发现了这一定律。该定
律告诉人们在各种各样不同数据库中每个数字(从1到9)作为首个重
要阿拉伯数字的频率。
发布者:admin,转转请注明出处:http://www.yc00.com/news/1714469812a2452615.html
评论列表(0条)