2024年4月30日发(作者:)
随机序列的统计检验之卡方检验
随机数序列的统计检验之χ
2
检验
论文摘要:
本文主要介绍了随机数序列的一种统计检验方法-—卡方检验(
2
检验).文章对随机数的定
义以及随机数序列的分类进行了说明介绍,并介绍了两种应用最为广泛的
2
拟合优度检验法。
进一步地介绍了
2
检验在农业及医学方面的应用,并客观评价了
2
检验方法的优劣性。
引言 关于随机数的研究,从很早以前就有.以前对于随机数的产生基本都是一些比较古老
的方法,例如古人喝酒时玩的掷骰子的游戏,其实就是一个产生随机数的过程。直到现在,仍然
有很多统计学者,在前人的基础上发展创新,致力于随机数的产生及检验的研究。在当下,随机
数的应用范围更为广泛,不仅是类似于古人掷骰子的购买彩票的研究,更是广泛地应用到医学、
农业等各个领域。并且随着计算机的应用与发展,计算机模拟的技术也逐步被深入研究和广泛
应用。利用计算机来产生随机数已经成为一个新的课题。相比于之前,计算机产生的随机数在均
匀性和随机性方面都更好,且模拟处理的问题更为广泛.随着随机数应用范围的扩大,对于随机
数的均匀性、独立性、随机性等的检验也不可或缺,只有通过了检验的随机数才能有更广大的
2
利用空间。本文介绍的就是随机数序列统计检验的其中一种方法——检验。
(一) 随机序列的定义及分类
2
[2]
在介绍随机数序列的检验之前,在这里先介绍一下随机数序列的定义和分类.
在连续型随机变量的分布中,最简单而且最基本的分布是单位均匀分布。由该分布抽取的简
单子样称随机数序列,其中每一个体称为随机数。其分布密度函数为:
1,0x1
f(x)
0,其他
分布函数为 :
0,
(x)
x,F
1,
x0
0x1
x1
随机序列的统计检验之卡方检验
随机数列可以分为三种不同的类型:真随机数列,准随机数列,伪随机数列。
真随机数数列是不可预计的,所以不可能重复产生两个相同的真随机数数列.真随机数只能
用某些随机物理过程来产生,如放射性衰变等。
准随机数序列并不具有随机性质,仅仅是它用来处理问题时能够得到正确结果。准随机数的
概念是来自如下的事实:对伪随机数来说,要实现其严格数学意义上的随机性,在理论上是不
可能的,在实际应用中也没有这个必要。关键是要保证“随机”数数列具有能产生出所需要的
结果的必要特性。
伪随机数序列是我们通常在实际应用的,是通过某些数学公式计算而产生的。这样的伪随
机数从数学意义上讲已经一点不是随机的了。但是,只要伪随机数能够通过随机数的一系列的统
计检验,我们就可以把它当作真随机数而放心地使用。这样我们就可以很经济地、重复地产生
出随机数。
(二)χ
2
拟合优度检验法
χ
2
检验的方法中,最简单也用得最为广泛的是χ
2
拟合优度检验法
[1]
。该方法可分为两种类型
进行讨论:
1.多项分布的χ
2
检验
设总体X是仅取
k
个可能值的离散型随机变量,设X的可能值为1,2,…,k,且
P(Xi)p
i
,i1,2,...,k,
p
i
1
i1
k
.又设
(X
1
,X
2
,...X
n
)
是从总体X抽得的简单随机样本;NI表示样本
观察值中取值为
i
的个数,即样本中出现事件
(Xi)
的频数。
2
(N
i
-np
i
)(np
i
)
规定的检验统计量 定理1 当
H
0
:p
i
p
i
,i1,2,...,k(p
i
已知)
成立时,按
=
2
00
k
i1
L
2
(k1),n
.
2
则由定理1知,对给定的检验水平
,可以取临界值
2
(k1)
,当
随机序列的统计检验之卡方检验
2
=
(N
i
-np
i
)(np
i
)
2
(k1)
时拒绝H
0
.
2
i1
k
2。分布中含有未知参数的χ检验
在实际问题中,更常见的一类问题是要检验总体分布是否具有确定的类型,即检验假设
H
0
:F(x)F
0
(x;
1,
2
,...,
m
),
1,
2
,...,
m
2
其中函数
F
0
的形式已知,参数空间
也已知。
把实轴划分成
k
个互不相交的区间
A
1
(,a
1
],A
2
(a
1
,a
2
],...,A
k
(a
k1
,),a
1
,a
2
,...,a
k
是视具体
情况选取的
k1
个实数,且记
ˆ
,...,
ˆ
)
F
(
a
;
ˆˆ
ˆ
i
F
0
(
a
i
;
p
1m0i11
,...,
m
)
,
i2,3,...,k1
用
N
i
表示样本
X
1,
X
2,
,...,X
n
中落在
A
i
内的个数。
2
ˆ
ˆ
i
)
ˆ
i
)
给出的检验统计量
(N
i
-np
(
np
定理2 若假设
H
0
成立,则按式
2
i1
k
L
2
ˆ
n
2
(
km
1)
。
n
ˆ
2
2
(km1)
时拒绝假设则按定理2知对给定的检验水平
,取临界值
2
(km1)
,当
H
0
,反之接受假设
H
0
。
这里需要注意的是χ
2
拟合优度检验法是在
n
充分大时推导出来的,所以在使用是必须注意
n
要足够的大,以及
np
i
不太小这两个条件.我们一般的要求是
n
不小于50,并且每个
np
i
都不小于5
(最好是大于10)。
对于随机数的χ检验,只用把
p
i
p{cxd}
1dx
带入公式即可。
c
2
d
(三)卡方检验的应用及评价
关于随机数序列代表的实际意义,使用卡方检验的方法,在实际生活中有相当广泛的应用,
这里介绍的,是使用EXCEL软件建立卡方检验的一些应用,包括在农业统计
[3]
和临床数据分析
[4]
等方面。而Microsoft Excel软件具有易学、易用、易懂的特性,并且还提供了很多基本和经
典的统计分析方法。可通过添加“分析工具库”后利用“工具”菜单的“数据分析"功能来实现,
随机序列的统计检验之卡方检验
但没有提供现成的卡方检验。在农业统计的遗传学分析中,常用
2
来检验所得实际结果是否与孟
德尔遗传的分离比例相符,如检测其与某种理论比例的适合性,其
2
值可以直接用如下简式求
出,见表1。
表1 检验两组资料与某种理论比例符合度的
2
值公式
理论比例(显性:隐形)
2
公式
1:1
((|Aa|)1)
2
/n
2:1
((|A2a|)1.5)
2
/2n
3:1
((|A3a|)2)
2
/3n
15:1
((|A15a|)8)
2
/15n
9:7
((|7A9a|)8)
2
/63n
13:3
((|3A13a|)8)
2
/63n
r:1
[(|Ara|)(r1)/2]
2
/rn
在农业统计中,
2
检验还可用于独立性检验.例如研究小麦种子灭菌和麦穗发病两个变数之间是
否独立。若相互独立,表示种子灭菌和发病高低无关,灭菌处理对发病无影响;若不相互独立,
则表示种子灭菌和发病高低有关,灭菌处理对发病有影响。这主要是采用
RC
表进行独立性检
验计算.常用的有2x2表、2x3表和3x3表等,在这里就不做介绍了。
而
2
检验在临床数据分析方面,只需在四格表内填入数字即可,操作方便快捷,可直接给
2
出检验的统计量和P值。
虽然随机序列的卡方检验具有很广泛的应用,但是其依然具有片面性
[5]
。那是因为现有随
机性检测规范没有系统地讨论统计检验和随机本质的联系, 也没有严格论证样本量和结论可信
度的联系,使其可操作性不强,难以指导实际的安全性评估工作,甚至有可能误导实际的测试工
作。所以我们还有待对卡方检验进行改进
[6]
。
在随机数的卡方检验的广泛应用上,可以看出来数理统计知识内容在生活和生产中都有着
随机序列的统计检验之卡方检验
极其广泛而重要的应用.而关于卡方检验,其实关于它的所有知识内容都是起步于对卡方分布的
定义。所以说,数学知识的内容都可以由浅入深逐步扩展,有待我们所有的学者去探索和发展,
不要止步于前人的经验和理论,探索无极限。
参 考 文 献
[1]
朱燕堂,赵选民,徐伟.概率论与数理统计.西安:西北工业大学出版社,1997。8:140—142
[2]
张咏.随机数发生器和随机数检验性能研究.电子科技大学,2006。1:11—15
[3]
谭永强,余华强,陈桥生,刘莹.利用EXCEL软件建立卡方检验分析模版在农业统计中的作用.湖北农
业科学,49卷12期 ,2010.12:
[4]
冯松,郑斌.利用EXCEL进行卡方检验为临床数据分析提供支持, 2011。9
[5]
石竑松,张翀斌,杨永生,高金萍.随机性检测及其片面性.清华大学学报(自然科学版),51卷10
期,2011
[6]
DAI Jia Jia,YANG Ai JunA.Modified Chi—Squared Goodness—of—Fit Test.College of Appilied
Sciences,Vol.29,No.1,2009.1
发布者:admin,转转请注明出处:http://www.yc00.com/web/1714463828a2451460.html
评论列表(0条)