2024年4月18日发(作者:)
统计学练习题
第一章 习题
思考题
1.1 “统计”一词有哪几种含义?
1.2 什么是统计学?怎样理解统计学与统计数据的关系?
1.3 统计数据可分为哪几种类型?不同类型的统计数据各有什么特点?
1.4 举例说明总体、样本、参数、统计量、变量这几个概念。
1.5 什么是有限总体和无限总体?举例说明。
1.6 变量可分为哪几类?
1.7 举例说明离散变量和连续变量。
第二章 习题
思考题
2.1 简述普查和抽样调查的特点。
2.2 统计数据的具体收集方法有哪些?
2.3 调查方案包括哪几个方面的内容?
2.4 什么是问卷?它由哪几部分组成?
2.5 设计问卷的提问项目应注意哪些问题?
2.6 封闭型问题答案的设计有哪些主要方法?
2.7 问卷中问题顺序的设计应注意哪些问题?
练习题
2.1 假定我们要研究在校大学生的生活时间分配状况,请写出你的研究思路。
2.2 某家用电器生产厂家想通过市场调查了解以下问题:
a.企业产品的知名度;
b.产品的市场占有率;
c.用户对产品质量的评价及满意程度。
(1)请你设计出一份调查方案;
(2)你认为这项调查采取哪种调查方法比较合适?
(3)设计出一份调查问卷。
第三章 习题
思考题
3.1 数据的预处理包括哪些内容?
3.2 分类数据和顺序数据的整理和图示方法各有哪些?
3.3 数值型数据的分组方法有哪些?简述组距分组的步骤。
3.4 直方图和条形图有何区别?
3.5 绘制线图应注意哪些问题?
3.6饼图和环形图有什么不同?
3.7 茎叶图和直方图相比有什么优点?
3.8 统计表有哪几个主要部分组成?
3.9 制作统计表应注意哪几个问题?
练习题
3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质
量的等级分别表示为:A.好;B.较好;C.一般;D.较差 E.差。调查结果如下:
B
D
A
B
C
D
B
B
A
C
E
A
D
A
B
A
E
A
D
B
C
C
B
C
C
C
C
C
B
C
C
B
C
D
E
B
C
D
C
E
A
C
C
E
D
C
A
E
C
D
D
D
A
A
B
D
D
A
A
B
C
E
E
B
C
E
C
B
E
C
B
C
D
D
C
C
B
D
D
C
A
E
C
D
B
E
A
D
C
B
E
E
B
C
C
B
E
C
B
C
(1) 指出上面数据属于什么类型;
(2) 用Excel制作一张频数分布表;
(3) 绘制一张条形图,反应评价等级的分布。
3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):
152
105
117
97
124
119
108
88
129
114
105
123
116
115
110
115
100
87
107
119
103
103
137
138
92
118
120
112
95
142
136
146
127
135
117
113
104
125
108
126
(1) 根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;
(2) 如果按规定,销售收入在125万元以上为先进企业,115-万元~125万元为良好企业,105
万元~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企
业、落后企业进行分组。
3.3 某百货公司连续40天的商品销售额如下(单位:万元):
41
46
35
42
根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
3.4 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果
如下:
700
706
708
668
706
694
688
701
693
713
716
715
729
710
692
690
689
671
697
699
728
712
694
693
691
736
683
718
664
725
719
722
681
697
747
689
685
707
681
726
685
691
695
674
699
696
702
683
721
704
709
708
685
658
682
651
741
717
720
729
691
690
706
698
698
673
698
733
677
703
684
692
661
666
700
749
713
712
679
696
705
707
735
696
710
708
676
683
695
717
718
701
665
698
722
727
702
692
691
688
25
36
28
36
29
45
46
37
47
37
34
37
38
37
30
49
34
36
37
39
30
45
44
42
38
43
26
32
43
33
38
36
40
44
44
35
(1) 利用计算机对上面的数据进行排序;
(2) 以组距为10进行等距分组,整理成频数分布表,并绘制直方图。
(3) 制作茎叶图,并与直方图作比较。
3.5 下面是北方某城市1—2月份各天气温的记录数据:
-3
-14
-6
-8
-14
-3
2
-18
-8
-6
-22
2
-4
-15
-12
-15
-13
-4
-7
-9
-16
-11
-9
-4
-11
-6
-19
-12
-6
-16
-1
-1
-15
-19
0
-1
7
0
-22
-25
-1
7
8
5
-25
-24
5
5
9
-4
-24
-18
-4
-6
-6
-9
-19
-17
-9
-5
(1) 指出上面的数据属于什么类型;
(2) 对上面的数据进行适当的分组;
(3) 绘制直方图,说明该城市气温分布的特点。
3.6 下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:
年龄
%
18~19
岁
1.9
20~21
岁
34.7
22~24
岁
34.1
25~29
岁
17.2
30~34
岁
6.4
35~39
岁
2.7
40~44
岁
1.8
45~59
岁
1.2
(1) 对这个年龄分布做直方图;
(2) 从直方图分析成人自学考试人员年龄分布的特点。
3.7 下面是A、B两个班学生的数学考试成绩(单位:分)数据:
A班:
44
66
73
76
85
B班:
35
55
61
71
85
39
56
62
73
90
40
56
63
74
91
44
57
64
74
91
44
57
66
79
94
48
57
68
81
95
51
58
68
82
96
52
59
70
83
100
52
60
70
83
100
54
61
71
84
100
57
66
74
77
85
59
67
74
77
86
60
69
74
77
86
61
70
75
78
90
61
70
75
78
92
62
71
75
79
92
63
72
75
80
92
63
73
75
80
93
65
73
76
82
96
(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;
(2) 比较两个班考试成绩分布的特点。
3.8 已知1987-1999年我国的国内生产总值数据如下(按当年价格计算,单位:亿元):
年
份
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
国内生产总值
3624.1
4038.2
4517.8
4862.4
5294.7
5934.5
7171.0
8964.4
10202.2
11962.5
14928.3
16909.2
18547.9
21617.8
第一产业
1018.4
1258.9
1359.4
1545.6
1761.6
1960.8
2295.5
2541.6
2763.9
3204.3
3831.0
4228.0
5017.0
5228.6
第二产业
1745.2
1913.5
2192.0
2255.5
2383.0
2646.2
3105.7
3866.6
4492.7
5251.6
6587.2
7278.0
7717.4
9102.2
第三产业
860.5
865.8
966.4
1061.3
1150.1
1327.5
1769.8
2556.2
2945.6
3506.6
4510.1
5403.2
5813.5
7227.0
1992
1993
1994
1995
1996
1997
1998
1999
26638.1
34634.4
46759.4
58478.1
67884.6
74462.6
78345.2
81910.9
5800.0
6882.1
9457.2
11993.0
13844.2
14211.2
14552.4
14457.2
11699.5
16428.5
22372.2
28537.9
33612.9
37222.7
38619.3
40417.9
9138.6
11323.8
14930.0
17947.2
20427.5
23028.7
25173.5
27035.8
(1) 用Excel绘制国内生产总值的线图;
(2) 绘制第一、二、三产业国内生产总值的线图;
(3) 根据1999年的国内生产总值及其构成数据绘制饼图。
3.9 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析
各城市平均相对湿度的分布特征。
月份
1
2
3
4
5
6
7
8
9
10
11
12
北京
49
41
47
50
55
57
69
74
68
47
66
56
长春
70
68
50
39
56
54
70
79
66
59
59
57
南京
76
71
77
72
68
73
82
82
71
75
82
82
郑州
57
57
68
67
63
57
74
71
67
53
77
65
武汉
77
75
81
75
71
74
81
73
71
72
78
82
广州
72
80
80
84
83
87
86
84
81
80
72
75
成都
79
83
81
79
75
82
84
78
75
78
78
82
昆明
65
65
58
61
58
72
84
74
77
76
71
71
兰州
51
41
49
46
41
43
58
57
55
45
53
52
西安
67
67
74
70
58
42
62
55
65
65
73
72
资料来源:《中国统计年鉴(1998)》,10页,北京,中国统计出版社,1998.
第四章 习题
思考题
4.1 一组数据的分布特征可以从那几个方面进行测度?
4.2 怎样理解均值在统计学中的地位?
4.3 对于比率数据为什么采用几何平均?
4.4 简述众数、中位数和均值的特点及应用场合。
4.5 简述异众比率、四分位数、方差或标准差的适用场合。
4.6 标准分数有哪些用途?
4.7 为什么要计算离散系数?
练习题
4.1 某百货公司6月份各天的销售额数据如下(单位:万元):
257
271
272
276
292
284
297
261
268
252
281
303
238
301
273
310
274
263
240
267
322
236
280
249
265
291
269
278
258
295
(1) 计算该百货公司日销售额的均值、中位数和四分位数;
(2) 计算日销售额的标准差
4.2 甲、乙两个企业生产三种产品的单位成本和总成本资料如下:
产品
名称
A
B
C
单位成本
(元)
15
20
30
甲企业
2100
3000
1500
总成本(元)
乙企业
3255
1500
1500
比较哪个企业的总平均成本高并分析其原因。
4.3 某企业有两个生产车间,甲车间有20名工人,人均日加工产品数为78件,标准差为8
件;乙车间有30名工人,人均日加工产品数为72件,标准差为10件。将两车间放在一起,
计算日加工产品数的平均值及标准差。
4.4 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17
岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。
请回答下面的问题,并解释其原因。
(1)哪一位调查研究人员在其所抽取的样本中得到少年儿童的平均身高较大?或者这两组
样本的平均身高相同?
(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这
两组样本的标准差相同?
(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调
查人员来说,这种机会是相同的?
4.5 在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,月人均收入在500
元~600元的家庭占24%,月人均收入在600元~700元的家庭占26%,在700元~800元
的家庭占29%,在800元~900元的家庭占10%,在900元~1000元的家庭占7%,在1000
元以上的占4%。你认为要分析该城市家庭的人均收入状况,用均值、众数、和中位数哪一
个测度值更好?是说明理由。
4.6 一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg;女生的
平均体重为50kg,标准差为5kg。请回答下面的问题:
(1)是男生的体重差异大还是女生的体重差异大?为什么?
(2)以磅为单位(1kg=2.2磅),求体重的平均数和标准差。
(3)粗略的估计一下,男生中有百分之几的人体重在55kg~65kg之间?
(4)粗略的估计一下,女生中有百分之几的人体重在40kg~60kg之间?
4.7一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100
分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者
在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一
项测试更为理想?
4.8 一条产品生产线平均每天的产量为3700件,标准差为50件。如果某一天的产量低于或
高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”。下面是
一周各天的产量,该生产线哪几天失去了控制?
时间
产量(件)
周一
3850
周二
3670
周三
3690
周四
3720
周五
3610
周六
3590
周日
3700
4.9 某班共有60名女生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为
6分;女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题:
(1)如果该班的男女生各占一半,全班考试成绩的平均数是多少?标准差又是多少?
(2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是
多少?
(3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是
多少?
(4)比较(1)、(2)和(3)的平均考试成绩有何变化?并解释其变化的原因。
(5)比较(2)和(3)的标准差有何变化?并解释其原因。
(6)如果该班的男女学生各占一半,全班学生中考试成绩在64.5 分~90.5的人数大概有多
少?
4.10 已知某地区农民家庭按年人均收入分组的资料如下:
按人均收入分组(元)
100以下
100~200
200~300
300~400
400~500
500~600
600以上
合 计
计算该地区平均每户人均收入的均值及标准差。
4.11 对10名成年人和10名幼儿的身高(cm)进行抽样调查,结果如下:
家庭户数占总户数比重(%)
2.3
13.7
19.7
15.2
15.1
20.0
14.0
100
成年
组
幼儿
组
166
68
169
69
172
68
177
70
180
71
170
73
172
72
174
73
168
74
173
75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的测度值?为什么?
(2)比较分析哪一组的身高差异大?
4.12 一种产品需要工人组装,现有三种可供选择的组装方法。为检验哪种方法更好,随即
抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时
间内组装的产品数量(单位:个):
方法A
164
167
168
165
170
165
164
168
164
162
163
166
167
166
165
方法B
129
130
129
130
131
130
129
127
128
128
127
128
128
125
132
方法C
125
126
126
127
126
128
127
126
127
127
125
126
116
126
125
(1)你准备采用什么方法来评价组装方法的优劣?
(2)如果让你选择一种方法,你会做出怎样的选择?试说明理由。
4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期
收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个
直方图,分别反映了200种商业类股票和200种高可以类股票的收益率分布。在股票市场上,
高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定的关系。
(1)你认为改用什么样的统计测度值来反映投资的风险?
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?
(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?
第五章 习题
思考题
5.1 解释抽样推断的含义。
5.2 解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。
5.3 比较简单随机抽样、分层抽样、系统抽样和整群抽样的特点。
5.4 什么是重复抽样和不重复抽样?
5.5 什么是抽样分布?
5.6 样本统计量的分布与总体分布的关系是什么?
5.7 样本均值抽样分布的两个主要特征值是什么?它们与总体参数有什么关系?
5.8 重复抽样和不重复抽样相比,抽样均值抽样分布的标准差有什么不同?
5.9 简述评价估计量好坏的标准。
5.10 Z
a/2
σ
n
的含义是什么?
5.11 简述样本容量与置信水平、总体方案、边际误差的关系。
练习题
5.1 从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值
x
估
计总体均值。
(1)
x
的数学期望是多少?
(2)
x
的标准差是多少?
(3)
x
的抽样分布是什么?
5.2 假定总体共有1000个单位,均值μ=32,标准差σ=5。从中抽取一个容量为30的简单随
机样本用于获得总体信息。
(1)
x
的数学期望是多少?
(2)
x
的标准差是多少?
5.3 从π=0.4的总体中,抽取一个容量为100的简单随机样本。
(1)p的数学期望是多少?
(2)p的标准差是多少?
(3)p的分布是什么?
5.4 假定总体比例为π=0.55,从该总体中分别抽取容量为100,200,500和1000的样本。
(1)分别计算样本比例的标准差σ
p
;
(2)当样本容量增大时,样本比例的标准差有何变化?
5.5从一个标准差为5 的总体中抽取一个容量为40的样本,样本均值为25,。
(1)样本均值的抽样标准差
σ
x
等于多少?
(2)在95%的置信水平下,边际误差是多少?
5.6 某快餐店想要估计每位顾客午餐的平均消费金额,在为期3周的时间里选取49名顾客
组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准差;
(2)在95%的置信水平下,求边际误差;
(3)如果样本均值为120元,求总体均值95%的置信区间。
5.7 某大学为了了解学生每天上网时间,在全校7500名学生中采取不重复抽样方法随机抽
取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):
3.3
4.4
2.1
4.7
3.1
2.0
1.9
1.4
6.2
5.4
1.2
1.2
5.8
2.6
5.1
2.9
2.3
6.4
4.3
3.5
4.1
1.8
4.2
2.4
5.4
3.5
3.6
0.5
4.5
5.7
0.8
3.6
3.2
2.3
1.5
2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。
5.8从一个正态总体中随机抽取容量为8的样本,各样本值分别为:
10 8 12 15 6 13 5 11
求总体均值95%的置信区间。
5.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样
本,他们到单位的距离(km)分别是:
10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2
求职工上班从家里到单位平均距离95%的置信区间。
5.10 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电
视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%
和95%。
5.11 某居民小区共有居民500户,小区管理者准备采取一项新的供水措施,想了解居民是
否赞成。采取不重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?
5.12 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为
120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超过
20元,应抽取多少个顾客作为样本?
5.13 某大学共有在校本科生8000人,学校想要估计每个学生一个月的生活费支出金额,准
备采取不重复抽样方法。根据前几届的毕业生资料,平均每个学生月生活费支出金额的标准
差约为50元,边际误差不超过20元,若本次估计确定的置信水平为95%,应抽取多少名
学生进行调查?
发布者:admin,转转请注明出处:http://www.yc00.com/web/1713425715a2246483.html
评论列表(0条)