试卷代号:11318
国家开放大学2 0 2 4年春季学期期末统一考试
社会统计学 试题
2024年7月
注意事项:
1.将你的学号、姓名及考点名称填写在试题和答题纸的规定栏内。考试结束后,把试题和答题纸放在桌上。试题和答题纸均不得带出考场。待监考人员收完试题和答题纸后方 可离开考场。
2.仔细阅读题目的说明,并按题目要求答题。所有答案必须写在答题纸的指定位置上,写在试题上的答案无效。
3.用蓝、黑圆珠笔或钢笔(含签字笔)答题,使用铅笔答题无效。
一、单项选择题(每题只有一个正确答案。每题2分,共20分)
1.为了调查某校社会工作专业200名学生的实务能力,需要抽取50人进行调查。调查员首先找到这200名学生的名单,并将所有学生从1到200编号,用200张小纸条分别写上001、002、003、…、200,然后将这些小纸条放入一个空盒子中,搅拌后,随意抽出50张小纸条,然后按照号码找到对应的学生进行调查。这种抽样方式是( )。
A.简单随机抽样 B.系统抽样
C.分层抽样 D.多阶段抽样
2.为了解某地区8万户家庭的消费情况,从该地区随机抽取5000户家庭进行调查,其中80%的家庭月消费在3000元以上,20%的家庭每月用于通讯、网络的费用在300元以上,则该研究的样本是( )。
A.8万户家庭 B.5000户家庭
C .80%家庭的月消费 D.20%家庭的月消费
3.某班级学生平均每学期的实习时长可以分为以下六组:1)50小时及以下;2)50-60小时;3)60-70小时;4)70-80小时;5)80-90小时;6)90小时及以上,该分组的组距是( )。
A.5 B.10
C.15 D.20
4.对于右偏分布,平均数、中位数和众数之间的关系是( )。
A.平均数>中位数>众数 B.中位数>平均数>众数
C.众数>中位数>平均数 D.众数>平均数>中位数
5.有甲、乙两人同时打靶,各打10靶。甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下关于甲、乙两人打靶的稳定性水平表述正确的是( )。
A.甲的离散程度小,稳定性水平低 B.甲的离散程度大,稳定性水平高
C.乙的离散程度小,稳定性水平低 D.乙的离散程度大,稳定性水平低
6.在回归方程中,若回归系数等于O,这表明( )。
A.因变量y对自变量x的影响是不显著的
B.自变量x对因变量y的影响是不显著的
C.因变量y对自变量x的影响是显著的
D.自变量x对因变量y的影响是显著的
7.对消费的回归分析中,学历,年龄、户口、性别、收入都是自变量,其中收入的回归系数为1。6,这表明( )。
A.收入每增加1元,消费增加1.6元 B.收入对消费影响的显著性为1.6
C.收入与消费的相关系数为1.6 D.消费每增加1元,收入增加1.6元
8.以下四种不同特征的散点图,哪一个属于负线性相关( )。
9.残差平方和(SSE)反映了y的总变差中( )。
A.由于x与y之间的线性关系引起的y的变化部分
B.除了x对y的现有影响之外的其他因素对y变差的影响
C.由于x与y之间的非线性关系引起的y的变化部分
D.由于x与y之间的函数关系引起的y的变化部分
10.下表是某单位工作人员年龄分布表,该组数据的中位数出现在( )。
组别
按年龄分组(岁))
工作人员数(人)
1
20~24
6
2
25~29
14
3
30~34
24
4
35~39
18
5
40~44
12
6
45~49
18
7
50~54
14
8
55~59
6
合计
112
A.第5组 B.第4组
C.第3组 D.第2组
二、名词解释(每小题5分,共20分)
11.滚雪球抽样
12.中心极限定理
13.置信区间
14.虚无假设与替换假设
三、简答题(每题10分,共30分)
15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。
(1)使用电脑的品牌
(2)上周收到的电子邮件数量
(3)每月用于网上购物的金额
(4)上网是否玩游戏
(5)发表论文的数量
16.简述直方图与条形图的区别。
17.简述相关系数的取值与意义。
四、计算题(每题15分,共30分)
18.某行业管理局所属40个企业2011年产品销售额数据如下所示。
40个企业2011年产品销售额
企业编号
销售额
企业编号
销售额
企业编号
销售额
企业编号
销售额
1
152
11
105
21
103
31
136
2
105
12
123
22
103
32
146
3
117
13
116
23
137
33
127
4
97
14
115
24
138
34
135
5
124
15
110
25
91
35
117
6
119
16
115
26
118
36
113
7
108
17
100
27
120
37
104
8
88
18
87
28
112
38
125
9
129
19
107
29
95
39
108
10
115
20
119
30
142
40
126
要求:
(1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。
(2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。
19.为估计某地区每个家庭日均生活用水量为多少,抽取了450个家庭的简单随机样本,得到样本均值为200升,样本标准差为50升。
(1)试用95%的置信水平,计算该地区家庭日均用水量的置信区间。
(2)在所调查的450个家庭中,女性为户主的为180个。以95%的置信水平,计算女性为户主的家庭比例的置信区间。
注:Z0.025=1.96