大学MOOC R语言数据分析与挖掘(中央财经大学)1463189161 最新慕课完整章节测试答案
第一章R语言基础
文章目录
单元测试
1、单选题:
下面关于修改向量 x<-c(1,2,-1,-3,-5) 的说法错误的是
选项:
A: 执行语句 x[1]<-0 后,x的值为 0,2,-1,-3,-5
B: 执行语句 x[c(1,5)]<-0 后,x的值为 0,2,-1,-3,0
C: 执行语句 x<-0 后,x的值为 0,0,0,0,0
D: 执行语句 x<-0 后,x的值为 0
答案: 【 执行语句 x<-0 后,x的值为 0,0,0,0,0】
2、单选题:
假设 y<-c( 1,2,3,-1,0,2), 那么关于语句 y[c(-2,-3)],说法正确的是
选项:
A: 该语句存在语法错误
B: 该语句选取y的第2和第3个元素
C: 执行该语句不会改变y的长度
D: 执行该语句将改变y的长度
答案: 【 执行该语句不会改变y的长度】
3、单选题:
下面哪些方式可以查看到帮助文档
选项:
A: ?mean
B: help(mean)
C: A和B都不正确
D: A和B都正确
答案: 【 A和B都正确】
4、单选题:
关于 attach( ) 函数说法正确的是
选项:
A: 把数据库加载到R的搜索空间
B: 与detach( )的功能不同
C: 执行 attach( ) 加载数据库后,可以直接访问该数据库中的一些对象
D: 以上都正确
答案: 【 以上都正确】
5、单选题:
下面哪些是R可以存储的数据对象
选项:
A: 矩阵
B: 数据框
C: 列表框
D: 以上都正确
答案: 【 以上都正确】
6、判断题:
x<-2,x的类型是Integer。
选项:
A: 正确
B: 错误
答案: 【 错误】
7、判断题:
常用的R的赋值方式有:=(等号)、<-(向左) 和 ->(向右) 赋值三种方式。
选项:
A: 正确
B: 错误
答案: 【 正确】
8、判断题:
x<-1:10,x是向量。
选项:
A: 正确
B: 错误
答案: 【 正确】
9、判断题:
x<-c(-1:-5),该语句存在语法错误。
选项:
A: 正确
B: 错误
答案: 【 错误】
10、判断题:
x<-seq(1,2, 0.5),执行该语句后,x的取值为:1, 1.5 和 2。
选项:
A: 正确
B: 错误
答案: 【 正确】
11、判断题:
x=rep("1",2), 执行该语句后x的取值为1,1。
选项:
A: 正确
B: 错误
答案: 【 错误】
12、判断题:
假设 x<-c(1,-2, 3, 5, 8),那么取x的第二个元素的语句为 x[1]。
选项:
A: 正确
B: 错误
答案: 【 错误】
13、判断题:
RData只能存放一个数据对象。
选项:
A: 正确
B: 错误
答案: 【 错误】
14、判断题:
read.table( ) 函数主要用于读取 .txt 文件。
选项:
A: 正确
B: 错误
答案: 【 正确】
15、判断题:
在不加载任何R包的情况下,R能够直接读取 .xlsx 文件。
选项:
A: 正确
B: 错误
答案: 【 错误】
第二章数据分析基础
单元测试
1、单选题:
若从正态分布总体中抽样得到一组样本,样本的值为 1, -1, 2, 3, 4, 5, 1, 2, 4, 3,那么样本的中位数为
选项:
A: 2
B: 2.5
C: 3
D: 4
答案: 【 2.5】
2、单选题:
若从正态分布总体中抽样得到一组样本,样本的值为7, 7, 5, 2, 5, 4, 7, 9, 4, 8,那么样本的众数为
选项:
A: 4
B: 5
C: 7
D: 8
答案: 【 7】
3、单选题:
最大值与最小值之间的差值称为
选项:
A: 四分位差
B: 范围
C: 极差
D: 方差
答案: 【 极差】
4、单选题:
关于变异系数的说法正确的是
选项:
A: 变异系数能够反映数据的离散程度
B: 变异系数越大,数据越分散
C: 可以用样本的变异系数来比较多个样本的离散程度
D: 以上答案都正确
答案: 【 以上答案都正确】
5、多选题:
若从正态分布总体中抽样得到一组样本,样本的值为 1, -1, 2, 3, 4, 5, 1, 2, 4, 3, 4, 4, 那么下面哪些说法是正确的
选项:
A: 若要计算该样本的中位数,需要先对其进行排序
B: 该样本只有一个众数
C: 该样本的极差为6
D: 该样本的标准差为3.16(只保留两位小数)
答案: 【 若要计算该样本的中位数,需要先对其进行排序;
该样本只有一个众数;
该样本的极差为6】
6、多选题:
下面哪些指标可以用来度量数据的分布形状
选项:
A: 标准分数
B: 变异系数
C: 偏度系数
D: 峰度系数
答案: 【 偏度系数;
峰度系数】
7、判断题:
总体是全部待研究的对象。
选项:
A: 正确
B: 错误
答案: 【 正确】
8、判断题:
数据通常被组织为变量和个体,变量即要测量的某种特征,个体即样本。
选项:
A: 正确
B: 错误
答案: 【 正确】
9、判断题:
按照计量尺度的不同,变量可以分为分类变量和定性变量。
选项:
A: 正确
B: 错误
答案: 【 错误】
10、填空题:
计算四分位数的函数是()
答案: 【 quartile()】
11、填空题:
若样本的均值为400,方差为1600,那么其变异系数为 ()
答案: 【 0.1】
第三章数据可视化
单元测试
1、多选题:
分类变量用下面哪些图形来描述较为合适
选项:
A: 直方图
B: 条形图
C: 饼图
D: 箱线图
答案: 【 条形图;
饼图】
2、多选题:
分类变量用哪些统计量来描述较为合适
选项:
A: 频数
B: 比例
C: 比率
D: 极差
答案: 【 频数;
比例;
比率】
3、多选题:
下面哪些图形用来描述数值变量的分布情况更为恰当
选项:
A: 直方图
B: 概率密度曲线
C: 箱线图
D: 折线图
答案: 【 直方图;
概率密度曲线;
箱线图】
4、多选题:
下面哪些说法是正确的
选项:
A: 可以用点图展示数值变量的分布形状
B: 点图不可以用来展示数值变量的分布形状
C: 在不对数值变量进行任何处理的情况下,使用条形图展示数值变量的分布形状是恰当的
D: 在对数值变量离散化处理的情况下,可以使用条形图展示数值变量的分布形状
答案: 【 可以用点图展示数值变量的分布形状;
在对数值变量离散化处理的情况下,可以使用条形图展示数值变量的分布形状】
5、多选题:
下面关于table( )函数说法正确的是
选项:
A: table( )函数能够用来制作一维列联表
B: table( )函数不能用来制作三维及以上的列联表
C: table( )函数本质是实现分类变量的频数统计
D: table( )函数可以用来制作交叉表
答案: 【 table( )函数能够用来制作一维列联表;
table( )函数本质是实现分类变量的频数统计;
table( )函数可以用来制作交叉表】
6、填空题:
制作散点图所使用的函数是()。
答案: 【 plot()】
7、填空题:
我们可以直接使用gmodels包中()函数来制作二维交叉表。
答案: 【 CrossTable()】
第七章参数估计
单元测试
1、单选题:
关于置信区间的构造,正确的是
选项:
A: 置信区间的宽度不会受到样本量的影响
B: 置信区间的宽度不会受到置信水平的影响
C: 置信区间的宽度会受到总体方差或样本方差的影响
D: 置信区间的宽度会受到样本均值的影响
答案: 【 置信区间的宽度会受到总体方差或样本方差的影响】
2、单选题:
关于总体均值置信区间的构造,说法正确的是
选项:
A: 置信区间由点估计标准误来构造
B: 置信区间由点估计分位数来构造
C: 置信区间由点估计分位数标准误来构造
D: 置信区间由点估计标准误分位数来构造
答案: 【 置信区间由点估计分位数标准误来构造】
3、单选题:
在构造总体均值的置信区间的过程中,首先需要确定分位数,关于分位数确定正确的是
选项:
A: 分位数只由样本量决定
B: 分位数只由总体方差是否已知决定
C: 分位数同时由样本量和总体方差是否已知决定
D: 分位数不由样本量和总体方差是否已知决定
答案: 【 分位数同时由样本量和总体方差是否已知决定】
4、单选题:
关于两个总体均值之差的置信区间的形式说法正确的是
选项:
A: 两个总体均值之差的点估计±标准差
B: 两个总体均值之差的点估计±标准误
C: 两个总体均值之差的点估计±分位数×标准差
D: 两个总体均值之差的点估计±分位数×标准误
答案: 【 两个总体均值之差的点估计±分位数×标准误】
5、单选题:
关于配对的两个总体均值之差的置信区间的说法正确的是
选项:
A: 要对配对样本标准化,得到标准化序列
B: 要先对配对样本做差值,得到差值序列
C: 要先对配对样本求和,得到求和序列
D: 要先求各个样本的均值、标准差等统计量
答案: 【 要先对配对样本做差值,得到差值序列】
6、单选题:
下面哪个是一个总体比例的置信区间
选项:
A:
,其中样本量n非常大,且p是总体比例
B:
,对样本量n无要求,且p是总体比例
C:
,其中样本量n非常大,且p是样本比例
D:
,对样本量n无要求,且p是样本比例
答案: 【
,对样本量n无要求,且p是样本比例】
7、单选题:
关于一个总体方差的置信区间的估计说法正确的是
选项:
A: 置信区间总是包含0
B: 置信区间总是小于等于0
C: 置信区间总是大于等于0
D: 置信区间对称
答案: 【 置信区间总是大于等于0】
8、单选题:
关于两个正态总体比例之比的置信区间,正确的是
选项:
A: 置信区间有可能会包含0
B: 置信区间不可能包含0
C: 置信区间的形式为:点估计标准误
D: 置信区间的宽度不会受到样本量的影响
答案: 【 置信区间不可能包含0】
9、单选题:
若X来自正态分布的一个样本,其样本量为100,样本均值为25.21,样本标准差为10,那么它的(95%)的置信区间为?已知
,
。
选项:
A: [23.25, 27.17]
B: [23.55, 26.87]
C: [-23.25, 27.17]
D: [-23.55, 26.87]
答案: 【 [23.25, 27.17]】
10、单选题:
若X是来自正态分布的一个样本,其样本量为20,样本均值为10.2,样本标准差为10,那么它的(95%)的置信区间的下界为(保留2位小数点)?已知
,
