大学MOOC 应用统计与R语言(南京大学)1463195163 最新慕课完整章节测试答案
专题一统计简介
专题一单元测验
1、单选题:
在纽约市盘查的案例中,利用统计分析问题的步骤的顺序是:①收集数据;②进行分析解释;③统计推断;④数据展示;
选项:
A: ①②③④
B: ①④③②
C: ①④②③
D: ①③②④
答案: 【 ①④③②】
2、单选题:
在李贤平研究《红楼梦》作者的案例中,李贤平为何选择各个虚词出现的次数进行统计分析?
选项:
A: 虚词次数易于统计。
B: 虚词出现的次数代表作者的语言风格。
C: 虚词的个数、种类比实词少。
D: 研究者的研究偏好,也可以利用各个实词出现的次数进行统计。
答案: 【 虚词出现的次数代表作者的语言风格。】
3、多选题:
概率论和统计都是研究随机现象,找寻的规律学科。
选项:
A: 概率论和统计都是研究随机现象,找寻的规律学科。
B: 概率论以随机变量为出发点,用随机变量描述随机现象。
C: 统计以数据为出发点,用数据描述随机现象。
D: 利用统计研究随机现象时能完全准确地推测分布的所有信息。
答案: 【 概率论和统计都是研究随机现象,找寻的规律学科。;
概率论以随机变量为出发点,用随机变量描述随机现象。;
统计以数据为出发点,用数据描述随机现象。】
4、多选题:
为什么要学习统计?
选项:
A: 大数据时代已经来临,数据无处不在,统计无处不在。
B: 利用统计可以汇总数据,把握数据的规律。
C: 统计是一种科学方法/工具,利用统计可以证明结论或解释现象。
D: 利用统计可以辅助决策。
答案: 【 大数据时代已经来临,数据无处不在,统计无处不在。;
利用统计可以汇总数据,把握数据的规律。;
统计是一种科学方法/工具,利用统计可以证明结论或解释现象。;
利用统计可以辅助决策。】
5、多选题:
在出租车颜色的案例中,哪些因素可能会使不同颜色出租车所属公司的车祸率出现差别?
选项:
A: 不同颜色出租车所属公司的经营结构不同。
B: 不同颜色出租车所属公司的司机驾驶能力不同。
C: 不同颜色出租车所属公司的公司驾驶习惯不同。
D: 不同颜色出租车所属公司的的车辆的其他差异。
答案: 【 不同颜色出租车所属公司的经营结构不同。;
不同颜色出租车所属公司的司机驾驶能力不同。;
不同颜色出租车所属公司的公司驾驶习惯不同。;
不同颜色出租车所属公司的的车辆的其他差异。】
6、多选题:
在中国工商银行的设施选址案例中,进行决策时需要进行哪些步骤
选项:
A: 搜集居民点的相关数据。
B: 进行数据分析,预测商业潜力。
C: 建立设施选址的相关模型。
D: 实施方案,验证效果。
答案: 【 搜集居民点的相关数据。;
进行数据分析,预测商业潜力。;
建立设施选址的相关模型。;
实施方案,验证效果。】
专题七假设检验(一)
专题七单元测试
1、单选题:
总体服从正态分布、方差未知时,单个总体均值的假设检验的统计量为
选项:
A: 
B: 
C: 
D: 
答案: 【
】
2、单选题:
对某批产品的平均寿命进行假设检验,如果在显著性水平0.05下接受了零假设,则在显著水平
=0.1下
选项:
A: 接受零假设
B: 拒绝零假设
C: 可能接受也可能拒绝零假设
D: 不接受也不拒绝零假设
答案: 【 可能接受也可能拒绝零假设】
3、多选题:
以下关于假设检验中的显著性水平
的说法,正确的有:
选项:
A: 取值是研究者事先约定的.
B: 是允许“错误地拒绝原假设”的最大概率
C: 取值等于0.05
D: 拒绝原假设犯错的代价越大,
的取值应该也越大
答案: 【 取值是研究者事先约定的.;
是允许“错误地拒绝原假设”的最大概率】
4、多选题:
以下关于观测到的显著性水平(p值)的说法正确的是
选项:
A: 取值是研究者事先约定的
B: 是在原假设成立的情况下,统计量的取值出现当前的观测值甚至比当前值更极端情况的概率
C: 是“拒绝原假设犯错”的概率
D: 取值越大越支持备择假设
答案: 【 是在原假设成立的情况下,统计量的取值出现当前的观测值甚至比当前值更极端情况的概率;
是“拒绝原假设犯错”的概率】
5、多选题:
以下关于小概率事件的说法正确的是
选项:
A: 一次实验或者抽样中,几乎不会发生的事件
B: 一次抽样的结果是不是小概率事件完全由p值决定
C: 一次抽样的结果是不是小概率事件完全由显著性水平
决定
D: 发生的概率小于显著性水平
的随机事件
答案: 【 一次实验或者抽样中,几乎不会发生的事件;
发生的概率小于显著性水平
的随机事件】
6、多选题:
以下关于原假设和备择假设的说法正确的是
选项:
A: 原假设和备择假设是互斥的
B: 原假设一定成立,备择假设不一定成立
C: 应该把不能轻易拒绝的假设作为原假设
D: 应该把不能轻易拒绝的假设作为备择假设
答案: 【 原假设和备择假设是互斥的;
应该把不能轻易拒绝的假设作为原假设】
7、多选题:
以下哪一项是不完备的右边的假设检验
选项:
A: 
B: 
C: 
D: 
答案: 【
;
】
8、多选题:
以下关于单个正态总体均值的假设检验的拒绝域的说法,正确的有
选项:
A: 完备的左边的假设检验的拒绝域在统计量取值的左边区域
B: 不完备的假设检验的拒绝域包含两个部分
C: 双边的假设检验的拒绝域包含两个部分
D: 不完备的右边的假设检验的拒绝域在统计量取值的右边区域
答案: 【 完备的左边的假设检验的拒绝域在统计量取值的左边区域;
双边的假设检验的拒绝域包含两个部分;
不完备的右边的假设检验的拒绝域在统计量取值的右边区域】
专题三数据的描述和展示
专题三单元测验
1、单选题:
在男女学术生涯公平性研究案例中,以下哪个R语言代码可以绘制如图所示的折线图?
选项:
A: ggplot(data, aes(x=time,y=papers,color=gender))+geom_line()+labs(x='Decade of career end',y='number of papers')
B: ggplot(data, aes(x=time,y=papers,color=gender))+geom_line()+labs('Decade of career end','number of papers')
C: ggplot(data, aes(x='time',y='papers',color='gender'))+geom_line()+labs(x='Decade of career end',y='number of papers')
D: ggplot(data, aes(x='time',y='papers',color='gender'))+geom_line()+labs('Decade of career end','number of papers')
答案: 【 ggplot(data, aes(x=time,y=papers,color=gender))+geom_line()+labs(x='Decade of career end',y='number of papers')】
2、单选题:
请问通过以下个指令可以画出如图所示的散点图?
选项:
A: library(ggplot2)data("mtcars")ggplot(mtcars, aes(wt, mpg)) + geom_point(color = "blue")
B: library(ggplot2)data("mtcars")ggplot(mtcars, aes(wt, mpg))
C: library(ggplot2)data("mtcars")ggplot(mtcars, aes(wt, mpg)) + geom_point(aes(color = "blue"))
D: library(ggplot2)data("mtcars")ggplot(mtcars, aes(wt, mpg)) + geom_point(color = blue)
答案: 【 library(ggplot2)data("mtcars")ggplot(mtcars, aes(wt, mpg)) + geom_point(color = "blue") 】
3、多选题:
在男女学术生涯公平性的案例研究,可以采用下列哪些方法进行研究?
选项:
A: 实验研究。
B: 描述性统计。
C: 统计推断。
D: 另外三个选择都正确。
答案: 【 描述性统计。;
统计推断。】
4、多选题:
下列关于描述性统计的说法正确的是:
选项:
A: 运用制表、图形、计算等概括性数据描述数据变量。
B: 可以用于描述变量的位置信息和分布信息。
C: 可以用图形描述变量的变化趋势。
D: 通常可以发现异常数据。
答案: 【 运用制表、图形、计算等概括性数据描述数据变量。;
可以用于描述变量的位置信息和分布信息。;
可以用图形描述变量的变化趋势。;
通常可以发现异常数据。】
5、多选题:
关于中心位置描述,以下说法正确的是:
选项:
A: 中位数和平均值都可以用来描述中心位置。
B: 中位数相比平均值而言更容易计算。
C: 平均值相比中位数而言更稳定。
D: 在描述中心位置时,要根据具体情形决定是使用中位数还是平均值。
答案: 【 中位数和平均值都可以用来描述中心位置。;
在描述中心位置时,要根据具体情形决定是使用中位数还是平均值。】
6、多选题:
在利用五数概括描述变量的分布时,需要用到哪些数值?
选项:
A: 第一分位数
B: 中位数
C: 第三分位数
D: 三分之一分位数
答案: 【 第一分位数;
中位数;
第三分位数】
7、多选题:
在马科维兹提出的现代证券投资组合理论中,下列说法正确的是:
选项:
A: 利用均值可以估计预期收益
B: 利用方差可以估计预期风险
C: 利用中位数可以估计预期收益
D: 利用CVaR可以估计预期风险
答案: 【 利用均值可以估计预期收益;
利用方差可以估计预期风险;
利用中位数可以估计预期收益;
利用CVaR可以估计预期风险】
8、多选题:
以下关于图形可视化中好的图像所满足的要求说法正确的是:
选项:
A: 图像要能明确表达意图
B: 图像要能明确主题、数据来源
C: 图形中的各项标识、刻度都清楚
D: 图像要容易对于各项做比较
答案: 【 图像要能明确表达意图;
图像要能明确主题、数据来源;
图形中的各项标识、刻度都清楚;
图像要容易对于各项做比较】
9、多选题:
以下关于直方图的说法正确的是:
选项:
A: 直方图可以直观地显示各组之间的频数或者频率,可用于各组之间的比较。
B: 通过直方图可以获得变量分布的大致形状、偏斜情况。
C: 通过直方图可以发现样本的异常值。
D: 在绘制直方图时分组越多越好。
答案: 【 直方图可以直观地显示各组之间的频数或者频率,可用于各组之间的比较。;
通过直方图可以获得变量分布的大致形状、偏斜情况。;
通过直方图可以发现样本的异常值。】
10、多选题:
对于图形的优化说法正确的是:
选项:
A: 图形优化的目标是更好的表述信息、更容易比较、图形更清晰。
B: 可以通过坐标系的选择对图形进行优化。
C: 可以通过对图形的种类和颜色进行调整进而优化图形。
D: 可以对变量的标识、定性变量的顺序做出改善进而优化图形。
答案: 【 图形优化的目标是更好的表述信息、更容易比较、图形更清晰。;
可以通过坐标系的选择对图形进行优化。;
可以通过对图形的种类和颜色进行调整进而优化图形。;
可以对变量的标识、定性变量的顺序做出改善进而优化图形。】
专题九相关性与预测
专题九单元测试
1、单选题:
进行预测时,要求输入变量和输出变量具有什么关系?
选项:
A: 因果关系
B: 共同反应
C: 交叉影响
D: 相关性
答案: 【 相关性】
2、单选题:
关于多元线性回归公式正确的是:
选项:
A: 
B: 
C: 
D: 
答案: 【
】
3、多选题:
相关性关系包括:
选项:
A: 因果关系
B: 共同反应
C: 交叉影响
D: 互斥关系
答案: 【 因果关系;
共同反应;
交叉影响】
4、多选题:
下面关于双向表检验正确的有
选项:
A: 双向表可用于随机变量独立性的检验。
B: 检验中构造的特殊随机变量严格服从卡方分布。
C: 检验中构造的特殊随机变量近似服从卡方分布。
D: 由于潜在变量的影响,可能存在辛普森悖论。
答案: 【 双向表可用于随机变量独立性的检验。;
检验中构造的特殊随机变量近似服从卡方分布。;
由于潜在变量的影响,可能存在辛普森悖论。】
5、多选题:
