大学MOOC 大数据分析与预测技术(山东财经大学)1459726161 最新慕课完整章节测试答案
第一章 理解大数据
第一章 理解大数据单元测试
1、单选题:
有关大数据分析与预测的过程认识正确的是?
选项:
A: 大数据分析与预测一般需要人的参与,只要把数据输入合适的算法就可以得到有用的结果。
B: A零售企业的客户行为数据分析得到的规律也可以直接用于B零售企业。
C: 大数据分析与预测得到的结果需要通过检验样本的测试,甚至需要在现实中实验才能投入使用。
D: 大数据分析与预测的问题一般都是用户给定的,因此不需要与用户交流和调研。
答案: 【 大数据分析与预测得到的结果需要通过检验样本的测试,甚至需要在现实中实验才能投入使用。】
2、单选题:
有关数据质量的认识正确的是?
选项:
A: 数据质量一般可以由机器自动完成,不需要数据分析人员参与。
B: 数据预处理就是删除有问题的数据。
C: 各种数据质量问题对机器学习算法的影响很大,因此需要充分预处理才能进入建模阶段。
D: 有些机器学习算法具有比较强的抗噪型,因此不需要预处理也能得到有用的规律。
答案: 【 各种数据质量问题对机器学习算法的影响很大,因此需要充分预处理才能进入建模阶段。】
3、单选题:
如果以药品B来代替药品A的使用,那么这个病人生存的几率有多大?这种分析属于:
选项:
A: 描述性分析
B: 诊断性分析
C: 预测性分析
D: 规范性分析
答案: 【 预测性分析】
4、单选题:
组织通过销售数据或洞察以创造新的收入来源,这属于大数据应用成熟度的哪一个阶段?
选项:
A: 业务监控
B: 业务优化
C: 业务转型
D: 数据货币化
E: 业务洞察
答案: 【 数据货币化】
5、单选题:
根据患者的视网膜图像等相关医疗信息,使用机器学习算法进行建模,预测患者患糖尿病的可能性。这个任务需要以下使用哪一类机器学习算法?
选项:
A: 监督学习
B: 无监督学习
C: 统计分析
D: 诊断性分析
答案: 【 监督学习】
6、多选题:
以下哪些情景可以使用大数据分析与预测建模技术?
选项:
A: 统计某零售超市一个月内哪类牛奶的销量最大
B: 保险公司的骗保分析
C: 预测电商网站某商品未来的销售量
D: 预测某移动运营商客户转移到竞争对手的可能性
答案: 【 保险公司的骗保分析;
预测电商网站某商品未来的销售量;
预测某移动运营商客户转移到竞争对手的可能性】
7、多选题:
下面有关机器学习正确的说法是?
选项:
A: 机器学习可以从有限的样本数据中得到有用的规律,并能对新样本进行一定的泛化预测。
B: 机器学习就是简单的统计分析。
C: 每种机器学习算法都有一定的使用范围,只能处理某类数据和问题。
D: 在机器学习过程中,需要人的经验指导数据的选择、噪声的消除、合适算法的选择以及调参等工作。
答案: 【 机器学习可以从有限的样本数据中得到有用的规律,并能对新样本进行一定的泛化预测。;
每种机器学习算法都有一定的使用范围,只能处理某类数据和问题。;
在机器学习过程中,需要人的经验指导数据的选择、噪声的消除、合适算法的选择以及调参等工作。】
8、多选题:
大数据分析的预测建模任务主要包括哪几大类问题?
选项:
A: 关联分析
B: 回归
C: 模式发现
D: 分类
答案: 【 关联分析;
模式发现;
分类】
9、多选题:
下列哪些分析需要机器学习?
选项:
A: 预测移动运营商用户未来使用的网络流量
B: 比较不同移动运营商用户对漫游业务的使用量
C: 寻找移动运营商用户对某类套餐使用的潜在客户
D: 统计移动运营商的用户在某段时间对短信的使用数量
答案: 【 预测移动运营商用户未来使用的网络流量;
寻找移动运营商用户对某类套餐使用的潜在客户】
10、判断题:
NoSQL数据库作为非关系型数据库,只能够用来存储非结构数据。
选项:
A: 正确
B: 错误
答案: 【 错误】
11、判断题:
构建模型后使用标准指标来评估模型性能,确定其是否符合业务目标,成为大数据的模型评估。
选项:
A: 正确
B: 错误
答案: 【 正确】
12、判断题:
关联规则的评价标准有准确性,精确度和召回率等。
选项:
A: 正确
B: 错误
答案: 【 错误】
第二章 大数据预处理
第二章 大数据预处理单元测试
1、单选题:
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?
选项:
A: 频繁模式挖掘
B: 分类和预测
C: 数据预处理
D: 数据流挖掘
答案: 【 数据预处理】
2、单选题:
下面哪个步骤不属于数据预处理的过程?
选项:
A: 数据清洗
B: 数据转换
C: 数据归约
D: 分类和预测
答案: 【 分类和预测】
3、单选题:
下面哪种不属于数据预处理的方法?
选项:
A: 变量代换
B: 离散化
C: 聚集
D: 估计遗漏值
答案: 【 估计遗漏值】
4、单选题:
以下哪种方法不属于特征选择的标准方法
选项:
A: 嵌入
B: 过滤
C: 包装
D: 抽样
答案: 【 抽样】
5、单选题:
下面不属于创建新属性的相关方法的是
选项:
A: 特征提取
B: 特征修改
C: 映射数据到新的空间
D: 特征构造
答案: 【 特征修改】
6、多选题:
数据清洗包括以下哪几个方面?
选项:
A: 缺失数据处理方法
B: 噪声数据平滑技术
C: 时间相关数据的处理
D: 按标准差进行的标准化
答案: 【 缺失数据处理方法;
噪声数据平滑技术;
时间相关数据的处理】
7、多选题:
以下哪几个是数据归约的策略?
选项:
A: 离散化和概念分层产生
B: 数值归约
C: 数据压缩
D: 维度归约
E: 数据立方体聚集
答案: 【 离散化和概念分层产生;
数值归约;
数据压缩;
维度归约;
数据立方体聚集】
8、多选题:
以下哪些是数据离散化技术?
选项:
A: ChiMerge技术
B: 基于熵的离散化
C: 分箱技术
D: 饼图分析
答案: 【 ChiMerge技术;
基于熵的离散化;
分箱技术】
9、多选题:
特征选择的目标有哪些?
选项:
A: 提高数据挖掘模型的性能
B: 提供更快、性价比更高的学习过程
C: 更好地理解生成数据的基本过程
D: 挖掘多个抽象层上的数据
答案: 【 提高数据挖掘模型的性能;
提供更快、性价比更高的学习过程;
更好地理解生成数据的基本过程】
10、多选题:
特征选择算法一般分为那几类?
选项:
A: 特征排列算法
B: 子集选择算法
C: 基于熵的离散化
D: 分箱技术
答案: 【 特征排列算法;
子集选择算法】
11、判断题:
不同的特征选择方法可以得出不同的归约数据集。
选项:
A: 正确
B: 错误
答案: 【 正确】
12、判断题:
特征构造是一个过程,它通过推断或创建附加的特征来发现特征之间联系的缺失信息和扩展特征空间。
选项:
A: 正确
B: 错误
答案: 【 正确】
13、判断题:
数据的离散化是将数据按比例缩放,使之落入一个小的特定区间。
选项:
A: 正确
B: 错误
答案: 【 错误】
14、判断题:
ChiMerge是一种自动化的规约算法,它使用X2统计来分析已知特征的多个区间的质量。
选项:
A: 正确
B: 错误
答案: 【 错误】
第三章 分类预测模型
第四章 聚类模型与算法
第四章 聚类模型与算法单元测试
1、单选题:
有关聚类算法不正确的说法是?
选项:
A: 把分析的样本根据距离分组
B: 必须给出聚类的组数
C: 聚类是分类的基础
D: 聚类算法可以找出每组样本不同的特征
答案: 【 必须给出聚类的组数】
2、单选题:
下列说法错误的是?
选项:
A: 在聚类分析中,簇之间的相似性越大,簇内样本的差别越大,聚类的效果就越好
B: 聚类分析可以看作是一种非监督的样本分组过程
C: k均值算法是一种常用的聚类算法,簇的个数算法不能自动
