第1章大数据概述

第1章 大数据概述

1、单选题:
对“数据处理阶段”描述不正确的是(      )。‏
选项:
A: 人工管理阶段
B: 文件管理阶段
C: 文本管理阶段
D: 数据库系统阶段
答案: 【 文本管理阶段

2、单选题:
不是大数据的关键技术(        )​
选项:
A: 大数据的组织
B: 大数据的分析
C: 大数据的存储
D: 大数据的可视化
答案: 【 大数据的组织

3、多选题:
大数据的主要特征是(        )‌
选项:
A: 大体量
B: 多样性
C: 大价值
D: 随机性
答案: 【 大体量;
多样性;
大价值

4、多选题:
数据库系统是由(           )的组成。​
选项:
A: 硬件环境
B: 软件环境
C: 人员
D: 数据库
答案: 【 硬件环境;
软件环境;
人员;
数据库

5、判断题:
‏分布式文件系统在物理结构上是由计算机集群中的多个节点构成的。‌
选项:
A: 正确
B: 错误
答案: 【 正确

6、判断题:
​大数据即海量的数据集合。​​​
选项:
A: 正确
B: 错误
答案: 【 错误

7、填空题:
所谓数据库,是以一定的组织方式将相关的数据组织在一起,长期存放在计算机内,可为多个用户共享,与应用程序彼此独立,__________的数据集合。‎‎‎
答案: 【 统一管理

8、填空题:
‌大数据往往表现为数据价值高,但价值__________的特点。‍
答案: 【 密度低

第2章 数据采集与预处理

第2章 数据采集与预处理 单元测验

1、单选题:
‌对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为()‎
选项:
A: 1
B: 1.8
C: 2
D: 4
答案: 【 2

2、多选题:
‎半结构化数据包括()‎
选项:
A: Excel表格
B: HTML文档
C: 银行账户上的消费记录
D: 检查身体后得到的体检报告
答案: 【 Excel表格;
HTML文档

3、多选题:
‍大数据的来源途径有许多,如下哪些属于大数据来源()‏
选项:
A: 计算机网络运行产生的日志
B: 人在微博上发表的记录
C: 传感器设备采集的数据
D: 网络爬虫得到的数据
答案: 【 计算机网络运行产生的日志;
人在微博上发表的记录;
传感器设备采集的数据;
网络爬虫得到的数据

4、判断题:
‌所谓数据的归一化处理,是指把数据变换到[0,1]区间,所以,对于数据1,2,3,4,归一化后得到的值为0.25,0.5,0.75,1‏
选项:
A: 正确
B: 错误
答案: 【 错误

5、判断题:
‍数据的平滑操作,其目的在于消除数据波动产生的噪声。‍
选项:
A: 正确
B: 错误
答案: 【 正确

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注