大学MOOC 大数据原理与技术（研究生用）(深圳大学)1453586169 最新慕课完整章节测试答案

第1讲大数据概述

文章目录

第1讲大数据概述
第2讲大数据处理架构Hadoop
第4讲分布式数据库HBase
第5讲NoSQL数据库
第6讲云数据库
第8讲数据仓库Hive
第9讲Hadoop再探讨
第10讲Spark
第11讲流计算
第12讲图计算
第13讲大数据在不同领域的应用

第1讲大数据概述章节单元测验

1、单选题：
‍第三次信息化浪潮的标志是：‏
选项：
A: 个人电脑的普及
B: 互联网的普及
C: 云计算、大数据、物联网技术的普及
D: 虚拟现实技术的普及
答案: 【云计算、大数据、物联网技术的普及】

2、单选题：
‏就数据的量级而言，1PB数据是多少TB？‎
选项：
A: 512
B: 1024
C: 1000
D: 2048
答案: 【 1024】

3、单选题：
‏以下关于云计算、大数据和物联网之间的关系，论述错误的是：‍
选项：
A: 云计算侧重于数据分析
B: 云计算、大数据和物联网三者紧密相关，相辅相成
C: 物联网可以借助于云计算实现海量数据的存储
D: 物联网可以借助于大数据实现海量数据的分析
答案: 【云计算侧重于数据分析】

4、单选题：
‏以下哪个不是大数据时代新兴的技术：‌
选项：
A: Hadoop
B: Spark
C: HBase
D: MySQL
答案: 【 MySQL】

5、单选题：
‍每种大数据产品都有特定的应用场景，以下哪个产品是用于批处理的：
选项：
A: MapReduce
B: Pregel
C: Dremel
D: Storm
答案: 【 MapReduce】

6、单选题：
‌每种大数据产品都有特定的应用场景，以下哪个产品是用于流计算的：‌
选项：
A: GraphX
B: S4
C: Hive
D: Impala
答案: 【 S4】

7、单选题：
每种大数据产品都有特定的应用场景，以下哪个产品是用于图计算的：‏
选项：
A: Cassandra
B: Flume
C: Storm
D: Pregel
答案: 【 Pregel】

8、单选题：
‏每种大数据产品都有特定的应用场景，以下哪个产品是用于查询分析计算的：
选项：
A: MapReduce
B: HDFS
C: Dremel
D: S4
答案: 【 Dremel】

9、多选题：
‏数据产生方式大致经历了三个阶段，包括：
选项：
A: 运营式系统阶段
B: 用户原创内容阶段
C: 感知式系统阶段
D: 移动互联网数据阶段
答案: 【运营式系统阶段;
用户原创内容阶段;
感知式系统阶段】

10、多选题：
‍大数据发展的三个阶段是：
选项：
A: 萌芽期
B: 低谷期
C: 成熟期
D: 大规模应用期
答案: 【萌芽期;
成熟期;
大规模应用期】

11、多选题：
‌大数据的4V特性包括：‍
选项：
A: 数据量大
B: 数据新颖
C: 数据类型繁多
D: 处理速度快
E: 价值密度低
答案: 【数据量大;
数据类型繁多;
处理速度快;
价值密度低】

12、多选题：
‍图领奖获得者、著名数据库专家Jim Gray博士认为，人类自古以来在科学研究上先后经历了四种范式，具体包括：‏
选项：
A: 猜想科学
B: 实验科学
C: 理论科学
D: 计算科学
E: 数据密集型科学
答案: 【实验科学;
理论科学;
计算科学;
数据密集型科学】

13、多选题：
‍大数据带来思维方式的三个转变是：‏
选项：
A: 精确而非全面
B: 全样而非抽样
C: 效率而非精确
D: 相关而非因果
答案: 【全样而非抽样;
效率而非精确;
相关而非因果】

14、多选题：
‍大数据的四种主要计算模式包括：
选项：
A: 批处理计算
B: 流计算
C: 框计算
D: 图计算
E: 查询分析计算
答案: 【批处理计算;
流计算;
图计算;
查询分析计算】

15、多选题：
‍云计算的典型服务模式包括三种：
选项：
A: PaaS
B: IaaS
C: SaaS
D: MaaS
答案: 【 PaaS;
IaaS;
SaaS】

第2讲大数据处理架构Hadoop

大数据处理架构Hadoop单元测验

1、单选题：
‎启动hadoop所有进程的命令是‏
选项：
A: start-dfs.sh
B: start-hadoop.sh
C: start-all.sh
D: start-hdfs.sh
答案: 【 start-all.sh】

2、单选题：
以下对Hadoop的说法错误的是‍
选项：
A: Hadoop的核心是HDFS和MapReduce
B: Hadoop是基于Java语言开发的，只支持Java语言编程
C: Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
D: Hadoop MapReduce是针对谷歌MapReduce的开源实现，通常用于大规模数据集的并行计算
答案: 【 Hadoop是基于Java语言开发的，只支持Java语言编程】

3、单选题：
‍以下哪个不是hadoop的特性‍
选项：
A: 高容错性
B: 高可靠性
C: 成本高
D: 支持多种编程语言
答案: 【成本高】

4、单选题：
‎以下名词解释不正确的是‍‎‍‎‍
选项：
A: HDFS：分布式文件系统，是Hadoop项目的两大核心之一，是谷歌GFS的开源实现
B: HBase：提供高可靠性、高性能、分布式的行式数据库，是谷歌BigTable的开源实现
C: Hive：一个基于Hadoop的数据仓库工具，用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D: Zookeeper：针对谷歌Chubby的一个开源实现，是高效可靠的协同工作系统
答案: 【 HBase：提供高可靠性、高性能、分布式的行式数据库，是谷歌BigTable的开源实现】

5、多选题：
‏以下哪些组件是Hadoop的生态系统的组件‎
选项：
A: MapReduce
B: HDFS
C: Oracle
D: HBase
答案: 【 MapReduce;
HDFS;
HBase】

6、多选题：
‌以下哪个命令可以用来操作HDFS文件
选项：
A: hadoop fs
B: hdfs dfs
C: hadoop dfs
D: hdfs fs
答案: 【 hadoop fs;
hdfs dfs;
hadoop dfs】

第4讲分布式数据库HBase

分布式数据库HBase单元测验

1、单选题：
‌HBase是一种数据库‏
选项：
A: 行式数据库
B: 列式数据库
C: 文档数据库
D: 关系数据库
答案: 【列式数据库】

2、单选题：
下列对HBase数据模型的描述错误的是‎
选项：
A: HBase是一个稀疏、多维度、排序的映射表，这张表的索引是行键、列族、列限定符和时间戳
B: HBase列族支持动态扩展，可以很轻松地添加一个列族或列
C: HBase中执行更新操作时，会删除数据旧的版本，并生成一个新的版本
D: 每个HBase表都由若干行组成，每个行由行键（row key）来标识
答案: 【 HBase中执行更新操作时，会删除数据旧的版本，并生成一个新的版本】

3、单选题：
‌下列说法正确的是
选项：
A: HBase的实现包括的主要功能组件是库函数，一个Master主服务器和一个Region服务器
B: Zookeeper是一个集群管理工具，常用于分布式计算，提供配置维护、域名服务、分布式同步等。
C: 如果不启动Hadoop，则HBase完全无法使用
D: 如果通过HBase Shell插入表数据，可以插入一行数据或一个单元格数据。
答案: 【 Zookeeper是一个集群管理工具，常用于分布式计算，提供配置维护、域名服务、分布式同步等。】

4、单选题：
对于HBase数据库而言，每个Region的建议最佳大小是‌
选项：
A: 100MB-200MB
B: 500MB-1000MB
C: 1GB-2GB
D: 2GB-4GB
答案: 【 1GB-2GB】

5、单选题：
‏HBase三层结构的顺序是‌
选项：
A: Zookeeper文件，.MEATA.表，-ROOT-表
B: Zookeeper文件，-ROOT-表，.MEATA.表
C: -ROOT-表，Zookeeper文件，.MEATA.表
D: .MEATA.表，Zookeeper文件，-ROOT-表
答案: 【 Zookeeper文件，-ROOT-表，.MEATA.表】

6、单选题：
客户端是通过级寻址来定位Region‍
选项：
A: 一
B: 二
C: 三
D: 四
答案: 【三】

7、单选题：
‎关于HBase Shell命令解释错误的是‍
选项：
A: create：创建表
B: list：显示表的所有数据
C: put：向表、行、列指定的单元格添加数据
D: get：通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值
答案: 【

剩余75%内容付费后可查看