第1讲大数据概述

第1讲大数据概述章节单元测验

1、单选题:
‍第三次信息化浪潮的标志是:‏
选项:
A: 个人电脑的普及
B: 互联网的普及
C: 云计算、大数据、物联网技术的普及
D: 虚拟现实技术的普及
答案: 【 云计算、大数据、物联网技术的普及

2、单选题:
‏就数据的量级而言,1PB数据是多少TB?‎
选项:
A: 512
B: 1024
C: 1000
D: 2048
答案: 【 1024

3、单选题:
‏以下关于云计算、大数据和物联网之间的关系,论述错误的是:‍
选项:
A: 云计算侧重于数据分析
B: 云计算、大数据和物联网三者紧密相关,相辅相成
C: 物联网可以借助于云计算实现海量数据的存储
D: 物联网可以借助于大数据实现海量数据的分析
答案: 【 云计算侧重于数据分析

4、单选题:
‏以下哪个不是大数据时代新兴的技术:‌
选项:
A: Hadoop
B: Spark
C: HBase
D: MySQL
答案: 【 MySQL

5、单选题:
‍每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:​
选项:
A: MapReduce
B: Pregel
C: Dremel
D: Storm
答案: 【 MapReduce

6、单选题:
‌每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:‌
选项:
A: GraphX
B: S4
C: Hive
D: Impala
答案: 【 S4

7、单选题:
​每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:‏
选项:
A: Cassandra
B: Flume
C: Storm
D: Pregel
答案: 【 Pregel

8、单选题:
‏每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:​
选项:
A: MapReduce
B: HDFS
C: Dremel
D: S4
答案: 【 Dremel

9、多选题:
‏数据产生方式大致经历了三个阶段,包括:​
选项:
A: 运营式系统阶段
B: 用户原创内容阶段
C: 感知式系统阶段
D: 移动互联网数据阶段
答案: 【 运营式系统阶段;
用户原创内容阶段;
感知式系统阶段

10、多选题:
‍大数据发展的三个阶段是:​
选项:
A: 萌芽期
B: 低谷期
C: 成熟期
D: 大规模应用期
答案: 【 萌芽期;
成熟期;
大规模应用期

11、多选题:
‌大数据的4V特性包括:‍
选项:
A: 数据量大
B: 数据新颖
C: 数据类型繁多
D: 处理速度快
E: 价值密度低
答案: 【 数据量大;
数据类型繁多;
处理速度快;
价值密度低

12、多选题:
‍图领奖获得者、著名数据库专家Jim Gray博士认为,人类自古以来在科学研究上先后经历了四种范式,具体包括:‏
选项:
A: 猜想科学
B: 实验科学
C: 理论科学
D: 计算科学
E: 数据密集型科学
答案: 【 实验科学;
理论科学;
计算科学;
数据密集型科学

13、多选题:
‍大数据带来思维方式的三个转变是:‏
选项:
A: 精确而非全面
B: 全样而非抽样
C: 效率而非精确
D: 相关而非因果
答案: 【 全样而非抽样;
效率而非精确;
相关而非因果

14、多选题:
‍大数据的四种主要计算模式包括:​
选项:
A: 批处理计算
B: 流计算
C: 框计算
D: 图计算
E: 查询分析计算
答案: 【 批处理计算;
流计算;
图计算;
查询分析计算

15、多选题:
‍云计算的典型服务模式包括三种:​
选项:
A: PaaS
B: IaaS
C: SaaS
D: MaaS
答案: 【 PaaS;
IaaS;
SaaS

第2讲大数据处理架构Hadoop

大数据处理架构Hadoop单元测验

1、单选题:
‎启动hadoop所有进程的命令是‏
选项:
A: start-dfs.sh
B: start-hadoop.sh
C: start-all.sh
D: start-hdfs.sh
答案: 【 start-all.sh

2、单选题:
​以下对Hadoop的说法错误的是‍
选项:
A: Hadoop的核心是HDFS和MapReduce
B: Hadoop是基于Java语言开发的,只支持Java语言编程
C: Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
D: Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
答案: 【 Hadoop是基于Java语言开发的,只支持Java语言编程

3、单选题:
‍以下哪个不是hadoop的特性‍
选项:
A: 高容错性
B: 高可靠性
C: 成本高
D: 支持多种编程语言
答案: 【 成本高

4、单选题:
‎以下名词解释不正确的是‍‎‍‎‍
选项:
A: HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B: HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
C: Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D: Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
答案: 【 HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现

5、多选题:
‏以下哪些组件是Hadoop的生态系统的组件‎
选项:
A: MapReduce
B: HDFS
C: Oracle
D: HBase
答案: 【 MapReduce;
HDFS;
HBase

6、多选题:
‌以下哪个命令可以用来操作HDFS文件​
选项:
A: hadoop fs
B: hdfs dfs
C: hadoop dfs
D: hdfs fs
答案: 【 hadoop fs;
hdfs dfs;
hadoop dfs

第4讲分布式数据库HBase

分布式数据库HBase单元测验

1、单选题:
‌HBase是一种    数据库‏
选项:
A: 行式数据库
B: 列式数据库
C: 文档数据库
D: 关系数据库
答案: 【 列式数据库

2、单选题:
​下列对HBase数据模型的描述错误的是‎
选项:
A: HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳
B: HBase列族支持动态扩展,可以很轻松地添加一个列族或列
C: HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本
D: 每个HBase表都由若干行组成,每个行由行键(row key)来标识
答案: 【 HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本

3、单选题:
‌下列说法正确的是​
选项:
A: HBase的实现包括的主要功能组件是库函数,一个Master主服务器和一个Region服务器
B: Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等。
C: 如果不启动Hadoop,则HBase完全无法使用
D: 如果通过HBase Shell插入表数据,可以插入一行数据或一个单元格数据。
答案: 【 Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等。

4、单选题:
​对于HBase数据库而言,每个Region的建议最佳大小是‌
选项:
A: 100MB-200MB
B: 500MB-1000MB
C: 1GB-2GB
D: 2GB-4GB
答案: 【 1GB-2GB

5、单选题:
‏HBase三层结构的顺序是‌
选项:
A: Zookeeper文件,.MEATA.表,-ROOT-表
B: Zookeeper文件,-ROOT-表,.MEATA.表
C: -ROOT-表,Zookeeper文件,.MEATA.表
D: .MEATA.表,Zookeeper文件,-ROOT-表
答案: 【 Zookeeper文件,-ROOT-表,.MEATA.表

6、单选题:
​客户端是通过    级寻址来定位Region‍
选项:
A: 一
B: 二
C: 三
D: 四
答案: 【 三

7、单选题:
‎关于HBase Shell命令解释错误的是‍
选项:
A: create:创建表
B: list:显示表的所有数据
C: put:向表、行、列指定的单元格添加数据
D: get:通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值
答案: 【 

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注