第1章大数据技术概述

第1章大数据技术概述单元测验

1、单选题:
‎大数据计算模式有以下四种,对电子商务网站购物平台数据的实时分析处理过程属于哪一种?‌
选项:
A: 批处理计算
B: 流计算
C: 图计算
D: 查询分析计算
答案: 【 流计算

2、单选题:
‏大数据技术及其代表性的软件种类很多,不同的技术有其不同应用场景,都对应着不同的大数据计算模式,请问软件产品Pregel主要应用于以下哪种计算模式?‍
选项:
A: 批处理计算
B: 流计算
C: 图计算
D: 查询分析计算
答案: 【 图计算

3、单选题:
‌经过多年的发展,Hadoop生态系统不断完善和成熟,目前已经包含多个子项目,其中YARN的主要功能是?‌
选项:
A: 分布式并行编程模型
B: 数据仓库工具
C: 负责集群资源调度管理的组件
D: 分布式海量日志采集、聚合和传输系统
答案: 【 负责集群资源调度管理的组件

4、单选题:
‏Hadoop生态系统中用于构建数据仓库并允许用户输入SQL语句进行查询的功能组件是?​
选项:
A: Spark
B: Pregel
C: Flume
D: Hive
答案: 【 Hive

5、单选题:
‎MapReduce的一个基本设计思想是?‎
选项:
A: 计算向数据靠拢
B: 数据向计算靠拢
C: 提高数据的串行计算速度
D: 提高数据的冗余度
答案: 【 计算向数据靠拢

6、单选题:
‍Hadoop的生态系统组件之一Sqoop的功能是?‌
选项:
A: 提供高可靠性、高可用、分布式的海量日志采集
B: 用来存储非结构化和半结构化的松散数据
C: 负责集群资源调度管理的组件
D: 用来在Hadoop和关系数据库之间的交换数据,改进数据的互操作性
答案: 【 用来在Hadoop和关系数据库之间的交换数据,改进数据的互操作性

7、单选题:
‏以下哪一项不是Hadoop的缺点?‌
选项:
A: 计算表达能力有限
B: 数据文件被分布存储到多台机器上
C: 计算延迟高
D: 磁盘I/O开销大
答案: 【 数据文件被分布存储到多台机器上

8、单选题:
‏网络中很多数据是以图的形式呈现的,比如社交网络、交通事故,现场证据采集等,为了解决大型图的分布式计算问题,最适合采用以下哪种计算框架:‌
选项:
A: Spark Core
B: Dr

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注