第1讲大数据概述

第1讲大数据概述章节单元测验

1、单选题:
‎第三次信息化浪潮的标志是:​
选项:
A: 个人电脑的普及
B: 互联网的普及
C: 云计算、大数据、物联网技术的普及
D: 虚拟现实技术的普及
答案: 【 云计算、大数据、物联网技术的普及

2、单选题:
​就数据的量级而言,1PB数据是多少TB?‏
选项:
A: 512
B: 1024
C: 1000
D: 2048
答案: 【 1024

3、单选题:
‏以下关于云计算、大数据和物联网之间的关系,论述错误的是:‌
选项:
A: 云计算侧重于数据分析
B: 云计算、大数据和物联网三者紧密相关,相辅相成
C: 物联网可以借助于云计算实现海量数据的存储
D: 物联网可以借助于大数据实现海量数据的分析
答案: 【 云计算侧重于数据分析

4、单选题:
‎以下哪个不是大数据时代新兴的技术:‌
选项:
A: Hadoop
B: Spark
C: HBase
D: MySQL
答案: 【 MySQL

5、单选题:
​每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:‍
选项:
A: MapReduce
B: Pregel
C: Dremel
D: Storm
答案: 【 MapReduce

6、单选题:
‌每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:‌
选项:
A: GraphX
B: S4
C: Hive
D: Impala
答案: 【 S4

7、单选题:
‎每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:‌
选项:
A: Cassandra
B: Flume
C: Storm
D: Pregel
答案: 【 Pregel

8、单选题:
‍每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:‏
选项:
A: MapReduce
B: HDFS
C: Dremel
D: S4
答案: 【 Dremel

9、多选题:
‎数据产生方式大致经历了三个阶段,包括:‌
选项:
A: 运营式系统阶段
B: 用户原创内容阶段
C: 感知式系统阶段
D: 移动互联网数据阶段
答案: 【 运营式系统阶段;
用户原创内容阶段;
感知式系统阶段

10、多选题:
​大数据发展的三个阶段是:​
选项:
A: 萌芽期
B: 低谷期
C: 成熟期
D: 大规模应用期
答案: 【 萌芽期;
成熟期;
大规模应用期

11、多选题:
‎大数据的4V特性包括:​
选项:
A: 数据量大
B: 数据新颖
C: 数据类型繁多
D: 处理速度快
E: 价值密度低
答案: 【 数据量大;
数据类型繁多;
处理速度快;
价值密度低

12、多选题:
‎图领奖获得者、著名数据库专家Jim Gray博士认为,人类自古以来在科学研究上先后经历了四种范式,具体包括:‌
选项:
A: 猜想科学
B: 实验科学
C: 理论科学
D: 计算科学
E: 数据密集型科学
答案: 【 实验科学;
理论科学;
计算科学;
数据密集型科学

13、多选题:
‎大数据带来思维方式的三个转变是:‍
选项:
A: 精确而非全面
B: 全样而非抽样
C: 效率而非精确
D: 相关而非因果
答案: 【 全样而非抽样;
效率而非精确;
相关而非因果

14、多选题:
​大数据的四种主要计算模式包括:​
选项:
A: 批处理计算
B: 流计算
C: 框计算
D: 图计算
E: 查询分析计算
答案: 【 批处理计算;
流计算;
图计算;
查询分析计算

15、多选题:
​云计算的典型服务模式包括三种:‏
选项:
A: PaaS
B: IaaS
C: SaaS
D: MaaS
答案: 【 PaaS;
IaaS;
SaaS

第1讲大数据概述章节单元测验补充

1、单选题:
‏第一次信息化浪潮主要解决什么问题?​
选项:
A: 信息传输
B: 信息处理
C: 信息爆炸
D: 信息转换
答案: 【 信息处理

2、单选题:
‌下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?‏
选项:
A: 利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B: 利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C: 构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D: 把实时采集的数据作为流计算系统的输入,进行实时处理分析
答案: 【 利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理

3、单选题:
‌在大数据的计算模式中,流计算解决的是什么问题?‍
选项:
A: 针对大规模数据的批量处理
B: 针对大规模图结构数据的处理
C: 大规模数据的存储管理和查询分析
D: 针对流数据的实时计算
答案: 【 针对流数据的实时计算

4、单选题:
‏大数据产业指什么?‌
选项:
A: 一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合
B: 提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业
C: 提供数据分享平台、数据分析平台、数据租售平台等服务的企业
D: 提供分布式计算、数据挖掘、统计分析等服务的各类企业
答案: 【 一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合

5、单选题:
‎下列哪一个不属于大数据产业的产业链环节?​
选项:
A: 数据循环层
B: 数据源层
C: 数据分析层
D: 数据应用层
答案: 【 数据循环层

6、单选题:
‎下列哪一个不属于第三次信息化浪潮中新兴的技术?‌
选项:
A: 互联网
B: 云计算
C: 大数据
D: 物联网
答案: 【 互联网

7、单选题:
‎云计算平台层(PaaS)指的是什么?‍
选项:
A: 操作系统和围绕特定应用的必需的服务
B: 将基础设施(计算资源和存储)作为服务出租
C: 从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型
D: 提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务
答案: 【 操作系统和围绕特定应用的必需的服务

第2讲大数据处理架构Hadoop

大数据处理架构Hadoop单元测验

1、单选题:
‏启动hadoop所有进程的命令是‍
选项:
A: start-dfs.sh
B: start-hadoop.sh
C: start-all.sh
D: start-hdfs.sh
答案: 【 start-all.sh

2、单选题:
‌以下对Hadoop的说法错误的是​
选项:
A: Hadoop的核心是HDFS和MapReduce
B: Hadoop是基于Java语言开发的,只支持Java语言编程
C: Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
D: Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
答案: 【 Hadoop是基于Java语言开发的,只支持Java语言编程

3、单选题:
‎以下哪个不是hadoop的特性‏
选项:
A: 高容错性
B: 高可靠性
C: 成本高
D: 支持多种编程语言
答案: 【 成本高

4、单选题:
‌以下名词解释不正确的是​‌​‌​
选项:
A: HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B: HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
C: Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D: Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
答案: 【 HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现

5、多选题

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注