大学MOOC 大数据技术原理与应用(吉林大学珠海学院)1451655225 最新慕课完整章节测试答案
第1讲大数据概述
文章目录
第1讲大数据概述章节单元测验
1、单选题:
第三次信息化浪潮的标志是:
选项:
A: 个人电脑的普及
B: 互联网的普及
C: 云计算、大数据、物联网技术的普及
D: 虚拟现实技术的普及
答案: 【 云计算、大数据、物联网技术的普及】
2、单选题:
就数据的量级而言,1PB数据是多少TB?
选项:
A: 512
B: 1024
C: 1000
D: 2048
答案: 【 1024】
3、单选题:
以下关于云计算、大数据和物联网之间的关系,论述错误的是:
选项:
A: 云计算侧重于数据分析
B: 云计算、大数据和物联网三者紧密相关,相辅相成
C: 物联网可以借助于云计算实现海量数据的存储
D: 物联网可以借助于大数据实现海量数据的分析
答案: 【 云计算侧重于数据分析】
4、单选题:
以下哪个不是大数据时代新兴的技术:
选项:
A: Hadoop
B: Spark
C: HBase
D: MySQL
答案: 【 MySQL】
5、单选题:
每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:
选项:
A: MapReduce
B: Pregel
C: Dremel
D: Storm
答案: 【 MapReduce】
6、单选题:
每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:
选项:
A: GraphX
B: S4
C: Hive
D: Impala
答案: 【 S4】
7、单选题:
每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:
选项:
A: Cassandra
B: Flume
C: Storm
D: Pregel
答案: 【 Pregel】
8、单选题:
每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:
选项:
A: MapReduce
B: HDFS
C: Dremel
D: S4
答案: 【 Dremel】
9、多选题:
数据产生方式大致经历了三个阶段,包括:
选项:
A: 运营式系统阶段
B: 用户原创内容阶段
C: 感知式系统阶段
D: 移动互联网数据阶段
答案: 【 运营式系统阶段;
用户原创内容阶段;
感知式系统阶段】
10、多选题:
大数据发展的三个阶段是:
选项:
A: 萌芽期
B: 低谷期
C: 成熟期
D: 大规模应用期
答案: 【 萌芽期;
成熟期;
大规模应用期】
11、多选题:
大数据的4V特性包括:
选项:
A: 数据量大
B: 数据新颖
C: 数据类型繁多
D: 处理速度快
E: 价值密度低
答案: 【 数据量大;
数据类型繁多;
处理速度快;
价值密度低】
12、多选题:
图领奖获得者、著名数据库专家Jim Gray博士认为,人类自古以来在科学研究上先后经历了四种范式,具体包括:
选项:
A: 猜想科学
B: 实验科学
C: 理论科学
D: 计算科学
E: 数据密集型科学
答案: 【 实验科学;
理论科学;
计算科学;
数据密集型科学】
13、多选题:
大数据带来思维方式的三个转变是:
选项:
A: 精确而非全面
B: 全样而非抽样
C: 效率而非精确
D: 相关而非因果
答案: 【 全样而非抽样;
效率而非精确;
相关而非因果】
14、多选题:
大数据的四种主要计算模式包括:
选项:
A: 批处理计算
B: 流计算
C: 框计算
D: 图计算
E: 查询分析计算
答案: 【 批处理计算;
流计算;
图计算;
查询分析计算】
15、多选题:
云计算的典型服务模式包括三种:
选项:
A: PaaS
B: IaaS
C: SaaS
D: MaaS
答案: 【 PaaS;
IaaS;
SaaS】
第1讲大数据概述章节单元测验补充
1、单选题:
第一次信息化浪潮主要解决什么问题?
选项:
A: 信息传输
B: 信息处理
C: 信息爆炸
D: 信息转换
答案: 【 信息处理】
2、单选题:
下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?
选项:
A: 利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B: 利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C: 构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D: 把实时采集的数据作为流计算系统的输入,进行实时处理分析
答案: 【 利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理】
3、单选题:
在大数据的计算模式中,流计算解决的是什么问题?
选项:
A: 针对大规模数据的批量处理
B: 针对大规模图结构数据的处理
C: 大规模数据的存储管理和查询分析
D: 针对流数据的实时计算
答案: 【 针对流数据的实时计算】
4、单选题:
大数据产业指什么?
选项:
A: 一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合
B: 提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业
C: 提供数据分享平台、数据分析平台、数据租售平台等服务的企业
D: 提供分布式计算、数据挖掘、统计分析等服务的各类企业
答案: 【 一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合】
5、单选题:
下列哪一个不属于大数据产业的产业链环节?
选项:
A: 数据循环层
B: 数据源层
C: 数据分析层
D: 数据应用层
答案: 【 数据循环层】
6、单选题:
下列哪一个不属于第三次信息化浪潮中新兴的技术?
选项:
A: 互联网
B: 云计算
C: 大数据
D: 物联网
答案: 【 互联网】
7、单选题:
云计算平台层(PaaS)指的是什么?
选项:
A: 操作系统和围绕特定应用的必需的服务
B: 将基础设施(计算资源和存储)作为服务出租
C: 从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型
D: 提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务
答案: 【 操作系统和围绕特定应用的必需的服务】
第2讲大数据处理架构Hadoop
大数据处理架构Hadoop单元测验
1、单选题:
启动hadoop所有进程的命令是
选项:
A: start-dfs.sh
B: start-hadoop.sh
C: start-all.sh
D: start-hdfs.sh
答案: 【 start-all.sh】
2、单选题:
以下对Hadoop的说法错误的是
选项:
A: Hadoop的核心是HDFS和MapReduce
B: Hadoop是基于Java语言开发的,只支持Java语言编程
C: Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
D: Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
答案: 【 Hadoop是基于Java语言开发的,只支持Java语言编程】
3、单选题:
以下哪个不是hadoop的特性
选项:
A: 高容错性
B: 高可靠性
C: 成本高
D: 支持多种编程语言
答案: 【 成本高】
4、单选题:
以下名词解释不正确的是
选项:
A: HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B: HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
C: Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D: Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
答案: 【 HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现】
5、多选题
