第一讲洞悉数据篇

单元测验

1、单选题:
‍海量数据从原始数据源到产生价值,期间会经过存储、()、挖掘、分析等多个环节。‌‍‌
选项:
A: 清洗
B: 计算
C: 建模
D: 处理
答案: 【 清洗

2、单选题:
‏由于大数据存在数据量大、数据类型多、数据处理快三个特点,导致数据价值隐藏在海量的数据中,使得大数据往往表现为()。‌
选项:
A: 数据价值密度高
B: 数据价值密度低
C: 数据价值高
D: 数据价值低
答案: 【 数据价值密度低

3、单选题:
‍2012年美国总统大选时,纳特西尔弗(Nate Silver)利用大数据成功预测出投票结果,让众多企业看到大数据应用的()。‎
选项:
A: 广泛性
B: 相关性
C: 真实性
D: 无用性
答案: 【 真实性

4、单选题:
‎学界大数据中,对大数据感知与表示的研究目的是()。​
选项:
A: 如何高效的采集和整合不同的数据源的数据
B: 处理数据规模巨大性及数据内容复杂性导致计算高度复杂性
C: 应对大数据在数据规模上的巨大性及数据内容的复杂性特点
D: 应对大数据在数据覆盖面广的现实需求
答案: 【 如何高效的采集和整合不同的数据源的数据

5、单选题:
​随着大数据产业链的不断成熟和明晰,大数据生态越来越稳定,数据的产生及数据的应用都有一套完整的技术作为支撑,说明了()对大数据产业环境的影响。​
选项:
A: 技术预研及人才储备
B: 基础奢侈
C: 多边合作
D: 产业化分工
答案: 【 产业化分工

6、单选题:
‌()的理念促进了大数据产业的发展,在大数据项目研发和试错中,通过跨界合作获得资源互补是大数据项目进展过程中的主旋律,进一步加强了多边的合作,促进了集体智慧的体现。‍
选项:
A: 技术预研及人才储备
B: 基础奢侈
C: 多边合作
D: 产业化分工
答案: 【 多边合作

7、单选题:
‍由于(),很多企业业务部门不了解大数据,也不了解大数据的应用场景和价值,导致很多数据没有应用场景,很多有价值历史数据被删除。‌‍‌
选项:
A: 需求不清晰
B: 技术不完善
C: 数据不全面
D: 计算不精确
答案: 【 需求不清晰

8、多选题:
‎大数据的特征主要有()方面特征。‏
选项:
A: 数据量大
B: 数据类型多
C: 数据处理快
D: 数据价值密度低
答案: 【 数据量大;
数据类型多;
数据处理快;
数据价值密度低

9、多选题:
‌基于现有数据类型,可以对其划分为()。‌‌‌
选项:
A: 结构化数据
B: 半结构化数据
C: 非结构化数据
D: 全结构化数据
答案: 【 结构化数据;
半结构化数据;
非结构化数据

10、多选题:
‏大数据产业链中共有()三种典型公司。‍
选项:
A: 基于数据(本身)的公司
B: 基于技术(研发)的公司
C: 基于思维(服务)的公司
D: 基于建模(分析)的公司
答案: 【 基于数据(本身)的公司;
基于技术(研发)的公司;
基于思维(服务)的公司

11、多选题:
‌在学界大数据研究中,研究大数据的复杂性和计算模型包括()‌
选项:
A: 处理数据规模的巨大性
B: 处理数据内容复杂性
C: 处理数据计算高度复杂性
D: 处理不同数据源的整合
答案: 【 处理数据规模的巨大性;
处理数据内容复杂性;
处理数据计算高度复杂性

12、多选题:
‏大数据产业可以分为三种:‏
选项:
A: 融合应用产业
B: 基础支撑产业
C: 高端技术产业
D: 数据服务产业
答案: 【 融合应用产业;
基础支撑产业

13、多选题:
‌机遇和挑战永远是并存的,在大数据时代到来的同时,大数据所面临的挑战也随之而来,大数据面临的技术层面的挑战可以分为()。‌‌‌
选项:
A: 数据收集
B: 数据储存
C: 数据处理
D: 数据展示
答案: 【 数据收集;
数据储存;
数据处理;
数据展示

14、多选题:
​由于大数据的四个特点,给现如今数据存储带来很多的挑战,主要为()。‏
选项:
A: 数据库过小
B: 数据多样性
C: 反馈时间
D: 数据运维
答案: 【 数据库过小;
数据多样性;
反馈时间;
数据运维

15、多选题:
‍大数据可视化如今仍然没有达到人们的要求,尽管计算机智能化有了很大进步,但目前还只能针对小规模、有结构或类结构的数据进行分析。大数据可视化仍然面临着()等挑战。​
选项:
A: 视觉噪声
B: 信息丢失
C: 大型图像感知
D: 高速图像变换
答案: 【 视觉噪声;
信息丢失;
大型图像感知;
高速图像变换

16、判断题:
‎数据科研的研究大致可以分为五类:大数据的复杂性和计算模型、大数据的感知与表示、大数据的内容建模与语义理解、大数据的存储与架构体系、其他相关基础研究支撑。‏
选项:
A: 正确
B: 错误
答案: 【 正确

17、判断题:
‍学界对于大数据的存储与结构体系的研究目的是应对大数据在数据规模上的巨大性及数据内容的复杂性特点。​
选项:
A: 正确
B: 错误
答案: 【 正确

18、判断题:
​大数据产业是指伴随着大数据时代的到来,大数据涉及的数据采集、数据分析、数据应用等环节都是大数据产业的一部分。​
选项:
A: 正确
B: 错误
答案: 【 正确

19、判断题:
‌大数据产业分类中的数据服务层是围绕各类应用和市场需求,提供辅助性的服务,包括数据交易、数据资产管理、数据采集加工分析、数据安全等。​
选项:
A: 正确
B: 错误
答案: 【 正确

20、判断题:
‎大数据现在被广泛地认可与期待,但是认可与期待能否持续下去仍然取决于大数据能否真正地落实并且创造价值。‍
选项:
A: 正确
B: 错误
答案: 【 正确

21、判断题:
‌现如今大数据产业以及它所生存的环境已然较为健康,大数据产业有着较为稳定的发展,不会有什么较大的挑战。‌
选项:
A: 正确
B: 错误
答案: 【 错误

22、判断题:
​大数据收集的最大挑战是数据收集的碎片化。在很多企业中尤其是大型的企业,数据常常散落在不同部门,而且这些数据存在不同的数据仓库中,不同部门的数据技术也有可能不一样,这导致企业内部自己的数据都无法打通整合。‍
选项:
A: 正确
B: 错误
答案: 【 正确

23、判断题:
‌数据存储的安全性在大数据时代下已经得到了稳妥的保护,个人一些知名网站密码等不会存在泄漏等问题。‎
选项:
A: 正确
B: 错误
答案: 【 错误

大数据产业随堂测验

1、判断题:
‏大数据给人类带来前所未有的机遇,很多创业者开创了具有大数据标签的公司,形成大数据产业。‏
选项:
A: 正确
B: 错误
答案: 【 正确

2、判断题:
‍伴随着大数据时代的到来,大数据涉及的数据采集、数据分析、数据应用等环节都是大数据产业的一部分。‎
选项:
A: 正确
B: 错误
答案: 【 正确

3、判断题:
​大数据产业中的基础支撑产业是指与政务、工业、农业、金融、交通和电信等行业紧密相关的应用软件和整体解决方案。‍
选项:
A: 正确
B: 错误
答案: 【 错误

4、判断题:
‍在大数据被多方面认同的情况下,不同期望、不同利益主体对于大数据所带来的机遇和挑战应对方式截然不同。因此,分析大数据产业的生存环境对于大数据产业的发展尤其重要。‌
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‎云计算等存储手段的发展及推进为大数据应用的部署与运维提供了事实的基础设施保障。‌
选项:
A: 正确
B: 错误
答案: 【 正确

大数据挑战随堂测验

1、判断题:
‏数据收集手段、数据收集碎片化、数据的可信性造成了大数据收集过程中的挑战。​
选项:
A: 正确
B: 错误
答案: 【 正确

2、判断题:
‎现如今,很多企业业务部门不了解大数据,不了解大数据的应用场景和价值,制约了大数据的发展。‌‎‌
选项:
A: 正确
B: 错误
答案: 【 正确

3、判断题:
‍大数据处理和分析能力远远不及理想中水平,数据量的快速增长,对存储技术提出了挑战。‍‍‍
选项:
A: 正确
B: 错误
答案: 【 正确

4、判断题:
‎数据存储虽然技术还不能支撑大数据的发展,但是安全性已经达到标准,目前阶段不必在考虑。​
选项:
A: 正确
B: 错误
答案: 【 错误

5、判断题:
‏大数据时代不仅对存储技术提出了挑战,它还需要高速信息传输能力的支持,以及低密度有价值数据的快速分析和处理能力。‏
选项:
A: 正确
B: 错误
答案: 【 正确

大数据溯源随堂测验

1、判断题:
‌大数据就是大量数字的集合。‍
选项:
A: 正确
B: 错误
答案: 【 错误

2、判断题:
‎大数据价值的产生和实现,需要技术的持续积累,才能由量变到质变。​‎​
选项:
A: 正确
B: 错误
答案: 【 正确

3、判断题:
‏任何事物的属性和规律,只要通过适当编码,均可以通过统一的数字信号表达出来。‏
选项:
A: 正确
B: 错误
答案: 【 正确

4、判断题:
‎大数据对未来的发展有着至关重要的作用。‏‎‏
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
​大数据技术是包括硬件、数据库、操作系统、Hadoop等一系列技术的综合应用。​
选项:
A: 正确
B: 错误
答案: 【 正确

大数据特征随堂测验

1、判断题:
‍大数据强调地是数据量,主要突出数据的海量性。‌‍‌
选项:
A: 正确
B: 错误
答案: 【 错误

2、判断题:
‏从技术上看,信息传感设备的出现、快速发展的物联网数据及存储技术的进步,推动了信息量几何增长。‍
选项:
A: 正确
B: 错误
答案: 【 正确

3、判断题:
‎从需求上看,数据类型没有改变,主要是由于数据搜集的基数逐渐变大导致信息量的增大。‏
选项:
A: 正确
B: 错误
答案: 【 错误

4、判断题:
‏大数据的数据类型多,早已经能不是单一的结构化数据占比大。‍‏‍
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‎由于大数据的数据量大、数据类型多等特征,导致价值隐藏在海量的数据中,使得大数据往往表现为“数据价值高,价值密度低”的情况。‍
选项:
A: 正确
B: 错误
答案: 【 正确

大数据现象随堂测验

1、判断题:
‎大数据在各行各业都有较为广泛的应用。‏‎‏
选项:
A: 正确
B: 错误
答案: 【 正确

2、判断题:
‍美国是大数据的策源地及创新引导者,大数据的发展一直走在全球前列。如今,大数据技术应成为了美国各个领域的变革力量。‏‍‏
选项:
A: 正确
B: 错误
答案: 【 正确

3、判断题:
‍企业发展也离不开大数据的支持,但每个独立的公司都会根据自身的成长基因对大数据给予不同的理解和运用。​
选项:
A: 正确
B: 错误
答案: 【 正确

4、判断题:
​由于大数据的广泛应用,国内出现了“数据科学”概念,数据处理技术将成为一个与计算科学并列的新的学科领域。‍
选项:
A: 正确
B: 错误
答案: 【 正确

5、判断题:
‏大数据计算的高度复杂性是由于数据覆盖面广。‏‏‏
选项:
A: 正确
B: 错误
答案: 【 错误

第二讲数据有度篇

单元测验

1、单选题:
​()是一种自动下载网页的计算机程序和自动化脚本,通常从一个成为种子集开始运行,按照一定序列或者条件爬取页面信息,最终遍历整个Web网页。‍
选项:
A: 传感器
B: 系统日志
C: Web爬虫
D: 数据库
答案: 【 Web爬虫

2、单选题:
‏()是指对文本的表示及其特征项的选取,是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。‎
选项:
A: 文本分析
B: 图像分析
C: 文本挖掘
D: 大数据分析
答案: 【 文本分析

3、单选题:
‏()是模式识别技术在图像领域中的具体应用,是对输入的图像信息建立图像识别模型,分析并提取图像的特征,然后建立分类器,根据图像的特征进行分类识别的一种技术。​
选项:
A: 图像识别
B: 图像构建
C: 图像修改
D: 图像重现
答案: 【 图像识别

4、单选题:
‌()是一种基于词典和人工规则的方法。是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功。‎
选项:
A: 机械分词算法
B: 基于统计的分词算法
C: 非机械分析算法
D: 基于语法的分词算法
答案: 【 机械分词算法

5、单选题:
‍()是一种无监督学习算法,其主要特征是将数据从高维降低到低维层次。‍
选项:
A: 降维算法
B: 回归算法
C: 神经网络
D: 聚类算法
答案: 【 降维算法

6、多选题:
‎大数据基础支撑技术涵盖了一下哪几个层次。​
选项:
A: 数据层
B: 统计层
C: 治理层
D: 模型层
答案: 【 数据层;
统计层;
治理层;
模型层

7、多选题:
‏治理层是大数据项目开展的第一部分,也是最基础的一个层次。我们通常需要几个方面来支持使得能够更好地实现数据治理。​
选项:
A: 标准
B: 策略流程
C: 技术平台
D: 基础架构
答案: 【 标准;
策略流程;
技术平台

8、多选题:
​潜在数据源主要存在于哪几处。‏
选项:
A: 内部数据
B: 互联网数据
C: 外部数据
D: 独立数据
答案: 【 内部数据;
互联网数据;
外部数据

9、多选题:
‍大数据采集方法主要分为哪几种。​‍​
选项:
A: 传感器
B: 系统日志
C: Web爬虫
D: 数据库
答案: 【 传感器;
系统日志;
Web爬虫

10、多选题:
‍统计学领域,一般将数据分析划分为()。‌
选项:
A: 描述性数据分析
B: 探索性数据分析
C: 验证性数据分析
D: 假设性数据分析
答案: 【 描述性数据分析;
探索性数据分析;
验证性数据分析

11、判断题:
‌数据分析更多的是基于业务背景来解读数据,把隐藏在数据背后的信息提炼和总结出来,也即通过数据理解、数据准备、建立模型、模型评估,进而发现其中有价值的内容,最后将模型应用于业务实践。‏
选项:
A: 正确
B: 错误
答案: 【 正确

12、判断题:
‏大数据分析主要涉及六个方面,具体包括可视化分析、数据仓库、数据质量和数据管理、数据挖掘算法、预测分析能力、语义引擎。‌
选项:
A: 正确
B: 错误
答案: 【 正确

13、判断题:
‌一般来说我们把数据清洗大致分为这五个步骤,分别是:去除不必要数据,改变数据类型,处理缺失数据,处理内容错误,处理书写错误。具体实践中可以稍作调整。‌
选项:
A: 正确
B: 错误
答案: 【 错误

14、判断题:
‍分词是自然语言处理技术的基础构成之一,但仍存在难点进行处理,例如中文分词中交叉歧义、组合歧义、真歧义分词问题。‍
选项:
A: 正确
B: 错误
答案: 【

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注