大学MOOC 数据清洗与筛选技术(陕西国防工业职业技术学院)1450295559 最新慕课完整章节测试答案
【第1周】初识大数据
【第一周】单元测试
1、单选题:
大数据的特性不包括
选项:
A: 应用领域广
B: 容量大
C: 速度快
D: 价值密度低
答案: 【 应用领域广】
2、单选题:
如下关于大数据分析流程的哪一项是正确的?
选项:
A: 数据采集、数据清洗、数据管理、数据分析、数据呈现
B: 数据采集、数据分析、数据清洗、数据管理、数据呈现
C: 数据采集、数据呈现、数据分析、数据清洗、数据管理
D: 数据清洗、数据采集、数据呈现、数据分析、数据管理
答案: 【 数据采集、数据清洗、数据管理、数据分析、数据呈现】
3、多选题:
大数据分析与传统的数据分析的区别主要在于:
选项:
A: 传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。
B: 大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。
C: 大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。
D: 大数据分析需要借助各种分析工具完成,而传统数据分析不需要使用其他工具。
答案: 【 传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。;
大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。;
大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。】
4、判断题:
1、大数据目前并无统一的定义,主要是由于数据规模巨大、来源分散、格式多样,所以需要新的体系架构、技术、算法和分析方法来对这些数据进行采集、存储和关联分析,以期望能够从中抽取出隐藏的有价值的信息。
选项:
A: 正确
B: 错误
答案: 【 正确】
5、判断题:
数据科学家主要负责开发、构建、测试和维护系统,比如数据库和大规模处理系统
选项:
A: 正确
B: 错误
答案: 【 错误】
6、判断题:
大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息。
选项:
A: 正确
B: 错误
答案: 【 正确】
7、填空题:
大数据分析能够应用在哪些领域?
答案: 【 交通 医疗 足球 零售 天文 政治】
【第4周】Python 大数据基础
【第四周】单元测试
1、单选题:
Python代码:r = 5 + "5"的执行结果是
选项:
A: 报错
B: 55
C: 10
D: 5
答案: 【 报错】
2、单选题:
1. m = [1, 2, [3]]2. n = m[:] 3. n[1] = 4 4. n[2][0] = 5 5. print(m)代码的执行结果是?
选项:
A: [1,2,[5]]
B: [1,2,[3]]
C: [1,4,[3]]
D: [1,4,[5]]
答案: 【 [1,2,[5]]】
3、单选题:
1. n1 = { 'a':1, 'b':2 }2. n2 = n13. n1['a'] = 54. s = n1['a'] + n2['a']5. print(s)代码的结果是?
选项:
A: 10
B: 5
C: 6
D: 7
答案: 【 10】
4、单选题:
用python处理本机文件时,可以使用glob完成文件查找功能。下列有关glob的说法中,错误的是
选项:
A: glob为内置库,无需import即可使用
B: glob可以使用?匹配单个字符
C: glob中表达式"[0-9]"表示匹配0-9中的单个数字
D: glob返回的是一个包含所有匹配文件的列表
答案: 【 glob为内置库,无需import即可使用】
5、单选题:
1. import sqlite32. from faker import Faker3. f=Faker("zh_cn")4. conn=sqlite3.connect(":memory:")5. c=conn.cursor()6. c.execute("create table user (id varchar(10) primary key, name varchar(20))")7. for i in range(0,100):8. c.execute("insert into user (id, name) values ('{}','{}')".format(i,f.name()))9. c.execute("select * from user")10. result = c.fetchall()11. print(len(result))上述代码执行的结果是?
选项:
A: 100
B: 10
C: 20
D: 0
答案: 【 100】
6、单选题:
用户处理numpy的ndarray对象时,可以改变数组维度。下列描述中错误的是
选项:
A: resize方法不能修改原andarray数组
B: reshape方法不能修改原andarray数组
C: flatten方法不能修改原andarray数组
D: 参数用元组来表示
答案: 【 resize方法不能修改原andarray数组】
7、判断题:
Numpy的Series对象在进行运算时,其默认索引值是0到n-1可以参与运算,而自定义索引值不会参与运算。
选项:
A: 正确
B: 错误
答案: 【 错误】
8、判断题:
DataFrame结构为一个二维结构,每一列可以为不同的值类型,但一列之内的类型必须相同。
选项:
A: 正确
B: 错误
