大学MOOC Python数据爬取与可视化(南华大学)1461696161 最新慕课完整章节测试答案
【案例1】 网页静态数据爬取与词云制作
单元测验
1、单选题:
Python 内置的HTTP请求库是( )。
选项:
A: urllib
B: os
C: time
D: requests
答案: 【 urllib】
2、单选题:
学习爬虫,就需要分析网页的HTML元素,就要学会使用浏览器的开发者工具,打开一些主流浏览器(如Google Chrome 或360浏览器)开发者工具的快捷键是( )。
选项:
A: F12
B: F10
C: F2
D: F5
答案: 【 F12】
3、单选题:
以下哪一个第三方库不是用来解析HTML/XML 文件的?
选项:
A: requests
B: bs4(BeautifulSoup 4 )
C: xpath
D: 正则表达式re
答案: 【 requests】
4、单选题:
使用以下哪一种方法,可以将字符串默认按照空格进行切片操作?
选项:
A: split( )
B: lower( )
C: upper( )
D: replace( )
答案: 【 split( )】
5、单选题:
以下关于lambda 函数的描述中,错误的是( )。
选项:
A: Python允许我们不以标准方式声明函数,也就是说,不使用def关键字,而是使用lambda来声明匿名函数,连名字都不用取。
B: 任何能够使用它们的地方,都可以定义一个单独的普通函数来进行替换。
C: 一般将lambda函数用在封装一些简单的、又不需要重用的代码上,这样可以让程序代码简洁美观。
D: lambda 必须要自己先定义,才能使用lambda
答案: 【 lambda 必须要自己先定义,才能使用lambda】
6、单选题:
以下关于Python中导入模块的几种方式描述中,错误的是( )。
选项:
A: from 模块名 import 功能名from 语句让你从模块中导入一个指定的部分到当前程序中,例如from wordcloud import WordCloud,那么程序中可以直接使用函数名WordCloud()即可
B: improt 模块名使用import 导入模块,例如,import wordcloud,那么每次使用模块中的函数时,就必须要先指定模块名,再指定函数,例如:wordcloud.WordCloud()
C: from 模块名 import * 这里用*号来一次性导入了模块中全部函数。每次要使用模块中的函数,则直接使用函数名就可以了,这是因为已经知道这个函数是在那个模块中了。
D: from 模块名 import 功能名 as 别名例如,import matplotlib.pyplot as plt 这里给matplotlib库中的pyplot这个模块取了一个别名plt,在使用的时候,直接用pyplot.plt即可。
答案: 【 from 模块名 import 功能名 as 别名例如,import matplotlib.pyplot as plt 这里给matplotlib库中的pyplot这个模块取了一个别名plt,在使用的时候,直接用pyplot.plt即可。】
7、判断题:
“词云”是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤大量无意义信息,突出文章或者网页内容的主旨。
选项:
A: 正确
B: 错误
答案: 【 正确】
8、判断题:
urllib库中的request模块是最基本的http请求模块,用来模拟发送请求的。
选项:
A: 正确
B: 错误
答案: 【 正确】
9、判断题:
urllib库中的error模块是异常处理模块,可以捕获由request模块产生的异常,避免了程序因报错而终止的问题。
选项:
A: 正确
B: 错误
答案: 【 正确】
10、判断题:
直接用import 导入urllib.request这个模块后,就可以使用request模块中的 urlopen()这个方法来获取页面。
选项:
A: 正确
B: 错误
答案: 【 正确】
11、判断题:
close() 方法用于关闭一个已打开的文件。关闭后的文件不能再进行读写操作。使用 close() 方法关闭文件是一个好的习惯。
选项:
A: 正确
B: 错误
答案: 【 正确】
12、判断题:
停用词(Stop Words)是指在信息检索中,为提高搜索效率,在处理文本数据之前,会自动过滤掉某些字或词,这些字或词被称为停用词。
选项:
A: 正确
B: 错误
答案: 【 正确】
13、判断题:
绘制词云时,必须要使用matplotlib第三方库。
选项:
A: 正确
B: 错误
答案: 【 错误】
14、判断题:
使用wordcloud库对中文文本进行词云绘制时,必须要使用font_path参数设置中文的字体,否则中文显示会出现乱码。
选项:
A: 正确
B: 错误
答案: 【 正确】
15、判断题:
要使用wordcloud库制作个性化词云,要从指定的文件读取图像,可以使用WordCloud函数中mask参数进行图片设置。
选项:
A: 正确
B: 错误
答案: 【 正确】
【案例2】多页面数据爬取
单元测验
1、判断题:
网页中一个标签Tag可能包含多个字符串或其它的标签,那么这些内部的标签都可以这个Tag的子节点。
选项:
A: 正确
B: 错误
答案: 【 正确】
2、判断题:
第三方库bs4中,find_all() 方法find_all( name , att
