南开21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业【标准答案】

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2021-05-27 22:52

21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业 试卷总分:100 得分:100 一、单选题 (共 20 道试题,共 40 分) 1.Python正则表达式模块的findall方法返回结
21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业
试卷总分:100  得分:100
一、单选题 (共 20 道试题,共 40 分)
1.Python正则表达式模块的findall方法返回结果为()
A.列表
B.元组
C.字典
D.集合
 
2.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。
A.字典
B.集合的名字
C.集合
D.文档
 
3.使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令()
A.scroll
B.scroll_up
C.scroll_forword
D.scroll_back
 
4.下面Python代码输出为(): def default_para_without_trap(para=[], value=0): if not para: para = [] para.append(value) return para print('第一步:{}'.format(default_para_trap(value=100))) print('第二步:{}'.format(default_para_trap(value=50)))
A.第一步:[100] 第二步:[100,50]
B.第一步:[100] 第二步:[50]
C.第一步:[100] 第二步:[]
D.第一步:[100] 第二步:[100]
 
5.MongoDB中可以将()数据结构插入集合中
A.列表
B.元组
C.字典
D.集合
 
6.Python中跳过本次循环应用关键字()
A.break
B.continue
C.exit
D.return
 
7.可以通过()绕过网站登录。
A.session
B.cookies
C.moonpies
D.localstorage
 
8.Python中把列表转换为集合需要使用##函数
A.set
B.list
C.convert
D.change
 
9.下列关于mitmproxy的安装说法错误的是()
A.对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install mitmproxy
B.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python 3.5或者更高版本
C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装
D.UBUNTU中执行命令 sudo pip3 install mitmproxy 进行安装
 
10.启动MongoDB使用命令mongod --() usr/local/etc/mongod.conf
A.config
B.install
C.start
D.begin
 
11.在Linux中哪个命令是添加权限的()
A.chmod
B.sudo
C.cp
D.mkdir
 
12.PyMongo中逻辑查询表示小于的符号是()
A.$gt
B.$lt
C.$gte$$lte
 
13.Python中退出循环应用关键字()
A.break
B.continue
C.exit
D.return
 
14.HTTP常用状态码表明服务器正忙的是()
A.500
B.503
C.403
D.404
 
15.Redis中往集合中读数据,使用关键字()
A.pop
B.spop
C.lpop
D.range
 
16.Redis是一个开源的使用()语言编写
A.ANSI C
B.C++
C.JAVA
D.Python
 
17.使用xpath方法的返回类型是()
A.列表
B.元组
C.字典
D.集合
 
18.Python并导入uiautomator来操作设备的语句是from uiautomator import ()
A.Device
B.Devices
C.Jobs
D.Job
 
19.采用以下()技术可以实现异步加载
A.HTML
B.AJAX
C.CSS
D.HTTP
 
20.HTTP常用状态码表明服务器内部资源出故障了的是()
A.500
B.503
C.403
D.404
 
二、多选题 (共 10 道试题,共 20 分)
21.PyMongo删除操作有()
A.delete
B.delete_all
C.delete_one
D.delete_many
 
22.在配置ios使用Charles的操作中,正确的有()
A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
 
23.常用的会话跟踪技术是
A.session
B.cookies
C.moonpies
D.localstorage
 
24.MongoDB中获取名字为db的库的语句为()
A.client.db
B.client('db')
C.client['db']
D.client{'db'}
 
25.如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
A.非法侵入计算机系统罪
B.非法获取计算机信息系统数据罪
C.非法获取计算机数据罪
D.非法获取系统罪
 
26.如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司
A.服务器日志
B.数据库日志记录
C.程序日志记录
D.服务器监控
 
27.以下HTTP状态码表示服务器本身发生错误的是
A.400
B.503
C.302
D.500
 
28.使用BeautifulSoup对象后可以使用()来查找内容
A.find_all
B.find
C.search
D.search_all
 
29.Redis中的值可以支持()
A.列表
B.哈希
C.集合
D.有序集合
 
30.以下哪些方法属于Python写CSV文件的方法()
A.writeheaders
B.writeheader
C.writerrows
D.writerow
 
三、判断题 (共 20 道试题,共 40 分)
31.使用异步加载技术的网站,被加载的内容可以在源代码中找到
 
32.在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server
 
33.通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
 
34.process_spider_input(response, spider)是在爬虫运行yield item或者yield scrapy.Request()的时候调用
 
35.chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
 
36.XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。
 
37.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。
 
38.自己能查看的数据,允许擅自拿给第三方查看
 
39.引用中间件时后面的数字代表的是中间件的执行顺序,例如 'AdvanceSpider.middlewares.ProxyMiddleware': 543 中的543
 
40.虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
 
41.Python可以将列表或字典转换成Json字符串
 
42.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取
 
43.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
 
44.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库
 
45.Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本
 
46.所有的异步加载都会向后台发送请求
 
47.HTTP状态码302表示资源永久重定向。
 
48.RoboMongo是MongoDB的管理软件
 
49.cookies在http请求中是明文传输的。
 
50.在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线
 
Tag:  

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)