南开22春学期(高起本1709、全层次1803-2103)《大数据开发技术(一)》在线作业【标准答案】

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2022-08-31 11:45

22春学期(高起本1709-1803、全层次1809-2103)《大数据开发技术(一)》在线作业-00001 试卷总分:100 得分:100 一、单选题 (共 30 道试题,共 60 分) 1.UMP系统中面对分库分表用户如何进行资源调
22春学期(高起本1709-1803、全层次1809-2103)《大数据开发技术(一)》在线作业-00001
试卷总分:100  得分:100
一、单选题 (共 30 道试题,共 60 分)
1.UMP系统中面对分库分表用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
 
2.以下说法不正确的是()。
A.MapReduce的核心思想就是“分面治之”
B.HDFS是对GFS的开源实现
C.MapReduce是一种分布式计算模型
D.HDFS采用HBase作为其底层数据存储
 
3.HDFS中()记录了每个文件中各个块所在的数据节点的位置信息
A.NameNode
B.SecondaryNameNode
C.DataNode
D.Block
 
4.Amazon DynamoDB属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
 
5.SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层
A.Client Layer
B.Services Layer
C.Platform Layer
D.Infrastructure Layer
 
6.以下针对Hive的说法不正确的是()。
A.Hive是一个基于Hadoop的数据仓库工具
B.Hive是关系数据库
C.Hive QL是一种查询语言
D.Hive可以提供查询分析存储等功能
 
7.Gephi是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
 
8.SQL Azure体系结构层中哪层是硬件和操作系统
A.Client Layer
B.Services Layer
C.Platform Layer
D.Infrastructure Layer
 
9.UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
A.Controller服务器
B.Procy服务器
C.愚公系统
D.Agent服务器
 
10.Amazon SimpleDB属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
 
11.关于Storm中Topology说法错误的是()。
A.Topology可视为流转换图
B.Topology可以被提交到Storm集群执行
C.在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算
D.Topology里面的每一个组件都是串行运行的
 
12.Google Fusion Tables是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
 
13.Pregel计算模型中每个顶点ID的类型是()
A.String
B.Int
C.Double
D.结构体
 
14.HDFS中ClientProtocol的()方法通知名称节点关闭文件
A.close
B.finish
C.exit
D.complete
 
15.Storm框架在处理()上比MapReduce更有优势。
A.静态数据
B.流数据
C.批量数据
D.网络数据
 
16.以下亚马逊的产品中哪个是数据仓库
A.ElastiCache
B.RDS
C.DynamoDB
D.Redshift
 
17.优点是扩展性好,灵活性好,大量写操作时性能高的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
 
18.Pregel计算模型以()作为输入
A.有向图
B.无向图
C.矢量图
D.树
 
19.使用Amazon云环境部署Hadoop的说法中错误的是()。
A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B.Hadoop自带有一套脚本,用于在EC2上面运行Hadoop
C.在EC2上运行Hadoop尤其适用于一些工作流
D.Amazon EC2为Hadoop提供了存储服务
 
20.NoSQL中的CAP理论中的P代表()
A.一致性
B.可用性
C.分区容忍性
D.可扩展性
 
21.Storm框架不适用于哪个领域()。
A.实时分析
B.实时交通
C.远程RPC
D.历史记录查询
 
22.Amazon Redshift属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
 
23.以下哪个不属于MongoDB的特点
A.提供了面向文档的存储
B.可以设置任何属性索引
C.具有很好的垂直可扩展性
D.支持丰富的查询表达式
 
24.HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A.Master
B.Region
C.Zookeeper
D.Chubby
 
25.()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
A.DistributedFileSystem
B.GFSSystem
C.FileSystem
D.HDFSSystem
 
26.词频计算就是典型的()运算。
A.关系连接
B.分组聚合
C.关系代数
D.矩阵
 
27.行式数据库采用()存储模型
A.NSM
B.DSM
C.Hbase
D.MySQL
 
28.列式数据库采用()存储模型
A.NSM
B.DSM
C.Hbase
D.MySQL
 
29.Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
 
30.信息技术发展史上的第三次信息化浪潮解决的问题是什么()。
A.信息处理
B.信息增长
C.信息爆炸
D.信息传输
 
二、多选题 (共 10 道试题,共 20 分)
31.以下图计算软件哪种属于基于遍历算法的、实时的图数据库
A.Neo4j
B.OrientDB
C.Infinite Graph
D.Pregel
 
32.分布式文件系统的设计目的包括()。
A.并发控制
B.可伸缩性
C.容错
D.速度
 
33.MapReduce的main函数中设置输出类型的方法有()。
A.setOutputKeyClass
B.setOutputClass
C.setOutputValueClass
D.setKeyValueClass
 
34.以下哪些是数据可视化时间线工具()
A.Echarts
B.Timetoast
C.Xtimeline
D.R
 
35.HDFS中NameNode保存的核心数据结构是()
A.FsImage
B.DataNode
C.Block
D.EditLog
 
36.关系数据库与NoSQL数据库相比适用于哪些领域()
A.电信
B.银行
C.互联网企业大数据处理
D.传统企业的数据分析
 
37.以下哪种数据库属于NoSQL数据库()
A.MongoDB
B.Oracle
C.Neo4j
D.Redis
E.Hbase
 
38.HDFS要实现的目标
A.流数据读写
B.大数据集的操作
C.复杂的文件模型
D.强大的跨平台兼容性
 
39.以下哪些是数据可视化信息图表工具()
A.大数据魔镜
B.D3
C.Google Chart API
D.Google Fusion Tables
 
40.NoSQL数据库与关系数据库相比适用于哪些领域()
A.电信
B.银行
C.互联网企业大数据处理
D.传统企业的数据分析
 
三、判断题 (共 10 道试题,共 20 分)
41.Hbase中为每个Region服务器配置了一个HLog文件,它是一种后写式日志
 
42.Pregel的消息模式采用异步和批量的方式传递消息,却无法缓解远程读取的延迟
 
43.大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。
 
44.Storm中的Tuple是一个Key-Value的Map,但也可以填入一个Value-List。
 
45.HDFS在块的大小的设计上明显要小于普通文件系统,可以最小化寻址开销
 
46.Linux系统中只有Ubuntu可以安装Hadoop。
 
47.Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。
 
48.Pregel将计算细化到顶点,同时在顶点内控制循环迭代次数,而MapReduce则将计算批量化处理,按任务进行循环迭代控制
 
49.Hbase中每个Region 使用一个Hlog
 
50.MapReduce执行程序时可以直接运行.class文件
 
Tag:  

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)