南开19春学期(1709、1803、1809、1903)《大数据开发技术(一)》在线作业【标准答案】

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2019-06-24 20:55

19春学期(1709、1803、1809、1903)《大数据开发技术(一)》在线作业-0001 试卷总分:100 得分:0 一、 单选题 (共 30 道试题,共 60 分) 1.以下说法不正确的是()。 A.Zookeeper提供分布式锁之类的
19春学期(1709、1803、1809、1903)《大数据开发技术(一)》在线作业-0001
试卷总分:100    得分:0
一、 单选题 (共 30 道试题,共 60 分)
1.以下说法不正确的是()。
A.Zookeeper提供分布式锁之类的基本服务
B.Mahout提供了分布式存储服务
C.Flume提供了日志管理服务
D.Sqoop主要被用于数据交互操作
 
 
2.使用Amazon云环境部署Hadoop的说法中错误的是()。
A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B.Hadoop自带有一套脚本,用于在EC2上面运行Hadoop
C.在EC2上运行Hadoop尤其适用于一些工作流
D.Amazon EC2为Hadoop提供了存储服务
 
 
3.优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
 
 
4.以下哪个是通过JDBS和关系数据库进行交互的()。
A.Ambari
B.Oozie
C.Hive
D.Sqoop
 
 
5.MongoDB将数据存储为一个()
A.关系
B.属性
C.字段
D.文档
 
 
6.BigTable采用()作为底层数据存储
A.HDFS
B.GFS
C.Hbase
D.传统文件系统
 
 
7.R是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
 
 
8.以下哪个不属于MongoDB的特点
A.提供了面向文档的存储
B.可以设置任何属性索引
C.具有很好的垂直可扩展性
D.支持丰富的查询表达式
 
 
9.Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings()。
A.ShuffleGrouping
B.AllGrouping
C.GlobalGrouping
D.FiedlsGrouping
 
 
10.关于分布式并行编程,以下说法错误的是()。
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce
 
 
11.UMP系统中面对中等规模用户如何进行资源调度()
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
 
 
12.Hbase中采用()保证系统出错时及时恢复
A.MemStore
B.Hlog
C.StoreFile
D.客户端
 
 
13.批处理系统关注(),流处理系统关注()。
A.吞吐率,延时
B.延时,吞吐率
C.延时,速度
D.速度,吞吐率
 
 
14.UMP系统借助于()来实现各个节点之间的通信
A.Mnesia
B.LVS
C.RabbitMQ
D.Zookeeper
 
 
15.Hbase中-ROOT-表有()个Region
A.1
B.10
C.10-1000
D.0
 
 
16.以下哪层不属于物联网体系架构()。
A.应用层
B.采集层
C.网络层
D.感知层
 
 
17.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A.垂直扩展
B.水平扩展
C.拓扑扩展
D.叠加
 
 
18.hadoop fs -() 命令可以显示指定的文件的详细信息
A.ll
B.ls
C.dir
D.show
 
 
19.Hbase采用()作为底层数据存储
A.HDFS
B.GFS
C.Hbase
D.传统文件系统
 
 
20.应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
A.列族数据库
B.键值数据库
C.图数据库
D.文档数据库
 
 
21.Gephi是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
 
 
22.Pregel计算模型以()作为输入
A.有向图
B.无向图
C.矢量图
D.树
 
 
23.Amazon SimpleDB属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
 
 
24.很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。
A.动态
B.存量
C.实时
D.静态
 
 
25.关于MapReduce中Shuffle过程,说法错误的是()。
A.Shuffle过程中为每个Map任务分配一个缓存
B.Shuffle过程中分区默认采用哈希函数
C.Shulle过程的合并会改变最终结果
D.Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
 
 
26.UMP系统借助于()来实现高效和可靠的协同工作
A.Mnesia
B.LVS
C.RabbitMQ
D.Zookeeper
 
 
27.Storm框架不适用于哪个领域()。
A.实时分析
B.实时交通
C.远程RPC
D.历史记录查询
 
 
28.Timetoast是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
 
 
29.以下亚马逊的产品中哪个是键值数据库
A.RDS
B.SimpleDB
C.DynamoDB
D.Redshift
 
 
30.关于Strom中Bolt说法错误的是()。
A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B.Bolt是一个被动的角色,Spout是一个主动的角色
C.Bolt不仅可以处理Tuple还可以创建新的Tuple
D.Bolt是Streams的状态转换过程的抽象含义
 
 
二、 多选题 (共 10 道试题,共 20 分)
1.NoSQL数据库与关系数据库相比有哪些优势()
A.支持事务ACID四性
B.可以支持超大规模数据存储
C.以完善的关系代数理论作为基础
D.具有强大的横向扩展能力
 
 
2.分布式文件系统的设计目的包括()。
A.并发控制
B.可伸缩性
C.容错
D.速度
 
 
3.关于MapReduce,说法正确的是()。
A.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
B.Hadoop框架是用Java实现的,因此MapReduce应用程序要用Java来写
C.MapReduce模型的核心是Map函数和Reduce函数
D.MapReduce将一个存储在分布式文件系统中的大规模数据集,切分成许多独立的分片
 
 
4.以下属于流计算框架的是()。
A.Twitter Storm
B.Spark
C.MapReduce
D.Pregel
E.Yahoo! S4
 
 
5.以下包含在Hadoop项目中的有()。
A.Ambari
B.Redis
C.MongoDB
D.Pig
E.Sqoop
 
 
6.Hbase提供了哪些访问接口?
A.Pig
B.Hive
C.Zookeeper
D.Java API
 
 
7.以下说法正确的是()。
A.Kafka是一种高吞吐量的分布式发布订阅消息系统
B.Spark是并行框架
C.Pig是一个基于Hadoop的大规模数据计算平台
D.Storm是一种流计算框架
 
 
8.以下哪些不是UMP系统中的角色()
A.Controller服务器
B.Procy服务器
C.Master服务器
D.Agent服务器
 
 
9.关系数据库与NoSQL数据库相比适用于哪些领域()
A.电信
B.银行
C.互联网企业大数据处理
D.传统企业的数据分析
 
 
10.关系数据库与NoSQL数据库相比有哪些优势()
A.支持事务ACID四性
B.可以支持超大规模数据存储
C.以完善的关系代数理论作为基础
D.具有强大的横向扩展能力
 
 
三、 判断题 (共 10 道试题,共 20 分)
1.数据仓库、专家系统产生于大数据发展的成熟期
A.对
B.错
 
 
2.Hbase中列族支持动态扩展,可以很轻松地添加一个列族或列
A.对
B.错
 
 
3.Hive提供了大数据批处理计算功能。
A.对
B.错
 
 
4.UMP系统中的Mnesia不错支持事务
A.对
B.错
 
 
5.数据产生方式的用户原创内容阶段的数据产生方式是主动的。
A.对
B.错
 
 
6.分布式离线分析可以实现秒级别的实时分析响应。
A.对
B.错
 
 
7.Hbase中表在水平方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起
A.对
B.错
 
 
8.Hadoop是典型的批处理模型
A.对
B.错
 
 
9.Ambari通过Web进行Hadoop集群的管理配置。
A.对
B.错
 
 
10.数据产生方式的运营式系统阶段的数据产生方式是主动的。
A.对
B.错
 
Tag:  

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)