《大数据技术》在线平时作业3-00001
	试卷总分:100  得分:100
	一、单选题 (共 10 道试题,共 50 分)
	1.持续改善,即在生产活动中不断提高,其核心不包括( )
	A.增加更多人手
	B.加快学习过程
	C.联系更多专家
	D.组织更多活动
	2.当企业处于越来越多的数据和决策的“围城”之中时,为寻找一个可持续发展的优势,可以( )来支持他们独特的经营策略,以帮助实现业务目标。
	A.量身定制其分析战略
	B.加大生产规模
	C.引进人才提高研究水平
	D.厉行节约减少成本
	3.( )是关联规则分析的一个典型例子。该过程通过发现顾客放入其中的不同商品之间的联系,分析顾客的购买习惯
	A.相关关系
	B.结合方式
	C.不同之处
	D.依赖程度
	4.大数据的4V特征中的Volume是指( )。
	A.价值密度低
	B.处理速度快
	C.数据类型繁多
	D.数据体量巨大
	5.定性分析专注于用( )描述不同数据的质量。与定量分析相对比,定性分析涉及分析相对小而深入的样本,其分析结果不能被适用于整个数据集中,也不能测量数值或用于数值比较。
	A.资源运用
	B.潜在风险
	C.经济价值
	D.潜在决策
	6.空间或地理空间数据通常用来识别单个实体的( )地理位置,然后将其绘图。空间数据分析专注于分析基于地点的数据,从而寻找实体间不同地理关系和模式。
	A.自然位置
	B.空间位置
	C.社交位置
	D.地理位置
	7.如今随着第二代更强大的分析功能的问世,在企业的( )方面都有利用分析的机会。
	A.销售
	B.各个
	C.财务
	D.采购
	8.Hadoop 作者
	A.Hadoop
	B.Nutch
	C.Lucene
	D.Solr
	9.针对每行数据内容为”Timestamp Url”的数据文件,在用JobConf对象conf设置conf.setInputFormat(WhichInputFormat.class)来读取这个文件时,WhichInputFormat应该为以下的( )
	A.TextInputFormat
	B.KeyValueTextInputFormat
	C.SequenceFileInputFormat
	D.NlineInputFormat
	10.下面与HDFS类似的框架是( )
	A.NTFS
	B.FAT32
	C.GFS
	D.EXT3
	二、多选题 (共 5 道试题,共 25 分)
	11.下面对LSM结构描述正确的是?
	A.顺序存储
	B.直接写硬盘
	C.需要将数据Flush到磁盘
	D.是一种搜索平衡树
	12.关于HBase二级索引的描述,哪些是正确的?
	A.核心是倒排表
	B.二级索引概念是对应Rowkey这个“一级”索引
	C.二级索引使用平衡二叉树
	D.二级索引使用LSM结构
	13.MapReduce与HBase的关系,哪些描述是正确的?
	A.两者不可或缺,MapReduce是HBase可以正常运行的保证
	B.两者不是强关联关系,没有MapReduce,HBase可以正常运行
	C.MapReduce可以直接访问Hbase
	D.它们之间没有任何关系
	14.下列哪个是 Hadoop 运行的模式?
	A.单机版
	B.伪分布式
	C.分布式
	15.HBase构建二级索引的实现方式有哪些?
	A.MapReduce
	B.Coprocessor
	C.Bloom Filter
	D.Filter
	三、判断题 (共 5 道试题,共 25 分)
	16.Nagios 不可以监控 Hadoop 集群,因为它不提供 Hadoop 支持。
	17.Hadoop 支持数据的随机读写。
	18.因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的。
	19.Ganglia 不仅可以进行监控,也可以进行告警。
	20.Hadoop 默认调度器策略为 FIFO.
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。