《大数据计算技术Ⅱ》课程在线作业3
	试卷总分:100  得分:100
	一、单选题 (共 5 道试题,共 25 分)
	1.下列不属于ODBC接口特征的:
	A.用户直接将SQL语句传送给ODBC
	B.对数据库的操作不依赖任何DBMS
	C.不直接与DBMS打交道
	D.由Java 语言编写的类和接口组成
	2.下列哪一个大数据属性是用来衡量价值的:
	A.volume
	B.Variety
	C.Velocity
	D.Value
	3.下列不属于大数据开源技术解决方案的
	A.HDFS
	B.Hbase
	C.MapReduce
	D.Colossus
	4.下列哪一个大数据衡量单位最大:
	A.EB
	B.ZB
	C.PB
	D.TB
	5.下列不属于列存储格式特征的:
	A.基于主键存储
	B.基于键值对存储
	C.采用非关系型模型
	D.查询效率优于按行存储
	二、判断题 (共 13 道试题,共 65 分)
	6.读取CSV文件不可以采用读取txt文件的函数
	7.ICDM会议评选的十大经典算法包括C4.5算法、k-均值算法、支持向量机、Apriori算法、EM算法、PageRank算法、AdaBoost算法、k-临近算法、朴素贝叶斯算法和回归树算法。
	8.Mayavi不但是一个方便实用的可视化软件,而且可以方便地用Python编写扩展
	9.二次索引表机制的关键是建立主表列到RowKey的逆向映射关系
	10.集群由多个独立的计算机通过高速局域网连接在一起
	11.Hadoop基于HDFS/HBase的数据存储系统
	12.Mapper执行map task,将输出结果写入中间文件
	13.scikit-learn 是机器学习领域的一个商用库
	14.自然语言处理的应用,包括语音识别,语音翻译,理解句意等
	15.Matplotlib是为Java构建一个与Matlab之间进行交互的绘图接口
	16.串行化计算模式是大数据计算模式之一
	17.HDFS采用多副本方式进行冗余存储
	18.HDFS提供了HBase的底层数据存储结构
	三、多选题 (共 2 道试题,共 10 分)
	19.下列关于监督学习的描述,不正确的是
	A.在监督学习中,输入变量与输出变量可以是连续的,也可以是离散的
	B.在监督学习中,输入变量与输出变量只能是连续的
	C.在监督学习中,输入变量与输出变量只能是离散的
	D.若输入变量与输出变量均为连续变量,则称为分类
	20.下列属于缺失值处理方法的是:
	A.忽略该记录
	B.使用默认值
	C.使用同类样本平均值
	D.随机产生缺失值的补充
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。