《大数据计算技术Ⅱ》课程在线作业2 试卷总分:100 得分:100 一、单选题 (共 4 道试题,共 20 分) 1.美国政府在哪一年推出大数据的研究和发展计划: A.2010 B.2011 C.2012 D.2013 2.下列哪一个大数
        
         
     
	《大数据计算技术Ⅱ》课程在线作业2
	试卷总分:100  得分:100
	一、单选题 (共 4 道试题,共 20 分)
	1.美国政府在哪一年推出“大数据的研究和发展计划”:
	A.2010
	B.2011
	C.2012
	D.2013
	2.下列哪一个大数据属性是用来衡量价值的:
	A.volume
	B.Variety
	C.Velocity
	D.Value
	3.下列不属于列存储格式特征的:
	A.基于主键存储
	B.基于键值对存储
	C.采用非关系型模型
	D.查询效率优于按行存储
	4.下列不属于NOSQL数据库的是:
	A.SQL数据库
	B.列存储数据库
	C.文档数据库
	D.图形数据库
	二、多选题 (共 3 道试题,共 15 分)
	5.下列属于数据噪声处理方法的是:
	A.分箱算法
	B.平滑算法
	C.聚类算法
	D.回归算法
	6.下列属于缺失值处理方法的是:
	A.忽略该记录
	B.使用默认值
	C.使用同类样本平均值
	D.随机产生缺失值的补充
	7.下列关于监督学习的描述,不正确的是
	A.在监督学习中,输入变量与输出变量可以是连续的,也可以是离散的
	B.在监督学习中,输入变量与输出变量只能是连续的
	C.在监督学习中,输入变量与输出变量只能是离散的
	D.若输入变量与输出变量均为连续变量,则称为分类
	三、判断题 (共 13 道试题,共 65 分)
	8.merge默认对数据表进行内连接
	9.读取CSV文件不可以采用读取txt文件的函数
	10.replace方法不支持一次性替换多个值
	11.DataFrame每一列必须都是类型相同的值
	12.scikit-learn 是机器学习领域的一个商用库
	13.HDFS提供了HBase的底层数据存储结构
	14.join默认对数据表进行内连接
	15.ndarray对象的属性包括数组轴的个数
	16.在创建数组类型时,可以按照特定的格式进行显示
	17.NumPy运算符dot函数是按元素相乘进行计算的
	18.完全不拷贝可以简单地对数组进行赋值,而不需要拷贝数组对象的数据。
	19.Pandas只能处理按照时间序列排列的数据
	20.Mapper执行map task,将输出结果写入中间文件


