《大数据计算技术Ⅱ》课程在线作业1
	试卷总分:100  得分:100
	一、单选题 (共 5 道试题,共 25 分)
	1.下列哪一个大数据衡量单位最大:
	A.EB
	B.ZB
	C.PB
	D.TB
	2.下列哪一个大数据属性是用来衡量价值的:
	A.volume
	B.Variety
	C.Velocity
	D.Value
	3.下列不属于大数据计算体系三个基本层次的:
	A.数据存储系统
	B.数据处理系统
	C.数据应用系统
	D.数据传输系统
	4.下列不属于NOSQL数据库的是:
	A.SQL数据库
	B.列存储数据库
	C.文档数据库
	D.图形数据库
	5.下列不属于大数据开源技术解决方案的
	A.HDFS
	B.Hbase
	C.MapReduce
	D.Colossus
	二、多选题 (共 2 道试题,共 10 分)
	6.下列属于数据处理算法的
	A.回归分析
	B.聚类算法
	C.关联规则算法
	D.排序算法
	7.下列属于缺失值处理方法的是:
	A.忽略该记录
	B.使用默认值
	C.使用同类样本平均值
	D.随机产生缺失值的补充
	三、判断题 (共 13 道试题,共 65 分)
	8.ICDM会议评选的十大经典算法包括C4.5算法、k-均值算法、支持向量机、Apriori算法、EM算法、PageRank算法、AdaBoost算法、k-临近算法、朴素贝叶斯算法和回归树算法。
	9.读取CSV文件不可以采用读取txt文件的函数
	10.ndarray对象的属性包括数组轴的个数
	11.DataFrame每一列必须都是类型相同的值
	12.Hadoop基于HDFS/HBase的数据存储系统
	13.一个HDFS文件可以按Split形式进行物理存储
	14.KNN算法无需通过学习得到决策函数。
	15.PageRank用来解决链接分析中网页排名的问题
	16.读取文本常用函数包括write
	17.要把数据写入txt文件,必须创建file对象
	18.连接数据库时需要设置服务器的名称
	19.连接数据库时需要设置服务器的地址
	20.merge默认对数据表进行内连接
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。