南开19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业【标准答案】

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2019-09-18 18:45

19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业-0003 试卷总分:100 得分:0 一、 单选题 (共 15 道试题,共 30 分) 1.大数据的最显著特征是() 。 A.数据规模大 B.数据类型多样 C
19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业-0003
试卷总分:100    得分:0
一、 单选题 (共 15 道试题,共 30 分)
1.大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
 
 
2.用于描述数据分散情况的是()
A.分布图
B.箱式图
C.饼图
D.折线图
 
 
3.下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
 
 
4.数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
 
 
5.数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
 
 
6.下列哪个R语言扩展包可以创建带有点和边的网络图()
A.ggplot2
B.network
C.ggmaps
D.animation
 
 
7.IaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
 
 
8.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
 
 
9.GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
 
 
10.以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
 
 
11.以下哪项不是数据可视化工具的特性()
A.实时性
B.简单操作
C.更丰富的展现
D.仅需一种数据支持方式即可
 
 
12.第一个提出大数据概念的公司是( )。
A.麦肯锡公司
B.谷歌公司
C.微软公司
D.脸谱公司
 
 
13.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.ggplot2
B.network
C.ggmaps
D.animation
 
 
14.用于描述相等时间间隔下连续数据随时间变化趋势的是()
A.折线图
B.散点图
C.条形图
D.饼图
 
 
15.DAS代表的意思是()
A.两个异步存储
B.数据归档软件
C.连接一个可选的存储
D.直连存储
 
 
二、 多选题 (共 15 道试题,共 30 分)
1.大数据采集主要包括()四种。
A.系统日志采集
B.网络数据采集
C.数据库采集
D.其他数据采集
 
 
2.基于大数据的临床决策支持系统的架构包括
A.支撑层
B.大数据分析层
C.网络层
D.应用层
 
 
3.可视化工具包括()
A.Excel
B.Google Chart
C.Gephi
D.ppt
 
 
4.大数据存储的特点与挑战有()
A.容量问题
B.延迟问题
C.安全问题
D.成本问题
 
 
5.传感器工作模式类别包括()
A.基于位置
B.基于活动
C.基于设备
 
 
6.数据归约(Data Reduction)主要有有()
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
 
 
7.常见的非结构化数据有()
A.web网页
B.即时消息
C.富文本文档
D.实时多媒体数据
 
 
8.关于R语言扩展包下列正确的是()
A.network可创建带有点和边的网络图
B.animation可制作一系列的图像并将它们串联起来做成动画
C.ggmaps通过树图来可视化层次型数据
D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
 
 
9.最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
A.用户行为数据
B.日志式的活动数据
C.事件信息
 
 
10.数据预处理的过程主要是
A.数据清洗
B.数据集成
C.数据变换
D.数据规约
 
 
11.大数据时代预测人类移动行为的数据特点是
A.多样化
B.数据量大
C.维数高
D.变化快
 
 
12.常见的分类方法有
A.决策树
B.贝叶斯网络
C.遗传算法
D.FP算法
 
 
13.数据归约(Data Reduction)主要有()
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
 
 
14.大数据在教育中的应用
A.网上公开课
B.慕课
C.智慧校园
D.翻转课堂
 
 
15.云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A.流计算
B.分布式计算
C.并行计算
D.网络计算
 
 
三、 判断题 (共 20 道试题,共 40 分)
1.《科学》(Science)杂志专刊——Dealing with data,通过社会调查的方式,第一次综合分析了大数据对人们生活造成的影响,详细描述了人类面临的“数据困境”。
A.对
B.错
 
 
2.NewSQL是对各种可扩展/高性能数据库的简称,这类数据库在保持了传统数据库支持ACID和SQL等能力的同时,还具有NoSQL对海量数据的存储管理能力。
A.对
B.错
 
 
3.PaaS是平台即服务的简称
A.对
B.错
 
 
4.用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。分析人员可以交互式地逐步优化设置以改进结果。
A.对
B.错
 
 
5.FP算法比Apriori算法慢
A.对
B.错
 
 
6.当数据量表完全超过BI和传统关系数据库的能力时,我们将用到海量数据分析。
A.对
B.错
 
 
7.广义的Spark是指Spark生态系统,采用了四层架构。
A.对
B.错
 
 
8.内存分析数据量比海量分析数据量大
A.对
B.错
 
 
9.数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式
A.对
B.错
 
 
10.数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。
A.对
B.错
 
 
11.利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
A.对
B.错
 
 
12.事件是Flume的基本数据单位
A.对
B.错
 
 
13.大数据可视化便于人们对数据的理解
A.对
B.错
 
 
14.用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。
A.对
B.错
 
 
15.数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
A.对
B.错
 
 
16.数据挖掘主要是为了发现隐藏在数据中的有用信息和规律
A.对
B.错
 
 
17.美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”
A.对
B.错
 
 
18.在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。
A.对
B.错
 
 
19.大数据数据量一定是PB,TB级的
A.对
B.错
 
 
20.美国《自然》(Nature)杂志专刊——The next google,第一次正式提出“大数据”概念。
A.对
B.错
 
Tag:  

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)