东财《大数据概念、方法与应用》在线作业2-0003 试卷总分:100 得分:100 一、单选题 (共 20 道试题,共 40 分) 1.大数据不是要教机器像人一样思考。相反,它是( )。 A.预测与惩罚 B.把数学算法
东财《大数据——概念、方法与应用》在线作业2-0003
试卷总分:100 得分:100
一、单选题 (共 20 道试题,共 40 分)
1.大数据不是要教机器像人一样思考。相反,它是( )。
A.预测与惩罚
B.把数学算法运用到海量的数据上来预测事情发生的可能性
C.被视为人工智能的一部分
D.被视为一种机器学习
2.导入与预处理过程的特点和挑战是( )。
A.数据量大,导致企业不堪重负
B.成本增长速度快
C.以上选项都不正确
D.隐私安全
3.可视化是给人看的,( )是给机器看的。
A.数据挖掘
B.数据质量和管理
C.语音引擎
D.预测性分析
4.相关关系强是指当一个数据值增加时,另一个数据值有可能也随着( )。
A.减少
B.不变
C.无法确定
D.增加
5.下列属于半结构化数据的是( )。
A.视频数据
B.网络日志
C.文本数据
D.音频数据
6.偏差检测的基本方法是寻找( )之间有意义的差别。
A.期望值与预测值
B.预测值与参照值
C.观测值与参照值
D.期望值与参照值
7.相比依赖于小数据和精确性的时代,大数据因为更强调数据的( ),帮助我们进一步接近事实的真相。
A.完整性
B.完整性和混杂性
C.安全性
D.混杂性
8.在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于( )为其行为承担责任。
A.数据分析者
B.数据提供者
C.数据使用者
D.个人许可
9.( )意味着当一个数据值增加时,另一个数据值几乎不发生变化。
A.没有相关关系
B.相关关系强
C.相关关系弱
D.不确定
10.数据挖掘在大型数据库中寻找预测信息是( )。
A.随机的
B.自动的
C.单一的
D.被动的
11.下列说法正确的是( )。
A.有价值的数据是附属于企业经营核心业务的一部分数据
B.数据挖掘它的主要价值后就没有必要再进行分析了
C.在大数据时代,收集、存储和分析数据非常简单
D.所有数据都是有价值的
12.当前,( )成为登录互联网的主要手段。
A.固定电话
B.手机
C.电视
D.电脑
13.数据挖掘的分类方法是找出数据库中一组数据对象的( )并按照分类模式将其划分为不同的类。
A.属性
B.值
C.不同点
D.共同点
14.( )将在大数据价值链中获益最大。
A.拥有技术的人
B.拥有大数据库的人
C.拥有大数据思维的人
D.拥有大数据的人
15.( )可以帮助我们捕捉现在和预测未来。
A.因果分析
B.统计分析
C.随机抽样
D.相关关系分析
16.采样分析的精确性随着采样随机性的增加而( ),但与样本数量的增加关系不大。
A.提高
B.降低
C.不变
D.无关
17.( )一些基金公司开始借助社交媒体大数据,分析市场情绪变动。
A.美国
B.法国
C.英国
D.中国
18.( )央行已经开始运用大数据对房地产市场和劳动力市场趋势作出快速判断。
A.中国
B.法国
C.美国
D.英国
19.半结构化的数据分析需求可以使用( )。
A.Exadata
B.Hadoop
C.Infobright
D.GreenPlum
20.根据国家数据公司(IDC)统计,2010年人类已经进入( )时代。
A.ZB
B.GB
C.MB
D.TB
二、多选题 (共 10 道试题,共 20 分)
21.( )在传统数据领域已得到较充分运用。
A.数理模型
B.计量模型
C.价值分析
D.数据分析
22.大数据处理数据时代理念的转变主要体现在哪几个方面( )?
A.要相关不要因果
B.要整体不要部分
C.要效率不要绝对精确
D.要全体不要抽样
23.数据挖掘出的知识是( )。
A.可接受的
B.可运用的
C.可理解的
D.有规则的
24.聚类分析是把一组数据按照( )分为几个类别。
A.差异性
B.相关性
C.相似性
D.逻辑性
25.聚类是( )的先决条件。
A.预测
B.概念描述
C.关联分析
D.偏差分析
26.从商业层面上看,数据挖掘的主要特点是( )。
A.对商业数据库中的大量业务数据进行分析
B.从商业数据库中提取辅助商业决策的关键性数据
C.对商业数据库中的大量业务数据进行其他模型化处理
D.对商业数据库中的大量业务数据进行抽取、转换
27.大数据可分成( )、大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。
A.大数据工程
B.大数据收集
C.大数据科学
D.大数据技术
28.下列选择中,属于大数据风险的是( )。
A.数据量大,导致企业不堪重负
B.成本增长速度快
C.隐私安全
D.以上选项都不正确
29.关于数据的潜在价值,说法正确的是( )。
A.在基本用途完成后,数据的价值仍然存在,只是处于休眠状态
B.数据的价值是其所有可能用途的总和
C.判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途
D.数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下
30.下列属于数据中间商的是( )。
A.Quantcast通过帮助网站记录用户的网页浏览历史来测评用户的年龄、收入、喜好等个人信息,然后向用户发送有针对性的定向广告
B.中国最大的汽车网站,汽车之家,各家汽车的数据和大量用户
C.中国最大的银行中国银行,拥有大量客户的数据
D.西雅图的交通数据处理公司Inrix,汇集了来自美洲和欧洲近1亿辆汽车的实时交通数据
三、判断题 (共 20 道试题,共 40 分)
31.对于大数据分析需求,一些实时性需求会用到MySQL的Infobright。( )
32.通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。( )
33.大数据时代,银行业可以打破信息孤岛,全面整合客户的多渠道交易数据。( )
34.商品分析通过指导企业商品结构的调整,加强所营商品的竞争能力和合理配置。( )
35.银行自建电商平台,获得数据资源的独立话语权。( )
36.在监控客户行为时,大数据可以识别出潜在的违规客户,从而节省反欺诈监控资源。( )
37.关联分析产生的规则是没有可信度的。( )
38.从商业层面上看,数据挖掘是一种新的商业信息处理技术。( )
39.对于大数据分析需求,一些实时性需求会用到Oracle的Exadata。( )
40.所有的数据都会贬值。( )
41.数据挖掘一般要预先设定好主题。( )
42.顾客分析主要是针对单个顾客的购买行为的分析。( )
43.生成一个类的特征性描述只涉及该类对象中单个对象的特征。( )
44.随机采样本身存在许多固有的缺陷和不足。( )
45.相关关系的核心是量化两个数值之间的数理关系。( )
46.特征分析是从数据库中的一组数据中提取出关于这些数据的差异性。( )
47.大数据时代,对相关关系分析和因果关系分析则摈弃了初始假设,使相关关系分析变得更加简单。( )
48.大数据思维认为公开的数据一旦处理得当就能为成千百万人急需解决的问题提供答案。( )
49.商业层次的数据挖掘是单纯为了研究的需要。( )
50.对中小客户来说,专门的客户关系管理是能够承受得了的。( )