26、 在网络爬虫的.爬行策略中,应用最为基础的是(AB )。 (多选题,本题3分)
A:深度优先遍历策略 B:广度优先遍历策略
C:高度优先遍历策略 D:反向链接策略 E:大站优先策略
27、 当前,大数据产业发展的特点是(ACE )。 (多选题,本题3分)
A:规模较大 B:规模较小 C:增速很快 D:增速缓慢 E:多产业交叉融合
28、 下列关于数据生命周期管理的核心认识中,正确的是(ABC )。 (多选题,本题3分) A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
B:在不同的数据存在阶段,数据的价值是不同的
C:根据数据价值的不同应该对数据采取不同的管理策略
D:数据生命周期管理旨在产生效益的同时,降低生产成本
E:数据生命周期管理最终关注的是社会效益
29、 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。答案选C更正选题,本题3
分)
A:传统营销模式比基于大数据的营销模式投入更小
B:传统营销模式比基于大数据的营销模式针对性更强
C:传统营销模式比基于大数据的营销模式转化率低
D:基于大数据的营销模式比传统营销模式实时性更强
E:基于大数据的营销模式比传统营销模式精准性更强
(多
30、 下列关于脏数据的说法中,正确的是( ABCDE)。 (多选题,本题3分)
A:格式不规范 B:编码不统一 C:意义不明确 D:与实际业务关系不大 E:数据不完整
31、 数据再利用的意义在于( ABC)。 (多选题,本题3分)
A:挖掘数据的潜在价值 B:实现数据重组的创新价值
C:利用数据可扩展性拓宽业务领域 D:优化存储设备,降低设备成本
E:提高社会效益,优化社会管理
32、 按照涉及自变量的多少,可以将回归分析分为(CD )。 (多选题,本题3分)
A:线性回归分析 B:非线性回归分析 C:一元回归分析
D:多元回归分析 E:综合回归分析
33、 传统数据密集型行业积极探索和布局大数据应用的表现是( BCE)。 (多选题,本题3分) A:投资入股互联网电商行业 B:打通多源跨域数据
C:提高分析挖掘能力 D:自行开发数据产品
E:实现科学决策与运营
34、 大数据人才整体上需要具备(ABE )等核心知识。 (多选题,本题3分)
A:数学与统计知识 B:计算机相关知识
C:马克思主义哲学知识 D:市场运营管理知识
E:在特定业务领域的知识
35、 下列关于大数据的说法中,错误的是(AD )。 (多选题,本题3分)
A:大数据具有体量大、结构单一、时效性强的特征
B:处理大数据需采用新型计算架构和智能算法等新技术
C:大数据的应用注重相关分析而不是因果分析
D:大数据的应用注重因果分析而不是相关分析
E:大数据的目的在于发现新的知识与洞察并进行科学决策
36、 在噪声数据中,波动数据比离群点数据偏离整体水平更大。( F) (判断题,本题2分) 是 否
37、 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。( F) (判断题,本题2分)
是 否
38、 一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T ) (判断题,本题2分) 是 否
39、 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F ) (判断题,本题2分)
是 否
40、 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。( F) (判断题,本题2分) 是 否
41、 决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。( T) (判断题,本题2分)
是 否
42、 信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。( F) (判断题,本题2分) 是 否
43、 简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。( F) (判断题,本题2分)
是 否
44、 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(F ) (判断题,本题2分)
是 否
45、 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。( F) (判断题,本题2分)
是 否
46.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)
A。数据规模大 B。数据类型多样 C。数据处理速度快D。数据价值密度高
47.下列关于大数据的分析理念的说法中,错误的是(D)
A.在数据基础上倾向于全体数据而不是抽样数据B。在分析方法上更注重相关分析而不是因果分析C。在分析效果上更追求效率而不是绝对精确D。在数据规模上强调相对数据而不是绝对数据
49.下列关于普查的缺点的说法中,正确的是(A)
A.工作量较大,容易导致调查内容有限、产生重复和遗漏现象B。误差不易被控制C。对样本的依赖比较强D。评测结果不够稳定
50.下列关于聚类挖掘技术的说法中,错误的是(B)
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。要求同类数据的内容相似度尽可能小C。要求不同类数据的内容相似度尽可能小D。与分类挖掘技术相似的是,都是要对数据进行分类处理