大数据学试题及答案(2)

时间:2021-08-31

  26、 在网络爬虫的.爬行策略中,应用最为基础的是(AB )。 (多选题,本题3分)

  A:深度优先遍历策略 B:广度优先遍历策略

  C:高度优先遍历策略 D:反向链接策略 E:大站优先策略

  27、 当前,大数据产业发展的特点是(ACE )。 (多选题,本题3分)

  A:规模较大 B:规模较小 C:增速很快 D:增速缓慢 E:多产业交叉融合

  28、 下列关于数据生命周期管理的核心认识中,正确的是(ABC )。 (多选题,本题3分) A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段

  B:在不同的数据存在阶段,数据的价值是不同的

  C:根据数据价值的不同应该对数据采取不同的管理策略

  D:数据生命周期管理旨在产生效益的同时,降低生产成本

  E:数据生命周期管理最终关注的是社会效益

  29、 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。答案选C更正选题,本题3

  分)

  A:传统营销模式比基于大数据的营销模式投入更小

  B:传统营销模式比基于大数据的营销模式针对性更强

  C:传统营销模式比基于大数据的营销模式转化率低

  D:基于大数据的营销模式比传统营销模式实时性更强

  E:基于大数据的营销模式比传统营销模式精准性更强

  (多

  30、 下列关于脏数据的说法中,正确的是( ABCDE)。 (多选题,本题3分)

  A:格式不规范 B:编码不统一 C:意义不明确 D:与实际业务关系不大 E:数据不完整

  31、 数据再利用的意义在于( ABC)。 (多选题,本题3分)

  A:挖掘数据的潜在价值 B:实现数据重组的创新价值

  C:利用数据可扩展性拓宽业务领域 D:优化存储设备,降低设备成本

  E:提高社会效益,优化社会管理

  32、 按照涉及自变量的多少,可以将回归分析分为(CD )。 (多选题,本题3分)

  A:线性回归分析 B:非线性回归分析 C:一元回归分析

  D:多元回归分析 E:综合回归分析

  33、 传统数据密集型行业积极探索和布局大数据应用的表现是( BCE)。 (多选题,本题3分) A:投资入股互联网电商行业 B:打通多源跨域数据

  C:提高分析挖掘能力 D:自行开发数据产品

  E:实现科学决策与运营

  34、 大数据人才整体上需要具备(ABE )等核心知识。 (多选题,本题3分)

  A:数学与统计知识 B:计算机相关知识

  C:马克思主义哲学知识 D:市场运营管理知识

  E:在特定业务领域的知识

  35、 下列关于大数据的说法中,错误的是(AD )。 (多选题,本题3分)

  A:大数据具有体量大、结构单一、时效性强的特征

  B:处理大数据需采用新型计算架构和智能算法等新技术

  C:大数据的应用注重相关分析而不是因果分析

  D:大数据的应用注重因果分析而不是相关分析

  E:大数据的目的在于发现新的知识与洞察并进行科学决策

  36、 在噪声数据中,波动数据比离群点数据偏离整体水平更大。( F) (判断题,本题2分) 是 否

  37、 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。( F) (判断题,本题2分)

  是 否

  38、 一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T ) (判断题,本题2分) 是 否

  39、 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F ) (判断题,本题2分)

  是 否

  40、 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。( F) (判断题,本题2分) 是 否

  41、 决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。( T) (判断题,本题2分)

  是 否

  42、 信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。( F) (判断题,本题2分) 是 否

  43、 简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。( F) (判断题,本题2分)

  是 否

  44、 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(F ) (判断题,本题2分)

  是 否

  45、 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。( F) (判断题,本题2分)

  是 否

  46.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)

  A。数据规模大 B。数据类型多样 C。数据处理速度快D。数据价值密度高

  47.下列关于大数据的分析理念的说法中,错误的是(D)

  A.在数据基础上倾向于全体数据而不是抽样数据B。在分析方法上更注重相关分析而不是因果分析C。在分析效果上更追求效率而不是绝对精确D。在数据规模上强调相对数据而不是绝对数据

  49.下列关于普查的缺点的说法中,正确的是(A)

  A.工作量较大,容易导致调查内容有限、产生重复和遗漏现象B。误差不易被控制C。对样本的依赖比较强D。评测结果不够稳定

  50.下列关于聚类挖掘技术的说法中,错误的是(B)

  A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。要求同类数据的内容相似度尽可能小C。要求不同类数据的内容相似度尽可能小D。与分类挖掘技术相似的是,都是要对数据进行分类处理