大数据工程技术人员考试题目及答案

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:403

试卷答案:没有

试卷介绍: 大数据工程技术人员考试题目及答案已经上线了,需要的朋友快来刷题吧。

开始答题

试卷预览

  • 1. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务()。

    A探索性数据分析

    B建模描述

    C预测建模

    D寻找模式和规则

  • 2. 以下哪个不属于事件驱动型应用?

    A反欺诈

    B异常检测

    C基于规则的报警

    D消费者技术中的实时数据即席分析

  • 3. 下列哪一项不属于每个超步的组件?

    A全局计算

    B局部计算

    C通讯

    D栅栏同步

  • 4. 在一个Worker中,它所管辖的分区的状态信息是保存在内存中的,下列哪一项不属于分区的状态信息?

    A顶点的当前值

    B消息队列

    C标志位

    D一个接收到的消息的迭代器

  • 5. 下列关于数据可视化的描述,哪个是错误的?

    A数据可视化是指将大型数据集中的数据以图形图像形式表示

    B利用数据分析和开发工具发现其中未知信息的处理过程

    C数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元素表示

    D将数据的各个属性值以一维数据的形式表示

  • 1. 大数据可以分析与挖掘出之前人们不知道或者没有注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值。

    A

    B

  • 2. Linux 系统安全性好,所以可以使用任意账号进行登陆。

    A

    B

  • 3. 海量数据可以存储到hadoop集群中通过map和reduce技术计算数据得出结果。

    A

    B

  • 4. 数据建模就是使用数学模型对大数据进行分析,解决现实生活中问题。

    A

    B

  • 5. 在Hadoop1.x版本中,MapReduce程序是运行在Yarn集群之上。

    A

    B

  • 1. 大数据是当前业界关注的焦点,下列对大数据的描述中正确的是:()

    A大数据(BigData)又称为巨量资料或海量资料

    B大数据是指所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为对企业经营决策具有较高参考价值的资讯

    C“大数据”一词首次被提出是在2011年有关机构发布的研究报告——《大数据:创新、竞争和生产力的下一个新领域》之中

    D“大数据”并不是突然产生的概念,它是IT技术发展的必然产物

  • 2. 在实际应用中,大数据处理主要包括以下哪三个类型?

    A复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间

    B基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间

    C基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间

    D基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间

  • 3. 关系数据库引以为傲的两个关键特性(完善的事务机制和高效的查询机制),到了Web2.0时代却成了鸡肋,主要表现在以下哪几个方面?

    AWeb2.0网站系统通常不要求严格的数据库事务

    BWeb2.0网站系统基本上不用关系数据库来存储数据

    CWeb2.0并不要求严格的读写实时性

    DWeb2.0通常不包含大量复杂的SQL查询

  • 4. HBase与传统的关系数据库的区别主要体现在以下哪几个方面?

    A数据类型

    B数据操作

    C存储模式

    D数据维护

  • 5. 一次等线BSP(Bulk Synchronous Parallel Computing Model,又称“大同步”模型)计算过程包括一系列全局超步(所谓的超步就是计算中的一次迭代),每个超步主要包括哪些组件?

    A局部计算:每个参与的处理器都有自身的计算任务

    B通讯:处理器群相互交换数据

    C栅栏同步:当一个处理器遇到“路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤

    D基于现有的分布式计算平台进行图计算