大数据工程技术人员试题及答案(五)

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:346

试卷答案:没有

试卷介绍: 本站为大家带来了大数据工程技术人员试题及答案(五)的模拟试卷,快来进行练习吧。

开始答题

试卷预览

  • 1. (  )是一个分布式的基于发布/订阅模式的消息队列。

    AFlume

    BKafka

    CZookeeper

    DHive

  • 2. 万维网之父是()。

    A彼得德鲁克

    B舍恩伯格

    C蒂姆伯纳斯-李

    D斯科特布朗

  • 3. 下列论据中,能够支撑“大数据无所不能”的观点的是(  )。

    A互联网金融打破了传统的观念和行为

    B大数据存在泡沫

    C大数据具有非常高的成本

    D个人隐私泄露与信息安全担忧

  • 4. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是()关系,而吸烟和肺癌则是()关系

    A因果;相关

    B相关;因果

    C并列;相关

    D因果;并列

  • 5. 以下哪个存储介质是易丢失存储

    A主存储器

    B快闪存储器

    C磁带存储

    D磁盘存储

  • 1. 数据挖掘应用工具有很多,其中Python可以用于数据分析。

    A

    B

  • 2. 云计算核心就是本地无法解决的问题提交到计算机网络集群中运算,运用网络计算机的能力。

    A

    B

  • 3. 数据挖掘可以是很少的数据得到精确的结果,从而给出精准的决策。

    A

    B

  • 4. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求

    A

    B

  • 5. 超市根据销售纪录发现,买啤酒的顾客有35%概率也会购买儿童尿布,这种属于数据挖掘的关联规则。

    A

    B

  • 1. 下列关于大数据的说法中,错误的是()。

    A大数据具有体量大、结构单一、时效性强的特征

    B处理大数据需采用新型计算架构和智能算法等新技术

    C大数据的应用注重相关分析而不是因果分析

    D大数据的应用注重因果分析而不是相关分析

    E大数据的目的在于发现新的知识与洞察并进行科学决策

  • 2. 下列关于流计算与Hadoop的说法,正确的有?

    AHadoop擅长批处理,不适合流计算

    BMapReduce是专门面向静态数据的批量处理的

    CHadoop设计的初衷是面向大规模数据的批量处理

    DMapReduce不适合用于处理持续到达的动态数据

  • 3. 很多传统的图计算算法都存在以下哪些典型问题?

    A常常表现出比较差的内存访问局部性

    B针对单个顶点的处理工作过少

    C计算过程中伴随着并行度的改变

    D计算过程简易

  • 4. Spark支持哪三种不同类型的部署方式?

    AStandalone(类似于MapReduce1.0,slot为资源分配单位)

    BSpark on Mesos(和Spark有血缘关系,更好支持Mesos)

    CSpark on YARN

    DSpark on HDFS

  • 5. 下列关于脏数据的说法中,正确的是()。

    A格式不规范

    B编码不统一

    C意义不明确

    D与实际业务关系不大

    E数据不完整