大数据工程技术人员考试试题

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:366

试卷答案:没有

试卷介绍: 本站为大家精心整理了大数据工程技术人员考试试题,看看你的分数是多少吧 。

开始答题

试卷预览

  • 1. 在数据生命周期管理实践中,(  )是执行方法。

    A数据存储和备份规范

    B数据管理和维护

    C数据价值发觉和利用

    D数据应用开发和管理

  • 2. 下列哪个不属于可视化工具?

    AGoogle Chart API

    BD3

    CVisual.ly

    DSpark

  • 3. 下列哪个说法是错误的?

    A无论是亚马逊还是Netflix,其推荐系统的基础都是ItemCF算法

    BItemCF算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品

    CItemCF算法主要通过分析用户的行为记录来计算物品之间的相似度

    D实现UserCF算法的关键步骤是计算物品与物品之间的相似度

  • 4. 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是(  )

    A一个Map函数就是对一部分原始数据进行指定的操作。

    B一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。

    CMap与Map之间不是相互独立的。

    DReducee与Reduce之间不是相互独立的。

  • 5. 制成大数据业务的基础是(  )

    A数据科学

    B数据应用

    C数据硬件

    D数据人才

  • 1. python中定义函数不用声明数据类型。

    A

    B

  • 2. Hive使用length()函数可以求出输出的数量。

    A

    B

  • 3. 删除Hive外部表时,表数据也会删除。

    A

    B

  • 4. 数据外部流通和对外开放不能通过数据直接交易的方式实现。

    A

    B

  • 5. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求

    A

    B

  • 1. Hive主要由哪三个模块组成:( )

    A用户接口模块

    B用户查询模块

    C驱动模块

    D元数据存储模块

  • 2. 下面哪个是Hadoop2.0的组件?

    AResourceManager

    BJobTracker

    CTaskTracker

    DNodeManager

  • 3. 推荐系统的本质是建立用户与物品的联系,根据推荐算法的不同,推荐方法包括以下哪几类?

    A专家推荐:人工推荐,由资深的专业人士来进行物品的筛选和推荐,需要较多的人力成本

    B基于统计的推荐:基于统计信息的推荐(如热门推荐),易于实现,但对用户个性化偏好的描述能力较弱

    C基于内容的推荐:通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容

    D混合推荐:结合多种推荐算法来提升推荐效果

  • 4. 一个完整的推荐系统通常包括以下哪三个模块?

    A用户建模模块

    B数据采集模块

    C推荐对象建模模块

    D推荐算法模块

  • 5. 关于基于用户的协同过滤,下列哪些说法是正确的?

    A基于用户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古老的算法

    BUserCF算法符合人们对于“趣味相投”的认知

    C实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度

    DUserCF算法符合兴趣相似的用户往往有相同的物品喜好