在Spark中,弹性分布式数据集的特点包括()。
A、可分区
B、可序列化
C、可直接修改
D、可持久化
E、
Spark组件包含()两个算子。
A、Map
B、Action
C、Transformation
D、Reduce
E、
Spark支持的计算模型有()。
A、批处理
B、实时计算
C、机器学习模型
D、交互式查询
E、
Hadoop运行的模式包括()。
A、单机版
B、伪分布式
C、分布式
D、全分布式
E、
Spark提交工作的方式有()。
A、Client
B、Cluster
C、Standalone
D、YARN
E、
在数据科学中,计算模式发生了根本性的变化——从集中式计算、分布式计算、网格计算等传统计算过渡至云计算,有一定的代表性的是Google云计算三大技术,这三大技术包括()。
A、HadoopYARN资源管理器
B、GFS分布式存储系统
C、MapReduce分布式处理技术
D、BigTable分布式数据库
E、
MapReduce对map()函数的返回值处理后才传给reduce()函数,其中涉及的操作有()。
A、合并
B、排序
C、分区
D、抽样
E、
MapReduce中运行程序副本程序的机器有()。
A、Map服务器
B、Master服务器
C、Worker服务器
D、Reduce服务器
E、
在MapReduce1.0版本中,JobTracker功能有()。
A、资源管理
B、作业控制
C、作业存储
D、作业审核
E、
下列中属于MapReduce特征的有()。
A、以主从结构的形式运行
B、容错机制的复杂性
C、任务备份机制的必要性
D、数据存储位置固定
E、