在Hive架构中,支持的数据操作有()。
A、插入
B、查询
C、删除
D、分析
E、
下列关于Spark中RDD的描述正确的有()。 "
A、RDD(Resilient Distributed Dataset)叫作弹性分布式数据集,是Spark中最基本的数据抽象"
B、Resilient:表示弹性的
C、Destributed:分布式,可以并行在集群计算
D、Dataset:就是一个集合,用于存放数据
E、
相对于Hadoop MapReduce,Spark的特点有()。
A、通用性
B、易用性
C、速度快
D、容错性
E、
Spark2.0提供的应用库包括()。
A、SparkSQL
B、SparkStreaming
C、MLib
D、GraphX
E、
在Spark中,弹性分布式数据集的特点包括()。
A、可分区
B、可序列化
C、可直接修改
D、可持久化
E、
Spark组件包含()两个算子。
A、Map
B、Action
C、Transformation
D、Reduce
E、
Spark提交工作的方式有()。
A、Client
B、Cluster
C、Standalone
D、YARN
E、
Spark支持的计算模型有()。
A、批处理
B、实时计算
C、机器学习模型
D、交互式查询
E、
Spark的基本流程主要涉及()等角色。
A、DriverProgram
B、ClusterManager
C、WorkerNode
D、Executor
E、
Spark的部署模式包括()。
A、本地模式
B、Standalone模式
C、Spark on YARN模式
D、Spark on Mesos模式
E、