Spark的基本流程主要涉及()等角色。
A、DriverProgram
B、ClusterManager
C、WorkerNode
D、Executor
E、
Spark提交工作的方式有()。
A、Client
B、Cluster
C、Standalone
D、YARN
E、
Spark RDD的依赖机制包括()。
A、宽依赖
B、深度依赖
C、广度依赖
D、窄依赖
E、
下列关于Hive的说法正确的有()。
A、Hive是基于Hadoop的数据仓库工具
B、Hive可以将结构化的数据文件映射为一张数据库表
C、最初,Hive由Google开源,用于解决海量结构化日志数据统计问题
D、Hive的主要应用场景是离线分析
E、
大数据平台的计算组件主要有()。
A、Storm
B、Spark
C、MapReduce
D、Sqoop
E、
Spark的部署模式包括()。
A、本地模式
B、Standalone模式
C、Spark on YARN模式
D、Spark on Mesos模式
E、
Spark的组件包括()。
A、SparkStreaming
B、MLib
C、GraphX
D、SparkR
E、
Spark2.0提供的应用库包括()。
A、SparkSQL
B、SparkStreaming
C、MLib
D、GraphX
E、
在Hive架构中,支持的数据操作有()。
A、插入
B、查询
C、删除
D、分析
E、
在Spark中,弹性分布式数据集的特点包括()。
A、可分区
B、可序列化
C、可直接修改
D、可持久化
E、