【单选题】val pairRDD1 = sc. parallelize(Array(("spark",1),("spark",2),("hadoop",3),("hadoop",5))) val pairRDD2 = sc.parallelize(Array(("spark","fast"))) pairRDD1.join(pairRDD2) 上述语句执行以后,pairRDD1这个RDD中所包含的元素是
A.
(“spark”,(3,”fast”)), (“spark”,(5,”fast”))
B.
(“hadoop”,(3,”fast”)), (“hadoop”,(5,”fast”))
C.
(“spark”,(1,”fast”)), (“spark”,(2,”fast”))
D.
(“hadoop”,(2,”fast”)), (“hadoop”,(1,”fast”))
【判断题】会计对象的具体内容是会计要素,而每个会计要素都包含若干具体项目。会计科目就是对会计要素具体内容进行分类核算的项目。()
【单选题】val pairRDD1 = sc. parallelize(Array(("spark",1),("spark",2),("hadoop",3),("hadoop",5))) val pairRDD2 = sc.parallelize(Array(("spark","fast"))) pairRDD1.join(pairRDD2) 上述语句执行以后,pairRDD1这个RDD中所包含的元素是
A.
(“hadoop”,(3,”fast”)), (“hadoop”,(5,”fast”))
B.
(“spark”,(3,”fast”)), (“spark”,(5,”fast”))
C.
(“hadoop”,(2,”fast”)), (“hadoop”,(1,”fast”))
D.
(“spark”,(1,”fast”)), (“spark”,(2,”fast”))
【多选题】下列关于 spark 中的 RDD 描述正确的有
A.
RDD ( Resilient Distributed Dataset )叫做弹性分布式数据集,是 spark 中最基本的数据抽象
C.
Destributed :分布式,可以并行在集群计算
D.
Dataset :就是一个集合,用于存放数据的
【单选题】关于Spark和RDD下列说法错误的是()
A.
Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN
B.
在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm
C.
RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换
D.
RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算
【单选题】在Spark中,调用RDD的()方法,可以将RDD转换为DataFrame对象。
【简答题】设 求 ,argz及Argz,并写出z的三角形式和指数形式.
【单选题】val pairRDD1 = sc. parallelize(Array(("spark",1),("spark",2),("hadoop",3),("hadoop",5))) val pairRDD2 = sc.parallelize(Array(("spark","fast"))) pairRDD1.join(pairRDD2) 上述语句执行以后, pairRDD1 这个 RDD 中所包含...
A.
(“spark”,(1,”fast”)), (“spark”,(2,”fast”))
B.
(“hadoop”,(2,”fast”)), (“hadoop”,(1,”fast”))
C.
(“hadoop”,(3,”fast”)), (“hadoop”,(5,”fast”))
D.
(“spark”,(3,”fast”)), (“spark”,(5,”fast”))