问题一:Spark中的RDD是什么,有哪些特性?1.RDD是什么?
RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合
2020-06-21