OneToOneDependency类型的操作


RangeDependency类型的操作


ManyToOneDependency类型的操作

coalesce(shuffle=false) 、 特殊情况下的union() , 以及zipPartitions() 操作对应的数据依赖关系都是ManyToOneDependency, child RDD中的每个分区需要从parent RDD中获取所依赖的多个分区的全部数据。 由于ManyToOneDependency是窄依赖, 所以Spark将parent RDD和child RDD组合为一个stage, 该stage生成的task个数与最后的RDD的分区个数相等。

ManyToManyDependency类型的操作


单一ShuffleDependency类型的操作


多ShuffleDependency类型的操作












