1.并行计算不同的任务,分配到不同的线程上就可以并行计算了
2.然后并行任务,现在我们知道,如果我们设置的并行度是3,那么这里需要的slot就是3个对吧
这个跟任务的最大并行度有关
3.然后就是我们写的一串代码,到底包含几个任务呢?每个算子包含几个任务了呢?
这个也需要解释.
然后我们再来看什么是并行度,可以看到一个任务,有几个子任务就有几个并行度,实际上就是
看一个任务是被拆成了几个任务来处理对吧.
可以看到上面source,这里,分成了2个子任务对吧,分别是source1,source2,两个子任务,并行度就是2了,然后再看map,这里两个map,那么并行度也是2,这两个map会分配到不同的slot上去执行.
然后再看整条流他的并行度是什么呢?注意,整条流的并行度,可以看到,就是在这个数据流图的过程中,他的拥有最多子任务的,那个任务的并行度,也就是,并行度最大的那个任务的,并行度,就是整个数据流图的并行度.