Spark makeRDD方法本地Task的默认分区数

注意setMaster(“local”)和setMaster(“local[])的分区数是不一样的。会匹配所有的cpu核数。

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Seq_Partition_04 {
  def main(args: Array[String]): Unit = {
    val sparkConf: SparkConf = new SparkConf().setMaster("local").setAppName("Operator")
    val sc: SparkContext = new SparkContext(sparkConf)

    val rdd: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4))
    rdd.saveAsTextFile("seq_output_04")
    sc.stop()
  }
}
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Seq_Partition_05 {
  def main(args: Array[String]): Unit = {
    val sparkConf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc: SparkContext = new SparkContext(sparkConf)

    val rdd: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4))
    rdd.saveAsTextFile("seq_partition_05")
    sc.stop()
  }
}

如果spark.default.parallelism没有设置,就会使用cpu的核数。

Spark makeRDD方法本地Task的默认分区数

Original: https://www.cnblogs.com/mkl34367803/p/15780731.html
Author: 坚守梦想
Title: Spark makeRDD方法本地Task的默认分区数

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/8884/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

发表回复

登录后才能评论
免费咨询
免费咨询
扫码关注
扫码关注
联系站长

站长Johngo!

大数据和算法重度研究者!

持续产出大数据、算法、LeetCode干货,以及业界好资源!

2022012703491714

微信来撩,免费咨询:xiaozhu_tec

分享本页
返回顶部