怎么关闭spark自动广播参数

1326
2024/5/24 15:28:18
栏目: 大数据
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

关闭Spark的自动广播参数可以通过设置spark.sql.autoBroadcastJoinThreshold参数为一个较大的值或者设置为-1来禁用自动广播。具体的操作步骤如下:

  1. 在启动Spark应用程序的时候,可以通过--conf选项来设置spark.sql.autoBroadcastJoinThreshold参数的值。例如:
./bin/spark-submit --conf spark.sql.autoBroadcastJoinThreshold=-1 --class your_main_class your_spark_application.jar
  1. 在代码中通过SparkSession对象来设置spark.sql.autoBroadcastJoinThreshold参数的值。例如:
val spark = SparkSession.builder()
  .appName("YourAppName")
  .config("spark.sql.autoBroadcastJoinThreshold", -1)
  .getOrCreate()

通过以上两种方式设置spark.sql.autoBroadcastJoinThreshold参数的值为-1,即可关闭Spark的自动广播参数。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: spark的四大组件是什么