国产精品免费嫩草研究院|无遮羞动漫在线观看AV|国产麻豆精品传媒AV国产在线|村在线观看|寂寞情人1正版|韩国床震韩国床震古|精品系列专区久久

我的Spark學習筆記

2026-01-31 生活百科

一、架構(gòu)設(shè)計

文章插圖

Driver根據(jù)用戶代碼構(gòu)建計算流圖，拆解出分布式任務(wù)并分發(fā)到 Executors 中去；每個Executors收到任務(wù)，然后處理這個 RDD 的一個數(shù)據(jù)分片子集
DAGScheduler根據(jù)用戶代碼構(gòu)建 DAG；以 Shuffle 為邊界切割 Stages；基于 Stages 創(chuàng)建 TaskSets，并將 TaskSets 提交給 TaskScheduler 請求調(diào)度
TaskScheduler 在初始化的過程中，會創(chuàng)建任務(wù)調(diào)度隊列，任務(wù)調(diào)度隊列用于緩存 DAGScheduler 提交的 TaskSets 。TaskScheduler 結(jié)合 SchedulerBackend 提供的 WorkerOffer，按照預先設(shè)置的調(diào)度策略依次對隊列中的任務(wù)進行調(diào)度，也就是把任務(wù)分發(fā)給SchedulerBackend
SchedulerBackend 用一個叫做 ExecutorDataMap 的數(shù)據(jù)結(jié)構(gòu)，來記錄每一個計算節(jié)點中 Executors 的資源狀態(tài) 。會與集群內(nèi)所有 Executors 中的 ExecutorBackend 保持周期性通信。SchedulerBackend收到TaskScheduler過來的任務(wù)，會把任務(wù)分發(fā)給ExecutorBackend去具體執(zhí)行
ExecutorBackend收到任務(wù)后多線程執(zhí)行（一個線程處理一個Task）。處理完畢后反饋StatusUpdate給SchedulerBackend，再返回給TaskScheduler，最終給DAGScheduler

文章插圖
二、常用算子2.1、RDD概念Spark 主要以一個彈性分布式數(shù)據(jù)集_（RDD）的概念為中心，它是一個容錯且可以執(zhí)行并行操作的元素的集合。有兩種方法可以創(chuàng)建 RDD：在你的 driver program（驅(qū)動程序）中 _parallelizing 一個已存在的集合，或者在外部存儲系統(tǒng)中引用一個數(shù)據(jù)集，例如，一個共享文件系統(tǒng)，HDFS，HBase，或者提供 Hadoop InputFormat 的任何數(shù)據(jù)源。
從內(nèi)存創(chuàng)建RDD

import org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}// 從內(nèi)存創(chuàng)建RDDobject MakeRDDFromMemory {def main(args: Array[String]): Unit = {// 準備環(huán)境val sparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")// 并行度，如果不設(shè)置則默認當前運行環(huán)境的最大可用核數(shù)sparkConf.set("spark.default.parallelism", "2")val sc = new SparkContext(sparkConf)// 從內(nèi)存中創(chuàng)建RDD，將內(nèi)存中集合的數(shù)據(jù)作為處理的數(shù)據(jù)源val seq = Seq[Int](1, 2, 3, 4, 5, 6)val rdd: RDD[Int] = sc.makeRDD(seq)rdd.collect().foreach(println)// numSlices表示分區(qū)的數(shù)量，不傳默認spark.default.parallelismval rdd2: RDD[Int] = sc.makeRDD(seq, 3)// 將處理的數(shù)據(jù)保存成分區(qū)文件rdd2.saveAsTextFile("output")sc.stop()}}

從文件中創(chuàng)建RDD

import org.apache.spark.{SparkConf, SparkContext}// 從文件中創(chuàng)建RDD（本地文件、HDFS文件）object MakeRDDFromTextFile {def main(args: Array[String]): Unit = {// 準備環(huán)境val sparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")val sc = new SparkContext(sparkConf)// 從文件中創(chuàng)建RDD，將文件中的數(shù)據(jù)作為處理的數(shù)據(jù)源// path路徑默認以當前環(huán)境的根路徑為基準 。可以寫絕對路徑，也可以寫相對路徑//val rdd: RDD[String] = sc.textFile("datas/1.txt")// path路徑可以是文件的具體路徑，也可以目錄名稱//val rdd = sc.textFile("datas")// path路徑還可以使用通配符 *//val rdd = sc.textFile("datas/1*.txt")// path還可以是分布式存儲系統(tǒng)路徑：HDFSval rdd = sc.textFile("hdfs://localhost:8020/test.txt")rdd.collect().foreach(println)sc.stop()}}

2.2、常用算子map算子：數(shù)據(jù)轉(zhuǎn)換

import org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}// map算子object map {def main(args: Array[String]): Unit = {val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")val sc = new SparkContext(sparkConf)val rdd = sc.makeRDD(List(1, 2, 3, 4))// 轉(zhuǎn)換函數(shù)def mapFunction(num: Int): Int = {num * 2}// 多種方式如下//val mapRDD: RDD[Int] = rdd.map(mapFunction)//val mapRDD: RDD[Int] = rdd.map((num: Int) => {//num * 2//})//val mapRDD: RDD[Int] = rdd.map((num: Int) => num * 2)//val mapRDD: RDD[Int] = rdd.map((num) => num * 2)//val mapRDD: RDD[Int] = rdd.map(num => num * 2)val mapRDD: RDD[Int] = rdd.map(_ * 2)mapRDD.collect().foreach(println)sc.stop()}}
上一頁
1
2
3
4
5
6
下一頁
		  	


經(jīng)驗總結(jié)擴展閱讀

           
                  
              
                  v15是什么牌子的手機 
                
                   
                
              
            

                  
              
                  發(fā)型|氣質(zhì)女神都愛的中分發(fā)型，看看你到底適合它嗎？ 
                
                   
                
              
            

                  
              
                  華為mate30聲音調(diào)節(jié)方法 華為mate30pro音量怎么調(diào) 
                
                   
                
              
            

                  
              
                  夫妻相一定有姻緣嗎 天注定的姻緣 
                
                   
                
              
            

                  
              
                  怎么驗證真假翡翠手鐲 
                
                   
                
              
            

                  
              
                  鳳凰男|家庭聚餐上，因為一道90元的葷菜，鳳凰男罵老婆：沒吃過鴨肉？ 
                
                   
                
              
            

                  
              
                  宋軼 經(jīng)常熬夜皮膚差？宋軼分享的這款國貨純露，有效改善黑頭、痘痘、粉刺 
                
                   
                
              
            

                  
              
                  瞬間快樂|生肖兔7月運勢如何？從此鴻運當頭，谷底翻身，2021年錢包鼓鼓 
                
                   
                
              
            

                  
              
                  抑郁癥|抑郁癥心理咨詢：不做好人，當個不好惹的人后，她感覺自己好多了 
                
                   
                
              
            

                  
              
                  春天可以吃綠豆嗎春天吃綠豆有什么益處嗎 
                
                   
                
              
            

                  
              
                  2022年冬至時刻在幾點鐘 早冬至晚冬至有什么說法 
                
                   
                
              
            

                  
              
                  悅悅在洗衣服，田靜一開始就帶郭威，許敏唱得很動聽 
                
                   
                
              
            

                  
              
                  雅萌ace和max的區(qū)別_雅萌ace和max的參數(shù) 
                
                   
                
              
            

                  
              
                  毛孔粗大怎么辦？ 五款自制面膜締造零毛孔瓷肌 
                
                   
                
              
            

                  
              
                  講解為什么皮膚干燥起皮 身體缺水的表現(xiàn) 
                
                   
                
              
            

                  
              
                  發(fā)蠟和發(fā)泥的區(qū)別 發(fā)蠟的用途以及優(yōu)缺點 
                
                   
                
              
            

                  
              
                  揚州小兔子 有個位于城市中心的濕地公園，你去過嗎？ 
                
                   
                
              
            

                  
              
                  小孩子打爸爸怎么教育 
                
                   
                
              
            

                  
              
                  好看感人的催淚電影排行榜前十名 
                
                   
                
              
            

                  
              
                  濰坊能放煙花爆竹嗎,濰坊煙花爆竹2023最新規(guī)定 
                
                   
                
              
            

          

驚艷我的朋友圈個性簽名 句句高品位的ins風簽名 

祝我的男孩兒子 文案 很潮又短的生日祝福 

生日文案給兒子 愿我的大男孩生日快樂的句子 

我的湯姆貓里的2048怎么玩（能玩2048的湯姆貓) 

JVM學習筆記——垃圾回收篇 

我的世界怎么去月球無模組無指令（我的世界新版怎么去月球) 

我的世界怎么去月球，我的世界手機版月球傳送門怎么做 

我的世界怎么去月球模組免費（mc月球模組) 

我的世界虛無3月球怎么去（我的世界虛無世界怎么找傳送門) 

我的世界怎么去月球（我的世界驚變100天)


          
    
      上一篇：2023年8月5號出生廖姓寶寶取名叫什么生辰八字五行查詢 
      下一篇：含鉀高的食物有哪些


    
      
        更多...
        
          
               
            
              含鉀高的食物有哪些
            
          

               
            
              我的Spark學習筆記
            
          

               
            
              2023年8月5號出生廖姓寶寶取名叫什么生辰八字五行查詢
            
          

               
            
              8寸戚風蛋糕烤箱溫度和時間
            
          

               
            
              vs 自定義代碼塊
            
          

               
            
              2023年9月28號出生薛姓寶寶取名叫什么生辰八字五行查詢
            
          

               
            
              紅燒肉用什么肉
            
          

               
            
              2023年十月廿七出生王姓女孩名字生辰八字五行查詢
            
          

               
            
              怎樣知道他對你有感覺
            
          

               
            
              2024年六月廿四出生葉姓男孩名字叫什么生辰八字五行查詢



  
    
      
        
          生活經(jīng)驗
           

        
        
          Copyright © 2017-2024 經(jīng)驗總結(jié) 
        
      
      
         
      
    
  


   


 




感谢您访问我们的网站，您可能还对以下资源感兴趣：
国产精品免费嫩草研究院|无遮羞动漫在线观看AV|国产麻豆精品传媒AV国产在线|村在线观看|寂寞情人1正版|韩国床震韩国床震古|精品系列专区久久