Spark1.0.0 集羣配置

原創

2020-06-15 00:07

1. 機器：

（1）master ：主機名：hadoop-1 IP：202.193.74.111

（2）slave1 ：主機名： hadoop-2 IP：202.193.74.112

（3）slave2 ：主機名： hadoop-3 IP：202.193.74.113

已經部署好了hadoop分佈式集羣環境，hadoop版本爲1.1.2（32），JDK版本爲1.6

2. Spark需要安裝的軟件

（1） Spark版本：spark-1.0.0-bin-hadoop1.tgz ，下載地址爲：http://d3kbcqa49mib13.cloudfront.net/spark-1.0.0-bin-hadoop1.tgz

（2） Scala版本：Scala2.10.4

下載地址爲：http://www.scala-lang.org/download/2.10.4.html

3. 安裝Scala：

（1）通過WinScp將Scala-2.10.4.tgz拷貝到Master主機上，目錄爲： /root/Dowloads/

（2）進入/root/Downloads/目錄，可以看到剛剛拷貝的scala壓縮包：

（3）創建目錄mkdir /usr/lib/scala ，將/root/Downloads/下的scala壓縮包拷貝到該目錄：

（4）將scala-2.10.4.tgz進行壓縮：

（5）對壓縮後的scala文件夾進行重命名爲scala： mv scala-2.10.4 scala

（6） Vim對/etc/profile進行配置文件的操作：增加如下圖所示的scala環境變量：

（7）對/etc/profile文件進行source操作，使之生效：

（8）進行scala的驗證，並進行加法的簡單運算：

（9）至此，我們已經完成了在Master上Scala的安裝，接着對Slave1和Slave2從節點進行scala安裝，通過scp命名將/usr/lib/scala/目錄分別傳給slave1（hadoop-2）和slave2（hadoop-3）節點：

同時將主節點上的/etc/profile配置文件也傳給兩個從節點：

並在從節點上對/etc/profile文件進行source操作，並進行驗證：

4. 安裝Spark

（1）將/root/Downloads/下的spark-1.0.0-bin-hadoop1.tgz 壓縮包拷貝到/usr/local/目錄下：

（2）將spark-1.0.0-bin-hadoop1.tgz 壓縮到當前目錄：

（3）將spark-1.0.0-bin-hadoop1 目錄重命名爲spark：

（4）進行/etc/profile配置文件操作，增加下列內容：

（5）對配置文件進行source操作：

（6）配置Spark：

①進入spark目錄的conf目錄：

②把spark-env.sh.template 拷貝到spark-env.sh

③Vim進入spark-env.sh進行如下內容添加：

JAVA_HOME是java的安裝目錄

SCALA_HOME是scala的安裝目錄

SPARK_MASTER_IP是spark集羣的master節點的地址

SPARK_WORKER_MEMORY是worker節點能夠分配給Excutors的內存大小，虛擬機配置的內存是1g 。

HADOOP_CONF_DIR是已經安裝的hadoop的配置文件所在目錄

④進行slaves文件的配置，在文件中增加下列內容，把worker節點的主機名都增加進去（我們將三個節點都設爲了worker節點，即把主節點既設爲了master節點又設爲了worker節點）：

⑤對於slave1和slave2節點也是相同的配置，用scp將spark目錄和/etc/profile、文件傳給hadoop-2和hadoop-3即可。

⑥啓動hadoop集羣：

⑦進入spark目錄下的sbin目錄，用“start-all.sh”啓動spark集羣：

⑧可以看到master節點上有master和worker兩個進程，此外在slave節點上也出現了worker節點：

⑨用瀏覽器查看Spark的web頁面，從頁面上我們可以看到三個worker節點：

⑩我們還可以進入spark的bin目錄，執行spark-shell命令，進入spark-shell控制檯：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

ClickHouse內幕（1）數據存儲與過濾機制

本文主要講述ClickHouse中的數據存儲結構，包括文件組織結構和索引結構，以及建立在其基礎上的數據過濾機制，從Part裁剪到Mark裁剪，最後到基於SIMD的行過濾機制。數據過濾機制實質上是構建在數據存儲格式之上的算法，所以在介紹過濾

2024-06-07 23:54:51

一文搞懂DevOps、DataOps、MLOps、AIOps：所有“Ops”的比較

引言近年來，"Ops"一詞在 IT 運維領域的使用迅速增加。IT 運維正在向自動化過程轉變，以改善客戶交付。傳統的應用程序開發採用 DevOps 實施持續集成（CI）和持續部署（CD）。但對於數據密集型的機器學習和人工智能（AI）應用，精

2024-06-07 14:08:38

JimuReport 積木報表 v1.7.5 版本發佈，免費的JAVA報表工具

項目介紹一款免費的數據可視化報表工具，含報表和大屏設計，像搭建積木一樣在線設計報表！功能涵蓋，數據報表、打印設計、圖表報表、大屏設計等！ Web 版報表設計器，類似於excel操作風格，通過拖拽完成報表設計。秉承“簡單、易用、專業”

2024-06-07 01:13:43

營銷系統黑名單優化：位圖的應用解析

背景營銷系統中，客戶投訴是業務發展的一大阻礙，一般會過濾掉黑名單高風險賬號，並配合頻控策略，來減少客訴，進而增加營銷效率，減少營銷成本，提升營銷質量。營銷系統一般是通過大數據分析建模，在CDP（客戶數據平臺，以客戶爲核心，圍繞數據融

京東雲開發者

2024-06-06 11:54:12

跨越雲端，華爲雲技術專家分享高效跨雲遷移實踐

本文分享自華爲雲社區《【華爲雲Stack】【大架光臨】第18期：跨越雲端，華爲雲Stack的高效跨雲遷移實踐》，作者：大架光臨。 1 背景在企業雲化的浪潮中，混合多雲已經是企業IT部署的新常態，虛擬機承載的業務佔據很大的比重。在上雲

2024-06-06 10:56:54

高效啓動DolphinScheduler工作流：Java URL調用詳解

轉載自牛肉胡辣湯在大數據分析和處理的領域中，DolphinScheduler是一個開源的分佈式工作流調度系統，可以用於調度和管理複雜的工作流任務。本文將介紹如何使用Java中的URL類來調用DolphinScheduler的API，實現啓

2024-06-04 21:21:59

【數智化人物展】白鯨開源CEO郭煒：大模型時代下DataOps驅動企業數智化升級

本文由白鯨開源CEO郭煒投遞並參與由數據猿聯合上海大數據聯盟共同推出的《2024中國數智化轉型升級先鋒人物》榜單/獎項評選。隨着大數據、人工智能技術的飛速發展，我們已邁入了一個全新的時代------大模型時代。在這個時代背景下，企業提高

2024-06-04 21:21:58

Opal 機器學習平臺：愛奇藝數智一體化實踐

01 綜述 Opal 是愛奇藝大數據團隊研發的機器學習平臺，包含特徵生產、樣本構建、模型訓練、模型部署在內的多環節 Bigdata + AI 開發服務，內置多種訓練鏡像、

愛奇藝技術產品團隊

2024-06-01 02:21:16

基於對比稀疏擾動技術的時間序列解釋框架 ContraLSP

開篇近日，由阿里雲計算平臺大數據基礎工程技術團隊主導，與南京大學、賓夕法尼亞州立大學、清華大學等高校合作，解釋時間序列預測模型的論文《Explaining Time Series via Contrastive and Locally

2024-06-01 00:25:50

向量數據庫引領 AI 創新——Zilliz 亮相 2024 亞馬遜雲科技中國峯會

2024年5月29日，亞馬遜雲科技中國峯會在上海召開，此次峯會聚集了來自全球各地的科技領袖、行業專家和創新企業，探討雲計算、大數據、人工智能等前沿技術的發展趨勢和應用場景。作爲領先的向量數據庫技術公司，Zilliz 在本次峯會上展示了最新的

2024-05-30 21:25:17

金融反欺詐指南：車險欺詐爲何如此猖獗？

青島市人民檢察院在其官方微信公衆號上發佈的梁某保險詐騙案顯示，2020 年以來，某汽修廠負責人梁某、某汽車服務公司負責人孫某，與保險公司的趙某等人相互勾結，收購二手北汽等品牌新能源汽車，併爲這些車輛購買車損險。隨後，他們利用暴雨天氣，故意製

2024-05-30 00:16:51

智能測試持續加碼，大模型引領軟件測試新生態

在軟件行業日新月異的今天，智能測試已成爲提升軟件質量的關鍵環節。大模型的崛起，更是爲軟件測試帶來了前所未有的變革。隨着AI和ML技術的突飛猛進，智能測試得到了快速發展，實現了對測試過程的自動化和智能化管理，顯著提高了測試效率和質量。如今，智

2024-05-25 02:07:17

圖表控件LightningChart JS v5.2正式發佈 - 全新的開發體驗

LightningChart JS是Web上性能特高的圖表庫，具有出色的執行性能 - 使用高數據速率同時監控數十個數據源。 GPU加速和WebGL渲染確保您的設備的圖形處理器得到有效利用，從而實現高刷新率和流暢的動畫，常用於貿易，工程，航空

2024-05-23 12:20:12

風控指南：國內車險欺詐呈現四大趨勢

2024年4月11日，國家金融監督管理總局官網發佈國家金融監督管理總局關於《反保險欺詐工作辦法（徵求意見稿）》公開徵求意見的公告。《徵求意見》共6章、37條，明確反保險欺詐工作目標是建立“監管引領、機構爲主、行業聯防、各方協同”四位一體的

2024-05-23 12:16:45

安全分析：國內一些常見的汽車保險欺詐案件

2024年3月，北京警方打掉一個故意製造事故實施騙保的專業保險詐騙犯罪團伙。此案中，某保險公司在職員工與離職員工、定點汽修廠內外勾連，通過虛構、故意製造車輛事故或對事故擴損等手段騙取理賠款。不久前，遼寧警方也破獲一起自導自演僞造車禍騙保的案

2024-05-22 00:17:52

24小時熱門文章

最新文章

最新評論文章