台部落有一个码农，他叫封子

類的定義 Scala中類的定義與Java類似，格式如下： [修飾符] class 類名 { 類體 } /** * 定義一個貓類 */ class Cat { var name = "" var age: Int

2020-06-22 10:17:18

提交任務 [fengling@hadoop129 spark-2.4.4-bin-hadoop2.7]$ bin/spark-submit --class org.apache.spark.examples.SparkPi \ > --

2020-06-22 09:14:06

Kafka起動腳本 #!/bin/bash BROKERS="hadoop129 hadoop130 hadoop131" APPHOME="/opt/module/kafka_2.11-2.2.0" APP_NAME="kafka_

2020-06-22 09:14:06

一、環境裝備兩臺或者兩臺以上安裝了jdk1.8的虛擬機我準備了三臺：hadoop129/hadoop130/hadoop131 規劃： Master機：hadoop129 Slaves機：hadoo

2020-06-22 09:14:06

相同點： Scala中創建包的方式與Java相同，使用同樣的關鍵字：package /** * @author [email protected] * @date 2019/8/26 */ package com

2020-06-22 09:14:06

目錄軟件清單解壓到指定目錄將Hadoop添加到環境變量運行 Standalone Operation（單機模式），官方grep案例 Pseudo-Distributed Operation（僞分佈式模式）軟件清單 jdk1.8

2020-06-22 09:14:06

最近在看尚學堂的大數據，學習了scala，閱讀大數據相關的公衆號瞭解了flink，忍不住要體驗一把。下載 flink下載可以直接到官網下載，選擇合適的鏡像網站下載即可，速度很快，我兩分鐘就下載完了如果使用scala進行開發，下載的時候

2020-06-22 09:14:06

目錄配置文件提交作業，檢查是否可用配置文件進入Spark的conf目錄，spark-defaults.conf.template拷貝一份 [fengling@hadoop129 conf]$ pwd /opt/module/sp

2020-06-22 09:14:06

Spark RDD操作的兩種類型： transformations 在Spark裏所有RDD的轉換都是延遲加載的，不會馬上計算結果，Spark只是記住要應用於基礎數據集的一些轉換操作。只有當一個動作要求返回給D

2020-06-22 09:14:06

目錄切換到root賬戶，執行命令拷貝公鑰到要免密登錄的目標機子上測試切換到root賬戶，執行命令 [root@hadoop129 ~]# ssh-keygen -t rsa 一路回車 /root/.ssh目錄下會生成文件

2020-06-22 09:14:06

目錄上傳文件到HDFS 運行Spark shell 統計RELEASE文件裏每個單詞的數量查看Job結果上傳文件到HDFS #hdfs創建spark目錄： [fengling@hadoop129 spark-2.4.4-bin-h

2020-06-22 09:14:06

NAME hostnamectl - Control the system hostname SYNOPSIS hostnamectl [OPTIONS...] {COMMAND} DESCRIPTION

2020-06-22 09:14:06

目標（1）配置集羣在YARN上運行MR （2）啓動、測試集羣（3）在YARN上運行WordCount案例執行步驟（1）配置集羣（a）配置yarn-env.sh $ vim etc/hadoop/yarn-env.sh （b）配

2020-06-22 09:14:06

主要步驟：創建RDD 設置sc.setCheckpointDir路徑調用checkpoint方法調用一下action操作 scala> sc.setCheckpointDir("hdfs://hadoop129:9000/spar

2020-06-22 09:14:06

循環複製文件到所有節點的相同目錄下集羣機子hadoop129/hadoop130/hadoop131之間同步文件基本命令 rsync -rvl /opt/module fengling@had

2020-06-22 09:14:06