台部落无名一小卒

模式匹配模式匹配的功能非常強大，使用恰當的話可以省略很多不必要的操作 /** * 模式匹配使用 */ object PatternDemo { def main(args: Array[String]): Unit

2020-06-14 12:58:12

使用場景在Spark中可以直接讀取數據文件但是讀取到的數據的每一項數據是沒有數據類型的而且不能使用數據像使用數據表中的字段名那樣使用數據可以在讀取數據的時候對讀取到的數據進行設置轉換設置轉換後使用數據可以像使用數據庫表中

2020-06-14 12:58:12

Scala中定義沒有構造函數的類 /** *創建一個類 * -1.屬性field,attribute:名詞 * -2.方法method/函數function：動詞 */ class People {

2020-06-14 12:58:12

HBASE表的設計最關鍵一點，最重要的一點 rowkey的設計 -1.不能重複 -2.前綴匹配原則 -3.熱點性常用倒轉字段方法如何將數據遷入到/存儲到HBASE表中方式一：批量將數據存儲到HBASE表中使用

2020-06-14 12:58:12

開發踩坑記錄，不定時更新日常踩坑記錄注意單詞拼寫！！！ 20200207 mybatis plus 自帶insert插入異常 sql injection violation 解決方法：使用逆向工程腳本時，生成的映射實體類在

2020-05-10 02:22:39

在spring boot中使用thymeleaf開發前端代碼時遇到的問題集成thymeleaf後，所有的靜態資源，只能加載一個index頁面其他頁面，js，css，都無法加載顯示錯誤信息爲 Whitelabel Error

2020-02-20 20:44:07

首先需要了解的幾個類 StreamingContext 如何讀取數據 DStream 處理數據函數 DStream裏面存儲着很多RDD PairDStreamFunctions 當處理的數據類型是二元組的時候， DStrea

2019-08-25 15:00:29

kafka介紹 Kafka是由Apache軟件基金會開發的一個開源流處理平臺，由Scala和Java編寫。 Kafka是一種高吞吐量的分佈式發佈訂閱消息系統，它可以處理消費者在網站中的所有動作流數據。這種動作（網頁瀏覽，搜索和其

2019-08-25 15:00:29

原文鏈接：http://spark.apache.org/docs/2.2.0/streaming-kafka-0-8-integration.html 基於Receiver的方法——基

2019-08-25 15:00:29

人工智能企業中的大佬們會幹點啥算法 -函數這個有點懸讀論文&實現之工程這個我還能幹一丟丟機器學習工程師（或調參工程師）運行已有算法，訓練業務數據，獲得工作模型。將數據 ->算法（函數） ->

2019-08-25 15:00:29

使用window函數實現時間段內數據累加 import kafka.serializer.StringDecoder import org.apache.spark.SparkConf import org.apache.spar

2019-08-25 15:00:29

producer生產者產生數據 Spark Streaming的Driver讓一個Executor運行一個Task接收器每隔一段時間主動向生產者拿數據根據時間間隔：批處理時間間隔將DStream分割爲多分RDD數據集合

2019-08-25 15:00:29

實現思路第一步獲取StreamingContext對象，因爲要使用檢查點恢復數據，所以不能使用new StreamingContext的方法獲取對象，要使用StreamingContext.getOrCreate建立對象創建

2019-08-25 15:00:29

SparkStreaming簡單介紹流式數據處理（stream processing）要處理的數據就像流水一樣，源源不斷的產生數據，需要實時進行處理對SparkCore的高級API的封裝，將流式的數據切分爲小的批次batch

2019-08-25 15:00:29

檢查點 Checkpoint功能保存每批中 state信息，累加加銷售營業額保存沒衝從Kafka topic 中讀取數據的offset 保存DStream的來源和DStream處理函數和輸出函數什麼時候需要使用Che

2019-08-25 15:00:29