原创 Linux內核實戰(二)- 操作系統概覽

不知道你有沒有產生過這些疑問: 桌面上的圖標到底是啥?憑啥我在鼠標上一雙擊,就會出來一些不可描述的畫面?都是從哪裏跑出來的?憑什麼我在鍵盤上噼裏啪啦地敲,某個位置就會顯示我想要的那些字符? 電腦怎麼知道我鼠標點擊的是這個地方,又是怎麼

原创 Linux內核實戰(一)- 學習路線規劃

1 拋棄舊文化,迎接Linux命令新文化 Linux第一步,從Windows思維,切換到Linux的“命令行+文件”模式 在Linux中,做什麼都有相應命令。一般就在bin或者sbin目錄下,數量繁多。如果你事先不知道該用哪個命令,很難通

原创 macOS下 Hive 2.x 的安裝與配置

1 簡介 Hive是基於Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並提供簡單的[SQL]查詢功能,可以將SQL語句轉換爲MapReduce任務進行運行。其優點是學習成本低,可以通過類SQL語句快速實現簡單的M

原创 Spark機器學習實戰 (十二) - 推薦系統實戰

0 相關源碼 將結合前述知識進行綜合實戰,以達到所學即所用。在推薦系統項目中,講解了推薦系統基本原理以及實現推薦系統的架構思路,有其他相關研發經驗基礎的同學可以結合以往的經驗,實現自己的推薦系統。 1 推薦系統簡介 1.1 什麼是推薦系統

原创 Spark機器學習實戰 (十一) - 文本情感分類項目實戰

0 相關源碼 將結合前述知識進行綜合實戰,以達到所學即所用。文本情感分類這個項目會將分類算法、文本特徵提取算法等進行關聯,使大家能夠對Spark的具體應用有一個整體的感知與瞭解。 1 項目總體概況 2 數據集概述 數據集 3 數據預

原创 基於Spark的機器學習實踐 (十) - 降維

通過講解PCA算法的原理,使大家明白降維算法的大致原理,以及能夠實現怎麼樣的功能。結合應用降維算法在分類算法使用之前進行預處理的實踐,幫助大家體會算法的作用。 0 相關源碼 1 PCA算法及原理概述 1.1 何爲降維? ◆ 從高維度變爲低

原创 基於Spark的機器學習實踐 (九) - 聚類算法

0 相關源碼 1 k-平均算法(k-means clustering)概述 1.1 回顧無監督學習 ◆ 分類、迴歸都屬於監督學習 ◆ 無監督學習是不需要用戶去指定標籤的 ◆ 而我們看到的分類、迴歸算法都需要用戶輸入的訓練數據集中給定一個個

原创 億萬級數據處理的高效解決方案

簡介 全文行文是基於面試題的分析基礎之上的,具體實踐過程中,還是得具體情況具體分析,且各個場景下需要考慮的細節也遠比本文所描述的任何一種解決方法複雜得多。##何謂海量數據處理?基於海量數據上的存儲、處理、操作。何謂海量,就是數據量太大,導致

原创 Java源碼解析 - ThreadPoolExecutor 線程池

1 線程池的好處 線程使應用能夠更加充分合理地協調利用CPU、內存、網絡、I/O等系統資源.線程的創建需要開闢虛擬機棧、本地方法棧、程序計數器等線程私有的內存空間;在線程銷燬時需要回收這些系統資源.頻繁地創建和銷燬線程會浪費大量的系統資源,

原创 長文慎入-探索Java併發編程與高併發解決方案

所有示例代碼,請見/下載於https://github.com/Wasabi1234/concurrency #1 基本概念##1.1 併發同時擁有兩個或者多個線程,如果程序在單核處理器上運行多個線程將交替地換入或者換出內存,這些線程是同時

原创 Vue2.5 零基礎開發去哪兒網實戰(二) - 起步 Vue.js

聯繫我 1.Java開發技術交流Q羣 2.完整博客鏈接 3.個人知乎 4.gayhub 本文源碼 本章將快速講解部分 Vue 基礎語法,通過 TodoList 功能的編寫,在熟悉基礎語法的基礎上,擴展解析 MVVM 模式及前端組件化的概念

原创 設計模式實戰-策略模式(Strategy Pattern)

0 聯繫我 1.Q羣【Java開發技術交流】:https://jq.qq.com/?_wv=1027&k=5UB4P1T2.完整博客鏈接:www.shishusheng.com3.知乎:http://www.zhihu.com/peopl

原创 Vue2.5 零基礎開發去哪兒網實戰(二) - 起步 Vue.js

聯繫我 1.Java開發技術交流Q羣 2.完整博客鏈接 3.個人知乎 4.gayhub 本文源碼 本章將快速講解部分 Vue 基礎語法,通過 TodoList 功能的編寫,在熟悉基礎語法的基礎上,擴展解析 MVVM 模式及前端組件化的概念

原创 Java源碼解析 - ThreadPoolExecutor 線程池

1 線程池的好處 線程使應用能夠更加充分合理地協調利用CPU、內存、網絡、I/O等系統資源.線程的創建需要開闢虛擬機棧、本地方法棧、程序計數器等線程私有的內存空間;在線程銷燬時需要回收這些系統資源.頻繁地創建和銷燬線程會浪費大量的系統資源,