原创 Hbase常識及適合場景

當我們對於數據結構字段不夠確定或雜亂無章很難按一個概念去進行抽取的數據適合用使用什麼數據庫?答案是什麼,如果我們使用的傳統數據庫,肯定留有多餘的字段,10個不行,20個,但是這個嚴重影響了質量。並且如果面對大數據庫,pt級別的數據,這種浪

原创 服務器免密登錄的實現以及異常解決方案

當我們在現在創建測試用Linux服務器或者服務器集羣的時候,需要通過終端連接自己創建的服務器。 實現步驟分爲2步:1、生成SSH Key;2、覆蓋authorized_keys文件 1、生成SSH Key 我們看到生成了以上一些列文件。

原创 樂觀鎖和悲觀鎖簡介

引言 爲什麼需要鎖(併發控制)?   在多用戶環境中,在同一時間可能會有多個用戶更新相同的記錄,這會產生衝突。這就是著名的併發性問題。 典型的衝突有: 丟失更新:一個事務的更新覆蓋了其它事務的更新結果,就是所謂的更新丟失。例如

原创 【隨筆】如何保持一個高效自律的學習心態

相信很多人在學習或者準備一件事情的時候,都想保持一個高效自律專注的狀態,儘快拿到結果,但是,在過程中總是事與願違,會被各種事情打斷,會被自己的惰性打敗,會被其他干擾信息拉偏方向,會被別人的眼光打亂陣腳。 以上說的種種可能其實都是非常正常的

原创 @DateTimeFormat無效原因

一般都是使用@DateTimeFormat把傳給後臺的時間字符串轉成Date,使用@JsonFormat把後臺傳出的Date轉成時間字符串,但是@DateTimeFormat只會在類似@RequestParam的請求參數(url拼接的參數

原创 11 個重要的數據庫設計規則

 英文原文: 11 Important Database designing rules   簡介   在您開始閱讀這篇文章之前,我得明確地告訴您,我並不是一個數據庫設計領域的大師。以下列出的 11 點是我對自己在平時項目實踐

原创 網站統計中的數據收集原理及實現-埋點統計

網站數據統計分析工具是網站站長和運營人員經常使用的一種工具,比較常用的有谷歌分析、百度統計和騰訊分析等等。所有這些統計分析工具的第一步都是網站訪問數據的收集。目前主流的數據收集方式基本都是基於javascript的。本文將簡要分析這

原创 MAC系統中搭建Spark大數據平臺(包括Scala)

MAC系統中搭建Spark大數據平臺(包括Scala) 總體介紹: 大家Spark大數據平臺,包括三部分內容:JDK,Scala,Spark 這三者是依次依賴的關係,Spark依賴於Scala環境(Spark是使用Scala語言開發),S

原创 即使刪了全庫,保證半小時恢復

即使刪了全庫,保證半小時恢復 近期一篇《就這樣把根目錄刪了!!!》引發了廣泛的討論,《如何防止根目錄被刪》彙總了7種防刪方案。還有同學評論中反饋“不小心把庫刪了”,如何快速恢復刪掉的數據庫,是今天要討論的話題。   【高可用數據庫架構】

原创 Mac下安裝Spark開發環境(Linux系統可參照)

Mac下安裝Spark開發環境(Linux系統可參照) 之前一直使用VNC在遠程集羣上進行Spark程序開發,但是網絡的不穩定以及集羣時常升級讓人頭疼。在這裏我在自己的Mac上 搭建單機Spark開發環境,作爲學習開發已經足夠。

原创 Apache kafka 工作原理介紹

Apache kafka 工作原理介紹 消息隊列 消息隊列技術是分佈式應用間交換信息的一種技術。消息隊列可駐留在內存或磁盤上, 隊列存儲消息直到它們被應用程序讀走。通過消息隊列,應用程序可獨立地執行–它們不需要知道彼此的位

原创 如何防止誤刪根目錄

如何防止誤刪根目錄 一、悲劇回顧 執行了一個清理日誌的腳本,大致的邏輯是: ... cd ${log_path} rm -rf * ... 看上去沒有任何問題,進入到日誌目錄,然後把日誌都刪除。但是,當目錄不存在時,悲

原创 數據庫建立索引的原則

索引查詢是數據庫中重要的記錄查詢方法,要不要進入索引以及在那些字段上建立索引都要和實際數據庫系統的查詢要求結合來考慮,下面給出實際中的一些通用的原則: 1. 在經常用作過濾器的字段上建立索引;  2. 在SQL語句中經常進行GRO

原创 表複製 SELECT INTO 和 INSERT INTO SELECT

Insert是T-sql中常用語句,Insert INTO table(field1,field2,...) values(value1,value2,...)這種形式的在應用程序開發中必不可少。但我們在開發、測試過程中,經常會遇到需要

原创 HashMap源碼解析(體系化總結)持續更新

Java集合繼承關係     典型集合源碼閱讀 HashTable 繼承Dictionary類,實現Map類 使用Syncronize實現線程安全,讀寫都做 數組+單向鏈表存儲 key的尋址算法:(hash & 0x7F