原创 從文章中檢索出關系型數據信息算法
我承認我超級喜歡胡思亂想... 今天我又有了新的想法,是關於從文章中提取出關係型信息的算法,我不知道現在是否已經存在了類似的算法,目前我還沒有想到這種算法的用途,但是我覺得這很困難,但是又可行,所以我就決定還是把它記下來吧。 文章呢,沒出
原创 mysql數據庫計算各種單位的兩個時間點的差值
mysql數據庫有一個很牛逼的自帶函數用來計算兩個時間點的時間差,他就是 timestampdiff(unit, datetime_expr1, datetime_expr2) 第一個參數(unit)就是你想要算出來的單位,我總結了一下有
原创 月亮與六便士
爲了讓靈魂安息,一個人每天都要做兩件他所厭惡的事情。說這句話的人是睿智的,我也一直在努力踐行着這條格言。因爲我每天都按時起牀,按時睡覺。--第二章
原创 多表關聯如何建立索引
我是用的三張表進行關聯的,一大兩小。下面看一下三張表的具體結構。 三張圖對應三張表,然後下面是我寫的查詢sql select a.*, b.*, c.* from statjiankong_etl a left join i
原创 存儲和計算的分別雲化設想
我的想法是這樣衍生來的... 雲的概念我這裏就不細說了,大致的意思就是可以自由分配固定的資源。比如說你有好幾百臺服務器,每臺服務器資源相對來說比較大,你的服務不需要這麼大的資源,一臺服務器的資源,對你來說都是“殺雞用了牛刀”,那麼雲計算就
原创 關於maven的pom.xml報錯
一、pom.xml報錯 類似:Missing artifact org.springframework:spring-jdbc:jar:3.2.4.RELEASE 這樣的錯誤,提示某個jar包沒有了。 這個問題之前碰見好幾次了,每
原创 eclipse打jar包報錯
想攻一攻hive的UDF,終於找到了依賴包,就用eclipse寫了個簡單的UDF,想打個jar包傳到hadoop環境上,結果這jar包就是打不上。 我根據報錯信息上網上找了好多博客,最終在一位前輩的指導下搞定了,下面我總結一下這種報錯可
原创 hive外表的.txt文件‘自動補全’問題
hive的表按性質來分,目前我知道的就是管理表和外部表。 建表語句中主要用關鍵字來區分,EXTENAL表示的就是外部表,MANAGED表示的就是管理表。區別就是,hive認爲外部表並非完全擁有這份數據,所以刪除該表並不會刪除掉這
原创 kettle的元數據
首先解釋一下元數據,元在中國漢語中有‘基本’之意,所以元數據也可以說成是kettle的基本描述數據。拿人來舉例子,一個人出生年月,年齡性別,地區職業,生活閱歷等等,這些都可以稱爲一個人的元數據,那麼kett
原创 開博第一篇
我越來越真切地覺得,人類急需要重構,無論是身體還是靈魂...