原创 Centos下daemontools監控logstash進程

Logstash安裝參考http://udn.yyuap.com/doc/logstash-best-practice-cn/get_start/daemon.html 首先用root用戶, $ yum install python-se

原创 ElasticSearch之Java Api聚合分組實戰

最近有個日誌收集監控的項目採用的技術棧是ELK+JAVA+Spring,客戶端語言使用的是Java,以後有機會的話可以試一下JavaScript+Nodejs的方式,非常輕量級的組合,只不過不太適合服務化的工程,Kibana充當可視化層

原创 大數據學習資源彙總

當前,整個互聯網正在從IT時代向DT時代演進,大數據技術也正在助力企業和公衆敲開DT世界大門。當今“大數據”一詞的重點其實已經不僅在於數據規模的定義,它更代表着信息技術發展進入了一個新的時代,代表着爆炸性的數據信息給傳統的計算技術和信息

原创 一文讀懂機器學習

從機器學習談起   在本篇文章中,我將對機器學習做個概要的介紹。本文的目的是能讓即便完全不瞭解機器學習的人也能瞭解機器學習,並且上手相關的實踐。這篇文檔也算是EasyPR開發的番外篇,從這裏開始,必須對機器學習瞭解才能進一步介紹

原创 Easyui Datagrid自動調整行號大小

相信很多人在使用easyui的時候都遇到過這個問題,當我們設置成顯示Rownumber的時候,你會發現,如果Rownumber越來越大,達到三位數或者四位數的時候,Rownumber就顯示不全了.這個問題糾結了不知道多少人,在羣裏

原创 JQuery EasyUI combobox動態添加option

<input class="easyui-combobox" id="rwlb" name="rwlb" style="width:435px" data-options="valueField:'id', textField:'tex

原创 ElasticSearch的Gateway及存儲原理

轉自:http://log.medcl.net/item/2010/10/elasticsearch-the-gateway-and-storage/ ES裏有一個叫做gateway的東西,今天抽空理一下,前面翻譯ES的一篇博文叫做“

原创 java 集合類Array、List、Map區別和聯繫

Java集合類主要分爲以下三類: 第一類:Array、Arrays 第二類:Collection :List、Set第三類:Map :HashMap、HashTable   一、Array , Arrays Java所有“存儲

原创 spark rdd

     RDD是彈性分佈式數據集,即一個RDD代表一個被分區的只讀數據集。一個RDD生成有兩種途徑,一個來自於內存集合和外部存儲系統,另一種是通過轉換操作來自於其他RDD,比如:map、filter、jion等。     RDD分區:對

原创 時間序列數據庫的祕密(3)——加載和分佈式計算

</pre><span style="font-size:12px">原來列式存儲還有這種優點,es利用了mmap來加載單獨需要索引的列,化隨機讀爲順序讀且排序過,並且因爲是列式存儲,所以可以減少加載的列的數量,並利用各種posting

原创 數據庫的原理(1)

一提到關係型數據庫,我禁不住想:有些東西被忽視了。關係型數據庫無處不在,而且種類繁多,從小巧實用的 SQLite 到強大的 Teradata 。但很少有文章講解數據庫是如何工作的但少有文章講解數據庫是如何工作的。你可以自己谷歌/百度一下

原创 Elasticsearch與Solr對比

轉自:http://i.zhcy.tk/blog/elasticsearchyu-solr/ 搜索引擎選型調研文檔 Elasticsearch簡介* Elasticsearch是一個實時的分佈式搜索和分析引擎。它可以幫助你用前所未

原创 時間序列數據庫的祕密(2)——索引

如何快速檢索? Elasticsearch是通過Lucene的倒排索引技術實現比關係型數據庫更快的過濾。特別是它對多條件的過濾支持非常好,比如年齡在18和30之間,性別爲女性這樣的組合查詢。倒排索引很多地方都有介紹,但是其比關係型數據

原创 Centos6.5 iptables配置詳解

1.什麼是iptables iptable其實是Linux下的數據包過濾軟件,也是目前最新Linux發行版中默認的防火牆。要想深入瞭解iptables機制,瞭解防火牆的規則是必不可少的。由於iptables利用的數據包過濾的機制,所以

原创 設計模式(一)-- 工廠模式

       在面向對象編程中, 最通常的方法是一個new操作符產生一個對象實例,new操作符就是用來構造對象實例的。但是在一些情況下, new操作符直接生成對象會帶來一些問題。舉例來說, 許多類型對象的創造需要一系列的步驟: 你可能需