原创 SEO優化之——常用工具總結

原文連接:http://www.zhaochao.net/index.php/2016/03/07/18/ 寫在前面 SEO優化就是讓網站排名更靠前,那麼怎麼來衡量一個網站SEO的好壞呢?通常我們是藉助一些SEO工具來查詢一個網站

原创 Spring+Jetty+Jersey+Mybatis整合教程 無web.xml 、webapp版

原文鏈接 http://blog.csdn.net/whzhaochao/article/details/50152833 項目總體目錄結構 項目結構說明 com.zhaochao.action 主要放處理RESTFull 接

原创 IKAnalyzer 添加擴展詞庫和自定義詞

原文鏈接http://blog.csdn.net/whzhaochao/article/details/50130605 IKanalyzer分詞器 IK分詞器源碼位置 http://git.oschina.net/wltea/I

原创 Hessian配置用戶名和密碼

原文鏈接 http://www.zhaochao.net/index.php/2016/01/26/12/ 配置原因 隨着業務的發展項目會變的越來越多,項目需要進行模塊化與服務化,服務化中常用的方法就是使用RPC技術,Hessia

原创 SEO優化之——網站SEO優化初步總結

原文連接 http://www.zhaochao.net/index.php/2016/03/06/17/ 什麼是SEO SEO是由英文Search Engine Optimization縮寫而來, 中文意譯爲“搜索引擎優化”。

原创 SEO優化之——百度搜索高級指令教程

原文鏈接:http://www.zhaochao.net/index.php/2016/03/06/16/ 寫在前面 最近正在學習SEO相關的知識,對於從事SEO的開發人員來說學會一些高級搜索指令是很有必要的,對於非專業人員來說

原创 配合Kibana記錄一次 ElasticSearch JVM 調優實戰

先上圖 主要問題:  GC count 中Old和YoungGC在10點之前次數比較頻繁   1、第一步優化       在JVM Heap圖表中可以看到在10點之前UsedHeap基本上等於Max Heap,所以引起頻繁的 Old G

原创 分佈式Web應用----zookeeper基本工作原理

寫在前面 前面一篇文章簡單介紹了zookeeper的安裝,當安裝好了zookeeper後,我們可以通過zookeeper自帶的客戶端連接到zookeeper上,並對其進行操作,在對它進行操作前我們先要了解一些基本的知識。 zookeepe

原创 ice-dubbo-thrift-grpc性能測試對比

 ice-dubbo-thrift-grpc性能測試對比 測試說明 本測試只是個人爲了對rpc進行技術選型,測試可能不夠嚴謹,對某些rpc的參數可能也不是最優,如果你知道更優的參數配置或者改進意見等,歡迎反饋給我magicdoom@gma

原创 分佈式Web應用----基於Socket+動態代理實現簡單RPC 生產者消費者模型

原文連接:http://www.zhaochao.net/index.php/2016/03/15/22/ 寫在前面 前面一文主要簡單介紹了JAVA動態代理基本原理,這也是實現RPC的基本知識,這裏我們運用Socket簡單實現一個遠程過程

原创 使用Spark MLlib 完成新聞自動分類

寫在前面 最近學習了一點文本挖掘相關知道,剛剛接觸到一點皮毛,剛好學了點Spark,所有就找個了小例子玩了一下,算法和實現都不太難,比較適合看公式一臉蒙逼,無聊想來點實際性Demo玩一下 基本流程 如圖所示爲新聞自己分類的基本流程,其中

原创 使用輕量級JAVA 爬蟲Gecco工具抓取新聞DEMO

寫在前面 最近看到Gecoo爬蟲工具,感覺比較簡單好用,所有寫個DEMO測試一下,抓取網站 http://zj.zjol.com.cn/home.html,主要抓取新聞的標題和發佈時間做爲抓取測試對象。抓取HTML節點通過像Jquery

原创 分佈式Web應用----Linux環境下zookeeper集羣環境的安裝與配置

寫在前面 zookeeper在分佈式應用中運用的比較廣泛,瞭解zookeeper的原理對理解分佈架構的應用具有很大的幫助,學會安裝zookeeper是學習zookeeper的前提,自己剛剛學習zookeeper,記錄一下安裝過程,增加自己

原创 分佈式Web應用----Java動態代理技術實現原理分析

原文鏈接:http://www.zhaochao.net/index.php/2016/03/11/20/ 寫在前面 在企業開發中,最基本的開發架構可能就算是MVC框架,如 Struts+Spring+Hibernate 或者 Spr

原创 使用SparkSQL 分析日誌中IP數、流量等數據

寫在前面 前面文章中,我們使用Spark RDD從非結構化的日誌文件中分析出了訪問獨立IP數,單個視頻訪問獨立IP數和每時CDN流量,這篇文章主要介紹使用Spark SQL從結構化的數據中完成這些數據的分析,如下圖所有,先將日誌文件結構化