原创 Hadoop源碼分析筆記(五):HDFS特點和體系結構

HDFS         Hadoop是一個能夠讓用戶輕鬆架構和使用的分佈式計算平臺,用戶可以在Hadoop上管理、開發和運行處理大規模數據的應用,其中,Hadoop分佈式文件系統(Hadoop Distributed File Syst

原创 Hadoop源碼分析筆記(八):HDFS主要流程

HDFS主要流程         本節介紹5個典型的HDFS流程:客戶端到名字節點的元數據操作、客戶端讀文件、客戶端寫文件、數據節點到名字節點的註冊和心跳、以及第二名字節點的合併數據。這些流程充分體現了HDFS實體間IPC接口和流

原创 Hadoop源碼分析筆記(二):Hadoop序列化與壓縮

Hadoop文件序列化         本文着重講述Hadoop面向海量數據處理的輸入輸出。代碼請見org.apache.hadoop.io包。 序列化用途         對象的序列化是用於將對象編碼成一個字節流,以及從字節流中重新夠着

原创 Java線程查看工具——jstack

jdk1.6退出了一個查看線程CPU使用率的工具——jstack。其可以查看當前web應用中存在的線程,以幫助定位程序中那些線程對CPU的使用率過高

原创 HashMap、HashTable、LinkedHashMap和TreeMap用法和區別

Java爲數據結構中的映射定義了一個接口java.util.Map,它有四個實現類,分別是HashMap、HashTable、LinkedHashMap和TreeMap。本節實例主要介紹這4中實例的用法和區別。 關鍵技術剖析: Map用於

原创 Java和PHP在Web開發方面的比較

比較PHP和JSP這兩個Web開發技術,在目前的情況是實在是比較PHP和Java的Web開發。以下是我就幾個主要方面進行的比較:   一、 語言比較   PHP是解釋執行的服務器腳本語言,首先php有簡單

原创 電商課題:對付秒殺器等惡意訪問行爲的簡單梳理

201208 @鄭昀 -秒殺器愛好者的技能點- OCR識別 掌握一般的驗證碼圖片識別OCR技術,多數侷限於英文和數字字符的OCR識別,隨着背景干擾加大,識別率急劇降低表單提交 提前準備好表單自動填寫表單,自動提交自定義快捷鍵題庫 針對

原创 Velocity語法

一、基本語法 1、"#"用來標識Velocity的腳本語句,包括#set、#if 、#else、#end、#foreach、#end、#iinclude、#parse、#macro等; 如: #if($info.imgs) <i

原创 由12306.cn談談網站性能技術

12306.cn網站掛了,被全國人民罵了。我這兩天也在思考這個事,我想以這個事來粗略地和大家討論一下網站性能的問題。因爲倉促,而且完全基於本人有限的經驗和了解,所以,如果有什麼問題還請大家一起討論和指正。(這又是一篇長文,只討論性能問題,

原创 redis Linux的安裝方法

原文地址:http://www.cnblogs.com/Qbright/archive/2012/07/05/2578346.html 首先下載reids的壓縮包  reidis-2.4.15.tar.gz, 然後鍵入: # tar x

原创 linux內核TCP相關參數解釋

tcp_syn_retries :INTEGER默認值是5 對於一個新建連接,內核要發送多少個 SYN 連接請求才決定放棄。不應該大於255,默認值是5,對應於180秒左右時間。(對於大負載而物理通信良好的網絡而言,這個值偏高,可修改爲

原创 輕量級HTTP服務器Nginx(Nginx性能優化技巧)

原創作品,允許轉載,轉載時請務必以超鏈接形式標明文章 原始出處 、作者信息和本聲明。否則將追究法律責任。http://ixdba.blog.51cto.com/2895551/803475 一、編譯安裝過程優化 1.減小Nginx編

原创 併發數的計算

與併發用戶數相關的概念還包括“併發用戶數”、“系統用戶數”和“同時在線用戶數”,下面用一個實際的例子來說明它們之間的差別。         假設有一個OA系統,該系統有2000個使用用戶——這就是說,可能使用該OA系統的用戶總數是2000

原创 Java Collection總結

ArrayList和Vector是採用數組方式存儲數據,此數組元素總數大於實際存儲的數據個數以便增加和插入元素,二者都允許直接序號索引元素,但是插入數據要移動數組元素等內存操作,所以它們索引數據快、插入數據慢。 ArrayList數組

原创 JAVA線程dump的分析 --- jstack pid

Java 的線程 線程是指能獨立於程序的其它部分運行的執行單元。 JAVA語言能夠很好的實現多線程的程序。我們在調試程序,或者在開發後期需要做性能調優的時候,往往也需要了解當前程序正在運行的線程的狀態,正在執行的操作,從而分析系統可能存