原创 Andriod的25個應用

         1.谷歌語音   谷歌語音是一種非常有用的服務,我認爲這是Android本身一個巨大的優勢,尤其是因爲蘋果在iPhone中拒絕谷歌語音。你可以使用一個電話號碼,可以撥打很多地方的電話或設備,還可以讓你通過網絡訪問你的所

原创 函數遞歸調用詳解

  遞歸問題是一個說簡單也簡單,說難也有點難理解的問題.我想非常有必要對其做一個總結. 首先理解一下遞歸的定義,遞歸就是直接或間接的調用自身.而至於什麼時候要用到遞歸,遞歸和非遞歸又有那些區別?又是一個不太容易掌握的問題,更難的是對於遞歸

原创 BM算法圖解

 首先,先簡單說明一下有關BM算法的一些基本概念。 BM算法是一種精確字符串匹配算法(區別於模糊匹配)。 BM算法採用從右向左比較 的方法,同時應用到了兩種啓發式規則,即壞字符規則 和好後綴規則 ,來決定

原创 TCP/IP之協議關係與結構

轉載之:http://www.cnblogs.com/JCSU/articles/1323931.html                                    圖1、TCP/IP協議的相互關係            

原创 各種排序算法穩定性的探討

 首先,排序算法的穩定性大家應該都知道,通俗地講就是能保證排序前2個相等的數其在序列的前後位置順序和排序後它們兩個的前後位置順序相同。在簡單形式化一下,如果Ai = Aj, Ai原來在位置前,排序後Ai還是要在Aj位置前。爲了簡便下面討論

原创 海量數據處理專題(五)——堆

  【什麼是堆】概念:堆是一種特殊的二叉樹,具備以下兩種性質 1)每個節點的值都大於(或者都小於,稱爲最小堆)其子節點的值 2)樹是完全平衡的,並且最後一層的樹葉都在最左邊 這樣就定義了一個最大堆。如下圖用一個數組來表示堆: 那麼下面

原创 海量數據處理專題(三)——Hash

  【什麼是Hash】 Hash,一般翻譯做“散列”,也有直接音譯爲“哈希”的,就是把任意長度的輸入(又叫做預映射, pre-image),通過散列算法,變換成固定長度的輸出,該輸出就是散列值。這種轉換是一種壓縮映射,也就是,散列值的空間

原创 大端模式和小端模式的判別!

  大端模式:     一般我們較習慣的模式,數值的高位存入低地址中,低位存入高地址中。如在16位的CPU中,一個整型佔有2個字節,如0x1234,它存儲在存儲器的順序是地址的低位存0x12,高位存0x34; 小端模式:    與大端模式

原创 細說Cache

  什麼是緩存? Web 應用程序通常都是被多個用戶訪問。一個Web站點可能存在一個“重量級”的加載,它能夠使得站點在訪問的時候,拖慢整個服務器。當站點被大量用戶同時訪問的時候,訪問速度緩慢是大部分網站共同存在的問題。爲了解決這個問題,我

原创 南瑞繼保、國電南自、國電南瑞

嚴格說來現在這兩者沒有任何關係了,兩者的前身是同一個公司——南京電力自動化設備總廠,後來分爲了兩家,一個是現在的國家電網下屬的自動化研究院,就是南瑞,另一個是中國華電集團下屬的上市公司,就是國電南自。 國電南瑞科技股份有限公司成立於200

原创 向量空間模型(VSM)

 向量空間模型(VSM) 向量空間模型將文檔映射爲一個特徵向量V(d)=(t1,ω1(d);…;tn, ωn(d)),其中ti(i=1,2, …,n)爲一列互不雷同的詞條項,ωi(d)爲ti在d中的權值, 一般被定義爲ti在d中出現頻率t

原创 海量數據處理專題(二)——Bloom Filter

  【什麼是Bloom Filter】 Bloom Filter是一種空間效率很高的隨機數據結構,它利用位數組很簡潔地表示一個集合,並能判斷一個元素是否屬於這個集合。Bloom Filter的這種高效是有一定代價的:在判斷一個元素是否屬

原创 細說Cookies

  什麼是Cookies? Cookies是一些小文件,它們被創建在客戶端的系統裏,或者被創建在客戶端瀏覽器的內存中(如果是臨時性的話)。用它可以實現狀態管理的功能。我們可以存儲一些少量信息到可以短的系統上,以便在需要的時候使用。最有趣

原创 海量數據處理專題(七)——數據庫索引及優化

  索引是對數據庫表中一列或多列的值進行排序的一種結構,使用索引可快速訪問數據庫表中的特定信息。 數據庫索引 什麼是索引 數據庫索引好比是一本書前面的目錄,能加快數據庫的查詢速度。 例如這樣一個查詢:select * from table