原创 最大熵模型簡記

最近兩天簡單看了下最大熵模型,特此做簡單筆記,後續繼續補充。最大熵模型是自然語言處理(NLP, nature language processing)被廣泛運用,比如文本分類等。主要從分爲三個方面,一:熵的數學定義;二:熵數學形式化定義的

原创 leetcode ---雙指針+滑動窗口

一:Minimum Size Subarray Sum(最小長度子數組的和O(N)) 題目: Given an array of n positive integers and a positive integer s, find t

原创 UFLDL教程筆記及練習答案三(Softmax迴歸與自我學習***)

1:softmax迴歸 當p(y|x,theta)滿足多項式分佈,通過GLM對其進行建模就能得到htheta(x)關於theta的函數,將其稱爲softmax迴歸。教程中已經給了cost及gradient的求法。需要注意的是一般用最優化方

原创 相似圖片搜索原理四(內容特徵法)

說明:這裏爲阮一峯的一篇blog:http://www.ruanyifeng.com/blog/2013/03/similar_image_search_part_ii.html,其中顏色分佈法就是顏色直方圖的一種,我的上一遍blog闡

原创 面試筆試

最近需要找工作了,特將遇到的面試筆試題總結在這裏,後續會陸續添加。。希望對大家也有幫助 1:不能被繼承只能被實例化3次 分析:不能被繼承,只需要將該類的構造函設置爲私有的就可以了,那麼如何得到它呢,只能通過靜態函數得到了(不能創建對象,自

原创 相似圖片搜索原理三(顏色直方圖—c++實現)

       圖像的顏色直方圖可以用於圖像檢索,適應有相同色彩,並且可以有平移、縮放、旋轉不變性的圖像檢索,當然了這三大特點不如sift或者surf穩定性強,此外最大的侷限就是如果形狀內容一樣,但色彩不一,結果是搜不到的。不過它在某些情況

原创 百度圖像搜索探祕

昨天,百度上線了新的相似圖(similarimage search)搜索,試了風景、人物、文字等不同類型query的效果,感覺效果非常贊。尤其對於人物搜索,返回的結果在顏色、以及姿態方面具有非常大的相似性。特別是在輸入某個pose的美女

原创 概念主題模型簡記

概念主題模型(PTM, probabilitytopical model)在自然語言處理(NLP,natural language processing)中有着重要的應用。主要包括以下幾個模型:LSA(latentsemantic an

原创 leetcode 204/187/205 Count Primes/Repeated DNA Sequences/Isomorphic Strings

一:leetcode 204 Count Primes 題目: Description: Count the number of prime numbers less than a non-negative number, n 分析

原创 UFLDL教程筆記及練習答案二(預處理:主成分分析和白化)

首先將本節主要內容記錄下來,然後給出課後習題的答案。 筆記: 1:首先我想推導用SVD求解PCA的合理性。        PCA原理:假設樣本數據X∈Rm×n,其中m是樣本數量,n是樣本的維數。PCA降維的目的就是爲了使將數據樣本由原來的

原创 UFLDL教程練習答案一(稀疏自編碼器和矢量化編程實現)

最近想研究下深度學習,一開始就看UFLDL(unsuprisedfeature learning and deep learning)教程了,特將課後習題答案放在這裏,作爲一個筆記。 筆記: 1:自編碼算法是一個無監督學習算法,它通過學習

原创 leetcode LinkList專題

此次blog會將leetcode上的linklist專題內容放在這裏,後續慢慢添加 一:leetcode 206 Reverse Linked List  二:leetcode 92 Reverse Linked List II 一:

原创 相似圖片搜索原理二(phash—c++實現)

前段時間介紹過相似圖片搜索原理一(ahash) http://blog.csdn.net/lu597203933/article/details/45101859,它是基於內容檢索最簡單的一種;這裏介紹它的增強版本感知哈希算法(perce

原创 貝葉斯網絡

貝葉斯網絡、馬爾科夫隨機場(MRF, Markov RandomField)和因子圖都屬於概念圖,因此它們都歸屬於機器學習中的概念圖模型(PGM,Probability Graphical Model). 一:定義 貝葉斯網絡,又稱信念網

原创 Lire源碼解析一

Lucene image retrieval是以圖搜圖的java開源框架,這幾天沒什麼事,就讀了點源碼,並寫了點註釋,特在這分享給大家。 這裏主要給出的是BOVWBuilder.java、Kmeans.java及Cluster.java。