1、 《LSA and PLSA筆記》 將LSA和pLSI的優點和缺點進行了總結和比較,是目前看到的非常好的資料;
2、 Zhou Li的博客,尤其是LSA和LDA的兩篇note,不僅詳細介紹了模型和求解過程、相關的背景知識,同時還有實驗結果和代碼;
3、 《PLSA中的EM算法 》,僅僅是介紹pLSI,不過文檔中又貼了其他reference,包括我看的一份Liangjie Hong的一份資料(資料中涉及的[4]和[6]參考文獻也很有價值)。原文沒有太多精彩(本文更不精彩),關鍵看references;
4、 中科院自動化所的徐立恆博士生總結的LDA資料,其中找到了我郵論壇的ML_DM版塊上的一篇好文(自己竟然都沒有關注過這個版塊,sigh~),文中不僅對LDA的論文進行了通俗易懂的描述,還對一些預備知識(例如dirichlet distribution, Conjugate Prior, EM)進行了簡單介紹,特別是給出了它們在PRML一書中相應的章節,實在是好文!
5、 還有就是原論文了,呵呵。
還有就是在各大會議中關注主題模型的新想法出現了。