原创 深度學習的一些演示項目

tensorflow http://playground.tensorflow.org/ ConvnetJS demo http://cs.stanford.edu/people/karpathy/convnetjs/ Neu

原创 最短路徑分詞

最短路徑分詞的原理是:首先,對句子進行原子切分,然後根據大詞典,構造一個有向無環圖,俗稱DAG(Directed Acyclic Graph),每個可能分詞對應DAG的一條邊,每條邊有一定的權重。因此,分詞問題轉化成了求DAG中起點到終點

原创 語料庫

思路: -語料庫有什麼用,在統計機器學習中的地位,用圖說明 -語料庫的一些基本概念。如熟語料、生語料等。 -有哪些著名的語料庫。人民日報語料庫、WordNet等。 -如何構建語料庫。主要是成本、規範