原创 MapReduce簡介

繼上一節的HDFS,這一節來學習並行計算框架MapReduce。 作爲Hadoop的又一核心概念,HDFS解決了數據的存儲的問題,而MapReduce自然解決的是並行計算的問題。 目錄: Hadoop的優勢與概念 Map和Reduce

原创 對貝葉斯、svm和神經網絡的入門級理解

在省略了不少計算、優化的過程的情況下記錄了一些自己對一下三個算法整體思路和關鍵點的理解,因此也只能說是“入門級理解”。以下是目錄索引。 貝葉斯 樸素貝葉斯 svm支持向量積 神經網絡 貝葉斯概率可以用來解決“逆概”問題,“正向概率

原创 NLPIR更新授權

中科院NLPIR授權 使用中科院NLPIR進行分詞: import pynlpir pynlpir.open() # 打開分詞器 sentence = '前一段時間在使用張華平博士的NLPIR中文分詞系統' for i in pynlp

原创 Word2vec安裝使用

下載C版本的word2vec 進入文件目錄下後,會有一個makefile文件,有了它就可以編譯啦 $ cd /home/yinglish/download/word2vec/trunk $ make 編譯完後會生成一些新的文件。 接下來

原创 HDFS概述

想學習大數據方面的知識就避不開hadoop,終於下決心補充一下知識的盲區,聽了廈門大學林子雨老師的大數據原理與應用課程(確實是好課,感謝老師!),記錄一下自己學習到了HDFS相關知識。 HDFS是hadoop的核心設計之一,解決的是海量數

原创 Python: 你不知道的 super

原文鏈接 super() 的入門使用 在類的繼承中,如果重定義某個方法,該方法會覆蓋父類的同名方法,但有時,我們希望能同時實現父類的功能,這時,我們就需要調用父類的方法了,可通過使用 super 來實現,比如: class Animal(

原创 java按值傳遞

主要參考來自這兩篇: Java:按值傳遞還是按引用傳遞詳細解說 Java 到底是值傳遞還是引用傳遞? - 知乎 爲了方便我自己的理解(每次記了就忘,也是很無奈了==),作了一下整理。 我們先下結論:java的參數傳遞就是採用按值傳遞的

原创 自動問答系統流程

一個自動問答系統可分爲問句處理和答案檢索兩大部分。 在一個面向電影領域知識的問答系統中,把所有數據存放在mysql數據庫中,用非結構數據庫neo4j(也稱圖形屬性數據庫)構造電影圖譜,在電影圖譜的基礎上進行答案檢索。之所以不直接從mys