原创 文本分類學習 (五) 機器學習SVM的前奏-特徵提取(卡方檢驗續集)

前言: 上一篇比較詳細的介紹了卡方檢驗和卡方分佈。這篇我們就實際操刀,找到一些訓練集,正所謂紙上得來終覺淺,絕知此事要躬行。然而我在躬行的時候,發現了卡方檢驗對於文本分類來說應該把公式再變形一般,那樣就完美了。 目錄: 文本分類學

原创 HttpClient參觀記:.net core 2.2 對HttpClient到底做了什麼?

.net core 於 10月17日發佈了 ASP.NET Core 2.2.0 -preview3,在這個版本中,我看到了一個很讓我驚喜的新特性:HTTP Client Performance Improvements ,而且

原创 文本分類學習(二)文本表示

接着上一篇。在正式的嘗試使用文本分類算法分類文本的時候,我們得先準備兩件事情: 一,準備適量的訓練文本;二,選擇合適的方法將這些訓練文本進行表示(也就是將文本換一種方式表示) 大家都知道文本其實就是很多詞組成的文章啊。所以很自然的

原创 文本分類學習(六) AdaBoost和SVM

直接從特徵提取,跳到了BoostSVM,是因爲自己一直在寫程序,分析垃圾文本,和思考文本分類用於識別垃圾文本的短處。自己學習文本分類就是爲了識別垃圾文本。 中間的博客待自己研究透徹後再補上吧。 因爲獲取垃圾文本的時候,發現垃圾文本

原创 文本分類學習 (八)SVM 入門之線性分類器

SVM 和線性分類器是分不開的。因爲SVM的核心:高維空間中,在線性可分(如果線性不可分那麼就使用核函數轉換爲更高維從而變的線性可分)的數據集中尋找一個最優的超平面將數據集分隔開來。 所以要理解SVM首先要明白的就是線性可分和線性

原创 文本分類學習(一):開篇

今天開始,就要認真開始對待文本分類,在此之前只是稀疏的看過一些博客,瞭解一下貝葉斯分類。之所以要學習文本分類,是因爲我做的畢業設計就是關於文本分類和機器學習的。突然感覺到時間不太夠用了,而擺在我面前的實際上是一個很浩大的工程,不得不抓緊時

原创 Int32 最大的數值是多少???(附十進制十六進制相互轉換且包含正負數的java代碼)

正數轉二進制很簡單,轉十六進制也很簡單。那麼負數的情況下呢?在計算機中無法識別你給的符號“+”,"-",計算機只認識0和1 那麼在二進制中如何表示負數。 先簡單介紹一下負數如何轉二進制,八進制,十六進制:比如給的是-4那麼先算出+4的二進

原创 Git 使用篇一:初步使用GitHub,下載安裝git,並上傳項目

首先在MAC上怎麼操作。 在gitHub創立一個賬戶,在創立一個項目,這就不用我說了對吧。 創建完之後是這樣的:   接下來,我們打開https://brew.sh 這是下載homebrew的網站,homebrew 是幹嘛

原创 Flask 學習篇二:學習Flask過程中的記錄

Flask學習筆記: GitHub上面的Flask實踐項目 https://github.com/SilentCC/FlaskWeb 1.Application and Request Context(上下文) 在Flask 中,一

原创 Lucene.net(4.8.0) 學習問題記錄五: JIEba分詞和Lucene的結合,以及對分詞器的思考

前言:目前自己在做使用Lucene.net和PanGu分詞實現全文檢索的工作,不過自己是把別人做好的項目進行遷移。因爲項目整體要遷移到ASP.NET Core 2.0版本,而Lucene使用的版本是3.6.0 ,PanGu分詞也是對應Lu

原创 溫故KMP算法

最近由於某些原因,又回顧了一次KMP算法。上一次回顧KMP算法還是在刷題的時候遇到的:http://blog.csdn.net/dacc123/article/details/50994611在我的記憶力,每次回顧KMP算法都會有新的理解

原创 Git 使用篇二:搭建遠程服務器

一般做一個私人的項目,不希望開源的,是不會放在GitHub上的,這個時候我們需要建裏一個自己的Git遠程服務器,方便小組成員開發。 這裏以Centos雲服務器爲例: 第一步 如果自己的服務器沒有git賬號,可以先配置一個git賬號(當然

原创 一道網易面試編程題

一條長爲n的路,需要用路燈點亮,其中"."表示需要點亮的位置,"X"表示無需點亮的位置,假設燈立在i處,則它可以點亮i-1,i,i+1三個位置,問至少需要多少燈才能點亮整條路。 乍一看,肯定是動態規劃:上代碼,敲了兩個小時的動態規劃:#i

原创 Docker 學習應用篇之三: Docker的簡單實用

安裝完Docker之後,我們就可以簡單的使用Docker,來體會Docker的用處。 首先看下Docker的常用命令,都是我在實用Docker的時候用到的命令:                     docker常用命令:      

原创 Nginx 日誌 worker_connections are not enough while connecting to upstream

記一次,排查錯誤所遇到的問題,和學習到的內容。上週五,剛上線的項目出現了503 ,查看日誌發現如下內容:System.Exception: Request api/blogpost/zzkDocs <html>^M <head><titl