原创 使用UCI兩個數據集,使用Python的Sklearn比較神經網絡、支持向量機、貝葉斯三個模型的好壞(附簡單詳細代碼)

文章目錄數據集說明快速下載Sklearn的各種包Wine數據集Iris數據集代碼輸出結果 數據集說明 數據下載地址:https://archive.ics.uci.edu/ml/index.php data文件爲數據,由逗號分開,

原创 ACM初中高級刷題指南

文章目錄刷題題集初級中級:高級網上的大神計劃刷匡冰專題 刷題題集 下面是我在網上找到的不同級別的一個算法分類和推薦題集: 初級 一.基本算法: (1)枚舉. (poj1753,poj2965) (2)貪心(poj1328,poj2

原创 NLP—比較各分類器在影評分類任務上的性能

題目:比較分類器在影評分類任務上的性能。 訓練集:1500,測試集:500。 1、Naive Bayes(樸素貝葉斯)有三個常用模型:高斯、多項式、伯努利; 2、KNN選擇K(最好是交叉驗證); 3、SVM選擇核函數。 4、決策樹

原创 各國數據網站大全(尤其適用美賽這種需要很多數據的)

參加美賽這種比賽,找到數據就成功了一半。比賽加上日常使用,積累了很多實用的數據網站(部分網站需自備梯子): 國家統計局 各國家統計局(很實用) 歐盟統計局(數據特別充足,美賽幫助很大)很詳細,比如這個:廢物產生量的數據 美國政府

原创 整型與字符串轉換函數atoi和itoa函數詳解

文章目錄atoi()---ASCII to integeratoi()應有舉例(有題有代碼)itoa---integer to ASCII其他類似函數atoi()使用的坑替代方法:stringstream 頭文件:#includ

原创 C++藍橋杯歷屆試題(附代碼)

文章目錄帶分數【全排列】錯誤票據 帶分數【全排列】 思想: 題意是用bfs搜索,我是枚舉出1~9這9個數字的全排列,然後截取成帶分數的3部分,判斷這個帶分數是否等於給定的數即可。 c++有自帶的求全排列的函數next_permu

原创 從零學python必備知識(一、函數+類)(附示例代碼)

文章目錄1、迭代器2、lambda表達式3、內建函數filter,map,reduce,zip4、閉包的定義5、閉包的使用6、裝飾器7、上下文管理器(附異常捕獲)8、模塊的定義9、PEP8編碼規範10、類與實例11、增加類的屬性與

原创 獲取字符串、字符串數組、數組等的長度

簡單來說 strlen()和sizeof() 先放一個例子 char *greeting1 = "hello"; char greeting2[] = {'h', 'e', 'l', 'l', 'o'}; char greeti

原创 NLP學習博客推薦

文章目錄降維方法奇異值分解(SVD)詳解及其應用[SVD 函數介紹](https://blog.csdn.net/mingyuli/article/details/81092795)PCA、SVD、LDA特徵值、特徵向量及降維方法

原创 基於TFIDF實現文本分類,並比較詞集模型與詞袋模型的分類效果

【方法原理】 TF-IDF是一種統計方法,用以評估某一字詞對於一個文件集或一個語料庫的重要程度。字詞的重要性隨着它在文件中出現的次數成正比增加,但同時會隨着它在語料庫中出現的頻率成反比下降。TF-IDF加權的各種形式常被搜索引擎應

原创 從零學python必備知識(三、機器學習庫)(附示例代碼)

文章目錄(一)、函數+類(二)、併發+正則表達式安裝17、Numpy1)數組與數據類型2)數組和標量的計算3)數組的索引和切片18、Pandas1)Series基本操作2)DataFrame基本操作19、Matplotlib1)簡

原创 Pycharm代碼一鍵規範化,符合PEP8編碼規範!

1、pip安裝autopep8 cmd+R打開中端,輸入pip install autopep8: 2、在Pycharm中添加 File->setting->Tools->External tools->點擊上方加號 ->輸入

原创 Python格式化輸出之format

format用法 相對基本格式化輸出採用‘%’的方法,format()功能更強大,該函數把字符串當成一個模板,通過傳入的參數進行格式化,並且使用大括號‘{}’作爲特殊字符代替‘%’ 使用方法由兩種:b.format(a)和form

原创 Ubuntu新手指南--壓縮一個文件夾中所有文件

1、打開要壓縮的文件夾,右鍵終端打開;2、輸入壓縮命令: tar -zcvf 3、輸入輸出的壓縮文件名,例如:ll.tar.gz。然後在後面輸入【*】星號就是所有文件。 4、回車,那麼即可壓縮,當前目錄有個壓縮文件。

原创 Sublime常用快捷鍵及自定義快捷鍵總結

原文鏈接:https://www.douban.com/note/362268947/ 選擇類 Ctrl+D 選中光標所佔的文本,繼續操作則會選中下一個相同的文本。 Alt+F3 選中文