原创 利用SVC(Support Vector Classifier)對digits數據進行分類

from sklearn.datasets import load_digits from sklearn.cross_validation imp

原创 利用KNC對iris數據進行分裂及預測

from sklearn.datasets import load_iris from sklearn.cross_validation impor

原创 使用LogisticRegression和SGDClassifier對良/惡性腫瘤進行分類,並計算出準確率召回率和F1的值

# -*- coding: utf-8 -*- """ Created on Tue Oct 24 10:08:40 2017 @author: l

原创 如何在去掉空數據及如何在matplotlib中顯示數據線性擬合

import numpy as np import scipy as sp import matplotlib.pyplot as plt def

原创 利用貝葉斯分類器對fetch_20newsgroups數據集進行分類

from sklearn.datasets import fetch_20newsgroups from sklearn.cross_validat

原创 對良/惡性腫瘤的預測python代碼實現

import pandas as pd import matplotlib.pyplot as plt import numpy as np fro

原创 Word中MathType不能正常使用解決方法

本人使用的是word2010+MathType,可以正常使用了。 首先介紹下,本人首先使用的word2007,然後裝mathtype6.9,裝上以後發現,公式編號啥的都不能使用(灰色的),然後自己鼓搗半天,廢了半天勁,網上找各種解決方法,

原创 利用鳶尾花數據,解釋並不是特徵越多越好

#首先導入我們需要的包from sklearn import datasetsimport numpy as npfrom sklearn.cross_validation import train_test_splitfrom skle

原创 Linux常用命令

1.Linux中用戶切換命令:su 用戶名 回車以後輸入用戶名對應的密碼即可如果先要切換到Root用戶可以使用:su - 然後回車即可(需要輸入root密碼)由root用戶到其他用戶可以直接su 用戶名即可(無需輸入密碼)2.常用命令:

原创 使用CountVectorizer和TfidfVectorizer對fetch_20newsgroups數據進行分類,並對是否使用停用詞進行對比(精確度)

from sklearn.datasets import fetch_20newsgroups from sklearn.cross_validation import train_test_split

原创 Anaconda如何安裝包

       如果安裝Anaconda,大家會發現很多包已經安裝好了,但是如果我們想要安裝新包,我們會發現pip install 包名無法安裝,或者安裝以後無法使用。 接下來,跟上腳步,本人自己親測: 1.找到如圖所示的         

原创 python 3.x 結巴(jieba)分詞基礎知識

# -*- coding: utf-8 -*- from __future__ import unicode_literals import sys sys.path.append("../") impo

原创 利用隨機森林和梯度替身決策樹對titanic數據進行分類,並對結果進行分析

import pandas as pd from sklearn.cross_validation import train_test_split from sklearn.feature_extract

原创 K近鄰迴歸模型對Boston房價進行預測,同時對性能進行評估(1.使用普通的算術平均法2.考慮距離差異進行加權平均)

from sklearn.datasets import load_boston from sklearn.cross_validation import train_test_split from sk

原创 python3.x正則表達式的含義及使用

import re import nltk #正則表達式 wordlist = [w for w in nltk.corpus.words.words('en') if w.islower()] prin