原创 中文編碼問題:raw_input輸入、文件讀取、變量比較等str、unicode、utf-8轉換問題

http://blog.csdn.net/eastmount/article/details/48841593

原创 Pandas模塊1

常用的兩個數據結構:Serious和DataFrame Serious:表示一維數組 #! /user/bin/env python #encoding=utf-8 __author__ = 'chw' import panda

原创 百度賬號登陸

#! /user/bin/env python #encoding=utf-8 __author__ = 'chw' import urllib2 import urllib import cookielib import re

原创 python編寫PSO算法

關鍵在於賦值的關係: 淺賦值:對原來的引用 深度賦值:纔是對值影響 #! /user/bin/env python #encoding=utf-8 __author__ = 'chw' import time import n

原创 selenium抓取四六級成績

#! /user/bin/env python #encoding=utf-8 from selenium import webdriver drive=webdriver.PhantomJS('C:\Anaconda2\Scri

原创 Pandas模塊2

#! /user/bin/env python #encoding=utf-8 __author__ = 'chw' from pandas import Series,DataFrame import pandas as pd

原创 數據庫必會的知識

參考文獻:http://blog.csdn.net/javazejian/article/details/61614366

原创 聚類總結

K-Means, K-Medoids, GMM(高斯混合模型), Spectral clustering(譜聚類),Ncut 參考:http://blog.csdn.net/abcjennifer/article/details/

原创 xpath抓取代理IP並檢測IP的有效性

#coding:utf-8 import urllib import urllib2 import requests import time from bs4 import BeautifulSoup from lxml impo

原创 SMO計算思路

簡化版SMO算法 和座標上升法的思想類似,SMO算法也想每次只更新一個變量,但是很可惜, 上式限定了,當固定其他所有參數,那麼α1上也是個定值,變不了;因此不得不將多增加一個αi,這樣α1才能變動,關於αi的選擇,有啓發式方

原创 sklearn學習

參考文獻:http://www.cnblogs.com/jasonfreak/p/5448385.html http://blog.csdn.net/wangpei1949/article/details/52904521

原创 ...weights already exists, disallowed. Did you mean to set reuse=True...(解決辦法)

model.inference(train_batch, BATCH_SIZE, N_CLASSES)這個裏面應該有with tf.variable_scope(‘layer1’):這樣的代碼,改爲with tf.variable

原创 lxml教程

首先考慮3個問題: 1:有一個XML文件,如何解析 2:解析後,如果查找、定位某個標籤 3:定位後如何操作標籤,比如訪問屬性、文本內容等 首先導入:from lxml import etree Element類 El

原创 知乎賬號登錄+驗證碼

#! /user/bin/env python #encoding=utf-8 __author__ = 'chw' import re # from urllib import parse, request import coo

原创 AdaBoost、GBDT、XGBoost處理迴歸問題及分類問題

1、迴歸問題 1.1 AdaBoost(建立一顆串行的樹) AdaBoost,是英文"Adaptive Boosting"(自適應增強)的縮寫,由Yoav Freund和Robert Schapire在1995年提出。它的自適應在