原创 Python正則表達式操作指南
本文是通過Python的 re 模塊來使用正則表達式的一個入門教程,和庫參考手冊的對應章節相比,更爲淺顯易懂、循序漸進。 本文可以從 http://www.amk.ca/python/howto 捕獲 目錄 目錄 [隱藏]
原创 使用mechanize和Beautiful Soup輕鬆收集Web數據
使用基本的 Python 模塊,可以 編寫腳本來與 Web 站點交互,但是如果沒有必要的話,那麼您就不希望這樣做。Python 2.x 中的模塊 urllib 和 urllib2,以及 Python 3.0 中的統一的 urllib.*
原创 python 實例一則
經過一天的研究python,寫了一則例子出來,順便經驗總結一下 google招聘的時候有一則就是python程序員,使用後發現作爲腳本的語言雖然有些地方跟傳統的c,java相悖,但是仍然有很強大的功能,各種樣式的庫支持。我自己的理解就是作
原创 自制爬蟲例--抓取網站圖像與簡介
#編碼格式要求爲utf-8 #coding=UTF-8 #urllib解析網站內容 import urllib2 #soup是特別好使的html解析器 from BeautifulSoup import * #開站,讀內容 c=url
原创 python時間轉爲時間戳
import datetime import time s=datetime.datetime(2009,3,20,10,15,55) time=time.mktime(s.timetuple()) print time 別外付一個
原创 異步消息httpsqs 安裝與配置
HTTPSQS 具有以下特徵: ● 非常簡單,基於 HTTP GET/POST 協議。PHP、Java、Perl、Shell、Python、Ruby等支持HTTP協議的編程語言均可調用。 ● 非常快速,入隊列、出隊列速度超過10000次
原创 MySQL中UNION
在數據庫中,UNION和UNION ALL關鍵字都是將兩個結果集合併爲一個,但這兩者從使用和效率上來說都有所不同。 MySQL中的UNION UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重
原创 正確理解 clear:both
要注意以下幾點: 1、 浮動元素會被自動設置成塊級元素,相當於給元素設置了display:block(塊級元素能設置寬和高,而行內元素則不可以)。 2、 浮動元素後邊的非浮動元素顯示問題。 3、 多個浮動方向一致的元素使用流式排
原创 Beautiful soup 中文文檔站
Beautiful Soup Site CN: http://www.crummy.com/software/BeautifulSoup/documentation.zh.html EN: http://www.crummy.com/
原创 Django+python+BeautifulSoup垂直搜索爬蟲
使用python+BeautifulSoup完成爬蟲抓取特定數據的工作,並使用Django搭建一個管理平臺,用來協調抓取工作。 因爲自己很喜歡Django admin後臺,所以這次用這個後臺對抓取到的鏈接進行管理,使我的爬蟲可以應對各種後
原创 用python爬蟲抓站的一些技巧總結
用python爬蟲抓站的一些技巧總結 zz 學用python也有3個多月了,用得最多的還是各類爬蟲腳本:寫過抓代理本機驗證的腳本,寫過在discuz論壇中自動登錄自動發貼的腳本,寫過自動收郵件的腳本,寫過簡單的驗證碼識別的腳本,本來想
原创 我的友情鏈接
51CTO博客開發
原创 關於自動補全功能的理解
自己研究的是jquery下的autocomplete 先推幾個網站 1.jQuery UI: http://jqueryui.com/ 2.jQuery plugin: http://bassistance.de/jquery-plugi
原创 百萬級PHP站點Poppen.de的技術架構
Facebook無疑是現在世界上最大的PHP站點,關於Facebook的技術架構可以在網上搜索到很多資料,今天我們來了解另外一個百萬級PHP站點的網站架構:Poppen.de。 Poppen.de是德國的一家交友/ 聊天/ 視頻 的SNS網
原创 python 讀取excel中的數據
應爲工作的原因有所接觸python,學習過程中找了點有用的東東,分享一下 使用xlrd包,它可以運行在所有的平臺上。 Windows下載鏈接: http://download.csdn.net/detail/qianminming