原创 Python正則表達式操作指南

 本文是通過Python的 re 模塊來使用正則表達式的一個入門教程,和庫參考手冊的對應章節相比,更爲淺顯易懂、循序漸進。   本文可以從 http://www.amk.ca/python/howto 捕獲   目錄   目錄 [隱藏]

原创 使用mechanize和Beautiful Soup輕鬆收集Web數據

 使用基本的 Python 模塊,可以 編寫腳本來與 Web 站點交互,但是如果沒有必要的話,那麼您就不希望這樣做。Python 2.x 中的模塊 urllib 和 urllib2,以及 Python 3.0 中的統一的 urllib.* 

原创 python 實例一則

 經過一天的研究python,寫了一則例子出來,順便經驗總結一下 google招聘的時候有一則就是python程序員,使用後發現作爲腳本的語言雖然有些地方跟傳統的c,java相悖,但是仍然有很強大的功能,各種樣式的庫支持。我自己的理解就是作

原创 自制爬蟲例--抓取網站圖像與簡介

 #編碼格式要求爲utf-8 #coding=UTF-8 #urllib解析網站內容 import urllib2 #soup是特別好使的html解析器 from BeautifulSoup import *   #開站,讀內容 c=url

原创 python時間轉爲時間戳

 import datetime import time s=datetime.datetime(2009,3,20,10,15,55) time=time.mktime(s.timetuple()) print time 別外付一個

原创 異步消息httpsqs 安裝與配置

 HTTPSQS 具有以下特徵: ● 非常簡單,基於 HTTP GET/POST 協議。PHP、Java、Perl、Shell、Python、Ruby等支持HTTP協議的編程語言均可調用。 ● 非常快速,入隊列、出隊列速度超過10000次

原创 MySQL中UNION

 在數據庫中,UNION和UNION ALL關鍵字都是將兩個結果集合併爲一個,但這兩者從使用和效率上來說都有所不同。 MySQL中的UNION UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重

原创 正確理解 clear:both

 要注意以下幾點:  1、 浮動元素會被自動設置成塊級元素,相當於給元素設置了display:block(塊級元素能設置寬和高,而行內元素則不可以)。  2、 浮動元素後邊的非浮動元素顯示問題。  3、 多個浮動方向一致的元素使用流式排

原创 Beautiful soup 中文文檔站

  Beautiful Soup Site CN:  http://www.crummy.com/software/BeautifulSoup/documentation.zh.html EN: http://www.crummy.com/

原创 Django+python+BeautifulSoup垂直搜索爬蟲

 使用python+BeautifulSoup完成爬蟲抓取特定數據的工作,並使用Django搭建一個管理平臺,用來協調抓取工作。 因爲自己很喜歡Django admin後臺,所以這次用這個後臺對抓取到的鏈接進行管理,使我的爬蟲可以應對各種後

原创 用python爬蟲抓站的一些技巧總結

用python爬蟲抓站的一些技巧總結 zz   學用python也有3個多月了,用得最多的還是各類爬蟲腳本:寫過抓代理本機驗證的腳本,寫過在discuz論壇中自動登錄自動發貼的腳本,寫過自動收郵件的腳本,寫過簡單的驗證碼識別的腳本,本來想

原创 我的友情鏈接

51CTO博客開發

原创 關於自動補全功能的理解

 自己研究的是jquery下的autocomplete 先推幾個網站 1.jQuery UI: http://jqueryui.com/ 2.jQuery plugin: http://bassistance.de/jquery-plugi

原创 百萬級PHP站點Poppen.de的技術架構

Facebook無疑是現在世界上最大的PHP站點,關於Facebook的技術架構可以在網上搜索到很多資料,今天我們來了解另外一個百萬級PHP站點的網站架構:Poppen.de。 Poppen.de是德國的一家交友/ 聊天/ 視頻 的SNS網

原创 python 讀取excel中的數據

  應爲工作的原因有所接觸python,學習過程中找了點有用的東東,分享一下   使用xlrd包,它可以運行在所有的平臺上。 Windows下載鏈接: http://download.csdn.net/detail/qianminming