原创 Python圖像處理庫(PIL)--Image,ImageDraw等基本模塊介紹
常用操作 合成 Image.blend(i1,i2,a)/Image.composite(i1,i2,mask) 縮略圖 thumbnail(size,filter=None) Modifies in-place,Preserves
原创 linux內核內存管理中的pagevec結構體
linux內核的內存管理中有一個2.6內核才加入的並不很張揚的結構體,那就是pagevec:struct pagevec { unsigned long nr; unsigned long cold; struct pa
原创 C++ const_cast問題闡述
本文對const_cast進行了更深入的研究. -----------------------------------------------------------------------------------------------
原创 用python爬蟲抓站的一些技巧總結
用得最多的還是各類爬蟲腳本:寫過抓代理本機驗證的腳本,寫過在discuz論壇中自動登錄自動發貼的腳本,寫過自動收郵件的腳本,寫過簡單的驗證碼識別的腳本,本來想寫google music的抓取腳本的,結果有了強大的gmbox,也就不用寫了。
原创 文本去重之SimHash算法
說到文本相似性計算,大家首先想到的應該是使用向量空間模型VSM(Vector Space Model)。使用VSM計算相似度,先對文本進行分詞,然後建立文本向量,把相似度的計算轉換成某種特徵向量距離的計算,比如餘弦角、歐式距離、
原创 Python內建函數用法!
abs() dict() help() min() setattr() all() dir() hex() next() slice() any() divmod() id() obj
原创 R語言爲Hadoop集羣數據統計分析帶來革命性變化
導讀:R現在還可以運行在HBase這種非關係型的數據庫以及面向列的分佈式數據存儲之上。其主要模仿了Google的BigTable。這基本上等同於使用Hadoop來持有結構化數據的數據庫。就像Apache軟件基金會Hadoop項目的子項
原创 selenium範例:python登錄webqq
from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from selenium.webdriver.co
原创 Linux:如何查看一個進程的詳細的啓動時間
ps -A -opid,stime,etime,args 其中: -A: Select all processes. Identical to -e. -o: user-defined format. pid: 列出進程號 stime:
原创 使用 google-perftools 剖析程序性能瓶頸
簡介: google-perftools 是一款優秀的 Linux C/C++ 程序的性能剖析及優化工具,它提供了將目標程序運行時所消耗的 CPU 時間片進行剖析和圖形化輸出剖析結果的功能。本文將從零開始,一步一步引導讀者搭建並運行一個
原创 Linux內核代碼華人貢獻統計
http://www.remword.com/kps_result/ 這個站點對Linux內核代碼補丁進行了詳細的統計,感興趣的童鞋可以看一下。 在這裏給大家看一下2005年4月16日至今各個國家貢獻的補丁統計數據
原创 Cpulimit
目錄 [隱藏] 1 功能2 語法3 補充說明4 參數5 安裝方法6 實例7 相關鏈接 功能 限制一個進程的 CPU 佔用率。 語法 cpulimit TARGET [OPTIONS...] 補充說明 cpulimit用來
原创 Ticket Servers: Distributed Unique Primary Keys on the Cheap
Ticket Servers: Distributed Unique Primary Keys on the Cheap February 8th, 2010 (re-published from the Flickr Co
原创 數據庫分庫分表(sharding)系列
數據庫分庫分表(sharding)系列 作者:黃鈞航 ,發佈於2012-11-22,來源:CSDN 目錄; (一) 拆分實施策略和示例演示 (二) 全局主鍵生成策略 (三) 關於使用框架還是自主開發以及sha
原创 如何使進程運行在後臺
在Linux中,如果要讓進程在後臺運行,一般情況下,我們在命令後面加上&即可,實際上,這樣是將命令放入到一個作業隊列中了: $ ./test.sh & [1] 17208 $ jobs -l [1]+ 17208 Running