原创 Python圖像處理庫(PIL)--Image,ImageDraw等基本模塊介紹

常用操作 合成 Image.blend(i1,i2,a)/Image.composite(i1,i2,mask) 縮略圖 thumbnail(size,filter=None)  Modifies in-place,Preserves

原创 linux內核內存管理中的pagevec結構體

linux內核的內存管理中有一個2.6內核才加入的並不很張揚的結構體,那就是pagevec:struct pagevec {    unsigned long nr;    unsigned long cold;    struct pa

原创 C++ const_cast問題闡述

本文對const_cast進行了更深入的研究. -----------------------------------------------------------------------------------------------

原创 用python爬蟲抓站的一些技巧總結

用得最多的還是各類爬蟲腳本:寫過抓代理本機驗證的腳本,寫過在discuz論壇中自動登錄自動發貼的腳本,寫過自動收郵件的腳本,寫過簡單的驗證碼識別的腳本,本來想寫google music的抓取腳本的,結果有了強大的gmbox,也就不用寫了。

原创 文本去重之SimHash算法

    說到文本相似性計算,大家首先想到的應該是使用向量空間模型VSM(Vector Space Model)。使用VSM計算相似度,先對文本進行分詞,然後建立文本向量,把相似度的計算轉換成某種特徵向量距離的計算,比如餘弦角、歐式距離、

原创 Python內建函數用法!

abs() dict() help() min() setattr() all() dir() hex() next() slice() any() divmod() id() obj

原创 R語言爲Hadoop集羣數據統計分析帶來革命性變化

導讀:R現在還可以運行在HBase這種非關係型的數據庫以及面向列的分佈式數據存儲之上。其主要模仿了Google的BigTable。這基本上等同於使用Hadoop來持有結構化數據的數據庫。就像Apache軟件基金會Hadoop項目的子項

原创 selenium範例:python登錄webqq

from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from selenium.webdriver.co

原创 Linux:如何查看一個進程的詳細的啓動時間

ps -A -opid,stime,etime,args  其中: -A: Select all processes. Identical to -e. -o: user-defined format. pid: 列出進程號 stime:

原创 使用 google-perftools 剖析程序性能瓶頸

簡介: google-perftools 是一款優秀的 Linux C/C++ 程序的性能剖析及優化工具,它提供了將目標程序運行時所消耗的 CPU 時間片進行剖析和圖形化輸出剖析結果的功能。本文將從零開始,一步一步引導讀者搭建並運行一個

原创 Linux內核代碼華人貢獻統計

    http://www.remword.com/kps_result/ 這個站點對Linux內核代碼補丁進行了詳細的統計,感興趣的童鞋可以看一下。     在這裏給大家看一下2005年4月16日至今各個國家貢獻的補丁統計數據

原创 Cpulimit

目錄  [隱藏]  1 功能2 語法3 補充說明4 參數5 安裝方法6 實例7 相關鏈接 功能 限制一個進程的 CPU 佔用率。 語法 cpulimit TARGET [OPTIONS...] 補充說明 cpulimit用來

原创 Ticket Servers: Distributed Unique Primary Keys on the Cheap

Ticket Servers: Distributed Unique Primary Keys on the Cheap February 8th, 2010 (re-published from the Flickr Co

原创 數據庫分庫分表(sharding)系列

數據庫分庫分表(sharding)系列   作者:黃鈞航 ,發佈於2012-11-22,來源:CSDN   目錄; (一) 拆分實施策略和示例演示 (二) 全局主鍵生成策略 (三) 關於使用框架還是自主開發以及sha

原创 如何使進程運行在後臺

在Linux中,如果要讓進程在後臺運行,一般情況下,我們在命令後面加上&即可,實際上,這樣是將命令放入到一個作業隊列中了: $ ./test.sh & [1] 17208 $ jobs -l [1]+ 17208 Running