原创 Generating Random Variables from Distributions

  Generating Random Variables from Distributions General Methods for Continuous Distributions Transformation : on

原创 Linux - Grep 命令

grep 時使用最廣泛的命令之一,用來對文本文件內榮按行進行模式匹配查找。啊如果找到匹配模式的行, grep 將打印包含模式的行。 Grep 有三種變形: Grep :標準 grep 命令主要討論此格式。

原创 終於完成搬家,可以自娛自樂到底

雖然wordpress的後臺控制很豐富,實在忍受不了國內的訪問速度。正好解決了micolog導入的問題,終於把這兒的文檔全部更顯到了google上,新的地址 http://ad-research.appspot.com 。以後主要在這

原创 Linux - Awk 用法

0. Awk 有三個不同的版本 awk,nawk 和 gawk ,未作特別說明,一般指 gawk 。 1. Awk 語言的最基本功能是在文件或字符串中基於指定的規則來分解抽取信息,也可以基於指

原创 Hadoop Streaming和Pipes理解

原始問題的引出見:http://bbs.hadoopor.com/viewthread.php?tid=542 在論壇裏搜索了下,發現了兩篇利用C/C++編寫mapreduce的文章.如下: http://bbs.hadoopor.

原创 Kappa Statistic

Kappa statistic 這個指標用於評判分類器的分類結果與隨機分類的差異度。(Kappa is a measure of agreement normalized for chance agreement.)          P

原创 Hashtable和HashMap

Hashtable是Dictionary的子類,HashMap是Map接口的一個實現類。 自 Java 2 平臺 v1.2 以來,Hashtable類已經改進爲可以實現 Map,因此它變成了 Java Collections Frame

原创 GAE部署時urllib2.py錯誤解決辦法

Google App Engine Launcher出問題,點擊 Deploy 後卻發現不能正常工作啦,囧啊,報的錯誤如下:  2010-06-16 16:32:27,427 ERROR appcfg.py:1568 An unexpec

原创 企業郵箱被反垃圾郵件聯盟封了的方法

企業郵箱被反垃圾郵件聯盟封了的方法 當郵件發送方服務器的IP被國際反垃圾郵件組織屏蔽後解除封鎖的步驟首先要做的事: 1、所做測試均在問題服務器上進行。 2、確認問題服務器的IP(或整個IP段)不在SBL、RBL、CBL中     

原创 urllib.error.URLError urlopen error unknown url type: https

出現以上的問題,是因爲 Python沒有安裝SSL模塊,需要和從新編譯安裝python,即可。 安裝openssl,openssl-devel yum install openssl yum install openssl-deve

原创 IE9 常用快捷方式

IE9 Beta2試用了下,確實感覺速度超過firefox,尤其討厭firefox第一次啓動的時候真是慢。   順便記錄下幾個快捷鍵,唯一遺憾的是沒有 Vimperator Ctrl+L/Alt+D 直接將光標轉到地址欄 Ctrl+E

原创 Numerical Example of K-Means Clustering

The basic step of k-means clustering is simple. In the beginning we determine number of cluster K and we assume the cen

原创 HDFS 簡介

一、HDFS HDFS全稱是Hadoop Distributed System。HDFS是爲以流的方式存取大文件而設計的。適用於幾百MB,GB以及TB,並寫一次讀多次的場合。而對於低延時數據訪問、大量小文件、同時寫和任意的文件修改,則並不

原创 The Efficiency of AWK Associative Array

僅做參考,轉自:http://cxwangyi.blogspot.com/2010/05/efficiency-of-awk-associative-array.html I did a little experiment compari

原创 Memory Footprinting Using “top”

轉自:http://cxwangyi.wordpress.com/2010/10/14/memory-footprinting-using-top/ 王流斌教我的辦法: 一種監控進程內存使用方法:top -b -n 30 -d 1 |