原创 Bitonic Sort

Abstract Continuing a tutorial on sorting algorithms, this page animates bitonic sort. Author Thomas W. Christopher

原创 光線跟蹤的 GPU 程序解讀

  《CUDA by example》 中的第六章講解了在 GPU 上實現光線跟蹤的一個例子,旨在介紹常量內存(constant memory)和事件,下面給出這個例子的詳細解讀(http://code2.us/2012/02/cuda

原创 mahout0.9 編寫簡單kmeans示例

網上找了很久,發現大多數的帖子裏用的mahout的版本都比較低,摸索了半天終於搞出來了,在此mark一下,直接上代碼: import org.apache.hadoop.conf.Configuration; import org.ap

原创 linux下常用指令(centos6、hadoop2.2和一些其他的technique)

前段時間搭建hadoop集羣做一些東西,積累了很多指令和一些調試經驗,怕以後忘記,在這裏做個備份,如果對大家有用,that's fine! root 賬戶管理 su ->輸入密碼($->#) exit->exit->退出終端 安裝中文輸

原创 學習log4j配置文件

1.      log4j: Log4j是Apache的一個開放源代碼項目,通過使用Log4j,我們可以控制日誌信息輸送的目的地是控制檯、文件、GUI組件、甚至是套接口服務器、NT的事件記錄器、UNIX Syslog守護進程等;我們也可以

原创 Windows下部署/配置/調試hadoop2.2

首先,說下原文出處(這位博主很厲害):http://winse.github.io/blog/2014/04/12/hadoop2-windows-startguide/ Windows作爲開發屌絲必備,在windows上如何跑

原创 Lucene的多種高級搜索形式

布爾操作符 大多數的搜索引擎都會提供布爾操作符讓用戶可以組合查詢,典型的布爾操作符有 AND, OR, NOT。Lucene 支持 5種布爾操作符,分別是 AND, OR, NOT, 加(+), 減(-)。接下來我會講述每個操作符的

原创 Eclipse安裝Maven插件

1.工具下載: Eclipse4.2 jee版本(這裏使用最新的Eclipse版本,3.7以上版本按照以下步驟都可以) 下載地址:http://www.eclipse.org/downloads/download.php?file=/

原创 Java調用命令行/啓動notepad

Java啓動命令行,其實非常簡單,只要你知道Windows的命令行,然後直接用 Runtime.getRuntime().exec();就可以執行命

原创 mahout將數據轉化成序列化文件、稀疏向量

對於文本信息的向量化,Mahout 已經提供了工具類,它基於 Lucene 給出了對文本信息進行分析,然後創建文本向量。mahout提供下面兩個命令來將文本轉成向量形式(轉化成向量後可以聚類): 1.mahout seqdirector

原创 CUDA 編程入門

1. CUDA 簡介         GPU (Graphic Processing Unit) 是圖形處理單元的簡稱,最初主要用於圖形渲染。自九十年代開始,GPU 的發展產生了較大的變化,NVIDIA、AMD(ATI) 等 GP

原创 JAVA文檔註釋小結

原文:http://lumanman5.blog.163.com/blog/static/1892883232010102402128751/ 目錄1 常用Java註釋標籤(Java comment tags)@author  作者@pa

原创 Paoding Analyzer

je分詞用lucene.中文分詞庖丁解牛 一般使用 使用評估 參考資料 下載 開始使用 分詞策略 效果體驗  在命令行模式下執行analyzer.bat(windows)或analyzer.sh(linux)即可

原创 hadoop2.2+mahout0.9實戰

版本:hadoop2.2.0,mahout0.9。 使用mahout的org.apache.mahout.cf.taste.hadoop.item.RecommenderJob進行測試。 首先說明下,如果使用官網提供的下載ha

原创 如何理解 CUDA 中的 cudaMalloc() 的參數

運行時函數的原型: cudaError_t cudaMalloc (void **devPtr, size_t  size );    此函數返回值是 CUDA 中定義的一個錯誤代碼。 主要是第一個參數。爲什麼是兩