原创 Hadoop10大應用案例 & 多個行業(轉載)

生命力旺盛!Hadoop10大應用(含8家潛力企業) 發表於23小時前| 1070次閱讀| 來源gigaom| 2 條評論| 作者Derrick Harris Hadoop大數據行業應用安全 摘要:談到Hadoop應用,爲搜索

原创 FLume NG 開發環境

主要過程及問題 1. 下載Flume NG的source code 2. 安裝Maven 3.* 3. 下載Eclipse 4. 安裝m2eclipse 3和4步遇到的問題: 問題一:  Eclipse Indigo 版本, 對應的

原创 Flume NG flume-hdfs-sink 源代碼分析

C1: HDFSEventSink 0. HDFSEventSink.configure() also needs to implement a Configurable interface for processing its own

原创 比較CMS的幾個好資源

純技術出發來創業是很難成功的,  要成功,從放棄技術嘗試學習......。  http://www.cmsmatrix.org/matrix/cms-matrix http://www.rackspace.com/knowledge_c

原创 Hive + Intellicus

Hive + Intellicus是大數據項目很好的BI 方案 準備寫的文章, 標記一下

原创 Hadoop Ecosystem World-Map

Hadoop Ecosystem World-Map Filed under: Advanced computing, Hadoop, Hive, HPC, NoSQL — Tags: Analytics Hive, BI, cou

原创 制定路徑下所有文件裏的目標字符串替換

sed -i "s/categary/category/g" `grep categary -rl ./spec`

原创 深度學習開源框架選型準則和知名框架調研(一)

TensorFlow(GitHub),出身名門谷歌,風姿綽約的功能,並且經過谷歌自己的Gmail和搜索引擎的實戰磨練提升,這樣的深度學習框架熱度第一應該沒有多少異議了。開源之後,谷歌長期支持對打算投入資源的公司和開發者也是個信心

原创 阿里雲服務器異地登錄報警

收到阿里雲服務器的異地登錄的報警後,趕緊看看。服務器馬上要遷移到阿里金融雲,會提高安全級別,但是“近鄉情更怯”,最近老是有不祥的預感,特別是公司融資新聞出來後,各類服務器攻擊明顯增加。 馬上確定一下服務端所有同事都沒有登錄服務器,。 n

原创 linode vpn 搭建

VPN搭建 1、安裝pptpd apt-get install pptpd 2、修改配置文件,主要涉及如下三個文件: /etc/pptpd.conf:將remoteip和localip的註釋去掉即可(建議使用推薦的ip)。 l

原创 secureCRT的中文顯示

1. 查看locale的情況,用命令:locale  2. 修改服務器設置(Ubuntu) /var/lib/locales/supported.d/local文件中添加一行:zh_CN.UTF-8 UTF-8 執行sudo locale

原创 數據挖掘&機器學習

1. 基本概念 (1) 距離算法 http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html 2.  系統實踐 (1) Ruby 實現的簡易推薦系統(譯) http://r

原创 大數據領域的頂級開源工具大集合(轉載)

其實還漏了很多東西,這些工具時沒法搭建起一個平臺的。 大數據領域的頂級開源工具大集合 如今,從小型初創企業到行業巨頭,各種規模的供應商都在使用開源來處理大數據和運行預測分析。本文介紹了一些大數據方面的頂級開源工具,分爲四個領

原创 優雅地結束 nohup 程序 like Ctrl C

優雅地結束 nohup 程序 like Ctrl C如何像ctrl c 殺死進程 kill linux 後臺進程[ec2-user@aws- ~]$ ps -ef|grep OKBec2-user 24681     1  0 6月14

原创 PyCharm 導入lib包時包和類都顯示Unresolved reference 的問題

pycharm 包和類,都顯示 unresolved reference1,PyCharm->Preferences->Build,Excution,Deployment->Console->Python Console勾選上Add so