原创 Hadoop10大應用案例 & 多個行業(轉載)
生命力旺盛!Hadoop10大應用(含8家潛力企業) 發表於23小時前| 1070次閱讀| 來源gigaom| 2 條評論| 作者Derrick Harris Hadoop大數據行業應用安全 摘要:談到Hadoop應用,爲搜索
原创 FLume NG 開發環境
主要過程及問題 1. 下載Flume NG的source code 2. 安裝Maven 3.* 3. 下載Eclipse 4. 安裝m2eclipse 3和4步遇到的問題: 問題一: Eclipse Indigo 版本, 對應的
原创 Flume NG flume-hdfs-sink 源代碼分析
C1: HDFSEventSink 0. HDFSEventSink.configure() also needs to implement a Configurable interface for processing its own
原创 比較CMS的幾個好資源
純技術出發來創業是很難成功的, 要成功,從放棄技術嘗試學習......。 http://www.cmsmatrix.org/matrix/cms-matrix http://www.rackspace.com/knowledge_c
原创 Hive + Intellicus
Hive + Intellicus是大數據項目很好的BI 方案 準備寫的文章, 標記一下
原创 Hadoop Ecosystem World-Map
Hadoop Ecosystem World-Map Filed under: Advanced computing, Hadoop, Hive, HPC, NoSQL — Tags: Analytics Hive, BI, cou
原创 制定路徑下所有文件裏的目標字符串替換
sed -i "s/categary/category/g" `grep categary -rl ./spec`
原创 深度學習開源框架選型準則和知名框架調研(一)
TensorFlow(GitHub),出身名門谷歌,風姿綽約的功能,並且經過谷歌自己的Gmail和搜索引擎的實戰磨練提升,這樣的深度學習框架熱度第一應該沒有多少異議了。開源之後,谷歌長期支持對打算投入資源的公司和開發者也是個信心
原创 阿里雲服務器異地登錄報警
收到阿里雲服務器的異地登錄的報警後,趕緊看看。服務器馬上要遷移到阿里金融雲,會提高安全級別,但是“近鄉情更怯”,最近老是有不祥的預感,特別是公司融資新聞出來後,各類服務器攻擊明顯增加。 馬上確定一下服務端所有同事都沒有登錄服務器,。 n
原创 linode vpn 搭建
VPN搭建 1、安裝pptpd apt-get install pptpd 2、修改配置文件,主要涉及如下三個文件: /etc/pptpd.conf:將remoteip和localip的註釋去掉即可(建議使用推薦的ip)。 l
原创 secureCRT的中文顯示
1. 查看locale的情況,用命令:locale 2. 修改服務器設置(Ubuntu) /var/lib/locales/supported.d/local文件中添加一行:zh_CN.UTF-8 UTF-8 執行sudo locale
原创 數據挖掘&機器學習
1. 基本概念 (1) 距離算法 http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html 2. 系統實踐 (1) Ruby 實現的簡易推薦系統(譯) http://r
原创 大數據領域的頂級開源工具大集合(轉載)
其實還漏了很多東西,這些工具時沒法搭建起一個平臺的。 大數據領域的頂級開源工具大集合 如今,從小型初創企業到行業巨頭,各種規模的供應商都在使用開源來處理大數據和運行預測分析。本文介紹了一些大數據方面的頂級開源工具,分爲四個領
原创 優雅地結束 nohup 程序 like Ctrl C
優雅地結束 nohup 程序 like Ctrl C如何像ctrl c 殺死進程 kill linux 後臺進程[ec2-user@aws- ~]$ ps -ef|grep OKBec2-user 24681 1 0 6月14
原创 PyCharm 導入lib包時包和類都顯示Unresolved reference 的問題
pycharm 包和類,都顯示 unresolved reference1,PyCharm->Preferences->Build,Excution,Deployment->Console->Python Console勾選上Add so