原创 mysql replication 基本原理

1、複製進程 Mysql的複製(Replication)是一個異步的複製,從一個Mysql instace(稱之爲Master)複製到另一個Mysql instance(稱之Slave)。實現整個複製操作主要由三個進程完成的,其中兩個進

原创 Hive調研

Hive是什麼 Hive是基於Hadoop構建的一套數據倉庫分析系統,它提供了豐富的SQL查詢方式來分析存儲在Hadoop 分佈式文件系統中的數據。Hive可以將結構化的數據存儲在數據倉庫中,通過自己的SQL去查詢分析需要的內容,這套SQ

原创 Coursera公開課筆記: 斯坦福大學機器學習第六課“邏輯迴歸(Logistic Regression)”

斯坦福大學機器學習第六課"邏輯迴歸“學習筆記,本次課程主要包括7部分: 1) Classification(分類) 2) Hypothesis Representation 3) Decision boundary(決策邊界) 4) Co

原创 Coursera公開課筆記: 斯坦福大學機器學習第四課“多變量線性迴歸(Linear Regression with Multiple Variables)”

斯坦福大學機器學習第四課"多變量線性迴歸“學習筆記,本次課程主要包括7部分: 1) Multiple features(多維特徵) 2) Gradient descent for multiple variables(梯度下降在多變量線性

原创 Coursera公開課筆記: 斯坦福大學機器學習第二課“單變量線性迴歸(Linear regression with one variable)”

斯坦福大學機器學習第二課"單變量線性迴歸“學習筆記,本次課程主要包括7部分: 1) Model representation(模型表示) 2) Cost function(代價函數,成本函數) 3) Cost function i

原创 求逆序對數

設A[1..n]是一個包含N個非負整數的數組。如果在i〈 j的情況下,有A〉A[j],則(i,j)就稱爲A中的一個逆序對。 例如,數組(3,1,4,5,2)的“逆序對”有<3,1>,<3,2><4,2><5,2>,共4個。 使用歸併排序

原创 crontab中的環境變量問題

大家都知道crontab是個好東東,可以定時執行一些任務,幫助你監控系統狀況,幫助你每天重複的做一些機械的事情。但是crontab有一個壞毛病,就是它總是不會缺省的從用戶profile文件中讀取環境變量參數,經常導致在手工執行某個腳本時

原创 C中的字符串拷貝問題

1.爲什麼用strlcpy而不是strcpy、strncpy   strcpy 函數原型: #include <string.h> char *strcpy(char *dest, constchar *src); 功能:把字符串src中

原创 Git 少用 Pull 多用 Fetch 和 Merge

本文有點長而且有點亂,但就像Mark Twain Blaise Pascal的笑話裏說的那樣:我沒有時間讓它更短些。在Git的郵件列表裏有很多關於本文的討論,我會盡量把其中相關的觀點列在下面。 我最常說的關於git使用的一個經驗

原创 用python爬蟲抓站的一些技巧總結

學用python也有3個多月了,用得最多的還是各類爬蟲腳本:寫過抓代理本機驗證的腳本,寫過在discuz論壇中自動登錄自動發貼的腳本,寫過自動收郵件的腳本,寫過簡單的驗證碼識別的腳本,本來想寫google music的抓取腳本的,結果有了

原创 搭建coreseek(sphinx+mmseg3)詳細安裝配置+php之sphinx擴展安裝+php調用示例

搭建coreseek(sphinx+mmseg3)安裝 [第一步] 先安裝mmseg3 [plain] view plaincopyprint? cd /var/install   wget http://www

原创 邏輯迴歸(logistic regression)

  轉:http://blog.csdn.net/houlaizhexq/article/details/27862973 logistic regression可以解決分類問題,即輸出的結果只有0和1兩種,比如,對於郵件的判斷只有是

原创 常見面試之機器學習算法思想簡單梳理

前言:   找工作時(IT行業),除了常見的軟件開發以外,機器學習崗位也可以當作是一個選擇,不少計算機方向的研究生都會接觸這個,如果你的研究方向是機器學習/數據挖掘之類,且又對其非常感興趣的話,可以考慮考慮該崗位,畢竟在機器智能

原创 網絡編程常見問題

Block IO & Non-Block IO [cpp] view plaincopy //fcntl函數可以將一個socket句柄設置成非阻塞模式   flags = fcntl(sockfd, F_GETFL, 

原创 數據挖掘工程師筆試及答案整理

2013百度校園招聘數據挖掘工程師 一、簡答題(30分)1、簡述數據庫操作的步驟(10分) 步驟:建立數據庫連接、打開數據庫連接、建立數據庫命令、運行數據庫命令、保存數據庫命令、關閉數據庫連接。 經萍萍提醒,瞭解到應該把prepa