原创 數據挖掘基礎:度量數據的相似性和相異性

數據矩陣(data matrix)或稱對象-屬性結構:這種數據結構用關係表的形式或n×p(n個對象×p個屬性)矩陣存放n個數據對象:  相異性矩陣(dissimilarity matrix)或稱對象-對象結構:存放n個對象兩兩之間

原创 mysqldump

mysqldump備份:mysqldump -u用戶名 -p密碼 -h主機 數據庫 a -w "sql條件" --lock-all-tables > 路徑案例:mysqldump -uroot -p1234 -hlocalhost db1

原创 10步讓你成爲更優秀的程序員

 這篇文章要介紹的,是我作爲專業程序員這些年來學到的能真正提高我的代碼質量和整體工作效率的 10 件事情。   1. 永遠不要複製代碼   不惜任何代價避免重複的代碼。如果一個常用的代碼片段出現在了程序中的幾個不同地方,重構它,把它

原创 ACID、Data Replication、CAP與BASE

原文地址 :http://www.cnblogs.com/hustcat/archive/2010/09/07/1820970.html ACID 在傳數據庫系統中,事務具有ACID 4個屬性(Jim Gray在《事務處理:概念與技

原创 SQL Mode及相關問題

一、Mysql SQL Mode簡介MySQL服務器能夠工作在不同的SQL模式下,並能針對不同的客戶端以不同的方式應用這些模式。這樣,應用程序就能對服務器操作進行量身定製以滿足自己的需求。這類模式定義了MySQL應支持的SQL語法,以及應

原创 數據挖掘基礎:描述性數據彙總

描述性數據彙總 1 中心趨勢度量     分佈式度量 可分佈式計算,如sum,count 代數度量  可通過分佈式計算運算得到,如avg=sum/count,中列數 整體度量  不可分佈式計算,必須整體計算,如中位數median,衆數mo

原创 數據挖掘基礎:相關性檢驗

本文給出兩種相關係數,係數越大說明越相關。你可能會參考另一篇博客獨立性檢驗。 皮爾森相關係數 皮爾森相關係數(Pearson correlation coefficient)也叫皮爾森積差相關係數(Pearson product-mom

原创 JAVA判斷字符串是否爲數字

public static boolean isNumeric(String str){ if(str.matches("\\d*"){return true; }else{return false;}

原创 數據挖掘基礎:屬性

屬性 標稱意味“與名稱相關”。標稱屬性(nominal attribute)的值是一些符號或事物的名稱。每個值代表某種類別、編碼或狀態,因此標稱屬性又被看做是分類的(categorical)。這些值不必具有有意義的序。在計算機科學中,這些

原创 機器學習中的相似性度量

機器學習中的相似性度量 Posted on 2011-03-08 23:42 蒼梧 閱讀(13747) 評論(11) 編輯 收藏   在做分類時常常需要估算不同樣本之間的相似性度量(Similarity Measurement)

原创 20年的老程序員分享所積累的20條編程經驗

從11歲時,我就一直在編程,並且一直都很喜歡技術和編程。這些年來,我積累了一些艱難又容易的經驗。作爲一名程序員,你或許還沒這些經驗,但我會把它們獻給那些想從中學到更多的朋友。 我會持續更新這些經驗,我可能還會有更多的感想,但就我這20

原创 java的繼承與上溯

Java代碼  Java代碼   class Parent {   int i = 1;   String j = "Parent J";   StringBuffer k = new StringBuffer("Pa

原创 lein安裝

linux下很簡單直接在https://github.com/technomancy/leiningen 的bin目錄下有個lein文件,直接chmod +x ;然後運行下就可以了,之後將lein添加到PATH。 --------

原创 爲程序員量身定製的12個目標

對程序員們來說挑戰自我非常重要,要麼不斷創新,要麼技術停滯不前。新年伊始,我整理了 12 個月的目標,每個目標都是對技術或個人能力的挑戰,而且可以年復一年循環使用。 變得有耐心保持健康擁抱變化帶來的不適應學習一門新的編程語言自動化學習更

原创 開發人員的升級

  學習多種編程範式:       用彙編語言寫一個程序       用函數式編程語言寫一個應用               用面嚮對象語言寫一個應用       用基於原型的語言寫一個應用      用邏輯編程語言寫一個