原创 洗牌算法和隨機數生成

【題目】 要求輸入一組數據,輸出的結果爲這組數據的隨機排列。 【解題思路】 1.      調用頭文件algorithms中的random_shuffle函數。該函數的本質就是生成隨機位置,不斷交換,使得數據重新排列。 2.      產

原创 R語言與機器學習學習筆記(分類算法)(6)logistic迴歸

邏輯迴歸研究因變量Y爲分類變量與多個自變量X之間的迴歸問題。隨機變量X的取值爲實數,隨機變量Y的取值爲1或0。常用於預測某隨機事件發生概率的大小。 Logistic迴歸問題的最優化問題可以表述爲: 尋找一個非線性函數Sigmoid的

原创 R語言與機器學習學習筆記(分類算法)(5)神經網絡

算法五:神經網絡(優化算法) 人工神經網絡(ANN),簡稱神經網絡,是一種模仿生物神經網絡的結構和功能的數學模型或計算模型。神經網絡由大量的人工神經元聯結進行計算。大多數情況下人工神經網絡能在外界信息的基礎上改變內部結構,是一種自適應系

原创 R語言與機器學習學習筆記(分類算法)(4)支持向量機

算法四:支持向量機 說到支持向量機,必須要提到july大神的《支持向量機通俗導論》,個人感覺再怎麼寫也不可能寫得比他更好的了。這也正如青蓮居士見到崔顥的黃鶴樓後也只能嘆“此處有景道不得”。不過我還是打算寫寫SVM的基本想法與libSVM

原创 lintcode178. graph valid tree 圖是否是樹

【題目】 給出 n 個節點,標號分別從 0 到 n - 1 並且給出一個 無向 邊的列表 (給出每條邊的兩個頂點), 寫一個函數去判斷這張`無向`圖是否是一棵樹 假設我們不會給出重複的邊在邊的列表當中. 無向邊 [0, 1] 和 [1,

原创 從關係型數據庫到非關係型數據庫

轉自:http://blog.csdn.net/xuanjiewu/article/details/48241045 1. 關係型數據庫 關係數據庫是採用關係模型作爲數據組織方式的數據庫。關係數據庫的特點在於它將每個具有相同屬性的數

原创 R語言與分類算法的績效評估

關於分類算法我們之前也討論過了KNN、決策樹、naivebayes、SVM、ANN、logistic迴歸。關於這麼多的分類算法,我們自然需要考慮誰的表現更加的優秀。 既然要對分類算法進行評價,那麼我們自然得有評價依據。到目前爲止

原创 R學習筆記——wordcloud包製作詞雲圖

一、.wordcloud包的函數介紹 1.wordcloud函數用於製作常規的詞雲圖 wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TR

原创 基於距離的聚類方法--K-means

確定k個劃分達到平方誤差最小。適用於發現凸面形狀的簇,簇與簇之間區別較明顯,且簇大小相近。 【優點】 算法快速,簡單;對大數據集有較高的效率並且可伸縮;時間複雜度爲O(n*k*t), 其中t是迭代次數,接近於線性,並且適合挖掘大規模數據

原创 Java數據類型轉換

http://blog.sina.com.cn/s/blog_5e9f4ac60100dfh7.html 1.  數據類型轉換的種類 java數據類型的轉換一般分三種,分別是: (1) 簡單數據類型之間的轉換 (2) 字符串與其它數據類

原创 進程線程相關

【進程和線程的區別】 進程是計算機中的程序關於某數據集合上的一次運行活動,是系統進行資源分配和調度的基本單位,是操作系統結構的基礎。 線程是進程的一個實體,是CPU調度和分派的基本單位,是比進程更小的能獨立運行的基本單位,只擁有在運行中必

原创 Hadoop--NameNode && SecondNameNode

SecondaryNameNode(SNN)是HDFS架構中的一個組成部分,是用來保存NameNode中對HDFS metadata的信息的備份,並減少NameNode重啓的時間。 Hadoop的默認配置中讓SNN進程默認運行在了Name

原创 R語言與數據挖掘學習筆記(常用的包)

今天發現一個很不錯的博客(http://www.RDataMining.com), 博主致力於研究R語言在數據挖掘方面的應用,正好近期很想系統的學習一下R語言和數據挖掘的整個流程,看了這個博客的內容,心裏久久不能平靜。決定從今天 開始

原创 lintcode-N-Queen, N皇后問題

【題目--33. N-Queens】 The n-queens puzzle is the problem of placing n queens on an n×n chessboard such that no two queens

原创 SQL語句--like和正則表達式的使用

【LIKE子句】 LIKE 操作符用於在 WHERE 子句中搜索列中的指定模式。 LIKE 子句中使用 ’ % ‘ 字符來表示0個或多個字符,實現模糊匹配。如果沒有使用 ‘ % ’ , LIKE 子句與’ = ’ 的效果是一樣的。 通配符