原创 SVD的介紹與原理

一.SVD的介紹 SVD,Singular Value Decomposition ,奇異值分解。PCA的實現一般有兩種,一種是用特徵值分解,一種是用奇異值分解。 優點:簡化數據,去除噪聲,提高算法的結果 缺點:數據的轉換可能難

原创 python中的list與矩陣的索引

問題介紹 最近用python來處理數據的時候,常常遇到這樣的錯誤: TypeError: list indices must be integers, not tuple 仔細檢查才發現,常常是矩陣和列表的索引給搞混淆了,我們

原创 ganglia安裝與配置

1.準備條件 相關依賴包安裝好 2.安裝過程 監控節點安裝 1.yum install -y ganglia ganglia-gmetad ganglia-web ganglia-gmond 2.修改/etc/ganglia/g

原创 python ,java 變量作用域

1.python的變量作用域 能夠改變python變量作用域的是def 、class、lambda; if/elif/else、try/except/finally、for/while這些語句並不能涉及變量值作用域的修改,也就是

原创 PCA原理以及算法實現

一.算法介紹 PCA(Princiapal Component Analysis),主成分分析,是統計數據分析、特徵提取和數據壓縮的經典方法,起源於Pearson的早期工作。實際上,PCA主要作用就是將一個存在信息冗餘的多維空間變

原创 matlab中的隨機矩陣及其相關函數的使用

一、rand函數的用法 R=rand(n) 產生一個N*N的隨機矩陣,其中的元素來自0-1均勻分佈 R=rand([M,N]) 產生一個M*N的隨機矩陣 R=rand(size(A)) 產生一個同矩陣A大小一致的隨機

原创 phoenix客戶端API使用

1.準備條件 phoenix與Hbase已經安裝好 phoenix-4.3.0 hbase-0.98 2.客戶端使用(服務器上使用客戶端) 在客戶端創建如下文件test.java: import java.sql.Connec

原创 phoenix操作注意點

一.與hbase 的映射 1.空表格映射 在phoenix中創建表格,會自動映射到hbase中,我們可以通過hbase shell 來查看。舉個例子,我們創建了一個表, create table hbase_col_test(

原创 python文件操作與輸入輸出

1.交互界面上的輸入輸出 1)input與raw_input函數的使用 input會假設用戶輸入的是合法的python表達式,當不合法是會出現錯誤: 這裏lan應該加引號,表示爲一個字符串,否則就是一個不合法的字符,如果用

原创 python 隨機數,隨機序列

一、函數使用介紹 python中與隨機相關的函數位於random包中 有幾個常用的函數如下: random.random() 產生一個0-1之間的隨機數 random.uniform(1,10) 產生一個1-10之間均勻分

原创 服務器環境配置思路

1.實際場景 在實際工作或者生產環境中,我們常常需要配置服務器的運行環境,比如一個常見的場景:hadoop+hive+hbase ,估計一般人折騰好這三項要做好幾天,常常會遇到各種問題,或者ERROR或者是exception,因

原创 機器學習幾種常見模型的介紹

這裏我主要介紹以下幾種模型: k近鄰法 樸素貝葉斯法 決策樹 邏輯斯蒂迴歸 支持向量機 adaBoost方法 K近鄰法 原理 輸入:實例的特徵向量 輸出:實例的類別 算法描述: (1)在訓練集中找出與實例最近鄰的k個點,

原创 Hadoop 運行wordcount 實例

一.運行環境 操作系統:ubuntu14.04 hadoop版本:hadoop-2.5.2 二.操作步驟 我在自己電腦上搭建的是hadoop僞分佈式的配置,所以wordcount實例只是在一臺機器上運行的。 在機器上,我的ha

原创 Java中wait,notify方法

一.介紹 wait(),notify(),notifyAll()方法是位於Object類的方法,這三個方法調用的都是jvm的 native方法。 wait()方法:持有該對象的線程處於等待,讓出對象的控制權 notify()方法

原创 ubuntu 卸載

1.所需工具 MbrFix.exe 2.操作步驟 將其放入C盤根目錄下 使用windows+R快捷鍵打開“運行”,輸入cmd,進入控制檯 通過 cd C:\ 進入根目錄下 輸入以下命令:MbrFix.exe /drive 0 f