原创 Java操作Hbase3

http://www.cnblogs.com/panfeng412/archive/2011/08/14/2137984.html 本文以HBase 0.90.2爲例,介紹如何在Windows系統,Eclipse IDE集成環境下,使

原创 java操作hbase

http://blog.csdn.net/karen_wang/article/details/6284154 1、需要的jar包: commons-codec-1.4.jar commons-logging-1.0.4.jar

原创 使用sklearn進行集成學習——實踐

1 Random Forest和Gradient Tree Boosting參數詳解 2 如何調參?   2.1 調參的目標:偏差和方差的協調   2.2 參數對整體模型性能的影響   2.3 一個樸實的方案:貪心的座標下降法     2

原创 Integer與int的區別

jdk1.5引入了自動裝箱(autoboxing)與自動拆箱(unboxing),這方便了集合類以及一些方法的調用,同時也使初學者對其感到非常之困惑。在此,我們來揭開其神祕的面紗。 首先,需要釐清一些概念:1、Integer是一個類,用

原创 Java操作Hbase2

http://javacrazyer.iteye.com/blog/1186881 1、搭建環境   新建JAVA項目,添加的包有:    有關Hadoop的hadoop-core-0.20.204.0.jar    有關Hbase的h

原创 使用python+sklearn的決策樹方法預測是否有信用風險

import numpy as np import pandas as pd names=("Balance,Duration,History,Purpose,Credit amount,Savings,Employment,in

原创 Java Collection

在 Java2中,有一套設計優良的接口和類組成了Java集合框架Collection,使程序員操作成批的數據或對象元素極爲方便。這些接口和類有很多對抽象數據類型操作的API,而這是我們常用的且在數據結構中熟知的。例如Map,Set,Li

原创 java文件讀寫操作大全

http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.獲得控制檯用戶輸入的信息      public String getInputMessage() throws IOExc

原创 偏差和方差的區別(機器學習)

關於偏差和方差,兩個比較直觀的解釋 作者:Jason Gu 鏈接:http://www.zhihu.com/question/20448464/answer/20039077 來源:知乎著作權歸作者所有,轉載請聯繫作者獲得授權。 偏差:描

原创 java中堆(heap)和堆棧(stack)的區別

java中堆(heap)和堆棧(stack)有什麼區別  stack 和 heap 都是內存的一部分 stack 空間小,速度比較快, 用來放對象的

原创 使用sklearn進行集成學習——理論

轉自http://www.cnblogs.com/jasonfreak/p/5657196.html 適合初學者,第四部分的公式沒有仔細研究,前3部分通俗易懂 目錄 1 前言 2 集成學習是什麼? 3 偏差和方差   3.1 模型的偏差和

原创 SVM支持向量機原理(四)SMO算法原理

轉自http://www.cnblogs.com/pinard/p/6111471.html 在SVM的前三篇裏,我們優化的目標函數最終都是一個關於α α向量的函數。而怎麼極小化這個函數,求出對應的α α向量,進而求出分離超平面我們

原创 SVM支持向量機原理(二) 線性支持向量機的軟間隔最大化模型

在支持向量機原理(一) 線性支持向量機中,我們對線性可分SVM的模型和損失函數優化做了總結。最後我們提到了有時候不能線性可分的原因是線性數據集裏面多了少量的異常點,由於這些異常點導致了數據集不能線性可分,本篇就對線性支持向量機如何處理這些

原创 scikit-learn SVM支持向量機算法庫使用小結

之前通過一個系列對支持向量機(以下簡稱SVM)算法的原理做了一個總結,本文從實踐的角度對scikit-learn SVM算法庫的使用做一個小結。scikit-learn SVM算法庫封裝了libsvm 和 liblinear 的實現,僅僅

原创 SVM支持向量機高斯核調參小結

轉自http://www.cnblogs.com/pinard/p/6117515.html  在支持向量機(以下簡稱SVM)的核函數中,高斯核(以下簡稱RBF)是最常用的,從理論上講, RBF一定不比線性核函數差,但是在實際應用中,卻