原创 聚類、K-Means、例子、細

聚類 今天說聚類,但是必須要先理解聚類和分類的區別,很多業務人員在日常分析時候不是很嚴謹,混爲一談,其實二者有本質的區別。 分類其實是從特定的數據中挖掘模式,作出判斷的過程。比如Gmail郵箱裏有垃圾郵件分類器,一開始的時候可能什麼都不過

原创 Naive Bayes算法(NB算法---樸素貝葉斯)

        貝葉斯分類器的分類原理是通過某對象的先驗概率,利用貝葉斯公式計算出其後驗概率,即該對象屬於某一類的概率,選擇具有最大後驗概率的類作爲該對象所屬的類。目前研究較多的貝葉斯分類器主要有四種,分別是:Naive Bayes、

原创 如何入手數據分析

鏈接:http://www.zhihu.com/question/27573926/answer/109653525 來源:知乎 著作權歸作者所有,

原创 Python文件的讀寫

Python文件的讀寫 Python:文件的讀取、創建、追加、刪除、清空 一、用Python創建一個新文件,內容是從0到9的整數,每個數字佔一行: >>>f=open('f.txt','w')    # r只讀,w可寫,a追加 >>>fo

原创 樸素貝葉斯分類器的應用

樸素貝葉斯分類器的應用 生活中很多場合需要用到分類,比如新聞分類、病人分類等等。 本文介紹樸素貝葉斯分類器(Naive Bayes classifier),它是一種簡單有效的常用分類算法。 一、病人分類的例子

原创 較常見的SQL面/筆試題

          日誌     關於我 Andy 一枚流星,在想像的高空逡巡,期待的眼波,寂寞而執着   加博友   關

原创 習近平談社會主義核心價值觀

習近平談社會主義核心價值觀 2014年10月15日,習近平在北京主持召開文藝工作座談會並發表重要講話。 新華社記者龐興雷攝 原標題:習近平談社會主義核心價值觀 社會主義核心價值觀有多重要? 一個民族賴以維繫的精

原创 棧的順序表示和實現

2.2基礎實驗 2.2.1 實驗目的 (1)掌握棧的順序表示和實現 (2)掌握棧的鏈式表示和實現 (3)掌握隊列的順序表示和實現 (4)掌握隊列的鏈式表示和實現 2.2.2 實驗內容 實驗一:棧的順序表示和實現 【實驗內容與要求】 編寫一

原创 Superior Scheduler學習心得 原創

1、組件介紹: 圖1-整體系統架構和組件的位置 Yarn和Superir scheduler是爲了和Hadoop DRM系統一起工作而專門設計的,類似於Yarn現有的開源Fair scheduler和Cap

原创 數據分析師需要學習的知識

1、懂業務。從事數據分析工作的前提就會需要懂業務,即熟悉行業知識、公司業務及流程,最好有自己獨到的見解,若脫離行業認知和公司業務背景,分析的結果只會是脫了線的風箏,沒有太大的使用價值。 2、懂管理。一方面是搭建數據分析框架的要求,比如確定

原创 python數據分析師面試題選

python數據分析師面試題選 以下題目均非原創,只是彙總 python數據分析部分 1. 如何利用SciKit包訓練一個簡單的線性迴歸模型 利用linear_model.LinearRegression()函數  # Create

原创 快速排序

       快速排序由於排序效率在同爲O(N*logN)的幾種排序方法中效率較高,因此經常被採用,再加上快速排序思想----分治法也確實實用,因此很多軟件公司的筆試面試,包括像騰訊,微軟等知名IT公司都喜歡考這個,還有大大小的程序方面的

原创 mysql存儲過程詳解

1. 存儲過程簡介  我們常用的操作數據庫語言SQL語句在執行的時候需要要先編譯,然後執行,而存儲過程(Stored Procedure)是一組爲了完成特定功能的SQL語句集,經編譯後存儲在數據庫中,用戶通過指定存儲過程的名字並給定參

原创 複習題目

數據結構:36,用一個數組tws表示兩個棧,棧頂分別爲數組的第一元素位置和最後一個位置,用算法表示兩個棧的進棧push(tws,i,x)和出棧pop(tws,i) 37.奇偶排序法:第一趟是所有奇數i進行排序,第二趟所有偶數i進行排序,

原创 數據結構的C實現_圖_鄰接表示

//圖,用鄰接表表示 //編譯環境:Dev C++5.11 //ALGragh.c #include <stdio.h> #include <stdlib.h> #define ERROR 0 #define OK 1 #define M