原创 我在面試機器學習、大數據崗位時遇到的各種問題

 原文  http://dataunion.org/20682.html 主題 數據挖掘 大數據 作者:  @太極儒 出處:  @太極儒的博客 自己的專業方向是機器學習、數據挖掘,就業意向是互聯網行業與本專業相關的工作崗位。各個

原创 【Machine Learning公開課】Chapter 2

這一講Ng給我們講了什麼是有監督學習,以及一種常用的求最值方法:梯度下降法。 首先我們回顧下一個簡單的機器學習過程:首先給出一個輸入數據,我們的算法會通過一系列的過程得到一個估計的函數,這個函數有能力對沒有見過的新數據給出一個新的

原创 爲什麼SSD隨機讀和寫性能差別大?

          SSD是一種基於閃存的存儲技術,有着與旋轉磁盤不同的性能特性。由於CPU按順序訪問邏輯磁盤塊,故SSD的順序讀和寫的性能相當,順序讀比寫稍微快一點。不過,當CPU按隨機順序訪問邏輯塊時,寫比讀慢一個數量級。      

原创 C++:如何用clock()和頭文件ctime來創建延遲循環

#include<iostream> using namespace std; #include<ctime>     void main() {c

原创 快速排序

快速排序(Quicksort)是對冒泡排序的一種改進。 快速排序由C. A. R. Hoare在1962年提出。它的基本思想是:通過一趟排序將要排序的數據分割成獨立的兩部分,其中一部分的所有數據都比另外一部分的所有數據都要小,然後再按

原创 python爬蟲基礎知識

爬蟲爬取策略 1.廣度優先:在抓取過程中,在完成當前層次的搜索後,才進行下一層次的搜索。 2.最佳優先:只訪問經過網頁分析算法預測爲“有用”的網頁 3.深度優先:可能會陷入trapped問題 DOM(Document Objec

原创 mac下使用Navicat

Navicat for mac使用教程 轉載自:http://www.jianshu.com/p/326c1aaa1052 1.安裝後第一次打開會彈出此框要求你連接mysql。連接名隨便填,password 默認爲 root. 屏幕快

原创 教你如何迅速秒殺掉:99%的海量數據處理面試題

教你如何迅速秒殺掉:99%的海量數據處理面試題 作者:July 出處:結構之法算法之道blog 前言    一般而言,標題含有“秒殺”,“99%”,“史上最全/最強”等詞彙的往往都脫不了譁衆取寵之嫌,但進一步來講,如

原创 如何解決錯誤1079:此服務的賬戶不同於運行於同一進

1.單擊「開始」,單擊“開始搜索”框,鍵入 services.msc,然後按 Enter。2.右鍵單擊詳細信息窗格中要配置的服務,然後單擊“屬性”。3.在“常規”選項卡的“啓動類型”中,單擊“自動”。 4.單擊“登錄”選項卡,然後執行下

原创 LeetCode 1: Two Sum

Given an array of integers, find two numbers such that they add up to a specific target number. The function twoSum s

原创 GCC跟G++區別

GCC:GNU編譯器集合,涉及所有由GNU編譯器所支持的不同的語言。GCC:GNU C編譯器G ++:GNU C ++編譯器其主要區別:GCC編譯:.C/.cpp文件分別作爲C和C ++。G ++編譯:.C/.cpp文件,但他們都將被視爲

原创 避免緩衝區溢出攻擊的方法

Linux上最新GCC版本提供了三種對抗緩衝區溢出攻擊的機制 --1. 棧隨機化        攻擊者對系統攻擊時不但需要插入代碼,還需要插入指向這段代碼的指針,這個指針也是攻擊字符串的一部分,而產生指針需要知道這個字符串的棧地址,在過

原创 SIMD並行

在最低層次上,許多現代處理器擁有特殊的硬件,允許一條指令產生多個可以並行執行的操作,這種方式成爲單指令、多數據,也就是SIMD並行。比如,較新的Intel和AMD處理器都具有並行地對四對單精度浮點數(也就是C語言數據類型float

原创 長度爲n的順序表L,編寫一個時間複雜度爲O(n),空間複雜度爲O(1)的算法,該算法刪除線性表中所有值爲X的元素

解法:用K記錄順序表L中不等於X的元素個數,邊掃描L邊統計K,並將不等於X的元素向前放置K位置上,最後修改L長度 void  del_x_1(SqList &L,Elemtype x){ int k=0; for(i=0;i<L.len

原创 個人整理的機器學習/數據挖掘相關算法

1. 梯度下降法、牛頓法 2. 最大似然估計法 3. 最小二乘法 4. 線性迴歸(基本思想是用梯度下降法對最小二乘法形式的誤差函數進行優化) 5. K最近鄰分類算法(KNN) 6. 決策樹(ID3、C4.5算法、迭代決策樹(GB