原创 malloc/free 與new/delete的區別

malloc與free是C++/C語言的標準庫函數,new/delete是C++的運算符。它們都可用於申請動態內存和釋放內存。 1.malloc函數初探 首先我們要知道malloc是一個函數,malloc的全稱是memory al

原创 python字符串split(),join(),strip()函數及網易筆試 迴文序列

Python中raw_input()輸入都是按字符串類型,因此梳理一下字符串分割、連接、刪除的split(),join(),strip()函數。 另外聯想到之前的網易筆試題 迴文序列,在輸入部分用到了split()。 split()

原创 C/C++求職寶典21個重點筆記(常考筆試面試點)

以下都是一些C/C++筆試面試中常考的重點難點問題,但比較基礎,適合初學者看。   1. char c = '\72'; 中的\72代表一個字符,72是八進制數,代表ASCII碼字符“:”。 2. 10*a++ 中a先進行乘法運算

原创 C++ 結構體所佔字節數

在用sizeof運算符求算某結構體所佔空間時,並不是簡單地將結構體中所有元素各自佔的空間相加,這裏涉及到內存字節對齊的問題。從理論上講,對於任何變量的訪問都可以從任何地址開始訪問,但是事實上不是如此,實際上訪問特定類型的變量只能在特定的

原创 typedef 與#define的區別

  以一個例子來說明 #define INTPTR1 int* typedef int* INTPTR2; INTPTR1 p1,p2; INTPTR2 p3,p4; 其中 p2爲 不是int型指針。 因爲宏定義#define是簡單的

原创 Kmeans聚類算法 python sklearn 用戶畫像

1、基本概念; 聚類分析簡稱聚類(clustering),是一個把數據集劃分成子集的過程,每一個子集是一個簇(cluster),使得簇中的樣本彼此相似,但與其他簇中的樣本不相似。 聚類分析不需要事先知道樣本的類別,甚至不用知道類別

原创 Hive 數據倉庫工具(最全整理)

工作時,數據統計分析、挖掘的時候用到很多Hive方面的內容,就做了一個完整的整理文檔。 ·       hive是基於Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並提供簡單的sql查詢功能,可以將sql語句轉

原创 hive內部表與外部表的區別 與Hive數據存儲

在工作中,遇到了Hive中內部表和外部表的差別。 因此梳理Hive的內部表與外部表兩個概念,以及如何在Hive裏面創建表和外部表,它們之間的區別。 我們可以在關係型數據庫裏面創建表(create table),這裏要討論的表和關係型數據庫

原创 OpenCV 實現canny邊緣檢測

近期,整理了一些之前做過的圖像處理內容,算是複習下基礎吧; 涉及canny邊緣檢測的OpenCV實現; 圖像邊緣信息主要集中在高頻段,通常說圖像銳化或檢測邊緣,實質就是高頻濾波。Canny是常用的邊緣檢測方法,其特點是試圖將獨立邊的候選像

原创 Hadoop 與Spark比較

Hadoop和Spark的關係中,最重要一點是,它們並不是非此即彼的關係,因爲它們不是相互排斥,也不是說一方是另一方的簡易替代者。兩者彼此兼容,這使得這對組合成爲一種功能極其強大的解決方案,適合諸多大數據應用場合。 兩者定義 Hadoo

原创 楊輝三角 python實現

題目 楊輝三角定義如下: 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 把每一行看作一個list,試寫一個 generator,不斷輸出下一行的list。 期待輸出: [1] [1, 1] [1,