原创 機器學習-RBF高斯核函數處理

SVM高斯核函數-RBF優化 重要了解數學的部分: 協方差矩陣,高斯核函數公式。 個人建議具體的求法還是看下面的核心代碼吧,更好理解,反正就我個人而言,煩躁的公式,還不如一段代碼來的實際。本來想用java的一個叫jblas的

原创 shell-grep

grep基本選項: -a 不要忽略二進制數據。  -A<顯示列數> 除了顯示符合範本樣式的那一行之外,並顯示該行之後的內容。  -b 在顯示符合範本樣式的那一行之外,並顯示該行之前的內容。  -c 計算符合範本樣式的列數。 -C<顯示列數

原创 Spark-Kmeans實戰

 Kmeans實戰算法總結 K-means均值聚類算法: 算法核心思想: 1.  選擇K個類中心;(類中心範圍爲數據min,max之間) 2.  計算各樣本到類中心的距離,把樣本添加到離他最近的那個類中心的dataset中。ps:常用距

原创 DataStructure-用指針實現List

具體實現代碼: #include<stdio.h> #include<malloc.h> typedef int ListItem; typedef struct node *link;//定義節點類型 typedef struc

原创 回溯法:最優裝載問題

回溯法對解空間進行深度優先搜索,在一般情況下可用遞歸方法實現回溯法。 空間樹理解: 假設裝載的集裝箱n=3,則空間樹可以表示爲上圖,就是1表示裝入該集裝箱,0表示不裝入該集裝箱,最優裝載問題就是在這些空間樹裏,尋找最優子結

原创 spark-sql(不包含hive-sql)查詢編程

spark-sql(不包含hive-sql)查詢編程 //1:將json格式的數據轉化爲dataFrame val df =sqlContext.read.json("hdfs://localhost:9000/jacksoom/

原创 貪心算法-活動安排問題

貪心算法-活動安排問題 具體求解思路: 首先將活動按照結束時間從小到大排序, 然後將startTime[i]大於finishTime[i-1]的活動安排進去, 由於活動結束時間是事前排好序的(具體排序方法可以看我之前的博客

原创 快速排序

快速排序 算法思想:找一個基準(一個數),i從左開始i++,j從右開始j--,找到直到i對應的值大於基準,j對應的值小於基準,交換兩數,終止條件是i>=j,達到終止條件的i值對應的數組位置就是基準的位置 核心代碼: static voi

原创 二分搜索法基本思想

二分搜索法基本思想 將n個元素分成個數大致相同的兩半, 取a[n/2]與x進行比較。   如果x=a[n/2], 則找到x算法終止,  如果x<x[n/2], 則在數組的右邊部分繼續搜索,   如果x<x[n/2] 則在數組的左邊部分繼

原创 linux-test測試

  test 測試 三種基本格式 test -f file -a -d folder && echo 1|| echo 0 [ -f file -a -d folder ] && echo 1|| echo 0 [[ -f file &&

原创 合併排序

合併排序 基本思想:遞歸分治法,將待排序的序列分成兩部分,然後對兩個部分進行排序,最終將排好序的子部分進行合併 public class hebing { public static void main(String args[]){

原创 shell腳本基礎知識和位置變量

                                                                           shell腳本基礎 和 相關位置變量含義 shell 腳本開頭:制定解釋器來執行腳本

原创 vim的完美配置go和rust

vim的go和rust的完美配置 詳情見:https://github.com/jacksoom/vim-conf 想讓指尖跳舞?想要雙手不離鍵盤編程?ok, 各種完美插件,應有盡有。徹底拋棄vscode。

原创 go源碼分析-> channel

針對go語言中chan的源碼分析channel的機制 1:發送者流程 1:常規檢查(發送一個已經關閉的chan會直接觸發panic) 2:查看接受則阻塞隊列中是否有sudog(對應的一個goroutine,注意是dequeue操作

原创 DataStructure-用數組實現List

表的基本概念 表(線性表),是一種非常靈活的結構,可以根據自己的需要改變表的長度,也可以在其中任何位置對元素進行訪問、插入、刪除等操作。另外還可以將多個表連接成一個表,或者把一個表拆分多個表。 表的圖示結構 用數組實現表 #incl