原创 Python3爬取汽車目標經銷商數據

Python3爬取汽車目標經銷商數據 本文采用Python3進行語法編寫,Python3與Python2中的函數會有所不同,但是相差不大,具體的問題可以百度找到,因有朋友在做汽車方面的業務,因此需要一些網絡數據進行支撐,一個個找會

原创 最優化算法總結(批量梯度下降【BGD】,隨機梯度下降【SGD】),牛頓法,擬牛頓法)

最優化算法總結 最優化方法主要有:梯度下降(批量梯度下降【BGD】,隨機梯度下降【SGD】),牛頓法,擬牛頓法 當目標函數是凸函數時,梯度下降每次求解是全局解,其解不保證全局最優解 每次通過求導找出梯度方向(負梯度方向作爲搜索

原创 《劍指offer》:java

題目1:數組-二維數組中的查找 在一個二維數組中,每一行都按照從左到右遞增的順序排序,每一列都按照從上到下遞增的順序排序。請完成一個函數,輸入這樣的一個二維數組和一個整數,判斷數組中是否含有該整數。 輸入描述: array:

原创 基本神經網絡BP的訓練以及反向傳播

一般情況,神經網絡主要由網絡結構,激活函數,最優權重的參數學習算法 多層前饋神經網絡(BP算法)是目前應用較爲廣泛的一種參數學習算法。BP神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡。 既然我們無法直接得

原创 【動態規劃問題】的解決方案

動態規劃問題解決方案動態規劃問題 動態規劃問題

原创 DataCastle[猜你喜歡]賽事算法分享

關於競賽 DC的小夥伴們大家好,我是Yes,boy! ,來自東北大學計算機學院。在猜你喜歡推薦系統競賽中,很幸運以7.89465的得分取得第一名,看到大家在羣裏對推薦系統的熱情很高,所以在這裏我簡單介紹下競賽中我的思路。 本次

原创 numpy 內置函數總結

numpy 內置函數總結1. np的數組創建函數(ndarray)2. 通用函數元素級數組函數2.1 一元函數2.2 二元函數3. 基本數組統計函數4. 數組的集合運算5. 常用的numpy.linalg函數6. 隨機數的生成6.

原创 RDD:基於內存的集羣計算容錯抽象

該論文來自Berkeley實驗室,英文標題爲:Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computin

原创 基於迴歸曲線擬合模型的ALS(最小二乘法)推導過程以及Python實現

概念 最小二乘法(Alternative -Least-Squares)是一種迭代算法。它通過最小化誤差的平方和尋找數據的最佳函數匹配。利用最小二乘法可以簡便地求得未知的數據,並使得這些求得的數據與實際數據之間誤差的平方和爲最小。

原创 《劍指offer》機器人的運動範圍(java)

題目: 地上有一個m行和n列的方格。一個機器人從座標0,0的格子開始移動,每一次只能向左,右,上,下四個方向移動一格,但是不能進入行座標和列座標的數位之和大於k的格子。 例如,當k爲18時,機器人能夠進入方格(35,37),因爲3

原创 python os模塊功能和方法總結

python os模塊功能和方法總結 本博客包含[os][6],[os.path][6]等模塊 - os - os.path os : os.sep :可以取代操作系統特定的路徑分割符 os.linesep : 字符串

原创 mongo批量插入問題(insert_many,bulk_write)

mongo批量插入問題1. 遇到問題2. 解決問題2.2 方法1:批量插入insert_many2.3 方法2:批量更新bulk_write(UpdateOne)2.3.1 bulk_write定義3. 性能測試4. 問題交流 1

原创 hive常用函數

hive常用函數1.字符串函數1.1 字符串長度函數:length1.2 字符串反轉函數:reverse1.3 字符串連接函數:concat1.4 帶分隔符字符串連接函數:concat_ws1.5 字符串截取函數:substr,s

原创 推薦系統常用評測指標

推薦系統常用評測指標 預測準確度(Precision) 評分預測準確度一般通過均方根誤差(RMSE)和平方根誤差(MAE)計算。對於測試集中的一個用戶u和物品i,令 評分預測:(測試集的一個用戶u和物品i,令rui 是用戶u對物品的實際

原创 Naive Bayes 樸素貝葉斯(文本)分類器Java實現

算法原理推導 僞代碼 java實現代碼 測試數據 算法原理推導 優缺點分析 優點:在數據較少的情況下,仍然有效,可以處理多分類問題 缺點:對於輸入數據的準備方式比較敏感 適用數據類型:標稱型數據 主要思想 p1(x,y)表示數據