原创 機器學習 | 特徵工程 —— 降維:PCA(主成分分析)

1.數學原理 1.1.【參考博客】 https://www.cnblogs.com/xinyuyang/p/11178676.html 1.2.【精簡描述】 PCA實際上是將含有冗餘特徵的高維空間數據集投影到地位空間中,在保證信息量的同

原创 認知物理學思維導圖

 

原创 python3__深度學習__卷積神經網絡(CNN):VGGNet / Finetuning

目錄 1.卷積層實現 2.全連接層實現 3.卷積組實現 4.全連接組實現 5.完整代碼 6.模型參數複用及模型存儲 7.模型Finetuning(微調)複用 7.1 基本概念 7.2 貓狗大戰(Finetuning使用VGG) VGG1

原创 Google瀏覽器截圖方法

1.2019年10月8號入職京東實習,在實習的過程中需要用到一個技能,特整理如下:(Google瀏覽器滾動截圖的方法) (1).Fn+F12(F12或右上角"三點標誌"->更多工具->開發者工具) 進入Google瀏覽器開發者模式

原创 python3__深度學習__過擬合/欠擬合的處理

1.過擬合定義+處理 1.1 過擬合概述(低偏差,高方差) 定義:過擬合簡單的描述就是在訓練集上的表現很好,但在未見過的測試集上的表現卻較差。專業一點的定義就是:給定一個假設空間H,一個假設h屬於H,如果存在其他的假設h'也屬於H

原创 距離(相似度)計算方法

1.幾何距離 1.1.閔式距離 又叫做閔可夫斯基距離,是歐氏空間中的一種測度,被看做是歐氏距離的一種推廣,歐氏距離是閔可夫斯基距離的一種特殊情況。閔可夫斯基距離公式中,當p=2時,即爲歐氏距離;當p=1時,即爲曼哈頓距離;當  時,即爲

原创 MongoDB數據庫和可視化工具Studio 3T的安裝及問題調試

目錄 1.MongoDB的安裝及測試 2.可視化工具Studio 3T的安裝及測試 1.MongoDB的安裝及測試 1.官網下載數據庫(.msi格式文件,並非.zip文件)      https://www.mongodb.com/ 2

原创 python3__pandas__預處理常用操作

目錄 1.pandas預處理的常用操作 2.個人補充內容 1.pandas預處理的常用操作 鏈接的文章已經講解的相對比較清楚了,包括: (1)缺失值處理:dropna(),fillna() (2)離散化:cut(),qcut() (3)

原创 python3_anaconda包管理工具使用(命令行)_詳解

以下所有命令均在Anaconda Prompt命令行運行: <一>管理anaconda 1.conda --version:查看anaconda版本 2.conda update conda:升級anaconda <二>管理環境

原创 推薦系統 | 協同過濾 —— 矩陣降維SVD/SVD++

目錄 1.特徵值分解(EVD) 1.1.實對稱矩陣(也可爲方陣)  1.2.一般矩陣 2.奇異值分解(SVD) 2.1.奇異值分解定義 2.2.奇異值求解 2.3.數學引例 2.4.圖像壓縮應用(Python) 2.5.協同過濾推薦系統中

原创 機器學習 | 分類 —— 決策樹:分支標準(熵/Gini係數)

1.Gini係數 設pk爲節點S包含的K個不同的類別的數據記錄所佔的比例,則結點S的基尼係數G(S)定義如下:  基尼係數位於[0,1]區間,數字越小表明區分度越大。一次劃分的整體基尼係數等於劃分得到的孩子節點的基尼係數的加權平均,且

原创 機器學習 | 聚類 —— FCM模糊聚類算法

1.FCM模糊聚類原理 模糊c均值聚類FCM算法融合了模糊理論的精髓,相較於k-means的硬聚類,FCM算法(Fuzzy C-Means,FCM)提供了更加靈活的聚類結果。因爲大部分情況下,數據集中的對象不能劃分成爲明顯分離的簇,將一

原创 網絡爬蟲 | 貓眼電影最受期待榜信息抓取 —— 基於multiprocessing / re(多進程/正則表達式)

import re import requests from requests.exceptions import RequestException import multiprocessing import random head

原创 MongoDB | 運算符 —— 查詢(query)與投影(projection)運算符 (16.1)

目錄 16.運算符 16.1.查詢(query)與投影(projection)運算符 16.1.1比較運算符 16.1.2.邏輯運算符 16.1.3.元素查詢運算符 16.1.4.求值查詢運算符 16.1.5.地理空間查詢運算符 16.1

原创 論文 | 翻譯 ——Resolving data sparsity and cold start problem in collaborative filtering ……(2019:協同過濾RS)

目錄 <SCI 2> 0.專有詞彙 0.Abstract 1.Introduction 2.Related works 2.1 Baseline estimation 2.2 Linked open data enabled recomm