原创 matplotlib繪圖教程

import numpy as np import matplotlib.pyplot as plt np.random.seed(2) y = np.random.random(10) z = np.random.random

原创 面試題

1、relu激活函數的好處 relu激活函數計算簡單,可以減少很多計算量。反向傳播求誤差梯度時,計算量較大,採用relu激活函數,可以節省很多計算量。 避免梯度消失問題。對於深層網絡,sigmoid函數反向傳播時,很容易會出現梯

原创 Dropout vs BatchNormalization

Dropout Dropout是神經網絡中防止模型過擬合的重要正則化方式。2014年 Hinton 提出了一個神器, 《Dropout: A Simple Way to Prevent Neural Networks from O

原创 TextCNN

TextCNN 在2014年,美國紐約大學的Yoon Kim提出了一種TextCNN模型,把卷積神經網絡(CNN)用於文本分類,利用多個不同大小的卷積核來提取文本中的特徵,從而能夠更好地捕捉局部的相關性。論文地址:Convolut

原创 LightGBM的原生接口和lightgbm庫接口對比

1、LightGBM原生接口----分類模型 import lightgbm as lgb from sklearn.metrics import accuracy_score from sklearn.datasets impo

原创 文本分類(4)-LSTM實現文本分類

利用LSTM對IMDB Reviwe文本進行分類,數據集可以在kaggle官網上獲取, kaggle比賽 或者https://pan.baidu.com/s/1EYoqAcW238saKy3uQCfC3w 提取碼:ilze # 導

原创 卷積神經網絡(CNN)

卷積神經網絡(Convolutional Neural Network,CNN)的提出最初是爲解決圖像識別問題,但是隨着技術的發展,現在CNN的應用也不僅侷限於圖像和視頻,也可以用於音頻和文本等時間序列數據。CNN作爲一個深度學習

原创 循環神經網絡

循環神經網絡(RNN) 人工神經網絡和卷積神經網絡的前提假設是元素之間是相互獨立的,輸入和輸出也是相互獨立的。但在現實世界中,很多元素都是相互連接的,比如,我出生在中國,從小在這裏長大,所以我能說一口流利的____。這裏填空,都知

原创 文本分類(5)-TextCNN實現文本分類

利用TextCNN對IMDB Reviwe文本進行分類,數據集地址:https://pan.baidu.com/s/1EYoqAcW238saKy3uQCfC3w 提取碼:ilze import numpy as np impor

原创 推薦系統(3)

隱語義模型(LFM) 從數據出發,進行個性化推薦 用戶和物品之間有着隱含關係 計算機能夠更好的理解隱含因子 將用戶和物品通過中介隱含因子聯繫起來 隱語義模型是基於機器學習的思想,ItemCF和UserCF是基於統計建模的思想

原创 特徵選擇

1、去掉方差較小的特徵 刪除方差不滿足某個閾值的所有特徵,默認情況下,它刪除所有0方差特徵,即在所有樣本中具有相同值的特徵。 from sklearn.datasets import load_boston from sklear

原创 推薦系統(2)

基於用戶的協同過濾算法(UserCF) 基於用戶的協同過濾算法是通過用戶的歷史行爲數據發現用戶對物品的喜好,並對這些喜好進行度量和打分,根據不同用戶對相同物品的偏好計算用戶之間的相似度,在有相同喜好的用戶間進行推薦。 步驟: 找

原创 多分類

from sklearn.datasets import load_iris from sklearn.linear_model import LogisticRegression from sklearn.multiclass

原创 機器學習:樸素貝葉斯算法

正向概率:假設袋子裏面有N個紅球,M個黑球,取出一個球,此時摸出黑球的概率是多少。 逆向概率:事先不知道袋子裏面紅球和黑球數量的比例,取出一個球或者多個球,觀察這些取出的球的顏色,可以對袋子中紅球和黑球的比例做出推斷。 樸素貝葉斯

原创 pandas分組聚合

基本操作 import pandas as pd import numpy as np df = pd.DataFrame({'a':['one','two','one','two'], 'b