原创 【Python畫圖】繪製雙座標圖

使用Python繪製雙座標圖,代碼及結果顯示如下。 import matplotlib.pyplot as plt fig = plt.figure(figsize=(10,6)) #顯示中文 plt.rcParams['font

原创 【機器學習】十六、XGBoost算法原理講解

之前文章分享了AdaBoost的算法原理和GBDT算法原理,這篇文章將講解XGBoost,建議看本文之前,先看一下AdaBoost算法和GBDT算法的原理。碼字不易,喜歡請點贊!!! 目錄1.XGBoost簡介2.XGBoost

原创 【Python】matplotlib中文顯示錯誤

有時候我們使用matplotlib包來畫圖的話,會顯示不出來中文,這時候只要加上兩行代碼即可,如下: plt.title('Feature Importance') #顯示中文 plt.rcParams['font.sans-s

原创 【Python】報錯:ConnectionError: ('Connection aborted.', BadStatusLine("''",))

報錯:ConnectionError: (‘Connection aborted.’, BadStatusLine("’’",)) 原因:傳入參數過多,拆分參數,再次傳入即可 點贊 收藏 分享

原创 【機器學習】十五、Gradient boosting算法原理詳解

上篇文章分享了AdaBoost的算法原理,這篇文章將講解Boosting家族中的梯度提升算法(Gradient boosting)。建議看本文之前,先看一下AdaBoost算法的原理。碼字不易,喜歡請點贊!!! 目錄1.梯度提升

原创 【Python】計算文本相似度

import jieba import numpy as np import re def get_word_vector(s1,s2): """ :param s1: 句子1 :param s2: 句子

原创 【SQL】數據類型轉換

SQL的數據類型轉行函數有cast和convert兩個函數,用法如下: cast(列名 as 數據類型) eg:cast(tableAge as int) convert(數據類型,列名) eg:convert(int,tabl

原创 Jensen不等式講解與證明

琴生不等式,是由丹麥數學家約翰•延森(Johan Jensen)命名,也成爲Jensen不等式或者詹森不等式。碼字不易,喜歡請點贊,謝謝!!!有問題隨時歡迎交流。 首先,對於如凸函數f(x)f(x)f(x),對任意0<=α<=10

原创 【輸入法】不顯示中文

有時候電腦會突然出現打字不出現中文,只顯示英文字母的情況,只需按以下操作運行就可以了。 首先,使用以下快捷鍵,打開運行界面: win+R 然後,運行以下命令即可: ctfmon.exe 點贊 收藏 分享

原创 【Python】對DataFrame進行分組排序

之前分享過在SQL裏面進行分組排序的方法,這裏分享一下Python對DataFrame進行分組排序的方法。 假設我們有以下數據: ID Data 01 100 01 200 01 300 02 100

原创 【Python】判斷DataFrame裏某個值在哪一列

通過如下代碼輸出某個值所在列: for col in X.columns: if(df[df[col].isin([某值])].shape[0]>0): print(col) 點贊 收

原创 【SQL Server】獲取數據庫下的數據庫名,表名

1.查詢所有的數據庫名 select * from sysdatabases 輸出: 2.獲取當前數據庫下的所有表名 #xtype = 'U'表示所有用戶表 #xtype = 'S'表示所有系統表 select * from

原创 【Python】讀取CSV/Excel文件報錯ParserError: NULL byte detected.解決方法

讀取CSV文件報錯如下: ParserError: NULL byte detected. This byte cannot be processed in Python’s native csv library at the m

原创 【數據分析與挖掘實戰】數據預處理篇

數據預處理1.數據清洗1.1缺失值處理1.2異常值處理2.數據集成2.1實體識別2.2冗餘屬性識別3.數據變換3.1簡單函數變換3.2規範化3.3連續屬性離散化3.4屬性構造3.5小波變換4.數據規約4.1屬性規約4.2數值規約

原创 【機器學習】常見模型評估指標

碼字不易,喜歡請點贊!!! 【機器學習】中常見的模型評估指標 常見類別一:錯誤率/精度 在mmm個樣本中,有α\alphaα個樣本分類錯誤。 1.錯誤率(error rate):E=α/mE = \alpha/mE=α/m 2.精