原创 數據分析實戰-Kaggle-手把手Xgboost信用欺詐檢測實例-超詳細完整數據分析項目

目錄 一、題目介紹 1.1 英文題目介紹 1.2 數據集瀏覽 1.3 數據集分析 二、開發環境 2.1 軟硬件開發環境 2.2 開發過程槽點 三、知識儲備及注意事項 3.1 知識儲備 3.2 注意事項 四、實戰代碼 4.1 數據分析 4.

原创 數據分析實戰-Kaggle-Twitter情感識別-基於Spacy的語句提取

目錄   一、題目解析 二、開發環境 三、數據分析過程 一、題目解析 英文題目: "My ridiculous dog is amazing." [sentiment: positive] With all of the tweets c

原创 Python爬蟲項目實戰-Scrapy+Charles+MongoDB+Redis實現分佈式京東全網信息爬取2020最新版

目錄   一、基礎知識 二、開發環境及項目結構 三、結果展示 四、實戰源碼 4.1 數據模型-items.py 4.2 存儲操作(以MongoDB爲存儲數據庫)-pipelines.py 4.3 項目配置-settings.py 4.4

原创 Python爬蟲實戰-官方API怎麼用?結合Socket實現鬥魚實時彈幕抓取-2020最新API

目錄   一、原理概述及結果展示 1.1 計算機網絡基礎知識 1.2 結果展示 二、開發環境 2.1 基礎環境及相關文檔 2.2 Windows環境下nc的配置(因爲windows不支持nc,linux用戶可以直接跳過這一步) 2.3 測

原创 Python爬蟲項目實戰-基於Flask、MongoDB異步構建免費高可匿IP池

目錄   一、基礎項目結構及解釋 二、具體代碼實現 2.1 採集模塊 2.2 校驗模塊 2.3 數據模塊 2.4 檢測模塊 2.5 API模塊 2.6 工具模塊 2.7 數據模型、配置文件、主程序 三、項目結果展示 3.1 數據庫展示 3

原创 Python-實現多元線性迴歸算法

#!/usr/bin/env python # coding: utf-8 # In[8]: #下面是數據庫的一些操作 import pandas as pd import pymysql import seaborn as sn

原创 NoteExpress中PDF批量自定義重命名

有了Endnotes還需要NoteExoress嗎?以前的我也覺得不需要,後來當我忘記每下一篇文獻就從CNKI導出對應的Endnotes格式的時候,我知道,不得不下了。因爲Endnotes不會對中文文獻的PDF進行自動更新補全。下面介紹N

原创 Notepad++ inconsistent use of tabs and spaces in indentation

Tab和空格混用,在某些時候是不行的,因爲Tab有時候不代表四個空格 在NotePad++中遇到該問題,可以打開視圖進行修改 將空格或製表符統一  

原创 綜述的參考文獻導入Endnote

看到了一篇極好的綜述性文章,如何將其參考文獻導入Endnote進行管理呢,由於英文綜述文章更好操作(省略cnki這個工具),我們以中文綜述爲例,你需要三個工具,WOS,Google Scholar,Endnote。步驟如下: 一、首先在W

原创 Python-批量修改文件名-文獻重命名

In [47]: import re In [48]: import sys In [49]: import os In [50]: cur = os.getcwd() In [51]: cur Out[51]: 'F:\\天

原创 Python調用Shell的常見操作

# 第一種,使用os.system方法,這種方法無法獲取輸出結果 import os os.system('ls') # 第二種,使用os.popen方法,這種方法可以獲取輸出 import os stream = os.popen

原创 解決: This Python interpreter is in a conda environment, but the environment has not been activat

其實這個報錯啥也不影響,可是就是看着不舒服,咋辦 有一種解決辦法,就是你再重新裝個python,不要在命令行端使用Anaconda的自帶python 網絡的第二種解決辦法,命令行運行activate,輸入python即可,實踐證明僅單次

原创 解決:File "C:\Python351\lib\site.py", line 419, in register_readline

進入對應的history.py文件,例如E:\Anaconda\Lib\site-packages\pyreadline\lineeditor,修改第82行如下,即可。 for line in open(filename, 'r', e