原创 數據分析實戰-Kaggle-手把手Xgboost信用欺詐檢測實例-超詳細完整數據分析項目
目錄 一、題目介紹 1.1 英文題目介紹 1.2 數據集瀏覽 1.3 數據集分析 二、開發環境 2.1 軟硬件開發環境 2.2 開發過程槽點 三、知識儲備及注意事項 3.1 知識儲備 3.2 注意事項 四、實戰代碼 4.1 數據分析 4.
原创 數據分析實戰-Kaggle-Twitter情感識別-基於Spacy的語句提取
目錄 一、題目解析 二、開發環境 三、數據分析過程 一、題目解析 英文題目: "My ridiculous dog is amazing." [sentiment: positive] With all of the tweets c
原创 Python爬蟲項目實戰-Scrapy+Charles+MongoDB+Redis實現分佈式京東全網信息爬取2020最新版
目錄 一、基礎知識 二、開發環境及項目結構 三、結果展示 四、實戰源碼 4.1 數據模型-items.py 4.2 存儲操作(以MongoDB爲存儲數據庫)-pipelines.py 4.3 項目配置-settings.py 4.4
原创 Python爬蟲實戰-官方API怎麼用?結合Socket實現鬥魚實時彈幕抓取-2020最新API
目錄 一、原理概述及結果展示 1.1 計算機網絡基礎知識 1.2 結果展示 二、開發環境 2.1 基礎環境及相關文檔 2.2 Windows環境下nc的配置(因爲windows不支持nc,linux用戶可以直接跳過這一步) 2.3 測
原创 Python爬蟲項目實戰-基於Flask、MongoDB異步構建免費高可匿IP池
目錄 一、基礎項目結構及解釋 二、具體代碼實現 2.1 採集模塊 2.2 校驗模塊 2.3 數據模塊 2.4 檢測模塊 2.5 API模塊 2.6 工具模塊 2.7 數據模型、配置文件、主程序 三、項目結果展示 3.1 數據庫展示 3
原创 Python-實現多元線性迴歸算法
#!/usr/bin/env python # coding: utf-8 # In[8]: #下面是數據庫的一些操作 import pandas as pd import pymysql import seaborn as sn
原创 NoteExpress中PDF批量自定義重命名
有了Endnotes還需要NoteExoress嗎?以前的我也覺得不需要,後來當我忘記每下一篇文獻就從CNKI導出對應的Endnotes格式的時候,我知道,不得不下了。因爲Endnotes不會對中文文獻的PDF進行自動更新補全。下面介紹N
原创 Notepad++ inconsistent use of tabs and spaces in indentation
Tab和空格混用,在某些時候是不行的,因爲Tab有時候不代表四個空格 在NotePad++中遇到該問題,可以打開視圖進行修改 將空格或製表符統一
原创 綜述的參考文獻導入Endnote
看到了一篇極好的綜述性文章,如何將其參考文獻導入Endnote進行管理呢,由於英文綜述文章更好操作(省略cnki這個工具),我們以中文綜述爲例,你需要三個工具,WOS,Google Scholar,Endnote。步驟如下: 一、首先在W
原创 Python-批量修改文件名-文獻重命名
In [47]: import re In [48]: import sys In [49]: import os In [50]: cur = os.getcwd() In [51]: cur Out[51]: 'F:\\天
原创 Python調用Shell的常見操作
# 第一種,使用os.system方法,這種方法無法獲取輸出結果 import os os.system('ls') # 第二種,使用os.popen方法,這種方法可以獲取輸出 import os stream = os.popen
原创 解決: This Python interpreter is in a conda environment, but the environment has not been activat
其實這個報錯啥也不影響,可是就是看着不舒服,咋辦 有一種解決辦法,就是你再重新裝個python,不要在命令行端使用Anaconda的自帶python 網絡的第二種解決辦法,命令行運行activate,輸入python即可,實踐證明僅單次
原创 解決:File "C:\Python351\lib\site.py", line 419, in register_readline
進入對應的history.py文件,例如E:\Anaconda\Lib\site-packages\pyreadline\lineeditor,修改第82行如下,即可。 for line in open(filename, 'r', e