原创 pandas.DataFrame.sample 隨機採樣

一、功能 隨機抽取dataframe中的部分 【行數據】 二、函數 DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=Non

原创 使用清華鏡像源安裝Python包

很多時候我們用pip安裝包時需要等待很長時間,這是因爲我們安裝的包所在的服務器在國外導致的。 這個時候我們就可以選擇國內的一些鏡像源進行pip安裝,常見的有如下幾個pip鏡像源: 清華:https://pypi.tuna.tsin

原创 詳解python執行定時任務的三種方法

方法一、用time模塊中的sleep方法 import datetime import time def do_job(): while True: print(datetime.datetime.no

原创 pd.read_csv()方法的參數:parse_dates使用詳解

parse_dates參數作用: 將csv中的時間字符串轉換成日期格式 1、準備數據 TestTime.csv文件: "name","time","date" 'Bob',21:33:30,2019-10-10 'Jerry',2

原创 基於加權移動平均的數據擴充辦法(Python)

問題背景 在做分析建模時,經常會遇到樣本稀少的情況,例如上市企業的財報數據,每個季度發佈一次,如果一家企業到目前爲止上市了三年,那它的實際樣本數量也就12條,使用這種如此小數量級的樣本量來進行建模會導致模型存在穩定性差、過擬合、泛

原创 python base64格式與圖片之間的互相轉換

前提條件 需要先安裝如下兩個包: pip install base64 pip install PIL 代碼 # -*- coding: utf-8 -*- """ @ModuleName:base64_transfor_pic

原创 將交互式Jupyter Notebook導出到html

windows在cmd中直接輸入下述命令即可: jupyter nbconvert --execute --to html notebook.ipynb 注意:其中notebook.ipynb是源代碼

原创 常用sql語句(備忘錄)

1、刪除表中的列: alter table pmart_per.dm_ty_person_num_important_factor drop column factor_num 刪除表dm_ty_person_num_impor

原创 安裝prophet走過的坑

先安裝:PyStan fbprophet依賴於PyStan,所以首先要安裝PyStan庫。我用的是Anaconda,直接 pip install pystan 然後安裝 :fbprophet 這裏面就出現坑了,直接說答案: co

原创 pandas按若干個列的組合條件篩選數據的方法

按照IIN列等於0,且count_same列等於1篩選dataframe數據: tn = df2[(df2['IIN'] == 0) & (df2['count_same'] == 1)] print(tn)

原创 Python爬蟲教程003:爬取豆瓣電影信息(更加豐富的信息)

# -*- coding: utf-8 -*- """ @ModuleName:demo3 @Function: @Author: H2017824 @Time: 2020/5/12 上午 09:14 """ from urlli

原创 Python爬蟲教程002:爬去豆瓣電影信息

先看代碼,再看結果,最後再看詳細解釋。 代碼 import requests from lxml import etree import re url = 'https://movie.douban.com/subject/12

原创 Python爬蟲教程001:最簡單的爬蟲

前置條件 需要首先安裝requests包 pip install requests 程序: import requests data = requests.get('https://www.baidu.com') data.e

原创 10個非常實用的網址收藏

1、鳩摩搜索 下載各式各樣的pdf,world等資料,各種電子書 https://www.jiumodiary.com 2、嗶哩嗶哩 非常豐富的視頻教程 https://www.bilibili.com 3、慕課網-程序員

原创 華爲機試題解析005:打印順序(python3)

題目描述 某個打印機根據打印隊列執行打印任務。打印任務分爲九個優先級,分別採用數字1~9表示,數字越大優先級越高。打印機每次從隊列頭部取出第一個任務A,然後檢查隊列餘下任務中有沒有比A優先級更高的任務,如果有比A優先級高的任務,則