原创 DataFrame多條件篩選

兩種方法: 1.使用query()方法,也是自己最常用的方法,數據量大的時候較快,語法較爲簡單; 2.使用 df[(df.c1==1) & (df.c2==1)] 的格式,注意這裏的()不能省略 ,雖然在Python條件判斷中 >、<、

原创 octave安裝包pkg install命令及可選參數

兩種方法 法一: 網上最多推薦的 pkg install -forge 包名,但沒有成功 ,可能是公司無線網太不穩定 法二: http://octave.sourceforge.net/packages.php 找到需要的包並下載

原创 pandas 分組排序並保留原始列

場景 需要按照各個省份及全網進行分組,對各個指標的率值進行排序。 其實這一步一般是在sql中完成的,但由於 要分組排序的列較多,達30列以上,代碼十分不簡潔,python一兩行即可搞定 連接的數據庫爲mysql,本身沒有ro

原创 ambiguous column name 錯誤

平時一般的錯誤: 如果 join了兩個表,兩個表同時含有一個某列col1,但沒有指定col1的表名,如下 select col1,col2 from a left join b on a.col1=b.col1 where col1>1

原创 使用vba進行excel超鏈接設置(鏈接到當前文檔某一單元格)

最前面直接說怎麼做,使用 sheet.Hyperlinks.Add  添加link,目的位置 anchor ,address 如果是本文件就空着,subaddress寫sheet名稱和位置,TextDisplay 顯示的文字。 For

原创 分組隨機採樣 事例:隨機抽取撲克牌

# -*- coding: utf-8 -*- """ Created on Wed Jul 4 17:14:41 2018 @author: Administrator """ '''隨機採樣''' '''21點計數 H 紅桃 S

原创 ndarray 花式索引與take函數比較

In [117]: arr4 = np.random.randn(2000,5) In [118]: inds = np.random.permutation(2000)[:500] #隨機取500個index In [120]: %

原创 DataFrame 按照字符串長度進行排序 iat 和 iloc兩種不同方式的耗時

數據共有如下幾列,100行左右Index(['區域', '網點名稱', '網點編碼', 'S', 'M', 'L', 'XL', 'XXL', 'XXXL', '4XL', '5XL', '總計:']''' 法一 使用循環 按照行遍歷''