原创 pandas如何將相同ID的字符串進行合併

寫在前面:說來真的很巧,先是有個人在一個qq比賽羣裏扔了這個問題,我覺得很有意思,然後自己嘗試了下,就將自己寫的一段代碼發給了他。事後,在一個微信公衆號的推文裏,看到這篇文章數據城堡參賽代碼實戰篇(三)—我們來探究一個深奧的問題

原创 今日頭條數據分析師分享有感

寫在前面: 這篇文章是聽了Bittiger邀請今日頭條的數據分析師潘老師做的一個分享之後,與自己的思考一起形成的總結,在她的分享中主要講了SQL的基本語法,在後面的答疑環節提到一些數據分析師相關的日常工作內容。據此,本文的outl

原创 "module 'pip' has no attribute 'main'"&"name pip is not defined"

起因: 之前安裝了pymongo用來存儲爬取的數據,後來想嘗試用Python操作MySQL,於是需要安裝pymysql的包,結果總是提示我的pip版本問題,我就索性更新了pip。結果,pip更新之後,接下來所有的包的安裝都提示標題

原创 Excel中倒排數據

OUTLINE: 問題 解決方案 問題: “倒排”不同於“倒序”,倒序是將一列數按照數值大小進行升序或者降序排列,而倒排是指給一列數據翻個個,前後數據的順序進行顛倒。 解決方案: 利用Excel中的“添加輔助列+自定義排序+對

原创 CSDN中上傳GIF圖片

環境:mac系統 軟件:licecap(一個非常好用的mac錄屏軟件) 網盤密碼:9lth 效果:

原创 "wordcloud2"

OUTLINE: 相關的可以生成詞雲的途徑 wordcloud2 相關的可以生成詞雲的途徑 wordle 介紹:從文本生成詞雲圖 網址:http://www.wordle.net 優點:及時調用 缺點:電腦需已安裝J

原创 python的去重以及數據合併的用法

OUTLINE: drop_dupicates merge drop_dupicates 參數含義: subset:即表示要去重指定參考的列 keep : {‘first’, ‘last’, False}, default

原创 用Python實現一個微信機器人

OUTLINE: 所需環境 實現代碼 所需環境 Python 3.5.3,pycharm professional版,預安裝”wxpy”包 方法一:電腦終端中 pip3 install wxpy 方法二:在file –

原创 Python中的groupby分組

寫在前面:之前我對於groupby一直都小看了,而且感覺理解得不徹底,雖然在另外一篇文章中也提到groupby的用法,但是這篇文章想着重地分析一下,並能從自己的角度分析一下groupby這個好東西~ OUTLINE 根據表本

原创 Vlookup

寫在前面:接着上一篇的數據透視表的內容,這篇着眼於Excel的Vlookup函數。 OUTLINE 什麼是Vlookup Vlookup怎麼用 適用場景 什麼是Vlookup Vlookup從它的功能上來看,就是爲了查找表

原创 Python中隨機數的生成

在Python中可以用於隨機數生成的有兩種主要途徑,一是random模塊,另一個是numpy庫中random函數。 OUTLINE random模塊 numpy中的random函數 總結 random模塊 random模塊中

原创 python爬蟲資料彙總

1、崔應才老師的博客 裏面包含四個系列:爬蟲入門、爬蟲實戰、爬蟲利器和爬蟲進階。 最棒的是裏面對各個爬蟲相關的庫做了詳細的介紹。 2、天善學院崔老師的課程:爬蟲三大案例實戰 裏面包含三個案例: 分析Ajax抓取今日頭條街拍

原创 數據透視表

寫在前面:最近給自己立下一個任務:掌握Excel中的數據透視表、Vlookup,如果還有餘力可以再掌握其VBA基礎。而因爲已經具備編程基礎,所以我認爲學習VBA應該也不是什麼難事,前兩種的話,希望可以達到在簡歷上寫“熟練使用Ex

原创 Mac中R的更新

環境:Mac os系統 已安裝R的版本:R3.4.1 需求:本想安裝wordcloud2包,結果該包只支持3.4.3之後的版本,故想升級R 常見的更新R的辦法 我所遇到的問題及解決方案 常見的更新R的辦法 前提:你已安裝

原创 Pandas兩種主要的數據結構

OUTLINE Series pandas pandas中的數據結構主要包括兩種,一種是Series,一種是dataframe。 Series Series表示一維數據,可以簡單理解爲一個向量,但是不同於向量的是,Seri