如何快速成爲數據分析師(個人角度)

說來我正式接觸數據分析也快一年,對速成還是有一些心得。優秀的數據分析師是不能速成的,但是零經驗也有零經驗的捷徑。

分享之前我還是要推薦下我自己創建的大數據學習資料分享羣 710219868 代號風火,這是全國最大的大數據學習交流的地方,2000人聚集,不管你是小白還是大牛,小編我都挺歡迎,今天的已經資訊上傳到羣文件,不定期分享乾貨,包括我自己整理的一份最新的適合2018年學習的大數據教程,歡迎初學和進階中的小夥伴。

以上的前提針對入門,目的是達到數據分析師的門檻,順利拿到一份offer,不涉及數據挖掘等高級技巧。我的方法傾向互聯網領域,不論是分析師這個職位,還是運營、產品的能力發展都是適用的。其他領域就仁者見仁了。

市面上有《七週七數據庫》,《七週七編程語言》。今天我們就《七週七學習成爲數據分析師》。

沒錯,七週。

第一週:Excel學習掌握

如果Excel玩的順溜,你可以略過這一週。不過介於我入行時也不會vlookup,所以有必要講下。

重點是瞭解各種函數,包括但不限於sum,count,sumif,countif,find,if,left/right,時間轉換等。

Excel函數不需要學全,重要的是學會搜索。即如何將遇到的問題在搜索引擎上描述清楚。

我認爲掌握vlookup和數據透視表足夠,是最具性價比的兩個技巧。學會vlookup,SQL中的join,Python中的merge很容易理解。學會數據透視表,SQL中的group,Python中的pivot_table也是同理。

這兩個搞定,基本10萬條以內的數據統計沒啥難度,80%的辦公室白領都能秒殺。

Excel是熟能生巧,多找練習題。還有需要養成好習慣,不要合併單元格,不要過於花哨。表格按照原始數據(sheet1)、加工數據(sheet2),圖表(sheet3)的類型管理。

專欄上寫了三篇Excel的文章,比較簡單,大體介紹了Excel應用,可以作爲職場新人的指南。

第一篇數據分析—函數篇。主要簡單講解常用的函數,以及與之對應的SQL/Python函數。

第二篇數據分析—技巧篇。主要簡單講解我認爲很有新價比的功能,提高工作效率。

第三篇數據分析—實戰篇。主要將前兩篇的內容以實戰方式進行,簡單地進行了一次數據分析。數據源採用了真實的爬蟲數據,是5000行數據分析師崗位數據。

下面是爲了以後更好的基礎而附加的學習任務。

瞭解單元格格式,後期的數據類型包括各類timestamp,date,string,int,bigint,char,factor,float等。

瞭解數組,以及怎麼用(excel的數組挺難用),Python和R也會涉及到 list。

瞭解函數和參數,當進階爲編程型的數據分析師時,會讓你更快的掌握。

瞭解中文編碼,UTF8和ASCII,包括CSV的delimiter等,以後你會回來感謝我的。

養成一個好習慣,不要合併單元格,不要過於花哨。表格按照原始數據、加工數據,圖表的類型管理

第二週:數據可視化

數據分析界有一句經典名言,字不如表,表不如圖。數據可視化是數據分析的主要方向之一。除掉數據挖掘這類高級分析,不少數據分析就是監控數據觀察數據。

數據分析的最終都是要兜售自己的觀點和結論的。兜售的最好方式就是做出觀點清晰數據詳實的PPT給老闆看。如果沒人認同分析結果,那麼分析也不會被改進和優化,不落地的數據分析價值又在哪裏?

首先要了解常用的圖表:

各類圖表的詳細介紹可以查看第四篇文章:數據可視化:你想知道的經典圖表全在這

瞭解圖表後,還應該學會報表製作,這裏準備了第五篇:數據可視化:打造高端的數據報表。將教會大家Excel的高級圖表用法。

如果還不過癮,我們得掌握信息圖和BI

BI(商業智能)和圖表的區別在於BI擅長交互和報表,更擅長解釋已經發生和正在發生的數據。將要發生的數據是數據挖掘的方向。

BI的好處在於很大程度解放數據分析師的工作,推動全部門的數據意識,另外降低其他部門的數據需求(萬惡的導數據)。

BI市面上的產品很多,基本都是建立儀表盤Dashboard,通過維度的聯動和鑽取,獲得可視化的分析。第六篇:數據可視化:深入淺出BI 將以第一週的實戰數據學習BI,上圖的就是學習後的成果。

數據可視化的學習就是三個過程,瞭解數據(圖表),整合數據(BI),展示數據(信息化)。

可視化也和審美息息相關,很多直男代表並不擅長做圖,沒關係,抽空可以看書:數據之美 (豆瓣)

PPT也別落下,Excel作圖多練習,不會有壞處的


發佈了31 篇原創文章 · 獲贊 21 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章