數據分析工具篇---Excel

數據導入
1.文本導入:數據-文本-語言-格式調整-Tab-分隔符(選擇)-設置格式-完成
2.數據庫導入:Access-數據透視表
3.網站導入:網站-網址粘貼–選擇導入數據(黃色+)-鼠標右鍵-刷新/屬性,刷新頻率
數據清洗
重複數據處理
1.數據透視表:推薦使用方法,唯一值,重複次數也可知
選中區域-插入-數據透視表-行標籤(唯一值)-彙總(計數,重複次數)
2.菜單刪除法:只能得到結果,篩選條件不同,效果不同
選中區域-數據選項卡-數據工具-刪除重複項
3.條件格式標記:只能得到重複值,無法得知重複次數和去重結果
選中區域-開始選項卡-條件格式-重複值
4.高級篩選:只能得到去重結果,不知重複幾次
數據選項卡-排序和篩選-高級-選擇不重複記錄
5.函數法:countif 重複值重複幾次,無去重結果
函數用法:=countif(range,criteria)
參數range 表示條件區域——對單元格進行計數的區域。
參數criteria 表示條件——條件的形式可以是數字、表達式或文本,甚至可以使用通配符。

合併單元格數據處理
取消單元格合併,並自動填充
定位條件:Ctrl +G/ F5 ,定位條件爲空值
自動填充: = ↑ Ctrl Enter

空格數據處理
a.查找替換 : Ctrl + H
b.函數法 : trim函數 用法:= trim(目標單元格)
(可搭配VLOOKUP一起使用,當關鍵字段有空格時,VLOOKUP不能正常使用,應先用trim函數處理)

數據合併
字段合併:將某幾個字段合成一個新字段
函數法:concatenate 或 &
用法:=concatenate(text1, [text2], …)
text1,text2可以是文本或者數值,項與項之間必須用逗號隔開。
&用法:目標單元格1 &目標單元格2 例:=A1&B1
注:
文本型數據(靠左排列) 無法計算(中間需要添加”-“)或 用&字符合並
數值型數據(靠右排列) 可以直接計算

字段匹配:將原數據表沒有的,但其他數據表中有的字段,通過共有的關鍵字段進行一一對應。

單條件:VLOOKUP(精確匹配)/ index+match 組合函數.
用法:=VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
1、lookup_value-判斷的條件(索引列)
2、table_array-跟蹤數據的區域(以索引列到目標列的之間範圍)
3、col_index_num-返回第幾列的數據
4、range_lookup是否精確匹配(0/1)
注:目標列一定要在索引列之後,且跟蹤數據區域要以索引列開頭;如果查詢列在索引列後,要麼改動數據使之前移,要麼使用index+match組合。

用法:
MATCH函數(返回指定內容所在的位置)
=MATCH(lookup-value,lookup-array,match-type)
1.lookup-value:表示要在區域或數組中查找的值,可以是直接輸入的數組或單元格引用。
2.lookup-array:表示可能包含所要查找的數值的連續單元格區域,應爲數組或數組引用。
3.match-type:表示查找方式,用於指定精確查找(查找區域無序排列)或模糊查找(查找區域升序排列)。取值爲-1、1、0 。其中0爲精確查找。

INDEX函數(返回制定位置中的內容)
= INDEX(array,row-num,column-num)
1.array:要返回值的單元格區域或數組。
2.row-num:返回值所在的行號。
3. column-num:返回值所在的列號。

組合:=INDEX(C:C,MATCH(B1,A:A,0))
優點:查詢效果與VLOOKUP一樣,且不必查詢列在索引列之後。

多條件:SUMPRODUCT數組函數 、SUMIFS函數、高級篩選法.
SUMPRODUCT 優點:自動更新,數據量大,打開文件計算慢 缺點:僅支持數值型匹配結果,不支持文本。
SUMIFS 優點:比上述函數簡單,自動更新,數據量大,打開文件計算慢 缺點:僅支持數值型匹配結果,不支持文本。
高級篩選法​​ 優點:簡單方便、快捷、支持文本 缺點:手動更新。

記錄合併:將具有共同數據字段結構但記錄信息不同的數據表合併在一張數據表中
數據抽取:保留原數據表中某些字段記錄信息形成新字段新紀錄
字段拆分
a.菜單法 數據選項卡-分列
數據-分列-選擇位置-設置單元格-設置忽略列 (可完成只提取目標字段,保留原始字段,截取某一字段中的部分信息)
b.函數法(Mid,left,right)

數據計算
簡單計算:+ - * / 直接在單元格內編寫公式即可。

函數運算
日期運算:函數法
NETWORKDAYS(B2,C2) B2到C2有多少個工作日
NETWORKDAYS(B2,C2,$G2:2:H$2) B2到C2,扣除節假日有多少個工作日
NETWORKDAYS.INTL(B2,C2,11) 每週單休有多少個工作日
WORKDAY(C2,3) C2日期3個工作日後是哪天
DATEDIF (起始日期,結束日期,日期格式參數) 日期格式參數:Y-年 M-月 D-日 在單元格內輸入公式“=DATEDIF(B2,C2,“Y”)" 注意:公式只能手動輸入,公式標點都是英文狀態下輸入。

數據標準化
作用:將數據按比例縮放,使之落入一個特定區間。功能:消除變量間的量跟關係,不同單位,從而使得數據具有可比性。
常用數據標準化方法爲0-1標準化 :X*=(X-MIN)/(MAX-MIN)
=C2-MIN($C2:2:C14)/MAX(14) / MAX(C2:2:C14)MIN(14)-MIN(C2:2:C$14)

數據分組
a.IF數據分組: 判斷條件,滿足條件結果,不滿足函數結果。 缺點:有層數限制,對邏輯思維要求高,易出錯且麻煩。
b.VLOOKUP(模糊匹配) 從右往左找用IF{1,0}實現 實現左開右閉區間,根據自己的數據特徵,把數據調到一個根本不可能出現的值,比如20.000000000001.

數據轉換:數據行列轉置 菜單法-選擇性粘貼

數據類型
1.文本-數值 選擇性粘貼-運算 X1或+0,運算 智能標記-轉換爲數字 選中數據後出現黃色歎號標記 轉數字 數據-分列 第三步選數字
2.數值-文本 數據-分列 第三步 文本 TEXT函數 插入函數 第一個參數A2單元格,第二個參數數字顯示位數 =TEXT(A2/10000,“0.0萬”)
3.數值-日期 設置單元格格式-日期 數據分列-日期
4.數據轉換 :二維轉一維 數據透視表法:多重合並計算(ALT+D+P) 調出嚮導,多重合並計算數據區域,下一步,下一步,選擇二維表,添加,雙擊透視表最後一個格。

數據分析(數據透視表)
對比分析 : 日期分組 、環比分析 、同比分析
結構分析 :定性分組(事物屬性分析)、佔比分析
分佈分析 :定量分組
交叉分析 :(2個或2個以上分組變量關係)
矩陣分析 :(根據事物的兩個重要屬性,進行關聯分析,找方法)
多表關聯分析 : 將數據表添加至“數據模型”中,插入數據透視表,建立數據表之間的關係。

RFM分析:根據客戶活躍程度和交易金額貢獻,進行客戶價值細分的一種方法。 指標 R 近度 最近一次購買時間間隔 數值越大,表示客戶越久未發生交易 F頻度 最近一段時間內購買次數 數值越大,表示客戶交易越頻繁 M額度 最近一段時間內購買金額 數值越大,表示客戶價值越高。

快捷鍵
Ctrl + shift + 方向鍵 快速選中方向鍵的區域表格
Alt + enter 換行符快捷鍵
Alt + = 自動求和
Ctrl + 1 單元格格式對話框

小技巧
a.開始 填充 序列 可完成對數字日期工作日等快速填充
b.以文本形式輸入數據 :半角 單引號+數據(與短日期形式相同的數據 應以文本形式輸入)
c.快速顯示日期是周幾,可採用複製一列日期後,調整日期格式,星期顯示
d.常用單元格設置:千 0,k 萬 0!.0,萬
e.數據有效性 數據驗證 可以規範數據的填寫

谷歌表格最常用的函數
IMPORTRANGE函數
作用:從指定的電子表格中導入相應範圍的單元格。
語法:IMPORTRANGE( 谷歌表格地址 , “[表單名!]範圍” )
=IMPORTRANGE("http網址,“表單名!引用範圍”)

Query函數
作用:Google query語法類似於SQL,可以便捷的更換數據列的位置、按需求聚合數據。
語法:=Query(‘表單名’!引用範圍,“查詢語句”)
=Query(‘測試表格’!A:Z,“select A,B,D,F, limit 1000”)
查詢語句:類似SQL語句。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章