寫在前面:
爬蟲今天停更一天,今天是週六,今天要把最近網課學習SPSS課程做個總結和回顧,明天繼續更新爬蟲的內容,今天這篇文章主要是SPSS中的數據管理,一些關於數據的簡單操作,是屬於SPSS中比較基礎的內容,希望看完博客能動手親自實踐一下,會有奇效
文章目錄
SPSS數據管理:
1.數據的錄入:
1.採用SPSS軟件將原始數據進行錄入
2.採用其他軟件錄入,保存爲其他數據格式的資料,如xls,txt(有格式的).sys等
SPSS中的數據文件格式:
😐
數據文件 | 文件拓展名 | 對應窗口 |
---|---|---|
數據文件 | .sav | 數據編輯窗口 |
語法文件 | .sps | 語法編輯窗口 |
輸出文件 | .spv | 結果管理窗口 |
腳本文件 | .sbs | 腳本窗口 |
在SPSS中打開對應格式的文件,根據提示保存和修改自己需要的格式
重要的是變量視圖中的變量的一些屬性
2.數據的保存:
SPSS能夠把數據保存爲各種數據的格式
3.數據的整理:
在數據分析之前,往往需要對數據進行整理.
1.數據合併
- 數據量很大時,經常需要將一份大的數據分成幾個小部分,將這些若干個小的數據文件合併成一個大的數據文件,是進行各種統計分析的前提
數據 ---->添加數據
合併類型:
1.縱向合併
:是幾個數據集中的數據的縱向相加,組成一個新的數據集,新數據集中的數據就是原來幾個數據集中的總和,實質就是兩個數據文件的變量列,按照各個變量名的含義,一一對應進行首尾連接合並,兩個數據文件的變量相同,合併的目的是增加分析個案.(添加個案)
合併條件:
- 兩個待合併的SPSS數據文件,其內含合併是有意義的
- 爲方便合併,在不同數據文件中,內容含義相同的列,最好起相同的名字,變量類型和變量長度也要儘量相同
2.橫向合併
;按照記錄的次序,或者某個關鍵變量的數值,將不同數據集中的不同變量合併爲一個數據集,新數據集中的變量數是所有原數據集中不重名變量的總和,實質就是將兩個數據文件的記錄,按照記錄對應,一一進行左右對接,合併的兩個數據文件的變量不同,但具有相同個案例數.(添加變量)
合併條件: - 如果不是按照記錄號對應的規則進行合併,則兩個數據文件必須至少有一個變量名相同的公共變量,這個變量是兩個數據文件橫向對應相等的依據,稱爲關鍵變量.如學號,貴賓卡號等(這個變量的值在同一個數據集中必須是唯一的,不然也不能作爲關鍵變量)
- 如果是使用關鍵變量進行合併的對應,則兩個數據文件都必須事先按關鍵變量進行升序排列(必須做的,容易出錯)
- 爲方便SPSS數據文件的合併,在不同數據文件中,數據含義不相同的列,變量名應該爲不同的名稱
2.數據個案的拆分:
- 在進行統計分析時,只需要對具有某種特性的數據進行分析,俺麼就涉及到分組分析,則可以通過查分數據集加以實現,它能夠使數據分析過程暗戰分組變量進行分組分析,得到各個組的結果.
數據---->拆分文件
3.數據個案的排序
數據編輯窗口個案的前後次序是隨機的,其先後順序是由錄入時決定.在做統計分析時,對數據進行排序,能更好的瞭解數據.
數據 ---->排序個案
完成對職工號進行排序的結果:
4.數據彙總:
數據 ----->分類彙總—函數(選擇合適的函數)
5.數據的加權:
爲了在統計分析中讓計算機知道每個分類或者每一個區間組段的頻數,需要定義權重變量.
權重變量
通常表示每個分類或者每個區間組段的頻數,它是數值變量,且必須取正值.
數據 ---->加權個案—選擇需要加權的變量
6.數據重複查找:
數據—>標識重複個案
7.個案的選擇:
在數據分析過程中,根據不同的要求,需要從SPSS中對所有個案中篩選出特定的個案進行分析,這可以通過給數據表設置選擇條件或者過濾條件,來滿足這一要求.
選擇類型:
- 按條件選擇(常用)
給出一個SPSS條件表達式,選擇符合該表達式的個案. - 按數據範圍選擇(常用)
選擇一定的數據範圍內的全部個案,要求給出數據範圍的上,下界的個案編號 - 隨機選擇
對數據編輯窗口中的所有個案進行隨機篩選 - 過濾變量選擇
指定一個已經存在的變量作爲個案選擇的標準
數據----->選擇個案----寫函數表達式
8.計算新變量:
- 使用SPSS算術表達式及函數,對所有記錄或者滿足SPSS條件表達式的記錄,計算出一個新結果,並將結果存入一個指定的變量中
- 通過使用SPSS算術表達式,SPSS函數,SPSS條件表達式進行實現
轉換-----計算變量----使用SPSS算術表達式,SPSS函數,SPSS條件表達式
求出了性別是男的三門功課的平均成績
9.變量值的重新編碼:
數據分析中,將連續變量轉換爲等級變量,或者將分類變量不同的變量等級進行合併是常見的工作.比如知道班級每位同學的平均成績,但是需要將這些同學的成績分爲優秀,良好,中等,差4個等級,那麼如何通過SPSS功能來完成這一任務呢?重新編碼過程可以很好地完成這一類任務
什麼是重新編碼?
重新編碼
爲相同
變量:對原始變量的取值進行修改,用新編碼直接取代原變量的取值
重新編碼
爲不同
變量:將新編碼存入新的變量,根據原始變量的取值生成一個新變量來表示分組情況.
寫在後面:
說一些題外話,這篇文章比較基礎,寫的也不是很好,但是我感覺最重要的是:基礎的東西,其實你需要實際去操作,才能掌握的更深,同時我最近都會更新關於SPSS做數據分析的系列文章,如果你喜歡,或者你需要這方面的文章不妨一起學習,一起進步?