R之基本統計分析

此博客主要評述用於生成基本的描述性統計量和推斷統計量的R函數。

  • 描述性統計分析:關注對連續型變量的中心趨勢、變化性和分佈形狀的分析。
    1.用summary()函數來獲取描述性統計變量
    將得到最小值,最大值,四分位數和數值型變量的均值,以及因子向量和邏輯型向量的頻數統計,結合apply()和sapply()函數計算所選擇的任一描述性統計量。
    擴展:
    Hmisc包中的describe()函數可返回變量和觀測的數量、缺失值和唯一值的數目、平均值、分位數以及五個最大的值和五個最小的值
library("Hmisc")
vars <- c("mpg","hp","wt")
describe(mtcars[vars])
a <- describe(mtcars[vars])
#通過a$來獲取結果
a$counts[1] 即爲觀測數量的值

pastecs包中有一個名爲stat.desc()函數,它可以計算種類繁多的描述性統計量,其格式爲:

stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)

其中x是一個數據框或時間序列,若basic=TRUE(默認值),則計算其中所有值、空值、缺失值的數量,以及最小值、最大值、值域、還有總和,還有總和。若desc=TRUE(同樣也是默認值),則計算中位數、平均數、平均數的標準誤、平均數置信度爲95%的置信區間、方差、標準差以及變異係數。最後,若norm=TRUE(不是默認的),則返回正態分佈統計量,包括偏度和峯度(以及它們的統計顯著程度)和Shapiro-Wilk正態檢驗結果。這裏使用了p值來計算平均數的置信區間(默認置信度爲0.95)

psych包

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章