R之基本統計分析

原創

2018-08-27 07:41

此博客主要評述用於生成基本的描述性統計量和推斷統計量的R函數。

描述性統計分析：關注對連續型變量的中心趨勢、變化性和分佈形狀的分析。
1.用summary（）函數來獲取描述性統計變量
將得到最小值，最大值，四分位數和數值型變量的均值，以及因子向量和邏輯型向量的頻數統計，結合apply（）和sapply（）函數計算所選擇的任一描述性統計量。
擴展：
Hmisc包中的describe（）函數可返回變量和觀測的數量、缺失值和唯一值的數目、平均值、分位數以及五個最大的值和五個最小的值

library("Hmisc")
vars <- c("mpg","hp","wt")
describe(mtcars[vars])
a <- describe(mtcars[vars])
#通過a$來獲取結果
a$counts[1] 即爲觀測數量的值

pastecs包中有一個名爲stat.desc（）函數，它可以計算種類繁多的描述性統計量，其格式爲：

stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)

其中x是一個數據框或時間序列，若basic=TRUE（默認值），則計算其中所有值、空值、缺失值的數量，以及最小值、最大值、值域、還有總和，還有總和。若desc=TRUE（同樣也是默認值），則計算中位數、平均數、平均數的標準誤、平均數置信度爲95%的置信區間、方差、標準差以及變異係數。最後，若norm=TRUE（不是默認的），則返回正態分佈統計量，包括偏度和峯度（以及它們的統計顯著程度）和Shapiro-Wilk正態檢驗結果。這裏使用了p值來計算平均數的置信區間（默認置信度爲0.95）

psych包

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

R之基本統計分析

R之基本統計分析

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結