原创 R-數據科學(六):數據框-表格重塑

R語言中數據框的操作除了單表操作、雙表操作以外,還有一個非常重要的操作是表格重塑,它的作用更爲實際,因爲在我們處理真實數據的時候,往往需要通過重塑表格來對收集到的數據集進行一個預處理。 數據集的預處理主要分爲兩類: 整體預處理:

原创 R-數據科學(三):向量

文章目錄1 向量的創建2 向量的操作2.1 選擇向量中的元素2.2 數值型向量的運算2.3 數值型向量的排序2.4 字符型向量的操作2.5 向量的去重2.6 向量的交集、並集、補集 之前我在R-數據科學(一):數據結構中初步介紹了

原创 R-數據科學(一):數據結構

文章目錄向量向量類型向量的創建向量中元素的訪問矩陣矩陣的創建矩陣下標的使用數組數組的創建數據框數據框的創建選取數據框的元素因子因子的創建列表列表的創建列表中對象的提取處理對象的通用函數數據轉換特殊數據參考資料 R擁有許多用於存儲數

原创 R-可視化(七):密度圖、箱線圖、小提琴圖

1.密度圖 library(ggpubr) df <- ToothGrowth df$dose <- as.factor(df$dose) p <- ggdensity(df, x = "len",

原创 ESTIMATE包計算腫瘤純度

介紹 腫瘤組織中的正常細胞不僅在分子研究中影響腫瘤信號,而且在癌症生物學中也起着重要作用。 估計包使用基因表達數據預測腫瘤組織中基質細胞和免疫細胞的存在。 示例 首先使用通過Affymetrix U133Plus2.0平臺從10個卵

原创 多元統計學(二):線性迴歸分析

1.多元線性迴歸 states <- as.data.frame(state.x77[,c("Murder", "Population","Illiteracy", "Income", "Frost")]) fit <- lm(M

原创 R-數據科學(四):數據框-單表操作

文章目錄1 按行操作1. 1 過濾1.2 排序1.3 添加新行2 按列操作2.1 過濾2.2 添加新列2.3 變量重命名3 管道操作 通常我們將EXCLE表格或者分隔符分割的文本文件導入R中進行處理,這些數據在R語言稱爲數據框也可

原创 R-數據科學(九):函數與控制

自定義函數 語法: myfunction <- function(arg1, arg2, ... ){ statements return(object) } 參數解釋: 參數 解釋 myfunctio

原创 R-數據科學(八):矩陣

本文中關於矩陣的內容僅限於R中數據結構,並不涉及線性代數裏面的概念。 在R的數據結構中,矩陣就是摺疊的向量,所以對於數值型向量的運算也可以用在矩陣上。 矩陣的本質 在介紹矩陣的運算前,我們得明白一個概念循環補齊,這對我們認識矩

原创 R-數據科學(二):目錄和文件

文章目錄1 目錄和文件增刪改查3 文件讀取3.1 文本文件讀取3.2 EXCLE文件讀取 R語言可以對目錄和文件進行一些簡單的操作,比如常見的增刪改查,文件的讀取,文件的寫入,對文件進行解壓等。 1 目錄和文件增刪改查 函數

原创 R-數據科學(七):字符串處理與正則表達式

文章目錄1 字符串基礎2 正則表達式實現模式匹配2.1 基礎匹配2.2 錨點2.3 字符類和字符選項2.4 重複2.5 分組與回溯引用3 工具3.1 匹配檢測3.2 提取匹配內容3.3 替換匹配內容3.4 定位3.5 其他操作4

原创 R-數據科學(五):數據框-雙表操作

文章目錄1 rbind()、cbind()函數合併數據集2 dplyr包組合數據集2.1 按行組合2.2 按列組合 在我們分析數據過程中,不僅僅是處理一個數據集,也會組合兩個數據集,這時候就可以用dplyr包進行相關的操作,當然

原创 R-可視化(三):散點圖

1.基本圖形 library(ggpubr) ggscatter(mtcars, x = "wt", y = "mpg", ggtheme = theme_bw()) 2.添加點的標籤 分組添加點的標籤

原创 R-可視化(六):折線圖

library(ggpubr) x = 1:10 df = data.frame(x = x,y1 = x,y2 = x^2, y3 = 2*x,y4 = log2(x)) ggline(df,x

原创 多元統計學(一):主成分分析(PCA)

PCA 主成分計算 library(FactoMineR) library(factoextra) iris.pca <- PCA(iris[,-5], graph = FALSE) iris.pca$var$cor # 因子