原创 跟着jimmy學docker系列之第3講:爲何不創建自己的docker容器呢?

✎✎✎跟着jimmy學docker系列之第2講:一個軟件一個容器 前面我們說到,在docker倉庫下載的那個容器是錯誤的,因爲它配置的Ubuntu庫文件不夠,所以我更新了,形成了自己的容器jimmy的docker教程——第3講爲何不創建自己

原创 GEO數據挖掘-第一期-膠質母細胞瘤(GBM)

GEO數據挖掘系列文-第一期-膠質母細胞瘤文章標題lncRNAs PVT1 and HAR1A are prognosis biomarkers and indicate therapy outcome for diffuse glioma

原创 第5篇:對ATAC-Seq/ChIP-seq的質量評估(二)——ChIPQC

ATAC系列連載: 第1篇:ATAC-seq的背景介紹以及與ChIP-Seq的異同第2篇:原始數據的質控、比對和過濾 第3篇:用MACS2軟件call peaks 第4篇:對ATAC-Seq/ChIP-seq的質量評估(一)——phanto

原创 TCGA的28篇教程-早期泛癌研究

長期更新列表: 使用R語言的cgdsr包獲取TCGA數據(cBioPortal)TCGA的28篇教程- 使用R語言的RTCGA包獲取TCGA數據 (離線打包版本)TCGA的28篇教程- 使用R語言的RTCGAToolbox包獲取TCGA數據

原创 第4篇:對ATAC-Seq/ChIP-seq的質量評估(一)——phantompeakqualtools

學習目標探討ChIP-seq數據質量低的來源理解鏈交叉相關性( strand cross-correlation)使用phantompeakqualtools計算交叉相關性和其他相關的質控度量值評估交叉相關圖ChIP-Seq質量評估在下游分

原创 下載文件一定要md5校驗一下

因爲要使用STAR-fusion軟件,其GitHub主頁裏面提到了配置好的數據庫文件,我就想直接下載,如下:├── [ 26G] GRCh37_gencode_v19_CTAT_lib_Nov012017.plug-n-play.tar.

原创 給學徒的GEO作業

首先需要看完R語言及GEO視頻並且嘗試理解代碼在:https://github.com/jmzeng1314/GEO 視頻在: https://www.bilibili.com/video/av26731585/作業1看懂文章:https

原创 blast簡介及格式解讀及練習題

01blast產生背景雙序列比對可以採用是基於動態規劃算法的Needleman-Wunsch(NW)和Smith-Waterman algorithm(SW)算法,雖然精度高,但計算消耗大。當與數據庫比對的時候,該算法就顯得不切實際。因此

原创 在R裏面對座標進行基因組區域註釋

座標註釋最簡單的生物學應用就是peaks區域的註釋,通常我們可以使用linux的各種軟件加上gtf等格式的基因組註釋信息來完成,在R裏面當然也是可以輕鬆完成的啦!假設有如下格式的座標:> head(pos) chr star

原创 Conquer-對單細胞數據差異表達分析的重新審視

隨着單細胞測序技術的流行,我們對複雜疾病和性狀的理解從patient,tissue的表達譜(bulk RNA-seq)到單個細胞的表達譜(single cell RNA-seq)。究其原因,在於bulk RNA-seq產生的是一個細胞羣體的

原创 第2篇:原始數據的質控、比對和過濾

專題目錄:1、第1篇:ATAC-seq的背景介紹以及與ChIP-Seq的異同2、這部分內容包括對原始測序數據質控,然後比對過濾,這是所有NGS數據處理的上游分析。ATAC-Seq與其他方法不同的一點是需要過濾去除線粒體(如果是植物,還需要過

原创 CRISPR相關公司的股價大跌背後的故事

CRISPR基因編輯技術 被稱爲基因魔剪的CRISPR-Cas9(Clustered Regularly Interspaced Short Palindromic Repeats)技術是當前發展最爲迅速、關注度和應用範圍最爲廣泛的一類基因

原创 TCGA的28篇教程-所以癌症的突變全景圖

長期更新列表: 使用R語言的cgdsr包獲取TCGA數據(cBioPortal)TCGA的28篇教程- 使用R語言的RTCGA包獲取TCGA數據 (離線打包版本)TCGA的28篇教程- 使用R語言的RTCGAToolbox包獲取TCGA數據

原创 第1篇:ATAC-seq的背景介紹以及與ChIP-Seq的異同

【ATAC-Seq簡介】ATAC-seq(Assay for Transposase-Accessible Chromatin with high throughput sequencing) 是2013年由斯坦福大學William J.

原创 把含有多樣本的vcf文件拆分

參考:https://www.biostars.org/p/224702/ 非常多已經造好的輪子可以完成,包括bcftools,vcftools,還有大名鼎鼎的GATK,隨便舉例如下:module load java/1.8.0_91 GE