原创 django基礎課程-2

安裝了所需要的軟件,熟悉了一些基本命令,就可是進行實戰操作,總會遇到一些問題,如下: 一 .根據視頻操作,執行django-admin.py startproject hello_django(命名爲hello-django,會提示Com

原创 通過哈希的鍵來去掉數組中的重複值

 通過哈希鍵不存在重複值的屬性,可以去掉數組中的重複值 #!/usr/bin/perl use strict; my %hash = (); my @array = (2,3,4,6,89,56,35,38,4,6,89); f

原创 perl學習筆記 - 輸入與輸出

鑽石操作符 <>  :從用戶指定的位置讀取輸入(一般用於讀取用戶的輸入文件) 注意: 1,<>會處理所有的輸入,直到所有輸入的結尾爲止 一般在一個程序中只有一個<>,若出現多次則可能發生錯誤。 2,調用參數@ARGV  @ARGV 是一個

原创 notepad++ 正則表達式的簡單應用

1.對於日常需要把如下一列數據轉換爲'A','B','C','D'的方法爲:在正則表達式的循環查找模式下,輸入查找目標爲([\w\W]+?)\r\n  , 替換爲 '\1', A B C D 2.對於ACE,ADA,BAX,CAPS轉換爲

原创 用python寫的一些小應用

1.根據一個表格是基因,一個工作簿裏不同的癌種基因信息放在不同的表格中,要查找表1的每個基因在工作簿裏的哪些癌種中存在 #!/usr/bin/env python # encoding=utf-8 # 目的是根據基因在另一個工作簿中各

原创 java 字符串基礎操作

1.“==”本身是進行數值比較的,而如果在對象之中進行比較,常進行的是對象內存地址的數值比較,而沒有進行內容的比較,如果要進行內容的比較,而需要使用String類中的一個方法        內容比較:public boolean  equ

原创 利用python生成二維碼 以及批量生成二維碼

常見的兩種簡單生成二維碼方法,目測均是很好用的 1.MyQR  要求是python3 ,並且二維碼上的內容不支持中文   #1.生成普通二維碼 #在程序中導入MyQR包下的模板myqr,其中word參數接收一個字符串作爲二維碼的內容。

原创 對annovar註釋的總結

新的一年到了,到了該更新數據庫的時候了,首先就從常用的annovar軟件以及所使用的數據庫開始更新吧。 1.下載最新版的annovar軟件,annovar.latest版本,需要一個edu的郵箱。 2.下載註釋所用的數據庫,官網上太多,可

原创 利用cBioportal數據庫進行腫瘤基因的挖掘

查找腫瘤靶藥預後風險相關基因位點,在沒有找到相關的腫瘤panel的情況下,可以去cBioportal這個數據庫去根據腫瘤類型查找頻率很高的基因,然後把鼠標放在某個基因上,就會看到圖一提示: 進入OncoKB Cancer Gene Li

原创 把PGM儀器上兩次數據進行合併後再跑variantCaller的流程

因爲一個樣本做了兩次,兩次的深度都不是很大,需要把兩次的數據bam文件進行合併後再運行流程,這時候拿到合併的數據後肯定不能在網頁端進行插件運行了,需要自己把數據拷貝到儀器的服務器,運用相應的軟件以及腳本進行運行了。 1.分別合併兩次的ub

原创 用R做GO功能註釋和KEGG通路富集分析

KEGG -GO主要是使用R 中clusterProfiler包進行富集分析  以及使用pathview 包進行代謝途徑整合和可視化。 進行在線分析的:https://pathways.embl.de/ 1.代碼:https://gith

原创 HLA分型的摸索史

HLA(human leukocyte antigen ,人類白細胞抗原)是人類的主要組織相容性複合體(MHC)的表達產物,該系統是目前所知人體最複雜的多態系統。通過HLA的分型,可以找到疾病的原因,比如免疫系統疾病,超過90%的強直性脊

原创 WES流程-系列一

目前分析WES/WGS的軟件已經很多了,這次主要寫GATK,和samtools mpileup 和bcftools call 流程。 1,需要安裝的軟件 trimmomatic,bwa,samtools,gatk bcftools ,vc

原创 gitforwindows 在windows下進行操作

gitforwindows 看名字,就知道是一個爲windows服務的軟件,可以在windows下進行shell的操作,雖然只是部分,但是也有兩百多個,最常見的也是有的,比如awk,cat,cut,sed,scp等。 進入官網點擊下載,就

原创 統計fastq格式的數據質量值

現在對fastq格式的數據進行統計的軟件也很多 1.FastQC,目前也是用的比較多  2.readfq 用來統計各種質量值 3.fqcheck 我自己用的比較少 ,它會統計每條reads,按read 1-100位點計算每個位置的ACGT