qiime2+biom+qiime1獲得16S物種丰度

我們知道,不管是16S等擴增子測序,還是宏基因組,最後最重要的結果,就是物種的丰度情況了,qiime2給出的16S丰度結果是一個計數,對於許多軟件來說這是可用的,那麼如果我們想獲得一個直接的百分比數據應該怎樣做呢?

當然,有許多方法可以實現,比如用shell, R, python腳本,或者再簡單粗暴點,excel解決,透視表,公式,宏等。自己造輪子總是覺得不怎麼踏實,出錯咋辦。那麼,現成的軟件有哪些呢,在這裏,我拋磚引玉,提出一個曲線救國的方法,使用qiime2的前任qiime1解決,稍微做幾步處理即可。如果你有更好的方法,歡迎交流和推薦,我們共同學習的進步!

這裏我就從qiime2得出的結果直接開始,參考了生信菜鳥團大神的推文,這個大神的教程以全面著稱,推薦學習!

1.導出物種分類信息和置信度

獲得taxonomy.tsv,這個文件,其實把qza文件重命名爲zip解壓,或者qzv可視化文件導出,得到的文件也應該是一樣的。

qiime tools export \
   --input-path taxa/taxonmony.qza --output-path taxa

文件是類似這樣一個:

Feature ID Taxon Confidence
#q2:types categorical categorical
OTU_1 k__Bacteria; p__Actinobacteria; c__Actinobacteria; o__Actinomycetales; f__; g__; s__ 0.8316610949745203

2.導出 BIOM 表,並加入將物種分類註釋信息:

這一步就是處理下表頭,讓他兼容biom格式。注意,這個sed在mac下命令不能用,暫不確定是什麼原因,我是用docker-ubuntu解決的。

#處理表頭
sed -i -e '1 s/Feature/#Feature/' -e '1 s/Taxon/taxonomy/' taxa/taxonomy.tsv
#導出otu(feature)表
qiime tools export \
   --input-path deblur_output/table_final.qza \
   --output-path table_exported
#添加物種註釋信息
biom add-metadata \
   -i deblur_output_exported/feature-table.biom \
   -o deblur_output_exported/feature-table_w_tax.biom \
   --observation-metadata-fp taxa/taxonomy.tsv \
   --sc-separated taxonomy
#biom轉換成txt格式
biom convert \
   -i deblur_output_exported/feature-table_w_tax.biom \
   -o deblur_output_exported/feature-table_w_tax.txt \
   --to-tsv \
   --header-key taxonomy

3.qiime1獲利各級分類結果

其實只需要biom格式就好了,唯一不足的是沒有把上幾級別的分類去除,比如屬級別,還包括門綱目科,還不是usearch那種直接就是這個分類的結果。但是根據我的經驗,usearch的物種註釋結果可能不如qiime2的分類效果好,所以怎樣結合這兩個方法是個需要解決的問題。

#結果按門、綱、目、科、屬五個級別進行分類彙總,對應結果的L2-L6
summarize_taxa.py -i result/otu_table3.biom -o result/sum_taxa # summary each level percentage

好的,我的分享就到這裏,期待大家有更好的解決方案。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章