ITSx, Blast
平时我们做一个调查项目,每一份标本都会提取一个its或者lsu的序列, 首先我们需要将所有的序列合并到同一个文件中,然后进行ITSx的分区,最后根据unite的数据库进行blast。
合并序列
1 2 3 4
| list=$(cat list.txt)
for i in $list;do echo ">${i}" >> ./sequences.fasta; grep -v ">" ${i} >> ./sequences.fasta; done
|
ITSx
1 2 3 4
| conda install ITSx
ITSX -i test.fasta -o test --save_regions ITS1,5.8S,ITS2 --partial 10
|
这样我们就分别得到了ITS1,5.8S,ITS2以及ITS全长!可以帮我掐掉5’端的18s,3’端的28s只留下ITS的序列。
Blast
这里主要介绍了大批量的序列合并和unite数据库对比的一个流程,基本上都可以直接复制粘贴了用。
1 2 3 4 5 6
| makeblastdb -in UNITE.fasta -dbtype nucl -out unite
blastdbcmd -db unite -dbtype nucl -info
blastn -db unite -query sequences.fasta -perc_identity 97 -evalue 1e-5 -outfmt 6 -num_threads 20 > zhejiang.csv
|
然后就可以安安心心地去excel里边进行序列的挑选了。