ITSx, Blast
平时我们做一个调查项目,每一份标本都会提取一个its或者lsu的序列, 首先我们需要将所有的序列合并到同一个文件中,然后进行ITSx的分区,最后根据unite的数据库进行blast。
合并序列
1 2 3 4
   |  list=$(cat list.txt)
  for i in $list;do echo ">${i}" >> ./sequences.fasta; grep -v ">" ${i} >> ./sequences.fasta; done
 
  | 
 
ITSx
1 2 3 4
   |  conda install ITSx
  ITSX -i test.fasta -o test --save_regions ITS1,5.8S,ITS2 --partial 10
 
  | 
 
这样我们就分别得到了ITS1,5.8S,ITS2以及ITS全长!可以帮我掐掉5’端的18s,3’端的28s只留下ITS的序列。
Blast
这里主要介绍了大批量的序列合并和unite数据库对比的一个流程,基本上都可以直接复制粘贴了用。
1 2 3 4 5 6
   |  makeblastdb -in UNITE.fasta -dbtype nucl -out unite
  blastdbcmd -db unite -dbtype nucl -info
  blastn -db unite -query sequences.fasta -perc_identity 97 -evalue 1e-5 -outfmt 6  -num_threads 20 > zhejiang.csv
 
  | 
 
然后就可以安安心心地去excel里边进行序列的挑选了。