这一篇就是针对有时候我们需要从文献之中获取Accesion Number来构建系统树,首先我们把pdf转成excel然后提取序列,并做好命名工作。
TBtools批量下载,应该很简单。在如图所示的位置下载就行。
然后是修改名字,这里一般是用两步,第一步删掉除了序列号以外的其他信息,可以用这行命令来执行:
1 | sed -i 's/\.1.*//g' ef1.fasta |
删之前长这样,删后如下:
然后使用 ID rename 功能进行更名
然后就可以进行常规的mafft,gblocks啦
1 | for i in *rename2.fasta;do |