抱歉,您的浏览器无法访问本站

本页面需要浏览器支持(启用)JavaScript


了解详情 >

Rename Sequences by TBtools

这一篇就是针对有时候我们需要从文献之中获取Accesion Number来构建系统树,首先我们把pdf转成excel然后提取序列,并做好命名工作。 TBtools批量下载,应该很简单。在如图所示的位置下载就行。 然后是修改名字,这里一般是用两步,第一步删掉除了序列号以外的其他信息,可以用这行命令来执行: 1sed -i 's/\.1.*//g' ef1.fasta ...

ITS的批量处理和BLAST比对

ITSx, Blast 平时我们做一个调查项目,每一份标本都会提取一个its或者lsu的序列, 首先我们需要将所有的序列合并到同一个文件中,然后进行ITSx的分区,最后根据unite的数据库进行blast。 合并序列1234# 行云流水list=$(cat list.txt)#合并序列for i in $list;do echo ">${i}"...

r8s 计算分化时间

r8s计算分化时间1. 下载与安装我不知道为什么网络上的下载路径都被禁用了,所以我找了一个网上下载的地方r8s download | SourceForge.net直接点这个链接也是可以的,https://sourceforge.net/projects/r8s/files/r8s1.81.tar.gz/download,这个版本是r8s 1.81,不是张金龙的1.71版,不过应该差不多,或...

MCMCtree 计算分化时间

目前我知道的可以做物种分化时间计算的软件主要有beast,beast2,r8s,paml的mcmctree,还有Nagy论文中的PhyloBayes (R package)。目前呢,我是尝试使用了beast2,非常的慢,我84个物种接近50万AA (amino acids) 每100万代运算时间差不多27h,但是一般设置是1亿代也就是需要100多天,年都过完了。暂且不提,所以开始尝试MCM...

单拷贝直系同源基因的比对结果TrimAI处理

对于单拷贝直系同源基因的比对结果,常规操作是用Gblocks进行处理,但是Gblocks会删的比较彻底,以至于好多基因的文件夹都是空的,所以这次尝试了用TrimAI来进行删除。 1234# trimal提取保守序列 for i in *.mafft;do trimal -in $i -out $i.trimal -automated1;done 然后就又遇到一个新的问题,那就是trim...

Busco和基因组大小统计

小黑的碎碎念: 最近接到的二代测序基因组数据基本上都是100个一起的,工作量比较大,也很难找到对应的处理包或者源代码,所以自己写的比较多,做一期codes合辑总结一下。 目前呢,自己掌握比较熟练的是R和Python,但是这俩常年不用,而且对文本的处理非常之麻烦,所以在做基因组分析的时候还是尝试了不太熟悉的Perl和Shell,算是感受了一把掌握多种编程语言的快乐吧~ 这几行的目的是从bu...

NGS20220312

NGS 分析流程首先,拿到的数据。 0. 去PCR重复(可选)Fastunique 1. 数据质控(可选)12fastqc -o fastqc -t 20 Ge1416_FDSW202317667-1r_R1.fq.gzfastqc -o fastqc -t 20 Ge1416_FDSW202317667-1r_R2.fq.gz 输出的文件: 2. 数据清洗1fastp -i Ge1416...

WSL_Mrbayes

Win子系统多线程Bayes构建1. win子系统的安装ubuntu(1)启动开发人员模式Windows系统设置 -> 更新和安全 -> 开发者选项 -> 开发人员模式 (2)打开window 子系统 linuxWindows系统设置 -> 应用 -> 程序和功能 -> 启动或关闭windows功能 -> 适用于Linux的Windows子系统 ...

浅层基因组测序的系统发育分析

    继上一次浅层基因组数据分析笔记 - Mushroom Monkey (jungleblack007.github.io)之后,我们发现Orthofinder很多情况下能找到的单拷贝直系同源基因非常少,而且文章里面也没有使用这种方法。     这次,我要构建蘑菇目的系统发育树! 下载蛋白序列    这个没啥好说的,JGI Genome Portal - Home (doe.gov)可以...

从浅层基因组测序到系统发育树的构建

Miniconda3环境安装 -> 质控 -> 组装 -> 预测 -> 提取单拷贝直系同源基因 -> 建树