SnpEff安装使用及报错解决

使用SnpEff对得到的标记进行注释 在使用gatk挖掘出相应的变异信息之后,需要对得到的变异信息SNP或Indel进行注释,然后再筛选。打算使用SnpEff来进行注释。下载安装SnpEff 去官网 SnpEff找到相应最新版本的下载链接,然后下载到服务器中 直接在官网下载最新版本的软件,然后使用unzip解压即可看见SnpEff文件夹里面...
SnpEff安装使用及报错解决
使用SnpEff对得到的标记进行注释

在使用gatk挖掘出相应的变异信息之后,需要对得到的变异信息SNP或Indel进行注释,然后再筛选。打算使用SnpEff来进行注释。
下载安装SnpEff

去官网 SnpEff找到相应最新版本的下载链接,然后下载到服务器中

直接在官网下载最新版本的软件,然后使用unzip解压即可看见SnpEff文件夹里面有相应的脚本文件
SnpEff使用

首先要将我们需要用到的参考基因组添加到SnpEff的配置文件里面,我是添加在最后一行了

在SnpEff下面新建data文件夹,并在里面新建你添加的物种的文件夹

使用Xftp上传需要的文件:需要参考基因组的染色体水平的fasta文件以及gff文件

上传到指定的XX文件夹之后要将文件名称改SnpEff需要的名字
使用SnpEff的build命令构建参考数据库

直接解压开的文件夹里面需要进行执行的文件没有执行权限,所以先需要给相应的脚本执行权限

使用build命令构建参考物种的数据库

解决思路1(针对个人服务器)

回到SnpEff官网查看需要的Java的版本号,然后再到Java的官网去找到相应的版本,下载安装到服务器上,在修改配置文件指定使用最新安装的Java即可

Java12安装

搜索下载Java12,因为知道需要下载的版本,所以直接搜索Java12找到相应的下载链接(建议使用Bing的国际版搜索)

Java SE 12 Archive Downloads

然后可以看到有12.0.2和12.0.1最下面才是12,找到之后就可以选择相应的链接进行下载

好,那么问题又来了!

在ORACLE下载Java的时候首先你需要先注册,不然下载链接是锁上的;其次登陆之后直接复制下载链接使用wget下载到服务器中很大可能你是下载了一个解压不了的文件(大概是假的哈哈哈)

所以可以考虑将linux版本下载到电脑上,然后使用Xftp上传到指定的文件夹里面,为了方便待会修改环境变量我传到了/usr/java

如果/usr/下没有java文件夹,新建一个即可
2.解压

解压开之后我们可以看到jdk-12的文件夹,切换到该文件夹里面
3. 修改环境变量

修改环境变量,将Java的路径指定为我们刚刚下载解压好的Java12

在配置文件的末尾添加上Java的位置信息

保存退出,然后刷新profile文件,使刚刚新添加的Java位置信息生效
4.确定java的版本信息

确定一下java的版本信息是否显示为我们安装的Java12

至此Java12安装完成,然后测试SnpEff是否能正常使用

解决思路2(针对公共服务器)

对于公共服务器而言,个人用户会受到一些限制,比如在usr下新建文件夹或者更改etc下的profile文件都会受到一定的限制,所以可以取巧。Snpeff其实可以使用conda直接安装,但是不方便更改config的配置文件,但是可以配置需要的java环境呀!

所以可以在手动下载安装snpeff的同时使用conda安装snpeff,这样就可以配置好需要用到的java环境,然后更改手动下载的config文件再使用就好啦!

装好之后查看java的版本,conda安装的java的版本号是"11.0.13"

耶✌我可真是个小机灵鬼
SnpEff创建参考基因组数据库

还是使用build命令去构建参考数据库

终于可以正常使用SnpEff了! 撒花❀(OK,经过一个月的报错警告,发现花撒早了)

研究报错

FATAL ERROR: No CDS checked. This is might be caused by differences in FASTA file transcript IDs respect to database's transcript's IDs.

报错解读:仔细看看报错信息可能是因为cds文件里面的基因ID和基因组不匹配,然后又查看了gff的注释文件发现ID后面有些后缀,所以我将gff文件中的ID后缀全部删除掉了,然后再进行构建数据库

构建数据库

构建之前建议再研究i一下snpeff.jar的帮助文档

因为刚刚的报错中显示No CDS checked.所以考虑直接不检查cds和protein文件,反正这两个也不是必须选项

耶✌好像是构建好了

在对应的物种文件夹下面生成了染色体条数的.bin文件,所以应该是构建好了
snpeff注释变异文件

在存放物种数据库的data文件下面运行注释的命令

然后会得到一些文件,这次尝试大致是成功的开心心。会试着再整理一下内容呐,一个月的尝试辛苦小谢啦

个人感悟:

多尝试多阅读帮助文档,不抛弃不放弃:要相信自己可以的,可以摆烂一时但不能一直摆烂哦

参考文章:如何使用snpEff创建本地数据库,Building databases2024-10-26
mengvlog 阅读 11 次 更新于 2025-06-20 00:34:34 我来答关注问题0
檬味博客在线解答立即免费咨询

报错相关话题

Copyright © 2023 WWW.MENGVLOG.COM - 檬味博客
返回顶部