Prokka安装和使用

2023年9月7日下午7:55 • Python • 阅读 42

原核生物基因组快速注释——Prokka

Prokka是一个适用于原核生物的基因组自动注释工具，由墨尔本大学生物信息学家 Torsten Seemann开发。Prokka协调了一套现有的软件工具，可以对原核基因组和宏基因组进行快速高效的功能注释。
目前常用对基因进行注释的工具有两款：Prokka和RAST。在web of science上RAST引用次数6280次，prokka引用次数3177次，但是prokka内置基因CDS预测工具prodigal的引用次数比RAST内置基因CDS预测工具glimmer多一千多次。同时，可能RAST的在线版本降低了其使用的难度，因此使RAST的引用次数较多。相较之下，选择使用Prokka。
Prokka是一款快速对原核生物基因组进行注释的工具，可以在10分钟内完成对一个细菌基因草图的注释工作。

利用conda安装
原本以为利用conda安装so easy，结果都是坑

首先直接用conda安装

conda install prokka

结果一直卡在Solving environment，一顿google，发现可能的原因：
1.可能是由于未使用国内的镜像源，所以非常的慢
2.可能由于conda是比较低的版本，需要更新
尝试了以上两种方式，都不可

最后解决方法是，先创建一个名为prokka的小环境，然后再在prokka环境中安装prokka

conda create -n prokka
conda install -c bioconda prokka

##&#x542F;&#x52A8;&#x548C;&#x9000;&#x51FA;&#x73AF;&#x5883;
To activate this environment, use
    $ conda activate prokka
To deactivate an active environment, use
    $ conda deactivate

BUG
在conda install -c bioconda prokka的过程中安装了很多依赖包，但最后还是报错：

CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https: conda.anaconda.org bioconda noarch perl-bio-tools-phylo-paml-1.7.3-pl5321hdfd78af_3.tar.bz2>
Elapsed: -

An HTTP error occurred when trying to retrieve this URL.

HTTP errors are often intermittent, and a simple retry will get you on your way.

CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https: conda.anaconda.org bioconda noarch perl-devel-stacktrace-2.04-pl5321hdfd78af_1.tar.bz2>
Elapsed: -
</https:></https:>

解决上述报错的方法是，再一次运行conda install -c bioconda prokka，将之前未安装好的依赖包再次安装，结果就成功了。最后显示如下：

Preparing transaction: done
Verifying transaction: done
Executing transaction: done
Retrieving notices: ...working... done

prokka genomic.fna --outdir annotation --prefix test --kingdom Bacteria

参数说明：

#usage
Usage:
 prokka [options] <contigs.fasta>
General:
 --help             This help
 --version          Print version and exit
 --citation         Print citation for referencing Prokka
 --quiet            No screen output (default OFF)
 --debug            Debug mode: keep all temporary files (default OFF)
Setup:
 --dbdir [X]        Prokka database root folders (default '/home6/trainees/miniconda3/db')
 --listdb           List all configured databases
 --setupdb          Index all installed databases
 --cleandb          Remove all database indices
 --depends          List all software dependencies
Outputs:
 --outdir [X]       Output folder [auto] (default '')
 --force            Force overwriting existing output folder (default OFF)
 --prefix [X]       Filename output prefix [auto] (default '') #&#x524D;&#x7F00;
 --addgenes         Add 'gene' features for each 'CDS' feature (default OFF)
 --addmrna          Add 'mRNA' features for each 'CDS' feature (default OFF)
 --locustag [X]     Locus tag prefix [auto] (default '')
 --increment [N]    Locus tag counter increment (default '1')
 --gffver [N]       GFF version (default '3')
 --compliant        Force Genbank/ENA/DDJB compliance: --addgenes --mincontiglen 200 --centre XXX (default OFF)
 --centre [X]       Sequencing centre ID. (default '')
 --accver [N]       Version to put in Genbank file (default '1')
Organism details:
 --genus [X]        Genus name (default 'Genus')
 --species [X]      Species name (default 'species')
 --strain [X]       Strain name (default 'strain')
 --plasmid [X]      Plasmid name or identifier (default '')
Annotations:
 --kingdom [X]      Annotation mode: Archaea|Bacteria|Mitochondria|Viruses (default 'Bacteria')
 --gcode [N]        Genetic code / Translation table (set if --kingdom is set) (default '0')
 --prodigaltf [X]   Prodigal training file (default '')
 --gram [X]         Gram: -/neg +/pos (default '')
 --usegenus         Use genus-specific BLAST databases (needs --genus) (default OFF)
 --proteins [X]     FASTA or GBK file to use as 1st priority (default '')
 --hmms [X]         Trusted HMM to first annotate from (default '')
 --metagenome       Improve gene predictions for highly fragmented genomes (default OFF)
 --rawproduct       Do not clean up /product annotation (default OFF)
 --cdsrnaolap       Allow [tr]RNA to overlap CDS (default OFF)
</contigs.fasta>

Original: https://blog.csdn.net/xq_ing/article/details/127271457
Author: xq_ing
Title: Prokka安装和使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/770635/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python爬虫-实现代理池的检测模块（proxy_test.py）

1.提供一个?run?方法, 用于处理检测代理IP核心逻辑 1.从数据库中获取所有代理IP 2.遍历代理IP列表 3.检查代理可用性1.如果代理不可用, 让代理分数-1, 如果代理…

Python 2023年8月14日
0041
【爬虫实战项目】Python爬虫批量下载网易云音乐飙升榜并保存本地（附源码）

前言今天给大家介绍的是Python爬虫批量下载音乐飙升榜并保存本地，在这里给需要的小伙伴们代码，并且给出一点小心得。首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫，基…

Python 2023年10月30日
0047
PyCharm安装PyQt5及其工具（Qt Designer、PyUIC、PyRcc）详细教程

摘要：Qt是常用的用户界面设计工具，而在Python中则使用PyQt这一工具包，它是Python编程语言和Qt库的成功融合。这篇博文通过图文详细介绍在PyCharm中如何完整优雅地…

Python 2023年11月9日
0093
场景之分页查询设计

一、场景后端开发中，无论是管理后台还是面向普通用户，必不可少的涉及到批量数据的查询，这种查询的结果通产在前端以列表分页的形式展示出来，包含的参数包括，页码pageNum，每页记录…

Python 2023年6月16日
0053
【PyTorch深度学习项目实战100例】—— 使用GRU进行天气变化的时间序列预测 | 第11例

; 前言大家好，我是阿光。本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集…

Python 2023年8月3日
0049
重学逻辑回归【学习笔记】

逻辑回归很简单但是一直不明确来源B站的视频老弓箭【模型】对每个特征加一个权重然后放入sigmoid函数中，得到0-1的值表示概率【公式】【损失函数】交叉熵损失…

Python 2023年10月29日
0044
爬取百度翻译（可中英互译）

由于下学期报了一个Python的入门课程所以我在寒假期间一直在摸索自己。毕竟，我当时的科目不能不及格，也是水到渠成的学分。 [En] So I have been groping…

Python 2023年5月24日
0076
python三维网格图_python 可视化 ploty 画3dmesh网格图

python 可视化 plotly 画3dmesh网格图最近在工作中遇到python 打印可视化3D图。需求是需要根据根据之前用matplotlib打印出来的效果不是很好。发现了…

Python 2023年8月7日
0063
python中flask_caching库用法详解（缓存）

为了尽量减少缓存穿透，并同时减少web的响应时间，可以针对那些需要一定时间才能获取结果的函数和那些不需要频繁更新的视图函数提供缓存服务，可以在一定的时间内直接返回结果而不是每次都需…

Python 2023年8月14日
0039
python 网站爬虫（四） Scrapy讲解

python 网站爬虫（四） Scrapy讲解 ; 1、Spider类 Spider 类是 Scrapy 中的主要核心类，它定义了如何爬取某个(或某些)网站。包括爬取的动作（例如是…

Python 2023年10月5日
0021
Python Pandas操作

文章目录 * – 一、索引操作 – 二、四则运算 – 三、Pandas画图 – 四、文件读取与存储 – 五、缺失值处理 …

Python 2023年8月21日
0036
knn(k近邻算法)——python

目录 1. 基本定义 2. 算法原理 2.1 算法优缺点 2.2 算法参数 2.3 变种 3.算法中的距离公式 4.案例实现 4.1 导入相关库 4.2 读取数据 4.3 读取变量…

Python 2023年8月1日
0040
GeoServer+Django(python3)+leaflet构建地图服务

做个最简单的，地图服务用GeoServer发布；Django做后端转发服务请求，leaflet做前端渲染并实现绘制功能。 Python是python3.7，IDE是社区版pycha…

Python 2023年8月6日
0045
跟羽夏学 Ghidra ——初识

写在前面此系列是本人一个字一个字码出来的，包括示例和实验截图。本人非计算机专业，可能对本教程涉及的事物没有了解的足够深入，如有错误，欢迎批评指正。如有好的建议，欢迎反馈。码字…

Python 2023年10月22日
0040
pytest系列教程——11、用例重复执行、顺序执行、分布式执行

重复执行当我们想要复现某个偶现的问题时候，重复执行测试脚本当然是最好的选择。不用写个循环去执行，pytest提供了 pytest-repeat插件去做这件事。 pip insta…

Python 2023年9月10日
0038
Pytest的使用

1.Pytest安装和介绍 pytest是python的一种单&amp…

Python 2023年9月10日
0031

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Prokka安装和使用

大家都在看