CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_014532	Halomonas elongata DSM 2581, complete genome	4 crisprs	cas3f,cas8f,cas5f,cas7f,cas6f,csa3,DEDDh,DinG,WYL,cas3	0	3	6	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_014532_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_014532_1

126711-127158

TypeI-F

I-F

Consensus_repeat	Method
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	PILER-CR
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	CRISPRCasFinder
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	CRT

7 spacers

cas6f,cas7f,cas5f,cas8f,cas3f,cas1

The CRISPR arrays of NC_014532_1

>merge|NC_014532|1|126711-127158|PILER-CR,CRISPRCasFinder,CRT
GTTCGCTGCCGCCCAGGCAGCTCAGAAATCCCGGCGGACGGAAAGCTTGGCAGACCAGCGGTTCGCTGCCGCCCAGGCAGCTCAGAAAAAGGCATAAAGATGAATACATTGAGCTCCCATGTTCGCTGCCGCCCAGGCAGCTCAGAAACAGTGCAGTTGCGAGATCTGTTTGCCATCGTTGTTCGCTGCCGCCCAGGCAGCTCAGAAAGTAAGCGCCGCATGCTGTGGGCGTCACGCCCTGTTCGCTGCCGCCCAGGCAGCTCAGAAATTGCGTCTCGAAGTCCTCAAAGCGCGTAGCATGTTCGCTGCCGCCCAGGCAGCTCAGAAAACATTGCAGCCGTGACCATTCTTGCTGTGATCGTTCGCTGCCGCCCAGGCAGCTCAGAAACAGCCGTCCTGGCTGTAGTCGCTCAGTTGGCAGTTCGCTGCCGCCCAGGCAGCTCACTCC

>NC_014532|1|1|126711-127098|PILER-CR
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	TCCCGGCGGACGGAAAGCTTGGCAGACCAGCG
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	AAGGCATAAAGATGAATACATTGAGCTCCCAT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	CAGTGCAGTTGCGAGATCTGTTTGCCATCGTT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	GTAAGCGCCGCATGCTGTGGGCGTCACGCCCT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	TTGCGTCTCGAAGTCCTCAAAGCGCGTAGCAT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	ACATTGCAGCCGTGACCATTCTTGCTGTGATC
GTTCGCTGCCGCCCAGGCAGCTCAGAAA

>NC_014532|1|1|126711-127158|CRISPRCasFinder
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	TCCCGGCGGACGGAAAGCTTGGCAGACCAGCG
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	AAGGCATAAAGATGAATACATTGAGCTCCCAT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	CAGTGCAGTTGCGAGATCTGTTTGCCATCGTT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	GTAAGCGCCGCATGCTGTGGGCGTCACGCCCT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	TTGCGTCTCGAAGTCCTCAAAGCGCGTAGCAT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	ACATTGCAGCCGTGACCATTCTTGCTGTGATC
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	CAGCCGTCCTGGCTGTAGTCGCTCAGTTGGCA
GTTCGCTGCCGCCCAGGCAGCTCACTCC

>NC_014532|1|1|126711-127158|CRT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	TCCCGGCGGACGGAAAGCTTGGCAGACCAGCG
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	AAGGCATAAAGATGAATACATTGAGCTCCCAT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	CAGTGCAGTTGCGAGATCTGTTTGCCATCGTT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	GTAAGCGCCGCATGCTGTGGGCGTCACGCCCT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	TTGCGTCTCGAAGTCCTCAAAGCGCGTAGCAT
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	ACATTGCAGCCGTGACCATTCTTGCTGTGATC
GTTCGCTGCCGCCCAGGCAGCTCAGAAA	CAGCCGTCCTGGCTGTAGTCGCTCAGTTGGCA
GTTCGCTGCCGCCCAGGCAGCTCACTCC

Protein	Signature genes	Signature genes Name	Protein_function
NC_014532.2\|WP_013330863.1\|122630_124007_+\|type-I-F-CRISPR-associated-protein-Csy1	cas8f	pfam09611_cas8f_CAS-I-F	gnl\|CDD\|378220
NC_014532.2\|WP_013330862.1\|118896_122238_+\|type-I-F-CRISPR-associated-helicase-Cas3	cas3f	cd09673_cas3f_CAS-I-F	gnl\|CDD\|274201
NC_014532.2\|WP_013330868.1\|128947_129226_+\|hypothetical-protein	unknown	unknown	unknown
NC_014532.2\|WP_013330860.1\|116154_117660_+\|YifB-family-Mg-chelatase-like-AAA-ATPase	unknown	unknown	gnl\|CDD\|223679
NC_014532.2\|WP_013330859.1\|115720_116062_+\|accessory-factor-UbiK-family-protein	unknown	unknown	gnl\|CDD\|377337
NC_014532.2\|WP_013330867.1\|128216_128837_+\|DUF4202-domain-containing-protein	unknown	unknown	gnl\|CDD\|379397
NC_014532.2\|WP_013330872.1\|132993_134313_-\|branched-chain-amino-acid-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|119323
NC_014532.2\|WP_013330857.1\|113802_115044_-\|ammonium-transporter	unknown	unknown	gnl\|CDD\|274697
NC_014532.2\|WP_041601826.1\|117922_118900_+\|type-I-F-CRISPR-associated-endonuclease-Cas1	cas1	cd09718_cas1_CAS-I-F	gnl\|CDD\|132676
NC_014532.2\|WP_013330865.1\|124976_126008_+\|type-I-F-CRISPR-associated-protein-Csy3	cas7f	pfam09615_cas7f_CAS-I-F	gnl\|CDD\|378222
NC_014532.2\|WP_041602309.1\|136989_138435_-\|sodium-dependent-transporter	unknown	unknown	gnl\|CDD\|271367
NC_014532.2\|WP_013330870.1\|130702_131464_-\|dienelactone-hydrolase-family-protein	unknown	unknown	gnl\|CDD\|223489
NC_014532.2\|WP_041601828.1\|136148_136919_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|213186
NC_014532.2\|WP_109637282.1\|126011_126581_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	cas6f	cd09739_cas6f_CAS-I-F:CAS-IV	gnl\|CDD\|378224
NC_014532.2\|WP_049786177.1\|131646_132885_+\|ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|380569
NC_014532.2\|WP_013330873.1\|134309_135317_-\|branched-chain-amino-acid-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|119324
NC_014532.2\|WP_013330874.1\|135357_136062_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|213191
NC_014532.2\|WP_013330864.1\|123999_124959_+\|type-I-F-CRISPR-associated-protein-Csy2	cas5f	cd09736_cas5f_CAS-I-F	gnl\|CDD\|378221
NC_014532.2\|WP_013330858.1\|115089_115428_-\|P-II-family-nitrogen-regulator	unknown	unknown	gnl\|CDD\|223424
NC_014532.2\|WP_013330869.1\|129298_130555_-\|dicarboxylate/amino-acid:cation-symporter	unknown	unknown	gnl\|CDD\|366058

Protein	Function_ID	Function_description	E-value
NC_014532.2\|WP_013330863.1\|122630_124007_+\|type-I-F-CRISPR-associated-protein-Csy1	gnl\|CDD\|378220	pfam09611, Cas_Csy1, CRISPR-associated protein (Cas_Csy1). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2465 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy1, for CRISPR/Cas Subtype Ypest protein 1.	0
NC_014532.2\|WP_013330862.1\|118896_122238_+\|type-I-F-CRISPR-associated-helicase-Cas3	gnl\|CDD\|274201	TIGR02562, conserved_hypothetical_protein, CRISPR-associated helicase Cas3, subtype I-F/YPEST. The helicase in many CRISPR-associated (cas) gene clusters is designated Cas3, and most Cas3 proteins are described by model TIGR01587. Members of this family are considerably larger, show a number of motifs in common with TIGR01587 sequences, and replace Cas3 in some CRISPR/cas loci in a number of Proteobacteria, including Yersinia pestis, Chromobacterium violaceum, Erwinia carotovora subsp. atroseptica SCRI1043, Photorhabdus luminescens subsp. laumondii TTO1, Legionella pneumophila, etc.	0
NC_014532.2\|WP_049786177.1\|131646_132885_+\|ABC-transporter-substrate-binding-protein	gnl\|CDD\|380569	cd06346, PBP1_ABC_ligand_binding-like, type 1 periplasmic ligand-binding domain of uncharacterized ABC (Atpase Binding Cassette)-type active transport systems predicted to be involved in uptake of amino acids, peptides, or inorganic ions. This subgroup includes the type 1 periplasmic ligand-binding domain of uncharacterized ABC (Atpase Binding Cassette)-type active transport systems that are predicted to be involved in uptake of amino acids, peptides, or inorganic ions. This subgroup has high sequence similarity to members of the family of hydrophobic amino acid transporters (HAAT), such as leucine-isoleucine-valine binding protein (LIVBP); however, its ligand specificity has not been determined experimentally.	9.36022e-109
NC_014532.2\|WP_013330860.1\|116154_117660_+\|YifB-family-Mg-chelatase-like-AAA-ATPase	gnl\|CDD\|223679	COG0606, COG0606, Predicted ATPase with chaperone activity [Posttranslational modification, protein turnover, chaperones].	0
NC_014532.2\|WP_013330859.1\|115720_116062_+\|accessory-factor-UbiK-family-protein	gnl\|CDD\|377337	pfam04380, BMFP, Membrane fusogenic activity. BMFP consists of two structural domains, a coiled-coil C-terminal domain via which the protein self-associates as a trimer, and an N-terminal domain disordered at neutral pH but adopting an amphipathic alpha-helical structure in the presence of phospholipid vesicles, high ionic strength, acidic pH or SDS. BMFP interacts with phospholipid vesicles though the predicted amphipathic alpha-helix induced in the N-terminal half of the protein and promotes aggregation and fusion of vesicles in vitro.	3.37544e-15
NC_014532.2\|WP_013330867.1\|128216_128837_+\|DUF4202-domain-containing-protein	gnl\|CDD\|379397	pfam13875, DUF4202, Domain of unknown function (DUF4202). This family of proteins is found in bacteria, archaea and eukaryotes. Proteins in this family are typically between 187 and 205 amino acids in length. There are two conserved sequence motifs: LED and KMS. The function of these proteins is unknown, although many are incorrectly annotated as glutamyl tRNA synthetases.	1.34052e-91
NC_014532.2\|WP_013330872.1\|132993_134313_-\|branched-chain-amino-acid-ABC-transporter-permease	gnl\|CDD\|119323	cd06581, TM_PBP1_LivM_like, Transmembrane subunit (TM) of Escherichia coli LivM and related proteins. LivM is one of two TMs of the E. coli LIV-1/LS transporter, a Periplasmic Binding Protein (PBP)-dependent ATP-Binding Cassette (ABC) transporter involved in the uptake of branched-chain amino acids (AAs). These types of transporters generally bind type 1 PBPs. PBP-dependent ABC transporters consist of a PBP, two TMs, and two cytoplasmic ABCs, and are mainly involved in importing solutes from the environment. The solute is captured by the PBP, which delivers it to a gated translocation pathway formed by the two TMs. The two ABCs bind and hydrolyze ATP and drive the transport reaction. E. coli LivM forms a heterodimer with another TM, LivH, to generate the transmembrane pore. LivH is not included in this subgroup. The LIV-1/LS transporter is comprised of two TMs (LivM and LivH), two ABCs (LivG and LivF), and one of two alternative PBPs, LivJ (LIV-BP) or LivK (LS-BP). In addition to transporting branched-chain AAs including leucine, isoleucine and valine, the E. coli LIV-1/LS transporter is involved in the uptake of the aromatic AA, phenylalanine.	4.28984e-38
NC_014532.2\|WP_013330857.1\|113802_115044_-\|ammonium-transporter	gnl\|CDD\|274697	TIGR03644, marine_trans_1, probable ammonium transporter, marine subtype. Members of this protein family are well conserved subclass of putative ammonimum transporters, belonging to the much broader set of ammonium/methylammonium transporter described by TIGR00836. Species with this transporter tend to be marine bacteria. Partial phylogenetic profiling (PPP) picks a member of this protein family as the single best-scoring protein vs. a reference profile for the marine environment Genome Property for a large number of different query genomes. This finding by PPP suggests that this transporter family represents an important adaptation to the marine environment.	0
NC_014532.2\|WP_041601826.1\|117922_118900_+\|type-I-F-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|132676	TIGR03637, cas1_YPEST, CRISPR-associated endonuclease Cas1, subtype I-F/YPEST. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the YPEST subtype of CRISPR/Cas system.	0
NC_014532.2\|WP_013330865.1\|124976_126008_+\|type-I-F-CRISPR-associated-protein-Csy3	gnl\|CDD\|378222	pfam09615, Cas_Csy3, CRISPR-associated protein (Cas_Csy3). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2463 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy3, for CRISPR/Cas Subtype Ypest protein 3.	0
NC_014532.2\|WP_041602309.1\|136989_138435_-\|sodium-dependent-transporter	gnl\|CDD\|271367	cd10336, SLC6sbd_Tyt1-Like, solute carrier 6 subfamily, Fusobacterium nucleatum Tyt1-like; solute-binding domain. SLC6 proteins (also called the sodium- and chloride-dependent neurotransmitter transporter family or Na+/Cl--dependent transporter family) include neurotransmitter transporters (NTTs): these are sodium- and chloride-dependent plasma membrane transporters for the monoamine neurotransmitters serotonin (5-hydroxytryptamine), dopamine, and norepinephrine, and the amino acid neurotransmitters GABA and glycine. These NTTs are widely expressed in the mammalian brain, involved in regulating neurotransmitter signaling and homeostasis, and the target of a range of therapeutic drugs for the treatment of psychiatric diseases. Bacterial members of the SLC6 family include the LeuT amino acid transporter. An arrangement of 12 transmembrane (TM) helices appears to be as a common topological motif for eukaryotic and some prokaryotic and archaeal NTTs. However, this subfamily which contains the majority of bacterial members and some archaeal members, appears to contain only 11 TMs; for example the functional Fusobacterium nucleatum tyrosine transporter Tyt1.	4.76192e-156
NC_014532.2\|WP_013330870.1\|130702_131464_-\|dienelactone-hydrolase-family-protein	gnl\|CDD\|223489	COG0412, COG0412, Dienelactone hydrolase and related enzymes [Secondary metabolites biosynthesis, transport, and catabolism].	3.81797e-36
NC_014532.2\|WP_041601828.1\|136148_136919_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|213186	cd03219, ABC_Mj1267_LivG_branched, ATP-binding cassette component of branched chain amino acids transport system. The Mj1267/LivG ABC transporter subfamily is involved in the transport of the hydrophobic amino acids leucine, isoleucine and valine. MJ1267 is a branched-chain amino acid transporter with 29% similarity to both the LivF and LivG components of the E. coli branched-chain amino acid transporter. MJ1267 contains an insertion from residues 114 to 123 characteristic of LivG (Leucine-Isoleucine-Valine) homologs. The branched-chain amino acid transporter from E. coli comprises a heterodimer of ABCs (LivF and LivG), a heterodimer of six-helix TM domains (LivM and LivH), and one of two alternative soluble periplasmic substrate binding proteins (LivK or LivJ).	9.7226e-102
NC_014532.2\|WP_109637282.1\|126011_126581_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	gnl\|CDD\|378224	pfam09618, Cas_Csy4, CRISPR-associated protein (Cas_Csy4). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This protein family, typified by YPO2462 of Yersinia pestis, is a CRISPR-associated (Cas) family strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy4, for CRISPR/Cas Subtype Ypest protein 4.	4.41723e-84
NC_014532.2\|WP_013330873.1\|134309_135317_-\|branched-chain-amino-acid-ABC-transporter-permease	gnl\|CDD\|119324	cd06582, TM_PBP1_LivH_like, Transmembrane subunit (TM) of Escherichia coli LivH and related proteins. LivH is one of two TMs of the E. coli LIV-1/LS transporter, a Periplasmic Binding Protein (PBP)-dependent ATP-Binding Cassette (ABC) transporter involved in the uptake of branched-chain amino acids (AAs). These types of transporters generally bind type 1 PBPs. PBP-dependent ABC transporters consist of a PBP, two TMs, and two cytoplasmic ABCs, and are mainly involved in importing solutes from the environment. The solute is captured by the PBP, which delivers it to a gated translocation pathway formed by the two TMs. The two ABCs bind and hydrolyze ATP and drive the transport reaction. E. coli LivH forms a heterodimer with another TM, LivM, to generate the transmembrane pore. LivM is not included in this subgroup. The LIV-1/LS transporter is comprised of two TMs (LivM and LivH), two ABCs (LivG and LivF), and one of two alternative PBPs, LivJ (LIV-BP) or LivK (LS-BP). In addition to transporting branched-chain AAs including leucine, isoleucine and valine, the E. coli LIV-1/LS transporter is involved in the uptake of the aromatic AA, phenylalanine.	1.22617e-62
NC_014532.2\|WP_013330874.1\|135357_136062_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|213191	cd03224, ABC_TM1139_LivF_branched, ATP-binding cassette domain of branched-chain amino acid transporter. LivF (TM1139) is part of the LIV-I bacterial ABC-type two-component transport system that imports neutral, branched-chain amino acids. The E. coli branched-chain amino acid transporter comprises a heterodimer of ABC transporters (LivF and LivG), a heterodimer of six-helix TM domains (LivM and LivH), and one of two alternative soluble periplasmic substrate binding proteins (LivK or LivJ). ABC transporters are a large family of proteins involved in the transport of a wide variety of different compounds, like sugars, ions, peptides, and more complex organic molecules.	1.01162e-108
NC_014532.2\|WP_013330864.1\|123999_124959_+\|type-I-F-CRISPR-associated-protein-Csy2	gnl\|CDD\|378221	pfam09614, Cas_Csy2, CRISPR-associated protein (Cas_Csy2). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2464 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy2, for CRISPR/Cas Subtype Ypest protein 2.	2.75015e-168
NC_014532.2\|WP_013330858.1\|115089_115428_-\|P-II-family-nitrogen-regulator	gnl\|CDD\|223424	COG0347, GlnK, Nitrogen regulatory protein PII [Amino acid transport and metabolism].	3.18689e-58
NC_014532.2\|WP_013330869.1\|129298_130555_-\|dicarboxylate/amino-acid:cation-symporter	gnl\|CDD\|366058	pfam00375, SDF, Sodium:dicarboxylate symporter family.	4.29806e-144

>NC_014532.2|WP_109637282.1|126011_126581_+|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4
MDHYLDIRLRPDPEFPASMLMNALYSKLHRALYDLGADDIGISLPDHKTGVRTRTPGDRLRLHARKERLEQLMALSWLAGMRDHVETTDIAPVPAAARHCRVTRRQFNTGGPSRVKRYARRHDISEDEARQCMSVPAKRKISLPFVQVNSRSSGQRFALFIEHGELQDAPMTGHFNHYGLSREATVPWF
>NC_014532.2|WP_013330865.1|124976_126008_+|type-I-F-CRISPR-associated-protein-Csy3
MAKKDDALKTASVLAFERKLDPSDALLYAGQWSQRDALEDWQAVSVREKSVRGTISNRLKAKEQDPAKLDAAIENPNLQTVDVATLSHDADTLMARFTLRVLGGAGTPSACNNADYQAKLQQAVADYVKTEGFSELARRYAHNLANGRFLWRNRVGAEQVEVRIRRMEKGHVDKEWTFDALSLSLRGFESDTHTAELAQDIADALAGERHLILEVIAFAHVGNGQEVFPSQELILERGRGDKSKTLYSVDGVAAIHSQKLGNAIRTIDTWYPAPEDGSDLGPIAVEPYGSVTTQGTAYRQPKQKVDFYSLLDNWMLKDQVPETEQQHFVMATLIRGGVFGEAG
>NC_014532.2|WP_013330864.1|123999_124959_+|type-I-F-CRISPR-associated-protein-Csy2
MSDVKNLLVLPRLRVQNANAISSPMTWGFPAMSAFVGMMHALERKLVEADIQVSLDRVGVVCHDTEAQATEGGYTRAFHLTRNPVDKAGNTAAIVEEGRIHLDITLIFAIAGKVVEGERQDIAHQISEMVAGMRVAGGSVMPNRSVAANYQKSAWVALDDEPSEREKQFKKLKRRWLPGFSLVLRDDRLAEHTRTLQAQDENATALDAWLDLSRLNHECHVDPESEEVRWQVRRPYRGWLVPMPVGYGAISKQFEPGSVENARDTQIPFRFVESIYSIGEWISPHRLTCPEDMLWYVDNDLDAGLYRLNNDYVQRAHRA
>NC_014532.2|WP_013330863.1|122630_124007_+|type-I-F-CRISPR-associated-protein-Csy1
MPTMSGGWQELRELIEAFLKDRFDTKAEKLATDDPKYQALVEQFQRDSWLQDAARRVSQLQVVTHSLKPIHPDAKGSNLYTPPEFLSKHQGVGSHLLPADFDGDVVGNAAALDVYKFLKIEYDGKSLLERVLEGDTELARALSDNSEQSQAWMKAFAGITEPRGEHASHTRAKQVYWLTGDDAVDDGDFHLLAPLYATSLAHQVFQTINRDRFSDEAKEARKAKREGKLGEQEVHDYPNIASQKMGGTKPQNISQLNSERGGNNYLLASLPPAWSSRDIRPPLKADSVLSRGGMFGRRKEVRALVGDLKRFLETNPNIDMHTRDLRDDYTAMIMDELVLFTMQMHSLEPGWSADENCRLAEEEVFWLDPGRAQEDAEFRKARHAADWPDEIRQRFANWLNEALGGKLPLGDVEFRHWKKELGQDASHQRLLDKDRRWMAALVEELDELEELKGREDDE
>NC_014532.2|WP_013330862.1|118896_122238_+|type-I-F-CRISPR-associated-helicase-Cas3
MNVLLVSQCNKNALKETRRILDQFAERRGERTWQTPITLEGLDTLRKLLRKTARKNTAVACHWIRGHDHSELVWIVGDAKRFNPQGAVPTNTTSRDILRREDENDWHSGEDILLLASMSALLHDLGKASAAFQQRLQGKLEGRNLYRHEWVSLRLFQAFVGDDDDATWLARLAEGRYQEADWLENMERDGLDAEPAAIFRRLPPLAAALGWLIVSHHRLPLKPPDDLSNPATRWGSQNVTLQMEQLGDVLSLIDAQWNEISTTQDPQRITPYWTFHHGLPLSTWRWRERAAKQAKRLLARLSDDTNWLDSPYVMHLSRLCLMLADHHYSSLEDPARRVQGEPGYPLVANTVRKTGQPNQLLDEHILGVEKHASTIARALPTVESHLSRLARHKGFRKRSEHPRFRWQDQAFDLAQSLRERSQCQGFFGINMASTGCGKTLANGRIMYALADPEQGARFSIALGLRTLTLQTGQALRERLHLGEDELAVRVGGSANKALFEHYEKDAEASGSASTQGLIDEDAHVVFEGHIDTHPVLRRLGDEPGTRSLIAAPILVCTVDHLVPATESTRGGRQIAPMLRLMSSDLVLDEIDDFDINDLPALTRLVHWAGLLGSRVLLSSATLPPALVHGLYEAYRSGREAYQHHRGEPGQPVNICCAWFDENDRQHQDCADGDAFSAAHAAFATRRLKRLAENPVRRRGELLSLPALGKRPEEIRPGLAELLRTQAAQLHERHHSRDPVTGKRVSFGLIRMANIDPLVDVARSLFQQGACSGQRIHLCVYHSRHPLVMRSEIERRLDRTLQRAEPERVFEQADIRRLLDGSDEADHLFIVLGSPVTEVGRDHDYDWAIVEPSSMRSIIQLAGRVWRHRDKPCDTPNIQLLDTNLKHLEDPGRLAFQRPGFETDEAWRLNHHSLNALLVPDEYQIIDARPRVLARETLFPRDSLVDLEHQRLVTQMLEPPTQPLTKKERRLGMEPSPPPLGAYSWYAVPRMHLTGVLSQRQRFRQPTQTDVALALLPDEGGGTWTLHRVEDGAKRGETLYVAVEESLMARIDLEHEQGERIQPWGADDYLTALADLAEDLDIPLDKAARTFGIVSAPESTHGWRYHPVLGFVKK
>NC_014532.2|WP_041601826.1|117922_118900_+|type-I-F-CRISPR-associated-endonuclease-Cas1
MDDLSPSDLKTILHSKRANLYYLQHCRVLVNGGRVEYVTDEGKQSRYWNIPIANTTSLLLGTGTSITQAAMRELAKAGVLVGFCGGGGTPLFAANEVDVDVAWLTPQSEYRPTEYLQYWVRFWFDDEKRLDAARCFQLARLDRIEHLWGESRFQRDTGFTPSKTELKALLTSSREAIGQAVDTTALLTEEARLTKKLFRLASHATDYGDFTRVKRGQGVDPANRFLDHGNYLAYGLAATATWVLGIPHGLAVLHGKTRRGGLVFDVADLVKDAIILPQAFLSAMKGDEEQEFRQACIERLTRTESLDFMIDTLKAVALDLGGPEA
>NC_014532.2|WP_013330860.1|116154_117660_+|YifB-family-Mg-chelatase-like-AAA-ATPase
MTLAIIRTRAGLGLEAPEVLVEVHLTNGLPGITLVGLPETAVKESRERVRSALVNAGFEFPLRRITLNLAPADLPKDGGRFDLPIALGLLVASGQIPPEALAEVECVGELALDGGLRPASGVLPLAMATRQAGRRLIVPRANADEAALAGDLEVLPAEHLLEVVAHLLGQETIAAHRLQAPPRRDTSEPDLREVRGQHQARRALEVAAAGGHNLLFAGPPGTGKTMLASRLPGILPPLGEDEALEVAAVRSVSGLPLAEQWGRRPFRAPHHTASAVALVGGGSRPKPGEISLAHHGVLFLDELPEFSRQVLEVMREPMESGQIHIARANHERRYPARFQLVAAMNPCPCGHLGDPRQACHCTAAQIQRYQARLSGPLLDRIDLQVEVPALPAEQLTSRESGEDSATVRERVLAARERQWSRGALNAYLAGPDLEAACALGADDRAWLAEVLERLQLSARAFHRVLRVALTLADLAGAPRPTREHLIEAIGYRQLDRLLKGG
>NC_014532.2|WP_013330859.1|115720_116062_+|accessory-factor-UbiK-family-protein
MVSQDRISRLAQQIGERLQGASQAPEDVQKGVQQVVKGAFDRLELVSREDFDILMDVLQRTRGRVEALEKQVAALEEALDASAAADEDAEEVREAEVGSDSPEEDAGAGETGR
>NC_014532.2|WP_013330858.1|115089_115428_-|P-II-family-nitrogen-regulator
MKLITAVIKPFKLDDVREALADNGVQGITVTEVKGFGRQKGHTELYRGAEYVVDFLPKVKVEVAVDDDRLDTVLDAICNAANSGKIGDGKVFVTPLEDVIRIRTGERGADAV
>NC_014532.2|WP_013330857.1|113802_115044_-|ammonium-transporter
MTELAYALDTFYFLVCGALVMWMAAGFSMLEAGLVRSKNTAEILTKNIALFAIACTMYLLVGYYLMYSSSAGGILPSLGFLLGGENSVDAVMAGGDDAPYYSARADFFFQVVFVATAMSIVSGAVAERMKLWAFLIFSVILTGFIYPVSGYWTWGGGWLAEIGFSDYAGSGIVHMAGASAALAGVLVLGPRKGKYGKDGAIYAIPGANMPLATLGTFILWLGWFGFNGGSELKVSDVTSANNMAQVLVNTNAAAAGGVIAALILAKAWFRKADLTMALNGAIAGLVSITADPLSPSALGATLIGGFGGLLVVVSIVCLDKLKLDDPVGAISAHGVVGIWGVLAVPLSNGEASFGAQIIGIFGIFVWVFVASLIVWLILKAVMGIRVSEEEEYEGVDLAECGLEAYPEFNVAKK
>NC_014532.2|WP_013330867.1|128216_128837_+|DUF4202-domain-containing-protein
MSASSAYQRALDALDALHAEDPRRVEVEGQSSSKELVPKELMPKELWHAGRMSAWLERLEASPDELVRLAVRGQHLQRWQVPRDEYPEGRVGYLTWRRDQGQRAGETTAKLMREAGFDEEDAEQVARMIRKQGLGRDAGTQAVEDCACLVFLENYFADFSRQVEHDHLIRIVRKTWGKMSPQARELALELPMSDEAREIVEAALRT
>NC_014532.2|WP_013330868.1|128947_129226_+|hypothetical-protein
MAYHIKTAFRGTNPILQICDVSSGSVRMAWEYPKDDLERGEDPELLAMRREEAIHDLFRRLFLLTTEQYLKGELEPMPGLGAWRRAPRPGAK
>NC_014532.2|WP_013330869.1|129298_130555_-|dicarboxylate/amino-acid:cation-symporter
MSEQDPTARPNLWQRIPLWQKILAGLVLGVLAGALMGERASLFKPLGDIFINAIKMLIVPLVFSTLVVGITAMRDPQKMGRIGLRTIALYLLTTAFAIAIGLLASWIFQPGVGLDMTFDSSVEPKEAPTLVEILVGLVPQNPIDALANGNILQIIVFAIGLGISLTLIGEKGEPVVKVFESFAEAMVKLTNIVMSFAPFGVFGLIAHVAGSYGLEVLLPLAKVIGVAYLASVLHVLLVYSGLLALLGRLNPLRYLQGILDALVVAYSSASSSGTLPVSLRCARNNLGVSEGVAGFVLPVGATINMDGTAIYQGVVAVFIAQLLGVDLSMTDYGMIILTGTLASIGTAGVPGAGLVMLSIVMAQIGLPLEAIAVIAGIDRILDMARTCVNVAGDLMVTTLVGKSEGELDEDVYNAKSWR
>NC_014532.2|WP_013330870.1|130702_131464_-|dienelactone-hydrolase-family-protein
MRPIATLTLGSLLLAGFADTALAEETDGQRIDYQVNDEAFTGYLASAPDEARGTVLIVHDWDGLTDYERQRADMLAAEGYDAFAIDLYGKGNRPVETDAKKAETARLYDDRERMRRLTLAGLEEARRQGVAQPTVVMGYCFGGAVVLELARSGQAEDVRGYATFHGGLNTPEGQAYSADTPPILIAHGGADTSISMSDVAALAEELEAAGAPYEIEVYSGAPHAFTVIGSDAYQQRADEKSWAAFHDLLGEVL
>NC_014532.2|WP_049786177.1|131646_132885_+|ABC-transporter-substrate-binding-protein
MMNKRILAMAVAASSVAFTGLAQAEVKIGFLGGFTGGIESLTPPIYDGAELAVKQINEQGGLLDGEEIVMPTGDTTCSDASAASNAADRMVNTEEVTAIVGALCTGATIAAANNAAVPGGVTMVSPASTAPAVTNIDDNDLVFRTVPSDGFQGKMLAKLLLDKGIEEVVVTYVNNDYGSGLDKAFTTAFKEGGGTVAENLPHEDNRSDYRAELGRLSSTGVPNLVVLAYADTSGQTVVRQAYESGMFTQFIGADGMVGDSLVKAIGADVLDGMIATRPGSPELPGTEIFNEDAKAAGIDPSAVFAAQAYDAAFLLGLAIEQNGNAERAGLSEALRSVASAPGEVILPGEWKKAKELIAAGTEINYEGASGTHEFDENGDVPGVVLEMVVQDGAFTSQGYVSEEGEPSEDSGS
>NC_014532.2|WP_013330872.1|132993_134313_-|branched-chain-amino-acid-ABC-transporter-permease
MTQSHPPRQQRADSVAAPRRFPLRESVIFLALLAAVLVVYAAMGSAYGTRMLVEAACYAILALGLTIQWGYAGQFNAGVMGFVALGGFCAMFFSIPVNEAFWSSELPGELGLALLYMVAAIVLVVAVSRLDRIGVPKPLRTFITVVLGVVLYMAVISNFREVAGQIESRVDFIGGLALPAWFGWIIGGALAGGVGYFIGHVCLGLRSDYLAIATIGIAEIIKAFLKNADWLTRGTATVSPLPWPVPGPGDVGFTLARALYLSVTAVIIAAIFFLLHRAYNAPWGRMIRAIRDNEVSAAAMGKDINKRRLEIFVLGCILMGIGGAVLASFNSLFDPQGYLPLNHTFLVLVMVILGGPGNNLGTIFGAVVVYIIWLMSEPLALFLMQLAVDIGSATFGWDAPTNLDSRALQARVFVIGLLISLVLRFAPKGMLPEKVRHHG
>NC_014532.2|WP_013330873.1|134309_135317_-|branched-chain-amino-acid-ABC-transporter-permease
MNELVFFINNVVIAGSVSGSIYAMGAVGVTLIFSIMRFAHFAHGDMMTFGAFMVLLLTTLFPQAGAAIGVPTPILMLPLAMVLTAGLAVGIDRTFYRPLRAHGVKPIVMVIASLGVTLMLQGLIRLFAGTGGSSLYVDDRKEIFRLPIPIEGVRMPVVITEPQLYLFVLTIICVVALHFFLSRSRLGKAMRAMSDNPDLAQASGINTNTIVAVTWMLAGGLAAIAGTLLSLDVTFKPDLSFFLLLPIFAAAIVGGVGHPFGAVAGGFVVGFAESLAVFNWSVLLRPFRDSLPEWLALPSNLSFVGTEYKIVVPFFILVAILVWRPTGIFKGKVIT
>NC_014532.2|WP_013330874.1|135357_136062_-|ABC-transporter-ATP-binding-protein
MPLLDARNVHGGYGGMNILNGVDMAIEANEVGVIVGPNGAGKSTMLKAIFGLLNVSQGEILLNGEPIQNQPPNQLVKRGMGFVPQEHNIFPSLTVKENLQMGAYLKPDNVKRMLARIYEFFPPLYDKRHQPAGELSGGQRQMVAMGRALMAEPDLLLLDEPTAGLSPRYMNEIFARVKEINAAGVGVLMVEQNAKQALGIADRGFVLAAGQNRFTDTGAALLADPDVAKSFLGG
>NC_014532.2|WP_041601828.1|136148_136919_-|ABC-transporter-ATP-binding-protein
MSAIIDVQHVRKAFGGLQVIDDCSIQVAQGSVTGLIGPNGAGKSTLFNIIAGALPLDSGQVWLDGEDITNRPANELFHKGLLRTFQIAHEFANMTALENLMMVPPRQSGEHLFSTWLKPRAVGREEAEVCRRALEVIDFIGLHHVRNELAGNLSGGQKKLLELGRTMMTDARIVLLDEIAAGVNRTLLGDLMRNIERLNREMGYTFLVIEHDMDMIARLCDPVIVLAQGSVMMEGSIEEIRNDKRVIEAYFGADVA
>NC_014532.2|WP_041602309.1|136989_138435_-|sodium-dependent-transporter
MSTNNIWTHKGTFLLAAVGSAVGLGNLWRFPYLAGENGGGAFLLIYAVTLFAVGVPILIAEILLGRSSRRSPIMGMRFLSRTHGTSRAWESIGWLGAASAFIILSFYSVIAGWALHYTWRMITGSLAGADAATIASGFDALLASPALLTLYHTLFIAASGLIVGLGIHRGIENGLRVLMPALLAILLVILAYSAMQGDMNAAARFLFTFQLSDLSVAGWLAAMGQSFFTLSLGMGAIMAYGAYMPGEASLSRTALAIVVIDTAVALIAGLAIFALVFGADLAPDEGPGLMFVTLPLAFAEMPGGSLVGGAFFILVLGAAISSAISMIEPVAAFLVERFDLNRAQAVAAMVITSWALGLLSVFSFNVWAEHSPFHELLGLSAFGLLELLTHIFMPLGGLMISLFAGWALTHGEVMKELRTSEGWFQTWRFLVRFVSPAAVAFVFLQAIPQLDGYLLPLIGAVVIVGVFAASRIFLAESHQNP

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_014532_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_014532_2

1759176-1759295

Orphan

Consensus_repeat	Method
AGGACCAGTGCCCGGGTACCCCGGCCGGTG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_014532_2

>merge|NC_014532|2|1759176-1759295|CRISPRCasFinder
AGGACCAGTGCCCGGGTACCCCGGCCGGTGTCGCCGTTGACGCCGTCGGCTGCCCGCTGGATTCCGATGGTGACGGCGTGCCGGACTATCAGGACCAGTGCCCGGGTACCCCGGCCGGTG

>NC_014532|2|2|1759176-1759295|CRISPRCasFinder
AGGACCAGTGCCCGGGTACCCCGGCCGGTG	TCGCCGTTGACGCCGTCGGCTGCCCGCTGGATTCCGATGGTGACGGCGTGCCGGACTATC
AGGACCAGTGCCCGGGTACCCCGGCCGGTG

Protein	Signature genes	Signature genes Name	Protein_function
NC_014532.2\|WP_049786291.1\|1768055_1768379_+\|hypothetical-protein	unknown	unknown	unknown
NC_014532.2\|WP_013332271.1\|1761860_1762352_+\|translation-initiation-factor-IF-3	unknown	unknown	gnl\|CDD\|234582
NC_014532.2\|WP_041602485.1\|1754458_1755514_+\|COX15/CtaA-family-protein	unknown	unknown	gnl\|CDD\|367131
NC_014532.2\|WP_013332272.1\|1762437_1762632_+\|50S-ribosomal-protein-L35	unknown	unknown	gnl\|CDD\|234676
NC_014532.2\|WP_013332267.1\|1756451_1757897_-\|DASS-family-sodium-coupled-anion-symporter	unknown	unknown	gnl\|CDD\|273267
NC_014532.2\|WP_013332270.1\|1759879_1761778_+\|threonine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234752
NC_014532.2\|WP_013332266.1\|1755506_1756412_+\|protoheme-IX-farnesyltransferase	unknown	unknown	gnl\|CDD\|235293
NC_014532.2\|WP_041602016.1\|1767537_1768002_+\|flavodoxin-domain-containing-protein	unknown	unknown	gnl\|CDD\|181230
NC_014532.2\|WP_013332260.1\|1751503_1752091_+\|cytochrome-c-oxidase-assembly-protein	unknown	unknown	gnl\|CDD\|235341
NC_014532.2\|WP_041602015.1\|1766831_1767134_+\|integration-host-factor-subunit-alpha	unknown	unknown	gnl\|CDD\|178961
NC_014532.2\|WP_013332274.1\|1763203_1764223_+\|phenylalanine--tRNA-ligase-subunit-alpha	unknown	unknown	gnl\|CDD\|234780
NC_014532.2\|WP_013332268.1\|1758098_1758566_+\|DUF2489-domain-containing-protein	unknown	unknown	gnl\|CDD\|378470
NC_014532.2\|WP_013332261.1\|1752087_1752951_+\|cytochrome-c-oxidase-subunit-3	unknown	unknown	gnl\|CDD\|238834
NC_014532.2\|WP_013332275.1\|1764390_1766769_+\|phenylalanine--tRNA-ligase-subunit-beta	unknown	unknown	gnl\|CDD\|234804
NC_014532.2\|WP_013332273.1\|1762668_1763022_+\|50S-ribosomal-protein-L20	unknown	unknown	gnl\|CDD\|179959
NC_014532.2\|WP_013332262.1\|1752973_1753168_-\|DUF2909-domain-containing-protein	unknown	unknown	gnl\|CDD\|378564
NC_014532.2\|WP_013332264.1\|1753900_1754437_+\|hypothetical-protein	unknown	unknown	unknown
NC_014532.2\|WP_109637631.1\|1753178_1753904_+\|SURF1-family-protein	unknown	unknown	gnl\|CDD\|119401
NC_014532.2\|WP_013332277.1\|1767213_1767420_-\|DUF2788-domain-containing-protein	unknown	unknown	gnl\|CDD\|378526
NC_014532.2\|WP_013332259.1\|1749844_1751482_+\|cytochrome-c-oxidase-subunit-I	unknown	unknown	gnl\|CDD\|238833

Protein	Function_ID	Function_description	E-value
NC_014532.2\|WP_013332271.1\|1761860_1762352_+\|translation-initiation-factor-IF-3	gnl\|CDD\|234582	PRK00028, infC, translation initiation factor IF-3; Reviewed.	8.5485e-91
NC_014532.2\|WP_041602485.1\|1754458_1755514_+\|COX15/CtaA-family-protein	gnl\|CDD\|367131	pfam02628, COX15-CtaA, Cytochrome oxidase assembly protein. This is a family of integral membrane proteins. CtaA is required for cytochrome aa3 oxidase assembly in Bacillus subtilis. COX15 is required for cytochrome c oxidase assembly in yeast.	1.97108e-62
NC_014532.2\|WP_013332272.1\|1762437_1762632_+\|50S-ribosomal-protein-L35	gnl\|CDD\|234676	PRK00172, rpmI, 50S ribosomal protein L35; Reviewed.	3.97484e-20
NC_014532.2\|WP_013332267.1\|1756451_1757897_-\|DASS-family-sodium-coupled-anion-symporter	gnl\|CDD\|273267	TIGR00785, Uncharacterized_transporter_HI_0020, anion transporter. The Divalent Anion:Na+ Symporter (DASS) Family (TC 2.A.47) Functionally characterized proteins of the DASS family transport (1) organic di- and tricarboxylates of the Krebs Cycle as well as dicarboxylate amino acid, (2) inorganic sulfate and (3) phosphate. The animal NaDC-1 cotransport 3 Na+ with each dicarboxylate. Protonated tricarboxylates are also cotransported with 3Na+. [Transport and binding proteins, Anions, Transport and binding proteins, Cations and iron carrying compounds].	2.04164e-85
NC_014532.2\|WP_013332270.1\|1759879_1761778_+\|threonine--tRNA-ligase	gnl\|CDD\|234752	PRK00413, thrS, threonyl-tRNA synthetase; Reviewed.	0
NC_014532.2\|WP_013332266.1\|1755506_1756412_+\|protoheme-IX-farnesyltransferase	gnl\|CDD\|235293	PRK04375, PRK04375, protoheme IX farnesyltransferase; Provisional.	5.3463e-123
NC_014532.2\|WP_041602016.1\|1767537_1768002_+\|flavodoxin-domain-containing-protein	gnl\|CDD\|181230	PRK08105, PRK08105, flavodoxin; Provisional.	2.43968e-55
NC_014532.2\|WP_013332260.1\|1751503_1752091_+\|cytochrome-c-oxidase-assembly-protein	gnl\|CDD\|235341	PRK05089, PRK05089, cytochrome C oxidase assembly protein; Provisional.	1.31861e-68
NC_014532.2\|WP_041602015.1\|1766831_1767134_+\|integration-host-factor-subunit-alpha	gnl\|CDD\|178961	PRK00285, ihfA, integration host factor subunit alpha; Reviewed.	4.41932e-60
NC_014532.2\|WP_013332274.1\|1763203_1764223_+\|phenylalanine--tRNA-ligase-subunit-alpha	gnl\|CDD\|234780	PRK00488, pheS, phenylalanyl-tRNA synthetase subunit alpha; Validated.	0
NC_014532.2\|WP_013332268.1\|1758098_1758566_+\|DUF2489-domain-containing-protein	gnl\|CDD\|378470	pfam10675, DUF2489, Protein of unknown function (DUF2489). This is a bacterial family of uncharacterized proteins.	9.75877e-41
NC_014532.2\|WP_013332261.1\|1752087_1752951_+\|cytochrome-c-oxidase-subunit-3	gnl\|CDD\|238834	cd01665, Cyt_c_Oxidase_III, Cytochrome c oxidase subunit III. Cytochrome c oxidase (CcO), the terminal oxidase in the respiratory chains of eukaryotes and most bacteria, is a multi-chain transmembrane protein located in the inner membrane of mitochondria and the cell membrane of prokaryotes. CcO catalyzes the reduction of O2 and simultaneously pumps protons across the membrane. The number of subunits varies from three to five in bacteria and up to 13 in mammalian mitochondria. Only subunits I and II are essential for function, but subunit III, which is also conserved, is believed to play a role in assembly of the multimer complex. Rhodobacter CcO subunit III stabilizes the integrity of the binuclear center in subunit I. Subunits I, II, and III of mammalian CcO are encoded within the mitochondrial genome and the remaining 10 subunits are encoded within the nuclear genome. Subunit III contains bound phospholipids in several crystal structures and is proposed to contain a "lipid pool." These phospholipids are believed to intrinsic constituents similar to cofactors of the enzyme.	1.37178e-85
NC_014532.2\|WP_013332275.1\|1764390_1766769_+\|phenylalanine--tRNA-ligase-subunit-beta	gnl\|CDD\|234804	PRK00629, pheT, phenylalanyl-tRNA synthetase subunit beta; Reviewed.	0
NC_014532.2\|WP_013332273.1\|1762668_1763022_+\|50S-ribosomal-protein-L20	gnl\|CDD\|179959	PRK05185, rplT, 50S ribosomal protein L20; Provisional.	1.38648e-67
NC_014532.2\|WP_013332262.1\|1752973_1753168_-\|DUF2909-domain-containing-protein	gnl\|CDD\|378564	pfam11137, DUF2909, Protein of unknown function (DUF2909). This is a family of proteins conserved in Proteobacteria of unknown function.	7.00751e-08
NC_014532.2\|WP_109637631.1\|1753178_1753904_+\|SURF1-family-protein	gnl\|CDD\|119401	cd06662, SURF1, SURF1 superfamily. Surf1/Shy1 has been implicated in the posttranslational steps of the biogenesis of the mitochondrially-encoded Cox1 subunit of cytochrome c oxidase (complex IV). Cytochrome c oxidase (complex IV), the terminal electron-transferring complex of the respiratory chain, is an assemblage of nuclear and mitochondrially-encoded subunits. Its assembly is mediated by nuclear encoded assembly factors, one of which is Surf1/Shy1. Mutations in human Surf1 are a major cause of Leigh syndrome, a severe neurodegenerative disorder.	8.80948e-39
NC_014532.2\|WP_013332277.1\|1767213_1767420_-\|DUF2788-domain-containing-protein	gnl\|CDD\|378526	pfam10981, DUF2788, Protein of unknown function (DUF2788). This bacterial family of proteins have no known function.	7.44045e-13
NC_014532.2\|WP_013332259.1\|1749844_1751482_+\|cytochrome-c-oxidase-subunit-I	gnl\|CDD\|238833	cd01663, Cyt_c_Oxidase_I, Cytochrome C oxidase subunit I. Cytochrome c oxidase (CcO), the terminal oxidase in the respiratory chains of eukaryotes and most bacteria, is a multi-chain transmembrane protein located in the inner membrane of mitochondria and the cell membrane of prokaryotes. It catalyzes the reduction of O2 and simultaneously pumps protons across the membrane. The number of subunits varies from three to five in bacteria and up to 13 in mammalian mitochondria. Only subunits I and II are essential for function, but subunit III, which is also conserved, may play a role in assembly or oxygen delivery to the active site. Subunits I, II, and III of mammalian CcO are encoded within the mitochondrial genome and the remaining 10 subunits are encoded within the nuclear genome. Subunit I contains a heme-copper binuclear center (the active site where O2 is reduced to water) formed by a high-spin heme (heme a3) and a copper ion (CuB). It also contains a low-spin heme (heme a), believed to participate in the transfer of electrons to the binuclear center. For every reduction of an O2 molecule, eight protons are taken from the inside aqueous compartment and four electrons are taken from cytochrome c on the opposite side of the membrane. The four electrons and four of the protons are used in the reduction of O2; the four remaining protons are pumped across the membrane. This charge separation of four charges contributes to the electrochemical gradient used for ATP synthesis. Two proton channels, the D-pathway and K-pathway, leading to the binuclear center have been identified in subunit I. A well-defined pathway for the transfer of pumped protons beyond the binuclear center has not been identified. Electrons are transferred from cytochrome c (the electron donor) to heme a via the CuA binuclear site in subunit II, and directly from heme a to the binuclear center.	0

>NC_014532.2|WP_013332268.1|1758098_1758566_+|DUF2489-domain-containing-protein
MSTTIALILLGLGLAIVAGLGVYAYVLWREVRRRQAFREEELRRAHDNCLENLELVANALQQGQVDITEGAWRCKTLLDILDPSLVSRPEFLAFAEVHERTRHLHTHSARQALTPRARFQEDRERLKVEDEWRDEVIKAASHALVFRRGWPDSLH
>NC_014532.2|WP_013332267.1|1756451_1757897_-|DASS-family-sodium-coupled-anion-symporter
MSSSPASPPPALAARIGLWLGPLWLVLTWLSPAPAGMPESAWACVGLALLMATWWSTEAIPIPATSLLPLVLMPALGIEGMGDTAVSYANPIIYLFLGGFLLGIAMQRWNLHRRIALHVLKVVGQRPRRQIGGFMIATGFLSMWVSNTATAIMMLPIGMSVVSLLDDSDPEELRRYATALLLAIAYSASIGGVATLIGTPPNALLAGYLADSRGIDLGFAQWMLVGLPISLAMMVCAWWWLTRRGFALDTGEDGAAMVDRELARLGTMSSAERRVGVIFLLAALAWVVRPLLNQHGLDWLSDTGIAIAAGILLFLLPSGNERGQRLMRWEDAQNLPWGILLLFGGGLALAGGISRSGLAEWIAQHLGIFGAFPVLALIGVVVLVIIFLTEVTSNTATAAAFLPLLGALALSLDISPLLVTVPAAIAASCAFMMPVATPPNAIVFATGHMKIQSMIRAGFVLNLISTVLVTLLAYPLLMLFW
>NC_014532.2|WP_013332266.1|1755506_1756412_+|protoheme-IX-farnesyltransferase
MHDARSMAQQAVMPLWRDLVTLGKPRVVAVMLVCSLVGMLLARPVPPFDKLVLGLVGIGLAASGAAAFNHVVDRRLDAMMLRTASRPLATRRLSIPLALGWASLLSVMGIGLLYVGVNALTAWLTFGSLIGYALIYTAFLKRATPQNIVIGGVAGAAPPLLGWTSVSDQLGPEPLLLVLIVFAWTPPHFWALAIHKREEYERAEVPMLPVTHGEAFTRLQVWLYGWLTVAVTLLPFVIGMSGWLYLAGVTALNVRFMWWNGKVWRGRDPKAPLAAFWFSIRYILGVFVVLLLDSYATLWWS
>NC_014532.2|WP_041602485.1|1754458_1755514_+|COX15/CtaA-family-protein
MRDRQYRARLNGLRWLSLLGGLLAALVVLAGAWTRLVDAGLGCPDWPGCYGQWVVPDSTRALMHSPDVPLDASKAWMEMLHRYLASSLGLLAIAVVVLGRRLRHHEGYPWRFSLGLLTLILVQGAFGAFTVTLRLWPQVVTLHLLGGMAVMGSFLWLYLRFRRLAVPGVARRRPRRLTPLWGLALVLLVLQLGLGGWTSSNYAGLACQGFPTCNAQWWPNMDWGEGFHLTQTVGPNYLHGQLHGEARSAIQMGHRLGGVALFLCLLGLGLRHRRDRGVSPWLGAMGGACLLQAALGIANVLFWLPLWLALLHTAGAAVLVTATLLAVWHWRWGDTVARSSPSVAARELMHA
>NC_014532.2|WP_013332264.1|1753900_1754437_+|hypothetical-protein
MTDARIARSRFKLLALFAVFALPMVMAWGMVEWRLGIPDERTAHGTLEPELPQLADWPLGEVSKEGADDWLMAFDCTDDCAESADRWWRVHRALGRDAHRVSRLRIGGTQSEALPGEAVVTWQGAPEWREPGTLWIIDPEGRAVLSYGEGVEASNVLEDIERLLELNPEPPLARLHDE
>NC_014532.2|WP_109637631.1|1753178_1753904_+|SURF1-family-protein
MTRFATRMRSSRRLMLWFGFWACLVVLGLGLGLWQWERAADKRELLARYDSAPRLVAPESAPPDGARISVSGEFLAKETLFLDNRIHGERLGVAALTPLRGDDGRLWLVERGFLPTGPSRDTPRVSTPEGRVSVAGRWQVAGDSAPLFGPNREGKRLQHIALDAWEGLGGFAHAGWLHQEEGGGHLASWWQPNVLPPSRHLGYAAQWWGLALTALVVMIVGARRLSRDRSRHTPNDKETRP
>NC_014532.2|WP_013332262.1|1752973_1753168_-|DUF2909-domain-containing-protein
MLLKVLIALVFIAMVASLAAGAGFLLKDGGRSRRVLISLKLRVCLAALLLILLLYGFYAGGLGG
>NC_014532.2|WP_013332261.1|1752087_1752951_+|cytochrome-c-oxidase-subunit-3
MSGGSYYVPASSKWPALGSLALGIMMVGTGMVLVHGNSGAPIMVIGLVGILAVMALWFRDVIHESRKGLYDDQMDRSFRWGMGWFIFSEVMFFAAFFGALFYIRTFALPWLDGEGAKGVAALLWPDFTASWPLLEPPDAAIQGPHQTFSPWHLPLVNTLILVGSSITLTVAHEGLKEGRRTTARHWLTLTVLLGLCFIAIQGIEYREAYVHYGITLQAGIYGATFFLLTGFHGAHVIVGTLILIAILARVWKGHFSADDHFGFEAAAWYWHFVDVVWIGLFTFVYVF
>NC_014532.2|WP_013332260.1|1751503_1752091_+|cytochrome-c-oxidase-assembly-protein
MTERHTDDTRRGVRRTVARTLVALAGMFVFAFALVPLYDVFCQVTGLNGKTSNQAQALVHEDADEGRVVTMQFITRGSPGLPWSLEAHTRQVRVHPGQSAEVEFTFENMGDEVSVARAVPSVTPSQASLHLRKLACFCFQNQRLAPGERFEAPLVFQLTRDLPEDIQTVTLVYTLYRQDAAPSPGSGDQVRGGDA
>NC_014532.2|WP_013332259.1|1749844_1751482_+|cytochrome-c-oxidase-subunit-I
MASHLPPRPTAQQSQADAGGMAADEHHHYGPRGLKRWLLTTNHKEIGTLYLIFSLTMFFIGGIFAMVVRAELFQPGLQLVQPEFFNQMTTMHGLIMVFGAVMPAFVGLANWMVPLQIGAPDMALPRLNNFSFWLLPVAFALLLSTLVMPGGAPNFGWTFYAPLSTTYAPPSTTFFIFSLHLAGISSILGAINIIATILNLRTPGMRLMDMSLFVWTWLITAFLLIAVMPVLAGVITMMLLDINFGTSFFNAAGGGDPVLFQHLFWFFGHPEVYIMILPAFGIVSVIIPTFARKRLFGYASMVYATASIAILSFLVWAHHMFVVGLPLVAELFFMYSTMLIAVPTGVKVFNWITTLFRGSLTFEPPMLFALAFVVLFTIGGFSGLMLAISPADFQYHDTYFVVAHFHYVLVPGAVFAIMAAVYYWLPKWTGHYPHTRLSQWHFWLSVIGVNLTFFPMHFAGLAGMPRRIPDYALQFADFNMVTSIGAFMFGASQLLFVAVVVLCVRGGEKAPAKAWDGAEDLEWTVPSPAPLHTFETPPHFEPHRH
>NC_014532.2|WP_013332270.1|1759879_1761778_+|threonine--tRNA-ligase
MPIVTLPDGSQRSFDEPLSIMQLAESIGTGLAKACVAGRIDGELVDAADIIDHDAEVAIITARDPEGLDIIRHSCAHLIGHAVKQLYPDAKMAIGPVIEDGFYYDIDFGRSITPEDLEAIEARMKSLIETGYDVVREYVDRDRAMLTFLHRDEPYKQEIVREIPEGETIRLYHHQEYTDMCRGPHVPNTRHLKAFKLTKLAGAYWRGDAERPMLTRIYGTAWGDKKQLKAYLKRLEEAEKRDHRKLARKLDLFHMQEEAPGMVFWHPRGWTLWQVVEQYMRQVYKDGGYQEIRCPQVMDVSLWKKSGHWDNYADGMFFTESEKREYALKPMNCPGHVQVFNSGLRSYRELPVRYGEFGGCHRNEPSGALHGIMRVRAFTQDDGHVFCTEEQIEPEVTSFHRQALQVYRDFGFEDIAVKIALRPEKRLGDDAVWDRAEEALRGALRTCDVDWDELPGEGAFYGPKIEYHMKDCLGREWQVGTMQVDFMMPVRLGAQYVAEDGERRSPVMLHRAIVGSMERFIGILIEHYAGAMPLWLAPQQAVVLTITDAQRDYATYLEQRLQKKGLRVKADLRNEKIGFKIREHTLQKVPYLLVVGDKEVEADSVAVRSRSGEDLGTMTVDAFIDRIQAERR
>NC_014532.2|WP_013332271.1|1761860_1762352_+|translation-initiation-factor-IF-3
MNERITDEQVRLIDSDGEQLGIMPTRDALERAEAAGMDLVQISNADPIVCKIMDYGKFVFEQKKQKAAQKKKQKQIQVKEVKFRPGTDEGDYQVKMKNLTRFLESGDKGKVTLRFRGREMAHQDIGRKLMERIAADLEEIGTVESFPKMEGRQMIMIIAPKKK
>NC_014532.2|WP_013332272.1|1762437_1762632_+|50S-ribosomal-protein-L35
MPKIKSNSGAAKRFKKTANGFKHKQSFRSHILTKKSTKRKRHLRGMKQIHDADKPLVQRMLPNL
>NC_014532.2|WP_013332273.1|1762668_1763022_+|50S-ribosomal-protein-L20
MTRVKRGVVARRRHKKILKQAKGYYGARSRVFRVAKQAVIKAGQYAYRDRRQRKRQFRALWIQRINAGARQHGLSYSRFVGGLKKAGIEIDRKVLADLAVNEKAAFAAIVEKAKAAQ
>NC_014532.2|WP_013332274.1|1763203_1764223_+|phenylalanine--tRNA-ligase-subunit-alpha
MDHLPTLVAEARDAIQAAESMAALDELRVRYLGKKGEITALLKGLGQLPAEERPAAGERINQAKQALSADLEERKQALEKADLEARLAAETLDVTLPGRGQPSGGLHPVTRTLERIEGLFTHVGFDVAVGPEIEDDYHNFEALNIPAHHPARGMADTFYFDATRLLRTHTSPVQVRTMKSTEPPIRIVCPGRVYRSDSDLTHTPMFHQVEGLLVDEDVRFSDLKGTIQDFLHAFFERDDLAVRFRPSYFPFTEPSAEVDIQCVMCDGAGCRVCSHSGWLEVMGCGMVHPEVFRHSGIDSERYTGFAFGMGAERLAMLRYGVNDLRLFFDNDLRFLQQFA
>NC_014532.2|WP_013332275.1|1764390_1766769_+|phenylalanine--tRNA-ligase-subunit-beta
MKFSEQWLREWVSPALATQALADQITMAGLEVDGIEPVAAAFDGVVVAEVIERAPHPDADKLNVCQVDDGVERLQVVCGAPNVAEGQKVAFARVGAVLPGDFKIKKAKLRGVESRGMICSASELGLEEETSAGILELPSAAPVGEDFRTYMTLDDSTIEVDLTPNRGDCLSIKGMAREVGVLNRLPVEGPSVAPVASVHEETFPVRVEDTEGCPRYLGRVIKGVDVTAETPLWMVERLRRSGIRSIDPVVDITNYVMLELGQPLHAFDRANLDGAVVVRRARQGEQLVLLDGQTITLNGDTLIIADERGPLAIGGVMGGEHSGVSVDTRDIFLEAAHFSPLAVAGQARAYGLHTDASHRFERGVDPRLAREAAERATALLLEITGGEAGPLIEAADESKLPDDREVVLRRTRLDQALDKVLPDDEVGEILERLGMSVERVDEGWRARVPSWRFDIAIEEDLIEEVARIHGYNQLPARHPRALLGPRPDNEARTPLSALRQRMVSRGYFEAVTYSFVAPDLQETLLPEAVSPVLANPISSDLSVMRASLFPGLVRALEHNLNRQQNRVRLFETGLVFRGELDDLDQVPMLGALICGSREPEGWSGGKEQVDFFDLKGDLESLIEMGGEAEAWRFEPGAHPALHPGQCARVMYRGQEAGWIGTLHPAVRARLGLKTDALLFEVRLDALTHGRVPAFKPLSRYPEVRRDLAFLVDAEQPVQALLDTLRAQAGEWLVEAHLFDVYQGKGVPEGRKSVALGLTWQHPSRTLNDDEINQLVDAIVEESRLHLGAELRA
>NC_014532.2|WP_041602015.1|1766831_1767134_+|integration-host-factor-subunit-alpha
MGALTKAELAEHLHAELGLSKREAKSMVESFFEEIRGCLRENEQVKLSGFGNFDLRDKRERPGRNPKTGEEIPISARRVVTFRPGQKLKSQVEAYTGDQS
>NC_014532.2|WP_013332277.1|1767213_1767420_-|DUF2788-domain-containing-protein
MQDAIDTWITPFMIGGLMLFMGFIIWDLARKSGAGRFGTVMLFVVLGAGMLAYLIKVVIGWSLEHGVL
>NC_014532.2|WP_041602016.1|1767537_1768002_+|flavodoxin-domain-containing-protein
MPMLKIFVGTVYGGALDVAEQVAPLFEQAGYEVSIFDQPTLDDLIGSPTDLALFCTSTTGSGDYPGNLVAFVRELEAKSPGLVGLKYGLIAMGDSSYVDSFCGAGRSLDEVLQGQGAERLGERLEVDAMETFMADDAALPWVDDWIESQQLKVA
>NC_014532.2|WP_049786291.1|1768055_1768379_+|hypothetical-protein
MAASVPRYLAGGHDTHLALLAIAGVAVAALAVFQWWLLPVASRAALPALMRRLVACLVIGLLATGIWHALFGAWSGWPLLVSHGAALGLLLHALGLWWKPAAKKGKE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_014532_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_014532_3

3332655-3332754

Orphan

Consensus_repeat	Method
CAAGAACTCAGCACCTTGGAAAC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_014532_3

>merge|NC_014532|3|3332655-3332754|CRISPRCasFinder
CAAGAACTCAGCACCTTGGAAACACTGGATAAATCACCTAACCGTGCGAAAAGTCAGCGAAAACAGACTCTTCTCGCCAAGAATTCAGCACCTTGGAAAC

>NC_014532|3|3|3332655-3332754|CRISPRCasFinder
CAAGAACTCAGCACCTTGGAAAC	ACTGGATAAATCACCTAACCGTGCGAAAAGTCAGCGAAAACAGACTCTTCTCGC
CAAGAATTCAGCACCTTGGAAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_014532.2\|WP_095522731.1\|3335087_3336186_-\|peptide-chain-release-factor-2	unknown	unknown	gnl\|CDD\|234799
NC_014532.2\|WP_013333589.1\|3325277_3326255_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|225088
NC_014532.2\|WP_013333592.1\|3328375_3329029_+\|16S-rRNA-(guanine(966)-N(2))-methyltransferase-RsmD	unknown	unknown	gnl\|CDD\|236793
NC_014532.2\|WP_013333605.1\|3341777_3343376_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|226641
NC_014532.2\|WP_013333601.1\|3336450_3338034_+\|peptide-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|173869
NC_014532.2\|WP_013333607.1\|3344904_3346242_-\|outer-membrane-protein-transport-protein	unknown	unknown	gnl\|CDD\|367457
NC_014532.2\|WP_013333590.1\|3326251_3326920_-\|cell-division-ATP-binding-protein-FtsE	unknown	unknown	gnl\|CDD\|225438
NC_014532.2\|WP_013333602.1\|3338256_3339840_+\|peptide-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|173869
NC_014532.2\|WP_013333597.1\|3330981_3332394_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|129794
NC_014532.2\|WP_041602190.1\|3332891_3333278_-\|hypothetical-protein	unknown	unknown	unknown
NC_014532.2\|WP_013333603.1\|3339894_3340821_+\|oligopeptide-ABC-transporter-permease-OppB	unknown	unknown	gnl\|CDD\|181886
NC_014532.2\|WP_013333594.1\|3329354_3329819_-\|ribosomal-protein-S18-alanine-N-acetyltransferase	unknown	unknown	gnl\|CDD\|273701
NC_014532.2\|WP_013333588.1\|3324282_3325149_-\|RNA-polymerase-sigma-factor-RpoH	unknown	unknown	gnl\|CDD\|235838
NC_014532.2\|WP_013333604.1\|3340841_3341768_+\|ABC-transporter-permease-subunit	unknown	unknown	gnl\|CDD\|185304
NC_014532.2\|WP_013333593.1\|3329115_3329346_+\|cell-division-protein-ZapB	unknown	unknown	gnl\|CDD\|368701
NC_014532.2\|WP_013333606.1\|3343635_3344760_+\|porin	unknown	unknown	gnl\|CDD\|225744
NC_014532.2\|WP_013333596.1\|3330641_3330953_-\|BolA-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|183243
NC_014532.2\|WP_013333599.1\|3333434_3334988_-\|lysine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234778
NC_014532.2\|WP_013333595.1\|3329811_3330645_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|180735
NC_014532.2\|WP_013333591.1\|3326916_3328284_-\|signal-recognition-particle-docking-protein-FtsY	unknown	unknown	gnl\|CDD\|236686

Protein	Function_ID	Function_description	E-value
NC_014532.2\|WP_095522731.1\|3335087_3336186_-\|peptide-chain-release-factor-2	gnl\|CDD\|234799	PRK00578, prfB, peptide chain release factor 2; Validated.	0
NC_014532.2\|WP_013333589.1\|3325277_3326255_-\|ABC-transporter-permease	gnl\|CDD\|225088	COG2177, FtsX, Cell division protein [Cell division and chromosome partitioning].	3.70024e-68
NC_014532.2\|WP_013333592.1\|3328375_3329029_+\|16S-rRNA-(guanine(966)-N(2))-methyltransferase-RsmD	gnl\|CDD\|236793	PRK10909, rsmD, 16S rRNA m(2)G966-methyltransferase; Provisional.	1.12577e-76
NC_014532.2\|WP_013333605.1\|3341777_3343376_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|226641	COG4172, COG4172, ABC-type uncharacterized transport system, duplicated ATPase component [General function prediction only].	0
NC_014532.2\|WP_013333601.1\|3336450_3338034_+\|peptide-ABC-transporter-substrate-binding-protein	gnl\|CDD\|173869	cd08504, PBP2_OppA, The substrate-binding component of an ABC-type oligopetide import system contains the type 2 periplasmic binding fold. This family represents the periplasmic substrate-binding component of an ATP-binding cassette (ABC)-type oligopeptide transport system comprised of 5 subunits. The transport system OppABCDEF contains two homologous integral membrane proteins OppB and OppF that form the translocation pore; two homologous nucleotide-binding domains OppD and OppF that drive the transport process through binding and hydrolysis of ATP; and the substrate-binding protein or receptor OppA that determines the substrate specificity of the transport system. The dipeptide (DppA) and oligopeptide (OppA) binding proteins differ in several ways. The DppA binds dipeptides and some tripeptides and is involved in chemotaxis toward dipeptides, whereas the OppA binds peptides of a wide range of lengths (2-35 amino acid residues) and plays a role in recycling of cell wall peptides, which precludes any involvement in chemotaxis. Most of other periplasmic binding proteins are comprised of only two globular subdomains corresponding to domains I and III of the dipeptide/oligopeptide binding proteins. The structural topology of these domains is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis. Besides transport proteins, the PBP2 superfamily includes the ligand-binding domains from ionotropic glutamate receptors, LysR-type transcriptional regulators, and unorthodox sensor proteins involved in signal transduction.	0
NC_014532.2\|WP_013333607.1\|3344904_3346242_-\|outer-membrane-protein-transport-protein	gnl\|CDD\|367457	pfam03349, Toluene_X, Outer membrane protein transport protein (OMPP1/FadL/TodX). This family includes TodX from Pseudomonas putida F1 and TbuX from Ralstonia pickettii PKO1. These are membrane proteins of uncertain function that are involved in toluene catabolism. Related proteins involved in the degradation of similar aromatic hydrocarbons are also in this family, such as CymD. This family also includes FadL involved in translocation of long-chain fatty acids across the outer membrane. It is also a receptor for the bacteriophage T2.	2.24739e-117
NC_014532.2\|WP_013333590.1\|3326251_3326920_-\|cell-division-ATP-binding-protein-FtsE	gnl\|CDD\|225438	COG2884, FtsE, Predicted ATPase involved in cell division [Cell division and chromosome partitioning].	6.8294e-121
NC_014532.2\|WP_013333602.1\|3338256_3339840_+\|peptide-ABC-transporter-substrate-binding-protein	gnl\|CDD\|173869	cd08504, PBP2_OppA, The substrate-binding component of an ABC-type oligopetide import system contains the type 2 periplasmic binding fold. This family represents the periplasmic substrate-binding component of an ATP-binding cassette (ABC)-type oligopeptide transport system comprised of 5 subunits. The transport system OppABCDEF contains two homologous integral membrane proteins OppB and OppF that form the translocation pore; two homologous nucleotide-binding domains OppD and OppF that drive the transport process through binding and hydrolysis of ATP; and the substrate-binding protein or receptor OppA that determines the substrate specificity of the transport system. The dipeptide (DppA) and oligopeptide (OppA) binding proteins differ in several ways. The DppA binds dipeptides and some tripeptides and is involved in chemotaxis toward dipeptides, whereas the OppA binds peptides of a wide range of lengths (2-35 amino acid residues) and plays a role in recycling of cell wall peptides, which precludes any involvement in chemotaxis. Most of other periplasmic binding proteins are comprised of only two globular subdomains corresponding to domains I and III of the dipeptide/oligopeptide binding proteins. The structural topology of these domains is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis. Besides transport proteins, the PBP2 superfamily includes the ligand-binding domains from ionotropic glutamate receptors, LysR-type transcriptional regulators, and unorthodox sensor proteins involved in signal transduction.	0
NC_014532.2\|WP_013333597.1\|3330981_3332394_-\|MFS-transporter	gnl\|CDD\|129794	TIGR00711, Uncharacterized_MFS-type_transporter_YhcA, drug resistance transporter, EmrB/QacA subfamily. This subfamily of drug efflux proteins, a part of the major faciliator family, is predicted to have 14 potential membrane-spanning regions. Members with known activities include EmrB (multiple drug resistance efflux pump) in E. coli, FarB (antibacterial fatty acid resistance) in Neisseria gonorrhoeae, TcmA (tetracenomycin C resistance) in Streptomyces glaucescens, etc. In most cases, the efflux pump is described as having a second component encoded in the same operon, such as EmrA of E. coli. [Cellular processes, Toxin production and resistance, Transport and binding proteins, Other].	8.23931e-53
NC_014532.2\|WP_013333603.1\|3339894_3340821_+\|oligopeptide-ABC-transporter-permease-OppB	gnl\|CDD\|181886	PRK09471, oppB, oligopeptide ABC transporter permease OppB.	3.37888e-147
NC_014532.2\|WP_013333594.1\|3329354_3329819_-\|ribosomal-protein-S18-alanine-N-acetyltransferase	gnl\|CDD\|273701	TIGR01575, rimI, ribosomal-protein-alanine acetyltransferase. Members of this model belong to the GCN5-related N-acetyltransferase (GNAT) superfamily. This model covers prokarotes and the archaea. The seed contains a characterized accession for Gram negative E. coli. An untraceable characterized accession (PIR\|S66013) for Gram positive B. subtilis scores well (205.0) in the full alignment. Characterized members are lacking in the archaea. Noise cutoff (72.4) was set to exclude M. loti paralog of rimI. Trusted cutoff (80.0) was set at next highest scoring member in the mini-database. [Protein synthesis, Ribosomal proteins: synthesis and modification].	7.27243e-24
NC_014532.2\|WP_013333588.1\|3324282_3325149_-\|RNA-polymerase-sigma-factor-RpoH	gnl\|CDD\|235838	PRK06596, PRK06596, RNA polymerase factor sigma-32; Reviewed.	0
NC_014532.2\|WP_013333604.1\|3340841_3341768_+\|ABC-transporter-permease-subunit	gnl\|CDD\|185304	PRK15406, PRK15406, oligopeptide ABC transporter permease OppC; Provisional.	4.56647e-128
NC_014532.2\|WP_013333593.1\|3329115_3329346_+\|cell-division-protein-ZapB	gnl\|CDD\|368701	pfam06005, ZapB, Cell division protein ZapB. ZapB is a non-essential, abundant cell division factor that is required for proper Z-ring formation.	6.842e-05
NC_014532.2\|WP_013333606.1\|3343635_3344760_+\|porin	gnl\|CDD\|225744	COG3203, OmpC, Outer membrane protein (porin) [Cell envelope biogenesis, outer membrane].	8.53174e-20
NC_014532.2\|WP_013333596.1\|3330641_3330953_-\|BolA-family-transcriptional-regulator	gnl\|CDD\|183243	PRK11628, PRK11628, transcriptional regulator BolA; Provisional.	4.35736e-38
NC_014532.2\|WP_013333599.1\|3333434_3334988_-\|lysine--tRNA-ligase	gnl\|CDD\|234778	PRK00484, lysS, lysyl-tRNA synthetase; Reviewed.	0
NC_014532.2\|WP_013333595.1\|3329811_3330645_-\|hypothetical-protein	gnl\|CDD\|180735	PRK06856, PRK06856, DNA polymerase III subunit psi; Validated.	0.00331007
NC_014532.2\|WP_013333591.1\|3326916_3328284_-\|signal-recognition-particle-docking-protein-FtsY	gnl\|CDD\|236686	PRK10416, PRK10416, signal recognition particle-docking protein FtsY; Provisional.	0

>NC_014532.2|WP_013333597.1|3330981_3332394_-|MFS-transporter
MSRLFATREGDDGLPGPERRLAVLALIFGTTMAVVDATMINLALPSIAADLEVASASAVWVTNIFQVTCAAFLLVFSGLSEVVGRRRLYVAGLALFAVSAAGSALSRDLNTLLAFRALQGLGAAATLSIGPSLYRTIFPSRLLGSALGLSSLVVATGYTAGPAIGGLVLSVADWPWLFALPVPIGVVAVILAWRALPREPGRRGGFDAAGAGCSILALGALFLAMDGVGHQTPVWQSLGWLALSLVVAGFFVWRQRRAPHPLLPLTLFRQRRFSLAVSASGLAFIGQGLAFVALSFLYQQGMGFSPLKTAWLFTPWPLAIMVAGPLAGRLADRVNPSLLSCLGLVVLIAGMIALADLEAEAGVVDCLWRTALCGLGFGIFQPPNNRELMASVPAERSANASGVMSTTRTVGQALGVALVGACLSVGAPVQTALWGGAVAGGLALLASFGRVSLAGEAARTRRRAASERVQ
>NC_014532.2|WP_013333596.1|3330641_3330953_-|BolA-family-transcriptional-regulator
MSTQSIIEEKLQALEPTLLTVENESHMHNVPPNAETHFKVTLVSSRFEGMMPVKRHQQIYALLADELAGPVHALALHPYTPEEWQSRGEARPDSPNCRGGGAS
>NC_014532.2|WP_013333595.1|3329811_3330645_-|hypothetical-protein
MTTEPHRLQYLEAMGLTAWVARYRLPNARPTEACEWEPEPAGEAGSRAPGERLHALLDDAAEASSTSAPSNESTTRPSAGQGRARALLGDLVPGEASASTATPPPAPPVSTPTEAPAEALRFTWQVTCLDGRWLVVLPRDVGPSDVEYRLLGNLLRAAGVVPSRPPSFETFRWPQLEGLPVEAPLEEAQEGLRAFLNGRRQRGWVPERLLVFGDDAVLNDLLALAEGQSGLLSMPVWQGPDLKELASGAEAKRALWPRMQGWKRDWRVGDEESRADA
>NC_014532.2|WP_013333594.1|3329354_3329819_-|ribosomal-protein-S18-alanine-N-acetyltransferase
MPDPSPAPLGRSALAALVELERVYQTYPLSAARLKAALTDGADVVFGLEEDGELLGYAILSRLPFDAELQSILVASHARRRGLAVALMEAVIAQAKAWKSERLLLEVREANAPAITLYRRMGFAEDGRRRDYYPSLDGAGREDALLMSRHLGGA
>NC_014532.2|WP_013333593.1|3329115_3329346_+|cell-division-protein-ZapB
MSIELFNQLEQKVSSAVEALELMKMEAEELREENARLKQEREEWERRLSALLGKFDDVETEQSSQQEQPAPQQQPG
>NC_014532.2|WP_013333592.1|3328375_3329029_+|16S-rRNA-(guanine(966)-N(2))-methyltransferase-RsmD
MTRRRSPSRPSRHSRAPRRRDGNRGRGQLRIIGGEYRRRLLPVIDLPGLRPTPDRVRETLFNWLGPGLAGARVLDLFAGTGALGLEALSRGAHDAILVELDARASRALEDNLATLGITHARVVNADVMRFLDAEPTPHSLVFLDPPFRQDLAAACCAALEGGWLSDDASIYLETESTLAPEVPANWILHREVRAGDSTGRLYRRRPTGEDSPTEDAC
>NC_014532.2|WP_013333591.1|3326916_3328284_-|signal-recognition-particle-docking-protein-FtsY
MFGFFKRKKKQEEQASQTPEQEVERDEAALADEEAASAPEVEPEPAPEVESEPAPEVEPEPTPEVEPDPVPEVEPEPTPEVEPEPAPEVEPEPTPEVEPEPAPEVEPEPTPEVEPEPAPEIEPEPEPTPEPAAAAPREKPRGEKKGWFARIKDGLGKTRANLTDGLAGLFLGRKQIDDDLMEELETQLLMADVGIEATTEIIDRLTERVSRKELKDPEALFKALQEELASLLDGVTQPLELPPKGEGPFVILVVGVNGVGKTTTIGKLTQRFQREGRSVMLAAGDTFRAAAVEQLKVWGERNSVPVVAQHTGADSASVVYDALAAARARGVDVLIADTAGRLHNKSHLMEELKKVRRVMGKLDADAPHEVMLVLDAGTGQNALSQASTFNEAVPVTGITLTKLDGTAKGGIIFALAQQLGTPIRFIGVGETLDDLRPFAAREFVDALFDRDDAAA
>NC_014532.2|WP_013333590.1|3326251_3326920_-|cell-division-ATP-binding-protein-FtsE
MIAFEHVGKRYGGRFEALAHLNFRVGRGEMVFLTGHSGAGKSSLLRLIIRLERPSRGRILVAGHDIDRLHHTQVPFYRRQIGVVFQDHQLLFDRSIYHNVALPLEIQGMEPRETSRRVRAALDKVGLLHRERALPIELSGGEQQRVGIARAVVNKPALLLADEPTGNLDPQLSADIMSLFEDFNRIGTTVMVASHDLALIARLRHRTLRLHEGRLVADEEAL
>NC_014532.2|WP_013333589.1|3325277_3326255_-|ABC-transporter-permease
MSRQAQKPAQRGARAYRAGASGRWRSWGRHHRAMARDSAMRLLRHPLSSLLTMLAIAIALVLPAGLWLALDGARLLDAELDESATLTAYLAERVDDGEAGRIEEALAAQQGVADTRLITAAEGMAEFQQSLGLEDALARLPDNPLPASVVISPVDPSPEAVRRLADELEGLNGVEEVRLDLAWLERLRHLAELGQRVTLALAVLFGMGVLLVVGNTIRLAVENRRQEIEVVTLIGATHPFVRRPFLYSGAWYGLGGGVLAWGLLTLGGDWLSGPVSALAASYGASFALPTLGIGGSATLLACSTLLGWLGAWIAVSRHLAQIRPR
>NC_014532.2|WP_013333588.1|3324282_3325149_-|RNA-polymerase-sigma-factor-RpoH
MSTSLLPVGHLSPGHDLNGYIQAVNGIPMLTVDEERELAFRLHDEGDLEAARRLVMSHLRFVVHIARSYSGYGLAQADLIQEGNVGLMKAVKRFDPNQGVRLVSFAVHWIKAEIHEFVLRNWRIVKVATTKAQRKLFFNLRGAKKRLAWLNSNEVEAIAKDLDVKPEVVREMEGRLSAHDAGFDAAPGEDEESAYQAPVHYLDDASQDPATQLEDSDWEEDSTQRLQAALSELDERSRDILQRRWLSDDKSTLHDLADVYGVSAERIRQLEKNAMKKIRQSIGDTLAA
>NC_014532.2|WP_041602190.1|3332891_3333278_-|hypothetical-protein
MKLLNRSALSVRPTQHFVDWINALEPTVGDDDLALEDVERESTVYLIPEMDTPENLEAFVRERYLEILETELRAWEEDERQWPETLDWALFQRFLCIEHSYLAIDLDDEAALEVAEVDDSMLLETDQD
>NC_014532.2|WP_013333599.1|3333434_3334988_-|lysine--tRNA-ligase
MAHQDNSQAPAGTQDENHLIAERRAKLAARREQAAASGGSAFPNDFRRDSLAAELAAELGDKDKAELESLGRPAAVAGRILRKRGPFIVIQDASGQIQLYVDKKGLPAETLEDIKGWDIGDIVAGRGPVHKSGKGDLYVMMEEARLLTKSLRPLPDKFHGLTDMEARYRQRYVDLIMNPDSRRVFETRAGVISAMRRFFEDHGFMEVETPMLQPIPGGATARPFITHHNALDIDMYLRIAPELYLKRLVVGGFEKVFEINRNFRNEGLSTRHNPEFTMVEYYQAYADYQDLMDFTEAMLRTVTREVLGDTTVVSTVRDSEGEVLETFEYDFGKPFERLSVFDAILAYNPDITAEALADEAAARQIAERLDIDVKDGWGLGKVQIEIFEKTVEHRLQQPTFIIDYPTEVSPLARRKDTDPFVTERFEFFVGGRELANGFSELNDAEDQAERFAAQAAEKDAGDQEAMYYDADYVRALEYGLPPTAGEGIGIDRLVMLLTDSASIRDVLLFPAMRPSAD
>NC_014532.2|WP_095522731.1|3335087_3336186_-|peptide-chain-release-factor-2
MQEVNPINHLIKDLSERTDVLRGYLDYAEKKERLEEVTRELEDPEVWNDPDYAQKLGKERATLEMVVDTIDTLERGLNDNRDLLELAEMEEDADTVDEVSRELESLRADLEKLEFRRMFAGEMDPNNAYLDIQAGSGGTEAQDWANMLLRMYLRWAEHHGFKADLIELSAGEVAGIKSATVHIQGEYAFGWLRTETGVHRLVRKSPFDSGGRRHTSFASVFLSPEVDDSFEVEINPSDLRVDTYRSSGAGGQHVNTTDSAVRITHEPTGIVVACQSQRSQHANRDFAMKQLRAKLWEHEMDKRNAAKQAAEDSKADIGWGSQIRSYVLDDQRIKDLRTGVQSSSCEKVLDGDLDQFIEASLKQGL
>NC_014532.2|WP_013333601.1|3336450_3338034_+|peptide-ABC-transporter-substrate-binding-protein
MTHNRTPLAGAIALAAALVTTPAWAQTLNLGVTGELASFDTSQVSGGIWESQILMDVYEGLVKKAPDGEVLPGMATSWEVSDDGRTYTFHIREDAAWSDGEPVTAEDFVFGWQHLLDPKNASKYAYMLYPVVNAEAVNTGEKPLDALGVASLDDGRTFQVELTAPTPYFIQLLTHYTAYPAPKHAVEEYGRKWVKLDNIVTNGAFTPEEWVSQSRISVSPNPEYYDADEIALDGVNYYTVEDRNAGVSRFRSGELDIMREYPSSLYGMLQEELPDATHMAPYLGSYYYVFNHREGHPTADPKVREALSLVVRRKVLSEQIMGGTFLPSRSFVPEGIHHYDVQQMPQEGSMDERMERARQLLAEAGYGPDSPLHLRLRYNTNDEHKKIAVALAAMWRPLGVEIEMINSEATVHYQTIAEGDFDIARAGWIADYNDAENFLSLLHSGVGNNYGAYSNAEFDDLTDQASHTLDADKRESLLEQAEQTALNDYAILPLLYYVSRNLVNPAISGWEDNVEDDHPSRWISFDK
>NC_014532.2|WP_013333602.1|3338256_3339840_+|peptide-ABC-transporter-substrate-binding-protein
MLSHRFTRAALLATLVAGAAQSAPAAVLQVGNGAEPGTLDPQKTNGVWETRITRELFERLVTYAADGSLVPGLAESWTISDDGTTYTFHLRQAEWSDGTPITADDAVFALRRLLKPAIASHNANLYYPIKNARAVNTGQAEPSELGVSAADEHTLVIQLDEPTAYFLQALAMTEAAPLPRHLVEKAGDEWTRPGTMVSSGAFTLREWRPQARIDLDRNPHFHDADTVSLDGVTFYPIDDTGSALNRFRAGDLDISYSGVPASRFDWVKDNLGESLRVGPLVAEYFYMFNLRDGQPLADERVREALSLAVRREVITDRILGMGQRASYWYVPRAAEGGTRGSLDVAEQPMEQRLARAKRLMQEAGYGPDNPLHVTLRYNTLEDHKKIAVAVAAMWKPLGVEVELINAEAAVHYATVNEGDFEIARYGMVATINDPYDFLNAYAKGGSAQRSTGYRNDAYDALVERSTRELNTERRAELMTRAEQMLLDDHALLPLYDYVSAHLVSPEVKGWQTTAIDVHPLRYIQLED
>NC_014532.2|WP_013333603.1|3339894_3340821_+|oligopeptide-ABC-transporter-permease-OppB
MLSYTLKRLLQAIPTMLIVITISFFLMRIAPGGPFDGERALPPEIEANLMAAYHLDEPLPMQYLRYMGNLLQGDFGPSFKYKDFSVTELIMQGFPVSLEIGGLAILLALLLGLPLGVIAALKRNSTIDYLVMGTALAGIAIPNFVIAPILALVFGVLLAWLPAGGWNGGALPNLVLPVIALSIQQIAYIARMMRASMIEVLGSHYIRTARAKGLAESQVIWRHALRPALLPVTSYLGPAVAGIITGSVVIEQIFGIPGIGRYFVQGALNRDYTLVMGTVVFYGALIVLMNLLVDLIYSALDPQIRHDD
>NC_014532.2|WP_013333604.1|3340841_3341768_+|ABC-transporter-permease-subunit
MTTEPLTHDGDRHAPGDDLAPGAAPAAGESLTRDAWRRLKQNRAAMVSLVMLSVITVICVFGPYVLPWGLADVDWNAFNAPPSIENGHLLGTDANGRDLLTRTLYGGRVSLSVALVASLVSLVIGVLYGAISGYLGGRVDNIMMRFVDIMYSLPFMFLVILLMVVFGRNILLIYAAIGAVEWLDMARIVRGQTLALKQREFVEAAHALGVRDSRIVTRHLIPNAIGPVIVYVTLTVPKVILLESFLSFLGLGVQEPLTSWGVLISEGTDMMQSSPWMLLVPSVFLAMTLFCLNFLGDGLRDALDPKTR
>NC_014532.2|WP_013333605.1|3341777_3343376_+|ABC-transporter-ATP-binding-protein
MSDTLLEIDNLSVDFQLPDGTVPAVKDVSFDIRAGETVALVGESGSGKSVSSTAAMRLLPELAQARGAIRFRGEDLLAATPRRMRRIRGNAISMIFQEPMTSLNPLHRIGAQIIEVLTRHNKAKGRAARTRAIELLEQVGIPEPERRIGSYPHELSGGQRQRVMIAMALACEPELLIADEPTTALDVTVQAQILQLLKSLQARYGMAILFITHDLGIVRHFADRVCVMRRGEMVERGDTAEVFTNPRHDYTRMLIDAEPRGGKSPVEASAPVLLEARNLRVRFALKKRLFRPSSYFEAVRGIDLTIQRGQTVGVVGESGSGKSTLGRALLRLLKSSGDIRFDDSDLTALDGAGMRPLRSRLQVVFQDPFGSLSPRLTVGEVISEGLRVHHPELDRRQRERRVIEALEEVALDPAMRNRYPHEFSGGQRQRIAIARALVLKPEFLLLDEPTSALDRSVQVTVIELLRNLQAKYGLTYLFISHDLAVVRALADTVMVMKSGQVVEQGPTEAIFANPREAYTRELMRAAFVDDAA
>NC_014532.2|WP_013333606.1|3343635_3344760_+|porin
MFHHYKLTGLAVAIGAALSTQQALAVTAYETDQDKLTISGRIAAGSSFIDNVDDDHDPTNAGSRIRLIHEHEFEHGWSSVARAEWGFDPFFEHGNDGHYKRMLYAGVRHDDYGTLLIGKQYSLWYDMVAYWTDWFWYNGATAQGSFNGAFGDGGFEGNGRPDNAVSYKNTWGDWSLGLLYQTSRDDVPTGAGYTGNLTGFERDYTAQGAAVWQPTEDLSLGATYTHSAIDGKTAGGGKRSKNVDAGLLAARWTPGNWYFALTGGRYDNLVRDGNFSGVNTTDGIVDEARGVEGVALYNLKGQVPGKVQLYTGFNRLEDRASEARSAFYLAGAAWLTFDENLIIALERKFDDSVDADGASDIGNDETNLLVRYNF
>NC_014532.2|WP_013333607.1|3344904_3346242_-|outer-membrane-protein-transport-protein
MQNQLNKLTVAVTLASAVLASSQAAASGFQVREQSAKALGNAMAGAAAGAEDVSYMTFNPAAIGNVDGTQVAGGISYIDANFELTDASAGPAGLPLSYDRGGSREGGEEAWVPSFAFKTQLDDRFDFGLSVSAPYGLSTEYDKNWIGRYHAIETDLQTIDIQPTLNYRATDRLNLAVGLRAQYADATLSNAIDLGGMSGNPALVGNADGKAEVTGDDWGYGYTLGALFQATDRTRLGISYRSEVDLTLEGDVNYSASNAAGRQILAGAQAMGQLRDAGGKADLTTPANMNLGVYHQLTDRFAVMANAEWTEWSSFDKLVVKSGGQDLSTTTENWDDTWAFSVGANYQLNREWLLRAGLGVDESPVPDSEHRTPRVPDADRRWATLGATWMPTPDLGVTAGYMRVFGDDGDIDQSGAKPENATRGDLSGTYEVDANVFALSVDYRF

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_014532_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_014532_4

3712097-3712185

Orphan

Consensus_repeat	Method
GCCGTGACAGGTCGGGCAGGTCT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_014532_4

>merge|NC_014532|4|3712097-3712185|CRISPRCasFinder
GCCGTGACAGGTCGGGCAGGTCTGCTGCACGGCGAAGAAGCCTTGCTGCATGCGTACCTGACCGTGGCCGTGACAGGTCGGGCAGGTCT

>NC_014532|4|4|3712097-3712185|CRISPRCasFinder
GCCGTGACAGGTCGGGCAGGTCT	GCTGCACGGCGAAGAAGCCTTGCTGCATGCGTACCTGACCGTG
GCCGTGACAGGTCGGGCAGGTCT

Protein	Signature genes	Signature genes Name	Protein_function
NC_014532.2\|WP_013333910.1\|3709119_3709869_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224045
NC_014532.2\|WP_013333913.1\|3712763_3714698_-\|molecular-chaperone-DnaK	unknown	unknown	gnl\|CDD\|234715
NC_014532.2\|WP_013333908.1\|3706911_3708039_+\|ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|238559
NC_014532.2\|WP_041602244.1\|3714825_3715455_-\|nucleotide-exchange-factor-GrpE	unknown	unknown	gnl\|CDD\|184539
NC_014532.2\|WP_041602243.1\|3710742_3711375_-\|LysE-family-translocator	unknown	unknown	gnl\|CDD\|224199
NC_014532.2\|WP_157953433.1\|3704441_3705425_+\|esterase-like-activity-of-phytase-family-protein	unknown	unknown	gnl\|CDD\|379191
NC_014532.2\|WP_013333915.1\|3715677_3717351_+\|DNA-repair-protein-RecN	unknown	unknown	gnl\|CDD\|223571
NC_014532.2\|WP_013333916.1\|3717429_3717876_-\|ferric-iron-uptake-transcriptional-regulator	unknown	unknown	gnl\|CDD\|236527
NC_014532.2\|WP_013333907.1\|3706334_3706616_-\|DUF2218-domain-containing-protein	unknown	unknown	gnl\|CDD\|378337
NC_014532.2\|WP_041602242.1\|3709846_3710746_-\|DMT-family-transporter	unknown	unknown	gnl\|CDD\|223769
NC_014532.2\|WP_013333904.1\|3703488_3704295_-\|4-hydroxy-tetrahydrodipicolinate-reductase	unknown	unknown	gnl\|CDD\|234595
NC_014532.2\|WP_013333920.1\|3719243_3719735_+\|SsrA-binding-protein-SmpB	unknown	unknown	gnl\|CDD\|235455
NC_014532.2\|WP_013333917.1\|3717909_3718368_+\|outer-membrane-protein-assembly-factor-BamE	unknown	unknown	gnl\|CDD\|367908
NC_014532.2\|WP_041602245.1\|3718375_3718690_-\|RnfH-family-protein	unknown	unknown	gnl\|CDD\|377094
NC_014532.2\|WP_041602248.1\|3721072_3721255_+\|type-II-toxin-antitoxin-system-HicA-family-toxin	unknown	unknown	gnl\|CDD\|377942
NC_014532.2\|WP_013333909.1\|3708040_3709126_+\|iron-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|223682
NC_014532.2\|WP_013333919.1\|3718679_3719114_-\|type-II-toxin-antitoxin-system-RatA-family-toxin	unknown	unknown	gnl\|CDD\|176855
NC_014532.2\|WP_041602246.1\|3720322_3720553_+\|DUF1654-domain-containing-protein	unknown	unknown	gnl\|CDD\|311699
NC_014532.2\|WP_013333903.1\|3702047_3703193_-\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	unknown	unknown	gnl\|CDD\|237139
NC_014532.2\|WP_041602712.1\|3705401_3706304_-\|DMT-family-transporter	unknown	unknown	gnl\|CDD\|273359

Protein	Function_ID	Function_description	E-value
NC_014532.2\|WP_013333910.1\|3709119_3709869_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224045	COG1120, FepC, ABC-type cobalamin/Fe3+-siderophores transport systems, ATPase components [Inorganic ion transport and metabolism / Coenzyme metabolism].	1.84149e-78
NC_014532.2\|WP_013333913.1\|3712763_3714698_-\|molecular-chaperone-DnaK	gnl\|CDD\|234715	PRK00290, dnaK, molecular chaperone DnaK; Provisional.	0
NC_014532.2\|WP_013333908.1\|3706911_3708039_+\|ABC-transporter-substrate-binding-protein	gnl\|CDD\|238559	cd01139, TroA_f, Periplasmic binding protein TroA_f. These proteins are predicted to function as initial receptors in the ABC metal ion uptake in eubacteria and archaea. They belong to the TroA superfamily of helical backbone metal receptor proteins that share a distinct fold and ligand binding mechanism. A typical TroA protein is comprised of two globular subdomains connected by a single helix and can bind their ligands in the cleft between these domains.	2.16202e-164
NC_014532.2\|WP_041602244.1\|3714825_3715455_-\|nucleotide-exchange-factor-GrpE	gnl\|CDD\|184539	PRK14150, PRK14150, heat shock protein GrpE; Provisional.	1.17759e-61
NC_014532.2\|WP_041602243.1\|3710742_3711375_-\|LysE-family-translocator	gnl\|CDD\|224199	COG1280, RhtB, Putative threonine efflux protein [Amino acid transport and metabolism].	1.04694e-37
NC_014532.2\|WP_157953433.1\|3704441_3705425_+\|esterase-like-activity-of-phytase-family-protein	gnl\|CDD\|379191	pfam13449, Phytase-like, Esterase-like activity of phytase. This is a repeated domain that carries several highly conserved Glu and Asp residues indicating the likelihood that the domain incorporates the enzymic activity of the PLC-like phospho-diesterase part of the proteins.	6.65729e-46
NC_014532.2\|WP_013333915.1\|3715677_3717351_+\|DNA-repair-protein-RecN	gnl\|CDD\|223571	COG0497, RecN, ATPase involved in DNA repair [DNA replication, recombination, and repair].	0
NC_014532.2\|WP_013333916.1\|3717429_3717876_-\|ferric-iron-uptake-transcriptional-regulator	gnl\|CDD\|236527	PRK09462, fur, ferric uptake regulator; Provisional.	1.85672e-65
NC_014532.2\|WP_013333907.1\|3706334_3706616_-\|DUF2218-domain-containing-protein	gnl\|CDD\|378337	pfam09981, DUF2218, Uncharacterized protein conserved in bacteria (DUF2218). This domain, found in various hypothetical bacterial proteins, has no known function.	1.09993e-38
NC_014532.2\|WP_041602242.1\|3709846_3710746_-\|DMT-family-transporter	gnl\|CDD\|223769	COG0697, RhaT, Permeases of the drug/metabolite transporter (DMT) superfamily [Carbohydrate transport and metabolism / Amino acid transport and metabolism / General function prediction only].	7.82501e-10
NC_014532.2\|WP_013333904.1\|3703488_3704295_-\|4-hydroxy-tetrahydrodipicolinate-reductase	gnl\|CDD\|234595	PRK00048, PRK00048, dihydrodipicolinate reductase; Provisional.	1.84002e-134
NC_014532.2\|WP_013333920.1\|3719243_3719735_+\|SsrA-binding-protein-SmpB	gnl\|CDD\|235455	PRK05422, smpB, SsrA-binding protein SmpB.	3.98877e-85
NC_014532.2\|WP_013333917.1\|3717909_3718368_+\|outer-membrane-protein-assembly-factor-BamE	gnl\|CDD\|367908	pfam04355, SmpA_OmlA, SmpA / OmlA family. Lipoprotein Bacterial outer membrane lipoprotein, possibly involved in in maintaining the structural integrity of the cell envelope. Lipid attachment site is a conserved N terminal cysteine residue. Sometimes found adjacent to the OmpA domain (pfam00691).	7.90242e-27
NC_014532.2\|WP_041602245.1\|3718375_3718690_-\|RnfH-family-protein	gnl\|CDD\|377094	pfam03658, Ub-RnfH, RnfH family Ubiquitin. A member of the RnfH family of the ubiquitin superfamily. Members of this family strongly co-occur in two distinct gene neighborhood contexts. In one it is associated with a START domain protein, a membrane protein SmpA and the transfer mRNA binding protein SmpB. This association suggests a possible role in the SmpB-tmRNA-based tagging and degadation system of bacteria, which is interesting given that other members of the ubiquitin system are analogously involved in protein-tagging and degradation across eukaryotes and various prokaryotes. The second context in which the RnfH genes are present is in a membrane associated complex involved in transporting electrons for various reductive reactions such as nitrogen fixation.	3.75847e-30
NC_014532.2\|WP_041602248.1\|3721072_3721255_+\|type-II-toxin-antitoxin-system-HicA-family-toxin	gnl\|CDD\|377942	pfam07927, HicA_toxin, HicA toxin of bacterial toxin-antitoxin,. HicA_toxin is a bacterial family of toxins that act as mRNA interferases. The antitoxin that neutralizes this is family HicB, pfam15919.	4.98682e-19
NC_014532.2\|WP_013333909.1\|3708040_3709126_+\|iron-ABC-transporter-permease	gnl\|CDD\|223682	COG0609, FepD, ABC-type Fe3+-siderophore transport system, permease component [Inorganic ion transport and metabolism].	1.32685e-72
NC_014532.2\|WP_013333919.1\|3718679_3719114_-\|type-II-toxin-antitoxin-system-RatA-family-toxin	gnl\|CDD\|176855	cd07813, COQ10p_like, Coenzyme Q-binding protein COQ10p and similar proteins. Coenzyme Q-binding protein COQ10p and similar proteins. COQ10p is a hydrophobic protein located in the inner membrane of mitochondria that binds coenzyme Q (CoQ), also called ubiquinone, which is an essential electron carrier of the respiratory chain. Deletion of the gene encoding COQ10p (COQ10 or YOL008W) in Saccharomyces cerevisiae results in respiratory defect because of the inability to oxidize NADH and succinate. COQ10p may function in the delivery of CoQ (Q6 in budding yeast) to its proper location for electron transport. The human homolog, called Q-binding protein COQ10 homolog A (COQ10A), is able to fully complement for the absence of COQ10p in fission yeast. Human COQ10A also has a splice variant COQ10B. COQ10p belongs to the SRPBCC (START/RHO_alpha_C/PITP/Bet_v1/CoxG/CalC) domain superfamily of proteins that bind hydrophobic ligands. SRPBCC domains have a deep hydrophobic ligand-binding pocket and they bind diverse ligands.	9.96432e-71
NC_014532.2\|WP_041602246.1\|3720322_3720553_+\|DUF1654-domain-containing-protein	gnl\|CDD\|311699	pfam07867, DUF1654, Protein of unknown function (DUF1654). This family consists of proteins from the Pseudomonadaceae.	4.43341e-12
NC_014532.2\|WP_013333903.1\|3702047_3703193_-\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	gnl\|CDD\|237139	PRK12564, PRK12564, carbamoyl-phosphate synthase small subunit.	0
NC_014532.2\|WP_041602712.1\|3705401_3706304_-\|DMT-family-transporter	gnl\|CDD\|273359	TIGR00950, Uncharacterized_inner_membrane_transporter_YicL, Carboxylate/Amino Acid/Amine Transporter. [Transport and binding proteins, Amino acids, peptides and amines].	5.23821e-07

>NC_014532.2|WP_041602243.1|3710742_3711375_-|LysE-family-translocator
MEWLAFVIAALGFAYLPGPAMLYTAAQTLGRGRRAGFCAVLGVHLGCYVHVIAAALGLAALFAAVPPAYVAMKIIGGCYLLWVGMRLWRRGIGSPETTDGTGKGARRVMVDSMLVEILNPKTALFFVAFLPQFAQPEAGMAMGWQLLWLGIAANFLFSSADVVVVMLAAPLRRWLQGPRGSTRLAQRLGGGLLASLGAHGLTQVYRQGIS
>NC_014532.2|WP_041602242.1|3709846_3710746_-|DMT-family-transporter
MTDAMDRPLAGILLRLCSGVLFTGMMVCVKVVSTEVPLGQTVFFRSAFALLPIVIFMIWRHEFPRALATRRPAGHLLRSGLGAAAMFASFAAVARLPVAEATLLAQLAPVAMAVGGVFLLGERFTRHRAAALALVLGGVAALVVPDLGNGEQAGRLPGYGLGILAALLTAGALVTVRRISRTETPASIAFYFVLVTALAGLATWPLGWVGVSGTTLSLLILAGLFGGAAHICMTLALRFAEVSRLAPFEYVALIWPVLADLLIFGLPLSPGFLVALPLVLGGAGLAALEGRRFRWRLRR
>NC_014532.2|WP_013333910.1|3709119_3709869_+|ABC-transporter-ATP-binding-protein
MVTLTLDRLTAHYGRRQILSEITTPPLEGGRVVALLGPNAAGKSTLFRRILGLIGGGGSARIDGTTRERPLAYMPQDTGANAVLSVYESVLLARMQGRSLKVQDEDLAEVDRALRELGISELGERDIGDLSGGQRQLVGAAQALVQDPEILLLDEPTSALDLHRQIQLLSILQRLARERHMLILAALHDLGQALRFTDEAIMLENGRLIACGPTGEVVTPELLRRVYRVETRIEACSRGQPQLIVEAAT
>NC_014532.2|WP_013333909.1|3708040_3709126_+|iron-ABC-transporter-permease
MHASPPDQAAAASPTTLQGRGFYRRLVIRRQLTLAALTLALCLSLCIDLALGPARFGLGEVIAALLDPASASQQVRVILWDIRMPVALMALVVGASLSVAGAQMQTILSNPLASPFTLGISAGASFGAALALAFGVVIVPAAVEYVIPINAFVMAMLTAFAIHALSLKRGVTIETIVLLGIAMVFIFNSLMALIQFFASQQAVAAVVFWTMGSLTKATWPKLGIAAGVLAVVLPLLARHGWALTAMRLGDAKAESLGVKPRALRLEVLVLVSLLAAIAVAFVGTIGFIGLVGPHIARLLMGEDQRFFLPGAALCGALILSVGSVLSKIILPGTIIPIGIITSLVGIPFFLFLVLNHKKSAW
>NC_014532.2|WP_013333908.1|3706911_3708039_+|ABC-transporter-substrate-binding-protein
MHTSLLKTLGGIALTLGSAVAQADEITVTDVAGREVTVDAPVDRVILGEGRQIYLLGALQPEAPFAHVVGWREDFSQADPDNYARYAAKFPELKDIPTFGGFKDGTFDVEQAAALEPDVVLMNLEAKAATEDAAYDDKLAELGIPILYVDFREAPLEHTIPSMRLMGKLLGKQEAAEDFIDFAEAQMARVTDTIESAAPERPRVFVDRAGGYSEDCCMSFGPGNFGEYVELAGGTNIAKDIIPNTFGSLNPEQIIAANPQQVVVTGGNWDAYVPGGDWVGVGPGADMTTARAKLEALTERTAMTGIEAVENDDVHAIWHQFYNSPYYFVAVQRLAKWFHPALFADLDPGATMKELHDRFLPVDYEPGYWVSLKEH
>NC_014532.2|WP_013333907.1|3706334_3706616_-|DUF2218-domain-containing-protein
MPISRAEIVTDSGEKLINRLCKHWSHKLEVEQEGDEGRITFDNGSCLLRAEEGKLKVAVESLDEEGLDRLEGVVASHLERMSGKESLDIIWEN
>NC_014532.2|WP_041602712.1|3705401_3706304_-|DMT-family-transporter
MLLWAALVGLSFPAVGLMGELPPMLLTALRFAIACLGLWPLAHRAEGFALARRAVPVYALMGLCLAGFFGAMFWAAHHATALSMATLYVTVPLLAYGLGLGLRVERLAWRLPAILALGAVGALALAYAEALVRGGQMRFGIGEAVFFVGCVCSALYPVLSKWGLNAGRLPASAAVRTFWSLGLGGVLIGVLGVLVEPVSRFAAMSWSDALLLVYLGLFSSALTFWLMQRATLVLTPGAITAYGYLVPFVSMLVLFLRAPQSLDWVWLPGSLMVLAAIALLLRHDADTERKTGDSARTQAD
>NC_014532.2|WP_157953433.1|3704441_3705425_+|esterase-like-activity-of-phytase-family-protein
MPRMPTSGRALGALPLAILFMTLLVPLPGCANHARVVSLAGVGADITPPPRVELCGTLSLPSHWPDGTPVNGLSDLVWERDAGLLHMVSDRGWLHRARPRFEDGQLVGLSPIDSHRLRDGDGLPLEGSAADAESLSLLHGTNGKLGDSEFWVSFERDHRLQRFDRDGGPLAAPIRPAQAADAAPNKGMEAMTELPKHGLILGLESPPPGAAPGETRLFTLDGKQWRYPLAAPTGSALTELTADGDDLLALERAFAPPAPLVISLRRVRLGEPPELDVETLASFSSADGWWLDNMEGLTRLDDGRLLLLSDDNASPLQRSLLVCLRPR
>NC_014532.2|WP_013333904.1|3703488_3704295_-|4-hydroxy-tetrahydrodipicolinate-reductase
MTRIAIAGVAGRMGRTLVNAVQQDAEATLAGGTVSPGSSLVGADIGELAGSGKLGVMATDSLAAIAADFDVLIDFTAPRVTLDNLAVCAEHGKRMVIGTTGLSDEELAELDAYRDRLPMVFAPNMSVGVNLTFKLLETAARALGDEGYDIEVIESHHRHKVDAPSGTALKLGEVVADALGRDLKTDGVFERVGQCGPRSDKEIGFATVRAGDIVGEHTVMFATEGERIEITHKASSRMTFAKGAVRAARWVAGQPVGRYDMQDVIGLD
>NC_014532.2|WP_013333903.1|3702047_3703193_-|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit
MSKPAILALEDGSVFHGTAIGADGQTSGEVVFNTAMTGYQEILTDPSYSRQIVTLTYPHIGNTGVNSEDVESSSIAAAGLVIRDLPLLASNFRCEQTLSDYLAQQNVLGIADIDTRRLTRLLRDKGSQNGAILAGPDAEGEGAEARALEAAGAFPGLKGMDLAKVVSCTEPYEWSEGEWTLGSGYADASEGERPYHVVAYDYGMKRNILRMLASRGCRLTVVPAQTPAEEVLAMNPDGIFLSNGPGDPEPCDYAISAIQAFLETEIPVFGICLGHQLLALASGARTVKMNHGHHGANHPVQDLDSGRVMITSQNHGFAVEEASLPDNLRAIHRSLFDGTLQGIERTDRPAFSFQGHPEASPGPRDVAPLFDRFVEMMRRRR
>NC_014532.2|WP_013333913.1|3712763_3714698_-|molecular-chaperone-DnaK
MGRIIGIDLGTTNSCVAVLDGDDAKVIENAEGARTTPSIIAYTDDGETLVGQAAKRQAVTNPQNTLYAIKRLIGRRFKDDVVQKDIKMVPYTITEADNGDAWVEVKGNKLAPPQVSAEVLKKMKKTAEDYLGETVTEAVITVPAYFNDSQRQATKDAGRIAGLEVKRIINEPTAAALAYGMDKSRGDKTIAVYDLGGGTFDISIIEVADVDGETQFEVLATNGDTFLGGEDFDLALINYLVDQFKSDSGIDLSGDNLAMQRLKEAAEKAKIELSSAQQTEVNLPYITADNTGPKHLNVKVTRAKLESLVEELVARSLKPCKTALADADLSASDIDDVILVGGQTRMPLVQAKVAEFFGKDARKDVNPDEAVAVGAAIQGGVLGGDVKDVLLLDVTPLTLGIETLGGVMTPLIEKNTTIPTKKTQTFSTADDNQTAVTIHVLQGERKQSSGNKSLGRFDLADIPPAPRGVPQIEVAFDLDANGILNVSAKDKATGKEQSIVIKASSGLSEEEVEQMVRDAEAHADEDKKFEELVALRNQADGMVHAARKTLEEAGDKATDEEKQAIENAASELEEAAKGDDQEDIQAKLDALTEASGNLAQKMYAEQAEDAAGADAGEQAEGQKKTEDDVVDAEYEEVNDDQKKQ
>NC_014532.2|WP_041602244.1|3714825_3715455_-|nucleotide-exchange-factor-GrpE
MAKDPQTPLDDELSRQQEEADAQVEPESVEGELEDAIENAEQTQEERESTDNPEAEVLAAKVEELEQSLADAKDQSLRAAAEAQNVRRRAEQEAEKARKFALEKFVKELLPVVDSLEKALDAMQEGASETHREGVSMTLKLQLDVLGKFGVEVVDPTGEPFDPQYHEAVTMVPNAELEPNSVMEVIQKGYLLNGRLVRPAMVVVSQSSE
>NC_014532.2|WP_013333915.1|3715677_3717351_+|DNA-repair-protein-RecN
MLTELAIRDFAIVDHLALELEGGMTAITGETGAGKSILLGALGLCLGERADAGSVRHGCERADLSARFDIAELPAARTWLDERELPSDDCLLRRVVTRSGRSKAWINGQPATVADLKALGDHLIEIHGQHAHQGLLREETHLHLLDDFADHDEAVRDMAATFHAWRESHQRLKRLSEDNDEIRARLQLLRYQVEELDQLALAEGELEGLESEQETLAHAEERLREAQFAAQCCDGDEGGALPLLHQAVNRLSALPGSERSALADALSMLGDACIQVEEAGRELNHFAAGVELDPERLAWVEERLGEVHRIARKHQVAPHELVSLHQHLTEELAELEGGDGDLDALAAEVENLKQAWRQRAEAVSATRRKAAQRFGKAVQEQLAFLAMGKASFDVELTPRDTPSPEGLERARFTISANPGQPARPLTKVASGGELSRISLAIQVVAAQHSTIPSLVFDEVDVGISGATAEVVGQLLRRLGKGGQVMTVTHLPQVAAQAHQHLHIAKQAEDETTLTHMALLDEAGRVGELARMLGGMKLTDQTLAHAREMLDASQRAHH
>NC_014532.2|WP_013333916.1|3717429_3717876_-|ferric-iron-uptake-transcriptional-regulator
MADQNHELRKAGLKVTLPRVKILHILENATGQHHLSAEDVYKTLLEAGEDVGLATVYRVLTQFETAGLVTRHNFDGGHAVFELTQEEHHDHMVCLDSGEIIEFFDDTIERRQQEIAEEHGYELVDHALVLYVRPKGSRVTRQEPSGKK
>NC_014532.2|WP_013333917.1|3717909_3718368_+|outer-membrane-protein-assembly-factor-BamE
MIDQNHDSEEQAQMQKLTRTVTLTVALTLVSGCSYFGVYKRDLAQGNLVTSAMAEQLQPGMTRQQVVNLMGSPMLEAPFDAQQWDYVYRLDKAYGGVEQRRLTLTFQGNRLADIDRHGDFSRPPSVADERGIGPTDSTNARGNLLNARPDDE
>NC_014532.2|WP_041602245.1|3718375_3718690_-|RnfH-family-protein
MDAEEQGMVHVEVAFALPNRQRIVSLTLPAGTHAREAVRQADLAHYFPDVPPETFENAALGIFGKALRDPERHILQEGERVEVYRPLRIDPKAARASRAADKRG
>NC_014532.2|WP_013333919.1|3718679_3719114_-|type-II-toxin-antitoxin-system-RatA-family-toxin
MPTVNRSALVRHTPQQMFDLVNDFERYPEFLPGCRRARLLERDAEHLVGEMTLGRAGIEQSFTTRNDLQEPERIDLSLVNGPFKRLRGRWLFMPMGEDTCKVSLEMEFEFANRLLGMAFGKLFQQVAGQLVEAFTRRADELYGR
>NC_014532.2|WP_013333920.1|3719243_3719735_+|SsrA-binding-protein-SmpB
MANKKGKGKGPGSNAIALNKKARFEYHIDETFEAGLALAGWEVKSLRAGKAQLTDTYILVKNGEAWLLGSHITPLNTVSTHEVADPTRTRKLLLHRKEIARIFSRTQDKGHTCVPLKLYWKGSKVKCELALVTGKKLHDKRATEKDRDWQRQKGRILREHNKT
>NC_014532.2|WP_041602246.1|3720322_3720553_+|DUF1654-domain-containing-protein
MAKKHRPTSYELLGQRVKQIIAAATWREQRQVHLQPAEGDSPDDWDRLIDEISENENVDVTRTDEGWLVSWVPVGA
>NC_014532.2|WP_041602248.1|3721072_3721255_+|type-II-toxin-antitoxin-system-HicA-family-toxin
MKSSELIKELEADGWQLDRIKGSHHHFRHPSKPGTITVPHPKKDLKKGLVQGIRKQAGLK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_014532_1	1.2\|126799\|32\|NC_014532\|PILER-CR,CRISPRCasFinder,CRT	126799-126830	32	NC_013190	Candidatus Accumulibacter phosphatis clade IIA str. UW-1 plasmid pAph02, complete sequence	27706-27737	8	0.75
NC_014532_1	1.1\|126739\|32\|NC_014532\|PILER-CR,CRISPRCasFinder,CRT	126739-126770	32	NZ_CP032325	Azospirillum brasilense strain MTCC4035 plasmid p4, complete sequence	598119-598150	9	0.719
NC_014532_1	1.1\|126739\|32\|NC_014532\|PILER-CR,CRISPRCasFinder,CRT	126739-126770	32	NZ_CP007796	Azospirillum brasilense strain Az39 plasmid AbAZ39_p3, complete sequence	48757-48788	9	0.719
NC_014532_1	1.4\|126919\|32\|NC_014532\|PILER-CR,CRISPRCasFinder,CRT	126919-126950	32	NZ_CP028971	Aminobacter sp. MSH1 plasmid pUSP3, complete sequence	9439-9470	10	0.688
NC_014532_1	1.4\|126919\|32\|NC_014532\|PILER-CR,CRISPRCasFinder,CRT	126919-126950	32	NZ_CP015008	Aminobacter aminovorans strain KCTC 2477 plasmid pAA03, complete sequence	106268-106299	10	0.688

1. spacer 1.2|126799|32|NC_014532|PILER-CR,CRISPRCasFinder,CRT matches to NC_013190 (Candidatus Accumulibacter phosphatis clade IIA str. UW-1 plasmid pAph02, complete sequence) position: , mismatch: 8, identity: 0.75

aaggcataaagatgaatacattgagctcccat	CRISPR spacer
aaggcacaaagatgaatacagtgatcgctatc	Protospacer
******.************* *** * *.  .

2. spacer 1.1|126739|32|NC_014532|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP032325 (Azospirillum brasilense strain MTCC4035 plasmid p4, complete sequence) position: , mismatch: 9, identity: 0.719

tcccggcggacggaaagcttggcagaccagcg	CRISPR spacer
ctccggcgaacggatagcttggcagcggcacg	Protospacer
..******.***** **********    .**

3. spacer 1.1|126739|32|NC_014532|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP007796 (Azospirillum brasilense strain Az39 plasmid AbAZ39_p3, complete sequence) position: , mismatch: 9, identity: 0.719

tcccggcggacggaaagcttggcagaccagcg	CRISPR spacer
ctccggcgaacggatagcttggcagcggcacg	Protospacer
..******.***** **********    .**

4. spacer 1.4|126919|32|NC_014532|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP028971 (Aminobacter sp. MSH1 plasmid pUSP3, complete sequence) position: , mismatch: 10, identity: 0.688

gtaagcgccgcatgctgtgggcgtcacgccct	CRISPR spacer
agaagcgccgcatgttgcgggcgtcatcgata	Protospacer
. ************.**.********.   .

5. spacer 1.4|126919|32|NC_014532|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP015008 (Aminobacter aminovorans strain KCTC 2477 plasmid pAA03, complete sequence) position: , mismatch: 10, identity: 0.688

gtaagcgccgcatgctgtgggcgtcacgccct	CRISPR spacer
agaagcgccgcatgttgcgggcgtcatcgata	Protospacer
. ************.**.********.   .

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1244941 : 1254916

Pseudomonas_phage(33.33%)

capsid,terminase

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_013331840.1\|1244941_1245331_-	hypothetical protein	A0A059VF88	Pseudomonas_phage	5.5e-13	37.1
WP_013331841.1\|1245332_1245713_-	hypothetical protein	NA	NA	NA	NA
WP_013331842.1\|1245699_1246104_-	hypothetical protein	A0A2H4J0N2	uncultured_Caudovirales_phage	8.2e-12	36.5
WP_013331843.1\|1246143_1246377_-	hypothetical protein	NA	NA	NA	NA
WP_013331844.1\|1246379_1247345_-	DUF2184 domain-containing protein	A0A0N9SG07	Pseudomonas_phage	9.0e-57	39.0
WP_013331845.1\|1247357_1247783_-	hypothetical protein	NA	NA	NA	NA
WP_013331846.1\|1247779_1248886_-	DUF2213 domain-containing protein	E5AGA6	Erwinia_phage	3.2e-50	36.0
WP_013331847.1\|1248882_1249719_-\|capsid	minor capsid protein	I3PGT9	Xanthomonas_phage	2.5e-31	33.6
WP_013331848.1\|1249711_1250956_-	DUF1073 domain-containing protein	A0A0N9SI81	Pseudomonas_phage	1.5e-32	32.1
WP_013331849.1\|1250964_1252560_-	hypothetical protein	A9YWZ6	Burkholderia_phage	1.6e-239	74.7
WP_013331850.1\|1252559_1253150_-\|terminase	terminase small subunit	A0A2H4J480	uncultured_Caudovirales_phage	6.8e-47	58.1
WP_041601944.1\|1253779_1254019_-	hypothetical protein	NA	NA	NA	NA
WP_157953394.1\|1254029_1254344_-	hypothetical protein	NA	NA	NA	NA
WP_041601946.1\|1254340_1254916_-	hypothetical protein	B0ZSJ3	Halomonas_phage	4.6e-56	63.3

DBSCAN-SWA_2

1268701 : 1283915

Halomonas_phage(33.33%)

integrase

attL 1265016:1265031|attR 1278614:1278629

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1265016:1265031	attL	NA	NA	NA	NA
WP_013331865.1\|1268701_1269637_+	recombination-associated protein RdgC	A0A1J0GUV6	Halomonas_phage	2.0e-117	70.3
WP_013331866.1\|1269645_1270155_+	single-stranded DNA-binding protein	I3PUY5	Vibrio_phage	8.4e-38	61.0
WP_157953398.1\|1270475_1271066_+	hypothetical protein	NA	NA	NA	NA
WP_041601957.1\|1271173_1271473_-	hypothetical protein	NA	NA	NA	NA
WP_013331867.1\|1271585_1273157_+	DNA cytosine methyltransferase	A0A1I9KFD6	Aeromonas_phage	9.0e-131	57.2
WP_041601958.1\|1273153_1273429_+	hypothetical protein	NA	NA	NA	NA
WP_013331868.1\|1273425_1273890_+	hypothetical protein	NA	NA	NA	NA
WP_013331869.1\|1273960_1274356_+	hypothetical protein	NA	NA	NA	NA
WP_157953399.1\|1274348_1274516_+	hypothetical protein	NA	NA	NA	NA
WP_013331870.1\|1274688_1275234_+	bifunctional (p)ppGpp synthetase/guanosine-3',5'-bis(diphosphate) 3'-pyrophosphohydrolase	L7TP62	Rhizobium_phage	2.5e-19	36.3
WP_013331871.1\|1275297_1275840_+	HNH endonuclease	A0A2I7RT07	Vibrio_phage	3.7e-31	45.6
WP_041601960.1\|1275856_1276081_+	DUF4224 domain-containing protein	A0A1J0GUW5	Halomonas_phage	7.3e-18	66.7
WP_013331872.1\|1276077_1277088_+\|integrase	tyrosine-type recombinase/integrase	A0A1J0GUW7	Halomonas_phage	2.0e-123	64.0
WP_013331873.1\|1277173_1277956_+	class II glutamine amidotransferase	NA	NA	NA	NA
WP_013331874.1\|1278055_1279726_+	AMP-binding protein	A0A2H4PQM9	Staphylococcus_phage	4.6e-32	26.2
1278614:1278629	attR	NA	NA	NA	NA
WP_013331875.1\|1279877_1283915_+	ATP-dependent RNA helicase HrpA	A0A1V0SBU4	Catovirus	1.0e-53	29.0

DBSCAN-SWA_3

1900649 : 1931078

Escherichia_phage(13.64%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_013332392.1\|1900649_1902086_-	WD40 repeat domain-containing protein	I7B6L0	Escherichia_phage	1.4e-05	40.4
WP_013332393.1\|1902089_1902356_-	hypothetical protein	A0A0M4RBJ6	Mycobacterium_phage	8.1e-08	37.5
WP_013332394.1\|1902352_1904677_-	hypothetical protein	NA	NA	NA	NA
WP_013332395.1\|1904689_1905112_-	hypothetical protein	H6BJ44	Methylophilales_phage	1.5e-19	38.1
WP_013332396.1\|1905147_1905705_-	hypothetical protein	NA	NA	NA	NA
WP_013332397.1\|1905708_1906422_-	hypothetical protein	A0A1I9KFD0	Aeromonas_phage	1.4e-35	38.0
WP_013332398.1\|1906425_1906821_-	hypothetical protein	NA	NA	NA	NA
WP_109637419.1\|1906899_1907733_-	hypothetical protein	A0A1L2JY55	Aeribacillus_phage	2.2e-27	31.7
WP_109637644.1\|1907773_1908172_-	HNH endonuclease	A0A1B1INA7	uncultured_Mediterranean_phage	2.2e-17	47.3
WP_157953411.1\|1908621_1908774_-	hypothetical protein	NA	NA	NA	NA
WP_013332400.1\|1908833_1909808_-	hypothetical protein	NA	NA	NA	NA
WP_157953412.1\|1910069_1912277_-	hypothetical protein	A0A1B1IWC5	uncultured_Mediterranean_phage	7.6e-43	25.4
WP_041602039.1\|1912315_1912762_-	hypothetical protein	NA	NA	NA	NA
WP_013332402.1\|1912787_1914392_-	hypothetical protein	A0A088C4W7	Shewanella_sp._phage	5.8e-141	50.6
WP_013332403.1\|1914378_1914936_-	hypothetical protein	A0A2H4J8J1	uncultured_Caudovirales_phage	6.7e-20	36.3
WP_013332404.1\|1915133_1915685_-	hypothetical protein	A0A1D9CA16	Salinivibrio_phage	6.2e-18	34.5
WP_013332405.1\|1915681_1916029_-	hypothetical protein	NA	NA	NA	NA
WP_013332406.1\|1916025_1916580_-	glycoside hydrolase family 104 protein	Q6J1Q5	Burkholderia_virus	1.3e-39	58.3
WP_041602040.1\|1916689_1917268_-	hypothetical protein	NA	NA	NA	NA
WP_109637645.1\|1917644_1918235_-	hypothetical protein	NA	NA	NA	NA
WP_041602041.1\|1918258_1918477_-	hypothetical protein	NA	NA	NA	NA
WP_049786210.1\|1918473_1918836_-	hypothetical protein	E0YQ53	Mycobacterium_phage	2.1e-06	37.4
WP_013332408.1\|1918957_1919251_-	hypothetical protein	G8C7V5	Escherichia_phage	7.5e-23	57.5
WP_013332409.1\|1919250_1919754_-	hypothetical protein	L7TJN5	Pseudomonas_virus	1.9e-29	38.0
WP_013332410.1\|1919753_1920062_-	hypothetical protein	NA	NA	NA	NA
WP_013332411.1\|1920084_1920912_-	ATP-binding protein	A0A059WFK9	Vibrio_phage	2.2e-43	39.3
WP_049786211.1\|1920914_1921820_-	hypothetical protein	C1JJ53	Enterobacteria_phage	1.7e-09	31.1
WP_041602042.1\|1921999_1922203_-	hypothetical protein	NA	NA	NA	NA
WP_041602043.1\|1922223_1922553_-	hypothetical protein	NA	NA	NA	NA
WP_157953413.1\|1922601_1922856_-	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_109637425.1\|1922936_1923599_+	helix-turn-helix domain-containing protein	U5P0T5	Shigella_phage	1.0e-35	56.8
WP_041602045.1\|1923601_1923922_+	hypothetical protein	NA	NA	NA	NA
WP_157953414.1\|1924432_1924576_+	hypothetical protein	NA	NA	NA	NA
WP_041602046.1\|1924729_1924978_+	hypothetical protein	A0A2K9VHR1	Pseudomonas_phage	9.8e-16	56.0
WP_013332413.1\|1925061_1926162_+	YqaJ viral recombinase family protein	A6XMH8	Bacillus_virus	5.5e-26	28.7
WP_013332414.1\|1926158_1927139_+	hypothetical protein	A0A2H4J1F0	uncultured_Caudovirales_phage	4.7e-37	45.1
WP_013332415.1\|1927190_1927556_+	hypothetical protein	A0A2R2X2A9	Escherichia_phage	1.0e-16	46.1
WP_013332416.1\|1927552_1928350_+	DUF2303 family protein	NA	NA	NA	NA
WP_157953415.1\|1928586_1929213_-	hypothetical protein	NA	NA	NA	NA
WP_013332417.1\|1929272_1931078_+	DNA cytosine methyltransferase	L7TH64	Pseudomonas_virus	1.8e-175	59.4

DBSCAN-SWA_4

3219370 : 3230398

Klosneuvirus(16.67%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_013333499.1\|3219370_3221977_-\|tRNA	alanine--tRNA ligase	A0A1V0SK38	Klosneuvirus	2.1e-76	37.4
WP_013333500.1\|3222259_3222724_-	regulatory protein RecX	NA	NA	NA	NA
WP_013333501.1\|3222727_3223798_-	recombinase RecA	A0A2D1GPX2	Mycobacterium_phage	8.9e-114	61.6
WP_013333502.1\|3223920_3224436_-	CinA family protein	B5TK85	Pseudomonas_phage	4.4e-34	55.8
WP_013333503.1\|3224598_3227184_+	DNA mismatch repair protein MutS	A0A1V0SDQ0	Indivirus	1.9e-29	23.0
WP_013333504.1\|3227328_3227652_+	ferredoxin family protein	NA	NA	NA	NA
WP_013333505.1\|3228211_3229504_-	phosphopyruvate hydratase	A0A1X9I5Z8	Streptococcus_phage	8.5e-135	59.8
WP_013333506.1\|3229546_3230398_-	3-deoxy-8-phosphooctulonate synthase	E3T537	Cafeteria_roenbergensis_virus	1.2e-49	41.6

DBSCAN-SWA_5

3739706 : 3748742

Vibrio_phage(33.33%)

portal,terminase,holin,head,capsid

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_013333937.1\|3739706_3740738_-\|capsid	major capsid protein	A0A067ZI79	Vibrio_phage	1.3e-64	41.7
WP_013333938.1\|3740801_3741155_-\|head	head decoration protein	A0A291AUM0	Sinorhizobium_phage	1.2e-11	48.8
WP_013333939.1\|3741190_3742414_-	S49 family peptidase	A0A219YAK4	Aeromonas_phage	7.4e-56	51.1
WP_013333940.1\|3742451_3744107_-\|portal	phage portal protein	A0A067ZJA4	Vibrio_phage	2.2e-82	38.3
WP_013333941.1\|3744109_3744334_-	hypothetical protein	NA	NA	NA	NA
WP_174208864.1\|3744330_3746232_-\|terminase	phage terminase large subunit family protein	A0A2D1GMT1	Marinobacter_phage	3.5e-177	52.9
WP_013333943.1\|3746263_3746857_-\|terminase	terminase small subunit	A0A2D1GMW4	Marinobacter_phage	1.1e-12	33.8
WP_041602252.1\|3747061_3747832_+	hypothetical protein	NA	NA	NA	NA
WP_013333944.1\|3747930_3748416_-	hypothetical protein	NA	NA	NA	NA
WP_041602253.1\|3748412_3748742_-\|holin	phage holin, lambda family	NA	NA	NA	NA

DBSCAN-SWA_6

4017529 : 4024835

Mycobacterium_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_013334185.1\|4017529_4017754_+	glutaredoxin-like protein NrdH	V5UN81	Mycobacterium_phage	4.7e-17	52.1
WP_013334186.1\|4017768_4018173_+	class Ib ribonucleoside-diphosphate reductase assembly flavoprotein NrdI	G3MBF1	Bacillus_virus	5.0e-09	32.3
WP_013334187.1\|4018162_4020349_+	class 1b ribonucleoside-diphosphate reductase subunit alpha	V9VI16	Lactococcus_phage	3.6e-210	52.1
WP_013334188.1\|4020552_4021527_+	class 1b ribonucleoside-diphosphate reductase subunit beta	A0A0M4S3B4	Mycobacterium_phage	4.3e-139	75.0
WP_013334189.1\|4021620_4023453_-	glutamine--fructose-6-phosphate transaminase (isomerizing)	A7IW18	Paramecium_bursaria_Chlorella_virus	2.8e-131	43.5
WP_041602288.1\|4023464_4024835_-	bifunctional UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase GlmU	A0A0G2Y8M0	Acanthamoeba_polyphaga_mimivirus	2.6e-25	31.8

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_014532

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection