CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_004557	Clostridium tetani E88, complete sequence	8 crisprs	csa3,cas3HD,WYL,DEDDh,cas6,cas8b2,cas7,cas5,cas3,cas4,cas1,cas2,cas7b,cas8b1,cas14j,RT	9	37	7	1
NC_004565	Clostridium tetani E88 plasmid pE88, complete sequence	0 crisprs	Cas14u_CAS-V	0	0	0	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_004557_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_1

1217308-1219530

Unclear

Consensus_repeat	Method
GTATTAGTAGCACCATATTGGAATGTAAAT	PILER-CR
GTATTAGTAGCACCATATTGGAATGTAAAT	CRISPRCasFinder
GTATTAGTAGCACCATATTGGAATGTAAAT	CRT

33 spacers

cas2,cas1,cas4,cas3,cas5,cas7,cas8b2,cas6

The CRISPR arrays of NC_004557_1

>merge|NC_004557|1|1217308-1219530|PILER-CR,CRISPRCasFinder,CRT
GTATTAGTAGCACCATATTGGAATGTAAATTTAAATGAAGGTACTAAATTTAAGGTAAGAATGGTGGTATTAGTAGCACCATATTGGAATGTAAATAGCATTCCTCTATCTCCATTAACTACTGAAAAAGGAGTATTAGTAGCACCATATTGGAATGTAAATGCTATAAGAATAATTCTAATTTTATCCAAGGAACTGGTATTAGTAGCACCATATTGGAATGTAAATTTCCAATTTTACTAGCTGCTACCCCAACGCCTAATAATGTATTAGTAGCACCATATTGGAATGTAAATTAAATATATTACTTCCTTCTTGCACTGTAGGTTTTTCGTATTAGTAGCACCATATTGGAATGTAAATTTGTTCGTAACTGTTAAAGCTATCTTTCTTTATGCGTATTAGTAGCACCATATTGGAATGTAAATAGAGCCTAGTTTCCTAAGCCCTTATAACCAACTTACCGTATTAGTAGCACCATATTGGAATGTAAATATACAATGCTCCATGGAAAGGACTCCACTTAGATATATAGTATTAGTAGCACCATATTGGAATGTAAATCCCACATCATTAAAGGATATAAAATTACCACCTTCCGTATTAGTAGCACCATATTGGAATGTAAATGTTTTAATATTAATATCGGCAAGTGCTAATTCATATGGTATTAGTAGCACCATATTGGAATGTAAATGTTTTAATATTAATATCGGCAAGTGCTAATTCATATGGTATTAGTAGCACCATATTGGAATGTAAATAACTGCACAGTATCACCGCTAGCTTTTAATTCTTTAGTATTAGTAGCACCATATTGGAATGTAAATTTTTGAAGTATATTATAAAGGCACAGTAACACGCCCGTATTAGTAGCACCATATTGGAATGTAAATGCTTTAACTCTTAAAAAAGATAAAGTTCTAAATTCGTATTAGTAGCACCATATTGGAATGTAAATAAGATGCAGCCAACGCACTTGGATATATGGCTTTGGGTATTAGTAGCACCATATTGGAATGTAAATGGTAATGTAAGTAATTCTACAACCAATAATAGCAATGTATTAGTAGCACCATATTGGAATGTAAATATACAGAATACAAGATTATAGTTAGTGGATATAGAAGTATTAGTAGCACCATATTGGAATGTAAATAATGAAGTCAAATAATAACATACCATTTTGTGCTCGTATTAGTAGCACCATATTGGAATGTAAATTTTAAATCTGGTTTATTTTTTACATTCTTCCAATCCGTATTAGTAGCACCATATTGGAATGTAAATAAGTGCGTTATTTACGCCTTCTATATGTCCGAATACCGTATTAGTAGCACCATATTGGAATGTAAATTTTTCATTAGCAATTCCTTTGTACTGCCATCTTCCGGTATTAGTAGCACCATATTGGAATGTAAATCCTAGTACGCCCAGCATACCCAAAAAAGAACTACTTAAGTATTAGTAGCACCATATTGGAATGTAAATCTGGAAAGAGGCAATAAAGCATTAGGAATAATAAAATGGTATTAGTAGCACCATATTGGAATGTAAATCTTACTAACACTTTCAGACCTAGTATTAAAATAATTTTGTATTAGTAGCACCATATTGGAATGTAAATGTGTTACATCTCCCAATTTCTCCTCATAATACTTTAAGTATTAGTAGCACCATATTGGAATGTAAATGCTATAGCTAGTATAGTAGATACGTTGCGAGAATGGGTATTAGTAGCACCATATTGGAATGTAAATAATTAATATTGGCAGTATATGCTATACCATCTATAGCGTATTAGTAGCACCATATTGGAATGTAAATTATCTAACTCAATATTTTCTTCTTTTACATCCTGTTTAGTATTAGTAGCACCATATTGGAATGTAAATAAATTAATAAAGATAGTAGGTTAAAGGGTATATTAGGTATTAGTAGCACCATATTGGAATGTAAATTTATAAAATTCTATTTCTAGTTCTTCTTGAGTATATGTATTAGTAGCACCATATTGGAATGTAAATGTCGACCCATTGGAGTTAGACAGATGGGATTTTCAGTATTAGTAGCACCATATTGGAATGTAAATTTAGCATCTATAATATTTACTTCTTTAATAGTTCTTGTATTAGTAGCACCATATTGGAATGTAAATATATGTGATGATGAATTAGAGAAAGTGCTTGAAAGGTATTAGTAGCACCATATTGGAATATAAAT

>NC_004557|1|1|1217308-1219530|PILER-CR
GTATTAGTAGCACCATATTGGAATGTAAAT	TTAAATGAAGGTACTAAATTTAAGGTAAGAATGGTG
GTATTAGTAGCACCATATTGGAATGTAAAT	AGCATTCCTCTATCTCCATTAACTACTGAAAAAGGA
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTATAAGAATAATTCTAATTTTATCCAAGGAACTG
GTATTAGTAGCACCATATTGGAATGTAAAT	TTCCAATTTTACTAGCTGCTACCCCAACGCCTAATAAT
GTATTAGTAGCACCATATTGGAATGTAAAT	TAAATATATTACTTCCTTCTTGCACTGTAGGTTTTTC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTGTTCGTAACTGTTAAAGCTATCTTTCTTTATGC
GTATTAGTAGCACCATATTGGAATGTAAAT	AGAGCCTAGTTTCCTAAGCCCTTATAACCAACTTACC
GTATTAGTAGCACCATATTGGAATGTAAAT	ATACAATGCTCCATGGAAAGGACTCCACTTAGATATATA
GTATTAGTAGCACCATATTGGAATGTAAAT	CCCACATCATTAAAGGATATAAAATTACCACCTTCC
GTATTAGTAGCACCATATTGGAATGTAAAT	GTTTTAATATTAATATCGGCAAGTGCTAATTCATATG
GTATTAGTAGCACCATATTGGAATGTAAAT	GTTTTAATATTAATATCGGCAAGTGCTAATTCATATG
GTATTAGTAGCACCATATTGGAATGTAAAT	AACTGCACAGTATCACCGCTAGCTTTTAATTCTTTA
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTTGAAGTATATTATAAAGGCACAGTAACACGCCC
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTTTAACTCTTAAAAAAGATAAAGTTCTAAATTC
GTATTAGTAGCACCATATTGGAATGTAAAT	AAGATGCAGCCAACGCACTTGGATATATGGCTTTGG
GTATTAGTAGCACCATATTGGAATGTAAAT	GGTAATGTAAGTAATTCTACAACCAATAATAGCAAT
GTATTAGTAGCACCATATTGGAATGTAAAT	ATACAGAATACAAGATTATAGTTAGTGGATATAGAA
GTATTAGTAGCACCATATTGGAATGTAAAT	AATGAAGTCAAATAATAACATACCATTTTGTGCTC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTAAATCTGGTTTATTTTTTACATTCTTCCAATCC
GTATTAGTAGCACCATATTGGAATGTAAAT	AAGTGCGTTATTTACGCCTTCTATATGTCCGAATACC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTTCATTAGCAATTCCTTTGTACTGCCATCTTCCG
GTATTAGTAGCACCATATTGGAATGTAAAT	CCTAGTACGCCCAGCATACCCAAAAAAGAACTACTTAA
GTATTAGTAGCACCATATTGGAATGTAAAT	CTGGAAAGAGGCAATAAAGCATTAGGAATAATAAAATG
GTATTAGTAGCACCATATTGGAATGTAAAT	CTTACTAACACTTTCAGACCTAGTATTAAAATAATTTT
GTATTAGTAGCACCATATTGGAATGTAAAT	GTGTTACATCTCCCAATTTCTCCTCATAATACTTTAA
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTATAGCTAGTATAGTAGATACGTTGCGAGAATGG
GTATTAGTAGCACCATATTGGAATGTAAAT	AATTAATATTGGCAGTATATGCTATACCATCTATAGC
GTATTAGTAGCACCATATTGGAATGTAAAT	TATCTAACTCAATATTTTCTTCTTTTACATCCTGTTTA
GTATTAGTAGCACCATATTGGAATGTAAAT	AAATTAATAAAGATAGTAGGTTAAAGGGTATATTAG
GTATTAGTAGCACCATATTGGAATGTAAAT	TTATAAAATTCTATTTCTAGTTCTTCTTGAGTATAT
GTATTAGTAGCACCATATTGGAATGTAAAT	GTCGACCCATTGGAGTTAGACAGATGGGATTTTCA
GTATTAGTAGCACCATATTGGAATGTAAAT	TTAGCATCTATAATATTTACTTCTTTAATAGTTCTT
GTATTAGTAGCACCATATTGGAATGTAAAT	ATATGTGATGATGAATTAGAGAAAGTGCTTGAAAG
GTATTAGTAGCACCATATTGGAATATAAAT

>NC_004557|1|1|1217308-1219530|CRISPRCasFinder
GTATTAGTAGCACCATATTGGAATGTAAAT	TTAAATGAAGGTACTAAATTTAAGGTAAGAATGGTG
GTATTAGTAGCACCATATTGGAATGTAAAT	AGCATTCCTCTATCTCCATTAACTACTGAAAAAGGA
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTATAAGAATAATTCTAATTTTATCCAAGGAACTG
GTATTAGTAGCACCATATTGGAATGTAAAT	TTCCAATTTTACTAGCTGCTACCCCAACGCCTAATAAT
GTATTAGTAGCACCATATTGGAATGTAAAT	TAAATATATTACTTCCTTCTTGCACTGTAGGTTTTTC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTGTTCGTAACTGTTAAAGCTATCTTTCTTTATGC
GTATTAGTAGCACCATATTGGAATGTAAAT	AGAGCCTAGTTTCCTAAGCCCTTATAACCAACTTACC
GTATTAGTAGCACCATATTGGAATGTAAAT	ATACAATGCTCCATGGAAAGGACTCCACTTAGATATATA
GTATTAGTAGCACCATATTGGAATGTAAAT	CCCACATCATTAAAGGATATAAAATTACCACCTTCC
GTATTAGTAGCACCATATTGGAATGTAAAT	GTTTTAATATTAATATCGGCAAGTGCTAATTCATATG
GTATTAGTAGCACCATATTGGAATGTAAAT	GTTTTAATATTAATATCGGCAAGTGCTAATTCATATG
GTATTAGTAGCACCATATTGGAATGTAAAT	AACTGCACAGTATCACCGCTAGCTTTTAATTCTTTA
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTTGAAGTATATTATAAAGGCACAGTAACACGCCC
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTTTAACTCTTAAAAAAGATAAAGTTCTAAATTC
GTATTAGTAGCACCATATTGGAATGTAAAT	AAGATGCAGCCAACGCACTTGGATATATGGCTTTGG
GTATTAGTAGCACCATATTGGAATGTAAAT	GGTAATGTAAGTAATTCTACAACCAATAATAGCAAT
GTATTAGTAGCACCATATTGGAATGTAAAT	ATACAGAATACAAGATTATAGTTAGTGGATATAGAA
GTATTAGTAGCACCATATTGGAATGTAAAT	AATGAAGTCAAATAATAACATACCATTTTGTGCTC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTAAATCTGGTTTATTTTTTACATTCTTCCAATCC
GTATTAGTAGCACCATATTGGAATGTAAAT	AAGTGCGTTATTTACGCCTTCTATATGTCCGAATACC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTTCATTAGCAATTCCTTTGTACTGCCATCTTCCG
GTATTAGTAGCACCATATTGGAATGTAAAT	CCTAGTACGCCCAGCATACCCAAAAAAGAACTACTTAA
GTATTAGTAGCACCATATTGGAATGTAAAT	CTGGAAAGAGGCAATAAAGCATTAGGAATAATAAAATG
GTATTAGTAGCACCATATTGGAATGTAAAT	CTTACTAACACTTTCAGACCTAGTATTAAAATAATTTT
GTATTAGTAGCACCATATTGGAATGTAAAT	GTGTTACATCTCCCAATTTCTCCTCATAATACTTTAA
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTATAGCTAGTATAGTAGATACGTTGCGAGAATGG
GTATTAGTAGCACCATATTGGAATGTAAAT	AATTAATATTGGCAGTATATGCTATACCATCTATAGC
GTATTAGTAGCACCATATTGGAATGTAAAT	TATCTAACTCAATATTTTCTTCTTTTACATCCTGTTTA
GTATTAGTAGCACCATATTGGAATGTAAAT	AAATTAATAAAGATAGTAGGTTAAAGGGTATATTAG
GTATTAGTAGCACCATATTGGAATGTAAAT	TTATAAAATTCTATTTCTAGTTCTTCTTGAGTATAT
GTATTAGTAGCACCATATTGGAATGTAAAT	GTCGACCCATTGGAGTTAGACAGATGGGATTTTCA
GTATTAGTAGCACCATATTGGAATGTAAAT	TTAGCATCTATAATATTTACTTCTTTAATAGTTCTT
GTATTAGTAGCACCATATTGGAATGTAAAT	ATATGTGATGATGAATTAGAGAAAGTGCTTGAAAG
GTATTAGTAGCACCATATTGGAATATAAAT

>NC_004557|1|1|1217308-1219530|CRT
GTATTAGTAGCACCATATTGGAATGTAAAT	TTAAATGAAGGTACTAAATTTAAGGTAAGAATGGTG
GTATTAGTAGCACCATATTGGAATGTAAAT	AGCATTCCTCTATCTCCATTAACTACTGAAAAAGGA
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTATAAGAATAATTCTAATTTTATCCAAGGAACTG
GTATTAGTAGCACCATATTGGAATGTAAAT	TTCCAATTTTACTAGCTGCTACCCCAACGCCTAATAAT
GTATTAGTAGCACCATATTGGAATGTAAAT	TAAATATATTACTTCCTTCTTGCACTGTAGGTTTTTC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTGTTCGTAACTGTTAAAGCTATCTTTCTTTATGC
GTATTAGTAGCACCATATTGGAATGTAAAT	AGAGCCTAGTTTCCTAAGCCCTTATAACCAACTTACC
GTATTAGTAGCACCATATTGGAATGTAAAT	ATACAATGCTCCATGGAAAGGACTCCACTTAGATATATA
GTATTAGTAGCACCATATTGGAATGTAAAT	CCCACATCATTAAAGGATATAAAATTACCACCTTCC
GTATTAGTAGCACCATATTGGAATGTAAAT	GTTTTAATATTAATATCGGCAAGTGCTAATTCATATG
GTATTAGTAGCACCATATTGGAATGTAAAT	GTTTTAATATTAATATCGGCAAGTGCTAATTCATATG
GTATTAGTAGCACCATATTGGAATGTAAAT	AACTGCACAGTATCACCGCTAGCTTTTAATTCTTTA
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTTGAAGTATATTATAAAGGCACAGTAACACGCCC
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTTTAACTCTTAAAAAAGATAAAGTTCTAAATTC
GTATTAGTAGCACCATATTGGAATGTAAAT	AAGATGCAGCCAACGCACTTGGATATATGGCTTTGG
GTATTAGTAGCACCATATTGGAATGTAAAT	GGTAATGTAAGTAATTCTACAACCAATAATAGCAAT
GTATTAGTAGCACCATATTGGAATGTAAAT	ATACAGAATACAAGATTATAGTTAGTGGATATAGAA
GTATTAGTAGCACCATATTGGAATGTAAAT	AATGAAGTCAAATAATAACATACCATTTTGTGCTC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTAAATCTGGTTTATTTTTTACATTCTTCCAATCC
GTATTAGTAGCACCATATTGGAATGTAAAT	AAGTGCGTTATTTACGCCTTCTATATGTCCGAATACC
GTATTAGTAGCACCATATTGGAATGTAAAT	TTTTCATTAGCAATTCCTTTGTACTGCCATCTTCCG
GTATTAGTAGCACCATATTGGAATGTAAAT	CCTAGTACGCCCAGCATACCCAAAAAAGAACTACTTAA
GTATTAGTAGCACCATATTGGAATGTAAAT	CTGGAAAGAGGCAATAAAGCATTAGGAATAATAAAATG
GTATTAGTAGCACCATATTGGAATGTAAAT	CTTACTAACACTTTCAGACCTAGTATTAAAATAATTTT
GTATTAGTAGCACCATATTGGAATGTAAAT	GTGTTACATCTCCCAATTTCTCCTCATAATACTTTAA
GTATTAGTAGCACCATATTGGAATGTAAAT	GCTATAGCTAGTATAGTAGATACGTTGCGAGAATGG
GTATTAGTAGCACCATATTGGAATGTAAAT	AATTAATATTGGCAGTATATGCTATACCATCTATAGC
GTATTAGTAGCACCATATTGGAATGTAAAT	TATCTAACTCAATATTTTCTTCTTTTACATCCTGTTTA
GTATTAGTAGCACCATATTGGAATGTAAAT	AAATTAATAAAGATAGTAGGTTAAAGGGTATATTAG
GTATTAGTAGCACCATATTGGAATGTAAAT	TTATAAAATTCTATTTCTAGTTCTTCTTGAGTATAT
GTATTAGTAGCACCATATTGGAATGTAAAT	GTCGACCCATTGGAGTTAGACAGATGGGATTTTCA
GTATTAGTAGCACCATATTGGAATGTAAAT	TTAGCATCTATAATATTTACTTCTTTAATAGTTCTT
GTATTAGTAGCACCATATTGGAATGTAAAT	ATATGTGATGATGAATTAGAGAAAGTGCTTGAAAG
GTATTAGTAGCACCATATTGGAATATAAAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_035109977.1\|1216850_1217129_+\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_004557.1\|WP_052040366.1\|1213026_1215306_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|273707
NC_004557.1\|WP_023438026.1\|1231664_1231820_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_035109971.1\|1224745_1226023_-\|O-acetylhomoserine-aminocarboxypropyltransferase/cysteine-synthase	unknown	unknown	gnl\|CDD\|225428
NC_004557.1\|WP_011099390.1\|1226391_1226925_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099384.1\|1215846_1216839_+\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853
NC_004557.1\|WP_011099386.1\|1221804_1222617_+\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|223669
NC_004557.1\|WP_035109979.1\|1210966_1211866_+\|type-I-B-CRISPR-associated-protein-Cas7/Cst2/DevR	cas7	cd09687_cas7_CAS-I-B	gnl\|CDD\|274215
NC_004557.1\|WP_011099381.1\|1211893_1212976_+\|CRISPR-associated-protein-Cas5	cas5	cd09658_cas5_CAS-I-B	gnl\|CDD\|274218
NC_004557.1\|WP_035109974.1\|1223406_1223634_+\|PepSY-domain-containing-protein	unknown	unknown	gnl\|CDD\|377032
NC_004557.1\|WP_035109981.1\|1207826_1208132_-\|transposase	unknown	unknown	gnl\|CDD\|225511
NC_004557.1\|WP_011099379.1\|1209607_1210951_+\|type-I-CRISPR-associated-protein-Cas8a1/Csx8	cas8b2	cd09744_cas8b2_CAS-I-B	gnl\|CDD\|187875
NC_004557.1\|WP_011099378.1\|1208849_1209593_+\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_004557.1\|WP_011099388.1\|1223806_1224727_-\|homoserine-O-succinyltransferase	unknown	unknown	gnl\|CDD\|335664
NC_004557.1\|WP_035110459.1\|1227275_1228748_+\|CZB-domain-containing-protein	unknown	unknown	gnl\|CDD\|206779
NC_004557.1\|WP_011099392.1\|1228883_1231022_-\|anaerobic-carbon-monoxide-dehydrogenase-catalytic-subunit	unknown	unknown	gnl\|CDD\|238896
NC_004557.1\|WP_011099377.1\|1206918_1207515_-\|DDE-type-integrase/transposase/recombinase	unknown	unknown	gnl\|CDD\|366234
NC_004557.1\|WP_035110461.1\|1215334_1215829_+\|CRISPR-associated-protein-Cas4	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|366863
NC_004557.1\|WP_011099387.1\|1222805_1223213_+\|DUF1259-domain-containing-protein	unknown	unknown	gnl\|CDD\|377846
NC_004557.1\|WP_035124903.1\|1219628_1221578_+\|HIRAN-domain-containing-protein	unknown	unknown	gnl\|CDD\|370129

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_035109977.1\|1216850_1217129_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	4.22499e-24
NC_004557.1\|WP_052040366.1\|1213026_1215306_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|273707	TIGR01587, CRISPR-associated_endonuclease/helicase_Cas3, CRISPR-associated helicase Cas3. This model represents the highly conserved core region of an alignment of Cas3, a protein found in association with CRISPR repeat elements in a broad range of bacteria and archaea. Cas3 appears to be a helicase, with regions found by pfam00270 (DEAD/DEAH box helicase) and pfam00271 (Helicase conserved C-terminal domain). Some but not all members have an N-terminal HD domain region (pfam01966) that is not included within this model.	1.2713e-60
NC_004557.1\|WP_035109971.1\|1224745_1226023_-\|O-acetylhomoserine-aminocarboxypropyltransferase/cysteine-synthase	gnl\|CDD\|225428	COG2873, MET17, O-acetylhomoserine sulfhydrylase [Amino acid transport and metabolism].	0
NC_004557.1\|WP_035110459.1\|1227275_1228748_+\|CZB-domain-containing-protein	gnl\|CDD\|206779	cd11386, MCP_signal, Methyl-accepting chemotaxis protein (MCP), signaling domain. Methyl-accepting chemotaxis proteins (MCPs or chemotaxis receptors) are an integral part of the transmembrane protein complex that controls bacterial chemotaxis, together with the histidine kinase CheA, the receptor-coupling protein CheW, receptor-modification enzymes, and localized phosphatases. MCPs contain a four helix trans membrane region, an N-terminal periplasmic ligand binding domain, and a C-terminal HAMP domain followed by a cytoplasmic signaling domain. This C-terminal signaling domain dimerizes into a four-helix bundle and interacts with CheA through the adaptor protein CheW.	6.78295e-39
NC_004557.1\|WP_011099384.1\|1215846_1216839_+\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	1.09205e-161
NC_004557.1\|WP_011099386.1\|1221804_1222617_+\|alpha/beta-hydrolase	gnl\|CDD\|223669	COG0596, MhpC, Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily) [General function prediction only].	4.84567e-37
NC_004557.1\|WP_035109979.1\|1210966_1211866_+\|type-I-B-CRISPR-associated-protein-Cas7/Cst2/DevR	gnl\|CDD\|274215	TIGR02585, conserved_protein, CRISPR-associated protein Cas7/Cst2/DevR, subtype I-B/TNEAP. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This clade is a member of the DevR family (TIGR01875) and includes the DevR protein of Myxococcus xanthus, a protein whose expression appears to be regulated through a number of means, including both location and autorepression; DevR mutants are incapable of fruiting body development.	1.87063e-78
NC_004557.1\|WP_011099381.1\|1211893_1212976_+\|CRISPR-associated-protein-Cas5	gnl\|CDD\|274218	TIGR02593, CRISPR-associated_protein_Cas5, CRISPR-associated protein Cas5, N-terminal domain. This model represents a shared N-terminal domain, about 43 amino acids in length, common to a number of related protein families each of which is associated with a distinct subtype of CRISPR/cas system, where CRISPR is an acronym for Clustered Regularly Interspaced Short Palindromic Repeat and Cas is an abbreviation for CRISPR-associated. Members of this family are widely distributed enough that we designated the family Cas5. Homology appears remote, or absent, between the more C-terminal regions different subfamilies of these proteins, which typically are 210 to 265 amino acids in total length. Cas5 proteins of six different CRISPR/cas subtypes so far defined are described by respective full-length models TIGR01868, TIGR01876, TIGR01895, TIGR01874, TIGR02586, and TIGR02592. The best characterized protein in this family is DevS or Myxococcus xanthus, a Cas protein that appears to participate in a species-specific developmental pathway.	1.73608e-11
NC_004557.1\|WP_035109974.1\|1223406_1223634_+\|PepSY-domain-containing-protein	gnl\|CDD\|377032	pfam03413, PepSY, Peptidase propeptide and YPEB domain. This region is likely to have an protease inhibitory function (personal obs:C Yeats). This model is likely to miss some members of this family as the separation from signal to noise is not clear. The name is derived from Peptidase & Bacillus subtilis YPEB.	2.12386e-13
NC_004557.1\|WP_035109981.1\|1207826_1208132_-\|transposase	gnl\|CDD\|225511	COG2963, COG2963, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	4.0979e-05
NC_004557.1\|WP_011099379.1\|1209607_1210951_+\|type-I-CRISPR-associated-protein-Cas8a1/Csx8	gnl\|CDD\|187875	cd09744, Cas8a1_I-A, CRISPR/Cas system-associated protein Cas8a1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Large proteins, some contain Zn-finger domain; signature gene for I-A subtype; also known as Csx8 family.	0
NC_004557.1\|WP_011099378.1\|1208849_1209593_+\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	2.60262e-28
NC_004557.1\|WP_011099388.1\|1223806_1224727_-\|homoserine-O-succinyltransferase	gnl\|CDD\|335664	pfam04204, HTS, Homoserine O-succinyltransferase.	0
NC_004557.1\|WP_011099392.1\|1228883_1231022_-\|anaerobic-carbon-monoxide-dehydrogenase-catalytic-subunit	gnl\|CDD\|238896	cd01915, CODH, Carbon monoxide dehydrogenase (CODH) is found in acetogenic and methanogenic organisms and is responsible for the synthesis and breakdown of acetyl-CoA, respectively. CODH has two types of metal clusters, a cubane [Fe4-S4] center (B-cluster) similar to that of hybrid cluster protein (HCP) and a Ni-Fe-S center (C-cluster) where carbon monoxide oxidation occurs. Bifunctional CODH forms a heterotetramer with acetyl-CoA synthase (ACS) consisting of two CODH and two ACS subunits while monofunctional CODH forms a homodimer. Bifunctional CODH reduces carbon dioxide to carbon monoxide and ACS then synthesizes acetyl-CoA from carbon monoxide, CoA, and a methyl group donated by another protein (CoFeSP), while monofunctional CODH oxidizes carbon monoxide to carbon dioxide. CODH and ACS each have a metal cluster referred to as the C- and A-clusters, respectively.	0
NC_004557.1\|WP_011099377.1\|1206918_1207515_-\|DDE-type-integrase/transposase/recombinase	gnl\|CDD\|366234	pfam00665, rve, Integrase core domain. Integrase mediates integration of a DNA copy of the viral genome into the host chromosome. Integrase is composed of three domains. The amino-terminal domain is a zinc binding domain pfam02022. This domain is the central catalytic domain. The carboxyl terminal domain that is a non-specific DNA binding domain pfam00552. The catalytic domain acts as an endonuclease when two nucleotides are removed from the 3' ends of the blunt-ended viral DNA made by reverse transcription. This domain also catalyzes the DNA strand transfer reaction of the 3' ends of the viral DNA to the 5' ends of the integration site.	2.21514e-21
NC_004557.1\|WP_035110461.1\|1215334_1215829_+\|CRISPR-associated-protein-Cas4	gnl\|CDD\|366863	pfam01930, Cas_Cas4, Domain of unknown function DUF83. This domain has no known function. The domain contains three conserved cysteines at its C-terminus.	8.71185e-63
NC_004557.1\|WP_011099387.1\|1222805_1223213_+\|DUF1259-domain-containing-protein	gnl\|CDD\|377846	pfam07485, DUF1529, Domain of Unknown Function (DUF1259). This family is the lppY/lpqO homolog family.	9.9546e-48
NC_004557.1\|WP_035124903.1\|1219628_1221578_+\|HIRAN-domain-containing-protein	gnl\|CDD\|370129	pfam08797, HIRAN, HIRAN domain. The HIRAN domain (HIP116, Rad5p N-terminal) is found in the N-terminal regions of the SWI2/SNF2 proteins typified by HIP116 and Rad5p. The HIRAN domain is found as a standalone protein in several bacteria and prophages, or fused to other catalytic domains, such as a nuclease of the restriction endonuclease fold and TDP1-like DNA phosphoesterases, in the eukaryotes. It has been predicted that this domain functions as a DNA-binding domain that probably recognizes features associated with damaged DNA or stalled replication forks.	1.31361e-18

>NC_004557.1|WP_035109977.1|1216850_1217129_+|CRISPR-associated-endonuclease-Cas2
MYVILVYDIKSGEEGQRVLNRTFKVCKKYLSHIQNSVFEGELAESQIIKLKYELDDIIRKDKDSVILFKSRNKRWLTKDMWGKKEDRTSNFI
>NC_004557.1|WP_011099384.1|1215846_1216839_+|type-I-B-CRISPR-associated-endonuclease-Cas1
MKRSYYIYNNGILKRKDNSMAFIDELGERRYIPIETANEIYVMSEMDFNTSLINYLSQYDVIIHFFNYYSFYTGSFQPRKKLVSGNLLVNQVNHYSDNSKRLEIAKKFVDGASYNIYRNLRYYNGRGKDVQIYMDKIEALRKQIYVSTNINELMGYEGNIRKIYYEAWNIIIDQKIDFTKRVKNPPDNMINTLISFVNTLIYTKVVGAIYHTQLNPTVSYLHEPGVRRFSLSLDIAEIFKPILADRLIFSLLNKKQITKKSFTKELNYLHLTKDASKIIVGELDQKIQTTIKHKDLNKNVSYEYLMRLECYKLIKHLLGEKEYEPFKIWW
>NC_004557.1|WP_035110461.1|1215334_1215829_+|CRISPR-associated-protein-Cas4
MKKEITGVMIYYYKVCKRKLWYFYNEIQMEQGNESVEIGKAIDEETYRRDKKHINIDNIINIDFIRSKGILHEVKKSNKIEEASILQVKYYLYFLNKRGIENIKGKIDYPLLKQNIDVELTREDVTIIEGILDDIQNIVKASNPPNLEKKRICKSCAYYDLCFI
>NC_004557.1|WP_052040366.1|1213026_1215306_+|CRISPR-associated-helicase/endonuclease-Cas3
MENKLNILDDDILKLIEEKKAKPDKTIKEHTLELIEVLNLLRELGYIKNDKIYNLVEKACIYHDLGKLNKEFQKRVNGKNVKFNETKEVVHNILSLYFINSKNFESKENYLKVAHSVLNHHNYCNNFDEISEKEELIKSLIEGFKTYKVKRSTISKLKSIVSDIDSIKVKGYLHKCDYSASSGNKAEYPNNFLENGLNNLLIKWKKGTKEATWNELQNFCIENKDENIIAIAQTGMGKTEAGLLWIGNTKGFFVLPIRTAINAIYDRVRKDILNNKGIDEKIAILHSSSLEYYIRNITGDTNEKEEIDLMNYHKIGKQLSIPINISTMDQIFDFVYKYPGYELKLTTLSYSKIVIDEIQAYGPDLLAYLICGLEKIAELGGRIAILTATLPPFIKDLLQKNIKFIENSTAFTNDMKRHNLKIIDERINSEDIYNKYVENKKLNKNNKILVVCNTIKEAQKLYEELKILINNEELHILHSKFIRKDRLKKESEIIEFGKTYDENKNIDKKNGIWISTSIVEASLDIDFDCLFTELQDLNSLFQRLGRCNRKGKKDSSNYNCYIYTEIDTANLINGDKGFIDKRLFDLSKKAIISCDGQISERDKINLIDSYLTTENLKGSDYMRKYKEIYNFIKDIPSYEFDLNQIDLRNILSEEIIPSPVYEEFLEEIKEIECKLANENISYYEKIILKDEIRKYTVSVHPNDIRNYDRAKQKGAAINYNKILLSKYKNEYIKVIECKYDEAGYKRIKYGETTRSSNIW
>NC_004557.1|WP_011099381.1|1211893_1212976_+|CRISPR-associated-protein-Cas5
MKALRIVLTQSSANYKKEETIDNKMTYPLPPISTIIGAIHDACGYKDYHPIDISVQGKFESMHKEPYTDYCFLNSVMDDRGILIKMKNESLLSNAFDKVASAKKSQGNSFRKGITIQVYNEELLKEYRDLKDLNDKIAHYKKNEFKEKLDSIKAAKTKLAEDKKKLDKKSKEFEDIIKREKEVKLKEKNFKQKVKEFELEKYTKPISKFRSLTTSLKYYEILNNVELVIHIRSDEKTLNEIEENIYNLKSIGRSEDFVNIIEAKIVTLTESDDYEIKSNYSAYLNYDDVKNEKVWFENTKADRKVSGTKYYINKNYIIKDDKRFFEKKKVIYGSQYFIEETSENIFIDNEENKEYIVNFI
>NC_004557.1|WP_035109979.1|1210966_1211866_+|type-I-B-CRISPR-associated-protein-Cas7/Cst2/DevR
MKDKKALTLTVVANMTSNYSEGLGNIASVQKVFKNRKVYTIRSRESLKNAIMVQSGMYDDLQTEVDGATQKLANKELNASNCRALEGGYMSTKGTTNIRKSSFYLTDAISCESFVNETRFHNNLYLANNAAQAKNINLQEKSSEAGLMPYQYEYDKSLKIYSITIDLEMIGKDENFQQEEDYKEADNKEKADRVNSILNAIENLSLTVKGNLDNAEPVFVVGGLSNRKTHYFENVVKVEEEKLIISEDLKDKIEKGYHVGLLEGKTLQNEKEIKEQLNPISITKFFDMIRHEVNTYFGI
>NC_004557.1|WP_011099379.1|1209607_1210951_+|type-I-CRISPR-associated-protein-Cas8a1/Csx8
MKTSIQNEKYDTMLEPSDWRFSATIVGLLQYLNYHDLDYKLEEDYILYNSSGINEERYLDFVEYKYGEELHHRLVENILSNEEITEEQLKLINEKLVANTIMKKTFGKIKFDNTNKKEILDIINKNRYELIRETFRRKSNMYANYGNTNQLFNDSQDHCRLLGYCIDTGKKGKSTGFNFMMSTFVGSDIKEFDFIPFAFEGSREAFFINDNYTIQRLKISNEILSKKIEDDLEGENKRKDARQTLFKAIMETSDFIKRDVEVILKDISKEYFETLYIRKESIDIFKEFINEKIEYKSFCFSHKVTDKYYINIQKKVTESILNNVLLDELIEIFLKEKNRSYLVLQLIKINVLIRRDKTMKDRLKGAFACAKQVSKAIESNKLDSYKQKLTSSIIFKDYDRVCQILLQLSNYSGIEFGFVYDLYDDFEENKDLAYTFINALSKKSENN
>NC_004557.1|WP_011099378.1|1208849_1209593_+|CRISPR-associated-endoribonuclease-Cas6
MRFCLTLHLKEKIFLIEYRKVILSYIKNAISKCNNGKYYECFFKDTKQKDYCFSVILPNPTFTKNEIILNGNEIKVLFSTNNNSKIGFILFSAFIAQKNKPYPLPNNNSMILKNINNKKQEEIFNSKAIFKTTLGSGLCVRDHDKEENKDTYYVYTDEKFREKLKVVLIKQILKAGFTEEEANDIKVNPIQCKKVVVKHYRRYIDTTTGLFEIQANNKILQHFYDVGIGSRKSMGFGMIDLVTQDLL
>NC_004557.1|WP_035109981.1|1207826_1208132_-|transposase
MSKVKFKRTFTEEDRISYVKEVLECGSNILVAKKYDINQVQLSTWVNNYRRYSQTLTPKKPKDVDIIPNYKKEYKKVVEQLKEKELEIAILKDLLKKKNRL
>NC_004557.1|WP_011099377.1|1206918_1207515_-|DDE-type-integrase/transposase/recombinase
MYRLMSSLNLLGDSTKYRKPRISRICESIRVAGSNQLWQMDIKYCFITGTRKTAYITSIIDVFDRSIVSQSIDLSATGNVAKSVLLKRLYCRGLKDSPNGLIIRTDNGSQFISGVFEKACLREEVIHERIPVRSPNYNAYIESFHRYLQDECLTGKIYMTLEDLKIDVEDYVYRYNHERIHSSIGYYSPHDYYIKNVS
>NC_004557.1|WP_035124903.1|1219628_1221578_+|HIRAN-domain-containing-protein
MDFNETIYNRILKFVKENPDSVYLPQDFDEAGKKDAYFIFNAKCGTEKFEIENSNNLIKLISNYLNDEAQYNDLIEYIHEFPIIVYYFEFCRILEMQIKESLLSRKKVIEVGKKFVTESNDNEQIKLGIALLGLSADIQTKTILETIALHNEFTFYVVVSMKHWNHYNSFVFELAQKTKGYGKLHCVKNLEPINDEMKTWFIEESCNNTVFKSLSAIMCVDKVDMSWYLKTRKITKIEFSNISRLIYYIFSVDENDIYELEDSLETVEFYLKYAEKYAENFRDLCAIVYIKRWMRPYWEQFNVDIEKKNGWTSNIESKVGDICKNLLKDKKWIPVLKSAIYNAEEDVEIYTRIAESIGFDLTFNMLDSVLKKDKFNIEVFYFLYTKDDEGDIKNVIDYAKNTLPYQVIFSGSEEINEDNLTVENKPDICFLYILKYLNNCNYIEFELPTMALQARFQKCREEAIKYLRNNKEHWNEKIVCKIREAIEVEVNDKLLRKLKRLIGEEVIDKKKQRKYVDISKQRLKPHIKDIYLFSTYVAGVYYRDTSVVEDYIGVNDILFLKEEPENPYDKNAILVTNENGYVLGYLPKSVNKIPKNLLAGGKFLYTIIEEYSLESNTISIDVYLSYKDVIDLVEELMKISESKVNYYKQ
>NC_004557.1|WP_011099386.1|1221804_1222617_+|alpha/beta-hydrolase
MGYYVRVEPNVKIYVEDLNPTGDKTIVFLHGWPGSHKLFEYQFNELPKRGYRCIGVDQRGFGQSDKPWRGYDYNRLADDVRCIVETLKLQDFILAGHSTGGAIAIRYMARHNGYKVSKLALFAAAAPSLIKRPNFPYGLDKETVMKIIEGTYTDRPKMLRDFGDIFFFQHITEPFNYWFLQLGLQAAGWATADIAKTWLREELFCDLGTITVPTLIMHGIHDKVVPFELGKIQKQGIKNSKLIPFEYSGHGLFYDQREKFNGELRSFIEE
>NC_004557.1|WP_011099387.1|1222805_1223213_+|DUF1259-domain-containing-protein
MRDFCRTCNEFARILGAEILSTANNVCTVMFMRDIDAEILGRRTNSPLALMAMFSFESPDNQGRTLNLGETVILQDEINDFISILRENGILVTALHNHWLFEDPRLMYIHFESIDRPLDFARKVAEALRVLRDNC
>NC_004557.1|WP_035109974.1|1223406_1223634_+|PepSY-domain-containing-protein
MTTPQYVLWDRYWRSYRIDSESAIQIALQQIPGEVIKVELDTENGVLVYEVTIRNNTGIYEISIDANTGQIVEFD
>NC_004557.1|WP_011099388.1|1223806_1224727_-|homoserine-O-succinyltransferase
MPIVIPKDLPATETLENENIFVITEHRAIHQDIRPLKIAIVNLMPKKIETETQLLRLLGNIPIQVSIDLIHPKTHHSKNISEKHLLSFYKTIDDIKNEKFDGMIITGAPVEQIAFEDVDYFQELKTIMDFSVTNVFSTLHICWGAQAALYYHYNINKNILPKKVFGVFSHHININKGTVKLLRGFDDKFYVPHSRHTEVKKEDIEKVPELEIFAESNEVGPYIIASKNGRQIFITGHPEYDANTLKSEYYRDINLGKHIEIPKNYFKNNNPREELIANWRGHANLLFSNWLNYYVYQETPYSYISI
>NC_004557.1|WP_035109971.1|1224745_1226023_-|O-acetylhomoserine-aminocarboxypropyltransferase/cysteine-synthase
MNNSWGKGTICIQGGYNPKPGEPRVLPIFQSTTYKYEDPDHVAKLFDLTEEGHIYSRISNPTVSAYEEKVNCLEGGAGALAVSSGQSATTLALLNICKSGDHIISASTIYGGTFTLLSSTLKKFGIEVSFINPDSSKEDILKEFKSNTKAIFAETIGNPGLNILDFDKFSDIAQKTEVPFIVDNTLASPYLCSPLELGANIVIHSSTKYIDGHATSIGGIIVDGGNFNWDNGKFPDLVKEDPTYHGIRYTKTFGKSAYIVKCRVQLLRDLGTCLSPFNAFLNNLGLETLHLRMERHCSNTLKLAKFLENHKKVNWVNYPGLYNNSNYQLANKYLSKGSGAILTFGVKGCKDAGSKFIRNLKLAALVVHLGDARTSVLQPATTTHRQLNEKEQISSGVYPDLIRVSVGIEDPEDLINDFNQALLNI
>NC_004557.1|WP_011099390.1|1226391_1226925_-|hypothetical-protein
MKIQQHSNFVNIFNLHNNPQKTKADQIKIDIARKENPQLDRALYLNDINKVFEEKAKVEQIAKKIARGKQLTREEKELISRTDPEMLRKAEMAKQENDALKRSLKSAKSKQHAQRILAQACIKAQLVSEVDPQYADLLMDTIQELHKDINKGNNPYDKANQYTQNKKSPYEMLNLKR
>NC_004557.1|WP_035110459.1|1227275_1228748_+|CZB-domain-containing-protein
MFEKKPCYEAECIIKYVEERLEGNKTLEPKVEYPIHVKLLKNYKKLFSNEGIMSSSAKTLLDINASLSDFDVQMSSISYELIDFAKEMSELSESNLAVVEEITASMNQVNHTIEDTSKTLEDLSISSKELIEENHKSLAEIEDINHLKEEVMNNANIMSSQIEELVEMANKVSDIVEGVGAIADQTNLLALNASIEAARAGEHGKGFAVVAQEIRKLADDTKGSLQNMRNFVNNIQNTSREGKKSMDNTISSTEKMSKKIDAITYTTKSNVDMLEDSVRSIYTINESMGGINLAATEINKAMDTSTQDAEKLSLMTNTIHDNALKSADYAKKISNIDDLLSEVLKHMMGGLQGTINAISNEEFLEYMEKAKKAHKNWLENLKNIVNEMRIYPLQTNGAKCAFGHFYNSIQATHPSILEEWKGIDNIHKEFHNLGDKVLKSVKENNKHKAQEYYDSAEKISKEIFMSMDKIIIESKKQMEKGVQLFQQIKN
>NC_004557.1|WP_011099392.1|1228883_1231022_-|anaerobic-carbon-monoxide-dehydrogenase-catalytic-subunit
MSNEDIKKSYEKSANRMSGDNTTFGSKLTPEDFNDPNINTNAFNKKKVDYNDFEKSPISMDEVHKWQRQHISKKDQPKEGYPLNVIIDPAMREMYQIVNKAGMTNVFDRFSQQQPIQCKFCIEGLSCQLCANGPCRISPSAPRGTCGVDAHTMVARNFMYRHVTIGTSANIFHAHQAARTLRAAGEHPESGLKIRDSEKLKNFADMAGLDANKSINELAVDFANWVINDIHSEQHIPSKTVEAFAPTKRKDLWRKLGLFPGGGYSEIAYSQTSCMTNFRSDPVEFLLNSVRLGIANEYQGLFLLNIIQEILMGTQEIEMKKQNMGLLNENRINIITNGHMPLLAHVAIDLASTDEWQQKAKNVGADGIQILGHVCEGQQLINYSGTHNQKAYAGQEGEWLSEEYLLATGVIDLFMFDYNCTIPTLPLYAEKFGTKLLSTHPVIKLQGTETLDFVPEKMKEQAEKALNMALEAFKERKKSNKEIYIPPHVSECMVGFSTESVKGALGGSFKPLIEQIVNGNIRGIATIVGCTTARYGQGGSNIFKITKGLIENNILVLSGGCTSSVMEYTGLTHPNAADEAGEGLKAVCKQLGIPPVLTYGACVDIGKMSQTAKEIADELDVDTNKLPLVIGAPEYLEQKAVADACTAVALGWLVHIAPVPSITGSDLVVKTLTETTESLGLGKVVVEMDAEKTIEIYKNHIEGKRKELGLDS
>NC_004557.1|WP_023438026.1|1231664_1231820_+|hypothetical-protein
MAKDSQPDNKKARMEKCNYQIPITSEEGKNQNRTLKKHSVKRKGFQSQHIN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_004557_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_2

1570766-1571383

TypeI-B

III-B

Consensus_repeat	Method
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRISPRCasFinder
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRT
ATTTAAATACAACTCTTGTTATTGTTCAAC	PILER-CR

9 spacers

cas2,cas1,cas4

The CRISPR arrays of NC_004557_2

>merge|NC_004557|2|1570766-1571383|CRISPRCasFinder,CRT,PILER-CR
TATTAAATACAACTCTTGTTATTGTTCAACGTTTTTGCTGCTTCTTCTGGTTGGTATTCATTATCTTATTTAAATACAACTCTTGTTATTGTTCAACAGATAAATGAATTGTTTAGTTACTTAGAGGAAGGCAATTTAAATACAACTCTTGTTATTGTTCAACGCTTAGGCTAGGAGCTACCTCTTTTTTTATTTTTATTTAAATACAACTCTTGTTATTGTTCAACGTTTTGCAGAGGTTCGAGAAAAACTTAAATATTAATTTAAATACAACTCTTGTTATTGTTCAACTGGTGCTAAATTAACAACTGTTAATCCAAATATAAAATTTAAATACAACTCTTGTTATTGTTCAACTTTCTTGCAACCATAGCACATAGTTGCAGCATAACATTTAAATACAACTCTTGTTATTGTTCAACAGGTTGGGACTGTTGGGGAAATGAAGTAAATCTTAAATTTAAATACAACTCTTGTTATTGTTCAACACCCTAATTGTAGAACTACAATAGTTCCGTATTTATTTAAATACAACTCTTGTTATTGTTCAACACAGTAACATGAATACACTCATGTTACTGTTTTTCAATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|2|2|1570766-1571383|CRISPRCasFinder
TATTAAATACAACTCTTGTTATTGTTCAAC	GTTTTTGCTGCTTCTTCTGGTTGGTATTCATTATCTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	AGATAAATGAATTGTTTAGTTACTTAGAGGAAGGCA
ATTTAAATACAACTCTTGTTATTGTTCAAC	GCTTAGGCTAGGAGCTACCTCTTTTTTTATTTTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	GTTTTGCAGAGGTTCGAGAAAAACTTAAATATTA
ATTTAAATACAACTCTTGTTATTGTTCAAC	TGGTGCTAAATTAACAACTGTTAATCCAAATATAAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	TTTCTTGCAACCATAGCACATAGTTGCAGCATAAC
ATTTAAATACAACTCTTGTTATTGTTCAAC	AGGTTGGGACTGTTGGGGAAATGAAGTAAATCTTAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	ACCCTAATTGTAGAACTACAATAGTTCCGTATTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ACAGTAACATGAATACACTCATGTTACTGTTTTTCA
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|2|2|1570766-1571383|CRT
TATTAAATACAACTCTTGTTATTGTTCAAC	GTTTTTGCTGCTTCTTCTGGTTGGTATTCATTATCTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	AGATAAATGAATTGTTTAGTTACTTAGAGGAAGGCA
ATTTAAATACAACTCTTGTTATTGTTCAAC	GCTTAGGCTAGGAGCTACCTCTTTTTTTATTTTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	GTTTTGCAGAGGTTCGAGAAAAACTTAAATATTA
ATTTAAATACAACTCTTGTTATTGTTCAAC	TGGTGCTAAATTAACAACTGTTAATCCAAATATAAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	TTTCTTGCAACCATAGCACATAGTTGCAGCATAAC
ATTTAAATACAACTCTTGTTATTGTTCAAC	AGGTTGGGACTGTTGGGGAAATGAAGTAAATCTTAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	ACCCTAATTGTAGAACTACAATAGTTCCGTATTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ACAGTAACATGAATACACTCATGTTACTGTTTTTCA
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|2|2|1570768-1571383|PILER-CR
TTAAATACAACTCTTGTTATTGTTCAACGT	TTTTGCTGCTTCTTCTGGTTGGTATTCATTATCTTAT
TTAAATACAACTCTTGTTATTGTTCAACAG	ATAAATGAATTGTTTAGTTACTTAGAGGAAGGCAAT
TTAAATACAACTCTTGTTATTGTTCAACGC	TTAGGCTAGGAGCTACCTCTTTTTTTATTTTTAT
TTAAATACAACTCTTGTTATTGTTCAACGT	TTTGCAGAGGTTCGAGAAAAACTTAAATATTAAT
TTAAATACAACTCTTGTTATTGTTCAACTG	GTGCTAAATTAACAACTGTTAATCCAAATATAAAAT
TTAAATACAACTCTTGTTATTGTTCAACTT	TCTTGCAACCATAGCACATAGTTGCAGCATAACAT
TTAAATACAACTCTTGTTATTGTTCAACAG	GTTGGGACTGTTGGGGAAATGAAGTAAATCTTAAAT
TTAAATACAACTCTTGTTATTGTTCAACAC	CCTAATTGTAGAACTACAATAGTTCCGTATTTAT
TTAAATACAACTCTTGTTATTGTTCAACAC	AGTAACATGAATACACTCATGTTACTGTTTTTCAAT
TTAAATACAACTCTTGTTATTGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	unknown	unknown	gnl\|CDD\|234664
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	unknown	unknown	gnl\|CDD\|379303
NC_004557.1\|WP_011099664.1\|1561428_1561872_-\|lysine-sensitive-aspartokinase-III	unknown	unknown	gnl\|CDD\|131580
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133382
NC_004557.1\|WP_011099667.1\|1563236_1565777_-\|choline-trimethylamine-lyase	unknown	unknown	gnl\|CDD\|275187
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_011099665.1\|1561868_1562222_-\|BMC-domain-containing-protein	unknown	unknown	gnl\|CDD\|132886
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|366863
NC_004557.1\|WP_035125177.1\|1571587_1572091_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	unknown	unknown	gnl\|CDD\|273359
NC_004557.1\|WP_023438388.1\|1562261_1563215_-\|choline-TMA-lyase-activating-enzyme	unknown	unknown	gnl\|CDD\|275188
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|234750
NC_004557.1\|WP_035125179.1\|1565915_1566224_-\|BMC-domain-containing-protein	unknown	unknown	gnl\|CDD\|132885
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	unknown	unknown	gnl\|CDD\|341459
NC_004557.1\|WP_023438392.1\|1566648_1566915_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_023438391.1\|1566245_1566542_-\|BMC-domain-containing-protein	unknown	unknown	gnl\|CDD\|132885
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	unknown	unknown	gnl\|CDD\|377640
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	unknown	unknown	gnl\|CDD\|224029
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	gnl\|CDD\|234664	PRK00143, mnmA, tRNA-specific 2-thiouridylase MnmA; Reviewed.	0
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	gnl\|CDD\|379303	pfam13630, SdpI, SdpI/YfhL protein family. This family of proteins includes the SdpI and YfhL proteins from B. subtilis. The SdpI protein is a multipass integral membrane protein that protects toxin-producing cells from being killed. Killing is mediated by the exported toxic protein SdpC an extracellular protein that induces the synthesis of an immunity protein.	5.45045e-10
NC_004557.1\|WP_011099664.1\|1561428_1561872_-\|lysine-sensitive-aspartokinase-III	gnl\|CDD\|131580	TIGR02528, Ethanolamine_utilization_protein_EutP, ethanolamine utilization protein, EutP. This protein is found within operons which code for polyhedral organelles containing the enzyme ethanolamine ammonia lyase. The function of this gene is unknown, although the presence of an N-terminal GxxGxGK motif implies a GTP-binding site. [Energy metabolism, Amino acids and amines].	3.9617e-26
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133382	cd01107, HTH_BmrR, Helix-Turn-Helix DNA binding domain of the BmrR transcription regulator. Helix-turn-helix (HTH) multidrug-efflux transporter transcription regulator, BmrR and YdfL of Bacillus subtilis, and related proteins; N-terminal domain. Bmr is a membrane protein which causes the efflux of a variety of toxic substances and antibiotics. BmrR is comprised of two distinct domains that harbor a regulatory (effector-binding) site and an active (DNA-binding) site. The conserved N-terminal domain contains a winged HTH motif that mediates DNA binding, while the C-terminal domain binds coactivating, toxic compounds. BmrR shares the N-terminal DNA binding domain with other transcription regulators of the MerR superfamily that promote transcription by reconfiguring the spacer between the -35 and -10 promoter elements.	4.10036e-38
NC_004557.1\|WP_011099667.1\|1563236_1565777_-\|choline-trimethylamine-lyase	gnl\|CDD\|275187	TIGR04394, putative_formate_C-acetyltransferase, choline trimethylamine-lyase. Members of this family, homologs to pyruvate formate-lyases and benzylsuccinate synthases, are glycine radical enzymes that appear to act as choline TMA-lyase, that is, to perform a C-N bond cleavage turning choline into trimethylamine (TMA) plus acetaldehyde. The gene symbol is cutC, for choline utilization. The activase, CutD, is a radical SAM enzyme. [Energy metabolism, Amino acids and amines].	0
NC_004557.1\|WP_011099665.1\|1561868_1562222_-\|BMC-domain-containing-protein	gnl\|CDD\|132886	cd07046, BMC_PduU-EutS, 1,2-propanediol utilization protein U (PduU)/ethanolamine utilization protein S (EutS), Bacterial Micro-Compartment (BMC) domain. PduU encapsulates several related enzymes within a shell composed of a few thousand protein subunits. PduU exists as a hexamer which might further assemble into the flat facets of the polyhedral outer shell of the pdu organelle. This proteinaceous noncarboxysome microcompartment is involved in coenzyme B12-dependent degradation of 1,2-propanediol. The core of PduU is related to the typical BMC domain and its natural oligomeric state is a cyclic hexamer. Unlike other typical BMC domain proteins, the 3D topology of PduU reveals a circular permuted variation on the typical BMC fold which leads to several unique features. The exact functions related to those unique features are still not clear. Another difference is the presence of a deep cavity on one side of the hexamer as well as an intermolecular six-stranded beta barrel that seems to block the central pore that is present in other BMC domain proteins. EutS proteins included in this CD are sequence homologs of PduU. They are encoded within eut operon and may be required for the formation of the outer shell of bacterial eut polyhedral organelles which are involved in the cobalamin-dependent degradation of ethanolamine. Although it has been suggested that EutS might also form hexamers and play similar functional roles in the construction of the eut organelle outer shell at present no experimental evidence directly supports this view.	3.32069e-53
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	gnl\|CDD\|366863	pfam01930, Cas_Cas4, Domain of unknown function DUF83. This domain has no known function. The domain contains three conserved cysteines at its C-terminus.	1.40975e-60
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	gnl\|CDD\|341459	cd08180, PDD, 1,3-propanediol dehydrogenase (PPD) catalyzes the reduction of 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol in glycerol metabolism. 1,3-propanediol dehydrogenase (PPD) plays a role in glycerol metabolism of some bacteria in anaerobic conditions. In this degradation pathway, glycerol is converted in a two-step process to 1,3-propanediol (1,3-PD) which is then excreted into the extracellular medium. The first reaction involves the transformation of glycerol into 3-hydroxypropionaldehyde (3-HPA) by a coenzyme B-12-dependent dehydratase. The second reaction involves the dismutation of the 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol by the NADH-linked 1,3-propanediol dehydrogenase (PPD). The enzyme requires iron ion for its function. Because many genes in this pathway are present in the propanediol utilization (pdu) operon, they are also named pdu genes. PPD is a member of the iron-containing alcohol dehydrogenase superfamily. The PPD structure has a dehydroquinate synthase-like fold.	2.12677e-180
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	gnl\|CDD\|273359	TIGR00950, Uncharacterized_inner_membrane_transporter_YicL, Carboxylate/Amino Acid/Amine Transporter. [Transport and binding proteins, Amino acids, peptides and amines].	0.00632714
NC_004557.1\|WP_023438388.1\|1562261_1563215_-\|choline-TMA-lyase-activating-enzyme	gnl\|CDD\|275188	TIGR04395, putative_pyruvate_formate-lyase_activating_enzyme, choline TMA-lyase-activating enzyme. Members of this family are CutD, a radical enzyme that serves as an activase for choline TMA-lyase, CutC. CutC is a glycyl radical enzyme related to pyruvate formate-lyase, and this enzyme, CutD, is related to pyruvate formate-lyase activase. [Energy metabolism, Amino acids and amines].	0
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	gnl\|CDD\|234750	PRK00409, PRK00409, recombination and DNA strand exchange inhibitor protein; Reviewed.	0.000256269
NC_004557.1\|WP_035125179.1\|1565915_1566224_-\|BMC-domain-containing-protein	gnl\|CDD\|132885	cd07045, BMC_CcmK_like, Carbon dioxide concentrating mechanism K (CcmK)-like proteins, Bacterial Micro-Compartment (BMC) domain. Bacterial micro-compartments are primitive protein-based organelles that sequester specific metabolic pathways in bacterial cells. The prototypical bacterial microcompartment is the carboxysome shell, a bacterial polyhedral organelle which increase the efficiency of CO2 fixation by encapsulating RuBisCO and carbonic anhydrase. They can be divided into two types: alpha-type carboxysomes (alpha-cyanobacteria and proteobacteria) and beta-type carboxysomes (beta-cyanobacteria). Potential functional differences between the two types are not yet fully understood. In addition to these proteins there are several homologous shell proteins including those found in pdu organelles involved in coenzyme B12-dependent degradation of 1,2-propanediol and eut organelles involved in the cobalamin-dependent degradation of ethanolamine. Structure evidence shows that several carboxysome shell proteins and their homologs (Csos1A, CcmK1,2,4, and PduU) exist as hexamers which might further assemble into extended, tightly packed layers hypothesized to represent the flat facets of the polyhedral organelles outer shell. Although it has been suggested that other homologous proteins in this family might also form hexamers and play similar functional roles in the construction of their corresponding organelle outer shells at present no experimental evidence directly supports this view.	3.11057e-33
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	gnl\|CDD\|377640	pfam06271, RDD, RDD family. This family of proteins contain three highly conserved amino acids: one arginine and two aspartates, hence the name of RDD family. This region contains two predicted transmembrane regions. The arginine occurs at the N-terminus of the first helix and the first aspartate occurs in the middle of this helix. The molecular function of this region is unknown. However this region may be involved in transport of an as yet unknown set of ligands (Bateman A pers. obs.).	1.24648e-05
NC_004557.1\|WP_023438391.1\|1566245_1566542_-\|BMC-domain-containing-protein	gnl\|CDD\|132885	cd07045, BMC_CcmK_like, Carbon dioxide concentrating mechanism K (CcmK)-like proteins, Bacterial Micro-Compartment (BMC) domain. Bacterial micro-compartments are primitive protein-based organelles that sequester specific metabolic pathways in bacterial cells. The prototypical bacterial microcompartment is the carboxysome shell, a bacterial polyhedral organelle which increase the efficiency of CO2 fixation by encapsulating RuBisCO and carbonic anhydrase. They can be divided into two types: alpha-type carboxysomes (alpha-cyanobacteria and proteobacteria) and beta-type carboxysomes (beta-cyanobacteria). Potential functional differences between the two types are not yet fully understood. In addition to these proteins there are several homologous shell proteins including those found in pdu organelles involved in coenzyme B12-dependent degradation of 1,2-propanediol and eut organelles involved in the cobalamin-dependent degradation of ethanolamine. Structure evidence shows that several carboxysome shell proteins and their homologs (Csos1A, CcmK1,2,4, and PduU) exist as hexamers which might further assemble into extended, tightly packed layers hypothesized to represent the flat facets of the polyhedral organelles outer shell. Although it has been suggested that other homologous proteins in this family might also form hexamers and play similar functional roles in the construction of their corresponding organelle outer shells at present no experimental evidence directly supports this view.	8.2144e-32
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	5.17626e-07
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	gnl\|CDD\|224029	COG1104, NifS, Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes [Amino acid transport and metabolism].	0
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	5.34287e-28
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	1.00899e-162

>NC_004557.1|WP_023438394.1|1569373_1570516_-|iron-containing-alcohol-dehydrogenase
MKEFSINTDVYFGEGSLDRLNEIKNKRVLIVCDKFMETSGMVTKVQQKLTDCEVTIYSDIVPDPSVEVIASGIQKLQSCNAQIIIALGGGSSIDGAKAIKEYSKKVTGKTINIEEFYAIPTTSGTGSEVTEYAVITNKQEGLKYAITDKSLLPTVAILDPQLVKSVPKAITADTGMDVITHALEAYVSKNATDFSDALAEKAFTLAFRFLPQAYADGEDIIAREKLHNASCLAGMAFNAAGLGITHSLAHAVGGKLHISHGRSNAIILPYVVEYNANLNKESFNAEYSIAAKKYQRLAKLLKLHAPNVTIGVNNLIKSIVKLQNTLMIPQTLKQQREDINLDETSKEEIINAALRDVCTTSNPRETKKEDFLKILDKVLG
>NC_004557.1|WP_023438393.1|1568460_1569291_-|MerR-family-transcriptional-regulator
MKEELYSIGKVGEICKITKKALRYYDKMDILSPDKVSDESGYRYYSKKTLLSVPMIKYYKQSGFKLEEMKVFLEGETYDFFHKSFRNKIDELKELEKEINLKIRSVKDWDDLIVEAQNVIENNVCDVAIKYIDNKTLTFLDQEFKYDYMDSIINIEFTNYIDSIENAITGPVIIRFPCHEDKMNGKCTKMRIMQETILKCKEELSVEFGGWMAAACYHIGPHETISDTYKKIKEWTKEHGYICFEECYERYVTDYWTTKNTDKFVTEILIKISRER
>NC_004557.1|WP_011099669.1|1566901_1568017_-|membrane-protein
MSENSKTVSLEAIAAKKKLSSDFFKKGISLALFSGLAYGLYTAFLTMGMTKGVWGDWYGDNTAGLSVFVIAYLLAALGNAINDTCSAIWSLLYAVVKGKFGDFLRCINTKPGRIMILAALIGGPIASTAYVIALQMAGSIVVPISALCPAIAAILGKVLYKQELNKRMAFGIVICVCASFLIGSTGFTSDGISRNTLLGLLIAIIAALGWGFEGCVAGYGTAMIDPEIGICIRQVTAGIADLCILLPVLGMMAGGINISVDLTMQAFTSAPAMIWFTLSGLLTFMTFMTWYAGNSMCGAGLGTACNGTYSFFGPLFCLLVLGVYGGMDGWALPTVAWIGAVVMIIGILIISMNPLDLFKRKKMEVDVDETA
>NC_004557.1|WP_023438392.1|1566648_1566915_-|hypothetical-protein
MKPLNYAILKHFTKVPEACVDDVIEALKGEYGHFKALNRKAVTNALMTAEANGLIEEVRFDLDENKQLRVYYHAHKEGADTINKYIPD
>NC_004557.1|WP_023438391.1|1566245_1566542_-|BMC-domain-containing-protein
MRYYGDEALGLVETIGLVPALEAADKMLKAANVELISYENIGSTLVTIMVKGDVAAVKASVEAGAKAAAAIGKLTAHNVMPRPIREVGDIVSVHDIDL
>NC_004557.1|WP_035125179.1|1565915_1566224_-|BMC-domain-containing-protein
MARYRALGLIETFGLVFALEAADAMCKAANVELIGYENVASGYISVLVSGDVGACRSAVDAGVAAVNGMEGGNLYSSIVIPSPHEELEKIIKRYSITTLIPE
>NC_004557.1|WP_011099667.1|1563236_1565777_-|choline-trimethylamine-lyase
MDIREFSNMLMEATKNMSDEERNGLMNMFQSISKEIKKEEKVTSNVVFNNNGEIPDGMTERLIKLKENYMKQVPSITTHRARAITKIAKENPGVPKSVLRGKCFKYCCETAPLVIQDNELIVGAPNGKPRAGAFSPDIAWRWMEDEIDTIANRPQDPFYISEEDKKIMREELFPYWKGKSVDEYCEDQYREAGVWELSGESFVSDCSYHAVNGGGDSNPGYDVILMKKGMLDIKREAEEKLASLSYERPEDIEKIYFYKSIIDTAEGVMIYAKRMSDYAAELAAKETDPKRKAELQKISKVNARVPAHKPSTFWEAIQAVWTIESLLVVEENQTGMSIGRVDQYMYPFYKSDIESGRMTDFEAFELAGCMLIKMSEMMWITSEGGSKFFAGYQPFVNMCVGGVTREGRDATNELTYLLMDAVRHVKIYQPSLACRIHKGSPQKYLKKIVDVIRAGMGFPACHFDDVHIKMMLAKGVSIEDARDYCLMGCVEPQKSGRLYQWTSTGYTQWPICIELVLNHGVPLWYGKQVCPDMGDLSQFKTYEQFEGAVREQIKYITKWTAVATTISQRVHRELAPKPLMSMMYEGCMEKGRGVEAGGAMYNFGPGVVWSGLATYTDSMAAIKKLVFEEKKYTLEELSEALKADFVGYERLRKDCLEAPKYGNDDDYADYIAADLVNFTEQEHRKYKTLYSVLSHGTLSISNNTPFGQMTGATANGRRAWMPLSDGISPSQGSDFKGPTSIIKSVSKISCEDMNIGMVHNFKLMSGLLDTPEGEQGIIALLRSACALQLGEIQFNYLDNETLIEAQKHPEQYRDLIVRVAGYSAFFVELCKDVQDEIISRTMLTHF
>NC_004557.1|WP_023438388.1|1562261_1563215_-|choline-TMA-lyase-activating-enzyme
MSNGNLGVIKEKATVFNIQKYSIYDGDGIRTLVFFQGCPLRCKWCSNPEGLIKKHRVMFKSNLCVNCGACVSVCPVSIHTLSNETLKHEINRNIDCIGCGKCKDACLKSAISIVGEEKTISELLKIVEEDRVFYEMSGGGVTLGGGEVLMQPKAASSLLMACKQEGINTAIETCGYTNLETILKVAESVDLFLFDIKHINPDRHFELTGVRNEQILENLQELLRRKYNVKIRMPLLKDINNSKEEIEATMEFLTPYKDYKNFKGIDLLPYHKMGVNKYNQLGIEYPIKGDPSLNDEELDRIEEWIKKYDLHVKVIRH
>NC_004557.1|WP_011099665.1|1561868_1562222_-|BMC-domain-containing-protein
MGDFENRQIQRVIQESVPGKQITIAHVIASPMADIYERLGIDECGAIGILTLSPFETAIIAADIATKASDVEIGFLDRFTGSVVISGDVQSVETALNAVNNTLKNMLGFTPALITRT
>NC_004557.1|WP_011099664.1|1561428_1561872_-|lysine-sensitive-aspartokinase-III
MIKKRIMVIGSSGSGKTTIVNALNDYNGPLRRTPDLIYGKNTIDVPGAYIENPWMYKHIIALAQNSASCIVILVDQSNCTEVYPHGFAKSFRCPVIGVVTKCDLMPENKEKCLGQLKDIGVVEPYFHISLKTGIDALKKYLLKKCKE
>NC_004557.1|WP_035125177.1|1571587_1572091_-|hypothetical-protein
MNKTKKLPIIILLAVIVMFSGVNIYRRIDANRLKSKKTSISCIERIKDEKFNDNNVSFSFKKLNGVWQLLLLDSKKDDEITIINNSKIDEGKFYIGVLNSENEIIAFDKEKQDKITFVTPEEGCYLVRILAKNSSGKCDVKVDSKKGIDLNYNSINGHNMGLLEKNN
>NC_004557.1|WP_011099673.1|1572395_1572800_+|RDD-family-protein
MVLIIINFNRTVLYRIIASFIDDSALLLLYMFFTNIINKNNSSFVYVLLLLVSFISIEICFFIKSTSLGKFIMGLKVIDKTSSLELGFIKMLIRETFGKVLSNILFIGNIYILFNDSNQGFHDKLVNSIVIEND
>NC_004557.1|WP_035125175.1|1573867_1574935_-|tRNA-2-thiouridine(34)-synthase-MnmA
MKKKVLVGMSGGVDSSVAAYLLKEQGYEVIGATMQIWQDDKEFIEREGGCCSLSAVADARRVANKIGIPFYVMNFKDAFKKNVIDYFVDEYMEGRTPNPCVACNKFIKFSSFLDKAMTLGIDYVATGHYAIIEKQNNRYIVRKSEDDKKDQTYALYNLTQFQLERTLMPCGRYKKSEIREIAKKIGLRVHNKKDSQEICFIPDNDHGKYIKNRFPSKVRQGNFVDKSGNVLGTHKGIVYYTIGQRKGLDIALGKPMYVVDINPFRNEVVLGNLDDLLNTELIAKDVNYIPFDNLKEPMEVEAKIRYSQIPSKAVITPMENDKVKVNFTEKQRAITKGQSVVFYKGDLLIGGGIIE
>NC_004557.1|WP_011099676.1|1574977_1576114_-|cysteine-desulfurase
MKKNIYMDYAATTYIKKEVIEAMMPYLTEYYANPSSVYNMSNNLKIVIDEAKEEIADFIGATPEEVFFTSGGTEGNNWAIKGIAYANEEKGKHIITSSIEHPAVLNSCKYLKEKGFEITFLPVDSYGKVDLEKLEKSIRNDTILVSIMAANNEIGTIQHIKSIGEICKRHKVLFHTDAVQALGHIPINAEEMDIDLMTIAAHKIYGPKGIGALYIKKGTKIENILHGGSQERGKRPGTENTAAIVGFKKAVSLLKENGLEESKRIEKLRDKFIKGLLQIENTKINGAMGKERLKGNVNVSFKNIDGELLLMLLDREGIYASAGSACSAGSIDASHVLVALGLEDEFLKGTIRFTLGARNTEEEVDFVLEKLNQLIKKI
>NC_004557.1|WP_023438397.1|1576489_1577302_+|hypothetical-protein
MFKSLSKKVIISVVILIVVLLGVLGMKNYNKSKDYKNLVTTANEYMNEKDYDKAMDKFKESLDYKKDQKAEEKLEECKNELINLSKEALKNKEYEKADNYLNVLLKHDGKNEEAIKMKNTIKDEIQKSKEEEEIKKAIEKEKREQELKKQMDKEEQAKKKTGITEQNKKKEVKENNKITKEKAESLVQPLKNKNEEIRYLGTRQVPEIPAKSTPYKKFPKEIENKKVYIFDIAVVYNSDSKATIGRYYVDFSGNIYKDTYPSNLECVKVK
>NC_004557.1|WP_035109706.1|1577339_1577690_-|SdpI-family-protein
MNILTNCIIGFIFIVIGLVLRAYPPQHINNSLGYRTPFSIKNKDTWYEGNRFCGTILLISSIIFIPFSILIKYLYSNNLNLSMGISSLSLLIIIIIGIVYTEIHLRMMFDKNGTRK
>NC_004557.1|WP_011099679.1|1578401_1579985_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYMLERYLNKFKDYLVISISFEGIGDLIFQDEKVFSKEFLQIMSDSLLLNSQALSECLEEQKPHVENFIDLSRVITKFIVKAKRKVVLMIDEVDKSSNNQLFLSFLGLLRNKYLLRNVGKDYTFHNVILAGVHDVKSLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKEVNLDKEYFAEKIYFYTSGYPFLVSKLCKIVDEKIMVKDELKWEKEYLQIAVKELLKESNTNFDSLIKNIENNKDLQELVRKIILDGYEITYNEDNPLITMGVTYGIFKNSHGKVKIHNRIYEQRIYNYMISLIETKINLGFYTERERYLKPNGDLDIKKVLKKFQEFMKHEYSQKREGFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLKQLVEYLNQYGLEEGYLLIFDFRKATNLIGQVEETHINAEDNIKKIIGVYC
>NC_004557.1|WP_023438399.1|1580562_1580853_-|CRISPR-associated-endonuclease-Cas2
MSKNFNYNYAFVFYDVNEKRVNRVFKTCKKYLSHFQKSVFRGELTPANFILLKKDLNKVINEDEDFICIIKLMNNKVYDEEILGNPHSCTGEDLIL
>NC_004557.1|WP_011099680.1|1580853_1581852_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYITSVGELKRKDNSLCFRKNNKNVYIPVENTKEIYCMSEVNINSKLLDFLSQNNIIMHFFNYYEGYSGTFYPREHYNSGKLLVKQVETYENRRLEVAKSIVEAIGDNIYELLYHYYKHDKKEVKETLDWIKNHSKINLKKANDIKQIMQVEGETWQRFYGEFKNILPEEFVMNKRVKRPPDNPINALISFGNTLLYGKTITAIYNTHLDQRISFLHEPSEGRFSLSLDISEAFKPVIVFKTIFDLVNNKRIQVSKHFDKKLNYCLLNDEGRNIFITAFEERMESIFLNEKLKRKISYKTAIKLDCYKLIKFILENKEFKPFSLKERM
>NC_004557.1|WP_011099681.1|1581861_1582353_-|CRISPR-associated-protein-Cas4
MKVNGTLVNYYFHCKRQCWLHGNRINLEDNSQDVKIGKAIHEVKKEKGKQTEISIDNIKIDKITKDYLTEVKKSDSDIEAAKWQLLLYLKVLKDKGIERKGKLEFIEKNKSKSTIIIELDENNLSELEDVIKNIENLLIQENPPEVINESKCKKCAYFEYCYI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_004557_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_3

1573235-1573655

TypeI-B

III-B

Consensus_repeat	Method
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRISPRCasFinder
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRT
ATTTAAATACAACTCTTGTTATTGTTCAAC	PILER-CR

6 spacers

cas2,cas1,cas4,cas3,cas5

The CRISPR arrays of NC_004557_3

>merge|NC_004557|3|1573235-1573655|CRISPRCasFinder,CRT,PILER-CR
ATTTAAAAACATCCTATGTTATTGTTCAACTTAATCCAGATAAAATATATTCTCTTACAGCAATATTTAAATACAACTCTTGTTATTGTTCAACGTGTGTTCCGTATCAATCTAGGTCGGCAAACTTCATTTAAATACAACTCTTGTTATTGTTCAACAGATGTTTTAACAACGATAATGAATGCTTACAAAAATTTAAATACAACTCTTGTTATTGTTCAACTATTAATTCTCCTTTTGAGCTATGCTCATATATATTTATTTAAATACAACTCTTGTTATTGTTCAACGAGCTACAAGATAAATACAAAGATGTGGATTTAGTATTTAAATACAACTCTTGTTATTGTTCAACATATGCAATAGCCATATTTCAAAGATATTCAAAGGAATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|3|3|1573235-1573655|CRISPRCasFinder
ATTTAAAAACATCCTATGTTATTGTTCAAC	TTAATCCAGATAAAATATATTCTCTTACAGCAAT
ATTTAAATACAACTCTTGTTATTGTTCAAC	GTGTGTTCCGTATCAATCTAGGTCGGCAAACTTC
ATTTAAATACAACTCTTGTTATTGTTCAAC	AGATGTTTTAACAACGATAATGAATGCTTACAAAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	TATTAATTCTCCTTTTGAGCTATGCTCATATATATTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	GAGCTACAAGATAAATACAAAGATGTGGATTTAGT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ATATGCAATAGCCATATTTCAAAGATATTCAAAGGA
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|3|3|1573235-1573655|CRT
ATTTAAAAACATCCTATGTTATTGTTCAAC	TTAATCCAGATAAAATATATTCTCTTACAGCAAT
ATTTAAATACAACTCTTGTTATTGTTCAAC	GTGTGTTCCGTATCAATCTAGGTCGGCAAACTTC
ATTTAAATACAACTCTTGTTATTGTTCAAC	AGATGTTTTAACAACGATAATGAATGCTTACAAAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	TATTAATTCTCCTTTTGAGCTATGCTCATATATATTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	GAGCTACAAGATAAATACAAAGATGTGGATTTAGT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ATATGCAATAGCCATATTTCAAAGATATTCAAAGGA
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|3|3|1573299-1573655|PILER-CR
ATTTAAATACAACTCTTGTTATTGTTCAAC	GTGTGTTCCGTATCAATCTAGGTCGGCAAACTTC
ATTTAAATACAACTCTTGTTATTGTTCAAC	AGATGTTTTAACAACGATAATGAATGCTTACAAAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	TATTAATTCTCCTTTTGAGCTATGCTCATATATATTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	GAGCTACAAGATAAATACAAAGATGTGGATTTAGT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ATATGCAATAGCCATATTTCAAAGATATTCAAAGGA
ATTTAAATACAACTCTTGTTATTGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	unknown	unknown	gnl\|CDD\|234664
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	unknown	unknown	gnl\|CDD\|379303
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133382
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NC_004557.1\|WP_011099667.1\|1563236_1565777_-\|choline-trimethylamine-lyase	unknown	unknown	gnl\|CDD\|275187
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|224124
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|366863
NC_004557.1\|WP_035125177.1\|1571587_1572091_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	unknown	unknown	gnl\|CDD\|273359
NC_004557.1\|WP_023438388.1\|1562261_1563215_-\|choline-TMA-lyase-activating-enzyme	unknown	unknown	gnl\|CDD\|275188
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|234750
NC_004557.1\|WP_035125179.1\|1565915_1566224_-\|BMC-domain-containing-protein	unknown	unknown	gnl\|CDD\|132885
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	unknown	unknown	gnl\|CDD\|341459
NC_004557.1\|WP_023438391.1\|1566245_1566542_-\|BMC-domain-containing-protein	unknown	unknown	gnl\|CDD\|132885
NC_004557.1\|WP_023438392.1\|1566648_1566915_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	unknown	unknown	gnl\|CDD\|377640
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	unknown	unknown	gnl\|CDD\|224029
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	gnl\|CDD\|234664	PRK00143, mnmA, tRNA-specific 2-thiouridylase MnmA; Reviewed.	0
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	gnl\|CDD\|379303	pfam13630, SdpI, SdpI/YfhL protein family. This family of proteins includes the SdpI and YfhL proteins from B. subtilis. The SdpI protein is a multipass integral membrane protein that protects toxin-producing cells from being killed. Killing is mediated by the exported toxic protein SdpC an extracellular protein that induces the synthesis of an immunity protein.	5.45045e-10
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133382	cd01107, HTH_BmrR, Helix-Turn-Helix DNA binding domain of the BmrR transcription regulator. Helix-turn-helix (HTH) multidrug-efflux transporter transcription regulator, BmrR and YdfL of Bacillus subtilis, and related proteins; N-terminal domain. Bmr is a membrane protein which causes the efflux of a variety of toxic substances and antibiotics. BmrR is comprised of two distinct domains that harbor a regulatory (effector-binding) site and an active (DNA-binding) site. The conserved N-terminal domain contains a winged HTH motif that mediates DNA binding, while the C-terminal domain binds coactivating, toxic compounds. BmrR shares the N-terminal DNA binding domain with other transcription regulators of the MerR superfamily that promote transcription by reconfiguring the spacer between the -35 and -10 promoter elements.	4.10036e-38
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	3.10242e-112
NC_004557.1\|WP_011099667.1\|1563236_1565777_-\|choline-trimethylamine-lyase	gnl\|CDD\|275187	TIGR04394, putative_formate_C-acetyltransferase, choline trimethylamine-lyase. Members of this family, homologs to pyruvate formate-lyases and benzylsuccinate synthases, are glycine radical enzymes that appear to act as choline TMA-lyase, that is, to perform a C-N bond cleavage turning choline into trimethylamine (TMA) plus acetaldehyde. The gene symbol is cutC, for choline utilization. The activase, CutD, is a radical SAM enzyme. [Energy metabolism, Amino acids and amines].	0
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	1.29817e-29
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	5.34287e-28
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	gnl\|CDD\|366863	pfam01930, Cas_Cas4, Domain of unknown function DUF83. This domain has no known function. The domain contains three conserved cysteines at its C-terminus.	1.40975e-60
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	gnl\|CDD\|341459	cd08180, PDD, 1,3-propanediol dehydrogenase (PPD) catalyzes the reduction of 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol in glycerol metabolism. 1,3-propanediol dehydrogenase (PPD) plays a role in glycerol metabolism of some bacteria in anaerobic conditions. In this degradation pathway, glycerol is converted in a two-step process to 1,3-propanediol (1,3-PD) which is then excreted into the extracellular medium. The first reaction involves the transformation of glycerol into 3-hydroxypropionaldehyde (3-HPA) by a coenzyme B-12-dependent dehydratase. The second reaction involves the dismutation of the 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol by the NADH-linked 1,3-propanediol dehydrogenase (PPD). The enzyme requires iron ion for its function. Because many genes in this pathway are present in the propanediol utilization (pdu) operon, they are also named pdu genes. PPD is a member of the iron-containing alcohol dehydrogenase superfamily. The PPD structure has a dehydroquinate synthase-like fold.	2.12677e-180
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	gnl\|CDD\|273359	TIGR00950, Uncharacterized_inner_membrane_transporter_YicL, Carboxylate/Amino Acid/Amine Transporter. [Transport and binding proteins, Amino acids, peptides and amines].	0.00632714
NC_004557.1\|WP_023438388.1\|1562261_1563215_-\|choline-TMA-lyase-activating-enzyme	gnl\|CDD\|275188	TIGR04395, putative_pyruvate_formate-lyase_activating_enzyme, choline TMA-lyase-activating enzyme. Members of this family are CutD, a radical enzyme that serves as an activase for choline TMA-lyase, CutC. CutC is a glycyl radical enzyme related to pyruvate formate-lyase, and this enzyme, CutD, is related to pyruvate formate-lyase activase. [Energy metabolism, Amino acids and amines].	0
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	gnl\|CDD\|234750	PRK00409, PRK00409, recombination and DNA strand exchange inhibitor protein; Reviewed.	0.000256269
NC_004557.1\|WP_035125179.1\|1565915_1566224_-\|BMC-domain-containing-protein	gnl\|CDD\|132885	cd07045, BMC_CcmK_like, Carbon dioxide concentrating mechanism K (CcmK)-like proteins, Bacterial Micro-Compartment (BMC) domain. Bacterial micro-compartments are primitive protein-based organelles that sequester specific metabolic pathways in bacterial cells. The prototypical bacterial microcompartment is the carboxysome shell, a bacterial polyhedral organelle which increase the efficiency of CO2 fixation by encapsulating RuBisCO and carbonic anhydrase. They can be divided into two types: alpha-type carboxysomes (alpha-cyanobacteria and proteobacteria) and beta-type carboxysomes (beta-cyanobacteria). Potential functional differences between the two types are not yet fully understood. In addition to these proteins there are several homologous shell proteins including those found in pdu organelles involved in coenzyme B12-dependent degradation of 1,2-propanediol and eut organelles involved in the cobalamin-dependent degradation of ethanolamine. Structure evidence shows that several carboxysome shell proteins and their homologs (Csos1A, CcmK1,2,4, and PduU) exist as hexamers which might further assemble into extended, tightly packed layers hypothesized to represent the flat facets of the polyhedral organelles outer shell. Although it has been suggested that other homologous proteins in this family might also form hexamers and play similar functional roles in the construction of their corresponding organelle outer shells at present no experimental evidence directly supports this view.	3.11057e-33
NC_004557.1\|WP_023438391.1\|1566245_1566542_-\|BMC-domain-containing-protein	gnl\|CDD\|132885	cd07045, BMC_CcmK_like, Carbon dioxide concentrating mechanism K (CcmK)-like proteins, Bacterial Micro-Compartment (BMC) domain. Bacterial micro-compartments are primitive protein-based organelles that sequester specific metabolic pathways in bacterial cells. The prototypical bacterial microcompartment is the carboxysome shell, a bacterial polyhedral organelle which increase the efficiency of CO2 fixation by encapsulating RuBisCO and carbonic anhydrase. They can be divided into two types: alpha-type carboxysomes (alpha-cyanobacteria and proteobacteria) and beta-type carboxysomes (beta-cyanobacteria). Potential functional differences between the two types are not yet fully understood. In addition to these proteins there are several homologous shell proteins including those found in pdu organelles involved in coenzyme B12-dependent degradation of 1,2-propanediol and eut organelles involved in the cobalamin-dependent degradation of ethanolamine. Structure evidence shows that several carboxysome shell proteins and their homologs (Csos1A, CcmK1,2,4, and PduU) exist as hexamers which might further assemble into extended, tightly packed layers hypothesized to represent the flat facets of the polyhedral organelles outer shell. Although it has been suggested that other homologous proteins in this family might also form hexamers and play similar functional roles in the construction of their corresponding organelle outer shells at present no experimental evidence directly supports this view.	8.2144e-32
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	gnl\|CDD\|377640	pfam06271, RDD, RDD family. This family of proteins contain three highly conserved amino acids: one arginine and two aspartates, hence the name of RDD family. This region contains two predicted transmembrane regions. The arginine occurs at the N-terminus of the first helix and the first aspartate occurs in the middle of this helix. The molecular function of this region is unknown. However this region may be involved in transport of an as yet unknown set of ligands (Bateman A pers. obs.).	1.24648e-05
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	5.17626e-07
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	gnl\|CDD\|224029	COG1104, NifS, Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes [Amino acid transport and metabolism].	0
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	1.00899e-162

>NC_004557.1|WP_011099673.1|1572395_1572800_+|RDD-family-protein
MVLIIINFNRTVLYRIIASFIDDSALLLLYMFFTNIINKNNSSFVYVLLLLVSFISIEICFFIKSTSLGKFIMGLKVIDKTSSLELGFIKMLIRETFGKVLSNILFIGNIYILFNDSNQGFHDKLVNSIVIEND
>NC_004557.1|WP_035125177.1|1571587_1572091_-|hypothetical-protein
MNKTKKLPIIILLAVIVMFSGVNIYRRIDANRLKSKKTSISCIERIKDEKFNDNNVSFSFKKLNGVWQLLLLDSKKDDEITIINNSKIDEGKFYIGVLNSENEIIAFDKEKQDKITFVTPEEGCYLVRILAKNSSGKCDVKVDSKKGIDLNYNSINGHNMGLLEKNN
>NC_004557.1|WP_023438394.1|1569373_1570516_-|iron-containing-alcohol-dehydrogenase
MKEFSINTDVYFGEGSLDRLNEIKNKRVLIVCDKFMETSGMVTKVQQKLTDCEVTIYSDIVPDPSVEVIASGIQKLQSCNAQIIIALGGGSSIDGAKAIKEYSKKVTGKTINIEEFYAIPTTSGTGSEVTEYAVITNKQEGLKYAITDKSLLPTVAILDPQLVKSVPKAITADTGMDVITHALEAYVSKNATDFSDALAEKAFTLAFRFLPQAYADGEDIIAREKLHNASCLAGMAFNAAGLGITHSLAHAVGGKLHISHGRSNAIILPYVVEYNANLNKESFNAEYSIAAKKYQRLAKLLKLHAPNVTIGVNNLIKSIVKLQNTLMIPQTLKQQREDINLDETSKEEIINAALRDVCTTSNPRETKKEDFLKILDKVLG
>NC_004557.1|WP_023438393.1|1568460_1569291_-|MerR-family-transcriptional-regulator
MKEELYSIGKVGEICKITKKALRYYDKMDILSPDKVSDESGYRYYSKKTLLSVPMIKYYKQSGFKLEEMKVFLEGETYDFFHKSFRNKIDELKELEKEINLKIRSVKDWDDLIVEAQNVIENNVCDVAIKYIDNKTLTFLDQEFKYDYMDSIINIEFTNYIDSIENAITGPVIIRFPCHEDKMNGKCTKMRIMQETILKCKEELSVEFGGWMAAACYHIGPHETISDTYKKIKEWTKEHGYICFEECYERYVTDYWTTKNTDKFVTEILIKISRER
>NC_004557.1|WP_011099669.1|1566901_1568017_-|membrane-protein
MSENSKTVSLEAIAAKKKLSSDFFKKGISLALFSGLAYGLYTAFLTMGMTKGVWGDWYGDNTAGLSVFVIAYLLAALGNAINDTCSAIWSLLYAVVKGKFGDFLRCINTKPGRIMILAALIGGPIASTAYVIALQMAGSIVVPISALCPAIAAILGKVLYKQELNKRMAFGIVICVCASFLIGSTGFTSDGISRNTLLGLLIAIIAALGWGFEGCVAGYGTAMIDPEIGICIRQVTAGIADLCILLPVLGMMAGGINISVDLTMQAFTSAPAMIWFTLSGLLTFMTFMTWYAGNSMCGAGLGTACNGTYSFFGPLFCLLVLGVYGGMDGWALPTVAWIGAVVMIIGILIISMNPLDLFKRKKMEVDVDETA
>NC_004557.1|WP_023438392.1|1566648_1566915_-|hypothetical-protein
MKPLNYAILKHFTKVPEACVDDVIEALKGEYGHFKALNRKAVTNALMTAEANGLIEEVRFDLDENKQLRVYYHAHKEGADTINKYIPD
>NC_004557.1|WP_023438391.1|1566245_1566542_-|BMC-domain-containing-protein
MRYYGDEALGLVETIGLVPALEAADKMLKAANVELISYENIGSTLVTIMVKGDVAAVKASVEAGAKAAAAIGKLTAHNVMPRPIREVGDIVSVHDIDL
>NC_004557.1|WP_035125179.1|1565915_1566224_-|BMC-domain-containing-protein
MARYRALGLIETFGLVFALEAADAMCKAANVELIGYENVASGYISVLVSGDVGACRSAVDAGVAAVNGMEGGNLYSSIVIPSPHEELEKIIKRYSITTLIPE
>NC_004557.1|WP_011099667.1|1563236_1565777_-|choline-trimethylamine-lyase
MDIREFSNMLMEATKNMSDEERNGLMNMFQSISKEIKKEEKVTSNVVFNNNGEIPDGMTERLIKLKENYMKQVPSITTHRARAITKIAKENPGVPKSVLRGKCFKYCCETAPLVIQDNELIVGAPNGKPRAGAFSPDIAWRWMEDEIDTIANRPQDPFYISEEDKKIMREELFPYWKGKSVDEYCEDQYREAGVWELSGESFVSDCSYHAVNGGGDSNPGYDVILMKKGMLDIKREAEEKLASLSYERPEDIEKIYFYKSIIDTAEGVMIYAKRMSDYAAELAAKETDPKRKAELQKISKVNARVPAHKPSTFWEAIQAVWTIESLLVVEENQTGMSIGRVDQYMYPFYKSDIESGRMTDFEAFELAGCMLIKMSEMMWITSEGGSKFFAGYQPFVNMCVGGVTREGRDATNELTYLLMDAVRHVKIYQPSLACRIHKGSPQKYLKKIVDVIRAGMGFPACHFDDVHIKMMLAKGVSIEDARDYCLMGCVEPQKSGRLYQWTSTGYTQWPICIELVLNHGVPLWYGKQVCPDMGDLSQFKTYEQFEGAVREQIKYITKWTAVATTISQRVHRELAPKPLMSMMYEGCMEKGRGVEAGGAMYNFGPGVVWSGLATYTDSMAAIKKLVFEEKKYTLEELSEALKADFVGYERLRKDCLEAPKYGNDDDYADYIAADLVNFTEQEHRKYKTLYSVLSHGTLSISNNTPFGQMTGATANGRRAWMPLSDGISPSQGSDFKGPTSIIKSVSKISCEDMNIGMVHNFKLMSGLLDTPEGEQGIIALLRSACALQLGEIQFNYLDNETLIEAQKHPEQYRDLIVRVAGYSAFFVELCKDVQDEIISRTMLTHF
>NC_004557.1|WP_023438388.1|1562261_1563215_-|choline-TMA-lyase-activating-enzyme
MSNGNLGVIKEKATVFNIQKYSIYDGDGIRTLVFFQGCPLRCKWCSNPEGLIKKHRVMFKSNLCVNCGACVSVCPVSIHTLSNETLKHEINRNIDCIGCGKCKDACLKSAISIVGEEKTISELLKIVEEDRVFYEMSGGGVTLGGGEVLMQPKAASSLLMACKQEGINTAIETCGYTNLETILKVAESVDLFLFDIKHINPDRHFELTGVRNEQILENLQELLRRKYNVKIRMPLLKDINNSKEEIEATMEFLTPYKDYKNFKGIDLLPYHKMGVNKYNQLGIEYPIKGDPSLNDEELDRIEEWIKKYDLHVKVIRH
>NC_004557.1|WP_035125175.1|1573867_1574935_-|tRNA-2-thiouridine(34)-synthase-MnmA
MKKKVLVGMSGGVDSSVAAYLLKEQGYEVIGATMQIWQDDKEFIEREGGCCSLSAVADARRVANKIGIPFYVMNFKDAFKKNVIDYFVDEYMEGRTPNPCVACNKFIKFSSFLDKAMTLGIDYVATGHYAIIEKQNNRYIVRKSEDDKKDQTYALYNLTQFQLERTLMPCGRYKKSEIREIAKKIGLRVHNKKDSQEICFIPDNDHGKYIKNRFPSKVRQGNFVDKSGNVLGTHKGIVYYTIGQRKGLDIALGKPMYVVDINPFRNEVVLGNLDDLLNTELIAKDVNYIPFDNLKEPMEVEAKIRYSQIPSKAVITPMENDKVKVNFTEKQRAITKGQSVVFYKGDLLIGGGIIE
>NC_004557.1|WP_011099676.1|1574977_1576114_-|cysteine-desulfurase
MKKNIYMDYAATTYIKKEVIEAMMPYLTEYYANPSSVYNMSNNLKIVIDEAKEEIADFIGATPEEVFFTSGGTEGNNWAIKGIAYANEEKGKHIITSSIEHPAVLNSCKYLKEKGFEITFLPVDSYGKVDLEKLEKSIRNDTILVSIMAANNEIGTIQHIKSIGEICKRHKVLFHTDAVQALGHIPINAEEMDIDLMTIAAHKIYGPKGIGALYIKKGTKIENILHGGSQERGKRPGTENTAAIVGFKKAVSLLKENGLEESKRIEKLRDKFIKGLLQIENTKINGAMGKERLKGNVNVSFKNIDGELLLMLLDREGIYASAGSACSAGSIDASHVLVALGLEDEFLKGTIRFTLGARNTEEEVDFVLEKLNQLIKKI
>NC_004557.1|WP_023438397.1|1576489_1577302_+|hypothetical-protein
MFKSLSKKVIISVVILIVVLLGVLGMKNYNKSKDYKNLVTTANEYMNEKDYDKAMDKFKESLDYKKDQKAEEKLEECKNELINLSKEALKNKEYEKADNYLNVLLKHDGKNEEAIKMKNTIKDEIQKSKEEEEIKKAIEKEKREQELKKQMDKEEQAKKKTGITEQNKKKEVKENNKITKEKAESLVQPLKNKNEEIRYLGTRQVPEIPAKSTPYKKFPKEIENKKVYIFDIAVVYNSDSKATIGRYYVDFSGNIYKDTYPSNLECVKVK
>NC_004557.1|WP_035109706.1|1577339_1577690_-|SdpI-family-protein
MNILTNCIIGFIFIVIGLVLRAYPPQHINNSLGYRTPFSIKNKDTWYEGNRFCGTILLISSIIFIPFSILIKYLYSNNLNLSMGISSLSLLIIIIIGIVYTEIHLRMMFDKNGTRK
>NC_004557.1|WP_011099679.1|1578401_1579985_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYMLERYLNKFKDYLVISISFEGIGDLIFQDEKVFSKEFLQIMSDSLLLNSQALSECLEEQKPHVENFIDLSRVITKFIVKAKRKVVLMIDEVDKSSNNQLFLSFLGLLRNKYLLRNVGKDYTFHNVILAGVHDVKSLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKEVNLDKEYFAEKIYFYTSGYPFLVSKLCKIVDEKIMVKDELKWEKEYLQIAVKELLKESNTNFDSLIKNIENNKDLQELVRKIILDGYEITYNEDNPLITMGVTYGIFKNSHGKVKIHNRIYEQRIYNYMISLIETKINLGFYTERERYLKPNGDLDIKKVLKKFQEFMKHEYSQKREGFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLKQLVEYLNQYGLEEGYLLIFDFRKATNLIGQVEETHINAEDNIKKIIGVYC
>NC_004557.1|WP_023438399.1|1580562_1580853_-|CRISPR-associated-endonuclease-Cas2
MSKNFNYNYAFVFYDVNEKRVNRVFKTCKKYLSHFQKSVFRGELTPANFILLKKDLNKVINEDEDFICIIKLMNNKVYDEEILGNPHSCTGEDLIL
>NC_004557.1|WP_011099680.1|1580853_1581852_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYITSVGELKRKDNSLCFRKNNKNVYIPVENTKEIYCMSEVNINSKLLDFLSQNNIIMHFFNYYEGYSGTFYPREHYNSGKLLVKQVETYENRRLEVAKSIVEAIGDNIYELLYHYYKHDKKEVKETLDWIKNHSKINLKKANDIKQIMQVEGETWQRFYGEFKNILPEEFVMNKRVKRPPDNPINALISFGNTLLYGKTITAIYNTHLDQRISFLHEPSEGRFSLSLDISEAFKPVIVFKTIFDLVNNKRIQVSKHFDKKLNYCLLNDEGRNIFITAFEERMESIFLNEKLKRKISYKTAIKLDCYKLIKFILENKEFKPFSLKERM
>NC_004557.1|WP_011099681.1|1581861_1582353_-|CRISPR-associated-protein-Cas4
MKVNGTLVNYYFHCKRQCWLHGNRINLEDNSQDVKIGKAIHEVKKEKGKQTEISIDNIKIDKITKDYLTEVKKSDSDIEAAKWQLLLYLKVLKDKGIERKGKLEFIEKNKSKSTIIIELDENNLSELEDVIKNIENLLIQENPPEVINESKCKKCAYFEYCYI
>NC_004557.1|WP_011099682.1|1582361_1584962_-|CRISPR-associated-helicase/endonuclease-Cas3
MYFNNIEKVNLENIIENNDKIYAHIHNGRKETLKEHSDLALKYLYKISERKSLDNVFLKIENNFLEKCSNEEKMVYRKMLLNTIYMHDLGKINCNFQRKKMANKIFKEEKMSSTNHSMLSSIIYINHFLKEIASIENGEHIKLLIAFLLLNSYVISKHHGAFNSVNKFKEKLVYDGEEGKDLYTKYMYIFDKVYKEEIIINESLIKEDLFDMYKSTIQEKTEENKDFPVELYIYERFLASLLLSCDYYSTSEFKNQKEVEEFGEIKNIEKFYKSFKSTEVYNWIRKYEKNDYGKTDDFSNIDDINVLRNELFLDAEKTMVSNIDKDIFYLEAPTGSGKSNVSFNLSFKMVERFKEINKIFYVYPFNTLVEQNIKTLEKIFKNNEIMKDIAIINSVVPIKIKSSKDNKIKEIDTNEESDILNEDYERALLDRQFLHYPIVLTTHVSIFNYLFGTSKDNLFPLCQIANSIIVLDEIQSYKNRIWKEIITFLACYSRLLNIKIIIMSATLPNLNKLVDGEIKTVNLIENRKKYFENPIFKNRVMVDFSLLEEKENIKEVLFNNVIKNTKAPNKNILVEFITKESAMDFYEKLKDYNKYLQESEKREIELITGDDNRVERNRIIDKIKSQKNIILVATQVIEAGVDIDMDIGYKDISMLDSEEQFLGRINRSCKNDEQGIVYFFDLDLASHVYKRDIRKQKNINLTCPKIREILINKNFQEFYDYVIKELNKKAGEYNNSSFQTFFLDKVKMLNFKEIEERMKLIDELYENNVFLNRNITLENEEELCGEDVWNEYIAILKNNKLDYAEKKIKLSQVTAKLNYFIYQISSDDFIYEDRVGDIYYIGDGEKYFEDGKFDRKKFKSIVADII
>NC_004557.1|WP_011099683.1|1585018_1585789_-|type-I-B-CRISPR-associated-protein-Cas5
MDALKFSLSGRTAFFKKPDVNSFFYFTYGNVHKVALLGILGAICGYGGYNSQCLNKEQIYPEFYEKLKDINIGVVPKNEKGYIDKKIQVFNNSVGYASKELGGNLIVKEQWLENPKWAIYILMDENVPKDLKDRLLNFKFKYIPYLGKNDHMANITDVEYLENIEKLDNTNKLDSIFIKDKYEIQKESKNFNDLKNIIKKSSSKIQEFKYEEMLPISLEETTNKYNLETFIYTNSNLKPLADTKTYKCGDKNIFFF

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_004557_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_4

1577804-1577966

TypeI-B

III-B

Consensus_repeat	Method
GAATTTAAATACATCCTATGTTAAGGTTCAAC	PILER-CR
ATTTAAATACATCCTATGTTAAGGTTCAAC	CRISPRCasFinder

2 spacers

cas2,cas1,cas4,cas3,cas5,cas7b,cas8b1,cas6

The CRISPR arrays of NC_004557_4

>merge|NC_004557|4|1577804-1577966|PILER-CR,CRISPRCasFinder
AATTTAAATACATCCTATGTTAAGGTTCAACTTAAAGCTTCTACTAATTCTTTTTTATTCATTGTATTTAAATACATCCTATGTTAAGGTTCAACGTACAAAACTTACCTCAAAACCATCTACCAGATTTAGAATTTAAATACATCCTATGTTAAGGTTCAAC

>NC_004557|4|4|1577804-1577966|PILER-CR
AATTTAAATACATCCTATGTTAAGGTTCAACT	TAAAGCTTCTACTAATTCTTTTTTATTCATTG
TATTTAAATACATCCTATGTTAAGGTTCAACG	TACAAAACTTACCTCAAAACCATCTACCAGATTTAG
AATTTAAATACATCCTATGTTAAGGTTCAAC

>NC_004557|4|4|1577805-1577966|CRISPRCasFinder
ATTTAAATACATCCTATGTTAAGGTTCAAC	TTAAAGCTTCTACTAATTCTTTTTTATTCATTGT
ATTTAAATACATCCTATGTTAAGGTTCAAC	GTACAAAACTTACCTCAAAACCATCTACCAGATTTAGA
ATTTAAATACATCCTATGTTAAGGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	unknown	unknown	gnl\|CDD\|234664
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	cas8b1	mkCas0106_cas8b1_CAS-I-B	gnl\|CDD\|188234
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	unknown	unknown	gnl\|CDD\|379303
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133382
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|366863
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	cas7b	pfam05107_cas7b_CAS-I-B:CAS-I-C	gnl\|CDD\|377458
NC_004557.1\|WP_035125177.1\|1571587_1572091_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	unknown	unknown	gnl\|CDD\|273359
NC_004557.1\|WP_155274218.1\|1589321_1589468_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|234750
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	unknown	unknown	gnl\|CDD\|377640
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	unknown	unknown	gnl\|CDD\|341459
NC_004557.1\|WP_023438392.1\|1566648_1566915_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|224124
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	unknown	unknown	gnl\|CDD\|224029
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	gnl\|CDD\|234664	PRK00143, mnmA, tRNA-specific 2-thiouridylase MnmA; Reviewed.	0
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	gnl\|CDD\|379303	pfam13630, SdpI, SdpI/YfhL protein family. This family of proteins includes the SdpI and YfhL proteins from B. subtilis. The SdpI protein is a multipass integral membrane protein that protects toxin-producing cells from being killed. Killing is mediated by the exported toxic protein SdpC an extracellular protein that induces the synthesis of an immunity protein.	5.45045e-10
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	1.00899e-162
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	3.10242e-112
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	gnl\|CDD\|366863	pfam01930, Cas_Cas4, Domain of unknown function DUF83. This domain has no known function. The domain contains three conserved cysteines at its C-terminus.	1.40975e-60
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	5.34287e-28
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.75114e-22
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	gnl\|CDD\|377458	pfam05107, Cas_Cas7, CRISPR-associated protein Cas7. CRISPR-associated protein Cas7 is one of the components of the type I-B cascade-like antiviral defense complex. In Haloferax volcanii, Cas5, Cas6 and Cas7 form a small complex that aids the stability of CRISPR-derived RNA.	6.79018e-48
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	gnl\|CDD\|341459	cd08180, PDD, 1,3-propanediol dehydrogenase (PPD) catalyzes the reduction of 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol in glycerol metabolism. 1,3-propanediol dehydrogenase (PPD) plays a role in glycerol metabolism of some bacteria in anaerobic conditions. In this degradation pathway, glycerol is converted in a two-step process to 1,3-propanediol (1,3-PD) which is then excreted into the extracellular medium. The first reaction involves the transformation of glycerol into 3-hydroxypropionaldehyde (3-HPA) by a coenzyme B-12-dependent dehydratase. The second reaction involves the dismutation of the 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol by the NADH-linked 1,3-propanediol dehydrogenase (PPD). The enzyme requires iron ion for its function. Because many genes in this pathway are present in the propanediol utilization (pdu) operon, they are also named pdu genes. PPD is a member of the iron-containing alcohol dehydrogenase superfamily. The PPD structure has a dehydroquinate synthase-like fold.	2.12677e-180
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	gnl\|CDD\|273359	TIGR00950, Uncharacterized_inner_membrane_transporter_YicL, Carboxylate/Amino Acid/Amine Transporter. [Transport and binding proteins, Amino acids, peptides and amines].	0.00632714
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	gnl\|CDD\|234750	PRK00409, PRK00409, recombination and DNA strand exchange inhibitor protein; Reviewed.	0.000256269
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	gnl\|CDD\|377640	pfam06271, RDD, RDD family. This family of proteins contain three highly conserved amino acids: one arginine and two aspartates, hence the name of RDD family. This region contains two predicted transmembrane regions. The arginine occurs at the N-terminus of the first helix and the first aspartate occurs in the middle of this helix. The molecular function of this region is unknown. However this region may be involved in transport of an as yet unknown set of ligands (Bateman A pers. obs.).	1.24648e-05
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	gnl\|CDD\|188234	TIGR02591, cas_Csh1, CRISPR-associated protein Cas8b/Csh1, subtype I-B/HMARI. This domain is found in the C-terminal 2/3 of a family of CRISPR associated proteins of the Hmari subtype. Except for the two sequences from halophilic archaea this domain contains a pair of CXXC motifs.	3.00773e-90
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	1.29817e-29
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	5.17626e-07
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	gnl\|CDD\|224029	COG1104, NifS, Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes [Amino acid transport and metabolism].	0
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133382	cd01107, HTH_BmrR, Helix-Turn-Helix DNA binding domain of the BmrR transcription regulator. Helix-turn-helix (HTH) multidrug-efflux transporter transcription regulator, BmrR and YdfL of Bacillus subtilis, and related proteins; N-terminal domain. Bmr is a membrane protein which causes the efflux of a variety of toxic substances and antibiotics. BmrR is comprised of two distinct domains that harbor a regulatory (effector-binding) site and an active (DNA-binding) site. The conserved N-terminal domain contains a winged HTH motif that mediates DNA binding, while the C-terminal domain binds coactivating, toxic compounds. BmrR shares the N-terminal DNA binding domain with other transcription regulators of the MerR superfamily that promote transcription by reconfiguring the spacer between the -35 and -10 promoter elements.	4.10036e-38

>NC_004557.1|WP_035109706.1|1577339_1577690_-|SdpI-family-protein
MNILTNCIIGFIFIVIGLVLRAYPPQHINNSLGYRTPFSIKNKDTWYEGNRFCGTILLISSIIFIPFSILIKYLYSNNLNLSMGISSLSLLIIIIIGIVYTEIHLRMMFDKNGTRK
>NC_004557.1|WP_023438397.1|1576489_1577302_+|hypothetical-protein
MFKSLSKKVIISVVILIVVLLGVLGMKNYNKSKDYKNLVTTANEYMNEKDYDKAMDKFKESLDYKKDQKAEEKLEECKNELINLSKEALKNKEYEKADNYLNVLLKHDGKNEEAIKMKNTIKDEIQKSKEEEEIKKAIEKEKREQELKKQMDKEEQAKKKTGITEQNKKKEVKENNKITKEKAESLVQPLKNKNEEIRYLGTRQVPEIPAKSTPYKKFPKEIENKKVYIFDIAVVYNSDSKATIGRYYVDFSGNIYKDTYPSNLECVKVK
>NC_004557.1|WP_011099676.1|1574977_1576114_-|cysteine-desulfurase
MKKNIYMDYAATTYIKKEVIEAMMPYLTEYYANPSSVYNMSNNLKIVIDEAKEEIADFIGATPEEVFFTSGGTEGNNWAIKGIAYANEEKGKHIITSSIEHPAVLNSCKYLKEKGFEITFLPVDSYGKVDLEKLEKSIRNDTILVSIMAANNEIGTIQHIKSIGEICKRHKVLFHTDAVQALGHIPINAEEMDIDLMTIAAHKIYGPKGIGALYIKKGTKIENILHGGSQERGKRPGTENTAAIVGFKKAVSLLKENGLEESKRIEKLRDKFIKGLLQIENTKINGAMGKERLKGNVNVSFKNIDGELLLMLLDREGIYASAGSACSAGSIDASHVLVALGLEDEFLKGTIRFTLGARNTEEEVDFVLEKLNQLIKKI
>NC_004557.1|WP_035125175.1|1573867_1574935_-|tRNA-2-thiouridine(34)-synthase-MnmA
MKKKVLVGMSGGVDSSVAAYLLKEQGYEVIGATMQIWQDDKEFIEREGGCCSLSAVADARRVANKIGIPFYVMNFKDAFKKNVIDYFVDEYMEGRTPNPCVACNKFIKFSSFLDKAMTLGIDYVATGHYAIIEKQNNRYIVRKSEDDKKDQTYALYNLTQFQLERTLMPCGRYKKSEIREIAKKIGLRVHNKKDSQEICFIPDNDHGKYIKNRFPSKVRQGNFVDKSGNVLGTHKGIVYYTIGQRKGLDIALGKPMYVVDINPFRNEVVLGNLDDLLNTELIAKDVNYIPFDNLKEPMEVEAKIRYSQIPSKAVITPMENDKVKVNFTEKQRAITKGQSVVFYKGDLLIGGGIIE
>NC_004557.1|WP_011099673.1|1572395_1572800_+|RDD-family-protein
MVLIIINFNRTVLYRIIASFIDDSALLLLYMFFTNIINKNNSSFVYVLLLLVSFISIEICFFIKSTSLGKFIMGLKVIDKTSSLELGFIKMLIRETFGKVLSNILFIGNIYILFNDSNQGFHDKLVNSIVIEND
>NC_004557.1|WP_035125177.1|1571587_1572091_-|hypothetical-protein
MNKTKKLPIIILLAVIVMFSGVNIYRRIDANRLKSKKTSISCIERIKDEKFNDNNVSFSFKKLNGVWQLLLLDSKKDDEITIINNSKIDEGKFYIGVLNSENEIIAFDKEKQDKITFVTPEEGCYLVRILAKNSSGKCDVKVDSKKGIDLNYNSINGHNMGLLEKNN
>NC_004557.1|WP_023438394.1|1569373_1570516_-|iron-containing-alcohol-dehydrogenase
MKEFSINTDVYFGEGSLDRLNEIKNKRVLIVCDKFMETSGMVTKVQQKLTDCEVTIYSDIVPDPSVEVIASGIQKLQSCNAQIIIALGGGSSIDGAKAIKEYSKKVTGKTINIEEFYAIPTTSGTGSEVTEYAVITNKQEGLKYAITDKSLLPTVAILDPQLVKSVPKAITADTGMDVITHALEAYVSKNATDFSDALAEKAFTLAFRFLPQAYADGEDIIAREKLHNASCLAGMAFNAAGLGITHSLAHAVGGKLHISHGRSNAIILPYVVEYNANLNKESFNAEYSIAAKKYQRLAKLLKLHAPNVTIGVNNLIKSIVKLQNTLMIPQTLKQQREDINLDETSKEEIINAALRDVCTTSNPRETKKEDFLKILDKVLG
>NC_004557.1|WP_023438393.1|1568460_1569291_-|MerR-family-transcriptional-regulator
MKEELYSIGKVGEICKITKKALRYYDKMDILSPDKVSDESGYRYYSKKTLLSVPMIKYYKQSGFKLEEMKVFLEGETYDFFHKSFRNKIDELKELEKEINLKIRSVKDWDDLIVEAQNVIENNVCDVAIKYIDNKTLTFLDQEFKYDYMDSIINIEFTNYIDSIENAITGPVIIRFPCHEDKMNGKCTKMRIMQETILKCKEELSVEFGGWMAAACYHIGPHETISDTYKKIKEWTKEHGYICFEECYERYVTDYWTTKNTDKFVTEILIKISRER
>NC_004557.1|WP_011099669.1|1566901_1568017_-|membrane-protein
MSENSKTVSLEAIAAKKKLSSDFFKKGISLALFSGLAYGLYTAFLTMGMTKGVWGDWYGDNTAGLSVFVIAYLLAALGNAINDTCSAIWSLLYAVVKGKFGDFLRCINTKPGRIMILAALIGGPIASTAYVIALQMAGSIVVPISALCPAIAAILGKVLYKQELNKRMAFGIVICVCASFLIGSTGFTSDGISRNTLLGLLIAIIAALGWGFEGCVAGYGTAMIDPEIGICIRQVTAGIADLCILLPVLGMMAGGINISVDLTMQAFTSAPAMIWFTLSGLLTFMTFMTWYAGNSMCGAGLGTACNGTYSFFGPLFCLLVLGVYGGMDGWALPTVAWIGAVVMIIGILIISMNPLDLFKRKKMEVDVDETA
>NC_004557.1|WP_023438392.1|1566648_1566915_-|hypothetical-protein
MKPLNYAILKHFTKVPEACVDDVIEALKGEYGHFKALNRKAVTNALMTAEANGLIEEVRFDLDENKQLRVYYHAHKEGADTINKYIPD
>NC_004557.1|WP_011099679.1|1578401_1579985_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYMLERYLNKFKDYLVISISFEGIGDLIFQDEKVFSKEFLQIMSDSLLLNSQALSECLEEQKPHVENFIDLSRVITKFIVKAKRKVVLMIDEVDKSSNNQLFLSFLGLLRNKYLLRNVGKDYTFHNVILAGVHDVKSLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKEVNLDKEYFAEKIYFYTSGYPFLVSKLCKIVDEKIMVKDELKWEKEYLQIAVKELLKESNTNFDSLIKNIENNKDLQELVRKIILDGYEITYNEDNPLITMGVTYGIFKNSHGKVKIHNRIYEQRIYNYMISLIETKINLGFYTERERYLKPNGDLDIKKVLKKFQEFMKHEYSQKREGFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLKQLVEYLNQYGLEEGYLLIFDFRKATNLIGQVEETHINAEDNIKKIIGVYC
>NC_004557.1|WP_023438399.1|1580562_1580853_-|CRISPR-associated-endonuclease-Cas2
MSKNFNYNYAFVFYDVNEKRVNRVFKTCKKYLSHFQKSVFRGELTPANFILLKKDLNKVINEDEDFICIIKLMNNKVYDEEILGNPHSCTGEDLIL
>NC_004557.1|WP_011099680.1|1580853_1581852_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYITSVGELKRKDNSLCFRKNNKNVYIPVENTKEIYCMSEVNINSKLLDFLSQNNIIMHFFNYYEGYSGTFYPREHYNSGKLLVKQVETYENRRLEVAKSIVEAIGDNIYELLYHYYKHDKKEVKETLDWIKNHSKINLKKANDIKQIMQVEGETWQRFYGEFKNILPEEFVMNKRVKRPPDNPINALISFGNTLLYGKTITAIYNTHLDQRISFLHEPSEGRFSLSLDISEAFKPVIVFKTIFDLVNNKRIQVSKHFDKKLNYCLLNDEGRNIFITAFEERMESIFLNEKLKRKISYKTAIKLDCYKLIKFILENKEFKPFSLKERM
>NC_004557.1|WP_011099681.1|1581861_1582353_-|CRISPR-associated-protein-Cas4
MKVNGTLVNYYFHCKRQCWLHGNRINLEDNSQDVKIGKAIHEVKKEKGKQTEISIDNIKIDKITKDYLTEVKKSDSDIEAAKWQLLLYLKVLKDKGIERKGKLEFIEKNKSKSTIIIELDENNLSELEDVIKNIENLLIQENPPEVINESKCKKCAYFEYCYI
>NC_004557.1|WP_011099682.1|1582361_1584962_-|CRISPR-associated-helicase/endonuclease-Cas3
MYFNNIEKVNLENIIENNDKIYAHIHNGRKETLKEHSDLALKYLYKISERKSLDNVFLKIENNFLEKCSNEEKMVYRKMLLNTIYMHDLGKINCNFQRKKMANKIFKEEKMSSTNHSMLSSIIYINHFLKEIASIENGEHIKLLIAFLLLNSYVISKHHGAFNSVNKFKEKLVYDGEEGKDLYTKYMYIFDKVYKEEIIINESLIKEDLFDMYKSTIQEKTEENKDFPVELYIYERFLASLLLSCDYYSTSEFKNQKEVEEFGEIKNIEKFYKSFKSTEVYNWIRKYEKNDYGKTDDFSNIDDINVLRNELFLDAEKTMVSNIDKDIFYLEAPTGSGKSNVSFNLSFKMVERFKEINKIFYVYPFNTLVEQNIKTLEKIFKNNEIMKDIAIINSVVPIKIKSSKDNKIKEIDTNEESDILNEDYERALLDRQFLHYPIVLTTHVSIFNYLFGTSKDNLFPLCQIANSIIVLDEIQSYKNRIWKEIITFLACYSRLLNIKIIIMSATLPNLNKLVDGEIKTVNLIENRKKYFENPIFKNRVMVDFSLLEEKENIKEVLFNNVIKNTKAPNKNILVEFITKESAMDFYEKLKDYNKYLQESEKREIELITGDDNRVERNRIIDKIKSQKNIILVATQVIEAGVDIDMDIGYKDISMLDSEEQFLGRINRSCKNDEQGIVYFFDLDLASHVYKRDIRKQKNINLTCPKIREILINKNFQEFYDYVIKELNKKAGEYNNSSFQTFFLDKVKMLNFKEIEERMKLIDELYENNVFLNRNITLENEEELCGEDVWNEYIAILKNNKLDYAEKKIKLSQVTAKLNYFIYQISSDDFIYEDRVGDIYYIGDGEKYFEDGKFDRKKFKSIVADII
>NC_004557.1|WP_011099683.1|1585018_1585789_-|type-I-B-CRISPR-associated-protein-Cas5
MDALKFSLSGRTAFFKKPDVNSFFYFTYGNVHKVALLGILGAICGYGGYNSQCLNKEQIYPEFYEKLKDINIGVVPKNEKGYIDKKIQVFNNSVGYASKELGGNLIVKEQWLENPKWAIYILMDENVPKDLKDRLLNFKFKYIPYLGKNDHMANITDVEYLENIEKLDNTNKLDSIFIKDKYEIQKESKNFNDLKNIIKKSSSKIQEFKYEEMLPISLEETTNKYNLETFIYTNSNLKPLADTKTYKCGDKNIFFF
>NC_004557.1|WP_011099684.1|1585792_1586752_-|type-I-CRISPR-associated-protein-Cas7
MGMNKRVYGVLGIVSRMSNWNADFTGYPKTTSSGDVFGSDKAFKYPMKKMWENGGEKVLYIKSIKFQENKKKERELIPRTLKERYEYIFDVEDLKKNKDSEEVLKNLFTAVDVKNFGATFAEEGNNISITGAVQIGQGFNKYKETYAEEQQILSPFRDPNQKEKSKDGEEAKSSTLGTKIVSNEAHYFYPLTVNPSAYSQFEEIGVTNGYTEEDYEKFKETSMIAATSFNTNSKIGCENEFALFVETKEDLYLPDLSQYVDFEKVEDKNIIILSCSELLNSFENEIENIEIYYNSYTTEIKSDEIKKAKKFNIFTKKEV
>NC_004557.1|WP_011099685.1|1586757_1588497_-|type-I-B-CRISPR-associated-protein-Cas8b/Csh1
MLKDVISIFKREYEKIGDRYVTESYIPSDGEYIIVDTFENDFKILDKVIIKKDRKTQKIDDSNQYFPFIREADYLSRLLDMNKPIDHKKIIHSNNYLSFFIKKENVNNGKLSDEIIDRYYEILKDPLIKYKNTKAEKLYEEVEEEHGKVNEKLIDEIKNWIKEKIHDFVDKGSKEKEYLKIFFKYDLDKYRKESEKYISPNLYNSNDYNVKIKEEIYGLPNDNMGLNSKKPYLENKTRKSKVPYLISKEEVLIQKKFFDYLMNQVAIGKSNIYINEKGIKGISNKETLGEDFTGYYLRIQKGKEVEIHNFDTIVNYRAKIEPFKLENVLELEKSELNYNVFIYEIGKLKDLIDNVFFYKFLSGNFFTKAEDLNINDATLKRSILLSRDTLFTWFYKGVDNNTWNNLNISSLNLIKGSINKRYLLKAGEQFNLRCSLKNYFEGGISMADVLLEVKNSLREKINKTVKENKNHEDVTLDNDREYYFAVGQLAYYLISLSKSKNKSHSLVNPIINAKTNERIKDEIRRLYTRYNYRIEFGSKRVERLYSMISSYVPKGKINGDLIIAGFLKNNLIYEKSEEE
>NC_004557.1|WP_011099686.1|1588509_1589202_-|CRISPR-associated-endoribonuclease-Cas6
MKIYELTLKVFLLKDIKSDESLEKISNLIDKSLSKDGKLLDFHERNTYKNYTFNSLYPIEKDKIYNEGKIYSVQIRTVDESLIQYFKKNLTNEYTEYIKALTLECRVIPQRYIEKIYSITPVIIKTEKGYWKGNLSLGEFEERIKNNLIKKYNSFFNTKIDERFTLFRTINLINNKPISCSYKDINILGDKITLIIDENEMAQKLACFSLGSGVGEMNARGYGFVNYKWL
>NC_004557.1|WP_155274218.1|1589321_1589468_-|hypothetical-protein
MKKKLKFSISATYEDLKEKERIEIDDIIYIIELVSVITLILKIFQFIN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_004557_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_5

1580088-1580377

TypeI-B

III-B

Consensus_repeat	Method
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRISPRCasFinder
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRT
ATTTAAATACAACTCTTGTTATTGTTCAAC	PILER-CR

4 spacers

cas2,cas1,cas4,cas3,cas5,cas7b,cas8b1,cas6

The CRISPR arrays of NC_004557_5

>merge|NC_004557|5|1580088-1580377|CRISPRCasFinder,CRT,PILER-CR
TTTTAAATACAACTCTTGTTATTGTTCAACGGATGCACTTTCTTTAAATATAAATAAAAAATCTAAATTTAAATACAACTCTTGTTATTGTTCAACAACATCAAATTCCTACTTCACAATAATTTCATGTTGATTTAAATACAACTCTTGTTATTGTTCAACAAGAGTTGCACTTTTTTATATAATCTCTTTTAGGATTTAAATACAACTCTTGTTATTGTTCAACTTGGAGATTTAAAGGAAGCTTATAAATATTTCTAATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|5|5|1580088-1580377|CRISPRCasFinder
TTTTAAATACAACTCTTGTTATTGTTCAAC	GGATGCACTTTCTTTAAATATAAATAAAAAATCTAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	AACATCAAATTCCTACTTCACAATAATTTCATGTTG
ATTTAAATACAACTCTTGTTATTGTTCAAC	AAGAGTTGCACTTTTTTATATAATCTCTTTTAGG
ATTTAAATACAACTCTTGTTATTGTTCAAC	TTGGAGATTTAAAGGAAGCTTATAAATATTTCTA
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|5|4|1580088-1580377|CRT
TTTTAAATACAACTCTTGTTATTGTTCAAC	GGATGCACTTTCTTTAAATATAAATAAAAAATCTAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	AACATCAAATTCCTACTTCACAATAATTTCATGTTG
ATTTAAATACAACTCTTGTTATTGTTCAAC	AAGAGTTGCACTTTTTTATATAATCTCTTTTAGG
ATTTAAATACAACTCTTGTTATTGTTCAAC	TTGGAGATTTAAAGGAAGCTTATAAATATTTCTA
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|5|5|1580089-1580377|PILER-CR
TTTAAATACAACTCTTGTTATTGTTCAACG	GATGCACTTTCTTTAAATATAAATAAAAAATCTAAA
TTTAAATACAACTCTTGTTATTGTTCAACA	ACATCAAATTCCTACTTCACAATAATTTCATGTTGA
TTTAAATACAACTCTTGTTATTGTTCAACA	AGAGTTGCACTTTTTTATATAATCTCTTTTAGGA
TTTAAATACAACTCTTGTTATTGTTCAACT	TGGAGATTTAAAGGAAGCTTATAAATATTTCTAA
TTTAAATACAACTCTTGTTATTGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	unknown	unknown	gnl\|CDD\|234664
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	unknown	unknown	gnl\|CDD\|379303
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133382
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|366863
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	cas7b	pfam05107_cas7b_CAS-I-B:CAS-I-C	gnl\|CDD\|377458
NC_004557.1\|WP_035125177.1\|1571587_1572091_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	unknown	unknown	gnl\|CDD\|273359
NC_004557.1\|WP_155274218.1\|1589321_1589468_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|234750
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	unknown	unknown	gnl\|CDD\|377640
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	unknown	unknown	gnl\|CDD\|341459
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	cas8b1	mkCas0106_cas8b1_CAS-I-B	gnl\|CDD\|188234
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|224124
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	unknown	unknown	gnl\|CDD\|224029
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_035125175.1\|1573867_1574935_-\|tRNA-2-thiouridine(34)-synthase-MnmA	gnl\|CDD\|234664	PRK00143, mnmA, tRNA-specific 2-thiouridylase MnmA; Reviewed.	0
NC_004557.1\|WP_035109706.1\|1577339_1577690_-\|SdpI-family-protein	gnl\|CDD\|379303	pfam13630, SdpI, SdpI/YfhL protein family. This family of proteins includes the SdpI and YfhL proteins from B. subtilis. The SdpI protein is a multipass integral membrane protein that protects toxin-producing cells from being killed. Killing is mediated by the exported toxic protein SdpC an extracellular protein that induces the synthesis of an immunity protein.	5.45045e-10
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	1.00899e-162
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	3.10242e-112
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	gnl\|CDD\|366863	pfam01930, Cas_Cas4, Domain of unknown function DUF83. This domain has no known function. The domain contains three conserved cysteines at its C-terminus.	1.40975e-60
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	0.000961226
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	5.34287e-28
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.75114e-22
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	gnl\|CDD\|377458	pfam05107, Cas_Cas7, CRISPR-associated protein Cas7. CRISPR-associated protein Cas7 is one of the components of the type I-B cascade-like antiviral defense complex. In Haloferax volcanii, Cas5, Cas6 and Cas7 form a small complex that aids the stability of CRISPR-derived RNA.	6.79018e-48
NC_004557.1\|WP_023438394.1\|1569373_1570516_-\|iron-containing-alcohol-dehydrogenase	gnl\|CDD\|341459	cd08180, PDD, 1,3-propanediol dehydrogenase (PPD) catalyzes the reduction of 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol in glycerol metabolism. 1,3-propanediol dehydrogenase (PPD) plays a role in glycerol metabolism of some bacteria in anaerobic conditions. In this degradation pathway, glycerol is converted in a two-step process to 1,3-propanediol (1,3-PD) which is then excreted into the extracellular medium. The first reaction involves the transformation of glycerol into 3-hydroxypropionaldehyde (3-HPA) by a coenzyme B-12-dependent dehydratase. The second reaction involves the dismutation of the 3-hydroxypropionaldehyde (3-HPA) to 1,3-propanediol by the NADH-linked 1,3-propanediol dehydrogenase (PPD). The enzyme requires iron ion for its function. Because many genes in this pathway are present in the propanediol utilization (pdu) operon, they are also named pdu genes. PPD is a member of the iron-containing alcohol dehydrogenase superfamily. The PPD structure has a dehydroquinate synthase-like fold.	2.12677e-180
NC_004557.1\|WP_011099669.1\|1566901_1568017_-\|membrane-protein	gnl\|CDD\|273359	TIGR00950, Uncharacterized_inner_membrane_transporter_YicL, Carboxylate/Amino Acid/Amine Transporter. [Transport and binding proteins, Amino acids, peptides and amines].	0.00632714
NC_004557.1\|WP_023438397.1\|1576489_1577302_+\|hypothetical-protein	gnl\|CDD\|234750	PRK00409, PRK00409, recombination and DNA strand exchange inhibitor protein; Reviewed.	0.000256269
NC_004557.1\|WP_011099673.1\|1572395_1572800_+\|RDD-family-protein	gnl\|CDD\|377640	pfam06271, RDD, RDD family. This family of proteins contain three highly conserved amino acids: one arginine and two aspartates, hence the name of RDD family. This region contains two predicted transmembrane regions. The arginine occurs at the N-terminus of the first helix and the first aspartate occurs in the middle of this helix. The molecular function of this region is unknown. However this region may be involved in transport of an as yet unknown set of ligands (Bateman A pers. obs.).	1.24648e-05
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	gnl\|CDD\|188234	TIGR02591, cas_Csh1, CRISPR-associated protein Cas8b/Csh1, subtype I-B/HMARI. This domain is found in the C-terminal 2/3 of a family of CRISPR associated proteins of the Hmari subtype. Except for the two sequences from halophilic archaea this domain contains a pair of CXXC motifs.	3.00773e-90
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	1.29817e-29
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	5.17626e-07
NC_004557.1\|WP_011099676.1\|1574977_1576114_-\|cysteine-desulfurase	gnl\|CDD\|224029	COG1104, NifS, Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes [Amino acid transport and metabolism].	0
NC_004557.1\|WP_023438393.1\|1568460_1569291_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133382	cd01107, HTH_BmrR, Helix-Turn-Helix DNA binding domain of the BmrR transcription regulator. Helix-turn-helix (HTH) multidrug-efflux transporter transcription regulator, BmrR and YdfL of Bacillus subtilis, and related proteins; N-terminal domain. Bmr is a membrane protein which causes the efflux of a variety of toxic substances and antibiotics. BmrR is comprised of two distinct domains that harbor a regulatory (effector-binding) site and an active (DNA-binding) site. The conserved N-terminal domain contains a winged HTH motif that mediates DNA binding, while the C-terminal domain binds coactivating, toxic compounds. BmrR shares the N-terminal DNA binding domain with other transcription regulators of the MerR superfamily that promote transcription by reconfiguring the spacer between the -35 and -10 promoter elements.	4.10036e-38

>NC_004557.1|WP_011099679.1|1578401_1579985_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYMLERYLNKFKDYLVISISFEGIGDLIFQDEKVFSKEFLQIMSDSLLLNSQALSECLEEQKPHVENFIDLSRVITKFIVKAKRKVVLMIDEVDKSSNNQLFLSFLGLLRNKYLLRNVGKDYTFHNVILAGVHDVKSLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKEVNLDKEYFAEKIYFYTSGYPFLVSKLCKIVDEKIMVKDELKWEKEYLQIAVKELLKESNTNFDSLIKNIENNKDLQELVRKIILDGYEITYNEDNPLITMGVTYGIFKNSHGKVKIHNRIYEQRIYNYMISLIETKINLGFYTERERYLKPNGDLDIKKVLKKFQEFMKHEYSQKREGFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLKQLVEYLNQYGLEEGYLLIFDFRKATNLIGQVEETHINAEDNIKKIIGVYC
>NC_004557.1|WP_035109706.1|1577339_1577690_-|SdpI-family-protein
MNILTNCIIGFIFIVIGLVLRAYPPQHINNSLGYRTPFSIKNKDTWYEGNRFCGTILLISSIIFIPFSILIKYLYSNNLNLSMGISSLSLLIIIIIGIVYTEIHLRMMFDKNGTRK
>NC_004557.1|WP_023438397.1|1576489_1577302_+|hypothetical-protein
MFKSLSKKVIISVVILIVVLLGVLGMKNYNKSKDYKNLVTTANEYMNEKDYDKAMDKFKESLDYKKDQKAEEKLEECKNELINLSKEALKNKEYEKADNYLNVLLKHDGKNEEAIKMKNTIKDEIQKSKEEEEIKKAIEKEKREQELKKQMDKEEQAKKKTGITEQNKKKEVKENNKITKEKAESLVQPLKNKNEEIRYLGTRQVPEIPAKSTPYKKFPKEIENKKVYIFDIAVVYNSDSKATIGRYYVDFSGNIYKDTYPSNLECVKVK
>NC_004557.1|WP_011099676.1|1574977_1576114_-|cysteine-desulfurase
MKKNIYMDYAATTYIKKEVIEAMMPYLTEYYANPSSVYNMSNNLKIVIDEAKEEIADFIGATPEEVFFTSGGTEGNNWAIKGIAYANEEKGKHIITSSIEHPAVLNSCKYLKEKGFEITFLPVDSYGKVDLEKLEKSIRNDTILVSIMAANNEIGTIQHIKSIGEICKRHKVLFHTDAVQALGHIPINAEEMDIDLMTIAAHKIYGPKGIGALYIKKGTKIENILHGGSQERGKRPGTENTAAIVGFKKAVSLLKENGLEESKRIEKLRDKFIKGLLQIENTKINGAMGKERLKGNVNVSFKNIDGELLLMLLDREGIYASAGSACSAGSIDASHVLVALGLEDEFLKGTIRFTLGARNTEEEVDFVLEKLNQLIKKI
>NC_004557.1|WP_035125175.1|1573867_1574935_-|tRNA-2-thiouridine(34)-synthase-MnmA
MKKKVLVGMSGGVDSSVAAYLLKEQGYEVIGATMQIWQDDKEFIEREGGCCSLSAVADARRVANKIGIPFYVMNFKDAFKKNVIDYFVDEYMEGRTPNPCVACNKFIKFSSFLDKAMTLGIDYVATGHYAIIEKQNNRYIVRKSEDDKKDQTYALYNLTQFQLERTLMPCGRYKKSEIREIAKKIGLRVHNKKDSQEICFIPDNDHGKYIKNRFPSKVRQGNFVDKSGNVLGTHKGIVYYTIGQRKGLDIALGKPMYVVDINPFRNEVVLGNLDDLLNTELIAKDVNYIPFDNLKEPMEVEAKIRYSQIPSKAVITPMENDKVKVNFTEKQRAITKGQSVVFYKGDLLIGGGIIE
>NC_004557.1|WP_011099673.1|1572395_1572800_+|RDD-family-protein
MVLIIINFNRTVLYRIIASFIDDSALLLLYMFFTNIINKNNSSFVYVLLLLVSFISIEICFFIKSTSLGKFIMGLKVIDKTSSLELGFIKMLIRETFGKVLSNILFIGNIYILFNDSNQGFHDKLVNSIVIEND
>NC_004557.1|WP_035125177.1|1571587_1572091_-|hypothetical-protein
MNKTKKLPIIILLAVIVMFSGVNIYRRIDANRLKSKKTSISCIERIKDEKFNDNNVSFSFKKLNGVWQLLLLDSKKDDEITIINNSKIDEGKFYIGVLNSENEIIAFDKEKQDKITFVTPEEGCYLVRILAKNSSGKCDVKVDSKKGIDLNYNSINGHNMGLLEKNN
>NC_004557.1|WP_023438394.1|1569373_1570516_-|iron-containing-alcohol-dehydrogenase
MKEFSINTDVYFGEGSLDRLNEIKNKRVLIVCDKFMETSGMVTKVQQKLTDCEVTIYSDIVPDPSVEVIASGIQKLQSCNAQIIIALGGGSSIDGAKAIKEYSKKVTGKTINIEEFYAIPTTSGTGSEVTEYAVITNKQEGLKYAITDKSLLPTVAILDPQLVKSVPKAITADTGMDVITHALEAYVSKNATDFSDALAEKAFTLAFRFLPQAYADGEDIIAREKLHNASCLAGMAFNAAGLGITHSLAHAVGGKLHISHGRSNAIILPYVVEYNANLNKESFNAEYSIAAKKYQRLAKLLKLHAPNVTIGVNNLIKSIVKLQNTLMIPQTLKQQREDINLDETSKEEIINAALRDVCTTSNPRETKKEDFLKILDKVLG
>NC_004557.1|WP_023438393.1|1568460_1569291_-|MerR-family-transcriptional-regulator
MKEELYSIGKVGEICKITKKALRYYDKMDILSPDKVSDESGYRYYSKKTLLSVPMIKYYKQSGFKLEEMKVFLEGETYDFFHKSFRNKIDELKELEKEINLKIRSVKDWDDLIVEAQNVIENNVCDVAIKYIDNKTLTFLDQEFKYDYMDSIINIEFTNYIDSIENAITGPVIIRFPCHEDKMNGKCTKMRIMQETILKCKEELSVEFGGWMAAACYHIGPHETISDTYKKIKEWTKEHGYICFEECYERYVTDYWTTKNTDKFVTEILIKISRER
>NC_004557.1|WP_011099669.1|1566901_1568017_-|membrane-protein
MSENSKTVSLEAIAAKKKLSSDFFKKGISLALFSGLAYGLYTAFLTMGMTKGVWGDWYGDNTAGLSVFVIAYLLAALGNAINDTCSAIWSLLYAVVKGKFGDFLRCINTKPGRIMILAALIGGPIASTAYVIALQMAGSIVVPISALCPAIAAILGKVLYKQELNKRMAFGIVICVCASFLIGSTGFTSDGISRNTLLGLLIAIIAALGWGFEGCVAGYGTAMIDPEIGICIRQVTAGIADLCILLPVLGMMAGGINISVDLTMQAFTSAPAMIWFTLSGLLTFMTFMTWYAGNSMCGAGLGTACNGTYSFFGPLFCLLVLGVYGGMDGWALPTVAWIGAVVMIIGILIISMNPLDLFKRKKMEVDVDETA
>NC_004557.1|WP_023438399.1|1580562_1580853_-|CRISPR-associated-endonuclease-Cas2
MSKNFNYNYAFVFYDVNEKRVNRVFKTCKKYLSHFQKSVFRGELTPANFILLKKDLNKVINEDEDFICIIKLMNNKVYDEEILGNPHSCTGEDLIL
>NC_004557.1|WP_011099680.1|1580853_1581852_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYITSVGELKRKDNSLCFRKNNKNVYIPVENTKEIYCMSEVNINSKLLDFLSQNNIIMHFFNYYEGYSGTFYPREHYNSGKLLVKQVETYENRRLEVAKSIVEAIGDNIYELLYHYYKHDKKEVKETLDWIKNHSKINLKKANDIKQIMQVEGETWQRFYGEFKNILPEEFVMNKRVKRPPDNPINALISFGNTLLYGKTITAIYNTHLDQRISFLHEPSEGRFSLSLDISEAFKPVIVFKTIFDLVNNKRIQVSKHFDKKLNYCLLNDEGRNIFITAFEERMESIFLNEKLKRKISYKTAIKLDCYKLIKFILENKEFKPFSLKERM
>NC_004557.1|WP_011099681.1|1581861_1582353_-|CRISPR-associated-protein-Cas4
MKVNGTLVNYYFHCKRQCWLHGNRINLEDNSQDVKIGKAIHEVKKEKGKQTEISIDNIKIDKITKDYLTEVKKSDSDIEAAKWQLLLYLKVLKDKGIERKGKLEFIEKNKSKSTIIIELDENNLSELEDVIKNIENLLIQENPPEVINESKCKKCAYFEYCYI
>NC_004557.1|WP_011099682.1|1582361_1584962_-|CRISPR-associated-helicase/endonuclease-Cas3
MYFNNIEKVNLENIIENNDKIYAHIHNGRKETLKEHSDLALKYLYKISERKSLDNVFLKIENNFLEKCSNEEKMVYRKMLLNTIYMHDLGKINCNFQRKKMANKIFKEEKMSSTNHSMLSSIIYINHFLKEIASIENGEHIKLLIAFLLLNSYVISKHHGAFNSVNKFKEKLVYDGEEGKDLYTKYMYIFDKVYKEEIIINESLIKEDLFDMYKSTIQEKTEENKDFPVELYIYERFLASLLLSCDYYSTSEFKNQKEVEEFGEIKNIEKFYKSFKSTEVYNWIRKYEKNDYGKTDDFSNIDDINVLRNELFLDAEKTMVSNIDKDIFYLEAPTGSGKSNVSFNLSFKMVERFKEINKIFYVYPFNTLVEQNIKTLEKIFKNNEIMKDIAIINSVVPIKIKSSKDNKIKEIDTNEESDILNEDYERALLDRQFLHYPIVLTTHVSIFNYLFGTSKDNLFPLCQIANSIIVLDEIQSYKNRIWKEIITFLACYSRLLNIKIIIMSATLPNLNKLVDGEIKTVNLIENRKKYFENPIFKNRVMVDFSLLEEKENIKEVLFNNVIKNTKAPNKNILVEFITKESAMDFYEKLKDYNKYLQESEKREIELITGDDNRVERNRIIDKIKSQKNIILVATQVIEAGVDIDMDIGYKDISMLDSEEQFLGRINRSCKNDEQGIVYFFDLDLASHVYKRDIRKQKNINLTCPKIREILINKNFQEFYDYVIKELNKKAGEYNNSSFQTFFLDKVKMLNFKEIEERMKLIDELYENNVFLNRNITLENEEELCGEDVWNEYIAILKNNKLDYAEKKIKLSQVTAKLNYFIYQISSDDFIYEDRVGDIYYIGDGEKYFEDGKFDRKKFKSIVADII
>NC_004557.1|WP_011099683.1|1585018_1585789_-|type-I-B-CRISPR-associated-protein-Cas5
MDALKFSLSGRTAFFKKPDVNSFFYFTYGNVHKVALLGILGAICGYGGYNSQCLNKEQIYPEFYEKLKDINIGVVPKNEKGYIDKKIQVFNNSVGYASKELGGNLIVKEQWLENPKWAIYILMDENVPKDLKDRLLNFKFKYIPYLGKNDHMANITDVEYLENIEKLDNTNKLDSIFIKDKYEIQKESKNFNDLKNIIKKSSSKIQEFKYEEMLPISLEETTNKYNLETFIYTNSNLKPLADTKTYKCGDKNIFFF
>NC_004557.1|WP_011099684.1|1585792_1586752_-|type-I-CRISPR-associated-protein-Cas7
MGMNKRVYGVLGIVSRMSNWNADFTGYPKTTSSGDVFGSDKAFKYPMKKMWENGGEKVLYIKSIKFQENKKKERELIPRTLKERYEYIFDVEDLKKNKDSEEVLKNLFTAVDVKNFGATFAEEGNNISITGAVQIGQGFNKYKETYAEEQQILSPFRDPNQKEKSKDGEEAKSSTLGTKIVSNEAHYFYPLTVNPSAYSQFEEIGVTNGYTEEDYEKFKETSMIAATSFNTNSKIGCENEFALFVETKEDLYLPDLSQYVDFEKVEDKNIIILSCSELLNSFENEIENIEIYYNSYTTEIKSDEIKKAKKFNIFTKKEV
>NC_004557.1|WP_011099685.1|1586757_1588497_-|type-I-B-CRISPR-associated-protein-Cas8b/Csh1
MLKDVISIFKREYEKIGDRYVTESYIPSDGEYIIVDTFENDFKILDKVIIKKDRKTQKIDDSNQYFPFIREADYLSRLLDMNKPIDHKKIIHSNNYLSFFIKKENVNNGKLSDEIIDRYYEILKDPLIKYKNTKAEKLYEEVEEEHGKVNEKLIDEIKNWIKEKIHDFVDKGSKEKEYLKIFFKYDLDKYRKESEKYISPNLYNSNDYNVKIKEEIYGLPNDNMGLNSKKPYLENKTRKSKVPYLISKEEVLIQKKFFDYLMNQVAIGKSNIYINEKGIKGISNKETLGEDFTGYYLRIQKGKEVEIHNFDTIVNYRAKIEPFKLENVLELEKSELNYNVFIYEIGKLKDLIDNVFFYKFLSGNFFTKAEDLNINDATLKRSILLSRDTLFTWFYKGVDNNTWNNLNISSLNLIKGSINKRYLLKAGEQFNLRCSLKNYFEGGISMADVLLEVKNSLREKINKTVKENKNHEDVTLDNDREYYFAVGQLAYYLISLSKSKNKSHSLVNPIINAKTNERIKDEIRRLYTRYNYRIEFGSKRVERLYSMISSYVPKGKINGDLIIAGFLKNNLIYEKSEEE
>NC_004557.1|WP_011099686.1|1588509_1589202_-|CRISPR-associated-endoribonuclease-Cas6
MKIYELTLKVFLLKDIKSDESLEKISNLIDKSLSKDGKLLDFHERNTYKNYTFNSLYPIEKDKIYNEGKIYSVQIRTVDESLIQYFKKNLTNEYTEYIKALTLECRVIPQRYIEKIYSITPVIIKTEKGYWKGNLSLGEFEERIKNNLIKKYNSFFNTKIDERFTLFRTINLINNKPISCSYKDINILGDKITLIIDENEMAQKLACFSLGSGVGEMNARGYGFVNYKWL
>NC_004557.1|WP_155274218.1|1589321_1589468_-|hypothetical-protein
MKKKLKFSISATYEDLKEKERIEIDDIIYIIELVSVITLILKIFQFIN
>NC_004557.1|WP_011099687.1|1590319_1591906_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYLLEKRLNHMKEYLPIKISFEAIDTEGYSKVEKFLSSIMMQIVNYFRFSTNKEMYKFIKNCENQITNMNDFNSFITDLVEFSEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKKVNLDKEYFAKKIYFYTSGYPFLVSKLCKIIDEKIMVEDELKWEKEYLELAVKELLKESNTNFDSLIKNIENNKELSQIIDNILIKGTRINFNIHNPDINLGYLYGIFKNNKGNLEINNRIYEQLIYEYRISKIQTASNFLNYNLKENFIKCNGDLDITKVLIKFQEFMKHEYSQKRDAFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNEKMYILELKIWRGEEYHKKGLKQLGEYLNQYGLEEGYLLIFDFRKATNLIGKTEETHVNAEDNIKKIIEVYC

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_004557_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_6

1589679-1590034

TypeI-B

III-B

Consensus_repeat	Method
ATTTAAATACATCCTATGTTAAGGTTCAAC	CRISPRCasFinder

5 spacers

cas6,cas8b1,cas7b,cas5,cas3,cas4,cas1,cas2

The CRISPR arrays of NC_004557_6

>merge|NC_004557|6|1589679-1590034|CRISPRCasFinder
TTTTAAATACACATAATGTTAAGGTTTAACGATATCTCCTATTATAACTAGTATTGCCAATAATCCTATTTAAATACATCCTATGTTAAGGTTCAACATTAACCACAAATAACCAAAGATTTTACCTTATTTGATTTAAATACATCCTATGTTAAGGTTCAACATAAGTGGAAATGAAGGTAGAGTATGGGTTAACACATTTAAATACATCCTATGTTAAGGTTCAACCTTTCTCTGTTATTTCTTCATCTTCATATTTTAAATTTAAATACATCCTATGTTAAGGTTCAACCTTTCTCTGTTATTTCTTCATCTTCATATTTTAAATTTAAATACATCCTATGTTAAGGTTCAAC

>NC_004557|6|6|1589679-1590034|CRISPRCasFinder
TTTTAAATACACATAATGTTAAGGTTTAAC	GATATCTCCTATTATAACTAGTATTGCCAATAATCCT
ATTTAAATACATCCTATGTTAAGGTTCAAC	ATTAACCACAAATAACCAAAGATTTTACCTTATTTG
ATTTAAATACATCCTATGTTAAGGTTCAAC	ATAAGTGGAAATGAAGGTAGAGTATGGGTTAACAC
ATTTAAATACATCCTATGTTAAGGTTCAAC	CTTTCTCTGTTATTTCTTCATCTTCATATTTTAA
ATTTAAATACATCCTATGTTAAGGTTCAAC	CTTTCTCTGTTATTTCTTCATCTTCATATTTTAA
ATTTAAATACATCCTATGTTAAGGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_023438413.1\|1593443_1594592_-\|polysaccharide-deacetylase	unknown	unknown	gnl\|CDD\|213022
NC_004557.1\|WP_011099690.1\|1596261_1596732_-\|DUF4829-domain-containing-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099691.1\|1596866_1597955_-\|amidase-domain-containing-protein	unknown	unknown	gnl\|CDD\|378910
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	cas7b	pfam05107_cas7b_CAS-I-B:CAS-I-C	gnl\|CDD\|377458
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_011099693.1\|1598677_1599271_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|366863
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	cas8b1	mkCas0106_cas8b1_CAS-I-B	gnl\|CDD\|188234
NC_004557.1\|WP_011099692.1\|1598119_1598677_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_041744712.1\|1595394_1595637_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_004557.1\|WP_035125168.1\|1599281_1600583_-\|S41-family-peptidase	unknown	unknown	gnl\|CDD\|367567
NC_004557.1\|WP_155274218.1\|1589321_1589468_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_035125170.1\|1595605_1595929_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_023438420.1\|1600700_1600883_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|224124

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_023438413.1\|1593443_1594592_-\|polysaccharide-deacetylase	gnl\|CDD\|213022	cd10917, CE4_NodB_like_6s_7s, Catalytic NodB homology domain of rhizobial NodB-like proteins. This family belongs to the large and functionally diverse carbohydrate esterase 4 (CE4) superfamily, whose members show strong sequence similarity with some variability due to their distinct carbohydrate substrates. It includes many rhizobial NodB chitooligosaccharide N-deacetylase (EC 3.5.1.-)-like proteins, mainly from bacteria and eukaryotes, such as chitin deacetylases (EC 3.5.1.41), bacterial peptidoglycan N-acetylglucosamine deacetylases (EC 3.5.1.-), and acetylxylan esterases (EC 3.1.1.72), which catalyze the N- or O-deacetylation of substrates such as acetylated chitin, peptidoglycan, and acetylated xylan. All members of this family contain a catalytic NodB homology domain with the same overall topology and a deformed (beta/alpha)8 barrel fold with 6- or 7 strands. Their catalytic activity is dependent on the presence of a divalent cation, preferably cobalt or zinc, and they employ a conserved His-His-Asp zinc-binding triad closely associated with the conserved catalytic base (aspartic acid) and acid (histidine) to carry out acid/base catalysis. Several family members show diversity both in metal ion specificities and in the residues that coordinate the metal.	0.000167005
NC_004557.1\|WP_011099691.1\|1596866_1597955_-\|amidase-domain-containing-protein	gnl\|CDD\|378910	pfam12671, Amidase_6, Putative amidase domain.	1.42235e-30
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	1.00899e-162
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	3.10242e-112
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	gnl\|CDD\|377458	pfam05107, Cas_Cas7, CRISPR-associated protein Cas7. CRISPR-associated protein Cas7 is one of the components of the type I-B cascade-like antiviral defense complex. In Haloferax volcanii, Cas5, Cas6 and Cas7 form a small complex that aids the stability of CRISPR-derived RNA.	6.79018e-48
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	0.000961226
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	5.34287e-28
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	gnl\|CDD\|366863	pfam01930, Cas_Cas4, Domain of unknown function DUF83. This domain has no known function. The domain contains three conserved cysteines at its C-terminus.	1.40975e-60
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	gnl\|CDD\|188234	TIGR02591, cas_Csh1, CRISPR-associated protein Cas8b/Csh1, subtype I-B/HMARI. This domain is found in the C-terminal 2/3 of a family of CRISPR associated proteins of the Hmari subtype. Except for the two sequences from halophilic archaea this domain contains a pair of CXXC motifs.	3.00773e-90
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.75114e-22
NC_004557.1\|WP_035125168.1\|1599281_1600583_-\|S41-family-peptidase	gnl\|CDD\|367567	pfam03572, Peptidase_S41, Peptidase family S41.	1.35691e-25
NC_004557.1\|WP_011099679.1\|1578401_1579985_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	5.17626e-07
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	1.29817e-29

>NC_004557.1|WP_155274218.1|1589321_1589468_-|hypothetical-protein
MKKKLKFSISATYEDLKEKERIEIDDIIYIIELVSVITLILKIFQFIN
>NC_004557.1|WP_011099686.1|1588509_1589202_-|CRISPR-associated-endoribonuclease-Cas6
MKIYELTLKVFLLKDIKSDESLEKISNLIDKSLSKDGKLLDFHERNTYKNYTFNSLYPIEKDKIYNEGKIYSVQIRTVDESLIQYFKKNLTNEYTEYIKALTLECRVIPQRYIEKIYSITPVIIKTEKGYWKGNLSLGEFEERIKNNLIKKYNSFFNTKIDERFTLFRTINLINNKPISCSYKDINILGDKITLIIDENEMAQKLACFSLGSGVGEMNARGYGFVNYKWL
>NC_004557.1|WP_011099685.1|1586757_1588497_-|type-I-B-CRISPR-associated-protein-Cas8b/Csh1
MLKDVISIFKREYEKIGDRYVTESYIPSDGEYIIVDTFENDFKILDKVIIKKDRKTQKIDDSNQYFPFIREADYLSRLLDMNKPIDHKKIIHSNNYLSFFIKKENVNNGKLSDEIIDRYYEILKDPLIKYKNTKAEKLYEEVEEEHGKVNEKLIDEIKNWIKEKIHDFVDKGSKEKEYLKIFFKYDLDKYRKESEKYISPNLYNSNDYNVKIKEEIYGLPNDNMGLNSKKPYLENKTRKSKVPYLISKEEVLIQKKFFDYLMNQVAIGKSNIYINEKGIKGISNKETLGEDFTGYYLRIQKGKEVEIHNFDTIVNYRAKIEPFKLENVLELEKSELNYNVFIYEIGKLKDLIDNVFFYKFLSGNFFTKAEDLNINDATLKRSILLSRDTLFTWFYKGVDNNTWNNLNISSLNLIKGSINKRYLLKAGEQFNLRCSLKNYFEGGISMADVLLEVKNSLREKINKTVKENKNHEDVTLDNDREYYFAVGQLAYYLISLSKSKNKSHSLVNPIINAKTNERIKDEIRRLYTRYNYRIEFGSKRVERLYSMISSYVPKGKINGDLIIAGFLKNNLIYEKSEEE
>NC_004557.1|WP_011099684.1|1585792_1586752_-|type-I-CRISPR-associated-protein-Cas7
MGMNKRVYGVLGIVSRMSNWNADFTGYPKTTSSGDVFGSDKAFKYPMKKMWENGGEKVLYIKSIKFQENKKKERELIPRTLKERYEYIFDVEDLKKNKDSEEVLKNLFTAVDVKNFGATFAEEGNNISITGAVQIGQGFNKYKETYAEEQQILSPFRDPNQKEKSKDGEEAKSSTLGTKIVSNEAHYFYPLTVNPSAYSQFEEIGVTNGYTEEDYEKFKETSMIAATSFNTNSKIGCENEFALFVETKEDLYLPDLSQYVDFEKVEDKNIIILSCSELLNSFENEIENIEIYYNSYTTEIKSDEIKKAKKFNIFTKKEV
>NC_004557.1|WP_011099683.1|1585018_1585789_-|type-I-B-CRISPR-associated-protein-Cas5
MDALKFSLSGRTAFFKKPDVNSFFYFTYGNVHKVALLGILGAICGYGGYNSQCLNKEQIYPEFYEKLKDINIGVVPKNEKGYIDKKIQVFNNSVGYASKELGGNLIVKEQWLENPKWAIYILMDENVPKDLKDRLLNFKFKYIPYLGKNDHMANITDVEYLENIEKLDNTNKLDSIFIKDKYEIQKESKNFNDLKNIIKKSSSKIQEFKYEEMLPISLEETTNKYNLETFIYTNSNLKPLADTKTYKCGDKNIFFF
>NC_004557.1|WP_011099682.1|1582361_1584962_-|CRISPR-associated-helicase/endonuclease-Cas3
MYFNNIEKVNLENIIENNDKIYAHIHNGRKETLKEHSDLALKYLYKISERKSLDNVFLKIENNFLEKCSNEEKMVYRKMLLNTIYMHDLGKINCNFQRKKMANKIFKEEKMSSTNHSMLSSIIYINHFLKEIASIENGEHIKLLIAFLLLNSYVISKHHGAFNSVNKFKEKLVYDGEEGKDLYTKYMYIFDKVYKEEIIINESLIKEDLFDMYKSTIQEKTEENKDFPVELYIYERFLASLLLSCDYYSTSEFKNQKEVEEFGEIKNIEKFYKSFKSTEVYNWIRKYEKNDYGKTDDFSNIDDINVLRNELFLDAEKTMVSNIDKDIFYLEAPTGSGKSNVSFNLSFKMVERFKEINKIFYVYPFNTLVEQNIKTLEKIFKNNEIMKDIAIINSVVPIKIKSSKDNKIKEIDTNEESDILNEDYERALLDRQFLHYPIVLTTHVSIFNYLFGTSKDNLFPLCQIANSIIVLDEIQSYKNRIWKEIITFLACYSRLLNIKIIIMSATLPNLNKLVDGEIKTVNLIENRKKYFENPIFKNRVMVDFSLLEEKENIKEVLFNNVIKNTKAPNKNILVEFITKESAMDFYEKLKDYNKYLQESEKREIELITGDDNRVERNRIIDKIKSQKNIILVATQVIEAGVDIDMDIGYKDISMLDSEEQFLGRINRSCKNDEQGIVYFFDLDLASHVYKRDIRKQKNINLTCPKIREILINKNFQEFYDYVIKELNKKAGEYNNSSFQTFFLDKVKMLNFKEIEERMKLIDELYENNVFLNRNITLENEEELCGEDVWNEYIAILKNNKLDYAEKKIKLSQVTAKLNYFIYQISSDDFIYEDRVGDIYYIGDGEKYFEDGKFDRKKFKSIVADII
>NC_004557.1|WP_011099681.1|1581861_1582353_-|CRISPR-associated-protein-Cas4
MKVNGTLVNYYFHCKRQCWLHGNRINLEDNSQDVKIGKAIHEVKKEKGKQTEISIDNIKIDKITKDYLTEVKKSDSDIEAAKWQLLLYLKVLKDKGIERKGKLEFIEKNKSKSTIIIELDENNLSELEDVIKNIENLLIQENPPEVINESKCKKCAYFEYCYI
>NC_004557.1|WP_011099680.1|1580853_1581852_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYITSVGELKRKDNSLCFRKNNKNVYIPVENTKEIYCMSEVNINSKLLDFLSQNNIIMHFFNYYEGYSGTFYPREHYNSGKLLVKQVETYENRRLEVAKSIVEAIGDNIYELLYHYYKHDKKEVKETLDWIKNHSKINLKKANDIKQIMQVEGETWQRFYGEFKNILPEEFVMNKRVKRPPDNPINALISFGNTLLYGKTITAIYNTHLDQRISFLHEPSEGRFSLSLDISEAFKPVIVFKTIFDLVNNKRIQVSKHFDKKLNYCLLNDEGRNIFITAFEERMESIFLNEKLKRKISYKTAIKLDCYKLIKFILENKEFKPFSLKERM
>NC_004557.1|WP_023438399.1|1580562_1580853_-|CRISPR-associated-endonuclease-Cas2
MSKNFNYNYAFVFYDVNEKRVNRVFKTCKKYLSHFQKSVFRGELTPANFILLKKDLNKVINEDEDFICIIKLMNNKVYDEEILGNPHSCTGEDLIL
>NC_004557.1|WP_011099679.1|1578401_1579985_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYMLERYLNKFKDYLVISISFEGIGDLIFQDEKVFSKEFLQIMSDSLLLNSQALSECLEEQKPHVENFIDLSRVITKFIVKAKRKVVLMIDEVDKSSNNQLFLSFLGLLRNKYLLRNVGKDYTFHNVILAGVHDVKSLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKEVNLDKEYFAEKIYFYTSGYPFLVSKLCKIVDEKIMVKDELKWEKEYLQIAVKELLKESNTNFDSLIKNIENNKDLQELVRKIILDGYEITYNEDNPLITMGVTYGIFKNSHGKVKIHNRIYEQRIYNYMISLIETKINLGFYTERERYLKPNGDLDIKKVLKKFQEFMKHEYSQKREGFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLKQLVEYLNQYGLEEGYLLIFDFRKATNLIGQVEETHINAEDNIKKIIGVYC
>NC_004557.1|WP_011099687.1|1590319_1591906_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYLLEKRLNHMKEYLPIKISFEAIDTEGYSKVEKFLSSIMMQIVNYFRFSTNKEMYKFIKNCENQITNMNDFNSFITDLVEFSEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKKVNLDKEYFAKKIYFYTSGYPFLVSKLCKIIDEKIMVEDELKWEKEYLELAVKELLKESNTNFDSLIKNIENNKELSQIIDNILIKGTRINFNIHNPDINLGYLYGIFKNNKGNLEINNRIYEQLIYEYRISKIQTASNFLNYNLKENFIKCNGDLDITKVLIKFQEFMKHEYSQKRDAFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNEKMYILELKIWRGEEYHKKGLKQLGEYLNQYGLEEGYLLIFDFRKATNLIGKTEETHVNAEDNIKKIIEVYC
>NC_004557.1|WP_023438413.1|1593443_1594592_-|polysaccharide-deacetylase
MRRKNKFGVILFLMIIITALSIILSDSRGSRQFIKSQKSENMASKNEKNKKKIKSEKYNGEMEFYNGEIEHLFFHPLILDKKAAFTGPKWHTDNMDNWLVTVEESKKVINSLYSKGYILIDPNSLYEEYESDGKKLFRKKPLKVPKGKKPLILSIDDLSYNEGMRKATALKLILDENGNLATYRKDQNGKEIIGYDEIVMILDRFVKEHPDFSLNGAKGVIALTGYEGVFGYRTNLDSKNREEEAKKAKVIANKLKENGWKFASHSYGHLDNAKIPFQTLKRDADKWEQLVKPIIGHTSIYVYPHGTAIKTNSEKFKYLQSKGFKIFYSVDSYLGERISENDLVVEGGRMPIDGLSMRNRREAFLKFFDAKEVLDLESRPKR
>NC_004557.1|WP_041744712.1|1595394_1595637_-|hypothetical-protein
MQLNPTQVVCSSINALEGNVVDIEKELNAKANQEYFHKLVKLDKHADSIIKFISELNCTESLSNDATYMLMNDLVERIKL
>NC_004557.1|WP_035125170.1|1595605_1595929_-|hypothetical-protein
MFNTADSEISEIITAAIHDSSGIGSEDTSSLKFMILEGDWNNKEIPQCFEGIKSAGESGKIQVLSRGKNLFTKDSIYYLNVVTGKTIRNPSKFVSSSIAVKPNTSCM
>NC_004557.1|WP_011099690.1|1596261_1596732_-|DUF4829-domain-containing-protein
MKKSYMMIIMISILFGVKLIYSNSAESIIKEYYKVIDSQQDVGKYNKLVIEDERLKNLEGIPDIVEKRDILELKKLNVNEHPLLEKELNYKYADEKDNVRYYMIKYDIKFKENVATPVDSGIYYEVITVVKRKNKWLVTTDIRKASFHNDKLTIDS
>NC_004557.1|WP_011099691.1|1596866_1597955_-|amidase-domain-containing-protein
MKKKLMKLKSKLDYGSLKNAYIIKGDEITNEDINALIDNYFNWIYENLINNTIGELQNIVGNNKLAEFKKSKLKWLINWYGKKDEEIKDYKIYTEINDVDINGNIIYINVIYGEDLILKSSSDIVQKIRNQEHKILAKNVGSKLVIIHDYYNDELADEMFLVSDREFKTNKKVKSINKKLEKKTLEINKNIKKIDKLVKQYKRNLHNTLQINNIQERKYPGYDGIAAAKYAVKYAINYNPEYQDYNGRGGDCTNFISQCIYAGGIPTDNVWYKDSHAWIRVVELRSWLLKKGYARELTVQDNAKKGDLIQLRNSGGYWYHSLIVTYKNSSNGELFVSCHTGDYVNRALSTYTTDRRYLILTS
>NC_004557.1|WP_011099692.1|1598119_1598677_+|hypothetical-protein
MIKTKKKVFANVSFTVLLLVLINTSVFAAYPSKATMDNTWGFEKGDSTEKQLIYHQHGDLDWKGHVDFAMNEININPADISCYYGTSEDLANIVVTSNYWPDATWSGSTYAPIGLEPKTIELNSSAELTDWQRDAVTTHEFVHIWGINDSRNKNSISYGFTPVNYRTITDDVTTLLKNRYNEEVK
>NC_004557.1|WP_011099693.1|1598677_1599271_+|hypothetical-protein
MIKKISVILALTGVINTNSALSTPPSKVNEPIKPKASASYMEIDGLKELKAKSDIIVEVEGTDKFELIDYKGIKMRKTTVKILDVMKGNPTLKEITVVQTEGLESEEPPMKNEKLLMFLRKGIDITDSYVPIGGNQGIYKIITKKTKKNSMTPKKLPHLNAPKDDAIKIVTPTSLINNKILRDLNGNYDDIKKKLIE
>NC_004557.1|WP_035125168.1|1599281_1600583_-|S41-family-peptidase
MKRFKKITILAVVLIILILSKSFIGKAYYKKNAPEHIKNFSKKEALEDYDYMWNVLERNYPCFNVIERKHGVTIKDIKNGYRKRIENRENVDFKYFNMILNKSINKFSNVGHLYVMDFNFYIMLRGTFDAIGKNEIGGIVKNNFEMAINKKTEETYKHIYNISYGKKILKNLNFTNISNKLYDNKNLSFKEIDKDTAYIKINNFYHYNIANDKDKLINFYRKNSDKKNLVIDLTENRGGADSYWMTSIVAPNIDKELKLYNQYALYKNGDIVNDQWVKKHGNNEYREITKDFSEVLKLSKIRKEDLKDLKYLEISKSIPYNVKPSSKEKLFKGKIYVLVSEQVQSSGEDFVEYCKNTKFATLIGTTTGGNSPAMSPVYDVLPNSGLMLSYQIDYKLNPDGTCNTEFGLPPDIVSKENEEPLDTFKRVILEKKL
>NC_004557.1|WP_023438420.1|1600700_1600883_+|hypothetical-protein
MILLLISMLSSKIFDIIFFNLLGETTGTLGSIIGFVLPYSIALEIILKKLFFEPSSKDSK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_004557_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_7

1592009-1592427

TypeI-B

III-B

Consensus_repeat	Method
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRISPRCasFinder
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRT
ATTTAAATACAACTCTTGTTATTGTTCAAC	PILER-CR

6 spacers

cas6,cas8b1,cas7b,cas5,cas3,cas4,cas1,cas2

The CRISPR arrays of NC_004557_7

>merge|NC_004557|7|1592009-1592427|CRISPRCasFinder,CRT,PILER-CR
TTTTAAATACAACTCTTGTTATTGTTCAACGTGCTGCACTTCTAGAACTTAAATTACATTCCTTTATTTAAATACAACTCTTGTTATTGTTCAACATATAGAGAAATCACTTAAAATAATAGAATTTGCATTTAAATACAACTCTTGTTATTGTTCAACAAAATAAAAGGAAGTGGTAATATAGTGAAAACATATTTAAATACAACTCTTGTTATTGTTCAACATCGACTAAAGATTATATTTGGGGGTAAGATAAAATTTAAATACAACTCTTGTTATTGTTCAACGAATGCTACACAATTTGCTAACAATGCTATGAATGAATTTAAATACAACTCTTGTTATTGTTCAACGCATCAAACATAGTTACAGCAATTGTAGTTACAAAGATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|7|7|1592009-1592427|CRISPRCasFinder
TTTTAAATACAACTCTTGTTATTGTTCAAC	GTGCTGCACTTCTAGAACTTAAATTACATTCCTTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ATATAGAGAAATCACTTAAAATAATAGAATTTGC
ATTTAAATACAACTCTTGTTATTGTTCAAC	AAAATAAAAGGAAGTGGTAATATAGTGAAAACAT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ATCGACTAAAGATTATATTTGGGGGTAAGATAAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	GAATGCTACACAATTTGCTAACAATGCTATGAATGA
ATTTAAATACAACTCTTGTTATTGTTCAAC	GCATCAAACATAGTTACAGCAATTGTAGTTACAAAG
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|7|5|1592009-1592427|CRT
TTTTAAATACAACTCTTGTTATTGTTCAAC	GTGCTGCACTTCTAGAACTTAAATTACATTCCTTT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ATATAGAGAAATCACTTAAAATAATAGAATTTGC
ATTTAAATACAACTCTTGTTATTGTTCAAC	AAAATAAAAGGAAGTGGTAATATAGTGAAAACAT
ATTTAAATACAACTCTTGTTATTGTTCAAC	ATCGACTAAAGATTATATTTGGGGGTAAGATAAA
ATTTAAATACAACTCTTGTTATTGTTCAAC	GAATGCTACACAATTTGCTAACAATGCTATGAATGA
ATTTAAATACAACTCTTGTTATTGTTCAAC	GCATCAAACATAGTTACAGCAATTGTAGTTACAAAG
ATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|7|6|1592010-1592427|PILER-CR
TTTAAATACAACTCTTGTTATTGTTCAACG	TGCTGCACTTCTAGAACTTAAATTACATTCCTTTA
TTTAAATACAACTCTTGTTATTGTTCAACA	TATAGAGAAATCACTTAAAATAATAGAATTTGCA
TTTAAATACAACTCTTGTTATTGTTCAACA	AAATAAAAGGAAGTGGTAATATAGTGAAAACATA
TTTAAATACAACTCTTGTTATTGTTCAACA	TCGACTAAAGATTATATTTGGGGGTAAGATAAAA
TTTAAATACAACTCTTGTTATTGTTCAACG	AATGCTACACAATTTGCTAACAATGCTATGAATGAA
TTTAAATACAACTCTTGTTATTGTTCAACG	CATCAAACATAGTTACAGCAATTGTAGTTACAAAGA
TTTAAATACAACTCTTGTTATTGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_023438413.1\|1593443_1594592_-\|polysaccharide-deacetylase	unknown	unknown	gnl\|CDD\|213022
NC_004557.1\|WP_128993785.1\|1601055_1602771_+\|histidine-decarboxylase	unknown	unknown	gnl\|CDD\|235068
NC_004557.1\|WP_011099690.1\|1596261_1596732_-\|DUF4829-domain-containing-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099691.1\|1596866_1597955_-\|amidase-domain-containing-protein	unknown	unknown	gnl\|CDD\|378910
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	cas7b	pfam05107_cas7b_CAS-I-B:CAS-I-C	gnl\|CDD\|377458
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_011099693.1\|1598677_1599271_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|366863
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	cas8b1	mkCas0106_cas8b1_CAS-I-B	gnl\|CDD\|188234
NC_004557.1\|WP_011099692.1\|1598119_1598677_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_041744712.1\|1595394_1595637_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_004557.1\|WP_035125168.1\|1599281_1600583_-\|S41-family-peptidase	unknown	unknown	gnl\|CDD\|367567
NC_004557.1\|WP_155274218.1\|1589321_1589468_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_035125170.1\|1595605_1595929_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_023438420.1\|1600700_1600883_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|224124

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_023438413.1\|1593443_1594592_-\|polysaccharide-deacetylase	gnl\|CDD\|213022	cd10917, CE4_NodB_like_6s_7s, Catalytic NodB homology domain of rhizobial NodB-like proteins. This family belongs to the large and functionally diverse carbohydrate esterase 4 (CE4) superfamily, whose members show strong sequence similarity with some variability due to their distinct carbohydrate substrates. It includes many rhizobial NodB chitooligosaccharide N-deacetylase (EC 3.5.1.-)-like proteins, mainly from bacteria and eukaryotes, such as chitin deacetylases (EC 3.5.1.41), bacterial peptidoglycan N-acetylglucosamine deacetylases (EC 3.5.1.-), and acetylxylan esterases (EC 3.1.1.72), which catalyze the N- or O-deacetylation of substrates such as acetylated chitin, peptidoglycan, and acetylated xylan. All members of this family contain a catalytic NodB homology domain with the same overall topology and a deformed (beta/alpha)8 barrel fold with 6- or 7 strands. Their catalytic activity is dependent on the presence of a divalent cation, preferably cobalt or zinc, and they employ a conserved His-His-Asp zinc-binding triad closely associated with the conserved catalytic base (aspartic acid) and acid (histidine) to carry out acid/base catalysis. Several family members show diversity both in metal ion specificities and in the residues that coordinate the metal.	0.000167005
NC_004557.1\|WP_011099691.1\|1596866_1597955_-\|amidase-domain-containing-protein	gnl\|CDD\|378910	pfam12671, Amidase_6, Putative amidase domain.	1.42235e-30
NC_004557.1\|WP_011099680.1\|1580853_1581852_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	1.00899e-162
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	3.10242e-112
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	gnl\|CDD\|377458	pfam05107, Cas_Cas7, CRISPR-associated protein Cas7. CRISPR-associated protein Cas7 is one of the components of the type I-B cascade-like antiviral defense complex. In Haloferax volcanii, Cas5, Cas6 and Cas7 form a small complex that aids the stability of CRISPR-derived RNA.	6.79018e-48
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	0.000961226
NC_004557.1\|WP_023438399.1\|1580562_1580853_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	5.34287e-28
NC_004557.1\|WP_011099681.1\|1581861_1582353_-\|CRISPR-associated-protein-Cas4	gnl\|CDD\|366863	pfam01930, Cas_Cas4, Domain of unknown function DUF83. This domain has no known function. The domain contains three conserved cysteines at its C-terminus.	1.40975e-60
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	gnl\|CDD\|188234	TIGR02591, cas_Csh1, CRISPR-associated protein Cas8b/Csh1, subtype I-B/HMARI. This domain is found in the C-terminal 2/3 of a family of CRISPR associated proteins of the Hmari subtype. Except for the two sequences from halophilic archaea this domain contains a pair of CXXC motifs.	3.00773e-90
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.75114e-22
NC_004557.1\|WP_035125168.1\|1599281_1600583_-\|S41-family-peptidase	gnl\|CDD\|367567	pfam03572, Peptidase_S41, Peptidase family S41.	1.35691e-25
NC_004557.1\|WP_128993785.1\|1601055_1602771_+\|histidine-decarboxylase	gnl\|CDD\|235068	PRK02769, PRK02769, histidine decarboxylase; Provisional.	8.098e-66
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	1.29817e-29

>NC_004557.1|WP_011099687.1|1590319_1591906_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYLLEKRLNHMKEYLPIKISFEAIDTEGYSKVEKFLSSIMMQIVNYFRFSTNKEMYKFIKNCENQITNMNDFNSFITDLVEFSEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKKVNLDKEYFAKKIYFYTSGYPFLVSKLCKIIDEKIMVEDELKWEKEYLELAVKELLKESNTNFDSLIKNIENNKELSQIIDNILIKGTRINFNIHNPDINLGYLYGIFKNNKGNLEINNRIYEQLIYEYRISKIQTASNFLNYNLKENFIKCNGDLDITKVLIKFQEFMKHEYSQKRDAFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNEKMYILELKIWRGEEYHKKGLKQLGEYLNQYGLEEGYLLIFDFRKATNLIGKTEETHVNAEDNIKKIIEVYC
>NC_004557.1|WP_155274218.1|1589321_1589468_-|hypothetical-protein
MKKKLKFSISATYEDLKEKERIEIDDIIYIIELVSVITLILKIFQFIN
>NC_004557.1|WP_011099686.1|1588509_1589202_-|CRISPR-associated-endoribonuclease-Cas6
MKIYELTLKVFLLKDIKSDESLEKISNLIDKSLSKDGKLLDFHERNTYKNYTFNSLYPIEKDKIYNEGKIYSVQIRTVDESLIQYFKKNLTNEYTEYIKALTLECRVIPQRYIEKIYSITPVIIKTEKGYWKGNLSLGEFEERIKNNLIKKYNSFFNTKIDERFTLFRTINLINNKPISCSYKDINILGDKITLIIDENEMAQKLACFSLGSGVGEMNARGYGFVNYKWL
>NC_004557.1|WP_011099685.1|1586757_1588497_-|type-I-B-CRISPR-associated-protein-Cas8b/Csh1
MLKDVISIFKREYEKIGDRYVTESYIPSDGEYIIVDTFENDFKILDKVIIKKDRKTQKIDDSNQYFPFIREADYLSRLLDMNKPIDHKKIIHSNNYLSFFIKKENVNNGKLSDEIIDRYYEILKDPLIKYKNTKAEKLYEEVEEEHGKVNEKLIDEIKNWIKEKIHDFVDKGSKEKEYLKIFFKYDLDKYRKESEKYISPNLYNSNDYNVKIKEEIYGLPNDNMGLNSKKPYLENKTRKSKVPYLISKEEVLIQKKFFDYLMNQVAIGKSNIYINEKGIKGISNKETLGEDFTGYYLRIQKGKEVEIHNFDTIVNYRAKIEPFKLENVLELEKSELNYNVFIYEIGKLKDLIDNVFFYKFLSGNFFTKAEDLNINDATLKRSILLSRDTLFTWFYKGVDNNTWNNLNISSLNLIKGSINKRYLLKAGEQFNLRCSLKNYFEGGISMADVLLEVKNSLREKINKTVKENKNHEDVTLDNDREYYFAVGQLAYYLISLSKSKNKSHSLVNPIINAKTNERIKDEIRRLYTRYNYRIEFGSKRVERLYSMISSYVPKGKINGDLIIAGFLKNNLIYEKSEEE
>NC_004557.1|WP_011099684.1|1585792_1586752_-|type-I-CRISPR-associated-protein-Cas7
MGMNKRVYGVLGIVSRMSNWNADFTGYPKTTSSGDVFGSDKAFKYPMKKMWENGGEKVLYIKSIKFQENKKKERELIPRTLKERYEYIFDVEDLKKNKDSEEVLKNLFTAVDVKNFGATFAEEGNNISITGAVQIGQGFNKYKETYAEEQQILSPFRDPNQKEKSKDGEEAKSSTLGTKIVSNEAHYFYPLTVNPSAYSQFEEIGVTNGYTEEDYEKFKETSMIAATSFNTNSKIGCENEFALFVETKEDLYLPDLSQYVDFEKVEDKNIIILSCSELLNSFENEIENIEIYYNSYTTEIKSDEIKKAKKFNIFTKKEV
>NC_004557.1|WP_011099683.1|1585018_1585789_-|type-I-B-CRISPR-associated-protein-Cas5
MDALKFSLSGRTAFFKKPDVNSFFYFTYGNVHKVALLGILGAICGYGGYNSQCLNKEQIYPEFYEKLKDINIGVVPKNEKGYIDKKIQVFNNSVGYASKELGGNLIVKEQWLENPKWAIYILMDENVPKDLKDRLLNFKFKYIPYLGKNDHMANITDVEYLENIEKLDNTNKLDSIFIKDKYEIQKESKNFNDLKNIIKKSSSKIQEFKYEEMLPISLEETTNKYNLETFIYTNSNLKPLADTKTYKCGDKNIFFF
>NC_004557.1|WP_011099682.1|1582361_1584962_-|CRISPR-associated-helicase/endonuclease-Cas3
MYFNNIEKVNLENIIENNDKIYAHIHNGRKETLKEHSDLALKYLYKISERKSLDNVFLKIENNFLEKCSNEEKMVYRKMLLNTIYMHDLGKINCNFQRKKMANKIFKEEKMSSTNHSMLSSIIYINHFLKEIASIENGEHIKLLIAFLLLNSYVISKHHGAFNSVNKFKEKLVYDGEEGKDLYTKYMYIFDKVYKEEIIINESLIKEDLFDMYKSTIQEKTEENKDFPVELYIYERFLASLLLSCDYYSTSEFKNQKEVEEFGEIKNIEKFYKSFKSTEVYNWIRKYEKNDYGKTDDFSNIDDINVLRNELFLDAEKTMVSNIDKDIFYLEAPTGSGKSNVSFNLSFKMVERFKEINKIFYVYPFNTLVEQNIKTLEKIFKNNEIMKDIAIINSVVPIKIKSSKDNKIKEIDTNEESDILNEDYERALLDRQFLHYPIVLTTHVSIFNYLFGTSKDNLFPLCQIANSIIVLDEIQSYKNRIWKEIITFLACYSRLLNIKIIIMSATLPNLNKLVDGEIKTVNLIENRKKYFENPIFKNRVMVDFSLLEEKENIKEVLFNNVIKNTKAPNKNILVEFITKESAMDFYEKLKDYNKYLQESEKREIELITGDDNRVERNRIIDKIKSQKNIILVATQVIEAGVDIDMDIGYKDISMLDSEEQFLGRINRSCKNDEQGIVYFFDLDLASHVYKRDIRKQKNINLTCPKIREILINKNFQEFYDYVIKELNKKAGEYNNSSFQTFFLDKVKMLNFKEIEERMKLIDELYENNVFLNRNITLENEEELCGEDVWNEYIAILKNNKLDYAEKKIKLSQVTAKLNYFIYQISSDDFIYEDRVGDIYYIGDGEKYFEDGKFDRKKFKSIVADII
>NC_004557.1|WP_011099681.1|1581861_1582353_-|CRISPR-associated-protein-Cas4
MKVNGTLVNYYFHCKRQCWLHGNRINLEDNSQDVKIGKAIHEVKKEKGKQTEISIDNIKIDKITKDYLTEVKKSDSDIEAAKWQLLLYLKVLKDKGIERKGKLEFIEKNKSKSTIIIELDENNLSELEDVIKNIENLLIQENPPEVINESKCKKCAYFEYCYI
>NC_004557.1|WP_011099680.1|1580853_1581852_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYITSVGELKRKDNSLCFRKNNKNVYIPVENTKEIYCMSEVNINSKLLDFLSQNNIIMHFFNYYEGYSGTFYPREHYNSGKLLVKQVETYENRRLEVAKSIVEAIGDNIYELLYHYYKHDKKEVKETLDWIKNHSKINLKKANDIKQIMQVEGETWQRFYGEFKNILPEEFVMNKRVKRPPDNPINALISFGNTLLYGKTITAIYNTHLDQRISFLHEPSEGRFSLSLDISEAFKPVIVFKTIFDLVNNKRIQVSKHFDKKLNYCLLNDEGRNIFITAFEERMESIFLNEKLKRKISYKTAIKLDCYKLIKFILENKEFKPFSLKERM
>NC_004557.1|WP_023438399.1|1580562_1580853_-|CRISPR-associated-endonuclease-Cas2
MSKNFNYNYAFVFYDVNEKRVNRVFKTCKKYLSHFQKSVFRGELTPANFILLKKDLNKVINEDEDFICIIKLMNNKVYDEEILGNPHSCTGEDLIL
>NC_004557.1|WP_023438413.1|1593443_1594592_-|polysaccharide-deacetylase
MRRKNKFGVILFLMIIITALSIILSDSRGSRQFIKSQKSENMASKNEKNKKKIKSEKYNGEMEFYNGEIEHLFFHPLILDKKAAFTGPKWHTDNMDNWLVTVEESKKVINSLYSKGYILIDPNSLYEEYESDGKKLFRKKPLKVPKGKKPLILSIDDLSYNEGMRKATALKLILDENGNLATYRKDQNGKEIIGYDEIVMILDRFVKEHPDFSLNGAKGVIALTGYEGVFGYRTNLDSKNREEEAKKAKVIANKLKENGWKFASHSYGHLDNAKIPFQTLKRDADKWEQLVKPIIGHTSIYVYPHGTAIKTNSEKFKYLQSKGFKIFYSVDSYLGERISENDLVVEGGRMPIDGLSMRNRREAFLKFFDAKEVLDLESRPKR
>NC_004557.1|WP_041744712.1|1595394_1595637_-|hypothetical-protein
MQLNPTQVVCSSINALEGNVVDIEKELNAKANQEYFHKLVKLDKHADSIIKFISELNCTESLSNDATYMLMNDLVERIKL
>NC_004557.1|WP_035125170.1|1595605_1595929_-|hypothetical-protein
MFNTADSEISEIITAAIHDSSGIGSEDTSSLKFMILEGDWNNKEIPQCFEGIKSAGESGKIQVLSRGKNLFTKDSIYYLNVVTGKTIRNPSKFVSSSIAVKPNTSCM
>NC_004557.1|WP_011099690.1|1596261_1596732_-|DUF4829-domain-containing-protein
MKKSYMMIIMISILFGVKLIYSNSAESIIKEYYKVIDSQQDVGKYNKLVIEDERLKNLEGIPDIVEKRDILELKKLNVNEHPLLEKELNYKYADEKDNVRYYMIKYDIKFKENVATPVDSGIYYEVITVVKRKNKWLVTTDIRKASFHNDKLTIDS
>NC_004557.1|WP_011099691.1|1596866_1597955_-|amidase-domain-containing-protein
MKKKLMKLKSKLDYGSLKNAYIIKGDEITNEDINALIDNYFNWIYENLINNTIGELQNIVGNNKLAEFKKSKLKWLINWYGKKDEEIKDYKIYTEINDVDINGNIIYINVIYGEDLILKSSSDIVQKIRNQEHKILAKNVGSKLVIIHDYYNDELADEMFLVSDREFKTNKKVKSINKKLEKKTLEINKNIKKIDKLVKQYKRNLHNTLQINNIQERKYPGYDGIAAAKYAVKYAINYNPEYQDYNGRGGDCTNFISQCIYAGGIPTDNVWYKDSHAWIRVVELRSWLLKKGYARELTVQDNAKKGDLIQLRNSGGYWYHSLIVTYKNSSNGELFVSCHTGDYVNRALSTYTTDRRYLILTS
>NC_004557.1|WP_011099692.1|1598119_1598677_+|hypothetical-protein
MIKTKKKVFANVSFTVLLLVLINTSVFAAYPSKATMDNTWGFEKGDSTEKQLIYHQHGDLDWKGHVDFAMNEININPADISCYYGTSEDLANIVVTSNYWPDATWSGSTYAPIGLEPKTIELNSSAELTDWQRDAVTTHEFVHIWGINDSRNKNSISYGFTPVNYRTITDDVTTLLKNRYNEEVK
>NC_004557.1|WP_011099693.1|1598677_1599271_+|hypothetical-protein
MIKKISVILALTGVINTNSALSTPPSKVNEPIKPKASASYMEIDGLKELKAKSDIIVEVEGTDKFELIDYKGIKMRKTTVKILDVMKGNPTLKEITVVQTEGLESEEPPMKNEKLLMFLRKGIDITDSYVPIGGNQGIYKIITKKTKKNSMTPKKLPHLNAPKDDAIKIVTPTSLINNKILRDLNGNYDDIKKKLIE
>NC_004557.1|WP_035125168.1|1599281_1600583_-|S41-family-peptidase
MKRFKKITILAVVLIILILSKSFIGKAYYKKNAPEHIKNFSKKEALEDYDYMWNVLERNYPCFNVIERKHGVTIKDIKNGYRKRIENRENVDFKYFNMILNKSINKFSNVGHLYVMDFNFYIMLRGTFDAIGKNEIGGIVKNNFEMAINKKTEETYKHIYNISYGKKILKNLNFTNISNKLYDNKNLSFKEIDKDTAYIKINNFYHYNIANDKDKLINFYRKNSDKKNLVIDLTENRGGADSYWMTSIVAPNIDKELKLYNQYALYKNGDIVNDQWVKKHGNNEYREITKDFSEVLKLSKIRKEDLKDLKYLEISKSIPYNVKPSSKEKLFKGKIYVLVSEQVQSSGEDFVEYCKNTKFATLIGTTTGGNSPAMSPVYDVLPNSGLMLSYQIDYKLNPDGTCNTEFGLPPDIVSKENEEPLDTFKRVILEKKL
>NC_004557.1|WP_023438420.1|1600700_1600883_+|hypothetical-protein
MILLLISMLSSKIFDIIFFNLLGETTGTLGSIIGFVLPYSIALEIILKKLFFEPSSKDSK
>NC_004557.1|WP_128993785.1|1601055_1602771_+|histidine-decarboxylase
MTQPTKDPNTVYPKVPGIDYDKFKLSEDKMTSKQINDALEELHNYISNQQINFLGYQINQSFNYMKDLKEYLNVHMNNIGDPFVSGNFTVNTKFLERAVLDYFASLWNAQWPHESKGDSNTNDWKNSYWGYVVSMGSTEANFFGIWNARDYLSGKALLLDTSTHKRAKSASINGNPQSVEPRVLNYQAKSLEDNPNMYTPIAFYSQDTHYSIIKGMRILNFTTFNEAGSGKFECPLKYPEDYPKGFSINYLDENGWPFEVPSNNDGSVFIPALKKLVEAFASKGYPIFVNFNYGTTFKGSYDNVEKAIDELVPILKKYNLYEREIIFDKNNKNSDTRTGFWFHVDGALGAAYMPFLEMTTDNEDFPVFDFRLKDVHSISMSGHKWIGVPWPCGIYMSKIKYQLLPPDNPNYIGSPDSTFAGSRNAFSSLILWYYIATHSYEDCKNMILDCQDTAKYTVEKLNELSKKLGIDLWVEYSSKSLTIRFKEANPDIVFKYSLSGEILYVNGEKRAYSHIYIMPHVTKDLIDKFIKDLSKPGAFPEQVSHLEKDGVNFNSNSHKGIYVPQIGRGFK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_004557_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_004557_8

1595950-1596044

TypeI-B

III-B

Consensus_repeat	Method
ATTTAAATACAACTCTTGTTATTGTTCAAC	CRISPRCasFinder

1 spacers

cas6,cas8b1,cas7b,cas5,cas3

The CRISPR arrays of NC_004557_8

>merge|NC_004557|8|1595950-1596044|CRISPRCasFinder
ATTTAAATACAACTCTTGTTATTGTTCAACGTACCTGTGCCAAGACTATTAAATTTTTTTGCTAAATTTAAATACAACTCTTGTTATTGTTCAAC

>NC_004557|8|8|1595950-1596044|CRISPRCasFinder
ATTTAAATACAACTCTTGTTATTGTTCAAC	GTACCTGTGCCAAGACTATTAAATTTTTTTGCTAA
ATTTAAATACAACTCTTGTTATTGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_004557.1\|WP_023438413.1\|1593443_1594592_-\|polysaccharide-deacetylase	unknown	unknown	gnl\|CDD\|213022
NC_004557.1\|WP_035125165.1\|1603540_1604416_-\|4Fe-4S-binding-protein	unknown	unknown	gnl\|CDD\|274004
NC_004557.1\|WP_128993785.1\|1601055_1602771_+\|histidine-decarboxylase	unknown	unknown	gnl\|CDD\|235068
NC_004557.1\|WP_011099691.1\|1596866_1597955_-\|amidase-domain-containing-protein	unknown	unknown	gnl\|CDD\|378910
NC_004557.1\|WP_011099692.1\|1598119_1598677_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	cas7b	pfam05107_cas7b_CAS-I-B:CAS-I-C	gnl\|CDD\|377458
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_004557.1\|WP_011099693.1\|1598677_1599271_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099690.1\|1596261_1596732_-\|DUF4829-domain-containing-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	cas8b1	mkCas0106_cas8b1_CAS-I-B	gnl\|CDD\|188234
NC_004557.1\|WP_041744712.1\|1595394_1595637_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_004557.1\|WP_035125168.1\|1599281_1600583_-\|S41-family-peptidase	unknown	unknown	gnl\|CDD\|367567
NC_004557.1\|WP_155274218.1\|1589321_1589468_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099696.1\|1602894_1603476_-\|TlpA-family-protein-disulfide-reductase	unknown	unknown	gnl\|CDD\|239264
NC_004557.1\|WP_035125170.1\|1595605_1595929_-\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099698.1\|1604648_1605866_-\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|273593
NC_004557.1\|WP_023438420.1\|1600700_1600883_+\|hypothetical-protein	unknown	unknown	unknown
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|224124

Protein	Function_ID	Function_description	E-value
NC_004557.1\|WP_023438413.1\|1593443_1594592_-\|polysaccharide-deacetylase	gnl\|CDD\|213022	cd10917, CE4_NodB_like_6s_7s, Catalytic NodB homology domain of rhizobial NodB-like proteins. This family belongs to the large and functionally diverse carbohydrate esterase 4 (CE4) superfamily, whose members show strong sequence similarity with some variability due to their distinct carbohydrate substrates. It includes many rhizobial NodB chitooligosaccharide N-deacetylase (EC 3.5.1.-)-like proteins, mainly from bacteria and eukaryotes, such as chitin deacetylases (EC 3.5.1.41), bacterial peptidoglycan N-acetylglucosamine deacetylases (EC 3.5.1.-), and acetylxylan esterases (EC 3.1.1.72), which catalyze the N- or O-deacetylation of substrates such as acetylated chitin, peptidoglycan, and acetylated xylan. All members of this family contain a catalytic NodB homology domain with the same overall topology and a deformed (beta/alpha)8 barrel fold with 6- or 7 strands. Their catalytic activity is dependent on the presence of a divalent cation, preferably cobalt or zinc, and they employ a conserved His-His-Asp zinc-binding triad closely associated with the conserved catalytic base (aspartic acid) and acid (histidine) to carry out acid/base catalysis. Several family members show diversity both in metal ion specificities and in the residues that coordinate the metal.	0.000167005
NC_004557.1\|WP_011099691.1\|1596866_1597955_-\|amidase-domain-containing-protein	gnl\|CDD\|378910	pfam12671, Amidase_6, Putative amidase domain.	1.42235e-30
NC_004557.1\|WP_035125165.1\|1603540_1604416_-\|4Fe-4S-binding-protein	gnl\|CDD\|274004	TIGR02163, Ferredoxin-type_protein_NapH_homolog, ferredoxin-type protein, NapH/MauN family. Most members of this family are the NapH protein, found next to NapG,in operons that encode the periplasmic nitrate reductase. Some species with this reductase lack NapC but accomplish electron transfer to NapAB in some other manner, likely to involve NapH, NapG, and/or some other protein. A few members of this protein are designated MauN and are found in methylamine utilization operons in species that appear to lack a periplasmic nitrate reductase.	4.19429e-18
NC_004557.1\|WP_011099683.1\|1585018_1585789_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	3.10242e-112
NC_004557.1\|WP_011099686.1\|1588509_1589202_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.75114e-22
NC_004557.1\|WP_011099687.1\|1590319_1591906_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	0.000961226
NC_004557.1\|WP_011099696.1\|1602894_1603476_-\|TlpA-family-protein-disulfide-reductase	gnl\|CDD\|239264	cd02966, TlpA_like_family, TlpA-like family; composed of TlpA, ResA, DsbE and similar proteins. TlpA, ResA and DsbE are bacterial protein disulfide reductases with important roles in cytochrome maturation. They are membrane-anchored proteins with a soluble TRX domain containing a CXXC motif located in the periplasm. The TRX domains of this family contain an insert, approximately 25 residues in length, which correspond to an extra alpha helix and a beta strand when compared with TRX. TlpA catalyzes an essential reaction in the biogenesis of cytochrome aa3, while ResA and DsbE are essential proteins in cytochrome c maturation. Also included in this family are proteins containing a TlpA-like TRX domain with domain architectures similar to E. coli DipZ protein, and the N-terminal TRX domain of PilB protein from Neisseria which acts as a disulfide reductase that can recylce methionine sulfoxide reductases.	2.25765e-26
NC_004557.1\|WP_011099684.1\|1585792_1586752_-\|type-I-CRISPR-associated-protein-Cas7	gnl\|CDD\|377458	pfam05107, Cas_Cas7, CRISPR-associated protein Cas7. CRISPR-associated protein Cas7 is one of the components of the type I-B cascade-like antiviral defense complex. In Haloferax volcanii, Cas5, Cas6 and Cas7 form a small complex that aids the stability of CRISPR-derived RNA.	6.79018e-48
NC_004557.1\|WP_035125168.1\|1599281_1600583_-\|S41-family-peptidase	gnl\|CDD\|367567	pfam03572, Peptidase_S41, Peptidase family S41.	1.35691e-25
NC_004557.1\|WP_128993785.1\|1601055_1602771_+\|histidine-decarboxylase	gnl\|CDD\|235068	PRK02769, PRK02769, histidine decarboxylase; Provisional.	8.098e-66
NC_004557.1\|WP_011099685.1\|1586757_1588497_-\|type-I-B-CRISPR-associated-protein-Cas8b/Csh1	gnl\|CDD\|188234	TIGR02591, cas_Csh1, CRISPR-associated protein Cas8b/Csh1, subtype I-B/HMARI. This domain is found in the C-terminal 2/3 of a family of CRISPR associated proteins of the Hmari subtype. Except for the two sequences from halophilic archaea this domain contains a pair of CXXC motifs.	3.00773e-90
NC_004557.1\|WP_011099698.1\|1604648_1605866_-\|HAMP-domain-containing-protein	gnl\|CDD\|273593	TIGR01386, Probable_sensor_protein_PcoS, heavy metal sensor kinase. Members of this family contain a sensor histidine kinase domain (pfam00512) and a domain found in bacterial signal proteins (pfam00672). This group is separated phylogenetically from related proteins with similar architecture and contains a number of proteins associated with heavy metal resistance efflux systems for copper, silver, cadmium, and/or zinc.	8.37909e-52
NC_004557.1\|WP_011099682.1\|1582361_1584962_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	1.29817e-29

>NC_004557.1|WP_035125170.1|1595605_1595929_-|hypothetical-protein
MFNTADSEISEIITAAIHDSSGIGSEDTSSLKFMILEGDWNNKEIPQCFEGIKSAGESGKIQVLSRGKNLFTKDSIYYLNVVTGKTIRNPSKFVSSSIAVKPNTSCM
>NC_004557.1|WP_041744712.1|1595394_1595637_-|hypothetical-protein
MQLNPTQVVCSSINALEGNVVDIEKELNAKANQEYFHKLVKLDKHADSIIKFISELNCTESLSNDATYMLMNDLVERIKL
>NC_004557.1|WP_023438413.1|1593443_1594592_-|polysaccharide-deacetylase
MRRKNKFGVILFLMIIITALSIILSDSRGSRQFIKSQKSENMASKNEKNKKKIKSEKYNGEMEFYNGEIEHLFFHPLILDKKAAFTGPKWHTDNMDNWLVTVEESKKVINSLYSKGYILIDPNSLYEEYESDGKKLFRKKPLKVPKGKKPLILSIDDLSYNEGMRKATALKLILDENGNLATYRKDQNGKEIIGYDEIVMILDRFVKEHPDFSLNGAKGVIALTGYEGVFGYRTNLDSKNREEEAKKAKVIANKLKENGWKFASHSYGHLDNAKIPFQTLKRDADKWEQLVKPIIGHTSIYVYPHGTAIKTNSEKFKYLQSKGFKIFYSVDSYLGERISENDLVVEGGRMPIDGLSMRNRREAFLKFFDAKEVLDLESRPKR
>NC_004557.1|WP_011099687.1|1590319_1591906_-|AAA-family-ATPase
MKKRFNVTGTCIPERHYMVDISNKLDSILKLVNNEEYFIINRPRQYGKTTTLYLLEKRLNHMKEYLPIKISFEAIDTEGYSKVEKFLSSIMMQIVNYFRFSTNKEMYKFIKNCENQITNMNDFNSFITDLVEFSEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRPDEEHKYNSPWNIASDFDVDMSFSIDEIKTMLDDYVENKKVNLDKEYFAKKIYFYTSGYPFLVSKLCKIIDEKIMVEDELKWEKEYLELAVKELLKESNTNFDSLIKNIENNKELSQIIDNILIKGTRINFNIHNPDINLGYLYGIFKNNKGNLEINNRIYEQLIYEYRISKIQTASNFLNYNLKENFIKCNGDLDITKVLIKFQEFMKHEYSQKRDAFLEEDGRLVFLAFLSPIINGAGFAFKEVQGGEEKRFDIVITYNEKMYILELKIWRGEEYHKKGLKQLGEYLNQYGLEEGYLLIFDFRKATNLIGKTEETHVNAEDNIKKIIEVYC
>NC_004557.1|WP_155274218.1|1589321_1589468_-|hypothetical-protein
MKKKLKFSISATYEDLKEKERIEIDDIIYIIELVSVITLILKIFQFIN
>NC_004557.1|WP_011099686.1|1588509_1589202_-|CRISPR-associated-endoribonuclease-Cas6
MKIYELTLKVFLLKDIKSDESLEKISNLIDKSLSKDGKLLDFHERNTYKNYTFNSLYPIEKDKIYNEGKIYSVQIRTVDESLIQYFKKNLTNEYTEYIKALTLECRVIPQRYIEKIYSITPVIIKTEKGYWKGNLSLGEFEERIKNNLIKKYNSFFNTKIDERFTLFRTINLINNKPISCSYKDINILGDKITLIIDENEMAQKLACFSLGSGVGEMNARGYGFVNYKWL
>NC_004557.1|WP_011099685.1|1586757_1588497_-|type-I-B-CRISPR-associated-protein-Cas8b/Csh1
MLKDVISIFKREYEKIGDRYVTESYIPSDGEYIIVDTFENDFKILDKVIIKKDRKTQKIDDSNQYFPFIREADYLSRLLDMNKPIDHKKIIHSNNYLSFFIKKENVNNGKLSDEIIDRYYEILKDPLIKYKNTKAEKLYEEVEEEHGKVNEKLIDEIKNWIKEKIHDFVDKGSKEKEYLKIFFKYDLDKYRKESEKYISPNLYNSNDYNVKIKEEIYGLPNDNMGLNSKKPYLENKTRKSKVPYLISKEEVLIQKKFFDYLMNQVAIGKSNIYINEKGIKGISNKETLGEDFTGYYLRIQKGKEVEIHNFDTIVNYRAKIEPFKLENVLELEKSELNYNVFIYEIGKLKDLIDNVFFYKFLSGNFFTKAEDLNINDATLKRSILLSRDTLFTWFYKGVDNNTWNNLNISSLNLIKGSINKRYLLKAGEQFNLRCSLKNYFEGGISMADVLLEVKNSLREKINKTVKENKNHEDVTLDNDREYYFAVGQLAYYLISLSKSKNKSHSLVNPIINAKTNERIKDEIRRLYTRYNYRIEFGSKRVERLYSMISSYVPKGKINGDLIIAGFLKNNLIYEKSEEE
>NC_004557.1|WP_011099684.1|1585792_1586752_-|type-I-CRISPR-associated-protein-Cas7
MGMNKRVYGVLGIVSRMSNWNADFTGYPKTTSSGDVFGSDKAFKYPMKKMWENGGEKVLYIKSIKFQENKKKERELIPRTLKERYEYIFDVEDLKKNKDSEEVLKNLFTAVDVKNFGATFAEEGNNISITGAVQIGQGFNKYKETYAEEQQILSPFRDPNQKEKSKDGEEAKSSTLGTKIVSNEAHYFYPLTVNPSAYSQFEEIGVTNGYTEEDYEKFKETSMIAATSFNTNSKIGCENEFALFVETKEDLYLPDLSQYVDFEKVEDKNIIILSCSELLNSFENEIENIEIYYNSYTTEIKSDEIKKAKKFNIFTKKEV
>NC_004557.1|WP_011099683.1|1585018_1585789_-|type-I-B-CRISPR-associated-protein-Cas5
MDALKFSLSGRTAFFKKPDVNSFFYFTYGNVHKVALLGILGAICGYGGYNSQCLNKEQIYPEFYEKLKDINIGVVPKNEKGYIDKKIQVFNNSVGYASKELGGNLIVKEQWLENPKWAIYILMDENVPKDLKDRLLNFKFKYIPYLGKNDHMANITDVEYLENIEKLDNTNKLDSIFIKDKYEIQKESKNFNDLKNIIKKSSSKIQEFKYEEMLPISLEETTNKYNLETFIYTNSNLKPLADTKTYKCGDKNIFFF
>NC_004557.1|WP_011099682.1|1582361_1584962_-|CRISPR-associated-helicase/endonuclease-Cas3
MYFNNIEKVNLENIIENNDKIYAHIHNGRKETLKEHSDLALKYLYKISERKSLDNVFLKIENNFLEKCSNEEKMVYRKMLLNTIYMHDLGKINCNFQRKKMANKIFKEEKMSSTNHSMLSSIIYINHFLKEIASIENGEHIKLLIAFLLLNSYVISKHHGAFNSVNKFKEKLVYDGEEGKDLYTKYMYIFDKVYKEEIIINESLIKEDLFDMYKSTIQEKTEENKDFPVELYIYERFLASLLLSCDYYSTSEFKNQKEVEEFGEIKNIEKFYKSFKSTEVYNWIRKYEKNDYGKTDDFSNIDDINVLRNELFLDAEKTMVSNIDKDIFYLEAPTGSGKSNVSFNLSFKMVERFKEINKIFYVYPFNTLVEQNIKTLEKIFKNNEIMKDIAIINSVVPIKIKSSKDNKIKEIDTNEESDILNEDYERALLDRQFLHYPIVLTTHVSIFNYLFGTSKDNLFPLCQIANSIIVLDEIQSYKNRIWKEIITFLACYSRLLNIKIIIMSATLPNLNKLVDGEIKTVNLIENRKKYFENPIFKNRVMVDFSLLEEKENIKEVLFNNVIKNTKAPNKNILVEFITKESAMDFYEKLKDYNKYLQESEKREIELITGDDNRVERNRIIDKIKSQKNIILVATQVIEAGVDIDMDIGYKDISMLDSEEQFLGRINRSCKNDEQGIVYFFDLDLASHVYKRDIRKQKNINLTCPKIREILINKNFQEFYDYVIKELNKKAGEYNNSSFQTFFLDKVKMLNFKEIEERMKLIDELYENNVFLNRNITLENEEELCGEDVWNEYIAILKNNKLDYAEKKIKLSQVTAKLNYFIYQISSDDFIYEDRVGDIYYIGDGEKYFEDGKFDRKKFKSIVADII
>NC_004557.1|WP_011099690.1|1596261_1596732_-|DUF4829-domain-containing-protein
MKKSYMMIIMISILFGVKLIYSNSAESIIKEYYKVIDSQQDVGKYNKLVIEDERLKNLEGIPDIVEKRDILELKKLNVNEHPLLEKELNYKYADEKDNVRYYMIKYDIKFKENVATPVDSGIYYEVITVVKRKNKWLVTTDIRKASFHNDKLTIDS
>NC_004557.1|WP_011099691.1|1596866_1597955_-|amidase-domain-containing-protein
MKKKLMKLKSKLDYGSLKNAYIIKGDEITNEDINALIDNYFNWIYENLINNTIGELQNIVGNNKLAEFKKSKLKWLINWYGKKDEEIKDYKIYTEINDVDINGNIIYINVIYGEDLILKSSSDIVQKIRNQEHKILAKNVGSKLVIIHDYYNDELADEMFLVSDREFKTNKKVKSINKKLEKKTLEINKNIKKIDKLVKQYKRNLHNTLQINNIQERKYPGYDGIAAAKYAVKYAINYNPEYQDYNGRGGDCTNFISQCIYAGGIPTDNVWYKDSHAWIRVVELRSWLLKKGYARELTVQDNAKKGDLIQLRNSGGYWYHSLIVTYKNSSNGELFVSCHTGDYVNRALSTYTTDRRYLILTS
>NC_004557.1|WP_011099692.1|1598119_1598677_+|hypothetical-protein
MIKTKKKVFANVSFTVLLLVLINTSVFAAYPSKATMDNTWGFEKGDSTEKQLIYHQHGDLDWKGHVDFAMNEININPADISCYYGTSEDLANIVVTSNYWPDATWSGSTYAPIGLEPKTIELNSSAELTDWQRDAVTTHEFVHIWGINDSRNKNSISYGFTPVNYRTITDDVTTLLKNRYNEEVK
>NC_004557.1|WP_011099693.1|1598677_1599271_+|hypothetical-protein
MIKKISVILALTGVINTNSALSTPPSKVNEPIKPKASASYMEIDGLKELKAKSDIIVEVEGTDKFELIDYKGIKMRKTTVKILDVMKGNPTLKEITVVQTEGLESEEPPMKNEKLLMFLRKGIDITDSYVPIGGNQGIYKIITKKTKKNSMTPKKLPHLNAPKDDAIKIVTPTSLINNKILRDLNGNYDDIKKKLIE
>NC_004557.1|WP_035125168.1|1599281_1600583_-|S41-family-peptidase
MKRFKKITILAVVLIILILSKSFIGKAYYKKNAPEHIKNFSKKEALEDYDYMWNVLERNYPCFNVIERKHGVTIKDIKNGYRKRIENRENVDFKYFNMILNKSINKFSNVGHLYVMDFNFYIMLRGTFDAIGKNEIGGIVKNNFEMAINKKTEETYKHIYNISYGKKILKNLNFTNISNKLYDNKNLSFKEIDKDTAYIKINNFYHYNIANDKDKLINFYRKNSDKKNLVIDLTENRGGADSYWMTSIVAPNIDKELKLYNQYALYKNGDIVNDQWVKKHGNNEYREITKDFSEVLKLSKIRKEDLKDLKYLEISKSIPYNVKPSSKEKLFKGKIYVLVSEQVQSSGEDFVEYCKNTKFATLIGTTTGGNSPAMSPVYDVLPNSGLMLSYQIDYKLNPDGTCNTEFGLPPDIVSKENEEPLDTFKRVILEKKL
>NC_004557.1|WP_023438420.1|1600700_1600883_+|hypothetical-protein
MILLLISMLSSKIFDIIFFNLLGETTGTLGSIIGFVLPYSIALEIILKKLFFEPSSKDSK
>NC_004557.1|WP_128993785.1|1601055_1602771_+|histidine-decarboxylase
MTQPTKDPNTVYPKVPGIDYDKFKLSEDKMTSKQINDALEELHNYISNQQINFLGYQINQSFNYMKDLKEYLNVHMNNIGDPFVSGNFTVNTKFLERAVLDYFASLWNAQWPHESKGDSNTNDWKNSYWGYVVSMGSTEANFFGIWNARDYLSGKALLLDTSTHKRAKSASINGNPQSVEPRVLNYQAKSLEDNPNMYTPIAFYSQDTHYSIIKGMRILNFTTFNEAGSGKFECPLKYPEDYPKGFSINYLDENGWPFEVPSNNDGSVFIPALKKLVEAFASKGYPIFVNFNYGTTFKGSYDNVEKAIDELVPILKKYNLYEREIIFDKNNKNSDTRTGFWFHVDGALGAAYMPFLEMTTDNEDFPVFDFRLKDVHSISMSGHKWIGVPWPCGIYMSKIKYQLLPPDNPNYIGSPDSTFAGSRNAFSSLILWYYIATHSYEDCKNMILDCQDTAKYTVEKLNELSKKLGIDLWVEYSSKSLTIRFKEANPDIVFKYSLSGEILYVNGEKRAYSHIYIMPHVTKDLIDKFIKDLSKPGAFPEQVSHLEKDGVNFNSNSHKGIYVPQIGRGFK
>NC_004557.1|WP_011099696.1|1602894_1603476_-|TlpA-family-protein-disulfide-reductase
MKKRMKKIILLAVFVITIISLVGCSSDKKDNTSQNSKSIQSTSNAKVFPKFQGEDFEGNTVDEKVFSKHPVTVVNLWFAGCKACVDEMPDLEKMSAEFQKKNVKMLGIDIDSTDDKEEVKKLLKAKGVTYQNLMLKSDKEIDEFLSKISAFPTTFLINSKGEIVGEAIEGVINSPKRIEEINRKIDEIIGQDK
>NC_004557.1|WP_035125165.1|1603540_1604416_-|4Fe-4S-binding-protein
MDRKRNIIQAFSTFITNIHFPNFLKGVLYNGQIKRVCVPGLNCYSCPAATGACPIGSFQAVVGSSKFSFSYYITGILILFGVLLGRFICGFFCPFGWFQDLLYKIPFKKFSTKKLKLLTYLKYLMLFVGVGLLPILITNNVGMGSPFFCKYVCPQGILEGGIPLSIANKGIRSSLGALFALKSIILVMVILLSIMFYRPFCKWICPLGAFYSFFNKISLYSYDFNKDNCVNCGKCRRVCKMDVDITKSTTHNECIRCGECIKVCPTKAISTFWGYEKRNSSTKIIGKYKNI
>NC_004557.1|WP_011099698.1|1604648_1605866_-|HAMP-domain-containing-protein
MERDISLMNKNNYENKSYDGSFSKKIKNSIVVKLMVTIIIIFIGMMTLSNFMINICVNNYFQEFDVEIENIFQTANHDDLYLLINEAQVKSTLEFRLYIILIMLFTVLIGCFFLYFIISHMMKPLKSLAEQVSEIDIHNIEDLNQEIVAIKGGYEIEDLAHTFNVTLKKLYLDYESQKKFSSNVAHELRTPLAVLYSKIDVFGKKSERNIEEYEELITSLKFNIERLADLVSKILLLTKKSNNIKLINVCLKDIVEEIVFDLEGIAEEKSVTATITGDNISMCTDDGLIQRVLFNLIENAIKYNVNNGKVNINLSKNDTDTIIEIADTGIGITDEHKEKVFDIFYRVEQSRNRALGGYGIGLALVESIVKVLGGKIFIRDNKPQGTIFVLSFQNIDSKMYSGSLN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Identity
NC_004557_1	1.1\|1217338\|36\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1217338-1217373	36	NC_004557.1	1205308-1205343	1.0
NC_004557_1	1.2\|1217404\|36\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1217404-1217439	36	NC_004557.1	1191961-1191996	1.0
NC_004557_1	1.8\|1217803\|39\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1217803-1217841	39	NC_004557.1	1099343-1099381	1.0
NC_004557_1	1.9\|1217872\|36\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1217872-1217907	36	NC_004557.1	1399450-1399485	1.0
NC_004557_2	2.9\|1571318\|36\|NC_004557\|CRISPRCasFinder,CRT	1571318-1571353	36	NC_004557.1	345159-345194	1.0
NC_004557_2	2.18\|1571320\|36\|NC_004557\|PILER-CR	1571320-1571355	36	NC_004557.1	345159-345194	1.0
NC_004557_3	3.1\|1573265\|34\|NC_004557\|CRISPRCasFinder,CRT	1573265-1573298	34	NC_004557.1	2280755-2280788	1.0
NC_004557_7	7.6\|1592362\|36\|NC_004557\|CRISPRCasFinder,CRT	1592362-1592397	36	NC_004557.1	462335-462370	1.0
NC_004557_7	7.12\|1592363\|36\|NC_004557\|PILER-CR	1592363-1592398	36	NC_004557.1	462335-462370	1.0

1. spacer 1.1|1217338|36|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to position: 1205308-1205343, mismatch: 0, identity: 1.0

ttaaatgaaggtactaaatttaaggtaagaatggtg	CRISPR spacer
ttaaatgaaggtactaaatttaaggtaagaatggtg	Protospacer
************************************

2. spacer 1.2|1217404|36|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to position: 1191961-1191996, mismatch: 0, identity: 1.0

agcattcctctatctccattaactactgaaaaagga	CRISPR spacer
agcattcctctatctccattaactactgaaaaagga	Protospacer
************************************

3. spacer 1.8|1217803|39|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to position: 1099343-1099381, mismatch: 0, identity: 1.0

atacaatgctccatggaaaggactccacttagatatata	CRISPR spacer
atacaatgctccatggaaaggactccacttagatatata	Protospacer
***************************************

4. spacer 1.9|1217872|36|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to position: 1399450-1399485, mismatch: 0, identity: 1.0

cccacatcattaaaggatataaaattaccaccttcc	CRISPR spacer
cccacatcattaaaggatataaaattaccaccttcc	Protospacer
************************************

5. spacer 2.9|1571318|36|NC_004557|CRISPRCasFinder,CRT matches to position: 345159-345194, mismatch: 0, identity: 1.0

acagtaacatgaatacactcatgttactgtttttca	CRISPR spacer
acagtaacatgaatacactcatgttactgtttttca	Protospacer
************************************

6. spacer 2.18|1571320|36|NC_004557|PILER-CR matches to position: 345159-345194, mismatch: 0, identity: 1.0

acagtaacatgaatacactcatgttactgtttttca	CRISPR spacer
acagtaacatgaatacactcatgttactgtttttca	Protospacer
************************************

7. spacer 3.1|1573265|34|NC_004557|CRISPRCasFinder,CRT matches to position: 2280755-2280788, mismatch: 0, identity: 1.0

ttaatccagataaaatatattctcttacagcaat	CRISPR spacer
ttaatccagataaaatatattctcttacagcaat	Protospacer
**********************************

8. spacer 7.6|1592362|36|NC_004557|CRISPRCasFinder,CRT matches to position: 462335-462370, mismatch: 0, identity: 1.0

gcatcaaacatagttacagcaattgtagttacaaag	CRISPR spacer
gcatcaaacatagttacagcaattgtagttacaaag	Protospacer
************************************

9. spacer 7.12|1592363|36|NC_004557|PILER-CR matches to position: 462335-462370, mismatch: 0, identity: 1.0

gcatcaaacatagttacagcaattgtagttacaaag	CRISPR spacer
gcatcaaacatagttacagcaattgtagttacaaag	Protospacer
************************************

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_004557_1	1.6\|1217671\|35\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1217671-1217705	35	KM983328	Clostridium phage phiCT453B, complete genome	7040-7074	0	1.0
NC_004557_3	3.1\|1573265\|34\|NC_004557\|CRISPRCasFinder,CRT	1573265-1573298	34	KM983328	Clostridium phage phiCT453B, complete genome	594-627	0	1.0
NC_004557_3	3.1\|1573265\|34\|NC_004557\|CRISPRCasFinder,CRT	1573265-1573298	34	KM983334	Clostridium phage phiCTC2B, complete genome	594-627	0	1.0
NC_004557_3	3.1\|1573265\|34\|NC_004557\|CRISPRCasFinder,CRT	1573265-1573298	34	KM983331	Clostridium phage phiCT19406B, complete genome	594-627	0	1.0
NC_004557_3	3.3\|1573393\|35\|NC_004557\|CRISPRCasFinder,CRT,PILER-CR	1573393-1573427	35	KM983328	Clostridium phage phiCT453B, complete genome	24672-24706	0	1.0
NC_004557_3	3.5\|1573525\|35\|NC_004557\|CRISPRCasFinder,CRT,PILER-CR	1573525-1573559	35	KM983327	Clostridium phage phiCT453A, complete genome	21916-21950	0	1.0
NC_004557_7	7.2\|1592104\|34\|NC_004557\|CRISPRCasFinder,CRT	1592104-1592137	34	KM983328	Clostridium phage phiCT453B, complete genome	14660-14693	0	1.0
NC_004557_7	7.8\|1592105\|34\|NC_004557\|PILER-CR	1592105-1592138	34	KM983328	Clostridium phage phiCT453B, complete genome	14660-14693	0	1.0
NC_004557_3	3.6\|1573590\|36\|NC_004557\|CRISPRCasFinder,CRT,PILER-CR	1573590-1573625	36	KM983327	Clostridium phage phiCT453A, complete genome	5886-5921	1	0.972
NC_004557_4	4.2\|1577900\|36\|NC_004557\|PILER-CR	1577900-1577935	36	KM983327	Clostridium phage phiCT453A, complete genome	9576-9611	1	0.972
NC_004557_4	4.4\|1577899\|38\|NC_004557\|CRISPRCasFinder	1577899-1577936	38	KM983327	Clostridium phage phiCT453A, complete genome	9576-9613	1	0.974
NC_004557_1	1.6\|1217671\|35\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1217671-1217705	35	KM983329	Clostridium phage phiCT9441A, complete genome	8919-8953	2	0.943
NC_004557_2	2.8\|1571254\|34\|NC_004557\|CRISPRCasFinder,CRT	1571254-1571287	34	KM983327	Clostridium phage phiCT453A, complete genome	19576-19609	2	0.941
NC_004557_2	2.17\|1571256\|34\|NC_004557\|PILER-CR	1571256-1571289	34	KM983327	Clostridium phage phiCT453A, complete genome	19576-19609	2	0.941
NC_004557_1	1.14\|1218204\|35\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1218204-1218238	35	NZ_CP013848	Clostridium botulinum strain Af650 plasmid pRSJ14_1, complete sequence	10611-10645	3	0.914
NC_004557_2	2.4\|1570993\|34\|NC_004557\|CRISPRCasFinder,CRT	1570993-1571026	34	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	196160-196193	3	0.912
NC_004557_2	2.13\|1570995\|34\|NC_004557\|PILER-CR	1570995-1571028	34	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	196160-196193	3	0.912
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	CP002037	Lactobacillus salivarius CECT 5713 plasmid pHN3, complete sequence	56952-56983	5	0.844
NC_004557_2	2.7\|1571188\|36\|NC_004557\|CRISPRCasFinder,CRT	1571188-1571223	36	NZ_CP013615	Clostridium perfringens strain JP838 plasmid pJFP838A, complete sequence	313612-313647	6	0.833
NC_004557_2	2.16\|1571190\|36\|NC_004557\|PILER-CR	1571190-1571225	36	NZ_CP013615	Clostridium perfringens strain JP838 plasmid pJFP838A, complete sequence	313612-313647	6	0.833
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NZ_CP045273	Bacillus megaterium strain FDU301 plasmid pFDU301A, complete sequence	353608-353639	6	0.812
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NZ_CP015592	Bacillus cereus strain AR156 plasmid pAR460, complete sequence	412221-412252	6	0.812
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NZ_CP009368	Bacillus cereus strain FM1 plasmid unnamed, complete sequence	364324-364355	6	0.812
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MT774380	CrAssphage cr1_1, complete genome	3245-3276	6	0.812
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	NZ_CP045273	Bacillus megaterium strain FDU301 plasmid pFDU301A, complete sequence	353606-353639	6	0.824
NC_004557_2	2.7\|1571188\|36\|NC_004557\|CRISPRCasFinder,CRT	1571188-1571223	36	MN693162	Marine virus AFVG_25M233, complete genome	7269-7304	7	0.806
NC_004557_2	2.16\|1571190\|36\|NC_004557\|PILER-CR	1571190-1571225	36	MN693162	Marine virus AFVG_25M233, complete genome	7269-7304	7	0.806
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NZ_CP033050	Virgibacillus halodenitrificans strain Bac324 plasmid unnamed, complete sequence	309797-309828	7	0.781
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NZ_CP043831	Bacillus sp. BS98 plasmid unnamed1	186464-186495	7	0.781
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NZ_LR214986	Mycoplasma cynos strain NCTC10142 plasmid 13	840082-840113	7	0.781
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NZ_AP017969	Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-1, complete sequence	69076-69107	7	0.781
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NC_007021	Staphylococcus phage Twort, complete genome	113971-114002	7	0.781
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MT151386	Staphylococcus virus Twort, complete genome	25794-25825	7	0.781
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	CP002037	Lactobacillus salivarius CECT 5713 plasmid pHN3, complete sequence	56952-56985	7	0.794
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	NZ_CP015592	Bacillus cereus strain AR156 plasmid pAR460, complete sequence	412221-412254	7	0.794
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	NZ_CP009368	Bacillus cereus strain FM1 plasmid unnamed, complete sequence	364324-364357	7	0.794
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	MT774380	CrAssphage cr1_1, complete genome	3243-3276	7	0.794
NC_004557_7	7.2\|1592104\|34\|NC_004557\|CRISPRCasFinder,CRT	1592104-1592137	34	NZ_CP024873	Leptospira mayottensis 200901116 plasmid p1_L200901116, complete sequence	73565-73598	7	0.794
NC_004557_7	7.8\|1592105\|34\|NC_004557\|PILER-CR	1592105-1592138	34	NZ_CP024873	Leptospira mayottensis 200901116 plasmid p1_L200901116, complete sequence	73565-73598	7	0.794
NC_004557_1	1.25\|1218935\|37\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1218935-1218971	37	NZ_CP014152	Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence	146195-146231	8	0.784
NC_004557_1	1.25\|1218935\|37\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1218935-1218971	37	NZ_CP013710	Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence	133154-133190	8	0.784
NC_004557_2	2.3\|1570929\|34\|NC_004557\|CRISPRCasFinder,CRT	1570929-1570962	34	NC_028838	Clostridium phage phiCD506, complete genome	19424-19457	8	0.765
NC_004557_2	2.6\|1571123\|35\|NC_004557\|CRISPRCasFinder,CRT	1571123-1571157	35	NZ_CP039845	Acetobacter pasteurianus strain CICC 22518 plasmid pAP22518-1, complete sequence	44968-45002	8	0.771
NC_004557_2	2.7\|1571188\|36\|NC_004557\|CRISPRCasFinder,CRT	1571188-1571223	36	MN693344	Marine virus AFVG_25M232, complete genome	2321-2356	8	0.778
NC_004557_2	2.7\|1571188\|36\|NC_004557\|CRISPRCasFinder,CRT	1571188-1571223	36	AP013454	Uncultured Mediterranean phage uvMED DNA, complete genome, group G17, isolate: uvMED-CGR-U-MedDCM-OCT-S33-C36	19997-20032	8	0.778
NC_004557_2	2.12\|1570931\|34\|NC_004557\|PILER-CR	1570931-1570964	34	NC_028838	Clostridium phage phiCD506, complete genome	19424-19457	8	0.765
NC_004557_2	2.15\|1571125\|35\|NC_004557\|PILER-CR	1571125-1571159	35	NZ_CP039845	Acetobacter pasteurianus strain CICC 22518 plasmid pAP22518-1, complete sequence	44968-45002	8	0.771
NC_004557_2	2.16\|1571190\|36\|NC_004557\|PILER-CR	1571190-1571225	36	MN693344	Marine virus AFVG_25M232, complete genome	2321-2356	8	0.778
NC_004557_2	2.16\|1571190\|36\|NC_004557\|PILER-CR	1571190-1571225	36	AP013454	Uncultured Mediterranean phage uvMED DNA, complete genome, group G17, isolate: uvMED-CGR-U-MedDCM-OCT-S33-C36	19997-20032	8	0.778
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MF186604	Methanosarcina spherical virus, complete genome	971-1002	8	0.75
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	AP014322	Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S33-C37, * SEQUENCING IN PROGRESS *	11492-11523	8	0.75
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	NC_019749	Stanieria cyanosphaera PCC 7437 plasmid pSTA7437.02, complete sequence	38582-38613	8	0.75
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MK614706	Gammaproteobacteria virus GOV_bin_2604, complete genome	55000-55031	8	0.75
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MT325768	Psychrobacillus phage Perkons, complete genome	7524-7555	8	0.75
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	NZ_CP043831	Bacillus sp. BS98 plasmid unnamed1	186464-186497	8	0.765
NC_004557_5	5.1\|1580118\|36\|NC_004557\|CRISPRCasFinder,CRT	1580118-1580153	36	MN693129	Marine virus AFVG_25M62, complete genome	46972-47007	8	0.778
NC_004557_5	5.5\|1580119\|36\|NC_004557\|PILER-CR	1580119-1580154	36	MN693129	Marine virus AFVG_25M62, complete genome	46972-47007	8	0.778
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_CP017256	Clostridium taeniosporum strain 1/k plasmid pCt3, complete sequence	158090-158123	8	0.765
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NC_011732	Gloeothece citriformis PCC 7424 plasmid pP742404, complete sequence	17051-17084	8	0.765
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_CP017256	Clostridium taeniosporum strain 1/k plasmid pCt3, complete sequence	158090-158123	8	0.765
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NC_011732	Gloeothece citriformis PCC 7424 plasmid pP742404, complete sequence	17051-17084	8	0.765
NC_004557_7	7.1\|1592039\|35\|NC_004557\|CRISPRCasFinder,CRT	1592039-1592073	35	NZ_CP026601	Clostridiaceae bacterium 14S0207 plasmid unnamed1, complete sequence	34147-34181	8	0.771
NC_004557_7	7.7\|1592040\|35\|NC_004557\|PILER-CR	1592040-1592074	35	NZ_CP026601	Clostridiaceae bacterium 14S0207 plasmid unnamed1, complete sequence	34147-34181	8	0.771
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MH617682	Microviridae sp. isolate ctcb14, complete genome	11-42	9	0.719
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	NZ_CP033050	Virgibacillus halodenitrificans strain Bac324 plasmid unnamed, complete sequence	309795-309828	9	0.735
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	NZ_LR214986	Mycoplasma cynos strain NCTC10142 plasmid 13	840082-840115	9	0.735
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	AP014322	Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S33-C37, * SEQUENCING IN PROGRESS *	11490-11523	9	0.735
NC_004557_5	5.3\|1580250\|34\|NC_004557\|CRISPRCasFinder,CRT	1580250-1580283	34	NZ_CP015331	Borrelia hermsii HS1 isolate Browne Mountain plasmid lpN31, complete sequence	6668-6701	9	0.735
NC_004557_5	5.3\|1580250\|34\|NC_004557\|CRISPRCasFinder,CRT	1580250-1580283	34	NZ_CP039041	Piscirickettsia salmonis strain Psal-072 plasmid unnamed1, complete sequence	53993-54026	9	0.735
NC_004557_5	5.3\|1580250\|34\|NC_004557\|CRISPRCasFinder,CRT	1580250-1580283	34	NZ_CP039048	Piscirickettsia salmonis strain Psal-073 plasmid unnamed2, complete sequence	95035-95068	9	0.735
NC_004557_5	5.7\|1580251\|34\|NC_004557\|PILER-CR	1580251-1580284	34	NZ_CP015331	Borrelia hermsii HS1 isolate Browne Mountain plasmid lpN31, complete sequence	6668-6701	9	0.735
NC_004557_5	5.7\|1580251\|34\|NC_004557\|PILER-CR	1580251-1580284	34	NZ_CP039041	Piscirickettsia salmonis strain Psal-072 plasmid unnamed1, complete sequence	53993-54026	9	0.735
NC_004557_5	5.7\|1580251\|34\|NC_004557\|PILER-CR	1580251-1580284	34	NZ_CP039048	Piscirickettsia salmonis strain Psal-073 plasmid unnamed2, complete sequence	95035-95068	9	0.735
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_KT897276	Clostridium botulinum strain INGR16-02E1 plasmid pINGR16-02E1, complete sequence	127266-127299	9	0.735
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_KT897280	Clostridium botulinum strain FI1111E1 plasmid pFI1111E1, complete sequence	136997-137030	9	0.735
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_KT897275	Clostridium botulinum strain IFR 12/29 plasmid p12/29, complete sequence	132152-132185	9	0.735
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_KT897277	Clostridium botulinum strain ST0210E1 plasmid pST0210E1, complete sequence	127266-127299	9	0.735
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_KT897278	Clostridium botulinum strain FWSKR40E1 plasmid pFWSKR40E1, complete sequence	134422-134455	9	0.735
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_KT897279	Clostridium botulinum strain SWKR38E2 plasmid pSWKR38E2, complete sequence	135558-135591	9	0.735
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_KT897276	Clostridium botulinum strain INGR16-02E1 plasmid pINGR16-02E1, complete sequence	127266-127299	9	0.735
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_KT897280	Clostridium botulinum strain FI1111E1 plasmid pFI1111E1, complete sequence	136997-137030	9	0.735
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_KT897275	Clostridium botulinum strain IFR 12/29 plasmid p12/29, complete sequence	132152-132185	9	0.735
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_KT897277	Clostridium botulinum strain ST0210E1 plasmid pST0210E1, complete sequence	127266-127299	9	0.735
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_KT897278	Clostridium botulinum strain FWSKR40E1 plasmid pFWSKR40E1, complete sequence	134422-134455	9	0.735
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_KT897279	Clostridium botulinum strain SWKR38E2 plasmid pSWKR38E2, complete sequence	135558-135591	9	0.735
NC_004557_1	1.33\|1219466\|35\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1219466-1219500	35	MT457553	Shewanella phage Thanatos-2, complete genome	40254-40288	10	0.714
NC_004557_1	1.33\|1219466\|35\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1219466-1219500	35	MT457552	Shewanella phage Thanatos-1, complete genome	36870-36904	10	0.714
NC_004557_2	2.7\|1571188\|36\|NC_004557\|CRISPRCasFinder,CRT	1571188-1571223	36	MN693242	Marine virus AFVG_25M170, complete genome	29744-29779	10	0.722
NC_004557_2	2.16\|1571190\|36\|NC_004557\|PILER-CR	1571190-1571225	36	MN693242	Marine virus AFVG_25M170, complete genome	29744-29779	10	0.722
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MF001361	Enterococcus phage EF5, partial genome	94857-94888	10	0.688
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MN693045	Marine virus AFVG_25M135, complete genome	24068-24099	10	0.688
NC_004557_4	4.1\|1577836\|32\|NC_004557\|PILER-CR	1577836-1577867	32	MF001358	Enterococcus phage EF1, partial genome	22458-22489	10	0.688
NC_004557_4	4.3\|1577835\|34\|NC_004557\|CRISPRCasFinder	1577835-1577868	34	MF186604	Methanosarcina spherical virus, complete genome	969-1002	10	0.706
NC_004557_5	5.1\|1580118\|36\|NC_004557\|CRISPRCasFinder,CRT	1580118-1580153	36	NZ_CP009967	Bacillus cereus E33L plasmid pBCO_1, complete sequence	449487-449522	10	0.722
NC_004557_5	5.1\|1580118\|36\|NC_004557\|CRISPRCasFinder,CRT	1580118-1580153	36	NZ_CP053657	Bacillus cereus strain CTMA_1571 plasmid p.1, complete sequence	85812-85847	10	0.722
NC_004557_5	5.1\|1580118\|36\|NC_004557\|CRISPRCasFinder,CRT	1580118-1580153	36	NC_007103	Bacillus cereus E33L plasmid pE33L466, complete sequence	338896-338931	10	0.722
NC_004557_5	5.1\|1580118\|36\|NC_004557\|CRISPRCasFinder,CRT	1580118-1580153	36	CP024685	Bacillus wiedmannii bv. thuringiensis strain FCC41 plasmid pFCC41-1-490K, complete sequence	33508-33543	10	0.722
NC_004557_5	5.4\|1580314\|34\|NC_004557\|CRISPRCasFinder,CRT	1580314-1580347	34	NZ_AP018284	Chondrocystis sp. NIES-4102 plasmid plasmid3 DNA, complete genome	83426-83459	10	0.706
NC_004557_5	5.5\|1580119\|36\|NC_004557\|PILER-CR	1580119-1580154	36	NZ_CP009967	Bacillus cereus E33L plasmid pBCO_1, complete sequence	449487-449522	10	0.722
NC_004557_5	5.5\|1580119\|36\|NC_004557\|PILER-CR	1580119-1580154	36	NZ_CP053657	Bacillus cereus strain CTMA_1571 plasmid p.1, complete sequence	85812-85847	10	0.722
NC_004557_5	5.5\|1580119\|36\|NC_004557\|PILER-CR	1580119-1580154	36	NC_007103	Bacillus cereus E33L plasmid pE33L466, complete sequence	338896-338931	10	0.722
NC_004557_5	5.5\|1580119\|36\|NC_004557\|PILER-CR	1580119-1580154	36	CP024685	Bacillus wiedmannii bv. thuringiensis strain FCC41 plasmid pFCC41-1-490K, complete sequence	33508-33543	10	0.722
NC_004557_5	5.8\|1580315\|34\|NC_004557\|PILER-CR	1580315-1580348	34	NZ_AP018284	Chondrocystis sp. NIES-4102 plasmid plasmid3 DNA, complete genome	83426-83459	10	0.706
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	NZ_CP022140	Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence	55234-55267	10	0.706
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	MH617769	Siphoviridae sp. isolate ctjc_2, complete genome	42776-42809	10	0.706
NC_004557_6	6.4\|1589907\|34\|NC_004557\|CRISPRCasFinder	1589907-1589940	34	LR588166	Pseudomonas phage vB_PaeM_MIJ3	50432-50465	10	0.706
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	NZ_CP022140	Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence	55234-55267	10	0.706
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	MH617769	Siphoviridae sp. isolate ctjc_2, complete genome	42776-42809	10	0.706
NC_004557_6	6.5\|1589971\|34\|NC_004557\|CRISPRCasFinder	1589971-1590004	34	LR588166	Pseudomonas phage vB_PaeM_MIJ3	50432-50465	10	0.706
NC_004557_8	8.1\|1595980\|35\|NC_004557\|CRISPRCasFinder	1595980-1596014	35	MN694169	Marine virus AFVG_250M458, complete genome	620-654	10	0.714
NC_004557_1	1.19\|1218532\|36\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1218532-1218567	36	NZ_CP010123	Escherichia coli strain C5 plasmid A, complete genome	146371-146406	11	0.694
NC_004557_1	1.28\|1219135\|38\|NC_004557\|PILER-CR,CRISPRCasFinder,CRT	1219135-1219172	38	NC_011737	Gloeothece citriformis PCC 7424 plasmid pP742402, complete sequence	86193-86230	11	0.711

1. spacer 1.6|1217671|35|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to KM983328 (Clostridium phage phiCT453B, complete genome) position: , mismatch: 0, identity: 1.0

ttgttcgtaactgttaaagctatctttctttatgc	CRISPR spacer
ttgttcgtaactgttaaagctatctttctttatgc	Protospacer
***********************************

2. spacer 3.1|1573265|34|NC_004557|CRISPRCasFinder,CRT matches to KM983328 (Clostridium phage phiCT453B, complete genome) position: , mismatch: 0, identity: 1.0

ttaatccagataaaatatattctcttacagcaat	CRISPR spacer
ttaatccagataaaatatattctcttacagcaat	Protospacer
**********************************

3. spacer 3.1|1573265|34|NC_004557|CRISPRCasFinder,CRT matches to KM983334 (Clostridium phage phiCTC2B, complete genome) position: , mismatch: 0, identity: 1.0

ttaatccagataaaatatattctcttacagcaat	CRISPR spacer
ttaatccagataaaatatattctcttacagcaat	Protospacer
**********************************

4. spacer 3.1|1573265|34|NC_004557|CRISPRCasFinder,CRT matches to KM983331 (Clostridium phage phiCT19406B, complete genome) position: , mismatch: 0, identity: 1.0

ttaatccagataaaatatattctcttacagcaat	CRISPR spacer
ttaatccagataaaatatattctcttacagcaat	Protospacer
**********************************

5. spacer 3.3|1573393|35|NC_004557|CRISPRCasFinder,CRT,PILER-CR matches to KM983328 (Clostridium phage phiCT453B, complete genome) position: , mismatch: 0, identity: 1.0

agatgttttaacaacgataatgaatgcttacaaaa	CRISPR spacer
agatgttttaacaacgataatgaatgcttacaaaa	Protospacer
***********************************

6. spacer 3.5|1573525|35|NC_004557|CRISPRCasFinder,CRT,PILER-CR matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 0, identity: 1.0

gagctacaagataaatacaaagatgtggatttagt	CRISPR spacer
gagctacaagataaatacaaagatgtggatttagt	Protospacer
***********************************

7. spacer 7.2|1592104|34|NC_004557|CRISPRCasFinder,CRT matches to KM983328 (Clostridium phage phiCT453B, complete genome) position: , mismatch: 0, identity: 1.0

atatagagaaatcacttaaaataatagaatttgc	CRISPR spacer
atatagagaaatcacttaaaataatagaatttgc	Protospacer
**********************************

8. spacer 7.8|1592105|34|NC_004557|PILER-CR matches to KM983328 (Clostridium phage phiCT453B, complete genome) position: , mismatch: 0, identity: 1.0

atatagagaaatcacttaaaataatagaatttgc	CRISPR spacer
atatagagaaatcacttaaaataatagaatttgc	Protospacer
**********************************

9. spacer 3.6|1573590|36|NC_004557|CRISPRCasFinder,CRT,PILER-CR matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 1, identity: 0.972

atatgcaatagccatatttcaaagatattcaaagga	CRISPR spacer
atatgcaatagccctatttcaaagatattcaaagga	Protospacer
************* **********************

10. spacer 4.2|1577900|36|NC_004557|PILER-CR matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 1, identity: 0.972

gtacaaaacttacctcaaaaccatctaccagattta	CRISPR spacer
gtacaaaacttacctcaaaaccatttaccagattta	Protospacer
************************.***********

11. spacer 4.4|1577899|38|NC_004557|CRISPRCasFinder matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 1, identity: 0.974

gtacaaaacttacctcaaaaccatctaccagatttaga	CRISPR spacer
gtacaaaacttacctcaaaaccatttaccagatttaga	Protospacer
************************.*************

12. spacer 1.6|1217671|35|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to KM983329 (Clostridium phage phiCT9441A, complete genome) position: , mismatch: 2, identity: 0.943

ttgttcgtaactgttaaagctatctttctttatgc	CRISPR spacer
ttgttcgtaactgttaaaattatctttctttatgc	Protospacer
******************..***************

13. spacer 2.8|1571254|34|NC_004557|CRISPRCasFinder,CRT matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 2, identity: 0.941

accctaattgtagaactacaatagttccgtattt	CRISPR spacer
atcctaattgtagaactgcaatagttccgtattt	Protospacer
*.***************.****************

14. spacer 2.17|1571256|34|NC_004557|PILER-CR matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 2, identity: 0.941

accctaattgtagaactacaatagttccgtattt	CRISPR spacer
atcctaattgtagaactgcaatagttccgtattt	Protospacer
*.***************.****************

15. spacer 1.14|1218204|35|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP013848 (Clostridium botulinum strain Af650 plasmid pRSJ14_1, complete sequence) position: , mismatch: 3, identity: 0.914

gctttaactcttaaaaaagataaagttctaaattc	CRISPR spacer
gatttaactcttaaaaaagatagagttttaaattc	Protospacer
* ********************.****.*******

16. spacer 2.4|1570993|34|NC_004557|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 3, identity: 0.912

gttttgcagaggttcgagaaaaacttaaatatta	CRISPR spacer
ggtttgcagaggttagagaaaaactaaaatatta	Protospacer
* ************ ********** ********

17. spacer 2.13|1570995|34|NC_004557|PILER-CR matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 3, identity: 0.912

gttttgcagaggttcgagaaaaacttaaatatta	CRISPR spacer
ggtttgcagaggttagagaaaaactaaaatatta	Protospacer
* ************ ********** ********

18. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to CP002037 (Lactobacillus salivarius CECT 5713 plasmid pHN3, complete sequence) position: , mismatch: 5, identity: 0.844

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
cgatagcttctactaattcgttcttattcatt	Protospacer
. * *************** **.*********

19. spacer 2.7|1571188|36|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP013615 (Clostridium perfringens strain JP838 plasmid pJFP838A, complete sequence) position: , mismatch: 6, identity: 0.833

aggttgggactgttggggaaatgaagtaaatcttaa--	CRISPR spacer
aggttgggattgttggggaaatgaagt--tttttagat	Protospacer
*********.*****************   *.***.

20. spacer 2.16|1571190|36|NC_004557|PILER-CR matches to NZ_CP013615 (Clostridium perfringens strain JP838 plasmid pJFP838A, complete sequence) position: , mismatch: 6, identity: 0.833

aggttgggactgttggggaaatgaagtaaatcttaa--	CRISPR spacer
aggttgggattgttggggaaatgaagt--tttttagat	Protospacer
*********.*****************   *.***.

21. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NZ_CP045273 (Bacillus megaterium strain FDU301 plasmid pFDU301A, complete sequence) position: , mismatch: 6, identity: 0.812

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
ctacttcttcaactaattctttttcattcatt	Protospacer
.**   **** *************.*******

22. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NZ_CP015592 (Bacillus cereus strain AR156 plasmid pAR460, complete sequence) position: , mismatch: 6, identity: 0.812

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
ctacactttttactaattctgttttattcatt	Protospacer
.** * .**.********** ***********

23. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NZ_CP009368 (Bacillus cereus strain FM1 plasmid unnamed, complete sequence) position: , mismatch: 6, identity: 0.812

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
ctacactttttactaattctgttttattcatt	Protospacer
.** * .**.********** ***********

24. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MT774380 (CrAssphage cr1_1, complete genome) position: , mismatch: 6, identity: 0.812

ttaaagcttctactaattcttttttat-tcatt	CRISPR spacer
caaaagcttctactaattattatttatatcaa-	Protospacer
. **************** ** ***** ***

25. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to NZ_CP045273 (Bacillus megaterium strain FDU301 plasmid pFDU301A, complete sequence) position: , mismatch: 6, identity: 0.824

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
ctacttcttcaactaattctttttcattcattgt	Protospacer
.**   **** *************.*********

26. spacer 2.7|1571188|36|NC_004557|CRISPRCasFinder,CRT matches to MN693162 (Marine virus AFVG_25M233, complete genome) position: , mismatch: 7, identity: 0.806

aggttgggactgttggggaaatgaagta----aatcttaa	CRISPR spacer
gggttgggattgttggggaaatgaggtataagaatc----	Protospacer
.********.**************.***    ****

27. spacer 2.16|1571190|36|NC_004557|PILER-CR matches to MN693162 (Marine virus AFVG_25M233, complete genome) position: , mismatch: 7, identity: 0.806

aggttgggactgttggggaaatgaagta----aatcttaa	CRISPR spacer
gggttgggattgttggggaaatgaggtataagaatc----	Protospacer
.********.**************.***    ****

28. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NZ_CP033050 (Virgibacillus halodenitrificans strain Bac324 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.781

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
gcaaaccttcaactaattcttttttatatagt	Protospacer
 .*** **** **************** .* *

29. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NZ_CP043831 (Bacillus sp. BS98 plasmid unnamed1) position: , mismatch: 7, identity: 0.781

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
ttaaatcttctactaattcttgtttctcggtc	Protospacer
***** *************** *** *. .*.

30. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NZ_LR214986 (Mycoplasma cynos strain NCTC10142 plasmid 13) position: , mismatch: 7, identity: 0.781

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
tagataattctaataattcttttttattaatt	Protospacer
* .* . ***** *************** ***

31. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NZ_AP017969 (Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-1, complete sequence) position: , mismatch: 7, identity: 0.781

ttaaagcttctactaattcttttttattcatt-	CRISPR spacer
ataaagcttttagtaattc-tttttatgaactt	Protospacer
 ********.** ****** *******  *.*

32. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NC_007021 (Staphylococcus phage Twort, complete genome) position: , mismatch: 7, identity: 0.781

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
tacaagcttctactaattcttgcttaataagt	Protospacer
*  ****************** .*** * * *

33. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MT151386 (Staphylococcus virus Twort, complete genome) position: , mismatch: 7, identity: 0.781

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
tacaagcttctactaattcttgcttaataagt	Protospacer
*  ****************** .*** * * *

34. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to CP002037 (Lactobacillus salivarius CECT 5713 plasmid pHN3, complete sequence) position: , mismatch: 7, identity: 0.794

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
cgatagcttctactaattcgttcttattcattaa	Protospacer
. * *************** **.*********.

35. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to NZ_CP015592 (Bacillus cereus strain AR156 plasmid pAR460, complete sequence) position: , mismatch: 7, identity: 0.794

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
ctacactttttactaattctgttttattcattat	Protospacer
.** * .**.********** ***********.*

36. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to NZ_CP009368 (Bacillus cereus strain FM1 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.794

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
ctacactttttactaattctgttttattcattat	Protospacer
.** * .**.********** ***********.*

37. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to MT774380 (CrAssphage cr1_1, complete genome) position: , mismatch: 7, identity: 0.794

ttaaagcttctactaattcttttttat-tcattgt	CRISPR spacer
caaaagcttctactaattattatttatatcaagg-	Protospacer
. **************** ** ***** ***  *

38. spacer 7.2|1592104|34|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP024873 (Leptospira mayottensis 200901116 plasmid p1_L200901116, complete sequence) position: , mismatch: 7, identity: 0.794

atatagagaaatcacttaaaataatagaatttgc	CRISPR spacer
atttctaaatatcacttaaaataactgaatttgc	Protospacer
** *  *.* **************. ********

39. spacer 7.8|1592105|34|NC_004557|PILER-CR matches to NZ_CP024873 (Leptospira mayottensis 200901116 plasmid p1_L200901116, complete sequence) position: , mismatch: 7, identity: 0.794

atatagagaaatcacttaaaataatagaatttgc	CRISPR spacer
atttctaaatatcacttaaaataactgaatttgc	Protospacer
** *  *.* **************. ********

40. spacer 1.25|1218935|37|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 8, identity: 0.784

gtgttacatctcccaatttctcctcataatactttaa	CRISPR spacer
catttgaatttcctaatttctcctcataatactttag	Protospacer
   **. **.***.**********************.

41. spacer 1.25|1218935|37|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 8, identity: 0.784

gtgttacatctcccaatttctcctcataatactttaa	CRISPR spacer
catttgaatttcctaatttctcctcataatactttag	Protospacer
   **. **.***.**********************.

42. spacer 2.3|1570929|34|NC_004557|CRISPRCasFinder,CRT matches to NC_028838 (Clostridium phage phiCD506, complete genome) position: , mismatch: 8, identity: 0.765

gcttaggctaggagctacctctttttttattttt	CRISPR spacer
taatttgctagttgctacctctttttttatttta	Protospacer
   *  *****  ********************

43. spacer 2.6|1571123|35|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP039845 (Acetobacter pasteurianus strain CICC 22518 plasmid pAP22518-1, complete sequence) position: , mismatch: 8, identity: 0.771

tttcttgcaaccatagcacatagttgcagcataac-	CRISPR spacer
ctatttgcaaccatagaacatggttgcag-gtatcg	Protospacer
.* .************ ****.******* .** *

44. spacer 2.7|1571188|36|NC_004557|CRISPRCasFinder,CRT matches to MN693344 (Marine virus AFVG_25M232, complete genome) position: , mismatch: 8, identity: 0.778

aggttgggactgttggggaaatgaagtaaatcttaa-----	CRISPR spacer
gggttgggattgttggggaaatgaggta-----taagaata	Protospacer
.********.**************.***     ***

45. spacer 2.7|1571188|36|NC_004557|CRISPRCasFinder,CRT matches to AP013454 (Uncultured Mediterranean phage uvMED DNA, complete genome, group G17, isolate: uvMED-CGR-U-MedDCM-OCT-S33-C36) position: , mismatch: 8, identity: 0.778

aggttgggactgttggggaaatgaagtaaatcttaa-----	CRISPR spacer
aggttgggattgttggggtaatgaagt-----ttgattgtt	Protospacer
*********.******** ********     **.*

46. spacer 2.12|1570931|34|NC_004557|PILER-CR matches to NC_028838 (Clostridium phage phiCD506, complete genome) position: , mismatch: 8, identity: 0.765

gcttaggctaggagctacctctttttttattttt	CRISPR spacer
taatttgctagttgctacctctttttttatttta	Protospacer
   *  *****  ********************

47. spacer 2.15|1571125|35|NC_004557|PILER-CR matches to NZ_CP039845 (Acetobacter pasteurianus strain CICC 22518 plasmid pAP22518-1, complete sequence) position: , mismatch: 8, identity: 0.771

tttcttgcaaccatagcacatagttgcagcataac-	CRISPR spacer
ctatttgcaaccatagaacatggttgcag-gtatcg	Protospacer
.* .************ ****.******* .** *

48. spacer 2.16|1571190|36|NC_004557|PILER-CR matches to MN693344 (Marine virus AFVG_25M232, complete genome) position: , mismatch: 8, identity: 0.778

aggttgggactgttggggaaatgaagtaaatcttaa-----	CRISPR spacer
gggttgggattgttggggaaatgaggta-----taagaata	Protospacer
.********.**************.***     ***

49. spacer 2.16|1571190|36|NC_004557|PILER-CR matches to AP013454 (Uncultured Mediterranean phage uvMED DNA, complete genome, group G17, isolate: uvMED-CGR-U-MedDCM-OCT-S33-C36) position: , mismatch: 8, identity: 0.778

aggttgggactgttggggaaatgaagtaaatcttaa-----	CRISPR spacer
aggttgggattgttggggtaatgaagt-----ttgattgtt	Protospacer
*********.******** ********     **.*

50. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MF186604 (Methanosarcina spherical virus, complete genome) position: , mismatch: 8, identity: 0.75

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
gtgtcctttctactaattcttttttagtcatg	Protospacer
 *.   .******************* ****

51. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to AP014322 (Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S33-C37, *** SEQUENCING IN PROGRESS ***) position: , mismatch: 8, identity: 0.75

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
gtcttacatctactaataattttttattcatt	Protospacer
 *   .* *********  *************

52. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to NC_019749 (Stanieria cyanosphaera PCC 7437 plasmid pSTA7437.02, complete sequence) position: , mismatch: 8, identity: 0.75

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
tttttccttctactaactctttattattcggt	Protospacer
**    **********.***** ******. *

53. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MK614706 (Gammaproteobacteria virus GOV_bin_2604, complete genome) position: , mismatch: 8, identity: 0.75

---ttaaagcttctactaattcttttttattcatt	CRISPR spacer
tgttccaa---tctactatttcttttttagtcata	Protospacer
   *. **   ******* ********** ****

54. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MT325768 (Psychrobacillus phage Perkons, complete genome) position: , mismatch: 8, identity: 0.75

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
gaagtgtttctagtaattcttttatattcaat	Protospacer
  *. *.***** ********** ****** *

55. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to NZ_CP043831 (Bacillus sp. BS98 plasmid unnamed1) position: , mismatch: 8, identity: 0.765

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
ttaaatcttctactaattcttgtttctcggtctt	Protospacer
***** *************** *** *. .*. *

56. spacer 5.1|1580118|36|NC_004557|CRISPRCasFinder,CRT matches to MN693129 (Marine virus AFVG_25M62, complete genome) position: , mismatch: 8, identity: 0.778

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
ttttacattttctttaaacataaataaaaaatcttt	Protospacer
   *.**.**********.***************

57. spacer 5.5|1580119|36|NC_004557|PILER-CR matches to MN693129 (Marine virus AFVG_25M62, complete genome) position: , mismatch: 8, identity: 0.778

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
ttttacattttctttaaacataaataaaaaatcttt	Protospacer
   *.**.**********.***************

58. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_CP017256 (Clostridium taeniosporum strain 1/k plasmid pCt3, complete sequence) position: , mismatch: 8, identity: 0.765

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
cattttctgtgatttcttcatcttcaaaaaatac	Protospacer
* **.***** *************** *   **

59. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NC_011732 (Gloeothece citriformis PCC 7424 plasmid pP742404, complete sequence) position: , mismatch: 8, identity: 0.765

ctttctctgttatttcttcatcttcatattttaa------	CRISPR spacer
ctttatctgttctttcttcatc------ttttaaaactcc	Protospacer
**** ****** **********      ******

60. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_CP017256 (Clostridium taeniosporum strain 1/k plasmid pCt3, complete sequence) position: , mismatch: 8, identity: 0.765

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
cattttctgtgatttcttcatcttcaaaaaatac	Protospacer
* **.***** *************** *   **

61. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NC_011732 (Gloeothece citriformis PCC 7424 plasmid pP742404, complete sequence) position: , mismatch: 8, identity: 0.765

ctttctctgttatttcttcatcttcatattttaa------	CRISPR spacer
ctttatctgttctttcttcatc------ttttaaaactcc	Protospacer
**** ****** **********      ******

62. spacer 7.1|1592039|35|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP026601 (Clostridiaceae bacterium 14S0207 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.771

gtgctgcacttctagaacttaaattacattccttt	CRISPR spacer
gtgctgcacttcttgaacttaatttatttttaatc	Protospacer
************* ******** ***. **.  *.

63. spacer 7.7|1592040|35|NC_004557|PILER-CR matches to NZ_CP026601 (Clostridiaceae bacterium 14S0207 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.771

gtgctgcacttctagaacttaaattacattccttt	CRISPR spacer
gtgctgcacttcttgaacttaatttatttttaatc	Protospacer
************* ******** ***. **.  *.

64. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MH617682 (Microviridae sp. isolate ctcb14, complete genome) position: , mismatch: 9, identity: 0.719

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
ataatgcttttactaattctttttcggacgct	Protospacer
 *** ****.**************..  *..*

65. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to NZ_CP033050 (Virgibacillus halodenitrificans strain Bac324 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.735

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
gcaaaccttcaactaattcttttttatatagttc	Protospacer
 .*** **** **************** .* * .

66. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to NZ_LR214986 (Mycoplasma cynos strain NCTC10142 plasmid 13) position: , mismatch: 9, identity: 0.735

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
tagataattctaataattcttttttattaatttc	Protospacer
* .* . ***** *************** *** .

67. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to AP014322 (Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S33-C37, *** SEQUENCING IN PROGRESS ***) position: , mismatch: 9, identity: 0.735

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
gtcttacatctactaataattttttattcatttt	Protospacer
 *   .* *********  ************* *

68. spacer 5.3|1580250|34|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP015331 (Borrelia hermsii HS1 isolate Browne Mountain plasmid lpN31, complete sequence) position: , mismatch: 9, identity: 0.735

aagagttgcacttttttatataatctcttttagg	CRISPR spacer
aaaatactgtcttttttatgtcatctcttttagg	Protospacer
**.*  .   *********.* ************

69. spacer 5.3|1580250|34|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP039041 (Piscirickettsia salmonis strain Psal-072 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.735

aagagttgcacttttttatataatctcttttagg	CRISPR spacer
aaagatgtcacttttttaaataatgtcttttact	Protospacer
**...*  ********** ***** *******

70. spacer 5.3|1580250|34|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP039048 (Piscirickettsia salmonis strain Psal-073 plasmid unnamed2, complete sequence) position: , mismatch: 9, identity: 0.735

aagagttgcacttttttatataatctcttttagg	CRISPR spacer
aaagatgtcacttttttaaataatgtcttttact	Protospacer
**...*  ********** ***** *******

71. spacer 5.7|1580251|34|NC_004557|PILER-CR matches to NZ_CP015331 (Borrelia hermsii HS1 isolate Browne Mountain plasmid lpN31, complete sequence) position: , mismatch: 9, identity: 0.735

aagagttgcacttttttatataatctcttttagg	CRISPR spacer
aaaatactgtcttttttatgtcatctcttttagg	Protospacer
**.*  .   *********.* ************

72. spacer 5.7|1580251|34|NC_004557|PILER-CR matches to NZ_CP039041 (Piscirickettsia salmonis strain Psal-072 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.735

aagagttgcacttttttatataatctcttttagg	CRISPR spacer
aaagatgtcacttttttaaataatgtcttttact	Protospacer
**...*  ********** ***** *******

73. spacer 5.7|1580251|34|NC_004557|PILER-CR matches to NZ_CP039048 (Piscirickettsia salmonis strain Psal-073 plasmid unnamed2, complete sequence) position: , mismatch: 9, identity: 0.735

aagagttgcacttttttatataatctcttttagg	CRISPR spacer
aaagatgtcacttttttaaataatgtcttttact	Protospacer
**...*  ********** ***** *******

74. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_KT897276 (Clostridium botulinum strain INGR16-02E1 plasmid pINGR16-02E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

75. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_KT897280 (Clostridium botulinum strain FI1111E1 plasmid pFI1111E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

76. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_KT897275 (Clostridium botulinum strain IFR 12/29 plasmid p12/29, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgatgctgttatttctttaccttcatatttaat	Protospacer
 *  . ************.*.********** *

77. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_KT897277 (Clostridium botulinum strain ST0210E1 plasmid pST0210E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

78. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_KT897278 (Clostridium botulinum strain FWSKR40E1 plasmid pFWSKR40E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

79. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_KT897279 (Clostridium botulinum strain SWKR38E2 plasmid pSWKR38E2, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

80. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_KT897276 (Clostridium botulinum strain INGR16-02E1 plasmid pINGR16-02E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

81. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_KT897280 (Clostridium botulinum strain FI1111E1 plasmid pFI1111E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

82. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_KT897275 (Clostridium botulinum strain IFR 12/29 plasmid p12/29, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgatgctgttatttctttaccttcatatttaat	Protospacer
 *  . ************.*.********** *

83. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_KT897277 (Clostridium botulinum strain ST0210E1 plasmid pST0210E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

84. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_KT897278 (Clostridium botulinum strain FWSKR40E1 plasmid pFWSKR40E1, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

85. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_KT897279 (Clostridium botulinum strain SWKR38E2 plasmid pSWKR38E2, complete sequence) position: , mismatch: 9, identity: 0.735

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atgaggctgttatttctttaccttcatatttaat	Protospacer
 *    ************.*.********** *

86. spacer 1.33|1219466|35|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to MT457553 (Shewanella phage Thanatos-2, complete genome) position: , mismatch: 10, identity: 0.714

atatgtgatgatgaattagagaaagtgcttgaaag	CRISPR spacer
tctagtgatgatgaattagataaattgctaaatgg	Protospacer
 .  **************** *** **** .* .*

87. spacer 1.33|1219466|35|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to MT457552 (Shewanella phage Thanatos-1, complete genome) position: , mismatch: 10, identity: 0.714

atatgtgatgatgaattagagaaagtgcttgaaag	CRISPR spacer
tctggtgatgatgaattagataaattgctaaatgg	Protospacer
 .  **************** *** **** .* .*

88. spacer 2.7|1571188|36|NC_004557|CRISPRCasFinder,CRT matches to MN693242 (Marine virus AFVG_25M170, complete genome) position: , mismatch: 10, identity: 0.722

aggttgggactgttggggaaatgaagtaaatcttaa	CRISPR spacer
tggttgggattgttggggtaatgaagtatgacaagt	Protospacer
 ********.******** ********* . *  .

89. spacer 2.16|1571190|36|NC_004557|PILER-CR matches to MN693242 (Marine virus AFVG_25M170, complete genome) position: , mismatch: 10, identity: 0.722

aggttgggactgttggggaaatgaagtaaatcttaa	CRISPR spacer
tggttgggattgttggggtaatgaagtatgacaagt	Protospacer
 ********.******** ********* . *  .

90. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MF001361 (Enterococcus phage EF5, partial genome) position: , mismatch: 10, identity: 0.688

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
cagttttttctactagtccttttttattcaat	Protospacer
. .   .********.*.************ *

91. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MN693045 (Marine virus AFVG_25M135, complete genome) position: , mismatch: 10, identity: 0.688

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
ctaaagcctttactaattctttttctaagtct	Protospacer
.******.*.**************.     .*

92. spacer 4.1|1577836|32|NC_004557|PILER-CR matches to MF001358 (Enterococcus phage EF1, partial genome) position: , mismatch: 10, identity: 0.688

ttaaagcttctactaattcttttttattcatt	CRISPR spacer
cagttttttctactagtccttttttattcaat	Protospacer
. .   .********.*.************ *

93. spacer 4.3|1577835|34|NC_004557|CRISPRCasFinder matches to MF186604 (Methanosarcina spherical virus, complete genome) position: , mismatch: 10, identity: 0.706

ttaaagcttctactaattcttttttattcattgt	CRISPR spacer
gtgtcctttctactaattcttttttagtcatgca	Protospacer
 *.   .******************* ****

94. spacer 5.1|1580118|36|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP009967 (Bacillus cereus E33L plasmid pBCO_1, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

95. spacer 5.1|1580118|36|NC_004557|CRISPRCasFinder,CRT matches to NZ_CP053657 (Bacillus cereus strain CTMA_1571 plasmid p.1, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

96. spacer 5.1|1580118|36|NC_004557|CRISPRCasFinder,CRT matches to NC_007103 (Bacillus cereus E33L plasmid pE33L466, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

97. spacer 5.1|1580118|36|NC_004557|CRISPRCasFinder,CRT matches to CP024685 (Bacillus wiedmannii bv. thuringiensis strain FCC41 plasmid pFCC41-1-490K, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

98. spacer 5.4|1580314|34|NC_004557|CRISPRCasFinder,CRT matches to NZ_AP018284 (Chondrocystis sp. NIES-4102 plasmid plasmid3 DNA, complete genome) position: , mismatch: 10, identity: 0.706

ttggagatttaaaggaagcttataaatatttcta	CRISPR spacer
tcagtattttaaaataagcttataaatatttaat	Protospacer
*..* . ******. ****************

99. spacer 5.5|1580119|36|NC_004557|PILER-CR matches to NZ_CP009967 (Bacillus cereus E33L plasmid pBCO_1, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

100. spacer 5.5|1580119|36|NC_004557|PILER-CR matches to NZ_CP053657 (Bacillus cereus strain CTMA_1571 plasmid p.1, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

101. spacer 5.5|1580119|36|NC_004557|PILER-CR matches to NC_007103 (Bacillus cereus E33L plasmid pE33L466, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

102. spacer 5.5|1580119|36|NC_004557|PILER-CR matches to CP024685 (Bacillus wiedmannii bv. thuringiensis strain FCC41 plasmid pFCC41-1-490K, complete sequence) position: , mismatch: 10, identity: 0.722

ggatgcactttctttaaatataaataaaaaatctaa	CRISPR spacer
caaaaaattttcattaaatataaaaaaaaaatcttg	Protospacer
 .* . *.**** *********** ********* .

103. spacer 5.8|1580315|34|NC_004557|PILER-CR matches to NZ_AP018284 (Chondrocystis sp. NIES-4102 plasmid plasmid3 DNA, complete genome) position: , mismatch: 10, identity: 0.706

ttggagatttaaaggaagcttataaatatttcta	CRISPR spacer
tcagtattttaaaataagcttataaatatttaat	Protospacer
*..* . ******. ****************

104. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to NZ_CP022140 (Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.706

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
cgaaatctgttattttttcatctttatatacgag	Protospacer
*    **********.********.**** . *.

105. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to MH617769 (Siphoviridae sp. isolate ctjc_2, complete genome) position: , mismatch: 10, identity: 0.706

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atactgatattattttttcattttcatattttat	Protospacer
 * ..  *.******.*****.***********

106. spacer 6.4|1589907|34|NC_004557|CRISPRCasFinder matches to LR588166 (Pseudomonas phage vB_PaeM_MIJ3) position: , mismatch: 10, identity: 0.706

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
aaatatcttttatttctttatcttcatatccgta	Protospacer
   * *** *********.**********..  *

107. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to NZ_CP022140 (Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.706

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
cgaaatctgttattttttcatctttatatacgag	Protospacer
*    **********.********.**** . *.

108. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to MH617769 (Siphoviridae sp. isolate ctjc_2, complete genome) position: , mismatch: 10, identity: 0.706

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
atactgatattattttttcattttcatattttat	Protospacer
 * ..  *.******.*****.***********

109. spacer 6.5|1589971|34|NC_004557|CRISPRCasFinder matches to LR588166 (Pseudomonas phage vB_PaeM_MIJ3) position: , mismatch: 10, identity: 0.706

ctttctctgttatttcttcatcttcatattttaa	CRISPR spacer
aaatatcttttatttctttatcttcatatccgta	Protospacer
   * *** *********.**********..  *

110. spacer 8.1|1595980|35|NC_004557|CRISPRCasFinder matches to MN694169 (Marine virus AFVG_250M458, complete genome) position: , mismatch: 10, identity: 0.714

gtacctgtgccaagactattaaatttttttgctaa	CRISPR spacer
aattttgtgcctagactatgaaatttttttccaat	Protospacer
.  ..****** ******* ********** * *

111. spacer 1.19|1218532|36|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP010123 (Escherichia coli strain C5 plasmid A, complete genome) position: , mismatch: 11, identity: 0.694

tttaaatctggtttattttttacattcttccaatcc	CRISPR spacer
tttaaagctggtttatttttaacattaaggagttta	Protospacer
****** ************* *****     . *.

112. spacer 1.28|1219135|38|NC_004557|PILER-CR,CRISPRCasFinder,CRT matches to NC_011737 (Gloeothece citriformis PCC 7424 plasmid pP742402, complete sequence) position: , mismatch: 11, identity: 0.711

tatctaactcaatattttcttcttttacatcctgttta	CRISPR spacer
tttctaactgaatatcttcttcttttacaactccccat	Protospacer
* ******* *****.************* *.. ..

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

688595 : 695591

Staphylococcus_phage(33.33%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_035110796.1\|688595_689678_+	bifunctional diaminohydroxyphosphoribosylaminopyrimidine deaminase/5-amino-6-(5-phosphoribosylamino)uracil reductase RibD	A0A1V0SE20	Indivirus	7.8e-57	38.3
WP_011098943.1\|689706_690357_+	riboflavin synthase	A0A2I2L4R9	Orpheovirus	2.4e-21	39.4
WP_035110798.1\|690718_691918_+	bifunctional 3,4-dihydroxy-2-butanone-4-phosphate synthase/GTP cyclohydrolase II	A0A2H4PQS2	Staphylococcus_phage	4.8e-108	51.6
WP_011098945.1\|691943_692405_+	6,7-dimethyl-8-ribityllumazine synthase	A0A2H4PQS3	Staphylococcus_phage	8.7e-42	57.7
WP_011098946.1\|692723_693743_+	RnfABCDGE type electron transport complex subunit G	NA	NA	NA	NA
WP_011098947.1\|693836_694232_+	hypothetical protein	NA	NA	NA	NA
WP_011098948.1\|694389_695022_+	HD domain-containing protein	A0A2I7QY60	Vibrio_phage	4.0e-05	30.6
WP_011098949.1\|695072_695591_+	peptidylprolyl isomerase	A0A1B1IVS0	uncultured_Mediterranean_phage	1.2e-20	41.0

DBSCAN-SWA_2

1133918 : 1184898

Clostridium_phage(95.59%)

capsid,holin,terminase,tail,portal

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_011099308.1\|1133918_1135136_+	U32 family peptidase	Q6DW11	Phage_TP	4.8e-55	38.0
WP_011099309.1\|1135166_1135796_+	uridine kinase	A0A2K9L178	Tupanvirus	2.0e-36	42.4
WP_078688072.1\|1135961_1137494_+	hypothetical protein	NA	NA	NA	NA
WP_128993679.1\|1137611_1138064_+	sigma-70 family RNA polymerase sigma factor	S6ANS0	Bacillus_phage	7.1e-12	39.0
WP_011099312.1\|1138053_1139562_-	recombinase family protein	A0A0A7S0M8	Clostridium_phage	5.6e-287	100.0
WP_035125317.1\|1139584_1139869_-	hypothetical protein	A0A0A7RW25	Clostridium_phage	4.7e-30	100.0
WP_011099313.1\|1139886_1140231_-	hypothetical protein	A0A0A7RU12	Clostridium_phage	1.4e-15	100.0
WP_011099314.1\|1140257_1140716_-	ImmA/IrrE family metallo-endopeptidase	A0A0A7RTX7	Clostridium_phage	3.5e-83	100.0
WP_052042385.1\|1140731_1141175_-	helix-turn-helix transcriptional regulator	A0A0A7RTW0	Clostridium_phage	1.8e-76	100.0
WP_035125315.1\|1141335_1141551_+	DUF739 family protein	A0A0A7S0N3	Clostridium_phage	1.9e-31	100.0
WP_011099316.1\|1141557_1142370_+	phage antirepressor KilAC domain-containing protein	A0A0A7RW33	Clostridium_phage	2.0e-150	100.0
WP_128993678.1\|1142402_1142804_-	hypothetical protein	A0A0A7RVV6	Clostridium_phage	2.1e-63	97.7
WP_035125388.1\|1143364_1143622_+	hypothetical protein	A0A0A7RTW4	Clostridium_phage	6.1e-45	100.0
WP_041744719.1\|1144109_1145051_+	YqaJ viral recombinase family protein	A0A0A7RWR9	Clostridium_phage	9.4e-176	100.0
WP_011099320.1\|1145052_1145859_+	recombinase RecT	A0A0A7RUP3	Clostridium_phage	4.9e-149	100.0
WP_035124629.1\|1145851_1146031_+	hypothetical protein	A0A0A7RU21	Clostridium_phage	1.6e-31	100.0
WP_011099321.1\|1146048_1146927_+	DnaD domain protein	A0A0A7RTY6	Clostridium_phage	2.6e-127	100.0
WP_011099322.1\|1146939_1147314_+	hypothetical protein	A0A0A7RTW8	Clostridium_phage	9.2e-66	100.0
WP_011099323.1\|1147395_1147824_+	DUF1064 domain-containing protein	A0A0A7S0P1	Clostridium_phage	5.6e-75	100.0
WP_011099324.1\|1147820_1148450_+	hypothetical protein	A0A0A7RW43	Clostridium_phage	2.9e-120	100.0
WP_035110041.1\|1148624_1149065_-	DNA starvation/stationary phase protection protein	A0A0A7RTZ1	Clostridium_phage	8.0e-77	100.0
WP_035110040.1\|1149549_1149711_+	hypothetical protein	A0A0A7RTX2	Clostridium_phage	1.4e-23	100.0
WP_035110039.1\|1149691_1149889_+	hypothetical protein	A0A0A7S0P6	Clostridium_phage	1.2e-29	100.0
WP_155274221.1\|1149891_1150032_+	hypothetical protein	A0A0A7RW51	Clostridium_phage	2.1e-15	100.0
WP_035124920.1\|1150031_1150232_+	hypothetical protein	A0A0A7RU32	Clostridium_phage	9.3e-33	100.0
WP_011099326.1\|1150269_1150581_+	AsnC family protein	A0A0A7RTZ6	Clostridium_phage	1.2e-50	100.0
WP_011099327.1\|1150592_1151060_+	hypothetical protein	A0A0A7RTX6	Clostridium_phage	5.7e-81	100.0
WP_162827854.1\|1151296_1151473_+	hypothetical protein	A0A0A7S0Q0	Clostridium_phage	1.2e-23	100.0
WP_035110030.1\|1151704_1151947_+	hypothetical protein	A0A0A7RW57	Clostridium_phage	2.1e-39	100.0
WP_011099328.1\|1152544_1153633_+	hypothetical protein	A0A0A7RU01	Clostridium_phage	3.1e-215	100.0
WP_011099329.1\|1153678_1154602_+\|terminase	terminase small subunit	A0A0A7RTY1	Clostridium_phage	4.6e-167	100.0
WP_011099330.1\|1154591_1155935_+\|terminase	PBSX family phage terminase large subunit	A0A0A7S0Q5	Clostridium_phage	1.1e-267	100.0
WP_011099331.1\|1155934_1157392_+\|portal	phage portal protein	A0A0A7RW62	Clostridium_phage	2.3e-285	100.0
WP_011099332.1\|1157448_1157922_+	hypothetical protein	A0A0A7RU41	Clostridium_phage	4.1e-79	100.0
WP_011099333.1\|1157958_1159659_+	hypothetical protein	A0A0A7RU06	Clostridium_phage	0.0e+00	100.0
WP_035124918.1\|1159655_1159856_+	hypothetical protein	A0A0A7RTY7	Clostridium_phage	5.1e-31	100.0
WP_035124916.1\|1159919_1160120_+	hypothetical protein	A0A0A7S0R0	Clostridium_phage	4.9e-34	100.0
WP_035124914.1\|1160119_1160737_+	phage scaffolding protein	A0A0A7RW68	Clostridium_phage	2.1e-107	100.0
WP_011099335.1\|1160751_1161084_+	hypothetical protein	A0A0A7RU46	Clostridium_phage	2.3e-52	100.0
WP_011099336.1\|1161103_1162138_+\|capsid	major capsid protein	A0A0A7RU11	Clostridium_phage	2.1e-189	100.0
WP_035124911.1\|1162193_1162382_+	hypothetical protein	A0A0A7RTZ2	Clostridium_phage	3.0e-25	100.0
WP_035124909.1\|1162384_1162687_+	hypothetical protein	A0A0A7S0R4	Clostridium_phage	2.0e-50	100.0
WP_011099337.1\|1162683_1163049_+	hypothetical protein	A0A0A7RW73	Clostridium_phage	5.1e-61	100.0
WP_115604774.1\|1163050_1163398_+	hypothetical protein	A0A0A7RU51	Clostridium_phage	2.7e-59	100.0
WP_011099339.1\|1163402_1163822_+	hypothetical protein	A0A0A7RU17	Clostridium_phage	4.9e-76	100.0
WP_011099340.1\|1163826_1164699_+	hypothetical protein	A0A0A7RTZ9	Clostridium_phage	1.6e-161	100.0
WP_052042375.1\|1164714_1165176_+	hypothetical protein	A0A0A7S0S0	Clostridium_phage	1.4e-76	100.0
WP_078688091.1\|1165123_1165330_+	hypothetical protein	A0A0A7RW80	Clostridium_phage	8.1e-32	100.0
WP_011099342.1\|1165342_1165669_+	hypothetical protein	A0A0A7RU55	Clostridium_phage	4.9e-55	100.0
WP_011099343.1\|1165726_1167772_+\|tail	phage tail tape measure protein	A0A0A7RU22	Clostridium_phage	6.6e-299	100.0
WP_035124907.1\|1168160_1169258_+	hypothetical protein	A0A0A7RU03	Clostridium_phage	1.5e-209	100.0
WP_011099345.1\|1169257_1169590_+	hypothetical protein	A0A0A7S0S4	Clostridium_phage	2.3e-36	100.0
WP_011099346.1\|1169602_1170163_+	hypothetical protein	A0A0A7RW86	Clostridium_phage	4.4e-104	100.0
WP_011099347.1\|1170159_1171191_+	hypothetical protein	A0A0A7RU61	Clostridium_phage	2.8e-197	100.0
WP_011099348.1\|1171193_1172429_+	hypothetical protein	A0A0A7RU28	Clostridium_phage	1.4e-243	100.0
WP_011099349.1\|1172441_1174334_+	hypothetical protein	A0A0A7RU09	Clostridium_phage	7.8e-230	100.0
WP_023437986.1\|1174338_1174593_+	hypothetical protein	A0A0A7S0T0	Clostridium_phage	9.7e-43	100.0
WP_011099350.1\|1174608_1175607_+	hypothetical protein	A0A0A7RW91	Clostridium_phage	9.0e-193	100.0
WP_035124965.1\|1175617_1176700_+	hypothetical protein	A0A0A7RU66	Clostridium_phage	1.7e-205	100.0
WP_011099352.1\|1176775_1177561_+	discoidin domain-containing protein	A0A0A7RU33	Clostridium_phage	3.2e-153	100.0
WP_011099353.1\|1177610_1178489_+	LamG domain-containing protein	A0A0A7RU14	Clostridium_phage	6.1e-145	100.0
WP_012047659.1\|1179074_1179269_+	hypothetical protein	A0A0A7RU02	Clostridium_phage	6.0e-29	100.0
WP_035109991.1\|1179687_1179921_+	hemolysin XhlA family protein	A0A0A7S0T7	Clostridium_phage	1.6e-36	100.0
WP_035110473.1\|1179938_1180202_+\|holin	phage holin family protein	A0A0A7RW97	Clostridium_phage	8.8e-39	100.0
WP_011099354.1\|1180202_1181003_+	glycoside hydrolase family 73 protein	A0A0A7RU71	Clostridium_phage	4.3e-153	100.0
WP_035109989.1\|1181235_1182288_+	hypothetical protein	A0A0A7RU39	Clostridium_phage	1.5e-201	100.0
WP_035109987.1\|1182271_1182604_+	hypothetical protein	A0A0A7RU20	Clostridium_phage	1.3e-55	99.1
WP_011099356.1\|1182596_1183403_+	hypothetical protein	A0A0A7S0U2	Clostridium_phage	7.9e-147	100.0
WP_011099357.1\|1183755_1184898_+	3'-5' exonuclease	A0A0A7RWA3	Clostridium_phage	2.8e-214	100.0

DBSCAN-SWA_3

1651758 : 1658683

uncultured_Mediterranean_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_011099736.1\|1651758_1652883_-	D-alanyl-D-alanine carboxypeptidase	B6DZZ7	Stx2-converting_phage	1.1e-26	28.6
WP_035109636.1\|1653014_1653521_+	DUF2953 domain-containing protein	NA	NA	NA	NA
WP_011099738.1\|1653538_1653955_+	GerW family sporulation protein	NA	NA	NA	NA
WP_011099739.1\|1654114_1654684_-	segregation/condensation protein B	A0A1B1IVT7	uncultured_Mediterranean_phage	8.6e-23	36.4
WP_011099740.1\|1654658_1655423_-	segregation/condensation protein A	A0A1B1IVW1	uncultured_Mediterranean_phage	9.5e-09	26.4
WP_115638824.1\|1655501_1656656_-	D-alanyl-D-alanine carboxypeptidase	A0A1P8VVG5	Erythrobacter_phage	6.7e-06	31.0
WP_011099742.1\|1656936_1657752_-	purine-nucleoside phosphorylase	Q5YBA4	Grouper_iridovirus	3.3e-60	41.7
WP_035109633.1\|1657783_1658683_-	site-specific tyrosine recombinase XerD	A0A1B1IQT7	uncultured_Mediterranean_phage	1.5e-16	27.5

DBSCAN-SWA_4

1663820 : 1682779

Clostridium_phage(50.0%)

capsid,holin,plate,head,tail,portal

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_011099748.1\|1663820_1664825_-	N-acetylmuramoyl-L-alanine amidase	A0A0A7RUJ1	Clostridium_phage	2.1e-128	69.8
WP_035125262.1\|1664841_1665102_-\|holin	phage holin family protein	A0A0A7RUL4	Clostridium_phage	3.3e-38	98.8
WP_035125153.1\|1665119_1665353_-	hemolysin XhlA family protein	A0A0A7RWZ1	Clostridium_phage	4.9e-33	92.2
WP_011099750.1\|1665625_1666054_-	hypothetical protein	NA	NA	NA	NA
WP_011099751.1\|1666337_1668320_-\|plate	BppU family phage baseplate upper protein	A0A0A7S181	Clostridium_phage	5.2e-293	99.4
WP_035125149.1\|1668303_1668492_-	hypothetical protein	A0A0A7RUH5	Clostridium_phage	2.6e-16	83.3
WP_011099752.1\|1668481_1670374_-\|tail	phage tail protein	A0A0A7RUI9	Clostridium_phage	1.6e-142	61.3
WP_011099753.1\|1670385_1671108_-	hypothetical protein	NA	NA	NA	NA
WP_011099754.1\|1671111_1673850_-\|tail	phage tail tape measure protein	H9A124	Staphylococcus_phage	4.4e-64	42.3
WP_011099756.1\|1673830_1674166_-	hypothetical protein	NA	NA	NA	NA
WP_035125146.1\|1674180_1674483_-	hypothetical protein	NA	NA	NA	NA
WP_011099758.1\|1674529_1675156_-	hypothetical protein	A0A0U4IS63	Bacillus_phage	1.1e-44	44.2
WP_035125143.1\|1675174_1675558_-	hypothetical protein	NA	NA	NA	NA
WP_035125141.1\|1675560_1675887_-	HK97 gp10 family phage protein	NA	NA	NA	NA
WP_011099759.1\|1675873_1676203_-	hypothetical protein	NA	NA	NA	NA
WP_011099760.1\|1676217_1676535_-\|head,tail	phage head-tail connector protein	NA	NA	NA	NA
WP_011099761.1\|1676588_1677404_-	hypothetical protein	A0A0S2MVF8	Bacillus_phage	2.2e-72	51.9
WP_011099762.1\|1677493_1678117_-	DUF4355 domain-containing protein	A0A2H4J4P4	uncultured_Caudovirales_phage	1.2e-22	38.0
WP_011099763.1\|1678198_1679071_-\|capsid	minor capsid protein	A0A1V0DZW9	Clostridioides_phage	1.8e-40	39.8
WP_011099764.1\|1679063_1680335_-\|portal	phage portal protein	A0A1V0DZW8	Clostridioides_phage	6.0e-125	56.2
WP_035125243.1\|1680350_1682081_-	hypothetical protein	A0A1V0DZW7	Clostridioides_phage	3.4e-107	38.2
WP_035125138.1\|1682209_1682779_-	recombinase family protein	M9Q1K0	Clostridium_phage	4.7e-21	37.6

DBSCAN-SWA_5

2053688 : 2060217

Streptococcus_phage(44.44%)

integrase,transposase

attL 2049646:2049662|attR 2064981:2064997

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
2049646:2049662	attL	NA	NA	NA	NA
WP_035109261.1\|2053688_2053901_-	helix-turn-helix transcriptional regulator	B3RH39	Bacillus_virus	3.9e-05	45.2
WP_011100099.1\|2053902_2054295_-	hypothetical protein	NA	NA	NA	NA
WP_035109259.1\|2054548_2054860_-	hypothetical protein	A0A2K5B282	Erysipelothrix_phage	3.0e-30	65.7
WP_035109258.1\|2054929_2056153_-	DNA modification methylase	A0A1B0RXJ0	Streptococcus_phage	6.1e-143	59.2
WP_035109255.1\|2056142_2056583_-	hypothetical protein	Q6DMV1	Streptococcus_phage	9.9e-19	37.3
WP_011100103.1\|2056795_2057179_-	type II toxin-antitoxin system death-on-curing family toxin	D0R0D2	Streptococcus_phage	9.8e-31	52.5
WP_035109252.1\|2057175_2057418_-	type II toxin-antitoxin system Phd/YefM family antitoxin	E4ZFM1	Streptococcus_phage	7.6e-21	58.8
WP_078688053.1\|2057634_2058159_+\|integrase,transposase	DDE-type integrase/transposase/recombinase	A0A2I7SC85	Paenibacillus_phage	1.3e-44	58.1
WP_011100105.1\|2058190_2058736_-	hypothetical protein	NA	NA	NA	NA
WP_011100106.1\|2058778_2059435_-	ParB/RepB/Spo0J family partition protein	H9YS69	environmental_Halophage	2.9e-06	31.5
WP_035109250.1\|2059431_2060217_-	ParA family protein	F0PIG8	Enterococcus_phage	1.4e-23	33.8
2064981:2064997	attR	NA	NA	NA	NA

DBSCAN-SWA_6

2237703 : 2286330

Clostridium_phage(91.43%)

protease,capsid,holin,plate,head,terminase,tail,portal

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_035109085.1\|2237703_2240334_-	DNA polymerase I	S5M8J1	Bacillus_phage	7.9e-55	32.7
WP_035109083.1\|2240355_2241501_-	chorismate synthase	A0A291AU41	Pandoravirus	1.2e-31	29.0
WP_011100261.1\|2241759_2242416_+	hypothetical protein	NA	NA	NA	NA
WP_011100262.1\|2242454_2242931_-	hypothetical protein	NA	NA	NA	NA
WP_035124561.1\|2243229_2243517_-	hypothetical protein	A0A0A7RTU5	Clostridium_phage	3.1e-45	100.0
WP_035124563.1\|2243716_2243869_-	ribbon-helix-helix domain-containing protein	A0A0A7RUX5	Clostridium_phage	5.8e-19	100.0
WP_052042365.1\|2244029_2244266_+	helix-turn-helix transcriptional regulator	A0A0A7RWZ4	Clostridium_phage	5.6e-37	100.0
WP_011100263.1\|2244314_2244782_-	hypothetical protein	A0A0A7S1G5	Clostridium_phage	2.9e-85	100.0
WP_011100264.1\|2244782_2245454_-	SocA family protein	A0A0A7RUP2	Clostridium_phage	9.2e-125	100.0
WP_011100265.1\|2245646_2246447_-	glycoside hydrolase family 73 protein	A0A0A7RUS8	Clostridium_phage	1.2e-152	100.0
WP_035124655.1\|2246447_2246711_-\|holin	phage holin family protein	A0A0A7RUX1	Clostridium_phage	7.4e-38	98.9
WP_035124565.1\|2246728_2246962_-	hemolysin XhlA family protein	A0A0A7RWZ1	Clostridium_phage	9.5e-37	100.0
WP_035124585.1\|2247034_2247310_-	hypothetical protein	A0A0A7S1G2	Clostridium_phage	1.1e-44	100.0
WP_011100267.1\|2247423_2248482_-	hypothetical protein	A0A0A7RUN8	Clostridium_phage	2.4e-204	100.0
WP_035124595.1\|2248484_2248862_-	hypothetical protein	A0A0A7RUS4	Clostridium_phage	9.3e-66	100.0
WP_011100268.1\|2248861_2249521_-	YmfQ family protein	A0A0A7RUW8	Clostridium_phage	5.3e-125	100.0
WP_035124597.1\|2249524_2250172_-	DNRLRE domain-containing protein	A0A0A7RWY8	Clostridium_phage	3.1e-109	100.0
WP_011100270.1\|2250182_2251433_-	hypothetical protein	A0A0A7S1G0	Clostridium_phage	3.1e-235	100.0
WP_129052575.1\|2251429_2252491_-\|plate	baseplate J/gp47 family protein	A0A0A7RUN3	Clostridium_phage	1.9e-193	100.0
WP_011100272.1\|2252483_2252924_-	DUF2634 domain-containing protein	A0A0A7RUS1	Clostridium_phage	3.6e-77	100.0
WP_035124599.1\|2252926_2253142_-	DUF2577 family protein	A0A0A7RUW4	Clostridium_phage	4.2e-31	100.0
WP_011100273.1\|2253167_2254262_-	hypothetical protein	A0A0A7RWY4	Clostridium_phage	2.9e-200	100.0
WP_035124602.1\|2254258_2254678_-	hypothetical protein	A0A0A7S1F7	Clostridium_phage	3.4e-77	100.0
WP_011100275.1\|2254723_2257306_-\|tail	phage tail tape measure protein	A0A0A7RUN0	Clostridium_phage	0.0e+00	100.0
WP_011100276.1\|2257359_2257737_-	hypothetical protein	A0A0A7RUR6	Clostridium_phage	2.8e-54	100.0
WP_011100277.1\|2257923_2258334_-	hypothetical protein	A0A0A7RTP2	Clostridium_phage	9.1e-67	100.0
WP_155274217.1\|2258335_2258488_-	hypothetical protein	A0A0A7RTS9	Clostridium_phage	5.2e-20	100.0
WP_011100278.1\|2258512_2258944_-\|tail	phage tail tube protein	A0A0A7RVT1	Clostridium_phage	1.1e-75	100.0
WP_011100279.1\|2258963_2260025_-\|tail	phage tail sheath subtilisin-like domain-containing protein	A0A0A7S0D2	Clostridium_phage	7.6e-198	100.0
WP_129028538.1\|2260029_2260440_-	hypothetical protein	A0A0A7RTL8	Clostridium_phage	3.2e-72	100.0
WP_035124607.1\|2260508_2260739_-	hypothetical protein	A0A0A7RTN8	Clostridium_phage	1.1e-37	100.0
WP_011100281.1\|2260747_2261179_-	HK97 gp10 family phage protein	A0A0A7RWX6	Clostridium_phage	2.1e-69	97.1
WP_011100282.1\|2261153_2261513_-\|head	phage head closure protein	A0A0A7RVS7	Clostridium_phage	2.2e-61	100.0
WP_035124611.1\|2261521_2261800_-\|head,tail	phage gp6-like head-tail connector protein	A0A0A7RUM3	Clostridium_phage	6.2e-43	100.0
WP_162827859.1\|2261808_2261946_-	hypothetical protein	A0A0A7RUQ9	Clostridium_phage	2.6e-18	100.0
WP_011100283.1\|2261988_2263095_-\|capsid	phage major capsid protein	A0A0A7RUV5	Clostridium_phage	4.5e-185	100.0
WP_011100284.1\|2263126_2263807_-\|protease	Clp protease ClpP	A0A0A7RWX3	Clostridium_phage	1.1e-122	100.0
WP_035124613.1\|2263803_2265036_-\|portal	phage portal protein	A0A0A7S1E7	Clostridium_phage	5.1e-238	100.0
WP_011100286.1\|2265047_2266739_-\|terminase	terminase large subunit	A0A0A7RUM0	Clostridium_phage	0.0e+00	100.0
WP_035124616.1\|2266735_2267197_-\|terminase	P27 family phage terminase small subunit	A0A0A7RUQ4	Clostridium_phage	4.2e-68	100.0
WP_011100288.1\|2267272_2267701_-	HNH endonuclease	A0A0A7RUV1	Clostridium_phage	1.3e-79	100.0
WP_035124618.1\|2267822_2268005_+	type II toxin-antitoxin system HicA family toxin	A0A0A7RWW9	Clostridium_phage	8.2e-28	100.0
WP_035124620.1\|2268059_2268470_+	type II toxin-antitoxin system HicB family antitoxin	A0A0A7S1E5	Clostridium_phage	3.2e-72	99.3
WP_052042366.1\|2268845_2269088_-	hypothetical protein	A0A0A7RUQ1	Clostridium_phage	5.0e-41	100.0
WP_155274225.1\|2269451_2269604_-	hypothetical protein	A0A0A7S142	Clostridium_phage	1.4e-20	100.0
WP_011100290.1\|2269615_2270131_-	hypothetical protein	A0A0A7RUC3	Clostridium_phage	3.1e-88	100.0
WP_035124623.1\|2270155_2270380_-	hypothetical protein	A0A0A7RUD7	Clostridium_phage	9.1e-37	100.0
WP_155274223.1\|2270376_2270517_-	hypothetical protein	A0A0A7RUL2	Clostridium_phage	7.2e-16	100.0
WP_011100291.1\|2270519_2270909_-	YopX family protein	A0A0A7RUP7	Clostridium_phage	5.8e-71	100.0
WP_011100292.1\|2271015_2271378_-	hypothetical protein	A0A0A7RUU3	Clostridium_phage	3.7e-64	100.0
WP_011100293.1\|2271461_2272178_-	hypothetical protein	A0A0A7RWW3	Clostridium_phage	7.0e-131	100.0
WP_011100294.1\|2272201_2272585_-	hypothetical protein	A0A0A7S1E0	Clostridium_phage	1.4e-61	100.0
WP_052042367.1\|2272721_2273003_-	hypothetical protein	A0A0A7RUP4	Clostridium_phage	9.1e-42	98.9
WP_035124627.1\|2273141_2273396_-	hypothetical protein	A0A0A7RUU0	Clostridium_phage	2.5e-30	100.0
WP_011100296.1\|2273409_2274306_-	DnaD domain protein	A0A0A7RWV8	Clostridium_phage	1.1e-128	100.0
WP_035124629.1\|2274323_2274503_-	hypothetical protein	A0A0A7RU21	Clostridium_phage	1.6e-31	100.0
WP_011100297.1\|2274495_2275302_-	recombinase RecT	A0A0A7RW37	Clostridium_phage	2.2e-149	100.0
WP_011100298.1\|2275303_2276224_-	YqaJ viral recombinase family protein	A0A0A7RUP0	Clostridium_phage	5.6e-173	100.0
WP_011100299.1\|2276216_2276648_-	hypothetical protein	A0A0A7RWB4	Clostridium_phage	6.2e-74	100.0
WP_035124355.1\|2276732_2276996_-	hypothetical protein	A0A0A7RWV6	Clostridium_phage	2.5e-46	100.0
WP_155274207.1\|2276989_2277145_-	hypothetical protein	A0A0A7S1D3	Clostridium_phage	7.5e-22	100.0
WP_035124357.1\|2277252_2277624_-	hypothetical protein	A0A0A7RUK3	Clostridium_phage	5.0e-64	100.0
WP_035124359.1\|2277628_2277841_-	hypothetical protein	A0A0A7RUN7	Clostridium_phage	2.1e-35	100.0
WP_011100301.1\|2277926_2278676_-	antA/AntB antirepressor family protein	A0A0A7RUT3	Clostridium_phage	9.0e-137	100.0
WP_155274208.1\|2278842_2279016_-	hypothetical protein	A0A0A7S0A6	Clostridium_phage	3.7e-22	100.0
WP_035124361.1\|2279026_2279242_-	helix-turn-helix transcriptional regulator	A0A0A7RTI3	Clostridium_phage	1.5e-33	100.0
WP_035124368.1\|2279478_2279880_+	helix-turn-helix transcriptional regulator	A0A0A7RTK4	Clostridium_phage	2.8e-68	100.0
WP_052040968.1\|2279902_2281387_+	recombinase family protein	A0A0A7RTP8	Clostridium_phage	1.9e-279	100.0
WP_011100304.1\|2281471_2282092_-	viroplasmin family protein	A0A2H4JH24	uncultured_Caudovirales_phage	1.5e-36	40.5
WP_011100305.1\|2282111_2283677_-	DNA mismatch repair protein MutS	F2QAF9	Pyramimonas_orientalis_virus	4.2e-11	28.4
WP_155274209.1\|2283728_2285648_-	sensor histidine kinase	W8CYF6	Bacillus_phage	9.0e-16	25.6
WP_035124369.1\|2285553_2286330_-	response regulator transcription factor	W8CYM9	Bacillus_phage	3.4e-38	36.6

DBSCAN-SWA_7

2348328 : 2360631

Caulobacter_phage(37.5%)

protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_011100371.1\|2348328_2349138_-	TerD family protein	K4JRX3	Caulobacter_phage	7.4e-12	27.2
WP_011100372.1\|2349173_2349833_-	AIM24 family protein	NA	NA	NA	NA
WP_011100373.1\|2350015_2351665_+	YceG family protein	NA	NA	NA	NA
WP_011100374.1\|2351703_2352798_+	toxic anion resistance protein	M1PLC8	Streptococcus_phage	4.1e-05	20.9
WP_035110326.1\|2352863_2353475_-	TerD family protein	K4JRX3	Caulobacter_phage	3.3e-20	30.0
WP_011100376.1\|2353500_2354079_-	TerD family protein	K4JRX3	Caulobacter_phage	3.5e-32	42.9
WP_035109019.1\|2354120_2354702_-	TerD family protein	A0A2I7QY15	Vibrio_phage	1.4e-20	32.7
WP_011100378.1\|2354846_2355662_-	HAD hydrolase family protein	NA	NA	NA	NA
WP_035124381.1\|2355661_2356774_-\|protease	cysteine protease StiP family protein	A0A172Q0S8	Acinetobacter_phage	8.3e-38	31.9
WP_035109014.1\|2356827_2358171_-	phosphoribosyltransferase domain-containing protein	A0A172Q0Y1	Acinetobacter_phage	1.0e-13	25.6
WP_011100381.1\|2358325_2359498_-	HpcH/HpaI aldolase/citrate lyase family protein	NA	NA	NA	NA
WP_115606241.1\|2359635_2360631_-	sodium:calcium antiporter	A0A2I7QY17	Vibrio_phage	8.0e-16	28.8

Anti-CRISPR protein detection

Acr_ID: NC_004557.1|WP_155274208.1|2278842_2279016_-|hypothetical-protein

Click the colored protein region to show detailed information

Acr ID

Acr position

Acr size

Homology with known anti

Neighbor HTH/AcRanker

Neighbor Aca

In prophage

Protospacer in prophage

NC_004557.1|WP_155274208.1|2278842_2279016_-|hypothetical-protein

2278842_2279016_-

57 aa aa

HTH_XRE

Identity	Hit_domain_coverage
0.5	1.0

2237703-2286330

yes

CRISPR ID	CRISPR type	Spacer info	Spacer location	Spacer length	Protospacer location	Mismatch
NC_004557_3	TypeI-B	3.1\|1573265\|34\|NC_004557\|CRISPRCasFinder,CRT	1573265-1573298	34	2280788-2280755	0

1. spacer 3.1|1573265|34|NC_004557|CRISPRCasFinder,CRT matches to NC_004557 position: 2280788-2280755, mismatch: 0

ttaatccagataaaatatattctcttacagcaat	CRISPR spacer
ttaatccagataaaatatattctcttacagcaat	Protospacer
**********************************

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_004557

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

Click the colored protein region to show detailed information