CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Target MGE spacer number	Prophage number
NZ_CP040885	Escherichia coli strain K71-77 plasmid pK71-77-2, complete sequence	0 crisprs	NA	0	1
NZ_CP040886	Escherichia coli strain K71-77 chromosome, complete genome	12 crisprs	DinG,DEDDh,WYL,RT,cas3,csa3,PD-DExK,cas5,cas6e,cas1,cas2,c2c9_V-U4	18	11
NZ_CP040884	Escherichia coli strain K71-77 plasmid pK71-77-1-NDM, complete sequence	0 crisprs	DEDDh	0	12

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

86975 : 114977

Stx2-converting_phage(42.86%)

transposase,protease

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_023149734.1\|86975_88547_+\|transposase	IS66 family transposase	A0A0P0ZEB3	Stx2-converting_phage	4.9e-169	58.5
WP_072142979.1\|89250_89484_+	hypothetical protein	NA	NA	NA	NA
WP_023149666.1\|89429_89672_-	hypothetical protein	NA	NA	NA	NA
WP_001312851.1\|89727_89877_+	type I toxin-antitoxin system Hok family toxin	NA	NA	NA	NA
WP_000083833.1\|90160_90418_+	replication regulatory protein RepA	NA	NA	NA	NA
WP_071586949.1\|90453_90570_-	replication protein RepA	NA	NA	NA	NA
WP_032336874.1\|90653_90728_+	RepA leader peptide Tap	NA	NA	NA	NA
WP_000410951.1\|92487_93708_+	arginine deiminase	NA	NA	NA	NA
WP_000440183.1\|93718_94630_+	carbamate kinase	NA	NA	NA	NA
WP_000154545.1\|94714_95719_+	ornithine carbamoyltransferase	NA	NA	NA	NA
WP_000514417.1\|95766_97170_+	YfcC family protein	NA	NA	NA	NA
WP_001496175.1\|97250_97730_+	ArgR family transcriptional regulator	NA	NA	NA	NA
WP_000080227.1\|98086_98308_-	hypothetical protein	NA	NA	NA	NA
WP_000624725.1\|98338_98689_-	IS66 family insertion sequence element accessory protein TnpB	A0A0P0ZBY2	Stx2-converting_phage	4.7e-40	66.4
WP_059330006.1\|98685_99048_-	IS66 family insertion sequence hypothetical protein	Q6H9S5	Enterobacteria_phage	9.0e-34	88.5
WP_032152936.1\|99875_100454_+	DUF2726 domain-containing protein	NA	NA	NA	NA
WP_000005489.1\|100866_101220_-	hypothetical protein	NA	NA	NA	NA
WP_000156883.1\|101691_102714_-\|transposase	IS110 family transposase	NA	NA	NA	NA
WP_071529016.1\|102900_103152_-	hypothetical protein	NA	NA	NA	NA
WP_000083821.1\|103118_103376_+	replication regulatory protein RepA	NA	NA	NA	NA
WP_072163418.1\|103416_103527_-	replication protein RepA	NA	NA	NA	NA
WP_001365705.1\|103610_103685_+	RepA leader peptide Tap	NA	NA	NA	NA
WP_032152935.1\|103677_104535_+	incFII family plasmid replication initiator RepA	NA	NA	NA	NA
WP_071940974.1\|104897_105284_+	hypothetical protein	NA	NA	NA	NA
WP_000616807.1\|105473_106127_+\|protease	CPBP family intramembrane metalloprotease	NA	NA	NA	NA
WP_000557619.1\|106219_106477_+	type II toxin-antitoxin system antitoxin PemI	NA	NA	NA	NA
WP_000439434.1\|106478_106811_+	hypothetical protein	NA	NA	NA	NA
WP_001067855.1\|108776_109481_+\|transposase	IS6-like element IS26 family transposase	A0A077SL39	Escherichia_phage	1.8e-139	100.0
WP_063840321.1\|109624_110179_+	fluoroquinolone-acetylating aminoglycoside 6'-N-acetyltransferase AAC(6')-Ib-cr5	NA	NA	NA	NA
WP_001334766.1\|110309_111140_+	oxacillin-hydrolyzing class D beta-lactamase OXA-1	NA	NA	NA	NA
WP_001067855.1\|111771_112476_-\|transposase	IS6-like element IS26 family transposase	A0A077SL39	Escherichia_phage	1.8e-139	100.0
WP_024193849.1\|112500_112875_+	IS66 family insertion sequence element accessory protein TnpB	A0A0P0ZDM8	Stx2-converting_phage	9.8e-60	100.0
WP_000255956.1\|113954_114977_+\|transposase	IS21-like element IS100 family transposase	A0A2L1IVA1	Escherichia_phage	1.0e-199	99.1

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

2. NZ_CP040884

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

0 : 13836

Lactococcus_phage(16.67%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001053910.1\|696_1146_+	hypothetical protein	NA	NA	NA	NA
WP_000380893.1\|1127_1439_+	hypothetical protein	NA	NA	NA	NA
WP_001151305.1\|1612_2398_+	ParA family protein	A0A1X9IGI7	Lactococcus_phage	1.0e-10	26.4
WP_001207227.1\|2401_3583_+	ParB/RepB/Spo0J family partition protein	I3NLC2	Bifidobacterium_phage	2.4e-11	28.7
WP_000703827.1\|3631_3904_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_000074431.1\|3956_4592_-	N-6 DNA methylase	NA	NA	NA	NA
WP_001125904.1\|5153_5531_+	hypothetical protein	A0A2H4P7P5	Pseudomonas_phage	1.7e-22	49.6
WP_000044823.1\|5523_5805_+	hypothetical protein	NA	NA	NA	NA
WP_000344149.1\|5779_6454_+	hypothetical protein	NA	NA	NA	NA
WP_001326170.1\|6521_6953_+	hypothetical protein	NA	NA	NA	NA
WP_000348669.1\|6937_7270_+	hypothetical protein	NA	NA	NA	NA
WP_000647188.1\|7278_7779_+	hypothetical protein	I3UMJ0	Colwellia_phage	9.5e-18	38.4
WP_000936897.1\|7782_9210_+	DNA cytosine methyltransferase	NA	NA	NA	NA
WP_000268552.1\|9209_9866_+	hypothetical protein	NA	NA	NA	NA
WP_000464630.1\|9921_10539_+	hypothetical protein	NA	NA	NA	NA
WP_000505706.1\|10539_10746_+	hypothetical protein	NA	NA	NA	NA
WP_001326171.1\|10750_11050_+	hypothetical protein	A0A0K1LLW2	Caulobacter_phage	3.6e-20	55.4
WP_004201072.1\|11140_11629_-	hypothetical protein	NA	NA	NA	NA
WP_000366823.1\|11643_13836_-	DNA topoisomerase III	A0A1X9I6W8	Streptococcus_phage	9.9e-43	29.4

DBSCAN-SWA_2

27575 : 30934

Salmonella_phage(50.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000608644.1\|27575_28838_+\|transposase	IS1380-like element ISEc9 family transposase	A0A1B0VDR3	Salmonella_phage	1.3e-39	100.0
WP_015058212.1\|29161_30307_+	class C beta-lactamase CMY-6	NA	NA	NA	NA
WP_001221666.1\|30400_30934_+	lipocalin family protein	A0A1W6JNX6	Morganella_phage	6.1e-47	54.1

DBSCAN-SWA_3

50418 : 55054

Rhizobium_phage(25.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000085160.1\|50418_51387_+	AAA domain-containing protein	L7TKP0	Rhizobium_phage	1.2e-29	32.6
WP_000739139.1\|51397_52306_+	hypothetical protein	NA	NA	NA	NA
WP_000987165.1\|52366_52897_+	single-stranded DNA-binding protein	A0A291LCB6	Klebsiella_phage	2.6e-42	71.8
WP_001282585.1\|52991_53981_+	phage recombination protein Bet	B5AX97	Iodobacteriophage	1.1e-52	39.6
WP_000706865.1\|54043_55054_+	YqaJ viral recombinase family protein	E0YQ48	Mycobacterium_phage	5.6e-09	28.7

DBSCAN-SWA_4

61642 : 74053

Salmonella_phage(33.33%)

integrase,transposase

attL 70076:70089|attR 75775:75788

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000595210.1\|61642_62494_+	hypothetical protein	A0A219UQS0	Bacillus_phage	3.6e-09	29.4
WP_001077336.1\|62952_63339_+	hypothetical protein	NA	NA	NA	NA
WP_000122922.1\|63516_65244_+	hypothetical protein	A0A0P0ZFY3	Escherichia_phage	9.9e-14	32.6
WP_000268337.1\|65230_65509_+	hypothetical protein	NA	NA	NA	NA
WP_000714163.1\|65581_65803_+	hypothetical protein	NA	NA	NA	NA
WP_000427620.1\|65984_66989_-\|transposase	IS110-like element IS4321 family transposase	NA	NA	NA	NA
WP_001138073.1\|67067_70040_-\|transposase	Tn3 family transposase	A0A1B0V7H9	Salmonella_phage	0.0e+00	73.1
WP_001162012.1\|70042_70600_-	recombinase family protein	A0A1B0V7I5	Salmonella_phage	5.8e-48	81.3
70076:70089	attL	NA	NA	NA	NA
WP_001447826.1\|70637_70961_-	hypothetical protein	NA	NA	NA	NA
WP_000845039.1\|70905_71919_-\|integrase	class 1 integron integrase IntI1	A0A1P8DJJ6	Virus_Rctr41k	1.0e-71	45.5
WP_015058213.1\|72125_72704_+	AAC(6')-Ib family aminoglycoside 6'-N-acetyltransferase	NA	NA	NA	NA
WP_000679427.1\|72872_73220_+	quaternary ammonium compound efflux SMR transporter QacE delta 1	NA	NA	NA	NA
WP_000259031.1\|73213_74053_+	sulfonamide-resistant dihydropteroate synthase Sul1	A0A0B5J4J5	Pandoravirus	5.0e-11	27.2
75775:75788	attR	NA	NA	NA	NA

DBSCAN-SWA_5

90230 : 92217

uncultured_virus(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_004201172.1\|90230_90521_+	co-chaperone GroES	A0A221S322	uncultured_virus	2.1e-17	47.8
WP_004201176.1\|90576_92217_+	chaperonin GroEL	A0A219YK78	uncultured_virus	8.2e-175	62.1

DBSCAN-SWA_6

98519 : 100404

Gordonia_phage(50.0%)

integrase

attL 94737:94749|attR 102594:102606

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
94737:94749	attL	NA	NA	NA	NA
WP_000543934.1\|98519_99530_+\|integrase	tyrosine-type recombinase/integrase	A0A0K0N6I5	Gordonia_phage	3.1e-07	31.9
WP_004201184.1\|99534_100404_+	3'-5' exonuclease	A0A1S6L012	Salmonella_phage	3.5e-23	35.1
102594:102606	attR	NA	NA	NA	NA

DBSCAN-SWA_7

103563 : 105075

Pseudoalteromonas_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000811656.1\|103563_105075_+	ATP-dependent helicase	A0A2D1GN12	Pseudoalteromonas_phage	3.6e-44	30.7

DBSCAN-SWA_8

112403 : 116150

uncultured_Caudovirales_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000356489.1\|112403_112676_+	nucleotide excision repair protein	A0A2H4J3B6	uncultured_Caudovirales_phage	1.3e-08	41.0
WP_000790610.1\|112675_113209_+	transglycosylase SLT domain-containing protein	NA	NA	NA	NA
WP_000891157.1\|113219_113828_+	hypothetical protein	NA	NA	NA	NA
WP_001020646.1\|113824_114376_+	hypothetical protein	NA	NA	NA	NA
WP_000651490.1\|114435_114855_-	H-NS histone family protein	NA	NA	NA	NA
WP_000919078.1\|114856_115150_-	hypothetical protein	NA	NA	NA	NA
WP_000077457.1\|115166_116150_-	ParM/StbA family protein	A7KUY1	Bacillus_phage	2.1e-08	24.4

DBSCAN-SWA_9

120053 : 121169

unidentified_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000946104.1\|120053_121169_-	phosphoadenosine phosphosulfate reductase family protein	H7BVI4	unidentified_phage	8.3e-46	28.9

DBSCAN-SWA_10

124809 : 130654

Wolbachia_phage(25.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001348528.1\|124809_125787_+	S49 family peptidase	Q9JMP1	Wolbachia_phage	1.6e-16	30.5
WP_004201087.1\|125802_126663_+	DsbA family protein	NA	NA	NA	NA
WP_000591076.1\|126696_127125_+	hypothetical protein	NA	NA	NA	NA
WP_000422769.1\|127182_127542_+	hypothetical protein	A0A076G835	Escherichia_phage	5.6e-20	49.4
WP_000919343.1\|127541_127988_+	hypothetical protein	NA	NA	NA	NA
WP_000210757.1\|127984_128503_+	nitrite reductase	NA	NA	NA	NA
WP_000972665.1\|128502_128733_+	hypothetical protein	NA	NA	NA	NA
WP_001167036.1\|128719_129577_+	hypothetical protein	NA	NA	NA	NA
WP_001270409.1\|129602_129794_+	hypothetical protein	NA	NA	NA	NA
WP_004201083.1\|129796_130324_+	thermonuclease family protein	A0A1W6JQ32	Staphylococcus_phage	2.0e-05	32.4
WP_001043046.1\|130381_130654_+	HU family DNA-binding protein	A3E2K9	Sodalis_phage	1.6e-19	58.4

DBSCAN-SWA_11

134284 : 138277

Pseudomonas_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000286591.1\|134284_134746_+	DUF1643 domain-containing protein	B5WZV8	Pseudomonas_phage	1.5e-46	60.5
WP_000062185.1\|134748_135246_+	hypothetical protein	NA	NA	NA	NA
WP_000954380.1\|135349_135613_+	hypothetical protein	NA	NA	NA	NA
WP_000434070.1\|135807_136740_+	hypothetical protein	NA	NA	NA	NA
WP_004201081.1\|136813_138277_+	AAA family ATPase	U5XGM6	Phormidium_phage	2.4e-45	38.2

DBSCAN-SWA_12

142737 : 143676

Yersinia_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000268394.1\|142737_143676_+	chromosome partitioning protein ParB	A0A2P9HXK7	Yersinia_phage	1.2e-69	50.2

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

3. NZ_CP040886

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP040886_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_1

318272-318363

Orphan

Consensus_repeat	Method
CCACCTTTTTTACCTGCTTCAGATGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_1

>merge|NZ_CP040886|1|318272-318363|CRISPRCasFinder
CCACCTTTTTTACCTGCTTCAGATGCGCGCTGCGGGTCATTCTTGAAATTACCCCCGCTGTGCTGTCCACCTTTTTTACCTGCTTCTGATGC

>NZ_CP040886|1|1|318272-318363|CRISPRCasFinder
CCACCTTTTTTACCTGCTTCAGATGC	GCGCTGCGGGTCATTCTTGAAATTACCCCCGCTGTGCTGT
CCACCTTTTTTACCTGCTTCTGATGC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_001299828.1\|307786_311749_+\|trifunctional-transcriptional-regulator/proline-dehydrogenase/L-glutamate-gamma-semialdehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|236989
NZ_CP040886.1\|WP_001143120.1\|319403_319631_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182285
NZ_CP040886.1\|WP_001347171.1\|316829_318158_+\|pyrimidine-utilization-transport-protein-G	unknown	unknown	gnl\|CDD\|132655
NZ_CP040886.1\|WP_001126787.1\|314509_314896_+\|pyrimidine-utilization-protein-C	unknown	unknown	gnl\|CDD\|274677
NZ_CP040886.1\|WP_000097602.1\|321201_322461_-\|YccE-family-protein	unknown	unknown	gnl\|CDD\|182074
NZ_CP040886.1\|WP_001323674.1\|314903_315704_+\|pyrimidine-utilization-protein-D	unknown	unknown	gnl\|CDD\|211851
NZ_CP040886.1\|WP_001044313.1\|319668_320910_-\|bifunctional-glucose-1-phosphatase/inositol-phosphatase	unknown	unknown	gnl\|CDD\|182284
NZ_CP040886.1\|WP_001062101.1\|324634_327181_-\|trimethylamine-N-oxide-reductase-TorA	unknown	unknown	gnl\|CDD\|237909
NZ_CP040886.1\|WP_001028095.1\|316314_316809_+\|pyrimidine-utilization-flavin-reductase-protein-F	unknown	unknown	gnl\|CDD\|132654
NZ_CP040886.1\|WP_001295606.1\|311788_312427_-\|HTH-type-transcriptional-regulator-RutR	unknown	unknown	gnl\|CDD\|184970
NZ_CP040886.1\|WP_001151437.1\|318786_319383_+\|NAD(P)H:quinone-oxidoreductase	unknown	unknown	gnl\|CDD\|179647
NZ_CP040886.1\|WP_001323677.1\|327180_328353_-\|pentaheme-c-type-cytochrome-TorC	unknown	unknown	gnl\|CDD\|184992
NZ_CP040886.1\|WP_000024560.1\|323640_323946_+\|chaperone-modulator-CbpM	unknown	unknown	gnl\|CDD\|182346
NZ_CP040886.1\|WP_000209869.1\|324038_324638_-\|molecular-chaperone-TorD	unknown	unknown	gnl\|CDD\|235326
NZ_CP040886.1\|WP_001345643.1\|313805_314498_+\|peroxyureidoacrylate/ureidoacrylate-amidohydrolase-RutB	unknown	unknown	gnl\|CDD\|163356
NZ_CP040886.1\|WP_001678465.1\|305856_307365_-\|sodium/proline-symporter-PutP	unknown	unknown	gnl\|CDD\|185317
NZ_CP040886.1\|WP_000420629.1\|322720_323641_+\|curved-DNA-binding-protein	unknown	unknown	gnl\|CDD\|182347
NZ_CP040886.1\|WP_001001184.1\|315713_316304_+\|malonic-semialdehyde-reductase	unknown	unknown	gnl\|CDD\|180040
NZ_CP040886.1\|WP_001120112.1\|328482_329175_+\|two-component-system-response-regulator-TorR	unknown	unknown	gnl\|CDD\|182711
NZ_CP040886.1\|WP_001345642.1\|312714_313806_+\|pyrimidine-utilization-protein-A	unknown	unknown	gnl\|CDD\|163355

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_001299828.1\|307786_311749_+\|trifunctional-transcriptional-regulator/proline-dehydrogenase/L-glutamate-gamma-semialdehyde-dehydrogenase	gnl\|CDD\|236989	PRK11809, putA, trifunctional transcriptional regulator/proline dehydrogenase/pyrroline-5-carboxylate dehydrogenase; Reviewed.	0
NZ_CP040886.1\|WP_001143120.1\|319403_319631_+\|hypothetical-protein	gnl\|CDD\|182285	PRK10174, PRK10174, hypothetical protein; Provisional.	8.66725e-44
NZ_CP040886.1\|WP_001347171.1\|316829_318158_+\|pyrimidine-utilization-transport-protein-G	gnl\|CDD\|132655	TIGR03616, Putative_pyrimidine_permease_RutG, pyrimidine utilization transport protein G. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the uracil-xanthine permease family defined by TIGR00801. As well as the The Nucleobase:Cation Symporter-2 (NCS2) Family (TC 2.A.40).	0
NZ_CP040886.1\|WP_001126787.1\|314509_314896_+\|pyrimidine-utilization-protein-C	gnl\|CDD\|274677	TIGR03610, RutC, pyrimidine utilization protein C. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the endoribonuclease L-PSP family defined by pfam01042.	2.27835e-84
NZ_CP040886.1\|WP_000097602.1\|321201_322461_-\|YccE-family-protein	gnl\|CDD\|182074	PRK09784, PRK09784, YccE family protein.	0
NZ_CP040886.1\|WP_001323674.1\|314903_315704_+\|pyrimidine-utilization-protein-D	gnl\|CDD\|211851	TIGR03611, RutD, pyrimidine utilization protein D. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the hydrolase, alpha/beta fold family defined by pfam00067.	2.49482e-139
NZ_CP040886.1\|WP_001044313.1\|319668_320910_-\|bifunctional-glucose-1-phosphatase/inositol-phosphatase	gnl\|CDD\|182284	PRK10173, PRK10173, glucose-1-phosphatase/inositol phosphatase; Provisional.	0
NZ_CP040886.1\|WP_001062101.1\|324634_327181_-\|trimethylamine-N-oxide-reductase-TorA	gnl\|CDD\|237909	PRK15102, PRK15102, trimethylamine-N-oxide reductase TorA.	0
NZ_CP040886.1\|WP_001028095.1\|316314_316809_+\|pyrimidine-utilization-flavin-reductase-protein-F	gnl\|CDD\|132654	TIGR03615, flavoprotein_oxidoreductase, pyrimidine utilization flavin reductase protein F. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the flavin reductase family defined by pfam01613. Presumably, this protein recycles the flavin of the RutA luciferase-like oxidoreductase.	3.76111e-106
NZ_CP040886.1\|WP_001295606.1\|311788_312427_-\|HTH-type-transcriptional-regulator-RutR	gnl\|CDD\|184970	PRK15008, PRK15008, HTH-type transcriptional regulator RutR; Provisional.	3.3044e-153
NZ_CP040886.1\|WP_001151437.1\|318786_319383_+\|NAD(P)H:quinone-oxidoreductase	gnl\|CDD\|179647	PRK03767, PRK03767, NAD(P)H:quinone oxidoreductase; Provisional.	8.51484e-133
NZ_CP040886.1\|WP_001323677.1\|327180_328353_-\|pentaheme-c-type-cytochrome-TorC	gnl\|CDD\|184992	PRK15032, PRK15032, pentaheme c-type cytochrome TorC.	0
NZ_CP040886.1\|WP_000024560.1\|323640_323946_+\|chaperone-modulator-CbpM	gnl\|CDD\|182346	PRK10265, PRK10265, chaperone modulator CbpM.	5.75956e-65
NZ_CP040886.1\|WP_000209869.1\|324038_324638_-\|molecular-chaperone-TorD	gnl\|CDD\|235326	PRK04976, torD, chaperone protein TorD; Validated.	5.28244e-84
NZ_CP040886.1\|WP_001345643.1\|313805_314498_+\|peroxyureidoacrylate/ureidoacrylate-amidohydrolase-RutB	gnl\|CDD\|163356	TIGR03614, RutB, pyrimidine utilization protein B.	2.60527e-169
NZ_CP040886.1\|WP_001678465.1\|305856_307365_-\|sodium/proline-symporter-PutP	gnl\|CDD\|185317	PRK15419, PRK15419, sodium/proline symporter PutP.	0
NZ_CP040886.1\|WP_000420629.1\|322720_323641_+\|curved-DNA-binding-protein	gnl\|CDD\|182347	PRK10266, PRK10266, curved DNA-binding protein.	0
NZ_CP040886.1\|WP_001001184.1\|315713_316304_+\|malonic-semialdehyde-reductase	gnl\|CDD\|180040	PRK05365, PRK05365, malonic semialdehyde reductase; Provisional.	1.24775e-128
NZ_CP040886.1\|WP_001120112.1\|328482_329175_+\|two-component-system-response-regulator-TorR	gnl\|CDD\|182711	PRK10766, PRK10766, two-component system response regulator TorR.	5.89892e-138
NZ_CP040886.1\|WP_001345642.1\|312714_313806_+\|pyrimidine-utilization-protein-A	gnl\|CDD\|163355	TIGR03612, RutA, pyrimidine utilization protein A. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the luciferase family defined by pfam00296 and is likely a FMN-dependent monoxygenase. [Unknown function, Enzymes of unknown specificity].	0

>NZ_CP040886.1|WP_001347171.1|316829_318158_+|pyrimidine-utilization-transport-protein-G
MAMFGFPHWQLKSTSTESGVVAPDERLPFAQTAIMGVQHAVAMFGATVLMPILMGLDPNLSILMSGVGTLLFFFITGGRVPSYLGSSAAFVGVVIAATGFNGQGINPNISIALGGIIACGLVYTVIGLVVMKIGTRWIERLMPPVVTGAVVMAIGLNLAPIAVKSVSASAFDSWMAVMTVLCIGLVAVFTRGMIQRLLILVGLIVACLLYGVMTNLLGLGKAVDFTLVSHAAWFGLPHFSTPAFNSQAMMLIAPVAVILVAENLGHLKAVAGMTGRNMDPYMGRAFVGDGLATMLSGSVGGSGVTTYAENIGVMAVTKVYSTLVFVAAAVIAMLLGFSPKFGALIHTIPAAVIGGASIVVFGLIAVAGARIWVQNRVDLSQNGNLIMVAVTLVLGAGDFALTLGGFTLGGIGTATFGAILLNALLSRKLVDVPPPEVVHQEP
>NZ_CP040886.1|WP_001028095.1|316314_316809_+|pyrimidine-utilization-flavin-reductase-protein-F
MNIVDQQTFRDAMSCMGAAVNIITTDGPAGRAGFTASAVCSVTDTPPTLLVCLNRGASVWPVFNENRTLCVNTLSAGQEPLSNLFGGKTPMEHRFAAARWQTGVTGCPQLEEALVSFDCRISQVVSVGTHDILFCAIEAIHRHATPYGLVWFDRSYHALMRPAC
>NZ_CP040886.1|WP_001001184.1|315713_316304_+|malonic-semialdehyde-reductase
MNEAVSPGALSTLFTDARTHNGWRETPVSDETLRELYALMKWGPTSANCSPARIVFIRTAEGKERLRPALSSGNLQKTLTAPVTAIVAWDSEFYERLPLLFPHGDARSWFTSSPQLAEETAFRNSSMQAAYLIVACRALGLDTGPMSGFDRQYVDDAFFAGSTLKSNLLINIGYGDNSKLYARLPRLSFEEACGLL
>NZ_CP040886.1|WP_001323674.1|314903_315704_+|pyrimidine-utilization-protein-D
MKLSLSPPPYADAPVVVLISGLGGSGSYWLPQLAVLEQEYQVVCYDQRGTGNNPDTLAEDYSIAQMAAELHQALVAAGIEHYAVVGHALGALVGMQLALDYPASVTVLVCVNGWLRINAHTRRCFQVRERLLYSGGAQAWVEAQPLFLYPADWMAARAPRLEAEDALALAHFQGKNNLLRRLNALKRADFSHHAVRIRCPVQIICASDDLLVPSACSSELHAALPDSQKMVMRYGGHACNVTDPETFNALLLNGLASLLHHREAAL
>NZ_CP040886.1|WP_001126787.1|314509_314896_+|pyrimidine-utilization-protein-C
MPKSVIIPAGSSAPLAPFVPGTLADGVVYVSGTLAFDQHNNVLFADDPKAQTRHVLETIRTVIETAGGTMADVTFNSIFITDWKNYAAINEIYAEFFPGDKPARFCIQCGLVKPDALVEIATIAHIAK
>NZ_CP040886.1|WP_001345643.1|313805_314498_+|peroxyureidoacrylate/ureidoacrylate-amidohydrolase-RutB
MTTLTARPEAITFDPQQSALIVVDMQNAYATPGGYLDLAGFDVSTTRPVIANIQTAVTAARAAGMLIIWFQNGWDEQYVEAGGPGSPNFHKSNALKTMRKQPQLQGKLLAKGSWDYQLVDELVPQPGDIVLPKPRYSGFFNTPLDSILRSRGIRHLVFTGIATNVCVESTLRDGFFLEYFGVVLEDATHQAGPEFVQKAALFNIETFFGWVSDVETFCDALSPTSFARIA
>NZ_CP040886.1|WP_001345642.1|312714_313806_+|pyrimidine-utilization-protein-A
MKIGVFVPIGNNGWLISTHAPQYMPTFELNKAIVQKAEHYHFDFALSMIKLRGFGGKTEFWDHNLESFTLMAGLAAVTSRIQIYATAATLTLPPAIVARMAATIDSISGGRFGVNLVTGWQKPEYEQMGIWPGDDYFSRRYDYLTEYVQVLRDLWGSGKSDFKGDFFTMNDCRVSPQPSVPMKVICAGQSDAGMAFSAQYADFNFCFGKGVNTPTAFAPTAARMKQAAEQTGRDVGSYVLFMVIADETDDAARAKWEHYKAGADEEALSWLTEQSQKDTRSGTDTNVRQMADPTSAVNINMGTLVGSYASVARMLDEVASVPGAEGVLLTFDDFLSGIETFGERIQPLMQCRAHLPALTQEVA
>NZ_CP040886.1|WP_001295606.1|311788_312427_-|HTH-type-transcriptional-regulator-RutR
MTQGAVKTTGKRSRTVSAKKKAILSAALDTFSQFGFHGTRLEQIAELAGVSKTNLLYYFPSKEALYIAVLRQILDIWLAPLKAFREDFAPLAAIKEYIRLKLEVSRDYPQASRLFCMEMLAGAPLLMDELTGDLKALIDEKSALIAGWVKSGKLAPIDPQHLIFMIWASTQHYADFAPQVEAVTGATLRDEVFFNQTVENVQRIIIEGIRPR
>NZ_CP040886.1|WP_001299828.1|307786_311749_+|trifunctional-transcriptional-regulator/proline-dehydrogenase/L-glutamate-gamma-semialdehyde-dehydrogenase
MGTTTMGVKLDDATRERIKSAATRIDRTPHWLIKQAIFSYLEQLENSDTLPELPALLSGAANESDEAPTPAEEPHQPFLDFAEQILPQSVSRAAITAAYRRPETEAVSMLLEQARLPQPVAEQAHKLAYQLADKLRNQKNASGRAGMVQGLLQEFSLSSQEGVALMCLAEALLRIPDKATRDALIRDKISNGNWQSHIGRSPSLFVNAATWGLLFTGKLVSTHNEASLSRSLNRIIGKSGEPLIRKGVDMAMRLMGEQFVTGETIAEALANARKLEEKGFRYSYDMLGEAALTAADAQAYMVSYQQAIHAIGKASNGRGIYEGPGISIKLSALHPRYSRAQYDRVMEELYPRLKSLTLLARQYDIGINIDAEEADRLEISLDLLEKLCFEPELAGWNGIGFVIQAYQKRCPLVIDYLIDLATRSRRRLMIRLVKGAYWDSEIKRAQMDGLEGYPVYTRKVYTDVSYLACAKKLLAVPNLIYPQFATHNAHTLAAIYQLAGQNYYPGQYEFQCLHGMGEPLYEQVTGKVADGKLNRPCRIYAPVGTHETLLAYLVRRLLENGANTSFVNRIADTSLPLDELVADPVTAVEKLAQQEGQTGLPHPKIPLPRDLYGHGRDNSAGLDLANEHRLASLSSALLNSALQKWQALPMLEQPVAAGEMSPVINPAEPKDIVGFVREATPREVEQALESAVNNAPIWFATPPVERAAILHRAAVLMESQMQQLIGILVREAGKTFSNAIAEVREAVDFLHYYAGQVRDDFANETHRPLGPVVCISPWNFPLAIFTGQIAAALAAGNSVLAKPAEQTPLIAAQGIAILLEAGVPPGVVQLLPGQGETVGAQLTGDDRVRGVMFTGSTEVATLLQRNIASRLDAQGRPIPLIAETGGMNAMIVDSSALTEQVVVDVLASAFDSAGQRCSALRVLCLQDEIADHTLKMLRGAMAECRMGNPGRLTTDIGPVIDSEAKANIERHIQTMRSKGRPVFQAVRENSEDAREWQSGTFVAPTLIELDDFAELQKEVFGPVLHVVRYNRNQLPELIEQINASGYGLTLGVHTRIDETIAQVTGSAHVGNLYVNRNMVGAVVGVQPFGGEGLSGTGPKAGGPLYLYRLLANRPESALAVTLARQDAEYPVDAQLKAALTQPLNALREWAANRPELQALCTQYGELAQAGTQRLLPGPTGERNTWTLLPRERVLCIADDEQDALTQLAAVLAVGSQVLWPDDALHRQLVKALPSAVSERIQLAKAENITAQPFDAVIFHGDSDQLRALCEAVAARDGAIVSVQGFARGESNILLERLYIERSLSVNTAAAGGNASLMTIG
>NZ_CP040886.1|WP_001678465.1|305856_307365_-|sodium/proline-symporter-PutP
MAISTPMLVTFCVYIFGMILIGFIAWRSTKNFDDYILGGRSLGPFVTALSAGASDMSGWLLMGLPGAVFLSGISESWIAIGLTLGAWINWKLVAGRLRVHTEYNNNALTLPDYFTGRFEDKSRILRIISALVILLFFTIYCASGIVAGARLFESTFGMSYETALWAGAAATILYTFIGGFLAVSWTDTVQASLMIFALILTPVIVIISVGGFGDSLEVIKQKSIENVDMLKGLNFVAIISLMGWGLGYFGQPHILARFMAADSHHSIVHARRISMTWMILCLAGAVAVGFFGIAYFNEHPAVAGAVNQNAERVFIELAQILFNPWIAGILLSAILAAVMSTLSCQLLVCSSAITEDLYKAFLRKHASQKELVWVGRVMVLVVALVAIALAANPENRVLGLVSYAWAGFGAAFGPVVLFSVMWSRMTRNGALAGMIIGALTVIVWKQFGWLGVYEIIPGFIFGSIGIVVFSLLGKAPSAAMQKRFAEADAHYHSAPPSRLQES
>NZ_CP040886.1|WP_001151437.1|318786_319383_+|NAD(P)H:quinone-oxidoreductase
MAKVLVLYYSMYGHIETMARAVAEGASKVDGAEVVVKRVPETMPPQLFEKAGGKTQTAPVATPQELADYDAIIFGTPTRFGNMSGQMRTFLDQTGGLWASGALYGKLASVFSSTGTGGGQEQTITSTWTTLAHHGMVIVPIGYAAQELFDVSQVRGGTPYGATTIAGGDGSRQPSQEELSIARYQGEYVAGLAVKLNG
>NZ_CP040886.1|WP_001143120.1|319403_319631_+|hypothetical-protein
MPTQEAKAHHVGEWASLRNTSPEIAEAIFEVAGYDEKMAEKIWEEGSDEVLVKAFAKTDKDSLFWGEQTIERKNV
>NZ_CP040886.1|WP_001044313.1|319668_320910_-|bifunctional-glucose-1-phosphatase/inositol-phosphatase
MNKTLIAATVAGIVLLASNAQAQTVPEGYQLQQVLMMSRHNLRAPLANNGSVLEQSTPNKWPEWDVPGGQLTTKGGVLEVYMGHYMREWLAQQGMVKSGECPPPDTVYAYANSLQRTVATAQFFITGAFPGCDIPVHHQEKMGTMDPTFNPVITDDSAAFSEQAVAAMEKELSKLQLTDSYQLLEKIVNYKDSPACKEKQQCSLVDGKNTFSAKYQQEPGVSGPLKVGNSLVDAFTLQYYEGFPMDQVAWGEIKSDQQWKVLSKLKNGYQDSLFTSPEVARNVAKPLVSYIDKALVTDRTSAPKITVLVGHDSNIASLLTALDFKPYQLHDQNERTPIGGKIVFQRWHDSKANRDLMKIEYVYQSAEQLRNADALTLQAPAQRVTLELSGCPIDANGFCPMDKFDSVLNEAVK
>NZ_CP040886.1|WP_000097602.1|321201_322461_-|YccE-family-protein
MSSNIHGISCTANNYLKQAWNNIKNEHEKNQKYSITLFENTLVCFMRLYKEIRRQKAEDYIPCLECDSLEKEFEEMQNDNDLSLFLRTLRTNDTETYSGVSEGITYTIQYVRDIDIVRVSLPGRGSESITDFKGYYWYGFMEYIENINACDDVFSEYCLDDENMSIQPEWINTPGISDLDTGIDLSGISFIQSEINKTYGLKYAPVDGDGYCLLRAILVLKEHEYSWALGSHKTQKQVYEEFIKIVDKQTIEALVDTAFNDLREDVKTLFGVNLQSDNKIQGQGGFLSWSFLSFKKEFIDSCLNDKKCILHLPEFIFNDNKARLVLDTDPEQKVNEVKNFLTALSDSICSLFIVNSNVASISLGNESFSTDDDLEYGYLINTGNHYDVYLPPELFAQAYELNNKERNAQIDFLTRYAIY
>NZ_CP040886.1|WP_000420629.1|322720_323641_+|curved-DNA-binding-protein
MELKDYYAIMGVKPTDDLKTIKTAYRRLARKYHPDVSKEPDAEARFKEVAEAWEVLSDEQRRAEYDQMWQHRNDPQFNRQFHHSDGQSFNAEDFDDIFSSIFGQHARQSRQRPATRGHDIEIEVAVFLEETLTEHKRTISYNLPVYNAFGMIEQEIPKTLNVKIPAGVGNGQRIRLKGQGTPGENGGPNGDLWLVIHIAPHPLFDIVGHDLEIVVPVSPWEAALGAKVTVPTLKESILLTIPPGSQAGQRLRVKGKGLVSKKQTGDLYAVLKIVMPPKPDENTAALWQQLADAQSSFDPRKDWGKA
>NZ_CP040886.1|WP_000024560.1|323640_323946_+|chaperone-modulator-CbpM
MANVTVTFTITEFCLHTGISEEELNEIVGLGVVEPREIQETTWVFDDHAAIVVQRAVRLRHELALDWPGIAVALTLMDDIAHLKQENRLLRQRLSRFVAHP
>NZ_CP040886.1|WP_000209869.1|324038_324638_-|molecular-chaperone-TorD
MTTLTAQQIACVYAWLAQLFSRELDDEQLTQIASAQMAEWFSLLKSEPPLAAAVNELENCIATLTVRDDARLELAADFCGLFLMTDKQAALPYASAYKQDEQEIKRLLVEAGMETSGNFNEPADHLAIYLELLSHLHFSLGEGTVPARRIDSLRQKTLTALWQWLPEFVVRCRQYDSFGFYAALSQLLLVLVESDHQNR
>NZ_CP040886.1|WP_001062101.1|324634_327181_-|trimethylamine-N-oxide-reductase-TorA
MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATAAQAATDAVISKEGILTGSHWGAIRATVKDGRFVAAKPFELDKYPSKMIAGLPDHVHNAARIRYPMVRVDWLRKRHLSDTSQRGDNRFVRVSWDEALDMFYEELERVQKTHGPSALLTASGWQSTGMFHNASGMLAKAIALHGNSVGTGGDYSTGAAQVILPRVVGSMEVYEQQTSWPLVLQNSKTIVLWGSDLLKNQQANWWCPDHDVYEYYAQLKAKVAAGEIEVISIDPVVTSTHEYLGREHVKHIAVNPQTDVPLQLALAYTLYSENLYDKNFLANYCVGFEQFLPYLLGEKDGQPKDAAWAEKLTGIDAETIRGLARQMAANRTQIIAGWCVQRMQHGEQWAWMIVVLAAMLGQIGLPGGGFGFGWHYNGAGTPGRKGVILSGFSGSTSIPPVHDNSDYKGYSSTIPIARFIDAILEPGKVINWNGKSVKLPPLKMCIFAGTNPFHRHQQINRIIEGWRKLETVIAIDNQWTSTCRFADIVLPATTQFERNDLDQYGNHSNRGIIAMKQVVPPQFEARNDFDIFRELCRRFNREEAFTEGLDEMGWLKRIWQEGVQQGKGRGVHLPAFDDFWNNKEYVEFDHPQMFVRHQAFREDPDLEPLGTPSGLIEIYSKTIADMNYDDCQGHPMWFEKIERSHGGPGSQKYPLHLQSVHPDFRLHSQLCESETLRQQYTVAGKEPVFINPQDASARGIRNGDVVRVFNARGQVLAGAVVSDRYAPGVARIHEGAWYDPDKGGEPGALCKYGNPNVLTIDIGTSQLAQATSAHTTLVEIEKYNGAVEQVTAFNGPVEMVAQCEYVPASQVKS
>NZ_CP040886.1|WP_001323677.1|327180_328353_-|pentaheme-c-type-cytochrome-TorC
MRKLWNALRRPSARWSVLALVAIGIVIGIALIVLPHVGIKVTSTTEFCVSCHSMQPVYEEYKQSVHFQNASGVRAECHDCHIPPDMPGMVKRKLEASNDIYQTFIAHSIDTPEKFEAKRAELAEREWARMKENNSATCRSCHNYDAMDHAKQHPEAARQMKVAAKDNQSCIDCHKGIAHQLPDMSSGFRKQFDELRASANDSGDTLYSIDIKPIYAAKGDKEASGSLLPASEVKVLKRDGDWLQIEITGWTESAGRQRVLTQFPGKRIFVASIRGDVQQQVKTLEKTTVADTNTEWSKLQATAWMKKGDMVNDIKPIWAYADSLYNGTCNQCHGAPEIAHFDANGWIGTLNGMIGFTSLDKREERTLLKYLQMNASDTAGKAHGDKKEEK
>NZ_CP040886.1|WP_001120112.1|328482_329175_+|two-component-system-response-regulator-TorR
MPHHIVIVEDEPVTQARLQSYFTQEGYTVSVTASGAGLREIMQNQPVDLILLDINLPDENGLMLTRALRERSTVGIILVTGRSDRIDRIVGLEMGADDYVTKPLELRELVVRVKNLLWRIDLARQAQPHTQDNCYRFAGYCLNVSRHTLERDGEPIKLTRAEYEMLVAFVTNPGEILSRERLLRMLSARRVENPDLRTVDVLIRRLRHKLSADLLVTQHGEGYFLAADVC

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_2

623114-623258

Orphan

Consensus_repeat	Method
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_2

>merge|NZ_CP040886|2|623114-623258|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGCTGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTCGTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

>NZ_CP040886|2|2|623114-623258|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	TGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTC
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_001395510.1\|618499_618781_+\|cell-division-protein-ZapA	unknown	unknown	unknown
NZ_CP040886.1\|WP_000815449.1\|629464_630460_-\|6-phosphogluconolactonase	unknown	unknown	gnl\|CDD\|182912
NZ_CP040886.1\|WP_000891515.1\|634123_634273_-\|multidrug-efflux-pump-accessory-protein-AcrZ	unknown	unknown	gnl\|CDD\|371231
NZ_CP040886.1\|WP_000101993.1\|633183_633957_-\|molybdate-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|182641
NZ_CP040886.1\|WP_001372426.1\|623281_625543_-\|hydratase	unknown	unknown	gnl\|CDD\|183125
NZ_CP040886.1\|WP_000604034.1\|632494_633184_-\|molybdate-ABC-transporter-permease-subunit	unknown	unknown	gnl\|CDD\|181841
NZ_CP040886.1\|WP_001372427.1\|627234_628287_-\|4-oxalomesaconate-tautomerase	unknown	unknown	gnl\|CDD\|380230
NZ_CP040886.1\|WP_001036475.1\|625725_627159_-\|anion-permease	unknown	unknown	gnl\|CDD\|279307
NZ_CP040886.1\|WP_000763365.1\|618879_619101_+\|TraR/DksA-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|222775
NZ_CP040886.1\|WP_000213425.1\|630614_631433_+\|pyridoxal-phosphatase	unknown	unknown	gnl\|CDD\|182523
NZ_CP040886.1\|WP_000891692.1\|631433_632492_-\|molybdenum-ABC-transporter-ATP-binding-protein-ModC	unknown	unknown	gnl\|CDD\|182993
NZ_CP040886.1\|WP_001303849.1\|620363_620582_+\|excisionase	unknown	unknown	gnl\|CDD\|116439
NZ_CP040886.1\|WP_000120065.1\|619311_619914_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_000533646.1\|620559_621630_+\|tyrosine-type-recombinase/integrase	unknown	unknown	gnl\|CDD\|271181
NZ_CP040886.1\|WP_023148020.1\|618297_618489_+\|DUF1382-family-protein	unknown	unknown	gnl\|CDD\|369224
NZ_CP040886.1\|WP_000679972.1\|628470_629424_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176131
NZ_CP040886.1\|WP_000545745.1\|620156_620324_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_071525073.1\|620038_620224_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_001091569.1\|621764_623048_+\|putative-acyl-CoA-thioester-hydrolase	unknown	unknown	gnl\|CDD\|236709
NZ_CP040886.1\|WP_072126246.1\|618142_618325_+\|DUF1317-domain-containing-protein	unknown	unknown	gnl\|CDD\|284449

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_000891692.1\|631433_632492_-\|molybdenum-ABC-transporter-ATP-binding-protein-ModC	gnl\|CDD\|182993	PRK11144, modC, molybdenum ABC transporter ATP-binding protein ModC.	0
NZ_CP040886.1\|WP_000891515.1\|634123_634273_-\|multidrug-efflux-pump-accessory-protein-AcrZ	gnl\|CDD\|371231	pfam10766, AcrZ, Multidrug efflux pump-associated protein AcrZ. AcrZ is associated with the AcrA-TolC multidrug efflux pump, it may enhance the ability of the pump to recognize and export certain substrates.	1.04381e-17
NZ_CP040886.1\|WP_000101993.1\|633183_633957_-\|molybdate-ABC-transporter-substrate-binding-protein	gnl\|CDD\|182641	PRK10677, modA, molybdate transporter periplasmic protein; Provisional.	0
NZ_CP040886.1\|WP_001372426.1\|623281_625543_-\|hydratase	gnl\|CDD\|183125	PRK11413, PRK11413, putative hydratase; Provisional.	0
NZ_CP040886.1\|WP_000604034.1\|632494_633184_-\|molybdate-ABC-transporter-permease-subunit	gnl\|CDD\|181841	PRK09421, modB, molybdate ABC transporter permease subunit.	2.41762e-146
NZ_CP040886.1\|WP_001372427.1\|627234_628287_-\|4-oxalomesaconate-tautomerase	gnl\|CDD\|380230	NF033377, OMA_tautomer, 4-oxalomesaconate tautomerase.	0
NZ_CP040886.1\|WP_001036475.1\|625725_627159_-\|anion-permease	gnl\|CDD\|279307	pfam00939, Na_sulph_symp, Sodium:sulfate symporter transmembrane region. There are also some members in this family that do not match the Prosite motif, and belong to the subfamily SODIT1.	0
NZ_CP040886.1\|WP_000763365.1\|618879_619101_+\|TraR/DksA-family-transcriptional-regulator	gnl\|CDD\|222775	PHA00080, PHA00080, DksA-like zinc finger domain containing protein.	1.11886e-26
NZ_CP040886.1\|WP_000213425.1\|630614_631433_+\|pyridoxal-phosphatase	gnl\|CDD\|182523	PRK10530, PRK10530, pyridoxal phosphate (PLP) phosphatase; Provisional.	0
NZ_CP040886.1\|WP_001303849.1\|620363_620582_+\|excisionase	gnl\|CDD\|116439	pfam07825, Exc, Excisionase-like protein. The phage-encoded excisionase protein (Xis) is involved in excisive recombination by regulating the assembly of the excisive intasome and by inhibiting viral integration. It adopts an unusual 'winged'-helix structure in which two alpha helices are packed against two extended strands. Also present in the structure is a two-stranded anti-parallel beta-sheet, whose strands are connected by a four-residue 'wing'. During interaction with DNA, helix alpha2 is thought to insert into the major groove, while the wing contacts the adjacent minor groove or phosphodiester backbone. The C-terminal region of Xis is involved in interaction with phage-encoded integrase (Int), and a putative C-terminal alpha helix may fold upon interaction with Int and/or DNA.	8.49552e-35
NZ_CP040886.1\|WP_000533646.1\|620559_621630_+\|tyrosine-type-recombinase/integrase	gnl\|CDD\|271181	cd00800, INT_Lambda_C, C-terminal catalytic domain of Lambda integrase, a tyrosine-based site-specific recombinase. Lambda-type integrases catalyze site-specific integration and excision of temperate bacteriophages and other mobile genetic elements to and from the bacterial host chromosome. They are tyrosine-based site-specific recombinase and belong to the superfamily of DNA breaking-rejoining enzymes, which share the same fold in their catalytic domain and the overall reaction mechanism. The phage lambda integrase can bridge two different and well-separated DNA sequences called arm- and core-sites. The C-terminal domain binds, cleaves and re-ligates DNA strands at the core-sites, while the N-terminal domain is largely responsible for high-affinity binding to the arm-type sites.	8.02573e-62
NZ_CP040886.1\|WP_023148020.1\|618297_618489_+\|DUF1382-family-protein	gnl\|CDD\|369224	pfam07131, DUF1382, Protein of unknown function (DUF1382). This family consists of several hypothetical Escherichia coli and bacteriophage lambda-like proteins of around 60 residues in length. The function of this family is unknown. Structural modelling suggests this domain may bind nucleic acids.	8.16312e-23
NZ_CP040886.1\|WP_000679972.1\|628470_629424_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176131	cd08440, PBP2_LTTR_like_4, TThe C-terminal substrate binding domain of an uncharacterized LysR-type transcriptional regulator, contains the type 2 periplasmic binding fold. LysR-transcriptional regulators comprise the largest family of prokaryotic transcription factor. Homologs of some of LTTRs with similar domain organizations are also found in the archaea and eukaryotic organisms. The LTTRs are composed of two functional domains joined by a linker helix involved in oligomerization: an N-terminal HTH (helix-turn-helix) domain, which is responsible for the DNA-binding specificity, and a C-terminal substrate-binding domain, which is structurally homologous to the type 2 periplasmic binding proteins. As also observed in the periplasmic binding proteins, the C-terminal domain of the bacterial transcriptional repressor undergoes a conformational change upon substrate binding which in turn changes the DNA binding affinity of the repressor. The genes controlled by the LTTRs have diverse functional roles including amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to a name a few. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	1.09679e-82
NZ_CP040886.1\|WP_000815449.1\|629464_630460_-\|6-phosphogluconolactonase	gnl\|CDD\|182912	PRK11028, PRK11028, 6-phosphogluconolactonase; Provisional.	0
NZ_CP040886.1\|WP_001091569.1\|621764_623048_+\|putative-acyl-CoA-thioester-hydrolase	gnl\|CDD\|236709	PRK10531, PRK10531, putative acyl-CoA thioester hydrolase.	0
NZ_CP040886.1\|WP_072126246.1\|618142_618325_+\|DUF1317-domain-containing-protein	gnl\|CDD\|284449	pfam07026, DUF1317, Protein of unknown function (DUF1317). This family consists of several hypothetical bacterial and phage proteins of around 60 residues in length. The function of this family is unknown.	8.0633e-35

>NZ_CP040886.1|WP_001091569.1|621764_623048_+|putative-acyl-CoA-thioester-hydrolase
MNTFSVSRLALALAFGVTLTACSSTPPDQRPSDQTAPGTSSRPILSAKEAQNFDAQHYFASLTPGAAAWNPSPITLPAQPDFVVGPAGTQGVTHTTIQAAVDAAIIKRTNKRQYIAVMPGEYQGTVYVPAAPGGITLYGTGEKPIDVKIGLSLDGGMSPADWRHDVNPRGKYMPGKPAWYMYDSCQSKRSDSIGVLCSAVFWSQNNGLQLQNLTIENTLGDSVDAGNHPAVALRTDGDQVQINNVNILGRQNTFFVTNSGVQNRLETNRQPRTLVTNSYIEGDVDIVSGRGAVVFDNTEFRVVNSRTQQEAYVFAPATLSNIYYGFLAVNSRFNAFGDGVAQLGRSLDVDANTNGQVVIRDSAINEGFNTAKPWADAVISNRPFAGNTGSVDDNDEIQRNLNDTNYNRMWEYNNRGVGSKVVAEAKK
>NZ_CP040886.1|WP_000533646.1|620559_621630_+|tyrosine-type-recombinase/integrase
MGRRRSHERRDLPPNLYIRNNGYYCYRDPRTGKEFGLGRDRRIAITEAIQANIELFSGHKHKPLTARINSDNSVTLHSWLDRYEKILASRGIKQKTLINYMSKIKAIRRGLPDAPLEDITTKEIAAMLNGYIDEGKAASAKLIRSTLSDAFREAIAEGHITTNPVAATRAAKSEVRRSRLTADEYLKIYQAAESSPCWLRLAMELAVVTGQRVGDLCEMKWSDIVDGYLYVEQSKTGVKIAIPTVLHVDALGISMKETLDKCKEILGGETIIASTRREPLSSGTVSRYFMRARKASGLSFEGDPPTFHELRSLSARLYEKQISDKFAQHLLGHKSDTMASQYRDDRGREWDKIEIK
>NZ_CP040886.1|WP_001303849.1|620363_620582_+|excisionase
MYLTLQEWNARQRRPRSLETVRRWVRECRIFPPPVKDGREYLFHESAVKVDLNRPVTGSLLKRIRNGKKAKS
>NZ_CP040886.1|WP_000545745.1|620156_620324_+|hypothetical-protein
MHFRVTGEWNGEPFNRVIEAENISDCYDHWMLWAQIAHADVTNIRIEELKEHQAA
>NZ_CP040886.1|WP_071525073.1|620038_620224_-|hypothetical-protein
MFSASITLLNGSPFHSPVTRKCIYHLHKTKPAVASSDKRNPRQCEDAVHCCYTLFCSQRKR
>NZ_CP040886.1|WP_000120065.1|619311_619914_-|hypothetical-protein
MSYFLRKKWMVNLSGSGKILWALNMKKDSYPYLICMTVSGLIFIFLFFWWRADIYRVTFLNQSISHYYILFSMGIAFLLSLFWVKKGIVKQSGWKSLSAYLKVYAGMCIFAGFFLIIPLTTLTYFLPGETSSYVAPYRYTSGSSKSCSGAEVDDPDLHENIRICYPYGNYEYDNIIYVEKKINILGAVVTYAQTARDDTE
>NZ_CP040886.1|WP_000763365.1|618879_619101_+|TraR/DksA-family-transcriptional-regulator
MADIIDSASEIEELQRNTAIKMRRLNHQAISATHCCECGDPIDERRRLAVQGCRTCASCQQDLELISKQRGSK
>NZ_CP040886.1|WP_001395510.1|618499_618781_+|cell-division-protein-ZapA
MHFSGSGLHILCAYACRHGACSMTPQQENALRSIARQANSEIKKARQQFPDKNVDDICRSVLKKHRETVTLMGFTPTHLSLAIGMLNGVFKER
>NZ_CP040886.1|WP_023148020.1|618297_618489_+|DUF1382-family-protein
MHKASPVELRTSIEMAHSLAQIGVRFVPIPVETDEEFHTLAAFLSQKLEMMVAKAEADERDQV
>NZ_CP040886.1|WP_072126246.1|618142_618325_+|DUF1317-domain-containing-protein
MTHPHDNIRVGAITFVYSVTKRGWVFPGLSVIRNPLKAQRLAEEINNKRGAVCTKHLPLS
>NZ_CP040886.1|WP_001372426.1|623281_625543_-|hydratase
MIKLSEKGVFLASNNEIIAEEHFTGEIKKEEAQKGTIAWSILSSHNTSGNMDKLKIKFDSLASHDITFVGIVQTAKASGMERFPLPYVLTNCHNSLCAVGGTINGDDHVFGLSAAQRYGGIFVPPHIAVIHQYMREMMAGGGKMILGSDSHTRYGALGTMAVGEGGGELVKQLLNDTWDIDYPGVVAVHLTGKPAPYVGPQDVALAIIGAVFKNGYVKNKVMEFVGPGVSALSTDFRNSVDVMTTETTCLSSVWQTDEEVHNWLALHGRGQDYCQLNPQPMAYYDGCISVDLSAIKPMIALPFHPSNVYKIDTLNQNLTDILREIEIESERVAHGKAKLSLLDKVENGRLKVQQGIIAGCSGGNYENVIAAANALRGQSCGNDTFSLAVYPSSQPVFMDLAQKGVVADLIGAGAIIRTAFCGPCFGAGDTPINNGLSIRHTTRNFPNREGSKPANGQMSAVALMDARSIAATAANGGYLTSASELDCWDNVPEYAFDVTPYKNRVYQGFVKGATQQPLIYGPNIKDWPELGALTDNIVLKVCSKILDEVTTTDELIPSGETSSYRSNPIGLAEFTLSRRDPGYVGRSKATAELENQRLAGNVSELTEVFARIKQIAGQEHIDPLQTEIGSMVYAVKPGDGSAREQAASCQRVIGGLANIAEEYATKRYRSNVINWGMLPLQMAEVPTFEVGDYIYIPGIKAALDNPGTTFKGYVIHEDAPVTEITLYMGSLTAEEREIIKAGSLINFNKNRQM
>NZ_CP040886.1|WP_001036475.1|625725_627159_-|anion-permease
MNKKSLWKLILILAIPCIIGFMPAPAGLSELAWVLFGIYLAAIVGLVIKPFPEPVVLLIAVAASMVVVGNLSDGAFKTTAVLSGYSSGTTWLVFSAFTLSAAFVTTGLGKRIAYLLIGKIGNTTLGLGYVTVFLDLVLAPATPSNTARAGGIVLPIINSVAVALGSEPEKSPRRVGHYLMMSIYMVTKTTSYMFFTAMAGNILALKMINDILHLQISWGGWALAAGLPGIIMLLVTPLVIYTMYPPEIKKVDNKTIAKAGLAELGPMKIREKMLLGVFVLALLGWIFSKSLGVDESTVAIVVMATMLLLGIVTWEDVVKNKGGWNTLIWYGGIIGLSSLLSKVKFFEWLAEVFKNNLAFDGHGNVAFFVIIFLSIIVRYFFASGSAYIVAMLPVFAMLANVSGAPLMLTALALLFSNSYGGMVTHYGGAAGPVIFGVGYNDIKSWWLVGAVLTILTFLVHITLGVWWWNMLIGWNML
>NZ_CP040886.1|WP_001372427.1|627234_628287_-|4-oxalomesaconate-tautomerase
MKKIPCVMMRGGTSRGAFLLAEHLPEDQTQRDKILMAIMGSGNDLEIDGIGGGNPLTSKVAIISRSSDLRADVDYLFAQVIVHEQRVDTTPNCGNMLSGVGAFAIENGLIAATSPVTRVRIRNVNTGTFIEADVQTPNGVVEYEGSARIDGVPGTAAPVALTFLNAAGTKTGKVFPTDNQIDYFDDVPVTCIDMAMPVVIIPAEYLGKTGYELPAELDADKALLARIESIRLQAGKAMGLGDVSNMVIPKPVLISPAQKGGAINVRYFMPHSCHRALAITGAIAISSSCALEGTVTRQIVPSVGYGNINIEHPSGALDVHLSNEGQDATTLRASVIRTTRKIFSGEVYLP
>NZ_CP040886.1|WP_000679972.1|628470_629424_+|LysR-family-transcriptional-regulator
MKHELSSMKAFVILAESSSFNNAAKLLNITQPALTRRIKKMEEDLHIQLFERTTRKVTLTKAGKRLLPEARELIKKFDETLFNIRDMNAYHRGMVTLACIPTAVFYFLPLAIGKFNELYPNIKVRILEQGTNNCMESVLCNESDFGINMNNVTNSSIDFTPLVNEPFVLACRRDHPLAKKQLVEWQELVGYKMIGVRSSSGNRLLIEQQLADKPWKLDWFYEVRHLSTSLGLVEAGLGISALPGLAMPHAPYSSIIGIPLVEPVIRRTLGIIRRKDAVLSPAAERFFALLINLWTDDKDNLWTNIVERQRHALQEIG
>NZ_CP040886.1|WP_000815449.1|629464_630460_-|6-phosphogluconolactonase
MKQTVYIASPESQQIHVWNLNHEGALTLTQVVDVPGQVQPMVVSPDKRYLYVGVRPEFRVLAYSIAPDDGALTFAAESALPGSPTHISTDHQGQFVFVGSYNAGNVSVTRLEDGLPVGVVDVVEGLDGCHSANISPDNRTLWVPALKQDRICLFTVSDDGHLVAQDPAEVTTVEGAGPRHMVFHPNEQYAYCVNELNSSVDVWELKDPHGNIECVQTLDMMPENFSDTRWAADIHITPDGRHLYACDRTASLITVFSVSEDGSVLSKEGFQPTETQPRGFNVDHSGKYLIAAGQKSHHISVYEIVGEQGLLHEKGRYAVGQGPMWVVVNAH
>NZ_CP040886.1|WP_000213425.1|630614_631433_+|pyridoxal-phosphatase
MTTRVIALDLDGTLLTPKKTLLPSSIEALARAREAGYQLIIVTGRHHVAIHPFYQALALDTPAICCNGTYLYDYHAKTVLEADPMPVNKALQLIEMLNEHHIHGLMYVDDAMVYEHPTGHVIRTSNWAQTLPPEQRPTFTQVASLAETAQQVNAVWKFALTHDDLPQLQHFGKHVEHELGLECEWSWHDQVDIARGGNSKGKRLTKWVEAQGWSMENVVAFGDNFNDISMLEAAGTGVAMGNADDAVKARANIVIGDNTTDSIAQFIYSHLI
>NZ_CP040886.1|WP_000891692.1|631433_632492_-|molybdenum-ABC-transporter-ATP-binding-protein-ModC
MLELNFSQTLGNHCLTINETLPANGITAIFGVSGAGKTSLINAISGLTRPQKGRIVLNGRVLNDAEKGICLTPEKRRVGYVFQDARLFPHYKVRGNLRYGMSKSMVDQFDKLVALLGIEPLLDRLPGSLSGGEKQRVAIGRALLTAPELLLLDEPLASLDIPRKRELLPYLQRLTREINIPMLYVSHSLDEILHLADRVMVLENGQVKAFGALEEVWGSSVMNPWLPKEQQSSILKVTVLEHHPHYAMTALALGDQHLWVNKLDEPLQAALRIRIQASDVSLVLQPPQQTSIRNVLRAKVVNSYDDNGQVEVELEVGGKTLWARISPWARDELAIKPGLWLYAQIKSVSITA
>NZ_CP040886.1|WP_000604034.1|632494_633184_-|molybdate-ABC-transporter-permease-subunit
MILTDPEWQAVLLSLKVSSLAVLFSLPFGIFFAWLLVRCTFPGKALLDSVLHLPLVLPPVVVGYLLLVSMGRRGFIGERLYDWFGITFAFSWRGAVLAAAVMSFPLMVRAIRLALEGVDVKLEQAARTLGAGRWRVFFTITLPLTLPGIIVGTVLAFARSLGEFGATITFVSNIPGETRTIPSAMYTLIQTPGGESGAARLCIISIALAMISLLISEWLARISRERAGR
>NZ_CP040886.1|WP_000101993.1|633183_633957_-|molybdate-ABC-transporter-substrate-binding-protein
MARKWLNLFAGAALSFAVAGNALADEGKITVFAAASLTNAMQDIATQYKKEKGVDVVSSFASSSTLARQIEAGAPADLFISADQKWMDYAVDKKAIDTATRQTLLGNSLVVVAPKASEQKDFTIDSKTNWTSLLNGGRLAVGDPEHVPAGIYAKEALQKLGAWDTLSPKLAPAEDVRGALALVERNEAPLGIVYGSDAVASKGVKVVAIFPEDSHKKVEYPVAVVEGHNNATVKAFYDYLKGPQAAEIFKRYGFTTK
>NZ_CP040886.1|WP_000891515.1|634123_634273_-|multidrug-efflux-pump-accessory-protein-AcrZ
MLELLKSLVFAVIMVPVVMAIILGLIYGLGEVFNIFSGVGKKDQPGQNH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_3

1120034-1120187

Orphan

Consensus_repeat	Method
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_3

>merge|NZ_CP040886|3|1120034-1120187|CRISPRCasFinder
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCGTCAGCGTCGCATCAGGCATCTGCGCATAACCGCCGGATGCGGCGTAAACGCCTTATCCGGCCTACCGATCCGGCACAGGTTTGTAGGCATGATAAGACGCG

>NZ_CP040886|3|3|1120034-1120187|CRISPRCasFinder
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCG	TCAGCGTCGCATCAGGCATCTGCGCATAACCGCCGGATGCGGCGTAAA
CGCCTTATCCGGCCTACCGATCCGGCACAGGTTTGTAGGCATGATAAGACGCG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_001371717.1\|1117429_1118200_-\|putative-lateral-flagellar-export/assembly-protein-LafU	unknown	unknown	gnl\|CDD\|235860
NZ_CP040886.1\|WP_001226155.1\|1116303_1117359_-\|DNA-polymerase-IV	unknown	unknown	gnl\|CDD\|235035
NZ_CP040886.1\|WP_000532698.1\|1126928_1127402_-\|C-lysozyme-inhibitor	unknown	unknown	gnl\|CDD\|182187
NZ_CP040886.1\|WP_000174677.1\|1110953_1111355_-\|sigma-factor-binding-protein-Crl	unknown	unknown	gnl\|CDD\|182882
NZ_CP040886.1\|WP_023147999.1\|1130225_1133285_-\|RHS-repeat-protein	unknown	unknown	gnl\|CDD\|225750
NZ_CP040886.1\|WP_000189539.1\|1111412_1112657_-\|esterase-FrsA	unknown	unknown	gnl\|CDD\|235337
NZ_CP040886.1\|WP_000284050.1\|1123623_1124202_-\|D-sedoheptulose-7-phosphate-isomerase	unknown	unknown	gnl\|CDD\|179012
NZ_CP040886.1\|WP_001225679.1\|1121939_1122680_+\|murein-L,D-transpeptidase	unknown	unknown	gnl\|CDD\|225577
NZ_CP040886.1\|WP_000978828.1\|1129764_1130214_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_001291992.1\|1112748_1113207_-\|xanthine-phosphoribosyltransferase	unknown	unknown	gnl\|CDD\|236395
NZ_CP040886.1\|WP_001059874.1\|1115854_1116307_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|182099
NZ_CP040886.1\|WP_000973093.1\|1124441_1126886_+\|acyl-CoA-dehydrogenase	unknown	unknown	gnl\|CDD\|236528
NZ_CP040886.1\|WP_001295202.1\|1115281_1115548_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|181972
NZ_CP040886.1\|WP_000952760.1\|1118159_1119899_+\|flagellar-type-III-secretion-system-protein-FlhA	unknown	unknown	gnl\|CDD\|224217
NZ_CP040886.1\|WP_000333380.1\|1122650_1123418_-\|class-II-glutamine-amidotransferase	unknown	unknown	gnl\|CDD\|372525
NZ_CP040886.1\|WP_001293003.1\|1113467_1114925_+\|cytosol-nonspecific-dipeptidase	unknown	unknown	gnl\|CDD\|184986
NZ_CP040886.1\|WP_000749881.1\|1109859_1110915_+\|phosphoporin-PhoE	unknown	unknown	gnl\|CDD\|182275
NZ_CP040886.1\|WP_000009291.1\|1120889_1121648_-\|C40-family-peptidase	unknown	unknown	gnl\|CDD\|223862
NZ_CP040886.1\|WP_001118055.1\|1127555_1128326_+\|2-oxoglutaramate-amidase	unknown	unknown	gnl\|CDD\|182461
NZ_CP040886.1\|WP_000006256.1\|1120216_1120714_-\|REP-associated-tyrosine-transposase-RayT	unknown	unknown	gnl\|CDD\|224854

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_001371717.1\|1117429_1118200_-\|putative-lateral-flagellar-export/assembly-protein-LafU	gnl\|CDD\|235860	PRK06778, PRK06778, hypothetical protein; Validated.	8.79616e-171
NZ_CP040886.1\|WP_001226155.1\|1116303_1117359_-\|DNA-polymerase-IV	gnl\|CDD\|235035	PRK02406, PRK02406, DNA polymerase IV; Validated.	0
NZ_CP040886.1\|WP_000532698.1\|1126928_1127402_-\|C-lysozyme-inhibitor	gnl\|CDD\|182187	PRK09993, PRK09993, C-lysozyme inhibitor; Provisional.	9.39999e-93
NZ_CP040886.1\|WP_000174677.1\|1110953_1111355_-\|sigma-factor-binding-protein-Crl	gnl\|CDD\|182882	PRK10984, PRK10984, sigma factor-binding protein Crl.	1.11584e-87
NZ_CP040886.1\|WP_023147999.1\|1130225_1133285_-\|RHS-repeat-protein	gnl\|CDD\|225750	COG3209, RhsA, Rhs family protein [Cell envelope biogenesis, outer membrane].	1.46409e-133
NZ_CP040886.1\|WP_000189539.1\|1111412_1112657_-\|esterase-FrsA	gnl\|CDD\|235337	PRK05077, frsA, esterase FrsA.	0
NZ_CP040886.1\|WP_000284050.1\|1123623_1124202_-\|D-sedoheptulose-7-phosphate-isomerase	gnl\|CDD\|179012	PRK00414, gmhA, D-sedoheptulose 7-phosphate isomerase.	1.61173e-142
NZ_CP040886.1\|WP_001225679.1\|1121939_1122680_+\|murein-L,D-transpeptidase	gnl\|CDD\|225577	COG3034, COG3034, Uncharacterized protein conserved in bacteria [Function unknown].	1.07529e-116
NZ_CP040886.1\|WP_001291992.1\|1112748_1113207_-\|xanthine-phosphoribosyltransferase	gnl\|CDD\|236395	PRK09177, PRK09177, xanthine-guanine phosphoribosyltransferase; Validated.	5.05624e-113
NZ_CP040886.1\|WP_001059874.1\|1115854_1116307_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|182099	PRK09831, PRK09831, GNAT family N-acetyltransferase.	4.77997e-103
NZ_CP040886.1\|WP_000973093.1\|1124441_1126886_+\|acyl-CoA-dehydrogenase	gnl\|CDD\|236528	PRK09463, fadE, acyl-CoA dehydrogenase; Reviewed.	0
NZ_CP040886.1\|WP_001295202.1\|1115281_1115548_-\|hypothetical-protein	gnl\|CDD\|181972	PRK09588, PRK09588, hypothetical protein; Reviewed.	1.93527e-42
NZ_CP040886.1\|WP_000952760.1\|1118159_1119899_+\|flagellar-type-III-secretion-system-protein-FlhA	gnl\|CDD\|224217	COG1298, FlhA, Flagellar biosynthesis pathway, component FlhA [Cell motility and secretion / Intracellular trafficking and secretion].	0
NZ_CP040886.1\|WP_000333380.1\|1122650_1123418_-\|class-II-glutamine-amidotransferase	gnl\|CDD\|372525	pfam13230, GATase_4, Glutamine amidotransferases class-II. This family captures members that are not found in pfam00310.	8.29603e-146
NZ_CP040886.1\|WP_001293003.1\|1113467_1114925_+\|cytosol-nonspecific-dipeptidase	gnl\|CDD\|184986	PRK15026, PRK15026, aminoacyl-histidine dipeptidase; Provisional.	0
NZ_CP040886.1\|WP_000749881.1\|1109859_1110915_+\|phosphoporin-PhoE	gnl\|CDD\|182275	PRK10159, PRK10159, phosphoporin PhoE.	0
NZ_CP040886.1\|WP_000009291.1\|1120889_1121648_-\|C40-family-peptidase	gnl\|CDD\|223862	COG0791, Spr, Cell wall-associated hydrolases (invasion-associated proteins) [Cell envelope biogenesis, outer membrane].	3.3314e-41
NZ_CP040886.1\|WP_001118055.1\|1127555_1128326_+\|2-oxoglutaramate-amidase	gnl\|CDD\|182461	PRK10438, PRK10438, C-N hydrolase family amidase; Provisional.	0
NZ_CP040886.1\|WP_000006256.1\|1120216_1120714_-\|REP-associated-tyrosine-transposase-RayT	gnl\|CDD\|224854	COG1943, COG1943, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	7.32036e-43

>NZ_CP040886.1|WP_000952760.1|1118159_1119899_+|flagellar-type-III-secretion-system-protein-FlhA
MLSRSDLLTLLTINFIVVTKGAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQTRRKDVASEADFYGAMDGASKFVRGDAIAGMMILAINLIGGVCIGIFKYNLSADAAFQQYVLMTIGDGLVAQIPSLLLSTAAAIIVTRISDNGDITHDVRHQLLASPSVLYTATGIMFVLAVVPGMPHLPFLLFSALLGFTGWRMSKRPQAAEAEEKSLETLTRTITETSEQQVSWETIPLIEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYAIFINGIKADEADIPADKLMALPSSETYGEIDGVLGNDPAYGMPVTWIQPAQKAKALNMGYQVIDSASVIATHVNKIVRSYIPDLFSYDDITQLHNRLSSMAPRLAEDLSAALNYSQLLKVYRALLTEGVSLRDIVTIATVLVASSAVTKDHILLAADVRLALRRSITHPFVRKQELTVYTLNNELENLLTNVVNQAQQGGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVPPQLRPLLARYARLFAPGLHVLSYNEVPDELELKIMGALM
>NZ_CP040886.1|WP_001371717.1|1117429_1118200_-|putative-lateral-flagellar-export/assembly-protein-LafU
MIVNSVSKSERESIIAALHGQSIFSGGGLSPLNKISPSHPPKPATVAVPEETEKKARDVNEKTALLKKKSATELGELATSINTIARDAHMEANLEMEIVPQGLRVLIKDDQNRNMFECGSAQIMPFFKTLLVELAPVFDSLDNKIIITGHTDAMAYKNNIYNNWNLSGDRALSARRVLEEAGMPEDKVMQVSAMADQMLLDAKNPQSAGNRRIEIMVLTKSASDTLYQYFGQHGDKVVQPLVQKLDKQQVLSQRMR
>NZ_CP040886.1|WP_001226155.1|1116303_1117359_-|DNA-polymerase-IV
MRKIIHVDMDCFFAAVEMRDNPALRDIPIAIGGSRERRGVISTANYPARKFGVRSAMPTGMALKLCPHLTLLPGRFDAYKEASNHIREIFSRYTSRIEPLSLDEAYLDVTDSVHCHGSATLIAQEIRQTIFNELHLTASAGVAPVKFLAKIASDMNKPNGQFVITPAEVPAFLQTLPLAKIPGVGKVSAAKLEAMGLRTCGDVQKCDLVILLKRFGKFGRILWERSQGIDERDVNSERLRKSVGVERTMAEDIHHWSECEAIIERLYPELERRLAKVKPDLLIARQGVKLKFDDFQQTTQEHVWPRLNKADLIATARKTWDERRGGRGVRLVGLHVTLLDPQMERQLVLGL
>NZ_CP040886.1|WP_001059874.1|1115854_1116307_-|GNAT-family-N-acetyltransferase
MNNIQIRNYQPGDFQQLCAIFIRAVMMTASQHYSPQQIAAWAQIDESRWKEKLAKSQVRVAVINAQPVGFISRIERHIDMLFVDPEYTRRGVASALLKPLIKSESELTVDASITAKPFFERYGFQIVKQQHVECRGAWFTNFYMRYKPQH
>NZ_CP040886.1|WP_001295202.1|1115281_1115548_-|hypothetical-protein
MEWYMGKYIRPLSDAVFTIASDDLWIESLAIQQLHTTANLPNMQRVVGMPDLHPGRGYPIGAAFFSVGRFYPARRRGNGAGNRNGPLL
>NZ_CP040886.1|WP_001293003.1|1113467_1114925_+|cytosol-nonspecific-dipeptidase
MSELSQLSPQPLWDIFAKICSIPHPSYHEEQLAEYIVGWAKEKGFHVERDQVGNILIRKPATAGMENRKPVVLQAHLDMVPQKNNDTVHDFTKDPIQPYIDGEWVKARGTTLGADNGIGMASALAVLADENVVHGPLEVLLTMTEEAGMDGAFGLQSNWLQADILINTDSEEEGEIYMGCAGGIDFTSNLHLDREAVPAGFETFKLTLKGLKGGHSGGEIHVGLGNANKLLVRFLAGHAEELDLRLIDFNGGTLRNAIPREAFATIAVAADKVDALKSLVNTYQDILKNELAEKEKNLALLLDSVANDKAALIAKSRDTFIRLLNATPNGVIRNSDVAKGVVETSLNVGVVTMTDNNVEIHCLIRSLIDSGKDYVVSMLDSLGKLAGAKTEAKGAYPGWQPDANSPVMHLVRETYQRLFNKTPNIQIIHAGLECGLFKKPYPEMDMVSIGPTITGPHSPDEQVHIKSVGHYWTLLTELLKEIPAK
>NZ_CP040886.1|WP_001291992.1|1112748_1113207_-|xanthine-phosphoribosyltransferase
MSEKYIVTWDMLQIHARKLASRLMPSEQWKGIIAVSRGGLVPGALLARELGIRHVDTVCISSYDHDNQRELKVLKRAEGDGEGFIVIDDLVDTGGTAVAIREMYPKAHFVTIFAKPAGRPLVDNYVVDIPQDTWIEQPWDMGVVFVPPISGR
>NZ_CP040886.1|WP_000189539.1|1111412_1112657_-|esterase-FrsA
MTQANLSETLFKPRFKHPETSTLVRRFNHGAQPPVQSALDGKTIPHWYRMINRLMWIWRGIDPREILDVQARIVMSDAERTDDDLYDTVIGYRGGNWIYEWATQAMVWQQKACAEEDPQLSGRHWLHAATLYNIAAYPHLKGDDLAEQAQALSNRAYEEAAQRLPGTMRQMEFTVPGGAPITGFLHMPKGDGPFPTVLMCGGLDAMQTDYYSLYERYFAPRGIAMLTIDMPSVGFSSKWKLTQDSSLLHQHVLKALPNVPWVDHTRVAAFGFRFGANVAVRLAYLESPRLKAVACLGPVVHTLLSDFKCQQQVPEMYLDVLASRLGMHDASDDALRVELNRYSLKVQGLLGRRCPTPMLSGYWKNDPFSPEEDSRLITSSSADGKLLEIPFNPVYRNFDKGLQEITGWIEKRLC
>NZ_CP040886.1|WP_000174677.1|1110953_1111355_-|sigma-factor-binding-protein-Crl
MTLPSGHPKSRLIKKFTALGPYIREGKCEDNRFFFDCLAVCVNVKPAPEVREFWGWWMELEAQESRFTYSYQFGLFDKAGDWKSVPVKDTEVVERLEHTLREFHEKLRELLTTLNLKLEPADDFRDEPVKLTA
>NZ_CP040886.1|WP_000749881.1|1109859_1110915_+|phosphoporin-PhoE
MKKSTLALVVMGIVASASVQAAEIYNKDGNKLDVYGKVKAMHYMSDNDSKDGDQSYIRFGFKGETQINDQLTGYGRWEAEFAGNKAESDTAQQKTRLAFAGLKYKDLGSFDYGRNLGALYDVEAWTDMFPEFGGDSSAQTDNFMTKRASGLATYRNTDFFGVIDGLNLTLQYQGKNENRDVKKQNGDGFGTSLTYDFGGSDFAISGAYTNSDRTNEQNLQSRGTGKRAEAWATGLKYDANNIYLATFYSETRKMTPITGGFANKTQNFEAVAQYQFDFGLRPSLGYVLSKGKDIEGIGDEDLVNYIDVGATYYFNKNMSAFVDYKINQLDSDNKLNINNDDIVAVGMTYQF
>NZ_CP040886.1|WP_000006256.1|1120216_1120714_-|REP-associated-tyrosine-transposase-RayT
MSEYRRYYIKGGTWFFTVNLRNRRSQLLTTQYQMLRHAIIKVKRDRPFEINAWVVLPEHMHCIWTLPEGDDDFSSRWREIKKQFTHACGLKNIWQPRFWEHAIRNTKDYRHHVDYIYINPVKHGWVKQVSDWPFSTFHRDVARGLYPIDWAGDVTDINAGERIIL
>NZ_CP040886.1|WP_000009291.1|1120889_1121648_-|C40-family-peptidase
MSFMSSFLLGRFLHPGVFSLCVLLPLFASATTSHISFSYAARQRMQNRARLLKQYQTHLKKQASYIVEGNAESRRALRQHNREQIKQHPEWFPAPLKASDRRWQALAENNHFLSSDHLHNITEVAIHRLEQQLGKPYVWGGTRPDQGFDCSGLVFYAYNKILEAKLPRTANEMYHYHRATIVANNDLRRGDLLFFHIHSREIADHMGVYLGDGQFIESPRTGENIRVSRLAEPFWQDHFLGARRILTEETIL
>NZ_CP040886.1|WP_001225679.1|1121939_1122680_+|murein-L,D-transpeptidase
MRKIALILAMLLIPCVSFAGLLGSSSSTTPVSKEYKQQLMGSPVYIQIFKEERTLDLYVKMGEQYQLLDSYKICKYSGGLGPKQRQGDFKSPEGFYSVQRNQLKPDSRYYKAINIGFPNAYDRAHGYEGKYLMIHGDCVSIGCYAMTNQGIDEIFQFVTGALVFGQPSVQVSIYPFRMTDANMKRHKYSNFKDFWEQLKPGYDYFEQTRKPPTVSVVNGRYVVSKPLSHEVVQPQLASNYTLPEAK
>NZ_CP040886.1|WP_000333380.1|1122650_1123418_-|class-II-glutamine-amidotransferase
MCELLGMSANVPTDICFSFTGLVQRGGGTGPHKDGWGITFYEGKGCRTFKDPQPSFNSPIAKLVQDYPIKSCSVVAHIRQANRGEVALENTHPFTRELWGRNWTYAHNGQLTGYKSLETGNFRPVGETDSEKAFCWLLHKLTQRYPRTPGNMAAVFKYIASLADELRQKGVFNMLLSDGRYVMAYCSTNLHWITRRAPFGVATLLDQDVEIDFSSQTTPNDVVTVIATQPLTGNETWQKIMPGEWRLFCLGERVV
>NZ_CP040886.1|WP_000284050.1|1123623_1124202_-|D-sedoheptulose-7-phosphate-isomerase
MYQDLIRNELNEAAETLANFLKDDANIHAIQRAAVLLADSFKAGGKVLSCGNGGSHCDAMHFAEELTGRYRENRPGYPAIAISDVSHISCVGNDFGFNDIFSRYVEAVGREGDVLLGISTSGNSANVIKAIAAAREKGMKVITLTGKDGGKMAGTADIEIRVPHFGYADRIQEIHIKVIHILIQLIEKEMVK
>NZ_CP040886.1|WP_000973093.1|1124441_1126886_+|acyl-CoA-dehydrogenase
MMILSILATVVLLGALFYHRVSLFISSLILLAWTAALGVAGLWSAWVLVPLAIILVPFNFAPMRKSMISAPVFRGFRKVMPPMSRTEKEAIDAGTTWWEGDLFQGKPDWKKLHNYPQPRLTAEEQAFLDGPVEEACRMANDFQITHELADLPPELWAYLKEHRFFAMIIKKEYGGLEFSAYAQSRVLQKLSGVSGILAITVGVPNSLGPGELLQHYGTDEQKNHYLPRLARGQEIPCFALTSPEAGSDAGAIPDTGIVCMGEWQGQQVLGMRLTWNKRYITLAPIATVLGLAFKLSDPEKLLGGAEDLGITCALIPTTTPGVEIGRRHFPLNVPFQNGPTRGKDVFVPIDYIIGGPKMAGQGWRMLVECLSVGRGITLPSNSTGGVKSVALATGAYAHIRRQFKISIGKMEGIEEPLARIAGNAYVMDAAASLITYGIMLGEKPAVLSAIVKYHCTHRGQQSIIDAMDITGGKGIMLGQSNFLARAYQGAPIAITVEGANILTRSMMIFGQGAIRCHPYVLEEMEAAKNNDVNAFDKLLFKHIGHVGSNKVRSFWLGLTRGLTSSTPTGDATKRYYQHLNRLSANLALLSDVSMAVLGGSLKRRERISARLGDILSQLYLASAVLKRYDDEGRNEADLPLVHWGVQDALYQAEQAMDDLLQNFPNRVVAGLLNVVIFPTGRHYLAPSDKLDHKVAKILQVPNATRSRIGRGQYLTPSEHNPVGLLEEALVDVIAADPIHQRICKELGKNLPFTRLDELAHNALAKGLIDKDEAAILVKAEESRLCSINVDDFDPEELATKPVKLPEKVRKVEAA
>NZ_CP040886.1|WP_000532698.1|1126928_1127402_-|C-lysozyme-inhibitor
MGRISSGGMMFKAITTVAALVIATSAMAQDDLTISSLAKGETTKAAFNQMVQGHKLPAWVMKGGTYTPAQTVTLGDETYQVMSACKPHDCGSQRIAVMWSEKSNQMTGLFSTIDEKTSQEKLTWLNVNDALSIDGKTVLFAALTGSLENHPDGFNFK
>NZ_CP040886.1|WP_001118055.1|1127555_1128326_+|2-oxoglutaramate-amidase
MPGLKITLLQQPLVWMDGPANLRHFDRQLEGITGRDVIVLPEMFTSGFAMEAAASSLAQNDVVNWMTAKAQQCNALIAGSVALQTESGSVNRFLLVEPGGTVHFYDKRHLFRMADEHLHYKAGNARVIVEWRGWRILPLVCYDLRFPVWSRNLNDYDLAIYVANWPAPRSLHWQALLTARAIENQAYVAGCNRVGSDGNGCHYRGDSRVINPQGEIIATADAHQATRIDAELSMVALREYREKFPAWQDADEFRLR
>NZ_CP040886.1|WP_000978828.1|1129764_1130214_-|hypothetical-protein
MMKYLMVLLSLFSGSVLGMGRVNELCGIDSVKTIEIINLPSYVTTLVPLSKEGLNEIYRYKVVVNEISDLYAGKIIDLLQMKYFRKEKYNNIRWGVSIISKGNNKCEIYFDAFGECGSVNGINVCFEKNEMIGWIKKEIPLLSQKIGGL
>NZ_CP040886.1|WP_023147999.1|1130225_1133285_-|RHS-repeat-protein
MTSPLNSEGRYTEGEGGLKRVVKKEHADGSITRSEYDEAGRLKAQTDAAGRRTEYSLHMASGAVTAVTGPDGRTVRYGYNSQRQVTSVTYPDGLRSSREYDEKGRLTAETSRSGETTRYSYDDPASELPTGIQDATGSTKQMAWSRYGQLLAFTDCSGYTTRYEYDRYGQQIAVHREEGISTYSSYNPRGQLVSQKDAQGREIRYEYSAAGDLTATISPDGKRSTIEYDKRGRPVSVTEGGLTRSMGYDAAGRITVLTNENGSQSTFRYDPVDRLTEQRGFDGRTQRYHYDLTGKLTQSEDEGLITLWHYDASDRITHRTVNGDPAEQWQYDEHGWLTTLSHTCEGHRVSVHYGYDDKGRLTGERQTVENPETGEMLWEHETGHAYSEQGLATRQEPDGLPPVEWLTYGSGYLAGMKLGGTPLVEYTRDRLHRETARSFGGAGSTAGYEQATAYTLTGQLQSRHLNLPQLDCDYTWNDNGQLVRISGPQECREYRYSGTGRLTGVHTTAANLDIDIPYATDPAGNRLPDPELHPDSTLTAWPDNRIAEDAHYVYRYDEYGRLAEKTDRIPEGVIRMHDERTHHYHYDSQHRLVFYTRIQHGEPQVESRYLYDPLGRRTGKRVWRRERDLTGWMSLSRKPEETWYGWDGDRLTTVQTQQTRIQTVYQPGSFTPLLRIETENGEQAKARHRSLAEVLQEDTGVTLPAELAVMLGRLERELRQGSVSEESQQWLAQCGLTAEQMAAQLEAEYIPERKLHLYHCDHRGLPLALISPEGETAWQGEYDEWGNLLGEESAQHLQQSLRLPGQQYDEESGLYYNRNRYYDPLQGRYITQDPIGLRGEWNLYKYPLNPVRFIDSLGLKFHVNGDPSDFNQAVEYLKQDSQMKETIDFLSSSEETINIEYIEGTNVRFNSNNMAIYWNSRASLFCSTELNSKSQSPALGLGHEFAHAQYYLLDKENFMALLSRTDKKYENKEEARVITIIESRAAKTLGECTRGAHSGLPFYRVDGPLQTMKITGTPE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_4

1309366-1309481

Orphan

Consensus_repeat	Method
AACGCCTGATGCGACGCTGACGCGTCTTATC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_4

>merge|NZ_CP040886|4|1309366-1309481|CRISPRCasFinder
AACGCCTGATGCGACGCTGACGCGTCTTATCTGGCCTACGCGCTGTGTTTTTGTAGGCCGGATAAGCAAAGCGCATCCGGCATTCAACGCCTGATGCGACGCTGGCGCGTCTTATC

>NZ_CP040886|4|4|1309366-1309481|CRISPRCasFinder
AACGCCTGATGCGACGCTGACGCGTCTTATC	TGGCCTACGCGCTGTGTTTTTGTAGGCCGGATAAGCAAAGCGCATCCGGCATTC
AACGCCTGATGCGACGCTGGCGCGTCTTATC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_000235700.1\|1301659_1303270_+\|thiamine/thiamine-pyrophosphate-ABC-transporter-permease-ThiP	unknown	unknown	gnl\|CDD\|181853
NZ_CP040886.1\|WP_001065381.1\|1322274_1323096_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	unknown	unknown	gnl\|CDD\|234708
NZ_CP040886.1\|WP_000746150.1\|1317595_1319950_+\|LPS-assembly-protein-LptD	unknown	unknown	gnl\|CDD\|235158
NZ_CP040886.1\|WP_000241271.1\|1321288_1322278_+\|4-hydroxythreonine-4-phosphate-dehydrogenase-PdxA	unknown	unknown	gnl\|CDD\|234696
NZ_CP040886.1\|WP_001300811.1\|1304915_1305794_-\|arabinose-operon-transcriptional-regulator-AraC	unknown	unknown	gnl\|CDD\|236717
NZ_CP040886.1\|WP_001371422.1\|1300700_1301684_+\|thiamine-ABC-transporter-substrate-binding-subunit	unknown	unknown	gnl\|CDD\|236883
NZ_CP040886.1\|WP_001200579.1\|1316525_1317341_-\|co-chaperone-DjlA	unknown	unknown	gnl\|CDD\|236512
NZ_CP040886.1\|WP_000916291.1\|1303253_1303952_+\|thiamine-ABC-transporter-ATP-binding-protein-ThiQ	unknown	unknown	gnl\|CDD\|182716
NZ_CP040886.1\|WP_001117011.1\|1312831_1315738_+\|RNA-polymerase-associated-protein-RapA	unknown	unknown	gnl\|CDD\|235319
NZ_CP040886.1\|WP_001248770.1\|1298661_1298793_-\|glucose-uptake-inhibitor-SgrT	unknown	unknown	gnl\|CDD\|374203
NZ_CP040886.1\|WP_000525176.1\|1315749_1316409_+\|bifunctional-tRNA-pseudouridine(32)-synthase/23S-rRNA-pseudouridine(746)-synthase-RluA	unknown	unknown	gnl\|CDD\|236659
NZ_CP040886.1\|WP_001148402.1\|1304065_1304830_-\|DedA-family-protein	unknown	unknown	gnl\|CDD\|223659
NZ_CP040886.1\|WP_000035637.1\|1310315_1312667_+\|DNA-polymerase-II	unknown	unknown	gnl\|CDD\|235595
NZ_CP040886.1\|WP_000800453.1\|1320002_1321289_+\|peptidylprolyl-isomerase-SurA	unknown	unknown	gnl\|CDD\|236758
NZ_CP040886.1\|WP_000637846.1\|1297381_1298560_-\|sugar-efflux-transporter-SetA	unknown	unknown	gnl\|CDD\|129977
NZ_CP040886.1\|WP_001371424.1\|1306132_1307833_+\|ribulokinase	unknown	unknown	gnl\|CDD\|235221
NZ_CP040886.1\|WP_001297366.1\|1298881_1300537_+\|HTH-type-transcriptional-regulator-SgrR	unknown	unknown	gnl\|CDD\|184188
NZ_CP040886.1\|WP_000610901.1\|1323098_1323476_+\|Co2+/Mg2+-efflux-protein-ApaG	unknown	unknown	gnl\|CDD\|180098
NZ_CP040886.1\|WP_000888642.1\|1309545_1310241_+\|L-ribulose-5-phosphate-4-epimerase	unknown	unknown	gnl\|CDD\|236181
NZ_CP040886.1\|WP_000151734.1\|1307843_1309346_+\|L-arabinose-isomerase	unknown	unknown	gnl\|CDD\|179503

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_000235700.1\|1301659_1303270_+\|thiamine/thiamine-pyrophosphate-ABC-transporter-permease-ThiP	gnl\|CDD\|181853	PRK09433, thiP, thiamine transporter membrane protein; Reviewed.	0
NZ_CP040886.1\|WP_001065381.1\|1322274_1323096_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	gnl\|CDD\|234708	PRK00274, ksgA, 16S rRNA (adenine(1518)-N(6)/adenine(1519)-N(6))-dimethyltransferase RsmA.	2.76119e-148
NZ_CP040886.1\|WP_000746150.1\|1317595_1319950_+\|LPS-assembly-protein-LptD	gnl\|CDD\|235158	PRK03761, PRK03761, LPS assembly outer membrane complex protein LptD; Provisional.	0
NZ_CP040886.1\|WP_000241271.1\|1321288_1322278_+\|4-hydroxythreonine-4-phosphate-dehydrogenase-PdxA	gnl\|CDD\|234696	PRK00232, pdxA, 4-hydroxythreonine-4-phosphate dehydrogenase; Reviewed.	0
NZ_CP040886.1\|WP_001300811.1\|1304915_1305794_-\|arabinose-operon-transcriptional-regulator-AraC	gnl\|CDD\|236717	PRK10572, PRK10572, arabinose operon transcriptional regulator AraC.	0
NZ_CP040886.1\|WP_001371422.1\|1300700_1301684_+\|thiamine-ABC-transporter-substrate-binding-subunit	gnl\|CDD\|236883	PRK11205, tbpA, thiamine transporter substrate binding subunit; Provisional.	0
NZ_CP040886.1\|WP_001200579.1\|1316525_1317341_-\|co-chaperone-DjlA	gnl\|CDD\|236512	PRK09430, djlA, co-chaperone DjlA.	2.49529e-169
NZ_CP040886.1\|WP_000916291.1\|1303253_1303952_+\|thiamine-ABC-transporter-ATP-binding-protein-ThiQ	gnl\|CDD\|182716	PRK10771, thiQ, thiamine ABC transporter ATP-binding protein ThiQ.	1.49788e-164
NZ_CP040886.1\|WP_001117011.1\|1312831_1315738_+\|RNA-polymerase-associated-protein-RapA	gnl\|CDD\|235319	PRK04914, PRK04914, RNA polymerase-associated protein RapA.	0
NZ_CP040886.1\|WP_001248770.1\|1298661_1298793_-\|glucose-uptake-inhibitor-SgrT	gnl\|CDD\|374203	pfam15894, SgrT, Inhibitor of glucose uptake transporter SgrT.	0.00206924
NZ_CP040886.1\|WP_000525176.1\|1315749_1316409_+\|bifunctional-tRNA-pseudouridine(32)-synthase/23S-rRNA-pseudouridine(746)-synthase-RluA	gnl\|CDD\|236659	PRK10158, PRK10158, bifunctional tRNA pseudouridine(32) synthase/23S rRNA pseudouridine(746) synthase RluA.	1.37214e-159
NZ_CP040886.1\|WP_001148402.1\|1304065_1304830_-\|DedA-family-protein	gnl\|CDD\|223659	COG0586, DedA, Uncharacterized membrane-associated protein [Function unknown].	2.3759e-49
NZ_CP040886.1\|WP_000035637.1\|1310315_1312667_+\|DNA-polymerase-II	gnl\|CDD\|235595	PRK05762, PRK05762, DNA polymerase II; Reviewed.	0
NZ_CP040886.1\|WP_000800453.1\|1320002_1321289_+\|peptidylprolyl-isomerase-SurA	gnl\|CDD\|236758	PRK10770, PRK10770, peptidyl-prolyl cis-trans isomerase SurA; Provisional.	0
NZ_CP040886.1\|WP_000637846.1\|1297381_1298560_-\|sugar-efflux-transporter-SetA	gnl\|CDD\|129977	TIGR00899, Sugar_efflux_transporter_A, sugar efflux transporter. This family of proteins is an efflux system for lactose, glucose, aromatic glucosides and galactosides, cellobiose, maltose, a-methyl glucoside and other sugar compounds. They are found in both gram-negative and gram-postitive bacteria. [Transport and binding proteins, Carbohydrates, organic alcohols, and acids].	0
NZ_CP040886.1\|WP_001371424.1\|1306132_1307833_+\|ribulokinase	gnl\|CDD\|235221	PRK04123, PRK04123, ribulokinase; Provisional.	0
NZ_CP040886.1\|WP_001297366.1\|1298881_1300537_+\|HTH-type-transcriptional-regulator-SgrR	gnl\|CDD\|184188	PRK13626, PRK13626, HTH-type transcriptional regulator SgrR.	0
NZ_CP040886.1\|WP_000610901.1\|1323098_1323476_+\|Co2+/Mg2+-efflux-protein-ApaG	gnl\|CDD\|180098	PRK05461, apaG, CO2+/MG2+ efflux protein ApaG; Reviewed.	3.63315e-76
NZ_CP040886.1\|WP_000888642.1\|1309545_1310241_+\|L-ribulose-5-phosphate-4-epimerase	gnl\|CDD\|236181	PRK08193, araD, L-ribulose-5-phosphate 4-epimerase AraD.	1.31794e-177
NZ_CP040886.1\|WP_000151734.1\|1307843_1309346_+\|L-arabinose-isomerase	gnl\|CDD\|179503	PRK02929, PRK02929, L-arabinose isomerase; Provisional.	0

>NZ_CP040886.1|WP_000151734.1|1307843_1309346_+|L-arabinose-isomerase
MTIFDNYEVWFVIGSQHLYGPETLRQVTQHAEHVVNALNTEAKLPCKLVLKPLGTTPDEITAICRDANYDDRCAGLVVWLHTFSPAKMWINGLTMLNKPLLQFHTQFNAALPWDSIDMDFMNLNQTAHGGREFGFIGARMRQQHAVVTGHWQDKQAHERIGSWMRQAVSKQDTRHLKVCRFGDNMREVAVTDGDKVAAQIKFGFSVNTWAVGDLVQVVNSISDGDVNALVDEYESCYTMTPATQIHGEKRQNVLEAARIELGMKRFLEQGGFHAFTTTFEDLHGLKQLPGLAVQRLMQQGYGFAGEGDWKTAALLRIMKVMSTGLQGGTSFMEDYTYHFEKGNDLVLGSHMLEVCPSIAVEEKPILDVQHLGIGGKDDPARLIFNTQTGPAIVASLIDLGDRYRLLVNCIDTVKTPHSLPKLPVANALWKAQPDLPTASEAWILAGGAHHTVFSHALNLNDMRQFAEMHDIEITVIDNDTRLPAFKDALRWNEVYYGFRR
>NZ_CP040886.1|WP_001371424.1|1306132_1307833_+|ribulokinase
MAIAIGLDFGSDSVRALAVDCASGEEIATSVEWYPRWQKGQFCDAPNNQFRHHPRDYIESMEAALKTVLAELSVEQRAAVVGIGVDTTGSTPAPIDADGNVLALRPEFAENPNAMFVLWKDHTAVEEAEEITRLCHAPGNVDYSRYIGGIYSSEWFWAKILHVTRQDSAVAQSAASWIELCDWVPALLSGTTGPQDIRRGRCSAGHKSLWHESWGGLPPASFFDELDPILNRHLPSPLFTDTWTADIPVGTLCPEWAQRLGLPESVVISGGAFDCHMGAVGAGAQPNALVKVIGTSTCDILIADKQSVGERAVKGICGQVDGSVVPGFIGLEAGQSAFGDIYAWFGRVLGWPLEQLAAQHPELKAQINASQKQLLPALTEAWAKNPSLDHLPVVLDWFNGRRTPNANQRLKGVITDLNLATDAPLLFGGLIAATAFGARAIMECFTDQGIAVNNVMALGGIARKNQVIMQACCDVLNRPLQIVASDQCCALGAAIFAAVAAKVHADIPSAQQKMASAVEKTLQPCSEQAQRFEQLYRRYQQWAMSAEQHYLPTSAPAQAAQAVPTL
>NZ_CP040886.1|WP_001300811.1|1304915_1305794_-|arabinose-operon-transcriptional-regulator-AraC
MAEAQNDPLLPGYSFNAHLVAGLTPIEANGYLDFFIDRPLGMKGYILNLTIRGQGVVKNQGREFVCRPGDILLFPPGEIHHYGRHPEAREWYHQWVYFRPRAYWHEWLNWPSIFANTGFFRPDEAHQPHFSDLFGQIINAGQGEGRYSELLAINLLEQLLLRRMEAINESLHPPMDNRVREACQYISDHLADSNFDIASVAQHVCLSPSRLSHLFRQQLGISVLSWREDQRISQAKLLLSTTRMPIATVGRNVGFDDQLYFSRVFKKCTGASPSEFRAGCEEKVNDVAVKLS
>NZ_CP040886.1|WP_001148402.1|1304065_1304830_-|DedA-family-protein
MQALLEHFITQSTVYSLMAVVLVAFLESLALVGLILPGTVLMAGLGALIGSGELSFWHAWLAGIVGCLLGDWISFWLGWRFKKPLHRWSFLKKNKALLDKTEHALHQHSMFTILVGRFVGPTRPLVPMVAGMLDLPVAKFITPNIIGCLLWPPFYFLPGILAGAAIDIPAGMQSGEFKWLLLATAVFLWVGGWLCWRLWRSGKATDRLSHYLSRGRLLWLTPLISAIGVVALVVLIRHPLMPVYIDILRKVVGG
>NZ_CP040886.1|WP_000916291.1|1303253_1303952_+|thiamine-ABC-transporter-ATP-binding-protein-ThiQ
MLKLTDITWLYHHLPMRFSLTVERGEQVAILGPSGAGKSTLLNLIAGFLTPASGSLTIDGVDHTTTPPSRRPVSMLFQENNLFSHLTVAQNIGLGLNPGLKLNAAQQEKMHAIARQMGIDNLMARLPGELSGGQRQRVALARCLVREQPILLLDEPFSALDPALRQEMLTLVSTSCQQQKMTLLMVSHSVEDAARIATRSVVVADGRIAWQGKTNELLSGKASASALLGITG
>NZ_CP040886.1|WP_000235700.1|1301659_1303270_+|thiamine/thiamine-pyrophosphate-ABC-transporter-permease-ThiP
MATRRQPLIPGWLIPGVSAATLVVAVALAAFLALWWNAPQGNWVAVWQDSYLWHVVRFSFWQAFLSALLSVVPAIFLARALYRRRFPGRLALLRLCAMTLILPVLVAVFGILSVYGRQGWLASLCQSLGLEWTFSPYGLQGILLAHVFFNLPMASRLLLQALENIPGEQRQLAAQLGMRGWHFFRFVEWPWLRRQIPPVAALIFMLCFASFATVLSLGGGPQATTIELAIYQALSYDYDPARAAMLALIQMVCCLGLVLLSQRLSKAIAPGTTLLQGWRDPDDRLHSRICDTVLIVLALLLLLPPLLAVIVDGVNRQLPEVLAQPVLWQALWTSLRIALAAGVLCVVLTMMLLWSSRELRARQKMLAGQALEMSGMLILAMPGIVLATGFFLLLNNTIGLPQSADGIVIFTNALMAIPYALKVLENPMRDITARYSMLCQSLGIEGWSRLKVVELRALKRPLAQALAFACVLSIGDFGVVALFGNDDFRTLPFYLYQQIGSYRSQDGAVTALILLLLCFLLFTVIEKLPGRNVKTD
>NZ_CP040886.1|WP_001371422.1|1300700_1301684_+|thiamine-ABC-transporter-substrate-binding-subunit
MLKKCLPLLLLCTAPVFAKPVLIVYTYDSFAADWGPGPKIKKAFEADCNCELKLVALEDGVSLLNRLRMEGKNSKADVVLGLDNNLLDAASKTGLFAKSGVAADAVNVPGGWNNDTFVPFDYGYFAFVYDKNKLKNPPQSLKELVESDQNWRVIYQDPRTSTPGLGLLLWMQKVYGDDAPQAWQKLAKKTVTVTKGWSEAYGLFLKGESDLVLSYTTSPAYHILEEKKDNYAAANFSEGHYLQVEVAARTAASKQPELAQKFLQFMVSPAFQNAIPTGNWMYPVANVTLPAGFEQLTKPATTLEFTPAEVAAQRQAWISEWQRAVSR
>NZ_CP040886.1|WP_001297366.1|1298881_1300537_+|HTH-type-transcriptional-regulator-SgrR
MPSARLQQQFIRLWQCCEGKSQDTTLNELAALLSCSRRHMRTLLNTMQDRGWLTWEAEVGRGKRSRLTFLYTGLALQQQRAEDLLEQDRIDQLVQLVGDKATVRQMLVSHLGRSFRQGRHILRVLYYRPLRNLLPGSALRRSETHIARQIFSSLTRINEENGELEADIAHHWQQISPLHWRFFLRPGVHFHHGRELEMDDVIASLKRINTLPLYSHIADIVSPTPWTLDIHLTQPDRWLPLLLGQVPAMILPREWETLSNFASHPIGTGPYAVIRNTTNQLKIQAFDDFFGYRALIDEVNVWVLPEIADEPAGGLMLKGPQGEEKEIESRLEEGCYYLLFDSRTHRGANQQVRDWVSYVLSPTNLVYFAEEQYQQLWFPAYGLLPRWHHARTIKSEKPAGLESLTLTFYQDHSEHRVIAGIMQQILASHQVTLEIKEISYDQWHEGEIESDIWLNSANFTLPLDFSLFAHLCEVPLLQHCIPIDWQADAARWRNGEMNLANWCQQLVASKAMVPLIHHWLIIQGQRSMRGLRMNTLGWFDFKSAWFAPPDP
>NZ_CP040886.1|WP_001248770.1|1298661_1298793_-|glucose-uptake-inhibitor-SgrT
MRQFYQHYFTATAKLCWLRWLSVPQRLTMLEGLMQWDDRNSES
>NZ_CP040886.1|WP_000637846.1|1297381_1298560_-|sugar-efflux-transporter-SetA
MIWIMTMARRMNGVYAAFMLVAFMMGVAGALQAPTLSLFLSREVGAQPFWIGLFYTVNAIAGIGVSLWLAKRSDSQGDRRKLIIFCCLMAIGNALLFAFNRHYLTLITCGVLLASLANTAMPQLFALAREYADNSAREVVMFSSVMRAQLSLAWVIGPPLAFMLALNYGFTVMFSIAAGIFTLSLVLIAFMLPSVARVELPSENALSMQGGWQDSNVRMLFVASTLMWTCNTMYIIDMPLWISSELGLPDKLAGFLMGTAAGLEIPAMILAGYYVKRYGKRRMMVIAVAAGVLFYTGLIFFHSRMALMTLQLFNAVFIGIVAGIGMLWFQDLMPGRAGAATTLFTNSISTGVILAGVIQGAIAQSWGHFAVYWVIAVISVVALFLTAKVKDV
>NZ_CP040886.1|WP_000888642.1|1309545_1310241_+|L-ribulose-5-phosphate-4-epimerase
MLEDLKRLVLEANLALPKHNLVTLTWGNVSAVDRERGVFVIKPSGVDYSVMTADDMVVVSIATGEVVEGTKKPSSDTPTHRLLYQAFPSIGGIVHTHSRHATIWAQAGQSIPATGTTHADYFYGTIPCTRKMTDAEINGEYEWETGNVIVETFEKQGIDAAQMPGVLVHSHGPFAWGKNAEDAVHNAIVLEEVAYMGIFCRQLAPQLPDMQQTLLDKHYLRKHGAKAYYGQ
>NZ_CP040886.1|WP_000035637.1|1310315_1312667_+|DNA-polymerase-II
MAQAGFILTRHWRDTPQGTEVSFWLATDNGPLQVTLAPQESVAFIPADQVPRAQHILQGEQGFRLTPLALKDFHRQPVYGLYCRAHRQLMNYEKRLREGGVTVYEADVRPPERYLMERFITSPVWVEGDIRNGAIVNARLKPHPDYRPPLKWVSIDIETTRHGELYCIGLEGCGQRIVYMLGPENGDASALDFELEYVASRPQLLEKLNAWFANYDPDVIIGWNVVQFDLRMLQKHAERYRIPLRLGRDNSELEWREHGFKNGVFFAQAKGRLIIDGIEALKSAFWNFSSFSLETVAQELLGEGKSIDNPWDRMDEIDRRFAEDKPALATYNLKDCELVTQIFHKTEIMPFLLERATVNGLPVDRHGGSVAAFGHLYFPRMHRAGYVAPNLGEVPPHASPGGYVMDSRPGLYDSVLVLDYKSLYPSIIRTFLIDPVGLVEGMAQPDPEHSTEGFLDAWFSREKHCLPEIVTNIWHGRDEAKRQGNKPLSQALKIIMNAFYGVLGTTACRFFDPRLASSITMRGHQIMRQTKALIEAQGYDVIYGDTDSTFVWLKGAHSEEEAAKIGRALVQHVNAWWAETLQKQRLTSALELEYETHFCRFLMPTIRGADTGSKKRYAGLIQEGDKQRMVFKGLETVRTDWTPLAQQFQQELYLRIFRNEPYQEYIRETIDKLMAGELDARLVYRKRLRRPLSEYQRNVPPHVRAARLADEENQKRGRPLQYQNRGTIKYVWTTNGPEPLDYQRSPLDYEHYLTRQLQPVAEGILPFIEDNFATLMTGQLGLF
>NZ_CP040886.1|WP_001117011.1|1312831_1315738_+|RNA-polymerase-associated-protein-RapA
MPFTLGQRWISDTESELGLGTVVAVDARTVTLLFPSTGENRLYARSDSPVTRVMFNPGDTITSHDGWQMQVEEVKEENGLLTYIGTRLDTEESGVALREVFLDSKLVFSKPQDRLFAGQIDRMDRFALRYRARKYSSEQFRMPYSGLRGQRTSLIPHQLNIAHDVGRRHAPRVLLADEVGLGKTIEAGMILHQQLLSGAAERVLIIVPETLQHQWLVEMLRRFNLRFALFDDERYAEAQHDAYNPFDTEQLVICSLDFARRSKQRLEHLCEAEWDLLVVDEAHHLVWSEDAPSREYQAIEQLAEHVPGVLLLTATPEQLGMESHFARLRLLDPNRFHDFAQFVEEQKNYRPVADAVAMLLAGNKLSNDELNMLGEMIGEQDIEPLLQAANSDSEDAQSARQELVSMLMDRHGTSRVLFRNTRNGVKGFPKRELHTIKLPLPTQYQTAIKVSGIMGARKSAEDRARDMLYPERIYQEFEGDNATWWNFDPRVEWLMGYLTSHRSQKVLVICAKAATALQLEQVLREREGIRAAVFHEGMSIIERDRAAAWFAEEDTGAQVLLCSEIGSEGRNFQFASHMVMFDLPFNPDLLEQRIGRLDRIGQAHDIQIHVPYLEKTAQSVLVRWYHEGLDAFEHTCPTGRTIYDSVYNDLINYLASPDQTEGFDDLIKNCREQHEALKAQLEQGRDRLLEIHSNGGEKAQALAESIEEQDDDTNLIAFAMNLFDIIGINQDDRGDNMIVLTPSDHMLVPDFPGLSEDGITITFDREVALAREDAQFITWEHPLIRNGLDLILSGDTGSSTISLLKNKALPVGTLLVELIYVVEAQAPKQLQLNRFLPPTPVRMLLDKNGNNLAAQVEFETFNRQLNAVNRHTGSKLVNAVQQDVHAILQLGEAQIEKSARALIDAARNEADEKLSAELSRLEALRAVNPNIRDDELTAIESNRQQVMESLDQAGWRLDALRLIVVTHQ
>NZ_CP040886.1|WP_000525176.1|1315749_1316409_+|bifunctional-tRNA-pseudouridine(32)-synthase/23S-rRNA-pseudouridine(746)-synthase-RluA
MGMENYNPPQEPWLVILYQDDHIMVVNKPSGLLSVPGRLEEHKDSVMTRIQRDYPQAESVHRLDMATSGVIVVALTKAAERELKRQFREREPKKQYVARVWGHPSPAEGLVDLPLICDWPNRPKQKVCYETGKPAQTEYEVVEYAADNTARVVLKPITGRSHQLRVHMLALGHPILGDRFYASPEARAMAPRLLLHAEMLTITHPAYGNSMTFKAPADF
>NZ_CP040886.1|WP_001200579.1|1316525_1317341_-|co-chaperone-DjlA
MQYWGKIIGVAVALLMGGGFWGVVLGLLIGHMFDKARSRKMAWFANQRERQALFFATTFEVMGHLTKSKGRVTEADIHIASQLMDRMNLHGASRTAAQNAFRVGKSDNYPLREKMRQFRSVCFGRFDLIRMFLEIQIQAAFADGSLHPNERAVLYVIAEELGISRAQFDQFLRMMQGGAQFGGGYQQQTGGGNWQQAQRGPTLEDACNVLGVKPTDDATTIKRAYRKLMSEHHPDKLVAKGLPPEMMEMAKQKAQEIQQAYELIKQQKGFK
>NZ_CP040886.1|WP_000746150.1|1317595_1319950_+|LPS-assembly-protein-LptD
MKKRIPTLLATMIATALYSQQGLAADLASQCMLGVPSYDRPLVQGDTNDLPVTINADHAKGDYPDDAVFTGSVDIMQGNSRLQADEVQLHQKEAPGQPEPVRTVDALGNVHYDDNQVILKGPKGWANLNTKDTNVWEGDYQMVGRQGRGKADLMKQRGENRYTILDNGSFTSCLPGSDTWSVVGSEIIHDREEQVAEIWNARFKVGPVPIFYSPYLQLPVGDKRRSGFLIPNAKYTTTNYFEFYLPYYWNIAPNMDATITPHYMHRRGNIMWENEFRYLSQAGAGLMELDYLPSDKVYEDEHPNDDSSRRWLFYWNHSGVMDQVWRFNVDYTKVSDPSYFNDFDNKYGSSTDGYATQKFSVGYAVQNFNATVSTKQFQVFSEQNTSSYSAEPQLDVNYYQNDVGPFDTRIYGQAVHFVNTRDDMPEATRVHLEPTINLPLSNNWGSINTEAKLLATHYQQTNLDWYNSRNTTKLDESVNRVMPQFKVDGKMVFERDMEMLAPGYTQTLEPRAQYLYVPYRDQSDIYNYDSSLLQSDYSGLFRDRTYGGLDRIASANQVTTGVTSRIYDDAAVERFNISVGQIYYFTESRTGDDNITWENDDKTGSLVWAGDTYWRISERWGLRGGIQYDTRLDNVATSNSSIEYRRDEDRLVQLNYRYASPEYIQATLPKYYSTAEQYKNGISQVGAVASWPIADRWSIVGAYYYDTNANKQADSMLGVQYSSCCYAIRVGYERKLNGWDNDKQHAVYDNAIGFNIELRGLSSNYGLGTQEMLRSNILPYQNSL
>NZ_CP040886.1|WP_000800453.1|1320002_1321289_+|peptidylprolyl-isomerase-SurA
MKNWKTLLLGIAMIANTSFAAPQVVDKVAAVVNNGVVLESDVDGLMQSVKLNAAQARQQLPDDATLRHQIMERLIMDQIILQMGQKMGVKISDEQLDQAIANIAKQNNMTLDQMRSRLAYDGLNYNTYRNQIRKEMIISEVRNNEVRRRITILPQEVESLAQQVGNQNDASTELNLSHILIPLPENPTSDQVNEAESQARAIVDQARNGADFGKLAIAHSADQQALNGGQMGWGRIQELPGIFAQALSTAKKGDIVGPIRSGVGFHILKVNDLRGESKNISVTEVHARHILLKPSPIMTDEQARVKLEQIAADIKSGKTTFAAAAKEFSQDPGSANQGGDLGWATADIFDPAFRDALTRLNKGQMSAPVHSSFGWHLIELLDTRNVDKTDAAQKDRAYRMLMNRKFSEEAASWMQEQRASAYVKILSN
>NZ_CP040886.1|WP_000241271.1|1321288_1322278_+|4-hydroxythreonine-4-phosphate-dehydrogenase-PdxA
MVKTQRVVITPGEPAGIGPDLVVQLAQREWPVELVVCADATLLTDRAAMLGLPLTLRTYSPNSPAQPQTAGTLTLLPVALRESVTAGQLAVENGHYVVETLARACDGCLNGEFAALITGPVHKGVINDAGIPFTGHTEFFEERSQAKKVVMMLATEELRVALATTHLPLRDIADAITPALLHEVIAILHHDLRTKFGIAEPRILVCGLNPHAGEGGHMGTEEIDTIIPLLDELRAQGMKLNGPLPADTLFQPKYLDNADAVLAMYHDQGLPVLKYQGFGRGVNITLGLPFIRTSVDHGTALELAGRGEADVGSFITALNLAIKMIVNTQ
>NZ_CP040886.1|WP_001065381.1|1322274_1323096_+|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA
MNNRVHQGHLARKRFGQNFLNDQFVIDSIVSAINPQKGQAMVEIGPGLAALTEPVGERLDQLTVIELDRDLAARLQTHPFLGPKLTIYQQDAMTFNFGELAEKMGQPLRVFGNLPYNISTPLMFHLFSYTDAIADMHFMLQKEVVNRLVAGPNSKAYGRLSVMAQYYCNVIPVLEVPPSAFTPPPKVDSAVVRLVPHATMPHPVKDVRVLSRITTEAFNQRRKTIRNSLGNLFSVEVLTGMGIDPAMRAENISVAQYCQMANYLAENAPLQES
>NZ_CP040886.1|WP_000610901.1|1323098_1323476_+|Co2+/Mg2+-efflux-protein-ApaG
MINSPRVCIQVQSVYIEAQSSPDNERYVFAYTVTIRNLGRAPVQLLGRYWLITNGNGRETEVQGEGVVGVQPLIAPGEEYQYTSGAIIETPLGTMQGHYEMIDENGVPFSIDIPVFRLAVPTLIH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_5

1332394-1332526

Orphan

Consensus_repeat	Method
ATCACCAATATTGAAAA	PILER-CR

2 spacers

The CRISPR arrays of NZ_CP040886_5

>merge|NZ_CP040886|5|1332394-1332526|PILER-CR
ATCACCAATATTGAAAATGTCACACGCAGATAAATCCAACTTTCAATATTGTTAAGTTCCTCACCAATATTGAAAACATGGCGTAGCAAAAAGAAATTTTCAATATTGCTTTATGGATCACCAATATTGAAAG

>NZ_CP040886|5|1|1332394-1332526|PILER-CR
ATCACCAATATTGAAAA	TGTCACACGCAGATAAATCCAACTTTCAATATTGTTAAGTTC
CTCACCAATATTGAAAA	CATGGCGTAGCAAAAAGAAATTTTCAATATTGCTTTATGG
ATCACCAATATTGAAAG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_000203747.1\|1328955_1329243_-\|ferredoxin-like-protein-FixX	unknown	unknown	gnl\|CDD\|185346
NZ_CP040886.1\|WP_001126376.1\|1340668_1343890_-\|carbamoyl-phosphate-synthase-large-subunit	unknown	unknown	gnl\|CDD\|235393
NZ_CP040886.1\|WP_000692204.1\|1331532_1332303_-\|electron-transfer-flavoprotein-FixA	unknown	unknown	gnl\|CDD\|179569
NZ_CP040886.1\|WP_000257192.1\|1323482_1324325_+\|bis(5'-nucleosyl)-tetraphosphatase-(symmetrical)	unknown	unknown	gnl\|CDD\|273208
NZ_CP040886.1\|WP_001287715.1\|1329239_1330526_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182273
NZ_CP040886.1\|WP_000333120.1\|1340012_1340408_-\|carnitine-metabolism-transcriptional-regulator-CaiF	unknown	unknown	gnl\|CDD\|183154
NZ_CP040886.1\|WP_000610901.1\|1323098_1323476_+\|Co2+/Mg2+-efflux-protein-ApaG	unknown	unknown	gnl\|CDD\|180098
NZ_CP040886.1\|WP_000122876.1\|1339336_1339927_+\|carnitine-operon-protein-CaiE	unknown	unknown	gnl\|CDD\|184189
NZ_CP040886.1\|WP_000377129.1\|1325073_1326936_-\|glutathione-regulated-potassium-efflux-system-protein-KefC	unknown	unknown	gnl\|CDD\|235131
NZ_CP040886.1\|WP_000597260.1\|1343907_1345056_-\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	unknown	unknown	gnl\|CDD\|237139
NZ_CP040886.1\|WP_000351348.1\|1336883_1338437_+\|crotonobetaine/carnitine-CoA-ligase	unknown	unknown	gnl\|CDD\|181195
NZ_CP040886.1\|WP_000004404.1\|1338545_1339331_+\|crotonobetainyl-CoA-hydratase	unknown	unknown	gnl\|CDD\|179599
NZ_CP040886.1\|WP_000347117.1\|1334321_1335464_+\|crotonobetainyl-CoA-dehydrogenase	unknown	unknown	gnl\|CDD\|179566
NZ_CP040886.1\|WP_000600725.1\|1326928_1327459_-\|glutathione-regulated-potassium-efflux-system-oxidoreductase-KefF	unknown	unknown	gnl\|CDD\|234852
NZ_CP040886.1\|WP_001091499.1\|1330576_1331518_-\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|235120
NZ_CP040886.1\|WP_000787103.1\|1332776_1334291_+\|L-carnitine/gamma-butyrobetaine-antiport-BCCT-transporter	unknown	unknown	gnl\|CDD\|179568
NZ_CP040886.1\|WP_000543597.1\|1345511_1346333_-\|4-hydroxy-tetrahydrodipicolinate-reductase	unknown	unknown	gnl\|CDD\|223366
NZ_CP040886.1\|WP_001183198.1\|1327566_1328898_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|340874
NZ_CP040886.1\|WP_000349926.1\|1335592_1336810_+\|L-carnitine-CoA-transferase	unknown	unknown	gnl\|CDD\|179589
NZ_CP040886.1\|WP_000624375.1\|1324402_1324882_-\|type-3-dihydrofolate-reductase	unknown	unknown	gnl\|CDD\|182714

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_000203747.1\|1328955_1329243_-\|ferredoxin-like-protein-FixX	gnl\|CDD\|185346	PRK15449, PRK15449, ferredoxin-like protein FixX; Provisional.	2.23442e-69
NZ_CP040886.1\|WP_001126376.1\|1340668_1343890_-\|carbamoyl-phosphate-synthase-large-subunit	gnl\|CDD\|235393	PRK05294, carB, carbamoyl-phosphate synthase large subunit.	0
NZ_CP040886.1\|WP_000692204.1\|1331532_1332303_-\|electron-transfer-flavoprotein-FixA	gnl\|CDD\|179569	PRK03359, PRK03359, putative electron transfer flavoprotein FixA; Reviewed.	6.8619e-170
NZ_CP040886.1\|WP_000257192.1\|1323482_1324325_+\|bis(5'-nucleosyl)-tetraphosphatase-(symmetrical)	gnl\|CDD\|273208	TIGR00668, Bis5'-nucleosyl-tetraphosphatase_symmetrical, bis(5'-nucleosyl)-tetraphosphatase (symmetrical). Diadenosine 5',5"'-P1,P4-tetraphosphate (Ap4A) is a regulatory metabolite of stress conditions. It is hydrolyzed to two ADP by this enzyme. Alternate names include diadenosine-tetraphosphatase and Ap4A hydrolase. [Cellular processes, Adaptations to atypical conditions].	0
NZ_CP040886.1\|WP_001287715.1\|1329239_1330526_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182273	PRK10157, PRK10157, putative oxidoreductase FixC; Provisional.	0
NZ_CP040886.1\|WP_000333120.1\|1340012_1340408_-\|carnitine-metabolism-transcriptional-regulator-CaiF	gnl\|CDD\|183154	PRK11476, PRK11476, carnitine metabolism transcriptional regulator CaiF.	2.96175e-74
NZ_CP040886.1\|WP_000610901.1\|1323098_1323476_+\|Co2+/Mg2+-efflux-protein-ApaG	gnl\|CDD\|180098	PRK05461, apaG, CO2+/MG2+ efflux protein ApaG; Reviewed.	3.63315e-76
NZ_CP040886.1\|WP_000122876.1\|1339336_1339927_+\|carnitine-operon-protein-CaiE	gnl\|CDD\|184189	PRK13627, PRK13627, carnitine operon protein CaiE; Provisional.	2.12106e-142
NZ_CP040886.1\|WP_000377129.1\|1325073_1326936_-\|glutathione-regulated-potassium-efflux-system-protein-KefC	gnl\|CDD\|235131	PRK03562, PRK03562, glutathione-regulated potassium-efflux system protein KefC; Provisional.	0
NZ_CP040886.1\|WP_000597260.1\|1343907_1345056_-\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	gnl\|CDD\|237139	PRK12564, PRK12564, carbamoyl-phosphate synthase small subunit.	0
NZ_CP040886.1\|WP_000351348.1\|1336883_1338437_+\|crotonobetaine/carnitine-CoA-ligase	gnl\|CDD\|181195	PRK08008, caiC, putative crotonobetaine/carnitine-CoA ligase; Validated.	0
NZ_CP040886.1\|WP_000004404.1\|1338545_1339331_+\|crotonobetainyl-CoA-hydratase	gnl\|CDD\|179599	PRK03580, PRK03580, crotonobetainyl-CoA hydratase.	1.76707e-178
NZ_CP040886.1\|WP_000347117.1\|1334321_1335464_+\|crotonobetainyl-CoA-dehydrogenase	gnl\|CDD\|179566	PRK03354, PRK03354, crotonobetainyl-CoA dehydrogenase; Validated.	0
NZ_CP040886.1\|WP_000600725.1\|1326928_1327459_-\|glutathione-regulated-potassium-efflux-system-oxidoreductase-KefF	gnl\|CDD\|234852	PRK00871, PRK00871, glutathione-regulated potassium-efflux system oxidoreductase KefF.	2.99389e-133
NZ_CP040886.1\|WP_001091499.1\|1330576_1331518_-\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|235120	PRK03363, fixB, electron transfer flavoprotein subunit alpha/FixB family protein.	0
NZ_CP040886.1\|WP_000787103.1\|1332776_1334291_+\|L-carnitine/gamma-butyrobetaine-antiport-BCCT-transporter	gnl\|CDD\|179568	PRK03356, PRK03356, L-carnitine/gamma-butyrobetaine antiport BCCT transporter.	0
NZ_CP040886.1\|WP_000543597.1\|1345511_1346333_-\|4-hydroxy-tetrahydrodipicolinate-reductase	gnl\|CDD\|223366	COG0289, DapB, Dihydrodipicolinate reductase [Amino acid transport and metabolism].	9.17052e-141
NZ_CP040886.1\|WP_001183198.1\|1327566_1328898_-\|MFS-transporter	gnl\|CDD\|340874	cd17316, MFS_SV2_like, Metazoan Synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters of the Major Facilitator Superfamily. This family is composed of metazoan synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters including those that transport inorganic phosphate (Pht), aromatic compounds (PcaK and related proteins), proline/betaine (ProP), alpha-ketoglutarate (KgtP), citrate (CitA), shikimate (ShiA), and cis,cis-muconate (MucK), among others. SV2 is a transporter-like protein that serves as the receptor for botulinum neurotoxin A (BoNT/A), one of seven neurotoxins produced by the bacterium Clostridium botulinum. BoNT/A blocks neurotransmitter release by cleaving synaptosome-associated protein of 25 kD (SNAP-25) within presynaptic nerve terminals. Also included in this family is synaptic vesicle 2 (SV2)-related protein (SVOP) and similar proteins. SVOP is a transporter-like nucleotide binding protein that localizes to neurotransmitter-containing vesicles. The SV2-like family belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	5.4298e-59
NZ_CP040886.1\|WP_000349926.1\|1335592_1336810_+\|L-carnitine-CoA-transferase	gnl\|CDD\|179589	PRK03525, PRK03525, L-carnitine CoA-transferase.	0
NZ_CP040886.1\|WP_000624375.1\|1324402_1324882_-\|type-3-dihydrofolate-reductase	gnl\|CDD\|182714	PRK10769, folA, type 3 dihydrofolate reductase.	1.07206e-127

>NZ_CP040886.1|WP_000692204.1|1331532_1332303_-|electron-transfer-flavoprotein-FixA
MKIITCYKCVPDEQDIAVNNADGSLDFSKADAKISQYDLNAIEAACQLKQQAAEAQVTALSVGGKALTNAKGRKDVLSRGPDELIVVIDDQFEQALPQQTASALAAAAQKAGFDLILCGDGSSDLYAQQVGLLVGEILNIPAVNGVSKIISLTADTLTVERELEDETETLSIPLPAVVAVSTDINSPQIPSMKAILGAAKKPVQVWSAADIGFNAEAAWSEQQVAAPKQRERQRIVIEGDGEEQIAAFAENLRKVI
>NZ_CP040886.1|WP_001091499.1|1330576_1331518_-|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MNTFSQVWVFSDTPSRLPELMNGAQALANQINTFVLNDADGAQAIQLGANHVWKLNGKPDDRMIEDYAGVMADTIRQHGADGLVLLPNTRRGKLLAAKLGYRLKAAVSNDASTVSVQDGKATVKHMVYGGLAIGEERIATPYAVLTISSGTFDAAQPDASRTGETHTVEWQAPAVAITRTATQARQSNSVDLDKARLVVSVGRGIGSKENIALAEQLCKAIGAELACSRPVAENEKWMEHERYVGISNLMLKPELYLAVGISGQIQHMVGANASQTIFAINKDKNAPIFQYADYGIVGDAVKILPALTAALAR
>NZ_CP040886.1|WP_001287715.1|1329239_1330526_-|FAD-dependent-oxidoreductase
MSEDIFDAIIVGAGLAGSVAALVLAREGAQVLVIERGNSAGAKNVTGGRLYAHSLEHIIPGFADSAPVERLITHEKLAFMTEKSAMTMDYCNGDETSPSQRSYSVLRSKFDAWLMEQAEEAGAQLITGIRVDNLVQRDGKVVGVEADGDVIEAKTVILADGVNSILAEKLGMAKRVKPTDVAVGVKELIELPKSVIEDRFQLQGNQGAACLFAGSPTDGLMGGGFLYTNENTLSLGLVCGLHHLHDAKKSVPQMLEDFKQHPAVAPLIAGGKLVEYSAHVVPEAGINMLPELVGDGVLIAGDAAGMCMNLGFTIRGMDLAIAAGEAAAKTVLSAMKSDDFSKQKLAEYRQHLESGPLRDMRMYQKLPAFLDNPRMFSGYPELAVGVARDLFTIDGSAPELMRKKILRHGKKVGFINLIKDGMKGVTVL
>NZ_CP040886.1|WP_000203747.1|1328955_1329243_-|ferredoxin-like-protein-FixX
MTSPVNVDVKLGVNKFNVDEEHPHIVVKADADKQVLELLVKACPAGLYKKQDDGSVRFDYAGCLECGTCRILGLGSALEQWEYPRGTFGVEFRYG
>NZ_CP040886.1|WP_001183198.1|1327566_1328898_-|MFS-transporter
MQPSRNFDDLKFSSIHRRILLWGSGGPFLDGYVLVMIGVALEQLTPALKLDADWIGLLGAGTLAGLFVGTSLFGYISDKVGRRKMFLIDIIAIGVISVATMFVSSPVELLVMRVLIGIVIGADYPIATSMITEFSSTRQRAFSISFIAAMWYVGATCADLVGYWLYDVEGGWRWMLGSAAIPCLLILIGRFELPESPRWLLRKGRVKECEEMMIKLFGEPVAFDEEQPQQTRFRDLFNRRHFPFVLFVAAIWTCQVIPMFAIYTFGPQIVGLLGLGVGKNAALGNVVISLFFMLGCIPPMLWLNTAGRRPLLIGSFAMMTLALAVLGLIPDMGIWLVVMAFAVYAFFSGGPGNLQWLYPNELFPTDIRASAVGVIMSLSRIGTIVSTWALPIFINNYGISNTMLMGAGISLFGLLISVAFAPETRGMSLAQTSNMTIRGQRMG
>NZ_CP040886.1|WP_000600725.1|1326928_1327459_-|glutathione-regulated-potassium-efflux-system-oxidoreductase-KefF
MILIIYAHPYPHHSHANKRMLEQARTLEGVEIRSLYQLYPDFNIDIAAEQEALSRADLIVWQHPMQWYSIPPLLKLWIDKVFSHGWAYGHGGTALHGKHLLWAVTTGGGESHFEIGAHPGFDVLSQPLQATAIYCGLNWLPPFAMHCTFICDDETLEGQARHYKQRLLEWQEAHHG
>NZ_CP040886.1|WP_000377129.1|1325073_1326936_-|glutathione-regulated-potassium-efflux-system-protein-KefC
MDSHTLIQALIYLGSAALIVPIAVRLGLGSVLGYLIAGCIIGPWGLRLVTDAESILHFAEIGVVLMLFIIGLELDPQRLWKLRAAVFGGGALQMVICGGLLGLFCMLLGLRWQVAELIGMTLALSSTAIAMQAMNERNLMVTQMGRSAFAVLLFQDIAAIPLVAMIPLLATSSASTTMGAFALSALKVAGALVLVVLLGRYVTRPALRFVARSGLREVFSAVALFLVFGFGLLLEEVGLSMAMGAFLAGVLLASSEYRHALESDIEPFKGLLLGLFFIGVGMSIDFGTLLENPLRIVILLLGFLIIKIAMLWLIARPLQVPNKQRRWFAVLLGQGSEFAFVVFGAAQMANVLEPEWAKSLTLAVALSMAATPILLVILNRLEQSSTEEAREADEIDEEQPRVIIAGFGRFGQITGRLLLSSGVKMVVLDHDPDHIETLRKFGMKVFYGDATRMDLLESAGAAKAEVLINAIDDPQTNLQLTEMVKEHFPHLQIIARARDVDHYIRLRQAGVEKPERETFEGALKTGRLALESLGLGPYEARERADVFRRFNIQMVEEMAMVENDTKARAAVYKRTSAMLSEIITEDREHLSLIQRHGWQGTEEGKHTGNMADEPETKPSS
>NZ_CP040886.1|WP_000624375.1|1324402_1324882_-|type-3-dihydrofolate-reductase
MISLIAALAVDRVIGMENAMPWNLPADLAWFKRNTLNKPVIMGRHTWESIGRPLPGRKNIILSSQPGTDDRVTWVKSVDEAIAACGDVPEIMVIGGGRVYEQFLPKAQKLYLTHIDAEVEGDTHFPDYEPDDWESVFSEFHDADAQNSHSYCFEILERR
>NZ_CP040886.1|WP_000257192.1|1323482_1324325_+|bis(5'-nucleosyl)-tetraphosphatase-(symmetrical)
MATYLIGDVHGCYDELIALLHKVEFTPGKDTLWLTGDLVARGPGSLDVLRYVKSLGDSVRLVLGNHDLHLLAVFAGISRNKPKDRLTPLLEAPDADELLNWLRRQPLLQIDEEKKLVMAHAGITPQWDLQTAKECARDVEAVLSSDSYPFFLDAMYGDMPNNWSPELRGLGRLRFITNAFTRMRFCFPNGQLDMYSKESPEEAPAPLKPWFAIPGPVAEEYSIAFGHWASLEGKGTPEGIYALDTGCCWGGTLTCLRWEDKQYFVQPSNRHKDLGEAAAS
>NZ_CP040886.1|WP_000610901.1|1323098_1323476_+|Co2+/Mg2+-efflux-protein-ApaG
MINSPRVCIQVQSVYIEAQSSPDNERYVFAYTVTIRNLGRAPVQLLGRYWLITNGNGRETEVQGEGVVGVQPLIAPGEEYQYTSGAIIETPLGTMQGHYEMIDENGVPFSIDIPVFRLAVPTLIH
>NZ_CP040886.1|WP_000787103.1|1332776_1334291_+|L-carnitine/gamma-butyrobetaine-antiport-BCCT-transporter
MKNEKRKTGIEPKVFFPPLIIVGILCWLTVRDLDAANVVINAVFSYVTNVWGWAFEWYMVVMLFGWFWLVFGPYAKKRLGNEPPEFSTASWIFMMFASCTSAAVLFWGSIEIYYYISTPPFGLEPNSTGAKELGLAYSLFHWGPLPWATYSFLSVAFAYFFFVRKMEVIRPSSTLVPLVGEKHAKGLFGTIVDNFYLVALIFAMGTSLGLATPLVTECMQWLFGIPHTLQLDAIIITCWIILNAICVACGLQKGVRIASDVRSYLSFLMLGWVFIVSGASFIMNYFTDSVGMLLMYLPRMLFYTDPIAKGGFPQGWTVFYWAWWVIYAIQMSIFLARISRGRTVRELCFGMVLGLTASTWILWTVLGSNTLLLIDKNIINIPNLIEQYGVARAIIETWAALPLSTATMWGFFILCFIATVTLVNACSYTLAMSTCREVRDGEEPPLLVRIGWSILVGIIGIVLLALGGLKPIQTAIIAGGCPLFFVNIMVTLSFIKDAKQNWKD
>NZ_CP040886.1|WP_000347117.1|1334321_1335464_+|crotonobetainyl-CoA-dehydrogenase
MDFNLNDEQELFVAGIRELMASENWEAYFAECDRDSVYPERFVKALADMGIDSLLIPEEHGGLDAGFVTLAAVWMELGRLGAPTYVLYQLPGGFNTFLREGTQEQIDKIMAFRGTGKQMWNSAITEPGAGSDVGSLKTTYTRRNGKIYLNGSKCFITSSAYTPYIVVMARDGASPDKPVYTEWFVDMSKPGIKVTKLEKLGLRMDSCCEITFDDVELDEKDMFGREGNGFNRVKEEFDHERFLVALTNYGTAMCAFEDAARYANQRVQFGEAIGRFQLIQEKFAHMAIKLNSMKNMLYEAAWKADNGTITSGDAAMCKYFCANAAFEVVDSAMQVLGGVGIAGNHRISRFWRDLRVDRVSGGSDEMQILTLGRAVLKQYR
>NZ_CP040886.1|WP_000349926.1|1335592_1336810_+|L-carnitine-CoA-transferase
MDHLPMPKFGPLAGLRVVFSGIEIAGPFAGQMFAEWGAEVIWIENVAWADTIRVQPNYPQLSRRNLHALSLNIFKDEGREAFLKLMETTDIFIEASKGPAFARRGITDEVLWQHNPKLVIAHLSGFGQYGTEEYTNLPAYNTIAQAFSGYLIQNGDVDQPMPAFPYTADYFSGLTATTAALAALHKARETGKGESIDIAMYEVMLRMGQYFMMDYFNGGEMCPRMSKGKDPYYAGCGLYKCADGYIVMELVGITQIEECFKDIGLAHLLSTPEIPEGTQLIHRIECPYGPLVEEKLDAWLAAHTIAEVKERFAELNIACAKVLTVPELESNPQYVARESITQWQTMDGRTCKGPNIMPKFKNNPGQIWRGMPSHGMDTAAILKNIGYSENDIQELVSKGLAKVED
>NZ_CP040886.1|WP_000351348.1|1336883_1338437_+|crotonobetaine/carnitine-CoA-ligase
MDIIGGQHLRQMWDDLADVYGHKTALICESSGGVVNRYSYLELNQEINRTANLFYTLGIRKGDKVALHLDNCPEFIFCWFGLAKIGAIMVPINARLLREESAWILQNSQACLLVTSAQFYPMYQQIQQEDATQLRHICLTDVALPADDGVSSFTQLKNQQPATLCYAPPLLTDDTAEILFTSGTTSRPKGVVITHYNLRFAGYYSAWQCALRDDDVYLTVMPAFHIDCQCTAAMAAFSAGATFVLVEKYSARAFWGQVQKYRATITECIPMMIRTLMVQPPSANDRQHRLREVMFYLNLSEQEKDAFCERFGVRLLTSYGMTETIVGIIGDRPGDKRRWPSIGRAGFCYEAEIRDDHNRPLPAGEIGEICIKGVPGKTIFKEYFLNPKATAKVLEADGWLHTGDTGYCDEEGFFYFVDRRCNMIKRGGENVSCVELENIIATHPKIQDIVVVGIKDSIRDEAIKAFVVLNEGETLSEEEFFRFCEQNMAKFKVPSYLEIRKDLPRNCSGKIIRKNLK
>NZ_CP040886.1|WP_000004404.1|1338545_1339331_+|crotonobetainyl-CoA-hydratase
MSESLHLTRNGSILEITLDRPKANAIDAKTSFEMGEVFLNFRDDPQLRVAIITGAGEKFFSAGWDLKAAAEGEAPDADFGPGGFAGLTEIFNLDKPVIAAVNGYAFGGGFELALAADFIVCADNASFALPEAKLGIVPDSGGVLRLPKILPPAIVNEMVMTGRRMGTEEALRWGIVNRVVSQAELMDNARELAQQLVNSAPLAIAALKEIYRTTSEMPVEEAYRYIRSGVLKHYPSVLHSEDAVEGPLAFAEKRDPVWKGR
>NZ_CP040886.1|WP_000122876.1|1339336_1339927_+|carnitine-operon-protein-CaiE
MSYYAFEGLIPVVHPTAFVHPSAVLIGDVIVGAGVYIGPLASLRGDYGRLIVQAGANIQDGCIMHGYCDTDTIVGENGHIGHGAILHGCVIGRDALVGMNSVIMDGAVIGEESIVAAMSFVKAGFHGEKRQLLMGTPARAVRSVSDDELHWKRLNTKEYQDLVGRCHASLHETQPLRQMEENRPRLQGTTDVTPKR
>NZ_CP040886.1|WP_000333120.1|1340012_1340408_-|carnitine-metabolism-transcriptional-regulator-CaiF
MCEGYVEKPLYLLIAEWMMAENRWVIAREISIHFDIEHSKAVNTLTYILSEVAEISCEVKMIPNKLEGRGCQCQRLVKVVDIDEQIYARLRNNSRDKLVGVRKTPRIPAVPLTELNREQKWQMMLSKSMRR
>NZ_CP040886.1|WP_001126376.1|1340668_1343890_-|carbamoyl-phosphate-synthase-large-subunit
MPKRTDIKSILILGAGPIVIGQACEFDYSGAQACKALREEGYRVILVNSNPATIMTDPEMADATYIEPIHWEVVRKIIEKERPDAVLPTMGGQTALNCALELERQGVLEEFGVTMIGATADAIDKAEDRRRFDVAMKKIGLETARSGIAHTMEEALAVAADVGFPCIIRPSFTMGGSGGGIAYNREEFEEICARGLDLSPTKELLIDESLIGWKEYEMEVVRDKNDNCIIVCSIENFDAMGIHTGDSITVAPAQTLTDKEYQIMRNASMAVLREIGVETGGSNVQFAVNPKNGRLIVIEMNPRVSRSSALASKATGFPIAKVAAKLAVGYTLDELMNDITGGRTPASFEPSIDYVVTKIPRFNFEKFAGANDRLTTQMKSVGEVMAIGRTQQESLQKALRGLEVGATGFDPKVSLDDPEALTKIRRELKDAGAERIWYIADAFRAGLSVDGVFNLTNIDRWFLVQIEELVRLEEKVAEVGITGLNAEFLRQLKRKGFADARLAKLAGVREAEIRKLRDQYDLHPVYKRVDTCAAEFATDTAYMYSTYEEECEANPSTDREKIMVLGGGPNRIGQGIEFDYCCVHASLALREDGYETIMVNCNPETVSTDYDTSDRLYFEPVTLEDVLEIVRIEKPKGVIVQYGGQTPLKLARALEAAGVPVIGTSPDAIDRAEDRERFQHAVERLKLKQPANATVTAIEMAVEKAKEIGYPLVVRPSYVLGGRAMEIVYDEADLRRYFQTAVSVSNDAPVLLDHFLDDAVEVDVDAICDGEMVLIGGIMEHIEQAGVHSGDSACSLPAYTLSQEIQDVMRQQVQKLAFELQVRGLMNVQFAVKNNEVYLIEVNPRAARTVPFVSKATGVPLAKVAARVMAGKSLAEQGVTKEVIPPYYSVKEVVLPFNKFPGVDPLLGPEMRSTGEVMGVGRTFAEAFAKAQLGSNSTMKKHGRALLSVREGDKERVVDLAAKLLKQGFELDATHGTAIVLGEAGINPRLVNKVHEGRPHIQDRIKNGEYTYIINTTSGRRAIEDSRVIRRSALQYKVHYDTTLNGGFATAMALNADATEKVISVQEMHAQIK
>NZ_CP040886.1|WP_000597260.1|1343907_1345056_-|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit
MIKSALLVLEDGTQFHGRAIGATGSAVGEVVFNTSMTGYQEILTDPSYSRQIVTLTYPHIGNVGTNDADEESSQVHAQGLVIRDLPLIASNFRNTEDLSSYLKRHNIVAIADIDTRKLTRLLREKGAQNGCIIAGDNPDAALALEKARAFPGLNGMDLAKEVTTAEAYSWTQGSWTLTGGLPEAKKEDELPFHVVAYDFGAKRNILRMLVDRGCRLTIVPAQTSAEDVLKMNPDGIFLSNGPGDPAPCDYAITAIQKFLETDIPVFGICLGHQLLALASGAKTVKMKFGHHGGNHPVKDVEKNVVMITAQNHGFAVDEATLPANLRVTHKSLFDGTLQGIHRTDKPAFSFQGHPEASPGPHDAAPLFDHFIELIEQYRKTAK
>NZ_CP040886.1|WP_000543597.1|1345511_1346333_-|4-hydroxy-tetrahydrodipicolinate-reductase
MHDANIRVAIAGAGGRMGRQLIQAALALEGVQLGAALEREGSSLLGSDAGELAGAGKTGVTVQSSLDAVKDDFDVFIDFTRPEGTLNHLAFCRQHGKGMVIGTTGFDEAGKQAIRDAAADIAIVFAANFSVGVNVMLKLLEKAAKVMGDYTDIEIIEAHHRHKVDAPSGTALAMGEAIAHALDKDLKDCAVYSREGHTGERVPGTIGFATVRAGDIVGEHTAMFADIGERLEITHKASSRMTFANGAVRSALWLSGKEGGLFDMRDVLDLNSL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_6

2926033-2926172

Orphan

Consensus_repeat	Method
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_6

>merge|NZ_CP040886|6|2926033-2926172|CRISPRCasFinder
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCAACAGCAGTCGGATGCGGCGTAAACACCTTATCTGACCTACGTTTTGTGTCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA

>NZ_CP040886|6|5|2926033-2926172|CRISPRCasFinder
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA	ACAGCAGTCGGATGCGGCGTAAACACCTTATCTGACCTACGT
TTTGTGTCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_001301318.1\|2919711_2920590_-\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|237968
NZ_CP040886.1\|WP_000646033.1\|2926185_2926761_-\|divisome-associated-lipoprotein-YraP	unknown	unknown	gnl\|CDD\|182907
NZ_CP040886.1\|WP_000249160.1\|2927733_2929770_-\|penicillin-binding-protein-activator	unknown	unknown	gnl\|CDD\|225649
NZ_CP040886.1\|WP_000421305.1\|2920598_2921594_-\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|223896
NZ_CP040886.1\|WP_024167269.1\|2931839_2934212_-\|fimbrial-biogenesis-outer-membrane-usher-protein	unknown	unknown	gnl\|CDD\|225729
NZ_CP040886.1\|WP_000534351.1\|2936117_2936909_-\|PTS-N-acetylgalactosamine-transporter-subunit-IID	unknown	unknown	gnl\|CDD\|182115
NZ_CP040886.1\|WP_000816988.1\|2930737_2931829_-\|fimbrial-protein	unknown	unknown	gnl\|CDD\|366088
NZ_CP040886.1\|WP_000908554.1\|2922320_2922824_+\|N-acetyltransferase	unknown	unknown	gnl\|CDD\|225695
NZ_CP040886.1\|WP_000037608.1\|2923586_2924105_-\|protein/nucleic-acid-deglycase	unknown	unknown	gnl\|CDD\|153228
NZ_CP040886.1\|WP_001158034.1\|2926770_2927361_-\|DnaA-initiator-associating-protein-DiaA	unknown	unknown	gnl\|CDD\|182811
NZ_CP040886.1\|WP_000449030.1\|2923163_2923607_+\|YhbP-family-protein	unknown	unknown	gnl\|CDD\|235127
NZ_CP040886.1\|WP_001323952.1\|2935361_2936117_-\|galactosamine-6-phosphate-isomerase	unknown	unknown	gnl\|CDD\|182064
NZ_CP040886.1\|WP_000189314.1\|2922810_2923113_-\|DNA-damage-response-exodeoxyribonuclease-YhbQ	unknown	unknown	gnl\|CDD\|178979
NZ_CP040886.1\|WP_000809262.1\|2929834_2930695_+\|16S-rRNA-(cytidine(1402)-2'-O)-methyltransferase	unknown	unknown	gnl\|CDD\|184956
NZ_CP040886.1\|WP_000246837.1\|2927380_2927776_-\|YraN-family-protein	unknown	unknown	gnl\|CDD\|129354
NZ_CP040886.1\|WP_001375267.1\|2921802_2922327_+\|SCP2-domain-containing-protein	unknown	unknown	gnl\|CDD\|225696
NZ_CP040886.1\|WP_000130392.1\|2918498_2919506_-\|LLM-class-flavin-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182505
NZ_CP040886.1\|WP_001295551.1\|2924232_2924868_+\|NAD(P)H-binding-protein	unknown	unknown	gnl\|CDD\|187560
NZ_CP040886.1\|WP_001375265.1\|2924940_2925981_+\|permease	unknown	unknown	gnl\|CDD\|223773
NZ_CP040886.1\|WP_000544489.1\|2936898_2937702_-\|PTS-N-acetylgalactosamine-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|236621

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_001301318.1\|2919711_2920590_-\|U32-family-peptidase	gnl\|CDD\|237968	PRK15447, PRK15447, putative protease; Provisional.	0
NZ_CP040886.1\|WP_000646033.1\|2926185_2926761_-\|divisome-associated-lipoprotein-YraP	gnl\|CDD\|182907	PRK11023, PRK11023, divisome-associated lipoprotein YraP.	1.97056e-117
NZ_CP040886.1\|WP_000249160.1\|2927733_2929770_-\|penicillin-binding-protein-activator	gnl\|CDD\|225649	COG3107, LppC, Putative lipoprotein [General function prediction only].	6.33924e-141
NZ_CP040886.1\|WP_000421305.1\|2920598_2921594_-\|U32-family-peptidase	gnl\|CDD\|223896	COG0826, COG0826, Collagenase and related proteases [Posttranslational modification, protein turnover, chaperones].	4.87234e-118
NZ_CP040886.1\|WP_024167269.1\|2931839_2934212_-\|fimbrial-biogenesis-outer-membrane-usher-protein	gnl\|CDD\|225729	COG3188, FimD, P pilus assembly protein, porin PapC [Cell motility and secretion / Intracellular trafficking and secretion].	0
NZ_CP040886.1\|WP_000534351.1\|2936117_2936909_-\|PTS-N-acetylgalactosamine-transporter-subunit-IID	gnl\|CDD\|182115	PRK09855, PRK09855, PTS N-acetylgalactosamine transporter subunit IID.	5.05026e-179
NZ_CP040886.1\|WP_000816988.1\|2930737_2931829_-\|fimbrial-protein	gnl\|CDD\|366088	pfam00419, Fimbrial, Fimbrial protein.	3.34626e-21
NZ_CP040886.1\|WP_000908554.1\|2922320_2922824_+\|N-acetyltransferase	gnl\|CDD\|225695	COG3153, COG3153, Predicted acetyltransferase [General function prediction only].	1.31299e-64
NZ_CP040886.1\|WP_000037608.1\|2923586_2924105_-\|protein/nucleic-acid-deglycase	gnl\|CDD\|153228	cd03134, GATase1_PfpI_like, A type 1 glutamine amidotransferase (GATase1)-like domain found in PfpI from Pyrococcus furiosus. A type 1 glutamine amidotransferase (GATase1)-like domain found in PfpI from Pyrococcus furiosus. This group includes proteins similar to PfpI from P. furiosus. and PH1704 from Pyrococcus horikoshii. These enzymes are ATP-independent intracellular proteases and may hydrolyze small peptides to provide a nutritional source. Only Cys of the catalytic triad typical of GATase1 domains is conserved in this group. This Cys residue is found in the sharp turn between a beta strand and an alpha helix termed the nucleophile elbow. For PH1704, it is believed that this Cys together with a different His in one monomer and Glu (from an adjacent monomer) forms a different catalytic triad from the typical GATase1domain. PfpI is homooligomeric. Protease activity is only found for oligomeric forms of PH1704.	6.06977e-86
NZ_CP040886.1\|WP_001158034.1\|2926770_2927361_-\|DnaA-initiator-associating-protein-DiaA	gnl\|CDD\|182811	PRK10886, PRK10886, DnaA initiator-associating protein DiaA; Provisional.	5.61903e-143
NZ_CP040886.1\|WP_000449030.1\|2923163_2923607_+\|YhbP-family-protein	gnl\|CDD\|235127	PRK03467, PRK03467, hypothetical protein; Provisional.	2.19601e-100
NZ_CP040886.1\|WP_001323952.1\|2935361_2936117_-\|galactosamine-6-phosphate-isomerase	gnl\|CDD\|182064	PRK09762, PRK09762, galactosamine-6-phosphate isomerase; Provisional.	1.51027e-147
NZ_CP040886.1\|WP_000189314.1\|2922810_2923113_-\|DNA-damage-response-exodeoxyribonuclease-YhbQ	gnl\|CDD\|178979	PRK00329, PRK00329, GIY-YIG nuclease superfamily protein; Validated.	3.58629e-45
NZ_CP040886.1\|WP_000809262.1\|2929834_2930695_+\|16S-rRNA-(cytidine(1402)-2'-O)-methyltransferase	gnl\|CDD\|184956	PRK14994, PRK14994, SAM-dependent 16S ribosomal RNA C1402 ribose 2'-O-methyltransferase; Provisional.	0
NZ_CP040886.1\|WP_000246837.1\|2927380_2927776_-\|YraN-family-protein	gnl\|CDD\|129354	TIGR00252, UPF0102_protein_HI_1656, TIGR00252 family protein. the scores for Mycobacterium tuberculosis and Treponema pallidum are low considering the alignment [Hypothetical proteins, Conserved].	3.92681e-63
NZ_CP040886.1\|WP_001375267.1\|2921802_2922327_+\|SCP2-domain-containing-protein	gnl\|CDD\|225696	COG3154, COG3154, Putative lipid carrier protein [Lipid metabolism].	8.79126e-85
NZ_CP040886.1\|WP_000130392.1\|2918498_2919506_-\|LLM-class-flavin-dependent-oxidoreductase	gnl\|CDD\|182505	PRK10508, PRK10508, luciferase-like monooxygenase.	0
NZ_CP040886.1\|WP_001295551.1\|2924232_2924868_+\|NAD(P)H-binding-protein	gnl\|CDD\|187560	cd05250, CC3_like_SDR_a, CC3(TIP30)-like, atypical (a) SDRs. Atypical SDRs in this subgroup include CC3 (also known as TIP30) which is implicated in tumor suppression. Atypical SDRs are distinct from classical SDRs. Members of this subgroup have a glycine rich NAD(P)-binding motif that resembles the extended SDRs, and have an active site triad of the SDRs (YXXXK and upstream Ser), although the upstream Asn of the usual SDR active site is substituted with Asp. For CC3, the Tyr of the triad is displaced compared to the usual SDRs and the protein is monomeric, both these observations suggest that the usual SDR catalytic activity is not present. NADP appears to serve an important role as a ligand, and may be important in the interaction with other macromolecules. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Atypical SDRs include biliverdin IX beta reductase (BVR-B,aka flavin reductase), NMRa (a negative transcriptional regulator of various fungi), progesterone 5-beta-reductase like proteins, phenylcoumaran benzylic ether and pinoresinol-lariciresinol reductases, phenylpropene synthases, eugenol synthase, triphenylmethane reductase, isoflavone reductases, and others. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. In addition to the Rossmann fold core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.89133e-65
NZ_CP040886.1\|WP_001375265.1\|2924940_2925981_+\|permease	gnl\|CDD\|223773	COG0701, COG0701, Predicted permeases [General function prediction only].	4.11883e-63
NZ_CP040886.1\|WP_000544489.1\|2936898_2937702_-\|PTS-N-acetylgalactosamine-transporter-subunit-IIC	gnl\|CDD\|236621	PRK09757, PRK09757, PTS N-acetylgalactosamine transporter subunit IIC.	2.85176e-176

>NZ_CP040886.1|WP_001375265.1|2924940_2925981_+|permease
MTGQSSSQAATPIQWWKPALFFLVVIAGLWYVKWEPYYGKAFTAAETHSIGKSILAQADANPWQAALDYAMIYFLAVWKAAVLGVILGSLIQVLIPRDWLLRTLGQSRFRGTLLGTLFSLPGMMCTCCAAPVAAGMRRQQVSMGGALAFWMGNPVLNPATLVFMGFVLSWGFAAIRLVAGLVMVLLIATLVQKWVRETPQTQAPVEIDIPEAQGGFFSRWGRALWTLFWSTIPVYILAVLVLGAARVWLFPHADGTVDNSLMWVVAMAVAGCLFVIPTAAEIPIVQTMMLAGMGTAPALALLMTLPAVSLPSLIMLRKAFPAKALWLTGAMVAVSGVIVGGLALLF
>NZ_CP040886.1|WP_001295551.1|2924232_2924868_+|NAD(P)H-binding-protein
MSQVLITGATGLVGGHLLRMLINEPKVNAIAAPTRRPLGDMPGVFNPHDPQLTDALAQVTDPIDIVFCCLGTTRREAGSKEAFIHADYTLVVDTALTGRRLGAQHMLVVSAMGANAHSPFFYNRVKGEMEEALIAQNWPKLTIARPSMLLGDRSKQRMNETLFAPLFRLLPGNWKSIDARDVARVMLAESMRPEHEGVTILSSSELRKRAE
>NZ_CP040886.1|WP_000037608.1|2923586_2924105_-|protein/nucleic-acid-deglycase
MSKKIAVLITDEFEDSEFTSPADEFRKAGHEVITIEKQAGKTVKGKKGEASVTIDKSIDEVTPAEFDALLLPGGHSPDYLRGDNRFVTFTRDFVNSGKPVFAICHGPQLLISADVIRGRKLTAVKPIIIDVKNAGAEFYDQEVVVDKDQLVTSRTPDDLPAFNREALRLLGA
>NZ_CP040886.1|WP_000449030.1|2923163_2923607_+|YhbP-family-protein
METLIAISRWLAKQHVVTWCVQQEGELWCANAFYLFDAQKVAFYILTEEKTRHAQMSGPQAAVAGTVNGQPKTVALIRGVQFKGEIRRLEGEESDLARKAYNRRFPVARMLSAPVWEIRLDEIKFTDNTLGFGKKMIWLRDSGTEQA
>NZ_CP040886.1|WP_000189314.1|2922810_2923113_-|DNA-damage-response-exodeoxyribonuclease-YhbQ
MTPWFLYLIRTADNKLYTGITTDVERRYQQHQSGKGAKALRGKGELTLAFSAPVGDRSLALRAEYRVKQLTKRQKERLVAEGAGFAELLSSLQTPEIKSD
>NZ_CP040886.1|WP_000908554.1|2922320_2922824_+|N-acetyltransferase
MLIRVEIPIDAPGIDALLRRSFESDAEAKLVHDLREDGFLTLGLVATDDEGQVIGYVAFSPVDVQGEDLQWVGMAPLAVDEKYRGQGLARQLVYEGLDSLNEFGYAAVVTLGDPALYSRFGFELAAHHDLRCRWPGTESAFQVHRLADDALNGVTGLVEYHEHFNRF
>NZ_CP040886.1|WP_001375267.1|2921802_2922327_+|SCP2-domain-containing-protein
MLDKLRSRIVHLGPSLLSVPVKLTPFALKRQVLEQVLSWQFRQALDDGELEFLEGRWLSIHVRDIDLQWFTSVVNGKLVVSQNAQADVSFSADASDLLMIAARKQDPDTLFFQRRLVIEGDTELGLYVKNLMDAIELEQMPKALRMMLLQLADFVEAGMKNAPETKQTSVGEPC
>NZ_CP040886.1|WP_000421305.1|2920598_2921594_-|U32-family-peptidase
MELLCPAGNLPALKAAIENGADAVYIGLKDDTNARHFAGLNFTEKKLQEAVSFVHQHRRKLHIAINTFAHPDGYARWQRAVDMAAQLGADALILADLAMLEYAAERYPHIERHVSVQASATNEEAINFYHRHFDVARVVLPRVLSIHQVKQLARVTPVPLEVFAFGSLCIMSEGRCYLSSYLTGESPNTVGACSPARFVRWQQTPQGLESRLNEVLIDRYQDGENAGYPTLCKGRYLVDGERYHALEEPTSLNTLELLPELMAANIASVKIEGRQRSPAYVSQVAKVWRQAIDRCKADPQNFVPQSAWMETLGSMSEGTQTTLGAYHRKWQ
>NZ_CP040886.1|WP_001301318.1|2919711_2920590_-|U32-family-peptidase
MKYSLGPVLWYWPKETLEEFYQQAATSSADVIYLGEAVCSKRRATKVGDWLEMAKSLAGSGKQIVLSTLALVQASSELGELKRYVENGEFLIEASDLGVVNMCAERKLPFVAGHALNCYNAVTLKILLKQGMMRWCMPVELSRDWLVNLLNQCDELGIRNQFEVEVLSYGHLPLAYSARCFTARSEDRPKDECETCCIKYPNGRNVLSQENQQVFVLNGIQTMSGYVYNLGNELASMQGLVDVVRLSPQGTDTFAMLDAFRANENGAAPLPLTANSDCNGYWRRLAGLELQA
>NZ_CP040886.1|WP_000130392.1|2918498_2919506_-|LLM-class-flavin-dependent-oxidoreductase
MTDKTIAFSLLDLAPIPEGSSAREAFSHSLDLARLAEKRGYHRYWLAEHHNMTGIASAATSVLIGYLAANTTTLHLGSGGVMLPNHSPLVIAEQFGTLNTLYPGRIDLGLGRAPGSDQRTMMALRRHMSGDIDNFPRDVAELVDWFDARDPNPNVRPVPGYGEKIPVWLLGSSLYSAQLAAQLGLPFAFASHFAPDMLFQALHLYRSNFKPSARLEKPYAMVCINIIAADSNRDAEFLFTSMQQAFVKLRRGETGQLPPPIQNMDQFWSPSEQYGVQQALSMSLVGDKAKVRHGLQSILRETDADEIMVNGQIFDHQARLHSFELAMDVKEELLG
>NZ_CP040886.1|WP_000646033.1|2926185_2926761_-|divisome-associated-lipoprotein-YraP
MKALSPIAVLISALLLQGCVAAAVVGTAAVGTKAATDPRSVGTQVDDGTLEVRVNSALSKDEQIKKEARINVTAYQGKVLLVGQSPNAELSARAKQIAMGVDGANEVYNEIRQGQPIGLGEASNDTWITTKVRSQLLTSDLVKSSNVKVTTENGEVFLMGLVTEREAKAAADIASRVSGVKRVTTAFTFIK
>NZ_CP040886.1|WP_001158034.1|2926770_2927361_-|DnaA-initiator-associating-protein-DiaA
MQERIKACFTESIQTQIAAAEALPDAISRAAMTLVQSLLNGNKILCCGNGTSAANAQHFAASMINRFETERPSLPAIALNTDNVVLTAIANDRLHDEVYAKQVRALGHAGDVLLAISTRGNSRDIVKAVEAAVTRDMTIVALTGYDGGELAGLLGPQDVEIRIPSHRSARIQEMHMLTVNCLCDLIDNTLFPHQDD
>NZ_CP040886.1|WP_000246837.1|2927380_2927776_-|YraN-family-protein
MATVPTRSGSPRQLTTKQTGDAWEAQARRWLEGKGLRFIAANVNERGGEIDLIMREGRTTVFVEVRYRRSALYGGAAASVTRSKQHKLLQTARLWLARHNGSFDTVDCRFDVVAFTGNEVEWIKDAFNDHS
>NZ_CP040886.1|WP_000249160.1|2927733_2929770_-|penicillin-binding-protein-activator
MVPSTFSRLKAARCLPVVLAALIFAGCGTHTPDQSTAYMQGTAQADSAFYLQQMQQSSDDTRINWQLLAIRALVKEGKTGQAVELFNQLPQELNDSQRREKTLLAVEIKLAQKDFAGAQNLLAKITPADLEQNQQARYWQAKIDASQGRPSIDLLRALIAQEPLLGAKEKQQNIDATWQALSSMTQEQANTLVINADENILQGWLDLQRVWFDNRNDPDMMKAGIADWQKRYPNNPGAKMLPTQLVNVKAFKPASTNKIALLLPLNGQAAVFGRTIQQGFEAAKNIGTQPVAAQVAAAPAADVAEQPQPQTVDGVASPAQASVSDLTGEQPAAQPVPVSAPATSTAAVSAPANPSAELKIYDTSSQPLSQILSQVQQDGASIVVGPLLKNNVEELLKSNTPLNVLALNQPENIENRVNICYFALSPEDEARDAARHIRDQGKQAPLVLIPRSSLGDRVANAFAQEWQKLGGGTVLQQKFGSTSELRAGVNGGSGIALTGSPITPRATTDSGMTTNNPTLQTTPTDDQFTNNGGRVDAVYIVATPGEIAFIKPMIAMRNGSQSGATLYASSRSAQGTAGPDFRLEMEGLQYSEIPMLAGGNLPLMQQALSAVNNDYSLARMYAMGVDAWSLANHFSQMRQVQGFEINGNTGSLTANPDCVINRKLSWLQYQQGQVVPAS
>NZ_CP040886.1|WP_000809262.1|2929834_2930695_+|16S-rRNA-(cytidine(1402)-2'-O)-methyltransferase
MKQHQSADNSQGQLYIVPTPIGNLADITQRALEVLQAVDLIAAEDTRHTGLLLQHFGINARLFALHDHNEQQKAETLLAKLQEGQNIALVSDAGTPLINDPGYHLVRTCREAGIRVVPLPGPCAAITALSAAGLPSDRFCYEGFLPAKSKGRRDALKAIEAEPRTLIFYESTHRLLDSLEDIVAVLGESRYVVLARELTKTWETIHGAPVGELLAWVKEDENRRKGEMVLIVEGHKAQEEDLPADALRTLALLQAELPLKKAAALAAEIHGVKKNALYKYALEQQG
>NZ_CP040886.1|WP_000816988.1|2930737_2931829_-|fimbrial-protein
MKRAPLITGLLLISTSCAYASSGGCGADSTSGATNYSSVVDDVTVNQTDNVTGREFTSATLSSTNWQYACSCSAGKAVKLVYMVSPVLTTTGHQAGYYKLNDSLDIKTTLKANDIPGLVTDQTVSVNTRFTQIKSNTVYSAATQTGVCQGDTSRYGPVNIGANTTFTLYVTKPFLGSMTIPKTDIAVIKGAWVDGMGSPSTGDFHDLVKLSIQGNLTAPQSCKINQGDVIKVNFGFINGQKFTTRNAMPDGFTPVDFDITYDCGDTSKIKNSLQMRIDGTTGVVDQYNLVARRRSSDNAPDVGIRIENLGGGVANIPFQNGILPVDPSGHGTVNMRAWPVNLVGGELETGKFQGTATITVIVR
>NZ_CP040886.1|WP_024167269.1|2931839_2934212_-|fimbrial-biogenesis-outer-membrane-usher-protein
MLETTKSGMQTTDLSRFSKKYAQLPGTYQVDIWLNKKKVSQKKITFTANAEQLLQPQFTVEQLRELGIKVDEIPALAEKDDDSVINSLEQIIPGTAAEFDFNHQRLNLSIPQIALYRDARGYVSPSRWDDGIPTLFTNYSFTGSDNRYRQGNRSQRQYLNMQNGANFGPWRLRNYSTWTRNDQTSSWNTISSYLQRDIKALKSQLLLGESATSGSIFSSYTFTGVQLASDDNMLPNSQRGFAPTVRGIANSSAIVTIRQNGYVIYQSNVPAGAFEINDLYPSSNSGDLEVTIEESDGTQRRFIQPYSSLPMMQRPGHLKYSATAGRYRADANSDSKEPEFAEATAIYGLNNTFTLYSGLLGSEDYYALGIGIGGTLGALGALSMDINRADTQFDNQHSFHGYQWRTQYIKDIPETNTNIAVSYYRYTNDGYFSFDEANTRNWDYNSRQKSEIQFNISQTIFDGVSLYASGSQQDYWGNNEKNRNISVGVSGQQWGIGYSLNYQYSRYTDQNNDRALSLNLSIPLERWLPRSRVSYQMTSQKDRPTQHEMRLDGSLLDDGRLSYSLEQSLDDDNNHNSSVNASYRSPYGTFSAGYSYGNDSSQYNYGVTGGVVIHPHGVTLSQYLGNAFALIDANGASGVRIQNYPGIATDPFGYAVVPYLTTYQENRLSVDTTQLPDNVDLEQTTQFVVPNRGAMVAARFNANIGYRVLVTVSDRNGKPLPFGALASNDETGQQSIVDEGGILYLSGISSKSQSWTVRWGNQADQQCQFAFSTPDSEPTTSVLQGTAQCH
>NZ_CP040886.1|WP_001323952.1|2935361_2936117_-|galactosamine-6-phosphate-isomerase
MERGTASGGASLLKEFHPVQTLQQVENYTALSERASEYLLAVIRSKPDAVICLATGATPLLTYHYLVEKIHQQQVDVSQLTFVKLDEWVDLPLTMPGTCETFLQQHIVQPLGLREDQLISFRSEEINETECERVTNLIARKGGLDLCVLGLGKNGHLGLNEPGESLQPACHISQLDARTQQHEMLKTAGRPVTRGITLGLKDILNAREVLLLVTGEGKQDATERFLTAKVSTAIPASFLWLHSNFICLINT
>NZ_CP040886.1|WP_000534351.1|2936117_2936909_-|PTS-N-acetylgalactosamine-transporter-subunit-IID
MGSEISKKDITRLGFRSSLLQASFNYERMQAGGFTWAMLPILKKIYKDDKPGLSAAMKDNLEFINTHPNLVGFLMGLLISMEEKGENRDTIKGLKVALFGPIAGIGDAIFWFTLLPIMAGICSSFASQGNLLGPILFFAVYLLIFFLRVGWTHVGYSVGVKAIDKVRENSQMIARSATILGITVIGGLIASYVHINVVTSFAIDSTHSVALQQDFFDKVFPNILPMAYTLLMYYFLRVKKAHPVLLIGVTFVLSIVCSAFGIL
>NZ_CP040886.1|WP_000544489.1|2936898_2937702_-|PTS-N-acetylgalactosamine-transporter-subunit-IIC
MHEITLLQGLSLAALVFVLGIDFWLEALFLFRPIIVCTLTGAILGDIQTGLITGGLTELAFAGLTPAGGVQPPNPIMAGLMTTVIAWSTGVDAKTAIGLGLPFSLLMQYVILFFYSAFSLFMTKADKCAKEADTAAFSRLNWTTMLIVASAYAVIAFLCTYLAQGAMQALVKAMPAWLTHGFEVAGGILPAVGFGLLLRVMFKAQYIPYLIAGFLFVCYIQVSNLLPVAVLGAGFAVYEFFNAKSRQQAQPQPVASKNEEEDYSNGI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_7

2969372-2969489

Orphan

Consensus_repeat	Method
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_7

>merge|NZ_CP040886|7|2969372-2969489|CRISPRCasFinder
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGGGTGCTCAACTTGTTGATGTTGTTGTGTTTTGTACCTGATGCCGGATGCGATGCTGGCGCATCTTATCCGGCCTACGGG

>NZ_CP040886|7|6|2969372-2969489|CRISPRCasFinder
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGG	GTGCTCAACTTGTTGATGTTGTTGTGTTTTGTACCTGA
TGCCGGATGCGATGCTGGCGCATCTTATCCGGCCTACGGG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_001295544.1\|2969562_2969727_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_000104211.1\|2957626_2958565_+\|transcriptional-regulator-TdcA	unknown	unknown	gnl\|CDD\|182391
NZ_CP040886.1\|WP_001198780.1\|2971502_2971859_-\|DUF805-domain-containing-protein	unknown	unknown	gnl\|CDD\|225694
NZ_CP040886.1\|WP_000096086.1\|2974392_2974692_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|372871
NZ_CP040886.1\|WP_000603618.1\|2973814_2974297_-\|DoxX-family-protein	unknown	unknown	gnl\|CDD\|225168
NZ_CP040886.1\|WP_000107720.1\|2959674_2961006_+\|threonine/serine-transporter-TdcC	unknown	unknown	gnl\|CDD\|184191
NZ_CP040886.1\|WP_001375219.1\|2964581_2964971_+\|enamine/imine-deaminase	unknown	unknown	gnl\|CDD\|105214
NZ_CP040886.1\|WP_000031415.1\|2975088_2975394_-\|DUF883-domain-containing-protein	unknown	unknown	gnl\|CDD\|226941
NZ_CP040886.1\|WP_000460519.1\|2968040_2969351_+\|serine-dehydratase-subunit-alpha-family-protein	unknown	unknown	gnl\|CDD\|226206
NZ_CP040886.1\|WP_000785722.1\|2974681_2975086_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227681
NZ_CP040886.1\|WP_000622115.1\|2965042_2966407_+\|L-serine-ammonia-lyase	unknown	unknown	gnl\|CDD\|185000
NZ_CP040886.1\|WP_000633577.1\|2969749_2970451_-\|pirin-family-protein	unknown	unknown	gnl\|CDD\|224655
NZ_CP040886.1\|WP_000531204.1\|2972758_2973745_-\|glutathione-S-transferase-family-protein	unknown	unknown	gnl\|CDD\|223512
NZ_CP040886.1\|WP_000861734.1\|2962273_2964568_+\|2-ketobutyrate-formate-lyase/pyruvate-formate-lyase	unknown	unknown	gnl\|CDD\|153087
NZ_CP040886.1\|WP_001041010.1\|2970555_2971452_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176122
NZ_CP040886.1\|WP_001297162.1\|2961031_2962240_+\|propionate-kinase	unknown	unknown	gnl\|CDD\|183484
NZ_CP040886.1\|WP_000384145.1\|2972100_2972466_-\|DUF805-domain-containing-protein	unknown	unknown	gnl\|CDD\|225694
NZ_CP040886.1\|WP_000548347.1\|2958663_2959653_+\|bifunctional-threonine-ammonia-lyase/L-serine-ammonia-lyase-TdcB	unknown	unknown	gnl\|CDD\|236317
NZ_CP040886.1\|WP_000145820.1\|2957093_2957438_-\|DNA-binding-transcriptional-activator-TdcR	unknown	unknown	gnl\|CDD\|236909
NZ_CP040886.1\|WP_000401598.1\|2966681_2968013_+\|HAAAP-family-serine/threonine-permease	unknown	unknown	gnl\|CDD\|273283

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_000785722.1\|2974681_2975086_-\|hypothetical-protein	gnl\|CDD\|227681	COG5393, COG5393, Predicted membrane protein [Function unknown].	2.73939e-60
NZ_CP040886.1\|WP_000104211.1\|2957626_2958565_+\|transcriptional-regulator-TdcA	gnl\|CDD\|182391	PRK10341, PRK10341, transcriptional regulator TdcA.	0
NZ_CP040886.1\|WP_001198780.1\|2971502_2971859_-\|DUF805-domain-containing-protein	gnl\|CDD\|225694	COG3152, COG3152, Predicted membrane protein [Function unknown].	1.64644e-35
NZ_CP040886.1\|WP_000096086.1\|2974392_2974692_-\|hypothetical-protein	gnl\|CDD\|372871	pfam13997, YqjK, YqjK-like protein. The YqjK-like protein family includes the E. coli YqjK protein, which is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are approximately 100 amino acids in length. There is a single completely conserved residue R that may be functionally important.	6.11451e-20
NZ_CP040886.1\|WP_000603618.1\|2973814_2974297_-\|DoxX-family-protein	gnl\|CDD\|225168	COG2259, COG2259, Predicted membrane protein [Function unknown].	1.8476e-29
NZ_CP040886.1\|WP_000107720.1\|2959674_2961006_+\|threonine/serine-transporter-TdcC	gnl\|CDD\|184191	PRK13629, PRK13629, threonine/serine transporter TdcC; Provisional.	0
NZ_CP040886.1\|WP_001375219.1\|2964581_2964971_+\|enamine/imine-deaminase	gnl\|CDD\|105214	PRK11401, PRK11401, enamine/imine deaminase.	1.34001e-81
NZ_CP040886.1\|WP_000031415.1\|2975088_2975394_-\|DUF883-domain-containing-protein	gnl\|CDD\|226941	COG4575, ElaB, Uncharacterized conserved protein [Function unknown].	1.46625e-41
NZ_CP040886.1\|WP_000460519.1\|2968040_2969351_+\|serine-dehydratase-subunit-alpha-family-protein	gnl\|CDD\|226206	COG3681, COG3681, L-cysteine desulfidase [Amino acid transport and metabolism].	0
NZ_CP040886.1\|WP_000622115.1\|2965042_2966407_+\|L-serine-ammonia-lyase	gnl\|CDD\|185000	PRK15040, PRK15040, L-serine ammonia-lyase.	0
NZ_CP040886.1\|WP_000633577.1\|2969749_2970451_-\|pirin-family-protein	gnl\|CDD\|224655	COG1741, COG1741, Pirin-related protein [General function prediction only].	1.02982e-67
NZ_CP040886.1\|WP_000531204.1\|2972758_2973745_-\|glutathione-S-transferase-family-protein	gnl\|CDD\|223512	COG0435, ECM4, Predicted glutathione S-transferase [Posttranslational modification, protein turnover, chaperones].	0
NZ_CP040886.1\|WP_000861734.1\|2962273_2964568_+\|2-ketobutyrate-formate-lyase/pyruvate-formate-lyase	gnl\|CDD\|153087	cd01678, PFL1, Pyruvate formate lyase 1. Pyruvate formate lyase catalyzes a key step in anaerobic glycolysis, the conversion of pyruvate and CoenzymeA to formate and acetylCoA. The PFL mechanism involves an unusual radical cleavage of pyruvate in which two cysteines and one glycine form radicals that are required for catalysis. PFL has a ten-stranded alpha/beta barrel domain that is structurally similar to those of all three ribonucleotide reductase (RNR) classes as well as benzylsuccinate synthase and B12-independent glycerol dehydratase.	0
NZ_CP040886.1\|WP_001041010.1\|2970555_2971452_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176122	cd08431, PBP2_HupR, The C-terminal substrate binding domain of LysR-type transcriptional regulator, HupR, which regulates expression of the heme uptake receptor HupA; contains the type 2 periplasmic binding fold. HupR, a member of the LysR family, activates hupA transcription under low-iron conditions in the presence of hemin. The expression of many iron-uptake genes, such as hupA, is regulated at the transcriptional level by iron and an iron-binding repressor protein called Fur (ferric uptake regulation). Under iron-abundant conditions with heme, the active Fur repressor protein represses transcription of the iron-uptake gene hupA, and prevents transcriptional activation via HupR. Under low-iron conditions with heme, the Fur repressor is inactive and transcription of the hupA is allowed. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	2.2986e-51
NZ_CP040886.1\|WP_001297162.1\|2961031_2962240_+\|propionate-kinase	gnl\|CDD\|183484	PRK12379, PRK12379, propionate kinase.	0
NZ_CP040886.1\|WP_000384145.1\|2972100_2972466_-\|DUF805-domain-containing-protein	gnl\|CDD\|225694	COG3152, COG3152, Predicted membrane protein [Function unknown].	3.68376e-42
NZ_CP040886.1\|WP_000548347.1\|2958663_2959653_+\|bifunctional-threonine-ammonia-lyase/L-serine-ammonia-lyase-TdcB	gnl\|CDD\|236317	PRK08638, PRK08638, bifunctional threonine ammonia-lyase/L-serine ammonia-lyase TdcB.	0
NZ_CP040886.1\|WP_000145820.1\|2957093_2957438_-\|DNA-binding-transcriptional-activator-TdcR	gnl\|CDD\|236909	PRK11424, PRK11424, DNA-binding transcriptional activator TdcR; Provisional.	3.36123e-66
NZ_CP040886.1\|WP_000401598.1\|2966681_2968013_+\|HAAAP-family-serine/threonine-permease	gnl\|CDD\|273283	TIGR00814, membrane_transport_protein_YhjV, serine transporter. The Hydroxy/Aromatic Amino Acid Permease (HAAAP) Family- serine/threonine subfamily (TC 2.A.42.2) The HAAAP family includes well characterized aromatic amino acid:H+ symport permeases and hydroxy amino acid permeases. This subfamily is specific for hydroxy amino acid transporters and includes the serine permease, SdaC, of E. coli, and the threonine permease, TdcC, of E. coli.//added GO terms, none avaialbelf or ser/thr specifically [SS 2/6/05] [Transport and binding proteins, Amino acids, peptides and amines].	2.53913e-167

>NZ_CP040886.1|WP_000460519.1|2968040_2969351_+|serine-dehydratase-subunit-alpha-family-protein
MFDSTLNPLWQRYILAVQEEVKPALGCTEPISLALAAAVAAAELEGPVERVEAWVSPNLMKNGLGVTVPGTGMVGLPIAAALGALGGNANAGLEVLKDATAQAIADAKALLAAGKVSVKIQEPCNEILFSRAKVWNGEKWACVTIVGGHTNIVHIETHNGVVFTQQACVAEGEQESPLTVLSRTTLAEILKFVNEVPFAAIRFILDSAKLNCALSQEGLSGKWGLHIGATLEKQCERGLLAKDLSSSIVIRTSAASDARMGGATLPAMSNSGSGNQGITATMPVVVVAEHFGADDERLARALMLSHLSAIYIHNQLPRLSALCAATTAAMGAAAGMAWLVDGRYETISMAISSMIGDVSGMICDGASNSCAMKVSTSASAAWKAVLMALDDTAVTGNEGIVAHDVEQSIANLCALASHSMQQTDRQIIEIMASKAR
>NZ_CP040886.1|WP_000401598.1|2966681_2968013_+|HAAAP-family-serine/threonine-permease
MEIASNKGVIADASTPAGRAGMSESEWREAIKFDSTDTGWVIMSIGMAIGAGIVFLPVQVGLMGLWVFLLSSVIGYPAMYLFQRLFINTLAESPECKDYPSVISGYLGKNWGILLGALYFVMLVIWMFVYSTAITNDSASYLHTFGVTEGLLSDSPFYGLVLICILVAISSRGEKLLFKISTGMVLTKLLVVAALGVSMVGMWHLYNVGSLPPLGLLVKNAIITLPFTLTSILFIQTLSPMVISYRSREKSIEVARHKALRAMNIAFGILFVTVFFYAVSFTLAMGHDEAVKAYEQNISALAIAAQFISGDGAAWVKVVSVILNIFAVMTAFFGVYLGFREATQGIVMNILRRKMPAEKINENLVQRGIMIFAILLAWSAIVLNAPVLSFTSICSPIFGMVGCLIPAWLVYKVPALHKYKGMSLYLIIVTGLLLCVSPFLAFS
>NZ_CP040886.1|WP_000622115.1|2965042_2966407_+|L-serine-ammonia-lyase
MISAFDIFKIGIGPSSSHTVGPMNAGKSFIDRLESSGLLTATSHIVVDLYGSLSLTGKGHATDVAIIMGLAGNSPQDVVIDEIPAFIELVTRSGRLPVASGAHIVDFPVAKNIIFHPEMLPRHENGMRITAWKGQEALLSKTYYSVGGGFIVEEEHFGLSHDVETSVPYDFHSAGELLKMCDYNGLSISGLMMHNELALRSKAEIDAGFARIWQVMHDGIERGMNTEGVLPGPLNVPRRAVALRRQLVSSDNISNDPMNVIDWINMYALAVSEENAAGGRVVTAPTNGACGIIPAVLAYYDKFRRPVNERSIARYFLAAGAIGALYKMNASISGAEVGCQGEIGVACSMAAAGLTELLGGSPAQVCNAAEIAMEHNLGLTCDPVAGQVQIPCIERNAINAVKAVNAARMAMRRTSAPRVSLDKVIETMYETGKDMNDKYRETSRGGLAIKVVCG
>NZ_CP040886.1|WP_001375219.1|2964581_2964971_+|enamine/imine-deaminase
MKKIIETQRAPGAIGPYVQGVDLGSMVFTSGQIPVCPQTGEIPADVQDQARLSLENVKAIVVAAGLSVGDIIKMTVFITDLNDFATINEVYKQFFDEHQATYPTRSYVQVARLPKDVKLEIEAIAVRSA
>NZ_CP040886.1|WP_000861734.1|2962273_2964568_+|2-ketobutyrate-formate-lyase/pyruvate-formate-lyase
MKVDIDTSDKLYADAWLGFKGTDWKNEINVRDFIQHNYTPYEGDESFLAEATPATTELWEKVMEGIRIENATHAPVDFDTNIATTITAHDAGYINQPLEKIVGLQTDAPLKRALHPFGGINMIKSSFHAYGREMDSEFEYLFTDLRKTHNQGVFDVYSPDMLRCRKSGVLTGLPDGYGRGRIIGDYRRVALYGISYLVRERELQFADLQSRLEKGEDLEATIRLREELAEHRHALLQIQEMAAKYGFDISRPAQNAQEAVQWLYFAYLAAVKSQNGGAMSLGRTASFLDIYIERDFKAGVLNEQQAQELIDHFIMKIRMVRFLRTPEFDSLFSGDPIWATEVIGGMGLDGRTLVTKNSFRYLHTLHTMGPAPEPNLTILWSEELPIAFKKYAAQVSIVTSSLQYENDDLMRTDFNSDDYAIACCVSPMVIGKQMQFFGARANLAKTLLYAINGGVDEKLKIQVGPKTAPLMDDVLDYDKVMDSLDHFMDWLAVQYISALNIIHYMHDKYSYEASLMALHDRDVYRTMACGIAGLSVATDSLSAIKYARVKPIRDENGLAVDFEIDGEYPQYGNNDERVDSIACDLVERFMKKIKALPTYRNAVPTQSILTITSNVVYGQKTGNTPDGRRAGTPFAPGANPMHGRDRKGAVASLTSVAKLPFTYAKDGISYTFSIVPAALGKEDPVRKTNLVGLLDGYFHHEADVEGGQHLNVNVMNREMLLDAIEHPEKYPNLTIRVSGYAVRFNALTREQQQDVISRTFTQAL
>NZ_CP040886.1|WP_001297162.1|2961031_2962240_+|propionate-kinase
MNEFPVVLVINCGSSSIKFSVLDASDCEVLMSGIADGINSENAFLSVNGGEPAPLAHHSYEGALKAIAFELEKRNLNDSVALIGHRIAHGGSIFTESAIITDEVIDNIRRVSPLAPLHNYANLSGIESAQQLFPGVTQVAVFDTSFHQTMAPEAYLYGLPWKYYEELGVRRYGFHGTSHRYVSQRAHSLLNLAEDDSGLVVAHLGNGASICAVRNGQSVDTSMGMTPLEGLMMGTRSGDVDFGAMSWVASQTNQSLGDLERVVNKESGLLGISGLSSDLRVLEKAWHEGHERAQLAIKTFVHRIARHIAGHAASLRRLDGIIFTGGIGENSSLIRRLVMEHLAVLGVEIDTEMNNRSNSCGERIVSSENARVICAVIPTNEEKMIALDAIHLGKVNAPAEFA
>NZ_CP040886.1|WP_000107720.1|2959674_2961006_+|threonine/serine-transporter-TdcC
MSTSDSIVSSQTKQSSWRKSDTTWTLGLFGTAIGAGVLFFPIRAGFGGLIPILLMLVLAYPIAFYCHRALARLCLSGSNPSGNITETVEEHFGKTGGVVITFLYFFAICPLLWIYGVTITNTFMTFWENQLGFAPLNRGFVALFLLLLMAFVIWFGKDLMVKVMSYLVWPFIASLVLISLSLIPYWNSAVIDQVDLGSLSLTGHDGILITVWLGISIMVFSFNFSPIVSSFVVSKREEYEKDFGRDFTERKCSQIISRASMLMVAVVMFFAFSCLFTLSPANMAEAKAQNIPVLSYLANHFASMTGTKTTFAITLEYAASIIALVAIFKSFFGHYLGTLEGLNGLILKFGYKGDKTKVSLGKLNTISMIFIMGSTWVVAYANPNILDLIEAMGAPIIASLLCLLPMYAIRKAPSLAKYRGRLDNVFVTVIGLLTILNIVYKLF
>NZ_CP040886.1|WP_000548347.1|2958663_2959653_+|bifunctional-threonine-ammonia-lyase/L-serine-ammonia-lyase-TdcB
MHITYDLPVAIDDIIEAKQRLAGRIYKTGMPRSNYFSERCKGEIFLKFENMQRTGSFKIRGAFNKLSSLTDAEKRKGVVACSAGNHAQGVSLSCAMLGIDGKVVMPKGAPKSKVAATCDYSAEVVLHGDNFNDTIAKVSEIVEMEGRIFIPPYDDPKVIAGQGTIGLEIMEDLYDVDNVIVPIGGGGLIAGIAVAIKSINPTIRVIGVQSENVHGMAASFHSGEITTHRTTGTLADGCDVSRPGNLTYEIVRELVDDIVLVSEDEIRNSMIALIQRNKVVTEGAGALACAALLSGKLDQYIQNRKTVSIISGGNIDLSRVSQITGFVDA
>NZ_CP040886.1|WP_000104211.1|2957626_2958565_+|transcriptional-regulator-TdcA
MSTILLPKTQHLVVFQEVIRSGSIGSAAKELGLTQPAVSKIINDIEDYFGVELVVRKNTGVTLTPAGQLLLSRSESITREMKNMVNEISGMSSEAVVEVSFGFPSLIGFTFMSGMINKFKEVFPKAQVSMYEAQLSSFLPAIRDGRLDFAIGTLSAEMKLQDLHVEPLFESEFVLVASKSRTCTGTTTLESLKNEQWVLPQTNMGYYSELLTTLQRNGISIENIVKTDSVVTIYNLVLNADFLTVIPCDMTSPFGSNQFITIPVEETLPVAQYAAVWSKNYRIKKAASVLVELAKEYSSYNGCRRRQLIEVG
>NZ_CP040886.1|WP_000145820.1|2957093_2957438_-|DNA-binding-transcriptional-activator-TdcR
MTGITIFYGDNIIRYVVNIKKGLRPYFKQLPDNYQAKFELNLMSKFSNFIINKPFSAINTAARHIFSRYLLENKHLFYQYFKISNTGIDHLEQLINVNFFSSDRTSFCECNRFP
>NZ_CP040886.1|WP_001295544.1|2969562_2969727_-|hypothetical-protein
MSKKSAKKRQPVKPVVAKEPARTAKNFGYEEMLSELEAIVADAETRLAEDEATA
>NZ_CP040886.1|WP_000633577.1|2969749_2970451_-|pirin-family-protein
MITTRTARQCGQADYGWLQARYTFSFGHYFDPKLLGYASLRVLNQEVLAPGAAFQPRTYPKVDILNVILDGEAEYRDSEGNHVQASAGEALLLSTQPGVSYSEHNLSKDKPLTRMQLWLDACPQRENPLIQKLALNMGKQQLIASPEGTMGSLQLRQQVWLHHIVLDKGESANFQLHGPRAYLQSIHGKFHALTHHEEKAALTCGDGAFIRDEANITLVADSPLRALLIDLPV
>NZ_CP040886.1|WP_001041010.1|2970555_2971452_+|LysR-family-transcriptional-regulator
MAKERALTLEALRVMDAIDRRGSFAAAADELGRVPSALSYTMQKLEEELDVVLFDRSGHRTKFTNVGRMLLERGRVLLEAADKLTTDAEALARGWETHLTIVTEALVPTPAFFPLIDKLAAKANTQLAIITEVLAGAWERLEQGRADIVIAPDMHFRSSSEINSRKLYTLMNVYVAAPDHPIHQEPEPLSEVTRVKYRGIAVADTARERPVLTVQLLDKQPRLTVSTIEDKRQALLAGLGVATMPYPMVEKDIAEGRLRVVSPESTSEIDIIMAWRRDSMGEAKSWCLREIPKLFSGK
>NZ_CP040886.1|WP_001198780.1|2971502_2971859_-|DUF805-domain-containing-protein
MQWYLAVLKNYVGFSGRARRKEYWMFTLINAIVGAIINVIQLILGLEFPFLSLIYLAATIIPVIALCVRRLHDTDRSGAWALLYLVPIIGWLVLFVFACLEGNSGSNRYGNDPKFGSN
>NZ_CP040886.1|WP_000384145.1|2972100_2972466_-|DUF805-domain-containing-protein
MDWYLKVLKNYVGFRGRARRKEYWMFILVNIIFTFVLGLLDKMLGWQRAGGEGILTTIYGILVFLPWWAVQFRRLHDTDRSAWWALLFLIPFIGWLIIIVFNCQAGTPGENRFGPDPKLEP
>NZ_CP040886.1|WP_000531204.1|2972758_2973745_-|glutathione-S-transferase-family-protein
MGQLIDGVWHDTWYDTKSTGGKFQRSASAFRNWLTADGAPGPTGTGGFIAEKDRYHLYVSLACPWAHRTLIMRKLKGLEPFISVSVVNPLMLENGWTFDDSFPGATGDTLYQHEFLYQLYLHADPHYSGRVTVPVLWDKKNHTIVSNESAEIIRMFNTAFDALGAKAGDYYPPALQTKIDELNGWIYDTVNNGVYKAGFATSQQAYDEAVAKVFESLARLEQILGQHRYLTGNQLTEADIRLWTTLVRFDPVYVTHFKCDKHRISNYLNLYGFLRDIYQMPGIAETVNFDHIRNHYFRSHKTINPTGIISIGPWQDLDEPHGRDVRFG
>NZ_CP040886.1|WP_000603618.1|2973814_2974297_-|DoxX-family-protein
MILSIDSNDANTAPLHKKTISSLSGAVESMMKKLEDVGVLVARILMPILFITAGWGKITGYAGTQQYMEAMGVPGFMLPLVILLEFGGGLAILFGFLTRTTALFTAGFTLLTAFLFHSNFAEGVNSLMFMKNLTISGGFLLLAITGPGAYSIDRLLNKKW
>NZ_CP040886.1|WP_000096086.1|2974392_2974692_-|hypothetical-protein
MSSKVERERRKAQLLSQIQQQRLDLSASRREWLEATGAYDRRWNMLLSLRSWALVGSSVMAIWTIRHPNMLVRWARRGFGVWSAWRLVKTTLKQQQLRG
>NZ_CP040886.1|WP_000785722.1|2974681_2975086_-|hypothetical-protein
MADTHHAQGPGKSVLGIGQRIVSIMVEMVETRLRLAVVELEEEKANLFQLLLMLGLTMLFAAFGLMSLMVLIIWAVDPQYRLNAMIATTVVLLLLALIGGIWTLRKSRKSTLLRHTRHELANDRQLLEEESREQ
>NZ_CP040886.1|WP_000031415.1|2975088_2975394_-|DUF883-domain-containing-protein
MSKEHTTEHLRAELKSLSDTLEEVLSSSGEKSKEELSKIRSKAEQALKQSRYRLGETGDAIAKQTRVAAARADEYVRENPWTGVGIGAAIGVVLGVLLSRR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_8

3344376-3344831

Orphan

I-E

Consensus_repeat	Method
GAGTTCCCCGCGCCAGCGGGGATAAACC	PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRT

7 spacers

The CRISPR arrays of NZ_CP040886_8

>merge|NZ_CP040886|8|3344376-3344831|PILER-CR,CRISPRCasFinder,CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCGGCTGATGGTCTGGGAGTGTCCATCGGGCAACTGAGTTCCCCGCGCCAGCGGGGATAAACCGGAAGTAGGCCTGACAGTGATTGAACGCATACTGAGTTCCCCGCGCCAGCGGGGATAAACCGAGTTGGGGCGGCGCAATAACGAGACGATACGCGAGTTCCCCGCGCCAGCGGGGATAAACCGGGGAGTGGCACTTCTGGGGTAGCGGCGGCCCTGAGTTCCCCGCGCCAGCGGGGATAAACCGTCAACGCGCTCAGACGTTGCGTGAGTGAACCAGAGTTCCCCGCGCCAGCGGGGATAAACCGAAATATCCAGGGCTGGGCTGGAGGCAGACGGCGAGTTCCCCGCGCCAGCGGGGATAAACCGCCCGGAATGCATTCTGAAGGTTTGCTGTATATGAGTTCCCCGCGCCAGCGGGGATAAACCA

>NZ_CP040886|8|2|3344376-3344830|PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACC	GGCTGATGGTCTGGGAGTGTCCATCGGGCAACT
GAGTTCCCCGCGCCAGCGGGGATAAACC	GGAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACC	GAGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACC	GGGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACC	GTCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACC	GAAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACC	GCCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACC

>NZ_CP040886|8|7|3344376-3344831|CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GCTGATGGTCTGGGAGTGTCCATCGGGCAACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

>NZ_CP040886|8|1|3344376-3344831|CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GCTGATGGTCTGGGAGTGTCCATCGGGCAACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_000046812.1\|3333782_3335084_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	unknown	unknown	gnl\|CDD\|237291
NZ_CP040886.1\|WP_001098105.1\|3350972_3352310_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
NZ_CP040886.1\|WP_000210878.1\|3339116_3340754_+\|CTP-synthase-(glutamine-hydrolyzing)	unknown	unknown	gnl\|CDD\|235437
NZ_CP040886.1\|WP_000581937.1\|3337443_3337692_+\|type-II-toxin-antitoxin-system-antitoxin-MazE	unknown	unknown	gnl\|CDD\|182082
NZ_CP040886.1\|WP_001199979.1\|3343364_3344036_+\|7-carboxy-7-deazaguanine-synthase-QueE	unknown	unknown	gnl\|CDD\|275126
NZ_CP040886.1\|WP_000059312.1\|3349424_3350879_+\|FAD-binding-oxidoreductase	unknown	unknown	gnl\|CDD\|223354
NZ_CP040886.1\|WP_000254738.1\|3337691_3338027_+\|endoribonuclease-MazF	unknown	unknown	gnl\|CDD\|182138
NZ_CP040886.1\|WP_001288227.1\|3343085_3343226_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_001679366.1\|3342199_3343072_-\|YgcG-family-protein	unknown	unknown	gnl\|CDD\|224429
NZ_CP040886.1\|WP_000039683.1\|3345468_3346947_-\|sugar-kinase	unknown	unknown	gnl\|CDD\|212662
NZ_CP040886.1\|WP_001164578.1\|3346973_3348251_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|349949
NZ_CP040886.1\|WP_000109532.1\|3354663_3354924_-\|ferredoxin-family-protein	unknown	unknown	gnl\|CDD\|225289
NZ_CP040886.1\|WP_001324445.1\|3352287_3353067_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	unknown	unknown	gnl\|CDD\|224997
NZ_CP040886.1\|WP_001295150.1\|3354914_3356186_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
NZ_CP040886.1\|WP_001130266.1\|3354071_3354647_-\|glycerol-3-phosphate-responsive-antiterminator	unknown	unknown	gnl\|CDD\|224865
NZ_CP040886.1\|WP_001071648.1\|3338097_3338889_+\|nucleoside-triphosphate-pyrophosphohydrolase	unknown	unknown	gnl\|CDD\|236569
NZ_CP040886.1\|WP_000036723.1\|3340841_3342140_+\|phosphopyruvate-hydratase	unknown	unknown	gnl\|CDD\|234617
NZ_CP040886.1\|WP_000226815.1\|3335131_3337366_+\|GTP-pyrophosphokinase	unknown	unknown	gnl\|CDD\|182797
NZ_CP040886.1\|WP_001324446.1\|3353063_3353924_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|224936
NZ_CP040886.1\|WP_000021330.1\|3348569_3349355_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|187605

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_000046812.1\|3333782_3335084_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	gnl\|CDD\|237291	PRK13168, rumA, 23S rRNA (uracil(1939)-C(5))-methyltransferase RlmD.	0
NZ_CP040886.1\|WP_001098105.1\|3350972_3352310_+\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	3.74708e-50
NZ_CP040886.1\|WP_000210878.1\|3339116_3340754_+\|CTP-synthase-(glutamine-hydrolyzing)	gnl\|CDD\|235437	PRK05380, pyrG, CTP synthetase; Validated.	0
NZ_CP040886.1\|WP_000581937.1\|3337443_3337692_+\|type-II-toxin-antitoxin-system-antitoxin-MazE	gnl\|CDD\|182082	PRK09798, PRK09798, MazF-MazE toxin-antitoxin system antitoxin MazE.	6.19513e-48
NZ_CP040886.1\|WP_001199979.1\|3343364_3344036_+\|7-carboxy-7-deazaguanine-synthase-QueE	gnl\|CDD\|275126	TIGR04322, organic_radical_activating_enzyme, putative 7-cyano-7-deazaguanosine (preQ0) biosynthesis protein QueE. Members of this radical SAM domain protein family appear to be the E. coli form of the queuosine biosynthesis protein QueE. QueE is involved in making preQ0 (7-cyano-7-deazaquanine), a precursor of both the bacterial/eukaryotic modified tRNA base queuosine and the archaeal modified base archaeosine. Members occur in species that lack known forms of QueE but usually are not found in queuosine biosynthesis operons. Members of this family tend to form bi-directional best hit matches to members of known (TIGR03365) and putative (TIGR03963) QueE families from other lineages.	3.23739e-155
NZ_CP040886.1\|WP_000059312.1\|3349424_3350879_+\|FAD-binding-oxidoreductase	gnl\|CDD\|223354	COG0277, GlcD, FAD/FMN-containing dehydrogenases [Energy production and conversion].	1.25325e-82
NZ_CP040886.1\|WP_000254738.1\|3337691_3338027_+\|endoribonuclease-MazF	gnl\|CDD\|182138	PRK09907, PRK09907, endoribonuclease MazF.	1.17475e-74
NZ_CP040886.1\|WP_001679366.1\|3342199_3343072_-\|YgcG-family-protein	gnl\|CDD\|224429	COG1512, COG1512, Beta-propeller domains of methanol dehydrogenase type [General function prediction only].	4.46208e-100
NZ_CP040886.1\|WP_000039683.1\|3345468_3346947_-\|sugar-kinase	gnl\|CDD\|212662	cd07779, FGGY_ygcE_like, uncharacterized ygcE-like proteins. This subfamily consists of uncharacterized hypothetical bacterial proteins with similarity to Escherichia coli sugar kinase ygcE , whose functional roles are not yet clear. Escherichia coli ygcE is recognized by this model, but is not present in the alignment as it contains a deletion relative to other members of the group. These proteins belong to the FGGY family of carbohydrate kinases, the monomers of which contain two large domains, which are separated by a deep cleft that forms the active site. This model includes both the N-terminal domain, which adopts a ribonuclease H-like fold, and the structurally related C-terminal domain.	9.76816e-108
NZ_CP040886.1\|WP_001164578.1\|3346973_3348251_-\|MFS-transporter	gnl\|CDD\|349949	cd06174, MFS, Major Facilitator Superfamily. The Major Facilitator Superfamily (MFS) is a large and diverse group of secondary transporters that includes uniporters, symporters, and antiporters. MFS proteins facilitate the transport across cytoplasmic or internal membranes of a variety of substrates including ions, sugar phosphates, drugs, neurotransmitters, nucleosides, amino acids, and peptides. They do so using the electrochemical potential of the transported substrates. Uniporters transport a single substrate, while symporters and antiporters transport two substrates in the same or in opposite directions, respectively, across membranes. MFS proteins are typically 400 to 600 amino acids in length, and the majority contain 12 transmembrane alpha helices (TMs) connected by hydrophilic loops. The N- and C-terminal halves of these proteins display weak similarity and may be the result of a gene duplication/fusion event. Based on kinetic studies and the structures of a few bacterial superfamily members, GlpT (glycerol-3-phosphate transporter), LacY (lactose permease), and EmrD (multidrug transporter), MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement. Bacterial members function primarily for nutrient uptake, and as drug-efflux pumps to confer antibiotic resistance. Some MFS proteins have medical significance in humans such as the glucose transporter Glut4, which is impaired in type II diabetes, and glucose-6-phosphate transporter (G6PT), which causes glycogen storage disease when mutated.	1.84544e-29
NZ_CP040886.1\|WP_000109532.1\|3354663_3354924_-\|ferredoxin-family-protein	gnl\|CDD\|225289	COG2440, FixX, Ferredoxin-like protein [Energy production and conversion].	3.6328e-41
NZ_CP040886.1\|WP_001324445.1\|3352287_3353067_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	gnl\|CDD\|224997	COG2086, FixA, Electron transfer flavoprotein, beta subunit [Energy production and conversion].	7.46503e-62
NZ_CP040886.1\|WP_001295150.1\|3354914_3356186_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	2.82789e-125
NZ_CP040886.1\|WP_001130266.1\|3354071_3354647_-\|glycerol-3-phosphate-responsive-antiterminator	gnl\|CDD\|224865	COG1954, GlpP, Glycerol-3-phosphate responsive antiterminator (mRNA-binding) [Transcription].	5.83077e-88
NZ_CP040886.1\|WP_001071648.1\|3338097_3338889_+\|nucleoside-triphosphate-pyrophosphohydrolase	gnl\|CDD\|236569	PRK09562, mazG, nucleoside triphosphate pyrophosphohydrolase; Reviewed.	8.97718e-160
NZ_CP040886.1\|WP_000036723.1\|3340841_3342140_+\|phosphopyruvate-hydratase	gnl\|CDD\|234617	PRK00077, eno, enolase; Provisional.	0
NZ_CP040886.1\|WP_000226815.1\|3335131_3337366_+\|GTP-pyrophosphokinase	gnl\|CDD\|182797	PRK10872, relA, (p)ppGpp synthetase I/GTP pyrophosphokinase; Provisional.	0
NZ_CP040886.1\|WP_001324446.1\|3353063_3353924_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|224936	COG2025, FixB, Electron transfer flavoprotein, alpha subunit [Energy production and conversion].	1.47186e-88
NZ_CP040886.1\|WP_000021330.1\|3348569_3349355_+\|SDR-family-oxidoreductase	gnl\|CDD\|187605	cd05347, Ga5DH-like_SDR_c, gluconate 5-dehydrogenase (Ga5DH)-like, classical (c) SDRs. Ga5DH catalyzes the NADP-dependent conversion of carbon source D-gluconate and 5-keto-D-gluconate. This SDR subgroup has a classical Gly-rich NAD(P)-binding motif and a conserved active site tetrad pattern. However, it has been proposed that Arg104 (Streptococcus suis Ga5DH numbering), as well as an active site Ca2+, play a critical role in catalysis. In addition to Ga5DHs this subgroup contains Erwinia chrysanthemi KduD which is involved in pectin degradation, and is a putative 2,5-diketo-3-deoxygluconate dehydrogenase. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase (15-PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, 15-PGDH numbering) and/or an Asn (Asn-107,15-PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	1.14687e-138

>NZ_CP040886.1|WP_001199979.1|3343364_3344036_+|7-carboxy-7-deazaguanine-synthase-QueE
MQYPINEMFQTLQGEGYFTGVPAIFIRLQGCPVGCAWCDTKHTWEKLEDREVSLFSILAKTKESDKWGAASSEDLLAVISRQGYTARHVVITGGEPCIHDLLPLTDLLEKNGFSCQIETSGTHEVRCTPNTWVTVSPKLNMRGGYEVLSQALERANEIKHPVGRVRDIEALDELLATLTDDKPRVIALQPISQKDDATRLCIETCIARNWRLSMQTHKYLNIA
>NZ_CP040886.1|WP_001288227.1|3343085_3343226_-|hypothetical-protein
MSEENKENGFNHVKTFTKIIFIFSVLVFNDNESKITDAAVNLFIQI
>NZ_CP040886.1|WP_001679366.1|3342199_3343072_-|YgcG-family-protein
MRYFILMFTFVCSFVAAQPTIVPQLQQQVTDLTSSLNSQEKKELTHKLESIFNNTQVQIAVLIVPTTKDETIEQYATRVFDNWRLGDAKRNDGILIIVAWSDRTVRIKVGYGLEEKVTDALAGDIIRSNMIPAFKQQKLAQGLELAINALNNQLTSQHQYPTNPSESESASSSDHYYFAIFWVFAVMFFPFWFFHQCSNFCRACKSGVCISAIYLLDLFLFSDKIFSIAVFSFFFTFTIFMVFTCLCVLQKRASGRSYHSDNSGSAGGSDSGGFSGGGGSSGGGGASGRW
>NZ_CP040886.1|WP_000036723.1|3340841_3342140_+|phosphopyruvate-hydratase
MSKIVKIIGREIIDSRGNPTVEAEVHLEGGFVGMAAAPSGASTGSREALELRDGDKSRFLGKGVTKAVAAVNGPIAQALIGKDAKDQAGIDKIMIDLDGTENKSKFGANAILAVSLANAKAAAAAKGMPLYEHIAELNGTPGKYSMPVPMMNIINGGEHADNNVDIQEFMIQPVGAKTVKEAIRMGSEVFHHLAKVLKAKGMNTAVGDEGGYAPNLGSNAEALAVIAEAVKAAGYELGKDITLAMDCAASEFYKDGKYVLAGEGNKAFTSEEFTHFLEELTKQYPIVSIEDGLDESDWDGFAYQTKVLGDKIQLVGDDLFVTNTKILKEGIEKGIANSILIKFNQIGSLTETLAAIKMAKDAGYTAVISHRSGETEDATIADLAVGTAAGQIKTGSMSRSDRVAKYNQLIRIEEALGEKAPYNGRKEIKGQA
>NZ_CP040886.1|WP_000210878.1|3339116_3340754_+|CTP-synthase-(glutamine-hydrolyzing)
MTTNYIFVTGGVVSSLGKGIAAASLAAILEARGLNVTIMKLDPYINVDPGTMSPIQHGEVFVTEDGAETDLDLGHYERFIRTKMSRRNNFTTGRIYSDVLRKERRGDYLGATVQVIPHITNAIKERVLEGGEGHDVVLVEIGGTVGDIESLPFLEAIRQMAVEIGREHTLFMHLTLVPYMAASGEVKTKPTQHSVKELLSIGIQPDILICRSDRAVPANERAKIALFCNVPEKAVISLKDVDSIYKIPGLLKSQGLDDYICKRFSLNCPEANLSEWEQVIFEEANPVSEVTIGMVGKYIELPDAYKSVIEALKHGGLKNRVSVNIKLIDSQDVETRGVEILKGLDAILVPGGFGYRGVEGMITTARFARENNIPYLGICLGMQVALIDYARHVANMENANSTEFVPDCKYPVVALITEWRDENGNVEVRSEKSDLGGTMRLGAQQCQLVDDSLVRQLYNAPTIVERHRHRYEVNNMLLKQIEDAGLRVAGRSGDDQLVEIIEVPNHPWFVACQFHPEFTSTPRDGHPLFAGFVKAASEFQKRQAK
>NZ_CP040886.1|WP_001071648.1|3338097_3338889_+|nucleoside-triphosphate-pyrophosphohydrolase
MNQIDRLLTIMQRLRDPENGCPWDKEQTFATIAPYTLEETYEVLDAIAREDFDDLRGELGDLLFQVVFYAQMAQEEGRFDFNDICAAISDKLERRHPHVFADSSAENSSEVLARWEQIKTEERAQKAQHSALDDIPRSLPALMRAQKIQKRCANVGFDWTTLGPVVDKVYEEIDEVMYEARQAVVDQAKLEEEMGDLLFATVNLARHLGTKAEIALQKANEKFERRFREVERIVAARGLEMTGVDLETMEEVWQQVKRQEIDL
>NZ_CP040886.1|WP_000254738.1|3337691_3338027_+|endoribonuclease-MazF
MVSRYVPDMGDLIWVDFDPTKGSEQAGHRPAVVLSPFMYNNKTGMCLCVPCTTQSKGYPFEVVLSGQERDGVALADQVKSIAWRARGATKKGTVAPEELQLIKAKINVLIG
>NZ_CP040886.1|WP_000581937.1|3337443_3337692_+|type-II-toxin-antitoxin-system-antitoxin-MazE
MIHSSVKRWGNSPAVRIPATLMQALNLNIDDEVKIDLVDGKLIIEPVRKEPVFTLAELVNDITPENLHENIDWGEPKDKEVW
>NZ_CP040886.1|WP_000226815.1|3335131_3337366_+|GTP-pyrophosphokinase
MVAVRSAHINKAGEFDPEKWIASLGITSQKSCECLAETWAYCLQQTQGHPDASLLLWRGVEMVEILSTLSMDIDTLRAALLFPLADANVVSEDVLRESVGKSVVNLIHGVRDMAAIRQLKATHTDSVSSEQVDNVRRMLLAMVDDFRCVVIKLAERIAHLREVKDAPEDERVLAAKECTNIYAPLANRLGIGQLKWELEDYCFRYLHPTEYKRIAKLLHERRLDREHYIEEFVGHLRAEMKAEGVKAEVYGRPKHIYSIWRKMQKKNLAFDELFDVRAVRIVAERLQDCYAALGIVHTHYRHLPDEFDDYVANPKPNGYQSIHTVVLGPGGKTVEIQIRTKQMHEDAELGVAAHWKYKEGAAAGGARSGHEDRIAWLRKLIAWQEEMADSGEMLDEVRSQVFDDRVYVFTPKGDVVDLPAGSTPLDFAYHIHSDVGHRCIGAKIGGRIVPFTYQLQMGDQIEIITQKQPNPSRDWLNPNLGYVTTSRGRSKIHAWFRKQDRDKNILAGRQILDDELEHLGISLKEAEKHLLPRYNFNDVDELLAAIGGGDIRLNQMVNFLQSQFNKPSAEEQDAAALKQLQQKSYTPQNRSKDNGRVVVEGVGNLMHHIARCCQPIPGDEIVGFITQGRGISVHRADCEQLAELRSHAPERIVDAVWGESYSAGYSLVVRVVANDRSGLLRDITTILANEKVNVLGVASRSDTKQQLATIDMTIEIYNLQVLGRVLGKLNQVPDVIDARRLHGS
>NZ_CP040886.1|WP_000046812.1|3333782_3335084_+|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD
MAQFYSAKRRTTTRQIITVSVNDLDSFGQGVARHNGKTLFIPGLLPQENAEVTVTEDKKQYARAKVVRRLSDSPERETPRCPHFGVCGGCQQQHASVDLQQRSKSAALARLMKHDVSEVIADVPWGYRRRARLSLNYLPKTQQLQMGFRKAGSSDIVDVKQCPILAPQLEALLPKVRACLGSLQAMRHLGHVELVQATSGTLMILRHTAPLSSADREKLERFSHSEGLDLYLAPDSEILETVSGEMPWYDSNGLRLTFSPRDFIQVNAGVNQKMVARALEWLDVQPEDRVLDLFCGMGNFTLPLATQAASVVGVEGVPALVEKGQQNARLNGLQNVTFYHENLEEDVTKQPWAKNGFDKVLLDPARAGAAGVMQQIIKLEPIRIVYVSCNPATLARDSEALLKAGYTIARLAMLDMFPHTGHLESMVLFSRVK
>NZ_CP040886.1|WP_000039683.1|3345468_3346947_-|sugar-kinase
MSKKYIIGIDGGSQSTKVVMYDLEGNVVCEGKGLLQPMHTPDADTAEHPDDDLWASLCFAGHDLMSQFAGNKEDIVGIGLGSIRCCRALLKADGTPAAPLISWQDARVTRPYEHTNPDVAYVTSFSGYLTHRLTGEFKDNIANYFGQWPVDYKSWAWSEDAAVMDKFNIPRHMLFDVQMPGTVLGHITPQAALATHFPAGLPVVCTTSDKPVEALGAGLLDDETAVISLGTYIALMMNGKALPKDPVAYWPIMSSIPQTLLYEGYGIRKGMWTVSWLRDMLGESLIQDAKAQDLSPEDLLNKKASCVPPGCNGLMTVLDWLTNPWEPYKRGIMIGFDSSMDYAWIYRSILESVALTLKNNYDNMCNEMNYFAKHVIITGGGSNSDLFMQIFADVFNLPARRNAINGCASLGAAINTAVGLGLYPDYATAVDKMVRVKDIFMPVESNAKRYDAMNKGIFKDLTKHTDVILKKSYEVMHGELGNADSIQSWSNA
>NZ_CP040886.1|WP_001164578.1|3346973_3348251_-|MFS-transporter
MQHNSYRRWITLAIISFSGGVSFDLAYLRYIYQIPMAKFMGFSNTEIGLIMSTFGIAAIILYAPSGVIADKFSHRKMITSAMIITGLLGLLMATYPPLWVMLCIQVAFAITTILMLWSVSIKAASLLGDHSEQGKIMGWMEGLRGVGVMSLAVFTMWVFSRFAPDDSTSLKTVIIIYSVVYILLGILCWFFVSDNNNLRSANNEEKQSFQLSDILAVLRISTTWYCSMVIFGVFTIYAILSYSTNYLTEMYGMSLVAASYMGIVINKIFRALCGPLGGIITTYSKVKSPTRVIQILSIIGLLALTALLVTNSNPQSVAMGIGLILLLGFTCYASRGLYWACPGEARTPSYIMGTTVGICSVIGFLPDVFVYPIIGHWQDTLPAAEAYRNMWLMGMAALGMVIVFTFLLFQKIRTADSAPAMASSK
>NZ_CP040886.1|WP_000021330.1|3348569_3349355_+|SDR-family-oxidoreductase
MSIESLNAFSMDFFSLKGKTAIVTGGNSGLGQAFAMALAKAGANIFIPSFVKDNGETKEMIEKQGVEVDFMQVDITAEGAPQKIIAASCERFGTVDILVNNAGICKLNKVLDFGRADWDPMIDVNLTAAFELSYEAAKIMIPQKSGKIINICSLFSYLGGQWSPAYSATKHALAGFTKAYCDELGQYNIQVNGIAPGYYATDITLATRSNPETNQRVLDHIPANRWGDTQDLMGAAVFLASPASNYVNGHLLVVDGGYLVR
>NZ_CP040886.1|WP_000059312.1|3349424_3350879_+|FAD-binding-oxidoreductase
MSLSRAAIVDQLKEIVGADRVITDETVLKKNSIDRFRKFPDIHGIYTLPIPAAVVKLGSTEQVSRVLNFMNAHKINGVPRTGASATEGGLETVVENSVVLDGSAMNQIINIDIENMQATAQCGVPLEVLENALREKGYTTGHSPQSKPLAQMGGLVATRSIGQFSTLYGAIEDMVVGLEAVLADGTVTRIKNVPRRAAGPDIRHIIIGNEGALCYITEVTVKIFKFTPENNLFYGYILEDMKTGFNILREVMVEGYRPSIARLYDAEDGTQHFTHFADGKCVLIFMAEGNPRIAKATGEGIAEIVARYPQCQRVDSKLIETWFNNLNWGPDKVAAERVQILKTGNMGFTTEVSGCWSCIHEIYESVINRIRTEFPHADDITMLGGHSSHSYQNGTNMYFVYDYNVVDCKPEEEIDKYHNPLNKIICEETIRLGGSMVHHHGIGKHRVHWSKLEHGSAWALLEGLKKQFDPNGIMNTGTIYPIEK
>NZ_CP040886.1|WP_001098105.1|3350972_3352310_+|MFS-transporter
MNTSPVRMDDLPLNRFHCRIAALTFGAHLTDGYVLGVIGYAIIQLTPAMQLTPFMAGMIGGSALLGLFLGSLVLGWISDHIGRQKIFTFSFLLITLASFLQFFATTPEHLIGLRILIGIGLGGDYSVGHTLLAEFSPRRHRGILLGAFSVVWTVGYVLASIAGHHFISENPEAWRWLLASAALPALLITLLRWGTPESPRWLLRQGRFAEAHAIVHRYFGPHVLLGDEVVTATHKHIKTLFSSRYWRRTAFNSVFFVCLVIPWFVIYTWLPTIAQTIGLEDALTASLMLNALLIVGALLGLVLTHLLAHRKFLLGSFLLLAATLVVMACLPSGSSLTLLLFVLFSTTISAVSNLVGILPAESFPTDIRSLGVGFATAMSRLGAAVSTGLLPWVLAQWGMQVTLLLLATVLLVGFVVTWLWAPETKALPLVAAGNVGGANEHSVSV
>NZ_CP040886.1|WP_001324445.1|3352287_3353067_+|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein
MNILLAFKAEPDAGMLAEKEWQAAAQGKSGPDISLLRSLLGADEQAAAALLLAQRKNGTPMSLTALSMGDERALHWLRYLMALGFEEAVLLETAADLRFAPEFVARHIAEWQHQNPLDLIITGCQSSEGQNGQTPFLLAEMLGWPCFTQVERFTLDALFITLEQRTEHGLRCCRVRLPAVIAVRQCGEVALPVPGMRQRMAAGKAEIIRKTVAAEMPAMQCLQLARAEQRRGATLIDGQTVAEKAQKLWRDYLRQRMQP
>NZ_CP040886.1|WP_001324446.1|3353063_3353924_+|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MNIAIVTINQENAAIASWLAAQDFSGCTLAHWQIEPQPVVAEQVLDALVEQWQRTPADVVLFPPGTFGDELSTRLAWRLHGASICQVTSLDIPTVSVRKSHWGNALTATLQTEKRPLCLSLARQAGAAKNATLPSGMQQLIIVPGALPDWLVSTEDLKNVTRDPLAEARRVLVVGQGGEADNQEIAMLAEKLGAEVGYSRARVMNGGVDAEKVIGISGHLLAPEVCIVVGASGAAALMAGVRNSKFVVAINHDASAAVFSQADVGVVDDWKVVLEALVTNIHADCQ
>NZ_CP040886.1|WP_001130266.1|3354071_3354647_-|glycerol-3-phosphate-responsive-antiterminator
MPLLHLLRQNPVIAAVKDNASLQLAIDSECQFISVLYGNICTISNIVKKIKNAGKYAFIHVDLLEGASNKEVVIQFLKLVTEADGIISTKASMLKAARAEGFFCIHRLFIVDSISFHNIDKQVAQSNPDCIEILPGCMPKVLGWVTEKIRQPLIAGGLVCDEEDARNAINAGVVALSTTNTGVWTLAKKLL
>NZ_CP040886.1|WP_000109532.1|3354663_3354924_-|ferredoxin-family-protein
MSVARNLWRVADAPHIVPADSVERQTAERLISACPAGLFSLTPEGDLRIDYRSCLECGTCRLLCDESTLQQWRYPPSGFGITYRFG
>NZ_CP040886.1|WP_001295150.1|3354914_3356186_-|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERCITHESLSLLTPDGATTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGGICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_9

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_9

3367216-3367611

Unclear

I-E

Consensus_repeat	Method
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	CRISPRCasFinder
GTGTTCCCCGCGCCAGCGGGGATAAACCG	PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CRT

6 spacers

cas2,cas1,cas6e,cas5

The CRISPR arrays of NZ_CP040886_9

>merge|NZ_CP040886|9|3367216-3367611|CRISPRCasFinder,PILER-CR,CRT
TGTGTTCCCCGCGCCAGCGGGGATAAACCGTTGCCCGCGCAATTCCGGGAGCATCCGCAATTGTGTTCCCCGCGCCAGCGGGGATAAACCGACGGACAAAATATATATTGATTTGCGAATTATGTGTTCCCCGCGCCAGCGGGGATAAACCGGTAAAGAAACTGCCGACAAATCCCTGTTCGTTGTGTTCCCCGCGCCAGCGGGGATAAACCGCCGAACGGCTGGCGAAGCAGGTGGCTGGCGTAGTGTTCCCCGCGCCAGCGGGGATAAACCGGTTTACCGCCCCGCAGAGGCGCTGGCAGATCCGTGTTCCCCGCGCCAGCGGGGATAAACCGGGATGACCTGTCGCTAAAACTCGCCGCGTACAGTGTTCCCCGCGCCAGCGGGGATAAACCG

>NZ_CP040886|9|8|3367216-3367611|CRISPRCasFinder
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAAT
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTA
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGT
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGT
AGTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATC
CGTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTAC
AGTGTTCCCCGCGCCAGCGGGGATAAACCG

>NZ_CP040886|9|3|3367217-3367611|PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAATT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTAT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGTT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGTA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATCC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTACA
GTGTTCCCCGCGCCAGCGGGGATAAACCG

>NZ_CP040886|9|2|3367217-3367611|CRT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAATT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTAT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGTT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGTA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATCC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTACA
GTGTTCCCCGCGCCAGCGGGGATAAACCG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_000063176.1\|3366826_3367120_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	cd09648_cas2_CAS-I-E	gnl\|CDD\|236930
NZ_CP040886.1\|WP_000372108.1\|3368981_3369890_+\|sulfate-adenylyltransferase-subunit-CysD	unknown	unknown	gnl\|CDD\|235375
NZ_CP040886.1\|WP_000281446.1\|3365259_3365910_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	cd09664_cas6e_CAS-I-E	gnl\|CDD\|273869
NZ_CP040886.1\|WP_000490426.1\|3367692_3368730_-\|alkaline-phosphatase-isozyme-conversion-aminopeptidase	unknown	unknown	gnl\|CDD\|182299
NZ_CP040886.1\|WP_000144861.1\|3365906_3366830_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NZ_CP040886.1\|WP_001374730.1\|3373530_3374010_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	unknown	unknown	gnl\|CDD\|178851
NZ_CP040886.1\|WP_000039842.1\|3360529_3361264_+\|phosphoadenosine-phosphosulfate-reductase	unknown	unknown	gnl\|CDD\|234997
NZ_CP040886.1\|WP_001246104.1\|3371973_3372297_+\|DUF3561-family-protein	unknown	unknown	gnl\|CDD\|371891
NZ_CP040886.1\|WP_000517476.1\|3372490_3372802_+\|cell-division-protein-FtsB	unknown	unknown	gnl\|CDD\|179156
NZ_CP040886.1\|WP_001173673.1\|3371318_3371924_+\|adenylyl-sulfate-kinase	unknown	unknown	gnl\|CDD\|179661
NZ_CP040886.1\|WP_000246138.1\|3372820_3373531_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	unknown	unknown	gnl\|CDD\|234670
NZ_CP040886.1\|WP_001090386.1\|3369891_3371319_+\|sulfate-adenylyltransferase-subunit-CysN	unknown	unknown	gnl\|CDD\|235349
NZ_CP040886.1\|WP_001290706.1\|3358743_3360456_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	unknown	unknown	gnl\|CDD\|237402
NZ_CP040886.1\|WP_001295150.1\|3354914_3356186_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
NZ_CP040886.1\|WP_000085051.1\|3364531_3365278_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|187776
NZ_CP040886.1\|WP_000956458.1\|3361528_3361681_+\|type-I-toxin-antitoxin-system-Hok-family-toxin	unknown	unknown	gnl\|CDD\|366840
NZ_CP040886.1\|WP_000211954.1\|3356944_3358744_+\|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit	unknown	unknown	gnl\|CDD\|182862
NZ_CP040886.1\|WP_000568943.1\|3374006_3375056_+\|tRNA-pseudouridine(13)-synthase-TruD	unknown	unknown	gnl\|CDD\|234884
NZ_CP040886.1\|WP_001374723.1\|3375036_3375798_+\|5'/3'-nucleotidase-SurE	unknown	unknown	gnl\|CDD\|234732
NZ_CP040886.1\|WP_000987944.1\|3356263_3356629_-\|6-carboxytetrahydropterin-synthase-QueD	unknown	unknown	gnl\|CDD\|238264

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_000063176.1\|3366826_3367120_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|236930	PRK11558, PRK11558, putative ssRNA endonuclease; Provisional.	2.35543e-65
NZ_CP040886.1\|WP_000372108.1\|3368981_3369890_+\|sulfate-adenylyltransferase-subunit-CysD	gnl\|CDD\|235375	PRK05253, PRK05253, sulfate adenylyltransferase subunit CysD.	0
NZ_CP040886.1\|WP_000281446.1\|3365259_3365910_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|273869	TIGR01907, CRISPR_system_Cascade_subunit_CasE, CRISPR-associated protein Cas6/Cse3/CasE, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model family, represented by CT1974 from Chlorobium tepidum, is found in the Ecoli subtype of CRISPR/Cas regions and is designated Cse3 (CRISPR/Cas Subtype Ecoli protein 3). The representative of this family from Thermus thermophilus HB8 (TTHB192) has been crystallized and found to have a structure consisting of two domains with opposing parallel beta-sheets known as a beta-sheet platform. This structure is similar to those found in the Sex-lethal protein and poly(A)-binding protein. This structure is consistent with an RNA-binding function.	1.0289e-91
NZ_CP040886.1\|WP_000490426.1\|3367692_3368730_-\|alkaline-phosphatase-isozyme-conversion-aminopeptidase	gnl\|CDD\|182299	PRK10199, PRK10199, alkaline phosphatase isozyme conversion aminopeptidase; Provisional.	0
NZ_CP040886.1\|WP_000144861.1\|3365906_3366830_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	6.67486e-158
NZ_CP040886.1\|WP_001374730.1\|3373530_3374010_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	gnl\|CDD\|178851	PRK00084, ispF, 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase; Reviewed.	3.39469e-104
NZ_CP040886.1\|WP_000039842.1\|3360529_3361264_+\|phosphoadenosine-phosphosulfate-reductase	gnl\|CDD\|234997	PRK02090, PRK02090, phosphoadenylyl-sulfate reductase.	1.33579e-136
NZ_CP040886.1\|WP_001246104.1\|3371973_3372297_+\|DUF3561-family-protein	gnl\|CDD\|371891	pfam12084, DUF3561, Protein of unknown function (DUF3561). This family of proteins is functionally uncharacterized. This protein is found in bacteria. Proteins in this family are about 110 amino acids in length.	1.22003e-52
NZ_CP040886.1\|WP_000517476.1\|3372490_3372802_+\|cell-division-protein-FtsB	gnl\|CDD\|179156	PRK00888, ftsB, cell division protein FtsB; Reviewed.	5.55235e-62
NZ_CP040886.1\|WP_001173673.1\|3371318_3371924_+\|adenylyl-sulfate-kinase	gnl\|CDD\|179661	PRK03846, PRK03846, adenylylsulfate kinase; Provisional.	7.34447e-148
NZ_CP040886.1\|WP_000246138.1\|3372820_3373531_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	gnl\|CDD\|234670	PRK00155, ispD, D-ribitol-5-phosphate cytidylyltransferase.	3.26939e-121
NZ_CP040886.1\|WP_001090386.1\|3369891_3371319_+\|sulfate-adenylyltransferase-subunit-CysN	gnl\|CDD\|235349	PRK05124, cysN, sulfate adenylyltransferase subunit 1; Provisional.	0
NZ_CP040886.1\|WP_001290706.1\|3358743_3360456_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	gnl\|CDD\|237402	PRK13504, PRK13504, NADPH-dependent assimilatory sulfite reductase hemoprotein subunit.	0
NZ_CP040886.1\|WP_001295150.1\|3354914_3356186_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	2.82789e-125
NZ_CP040886.1\|WP_000085051.1\|3364531_3365278_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|187776	cd09645, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	5.83917e-49
NZ_CP040886.1\|WP_000956458.1\|3361528_3361681_+\|type-I-toxin-antitoxin-system-Hok-family-toxin	gnl\|CDD\|366840	pfam01848, HOK_GEF, Hok/gef family.	8.32243e-12
NZ_CP040886.1\|WP_000211954.1\|3356944_3358744_+\|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit	gnl\|CDD\|182862	PRK10953, cysJ, NADPH-dependent assimilatory sulfite reductase flavoprotein subunit.	0
NZ_CP040886.1\|WP_000568943.1\|3374006_3375056_+\|tRNA-pseudouridine(13)-synthase-TruD	gnl\|CDD\|234884	PRK00984, truD, tRNA pseudouridine synthase D; Reviewed.	0
NZ_CP040886.1\|WP_001374723.1\|3375036_3375798_+\|5'/3'-nucleotidase-SurE	gnl\|CDD\|234732	PRK00346, surE, 5'(3')-nucleotidase/polyphosphatase; Provisional.	5.52694e-150
NZ_CP040886.1\|WP_000987944.1\|3356263_3356629_-\|6-carboxytetrahydropterin-synthase-QueD	gnl\|CDD\|238264	cd00470, PTPS, 6-pyruvoyl tetrahydropterin synthase (PTPS). Folate derivatives are essential cofactors in the biosynthesis of purines, pyrimidines, and amino acids, as well as formyl-tRNA. Mammalian cells are able to utilize pre-formed folates after uptake by a carrier-mediated active transport system. Most microbes and plants lack this system and must synthesize folates de novo from guanosine triphosphate. One enzyme from this pathway is PTPS which catalyzes the conversion of dihydroneopterin triphosphate to 6-pyruvoyl tetrahydropterin. The functional enzyme is a hexamer of identical subunits.	9.8593e-60

>NZ_CP040886.1|WP_000063176.1|3366826_3367120_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MSMVVVVTENVPPRLRGRLAIWLLEVRAGVYVGDTSKRIREMIWQQITQLAGCGNVVMAWATNTESGFEFQTWGENRRIPVDLDGLRLVSFLPVDNQ
>NZ_CP040886.1|WP_000144861.1|3365906_3366830_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MTFVPLSPIPLKDRTSMIFLQYGQIDVLDGAFVLIDKTGIRTHIPVGSVACIMLEPGTRVSHAAVHLAATVGTLLVWVGEAGVRVYSSGQPGGARADKLLYQAKLALTEDLRLKVVRKMYELRFREPPPARRSVEQLRGIEGSRVRQTYALLAKQYGVKWNGRKYDPKDWEKGDVVNRCISAATSCLYGISEAAVLAAGYAPAIGFIHSGKPLSFVYDIADIIKFDSVVPKAFEIAARQPAEPDKEVRLACRDIFRSTKLTGKLIPLIEEVLAAGEIEPPQPAPDMLPPAIPEPETLGDSGHRGRGG
>NZ_CP040886.1|WP_000281446.1|3365259_3365910_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MYLSRITLHTGQLSPAQLLHLVDRGEYVMHQWLWDLFPGGKERQFLYRREELQGAFRFFVLSQERPAESDTFTIECRSFAPELRTGQQLCFNLRANPTICKSGKRHDLLMEAKRQVRGQAEGSDVWLHQQQAALDWLAAQGERSGFTLLDTSVDAYRQQQLRRENSRQLIQFSSVDYTGMLTVTDPGLFLQRLSQGYGKSRAFGCGLMLIKPGAEA
>NZ_CP040886.1|WP_000085051.1|3364531_3365278_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MSQYLIFQLHGPMASWGVDAPGEVRHTHELPSRSALLGLLAAGVGIRRDDTERLNAFNRHYSLVVCASRNPRWARDYHTIQMPKEVRKARYFSRREELSDPDLLSAIISRRDYYTDAWWMVAVATTADAPYSLEQLQDGLRHPVFPLYLGRKSHPLALPLAPLLLEGNACDALCNAYQQYQDHFHKLKVSLPKLQDECWWEGEHDGLVASKILRRRDVPLNRQQWLFGERTINQGPWLSKEEPCTSQE
>NZ_CP040886.1|WP_000956458.1|3361528_3361681_+|type-I-toxin-antitoxin-system-Hok-family-toxin
MLTKYALVAIIVLCCTVLGFTLMVGDSLCELSIRERGMEFKAVLAYESKK
>NZ_CP040886.1|WP_000039842.1|3360529_3361264_+|phosphoadenosine-phosphosulfate-reductase
MSKLDLNALNELPKVDRILALAETNAELEKLDAEGRVAWALDNLPGEYVLSSSFGIQAAVSLHLVNQIHPDIPVILTDTGYLFPETYRFIDELTDKLKLNLKVYRATESAAWQEARYGKLWEQGVEGIEKYNDINKVEPMNRALKELNAQTWFAGLRREQSGSRANLPVLAIQRGVFKVLPIIDWDNRTIYQYLQKHGLKYHPLWDEGYLSVGDTHTTRKWEPGMLEEETRFFGLKRECGLHEG
>NZ_CP040886.1|WP_001290706.1|3358743_3360456_+|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit
MSEKHPGPLVVEGKLTDAERMKLESNYLRGTIAEDLNDGLTGGFKGDNFLLIRFHGMYQQDDRDIRAERAEQKLEPRHAMLLRCRLPGGVITTKQWQAIDKFAGENTIYGSIRLTNRQTFQFHGILKKNVKPVHQMLHSVGLDALATANDMNRNVLCTSNPYESQLHAEAYEWAKKISEHLLPRTRAYAEIWLDQEKVATTDEEPILGQTYLPRKFKTTVVIPPQNDIDLHANDMNFVAIAENGKLVGFNLLVGGGLSIEHGNKKTYARTASEFGYLPLEHTLAVAEAVVTTQRDWGNRTDRKNAKTKYTLERVGVETFKAEVERRAGIKFEPIRPYEFTGRGDRIGWVKGIDDNWHLTLFIENGRILDYPGRPLKTGLLEIAKIHKGDFRITANQNLIIAGVPESEKAKIEKIAKESGLMNAVTPQRENSMACVSFPTCPLAMAEAERFLPSFIDNIDNLMAKHGVSDEHIVMRVTGCPNGCGRAMLAEVGLVGKAPGRYNLHLGGNRIGTRIPRMYKENITEPEILASLDELIGRWAKEREAGEGFGDFTVRAGIIRPVLDPARDLWD
>NZ_CP040886.1|WP_000211954.1|3356944_3358744_+|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit
MTTQVPPSALLPLNPEQLVRLQAATTDLTPTQLAWVSGYFWGVLNQQPAALAATPAPAAEMPGITIISASQTGNARRVAEALRDDLLAAKLNVKLVNAGDYKFKQIASEKLLIVVTSTQGEGEPPEEAVALHKFLFSKKAPKLENTAFAVFSLGDSSYEFFCQSGKDFDSKLAELGGERLLDRVDADVEYQAAASEWRARVVDALKSRAPVAAPSQSVATGAVNEIHTSPYSKDAPLVASLSVNQKITGRNSEKDVRHIEIDLGDSGLRYQPGDALGVWYQNDPALVKELVELLWLKGDEPVTVEGKTLPLNEALQWHFELTVNTANIVENYATLTRSETLLPLVGDKAKLQHYAATTPIVDMVRFSPAQLDAEALINLLRPLTPRLYSIASSQAEVENEVHVTVGVVRYDVEGRARAGGASSFLADRVEEEGEVRVFIEHNDNFRLPANPETPVIMIGPGTGIAPFRAFMQQRAADEAPGKNWLFFGNPHFTEDFLYQVEWQRYVKDGVLTRIDLAWSRDQKEKVYVQDKLREQGAELWRWINDGAHIYVCGDANRMAKDVEQALLEVIAEFGGMDTEAADEFLSELRVERRYQRDVY
>NZ_CP040886.1|WP_000987944.1|3356263_3356629_-|6-carboxytetrahydropterin-synthase-QueD
MMSTTLFKDFTFEAAHRLPHVPEGHKCGRLHGHSFMVRLEITGEVDPHTGWIIDFAELKAAFKPTYERLDHHYLNDIPGLENPTSEVLAKWIWDQVKPVVPLLSAVMVKETCTAGCIYRGE
>NZ_CP040886.1|WP_001295150.1|3354914_3356186_-|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERCITHESLSLLTPDGATTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGGICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL
>NZ_CP040886.1|WP_000490426.1|3367692_3368730_-|alkaline-phosphatase-isozyme-conversion-aminopeptidase
MFSALRHRTAALALGVCFILPVHASSPKPGDFANTQARHIATFFPGRMTGTPAEMLSADYIRQQFQQMGYRSDIRTFNSRYIYTARDNRKSWHNVTGSTVIAAHEGKAPQQIIIMAHLDTYAPLSDADADANLGGLTLQGMDDNAAGLGVMLELAERLKNTPTEYGIRFVATSGEEEGKLGAENLLKRMSDTEKKNTLLVINLDNLIVGDKLYFNSGVKTPEAVRKLTRDRALAIARSHGIAATTNPGLNKNYPKGTGCCNDAEIFDKAGIAVLSVEATNWNLGNKDGYQQRAKTAAFPAGNSWHDVRLDNQQHIDKALPGRIERRCRDVMRIMLPLVKELAKAS
>NZ_CP040886.1|WP_000372108.1|3368981_3369890_+|sulfate-adenylyltransferase-subunit-CysD
MDQIRLTHLRQLEAESIHIIREVAAEFSNPVMLYSIGKDSSVMLHLARKAFYPGTLPFPLLHVDTGWKFREMYEFRDRTAKAYGCELLVHKNPEGVAMGINPFVHGSAKHTDIMKTEGLKQALNKYGFDAAFGGARRDEEKSRAKERIYSFRDRFHRWDPKNQRPELWHNYNGQINKGESIRVFPLSNWTEQDIWQYIWLENIDIVPLYLAAERPVLERDGMLMMIDDNRIDLQPGEVIKKRMVRFRTLGCWPLTGAVESNAQTLPEIIEEMLVSTTSERQGRVIDRDQAGSMELKKRQGYF
>NZ_CP040886.1|WP_001090386.1|3369891_3371319_+|sulfate-adenylyltransferase-subunit-CysN
MNTALAQQIANEGGVEAWMIAQQHKSLLRFLTCGSVDDGKSTLIGRLLHDTRQIYEDQLSSLHNDSKRHGTQGEKLDLALLVDGLQAEREQGITIDVAYRYFSTEKRKFIIADTPGHEQYTRNMATGASTCELAILLIDARKGVLDQTRRHSFISTLLGIKHLVVAINKMDLVDYSEKTFTRIREDYLTFAGQLPGNLDIRFVPLSALEGDNVASQSESMAWYSGPTLLEVLETVEIQRVVDAQPMRFPVQYVNRPNLDFRGYAGTLASGRVEVGQRVKVLPSGVESNVARIVTFDGDREEAFAGEAITLVLTDEIDISRGDLLLAADEALPAVQSASVDVVWMAEQPLSPGQSYDIKIAGKKTRARVDGIRYQVDINNLTQREVENLPLNGIGLVDLTFDEPLVLDRYQQNPVTGGLIFIDRLSNVTVGAGMVHEPVSQATAAPSEFSAFELELNALVRRHFPHWGARDLLGDK
>NZ_CP040886.1|WP_001173673.1|3371318_3371924_+|adenylyl-sulfate-kinase
MALHDENVVWHSHPVTVQQRELHHGHRGVVLWFTGLSGSGKSTVAGALEEALHKLGVSTYLLDGDNVRHGLCSDLGFSDADRKENIRRVGEVANLMVEAGLVVLTAFISPHRAERQMVRERVGEGRFIEVFVDTPLAICEARDPKGLYKKARAGELRNFTGIDSVYEAPESAEIHLNGEQLVTNLVQQLLDLLRQNDIIRS
>NZ_CP040886.1|WP_001246104.1|3371973_3372297_+|DUF3561-family-protein
MRNSHNITLTNNDSLTEDEETTWSLPGAVVGFISWLFALAMPMLIYGSNTLFFFIYTWPFFLALMPVAVVVGIALHSLMDGKLRYSIVFTLVTVGIMFGALFMWLLG
>NZ_CP040886.1|WP_000517476.1|3372490_3372802_+|cell-division-protein-FtsB
MGKLTLLLLAILVWLQYSLWFGKNGIHDYTRVNDDVAAQQATNAKLKARNDQLFAEIDDLNGGQEALEERARNELSMTRPGETFYRLVPDASKRAQSAGQNNR
>NZ_CP040886.1|WP_000246138.1|3372820_3373531_+|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase
MATTHLDVCAVVPAAGFGRRMQTECPKQYLSIGNQTILEHSVHALLAHPRVKRVVIAISPGDSRFAQLPLANHPQITVVDGGDERADSVLAGLKAAGDAQWVLVHDAARPCLHQDDLARLLALSETSRTGGILAAPVRDTMKRAEPGKNAIAHTVDRNGLWHALTPQFFPRELLHDCLTRALNEGATITDEASALEYCGFHPQLVEGRADNIKVTRPEDLALAEFYLTRTIHQENT
>NZ_CP040886.1|WP_001374730.1|3373530_3374010_+|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase
MRIGHGFDVHAFGGEGPIIIGGVRIPYERGLLAHSDGDVALHALTDALLGAAALGDIGKLFPDTDPAFKGADSRELLREAWRRIQAKGYTLGNVDVTIIAQAPKMLPHIPQMRVFIAEDLGCHMDDVNVKATTTEKLGFTGRGEGIACEAVALLIKATK
>NZ_CP040886.1|WP_000568943.1|3374006_3375056_+|tRNA-pseudouridine(13)-synthase-TruD
MIEFDNLTYLHGKPQGTGLLKANPEDFVVVEDLGFEPDGEGEHILVRILKNGCNTRFVADALAKFLKIHAREVSFAGQKDKHAVTEQWLCARVPGKEMPDLSAFQLEGCQVLEYARHKRKLRLGALKGNAFTLVLREVSNRDDVEQRLIDICVKGVPNYFGAQRFGIGGSNLQGAQRWAQTNTPVRDRNKRSFWLSAARSALFNQIVAERLKKADVNQVVDGDALQLAGRGSWFVATTEELAELQRRVNDKELMITAALPGSGEWGTQREALAFEQAAVAAETELQALLVREKVEAARRAMLLYPQQLSWNWWDDVTVEIRFWLPAGSFATSVVRELINTTGDYAHIAE
>NZ_CP040886.1|WP_001374723.1|3375036_3375798_+|5'/3'-nucleotidase-SurE
MRILLSNDDGVHAPGIQTLAKALREFADVQVVAPDRNRSGASNSLTLESSLRTFTFENGDIAVQMGTPTDCVYLGVNALMRPRPDIVVSGINAGPNLGDDVIYSGTVAAAMEGRHLGFPALAVSLDGHKHYDTAAAVICSILRALCKEPLRTGRILNINVPDLPLDQIKGIRVTRCGTRHPADQVIPQQDPRGNTLYWIGPPGGKCDAGPGTDFAAVDEGYVSITPLHVDLTAHSAQDVVSDWLNSVGVGTQW

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_10

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_10

3759492-3759598

Orphan

Consensus_repeat	Method
ATTGTCCAACGGTTGTCCAACGGTTGTCCA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_10

>merge|NZ_CP040886|10|3759492-3759598|CRISPRCasFinder
TCAGGCAAAAAATTGTCCAACGGTTGTCCAACGGTTGTCCAACGCAAACACCAGTAATGGCGCGGCTCTCAGTGGAGATTGTCCAACGGTTGTCCAACGGTTGTCCA

>NZ_CP040886|10|9|3759492-3759598|CRISPRCasFinder
TCAGGCAAAAAATTGTCCAACGGTTGTCCA	ACGGTTGTCCAACGCAAACACCAGTAATGGCGCGGCTCTCAGTGGAG
ATTGTCCAACGGTTGTCCAACGGTTGTCCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_001515066.1\|3762313_3762520_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_060504015.1\|3762528_3762939_+\|recombination-protein-NinB	unknown	unknown	gnl\|CDD\|368607
NZ_CP040886.1\|WP_060504008.1\|3754686_3755394_-\|recombinase	unknown	unknown	gnl\|CDD\|227056
NZ_CP040886.1\|WP_060504019.1\|3764220_3764832_+\|recombination-protein-NinG	unknown	unknown	gnl\|CDD\|368603
NZ_CP040886.1\|WP_001609782.1\|3755995_3756307_-\|superinfection-exclusion-protein	unknown	unknown	gnl\|CDD\|107038
NZ_CP040886.1\|WP_000972063.1\|3755785_3755920_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|369704
NZ_CP040886.1\|WP_060504010.1\|3756929_3757229_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_060504012.1\|3762044_3762311_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_000950963.1\|3764051_3764228_+\|protein-ninF	unknown	unknown	gnl\|CDD\|283468
NZ_CP040886.1\|WP_000856967.1\|3757631_3758282_-\|LexA-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224885
NZ_CP040886.1\|WP_000796282.1\|3761509_3761836_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_000276886.1\|3758362_3758548_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|373126
NZ_CP040886.1\|WP_001177653.1\|3758656_3758935_+\|transcriptional-regulator	unknown	unknown	gnl\|CDD\|336083
NZ_CP040886.1\|WP_001243355.1\|3755648_3755801_-\|host-cell-division-inhibitory-peptide-Kil	unknown	unknown	gnl\|CDD\|310716
NZ_CP040886.1\|WP_000049638.1\|3761832_3762033_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_000167595.1\|3756450_3756921_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_060504017.1\|3763108_3764059_+\|DNA-cytosine-methyltransferase	unknown	unknown	gnl\|CDD\|223348
NZ_CP040886.1\|WP_001254255.1\|3762935_3763112_+\|NinE-family-protein	unknown	unknown	gnl\|CDD\|283078
NZ_CP040886.1\|WP_001549089.1\|3759997_3761434_+\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|274672
NZ_CP040886.1\|WP_024167014.1\|3754212_3754686_-\|single-stranded-DNA-binding-protein	unknown	unknown	gnl\|CDD\|236362

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_060504015.1\|3762528_3762939_+\|recombination-protein-NinB	gnl\|CDD\|368607	pfam05772, NinB, NinB protein. The ninR region of phage lambda contains two recombination genes, orf (ninB) and rap (ninG), that have roles when the RecF and RecBCD recombination pathways of E. coli, respectively, operate on phage lambda. NinB binds to single-stranded DNA.	7.78082e-60
NZ_CP040886.1\|WP_060504008.1\|3754686_3755394_-\|recombinase	gnl\|CDD\|227056	COG4712, COG4712, Uncharacterized protein conserved in bacteria [Function unknown].	6.74201e-42
NZ_CP040886.1\|WP_060504019.1\|3764220_3764832_+\|recombination-protein-NinG	gnl\|CDD\|368603	pfam05766, NinG, Bacteriophage Lambda NinG protein. NinG or Rap is involved in recombination. Rap (recombination adept with plasmid) increases lambda-by-plasmid recombination catalyzed by Escherichia coli's RecBCD pathway.	3.75325e-92
NZ_CP040886.1\|WP_001609782.1\|3755995_3756307_-\|superinfection-exclusion-protein	gnl\|CDD\|107038	PHA01516, PHA01516, hypothetical protein.	8.90026e-62
NZ_CP040886.1\|WP_000972063.1\|3755785_3755920_-\|hypothetical-protein	gnl\|CDD\|369704	pfam08134, cIII, cIII protein family. This family consists of the cIII family of regulatory proteins. The lambda CIII protein has 54 amino acids and it forms an amphipathic helix within its amino acid sequence. Lambda cIII stabilizes the lambda cII protein and the host sigma factor 32, responsible for transcribing genes of the heat shock regulon.	3.3109e-12
NZ_CP040886.1\|WP_001254255.1\|3762935_3763112_+\|NinE-family-protein	gnl\|CDD\|283078	pfam05322, NinE, NINE Protein. This family consists of NINE proteins from several bacteriophages and from E. coli.	2.29903e-23
NZ_CP040886.1\|WP_000950963.1\|3764051_3764228_+\|protein-ninF	gnl\|CDD\|283468	pfam05810, NinF, NinF protein. This family consists of several bacteriophage NinF proteins as well as related sequences from E. coli.	2.91109e-21
NZ_CP040886.1\|WP_000856967.1\|3757631_3758282_-\|LexA-family-transcriptional-regulator	gnl\|CDD\|224885	COG1974, LexA, SOS-response transcriptional repressors (RecA-mediated autopeptidases) [Transcription / Signal transduction mechanisms].	1.53208e-37
NZ_CP040886.1\|WP_000276886.1\|3758362_3758548_+\|hypothetical-protein	gnl\|CDD\|373126	pfam14549, P22_Cro, DNA-binding transcriptional regulator Cro. Bacteriophage P22 Cro protein represses genes normally expressed in early phage development and is necessary for the late stage of lytic growth. It does this by binding to the OL and OR operator-regions normally used by the repressor protein for lysogenic maintenance.	4.0721e-24
NZ_CP040886.1\|WP_001177653.1\|3758656_3758935_+\|transcriptional-regulator	gnl\|CDD\|336083	pfam05269, Phage_CII, Bacteriophage CII protein. This family consists of several phage CII regulatory proteins. CII plays a key role in the lysis-lysogeny decision in bacteriophage lambda and related phages.	1.23165e-37
NZ_CP040886.1\|WP_001243355.1\|3755648_3755801_-\|host-cell-division-inhibitory-peptide-Kil	gnl\|CDD\|310716	pfam06301, Lambda_Kil, Bacteriophage lambda Kil protein. This family consists of several Bacteriophage lambda Kil protein like sequences from both phages and bacteria. Induction of a lambda prophage causes the death of the host cell even in the absence of phage replication and lytic functions due to expression of the lambda kil gene.	2.78295e-13
NZ_CP040886.1\|WP_001549089.1\|3759997_3761434_+\|AAA-family-ATPase	gnl\|CDD\|274672	TIGR03600, phage_DnaB, phage replicative helicase, DnaB family, HK022 subfamily. Members of this family are phage (or prophage-region) homologs of the bacterial homohexameric replicative helicase DnaB. Some phage may rely on host DnaB, while others encode their own verions. This model describes the largest phage-specific clade among the close homologs of DnaB, but there are, or course, other DnaB homologs from phage that fall outside the scope of this model. [Mobile and extrachromosomal element functions, Prophage functions].	0
NZ_CP040886.1\|WP_060504017.1\|3763108_3764059_+\|DNA-cytosine-methyltransferase	gnl\|CDD\|223348	COG0270, Dcm, Site-specific DNA methylase [DNA replication, recombination, and repair].	7.13966e-22
NZ_CP040886.1\|WP_024167014.1\|3754212_3754686_-\|single-stranded-DNA-binding-protein	gnl\|CDD\|236362	PRK09010, PRK09010, single-stranded DNA-binding protein; Provisional.	2.22214e-76

>NZ_CP040886.1|WP_001177653.1|3758656_3758935_+|transcriptional-regulator
MQLTSTRKKANAITSNILNRIAVRGQRKVADALGINESQISRWKDSFIPKMGMLLAVLEWGVEDEELAELAKKVARMLTKEKAPKNGEFFEA
>NZ_CP040886.1|WP_000276886.1|3758362_3758548_+|hypothetical-protein
MYKKDVIDHFGTQRAVAKALGISDAAVSQWKEVIPEKDAYRLEVVTAGALKYQESAYRKAA
>NZ_CP040886.1|WP_000856967.1|3757631_3758282_-|LexA-family-transcriptional-regulator
MKTQLMGERIRARRKELKIRQAALGKMVGVSNVAISQWERSETEPNGENLLALANALKCSPDYLMKGEESLSNIAYHSRHDPRGSYPLISWVSAGCWMEAVEPYHKRAIDNWYDTTVDCSEDSFWLDVKGDSMTAPAGLSIPEGMIILVDPEVEPRNGKLVVAKLEGENEATFKKLVIDAGRKFLKPLNPQYPMIEINGNCKIIGVVVDAKLANLP
>NZ_CP040886.1|WP_060504010.1|3756929_3757229_-|hypothetical-protein
MTVVITYLADDNARNRRRARRQAQREQAMQEQRLARKIALKLSGCVRADKAASLVSLRCKKADEVERKQNRIYYRKPRSEMGVTCVGRQKMKLGSKPLI
>NZ_CP040886.1|WP_000167595.1|3756450_3756921_-|hypothetical-protein
MTKSWSVPFPESETEHDGMPVFWRFQATVEEDGIKIFALQYIAFHQTEHYAWLVPAHWIVNFKPAPNQWLQEWKQRRNRYAIKKVAKNAERSFAFPTKKLAIESLLRRKKYHLMRIKQDLAVVSTLVDGMKNIDTSTPDIEYNFGHNQETENWVFY
>NZ_CP040886.1|WP_001609782.1|3755995_3756307_-|superinfection-exclusion-protein
MKLRVWHIPQVPMKPFIAEVASVEEGVRLMDALADYDAFQYDNNIKPDYCNANGLEMWDESLTDEDLSEMGLTDRWVDWYSECQCYDDPRKYLESLKEETSAA
>NZ_CP040886.1|WP_000972063.1|3755785_3755920_-|hypothetical-protein
MMHFQLAGSGVMSAFYPHESELSRRVKQLIRAAKKQLEALCAMK
>NZ_CP040886.1|WP_001243355.1|3755648_3755801_-|host-cell-division-inhibitory-peptide-Kil
MRNEIAINHQMLRAAQNKAVIARFIGDSKMWLEANKAMKSAINLPWYRRK
>NZ_CP040886.1|WP_060504008.1|3754686_3755394_-|recombinase
MDLNKFDEPFSPEDIEWRIQQSGKTRDGKVWAMVLAYVTNRAIMKRLDDVCGKAGWRNEYRDIPNNGGVECGISIKIDSEWVTKWDAAENTQVEAVKGGRSGAMKRAAVQWGIGRYLYNLEEGFAQTSLDKKQGWHRAKLKDGTGFYWLPPSLPGWAIPASDNKPSPENTNQKSPSVDYEQILKDFSDFASKETDKKKLIERYQHDWQLMAGNEDAQAKCVQVMNIRVNELKQAA
>NZ_CP040886.1|WP_024167014.1|3754212_3754686_-|single-stranded-DNA-binding-protein
MASRGVNKVIIIGRLGHDPEIRYSPSGTAFANLTVATSEQWRDKQTGEQKEQTEWHRVVMSGKLAEIASEYLRKGSEVYLEGKLRTRKWQDQSGQDRFTTEVIVGVGGTMQMLGGKQGGNEQSSHQRNNGQQQRQQSQQQGNHSEPPMNFDDSDIPF
>NZ_CP040886.1|WP_001549089.1|3759997_3761434_+|AAA-family-ATPase
MTDNFYAPPHSIEAEQAVIGGLLLDDDSSERVQKVLAMLKPDSFYSRPHKILFEEITRMHREQKPVDGLTLFDELERKSLTASVGGFAYIAEIAKNTPSAANIVAYAMQVRETAMERYAINRMTEATELLYSRNGMTATQKYEAIQAIFTQLTDHAKTGSRRGLRSFGEVMEDWVSDLEKRFDPSGEQRGMSTGIPSLDRMLSPKGLVKGSLFVIGARPKMGKTTLYSQMAINCAVHEKKPALMFSLEMPGDQILEKLVGQKSGVNPNIFYLPATNDADDGYQGDYDGDFNRAIETANRLSEIDLLYIDDTPGLSLAQIVSESRRIKREKGCVGMILVDYLTLMTAEKADRNDLAYGMITKGLKNLAKELDCVVVLLTQLNRALESRTNKRPLPSDSRDTGQIEQDCDYWVGIHREGAFDDSVPPGETELILRLNRHGNTGTVYCIQANGAIYDTDQQSAEMRRREREEPQSKKKGGF
>NZ_CP040886.1|WP_000796282.1|3761509_3761836_+|hypothetical-protein
MADWQIPIIILAGASLVAGFILLKKHKDRDQKVEVLYGYPANSTTWLTIYHYRKSGRWVFEWDDLFAEKRPKSWGDISECMMFEERKSGATREEFNEAWARLSERGYL
>NZ_CP040886.1|WP_000049638.1|3761832_3762033_+|hypothetical-protein
MSKYEKLDQNILSMLSERPTPVFDIWLKWRSNGMYIETIDRRMQYLRKKGLVANVRGKGWVKINLS
>NZ_CP040886.1|WP_060504012.1|3762044_3762311_+|hypothetical-protein
MDESRKQFEEWFKNKYHVSSDVMKIMHIKVEIAWEAWQASRAAIEIELQKPKKGPLPGDYHIGYDSGAESQYESDVEAIRAAGVKVKE
>NZ_CP040886.1|WP_001515066.1|3762313_3762520_+|hypothetical-protein
MTNQQQIEFILEQIRKMREKNQPDMMEIWRRQQEEYRKHIFGERKQDDWSLYGYGTRTNKNGYSLYTY
>NZ_CP040886.1|WP_060504015.1|3762528_3762939_+|recombination-protein-NinB
MKQTIFLRSKQQQQAAINAILATPLDKDKPVTIRITDYKRNLDQNAKFHAMLADIASQVQWCGKWLKPEQWKVLLISGHAVATKQEADVLRGLEGEFVNIRESSAQMSVKRMASLIEYTTAWAIGQGVRFTDRRYE
>NZ_CP040886.1|WP_001254255.1|3762935_3763112_+|NinE-family-protein
MRRQRRSITDIICENCKYLPTKRSRNKRKPIPKESDVKTFNYTAHLWDIRWLRHRARK
>NZ_CP040886.1|WP_060504017.1|3763108_3764059_+|DNA-cytosine-methyltransferase
MTMTAYYNEIDPYAAQWLRNLIDAGEIAPGYVDERSIEDVTPGDLRGFTQHHFFAGIGVWSYALRKAGWPDNKSIWTGSCPCQPFSSAGKGKGVDDERHLWPAFFWLIEKCNPGIVIGEQVASADGLAWLDLVQTDLEGANYTSAGTDICAAGFGSPHIRQRLYWVAYSNDKYQLSARDTQGNSEPIWMRETSGMANSFSERCNRFNALLQRKRQERNPKNLLETSRDGEAMYPLPVNGFWRDADWLYCRDEKYRPVRPGSFPMVNGIAKSLGRGKSTLGRMAKRNQDQRIIGYGNAINAEVATAFVKVCMEVVNA
>NZ_CP040886.1|WP_000950963.1|3764051_3764228_+|protein-ninF
MLSPSQSLQYQKESVERALTCANCGQKLHVLEVHVCEHCCAELMSDPNSSMYEEEDDG
>NZ_CP040886.1|WP_060504019.1|3764220_3764832_+|recombination-protein-NinG
MAKPARRRCKNGECREWFHPAFANQWWCSPECGTKIALERRSKEREKAEKAAEKKLRREEQKQKDKLKIRKLALKPRSYWIKQAQQAVNAFIRERDRDLPCISCGTLTSAQWDAGHYRTTAAAPQLRFDERNIHKQCVVCNQHKSGNLVPYRVELISRIGQEAVDEIESNHNRHRWTIEECKAIKAEYQQKLKDLRNSRSEAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_11

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_11

3909722-3909839

Orphan

Consensus_repeat	Method
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_11

>merge|NZ_CP040886|11|3909722-3909839|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGCTGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAACCGAGCCGTAGGCCGGATAAGGCGTTTACGC

>NZ_CP040886|11|10|3909722-3909839|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	TGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAA
CCGAGCCGTAGGCCGGATAAGGCGTTTACGC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_001104488.1\|3927211_3928861_+\|DUF2300-domain-containing-protein	unknown	unknown	gnl\|CDD\|227732
NZ_CP040886.1\|WP_000135040.1\|3908240_3908495_-\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	unknown	unknown	gnl\|CDD\|182668
NZ_CP040886.1\|WP_000301049.1\|3907536_3908187_+\|lipopolysaccharide-kinase-InaA	unknown	unknown	gnl\|CDD\|182136
NZ_CP040886.1\|WP_001567753.1\|3928865_3929642_+\|YfaP-family-protein	unknown	unknown	gnl\|CDD\|227021
NZ_CP040886.1\|WP_122633159.1\|3922816_3927211_+\|alpha-2-macroglobulin-family-protein	unknown	unknown	gnl\|CDD\|225248
NZ_CP040886.1\|WP_000948732.1\|3902144_3903503_+\|glycerol-3-phosphate-transporter	unknown	unknown	gnl\|CDD\|236889
NZ_CP040886.1\|WP_001220074.1\|3912839_3916592_+\|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC	unknown	unknown	gnl\|CDD\|182059
NZ_CP040886.1\|WP_000857251.1\|3900243_3901872_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	unknown	unknown	gnl\|CDD\|236847
NZ_CP040886.1\|WP_000786548.1\|3929715_3930900_-\|acetyl-CoA-C-acetyltransferase	unknown	unknown	gnl\|CDD\|180261
NZ_CP040886.1\|WP_000332037.1\|3908494_3909625_-\|ribonucleotide-diphosphate-reductase-subunit-beta	unknown	unknown	gnl\|CDD\|181647
NZ_CP040886.1\|WP_001281225.1\|3917588_3920216_+\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	unknown	unknown	gnl\|CDD\|235502
NZ_CP040886.1\|WP_001075164.1\|3909858_3912144_-\|ribonucleoside-diphosphate-reductase-subunit-alpha	unknown	unknown	gnl\|CDD\|181649
NZ_CP040886.1\|WP_000990756.1\|3916719_3917442_-\|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG	unknown	unknown	gnl\|CDD\|235350
NZ_CP040886.1\|WP_001209908.1\|3898994_3900254_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	unknown	unknown	gnl\|CDD\|225617
NZ_CP040886.1\|WP_001374259.1\|3896715_3897615_-\|ISNCY-family-transposase	unknown	unknown	gnl\|CDD\|182167
NZ_CP040886.1\|WP_001000370.1\|3897807_3898998_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	unknown	unknown	gnl\|CDD\|132422
NZ_CP040886.1\|WP_072163405.1\|3904802_3905117_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040886.1\|WP_001295211.1\|3922049_3922673_+\|DUF1175-domain-containing-protein	unknown	unknown	gnl\|CDD\|225774
NZ_CP040886.1\|WP_000012305.1\|3920364_3922053_+\|DUF2138-domain-containing-protein	unknown	unknown	gnl\|CDD\|227030
NZ_CP040886.1\|WP_000768974.1\|3903507_3904584_+\|glycerophosphodiester-phosphodiesterase	unknown	unknown	gnl\|CDD\|236859

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_001104488.1\|3927211_3928861_+\|DUF2300-domain-containing-protein	gnl\|CDD\|227732	COG5445, COG5445, Predicted secreted protein [Function unknown].	2.06112e-125
NZ_CP040886.1\|WP_000135040.1\|3908240_3908495_-\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	gnl\|CDD\|182668	PRK10713, PRK10713, 2Fe-2S ferredoxin-like protein.	2.72138e-53
NZ_CP040886.1\|WP_000301049.1\|3907536_3908187_+\|lipopolysaccharide-kinase-InaA	gnl\|CDD\|182136	PRK09902, PRK09902, lipopolysaccharide kinase InaA.	1.43283e-158
NZ_CP040886.1\|WP_001567753.1\|3928865_3929642_+\|YfaP-family-protein	gnl\|CDD\|227021	COG4676, COG4676, Uncharacterized protein conserved in bacteria [Function unknown].	1.0163e-152
NZ_CP040886.1\|WP_122633159.1\|3922816_3927211_+\|alpha-2-macroglobulin-family-protein	gnl\|CDD\|225248	COG2373, COG2373, Large extracellular alpha-helical protein [General function prediction only].	0
NZ_CP040886.1\|WP_000948732.1\|3902144_3903503_+\|glycerol-3-phosphate-transporter	gnl\|CDD\|236889	PRK11273, glpT, glycerol-3-phosphate transporter.	0
NZ_CP040886.1\|WP_001220074.1\|3912839_3916592_+\|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC	gnl\|CDD\|182059	PRK09752, PRK09752, AIDA-I family autotransporter YfaL.	0
NZ_CP040886.1\|WP_000857251.1\|3900243_3901872_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	gnl\|CDD\|236847	PRK11101, glpA, anaerobic glycerol-3-phosphate dehydrogenase subunit A.	0
NZ_CP040886.1\|WP_000786548.1\|3929715_3930900_-\|acetyl-CoA-C-acetyltransferase	gnl\|CDD\|180261	PRK05790, PRK05790, putative acyltransferase; Provisional.	0
NZ_CP040886.1\|WP_000332037.1\|3908494_3909625_-\|ribonucleotide-diphosphate-reductase-subunit-beta	gnl\|CDD\|181647	PRK09101, nrdB, ribonucleotide-diphosphate reductase subunit beta; Reviewed.	0
NZ_CP040886.1\|WP_001281225.1\|3917588_3920216_+\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	gnl\|CDD\|235502	PRK05560, PRK05560, DNA gyrase subunit A; Validated.	0
NZ_CP040886.1\|WP_001075164.1\|3909858_3912144_-\|ribonucleoside-diphosphate-reductase-subunit-alpha	gnl\|CDD\|181649	PRK09103, PRK09103, ribonucleoside-diphosphate reductase subunit alpha.	0
NZ_CP040886.1\|WP_000990756.1\|3916719_3917442_-\|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG	gnl\|CDD\|235350	PRK05134, PRK05134, bifunctional 2-polyprenyl-6-hydroxyphenol methylase/3-demethylubiquinol 3-O-methyltransferase UbiG.	9.80223e-171
NZ_CP040886.1\|WP_001209908.1\|3898994_3900254_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	gnl\|CDD\|225617	COG3075, GlpB, Anaerobic glycerol-3-phosphate dehydrogenase [Amino acid transport and metabolism].	0
NZ_CP040886.1\|WP_001374259.1\|3896715_3897615_-\|ISNCY-family-transposase	gnl\|CDD\|182167	PRK09956, PRK09956, ISNCY family transposase.	0
NZ_CP040886.1\|WP_001000370.1\|3897807_3898998_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	gnl\|CDD\|132422	TIGR03379, glycerol3P_GlpC, glycerol-3-phosphate dehydrogenase, anaerobic, C subunit. Members of this protein family are the membrane-anchoring, non-catalytic C subunit, product of the glpC gene, of a three-subunit, FAD-dependent, anaerobic glycerol-3-phosphate dehydrogenase. GlpC lasks classical hydrophobic transmembrane helices; Cole, et al suggest interaction with the membrane may involve amphipathic helices. GlcC has conserved Cys-containing motifs suggestive of iron-sulfur binding. This complex is found mostly in Escherichia coli and closely related species. [Energy metabolism, Anaerobic].	0
NZ_CP040886.1\|WP_001295211.1\|3922049_3922673_+\|DUF1175-domain-containing-protein	gnl\|CDD\|225774	COG3234, COG3234, Uncharacterized protein conserved in bacteria [Function unknown].	7.99004e-141
NZ_CP040886.1\|WP_000012305.1\|3920364_3922053_+\|DUF2138-domain-containing-protein	gnl\|CDD\|227030	COG4685, COG4685, Uncharacterized protein conserved in bacteria [Function unknown].	0
NZ_CP040886.1\|WP_000768974.1\|3903507_3904584_+\|glycerophosphodiester-phosphodiesterase	gnl\|CDD\|236859	PRK11143, glpQ, glycerophosphodiester phosphodiesterase; Provisional.	0

>NZ_CP040886.1|WP_000332037.1|3908494_3909625_-|ribonucleotide-diphosphate-reductase-subunit-beta
MAYTTFSQTKNDQLKEPMFFGQPVNVARYDQQKYDIFEKLIEKQLSFFWRPEEVDVSRDRIDYQALPEHEKHIFISNLKYQTLLDSIQGRSPNVALLPLISIPELETWVETWAFSETIHSRSYTHIIRNIVNDPSVVFDDIVTNEQIQKRAEGISSYYDELIEMTSYWHLLGEGTHTVNGKTVTVSLRELKKKLYLCLMSVNALEAIRFYVSFACSFAFAERELMEGNAKIIRLIARDEALHLTGTQHMLNLLRSGADDPEMAEIAEECKQECYDLFVQAAQQEKDWADYLFRDGSMIGLNKDILCQYVEYITNIRMQAVGLDLPFQTRSNPIPWINTWLVSDNVQVAPQEVEVSSYLVGQIDSEVDTDDLSNFQL
>NZ_CP040886.1|WP_000135040.1|3908240_3908495_-|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE
MARVTLRITGTQLLCQDEHPSLLAALESHNVAVEYQCREGYCGSCRTRLVAGQVDWIAEPLAFIQPGEILPCCCRAKGDIEIEM
>NZ_CP040886.1|WP_000301049.1|3907536_3908187_+|lipopolysaccharide-kinase-InaA
MAVSAKYDEFNHWWATEGDWVEEPNYRRNGMSGVQCVERNGKKLYVKRMTHHLFHSVRYPFGRPTIVREVAVIKELERAGVIVPKIVFGEAVKIEGEWRALLVTEDMAGFISIADWYAQHAVSPYSDEVRQAMLKAVALAFKKMHSINRQHGCCYVRHIYVKTEGKAEAGFLDLEKSRRRLRRDKAINHDFRQLEKYLEPIPKADWEQVKAYYYAM
>NZ_CP040886.1|WP_072163405.1|3904802_3905117_-|hypothetical-protein
MTNKLGGELIDIADKKLAPLINDSFSYTRDFFAYSKQENNIFTFDNSKFVDPKEKEGLMIQHSNGQLVITGKYCPEGVQTAFTQEQYDKLIRYINIFFTFPKCE
>NZ_CP040886.1|WP_000768974.1|3903507_3904584_+|glycerophosphodiester-phosphodiesterase
MKLKLKNLSMAIMMSTIVMGSSAMAADSNEKIVIAHRGASGYLPEHTLPAKAMAYAQGADYLEQDLVMTKDDHLVVLHDHYLDRVTDVADRFPDRARKDGRYYAIDFTLDEIKSLKFTEGFDIENGKKVQTYPGRFPMGKSDFRVHTFEEEIEFVQGLNHSTGKNIGIYPEIKAPWFHHQEGKDIAAKTLEVLKKYGYTGKDDKVYLQCFDADELKRIKNELEPKMGMDLNLVQLIAYTDWNETQQKQPDGSWVNYSYDWMFKPGAMKQVAEYADGIGPDYHMLIEETSQPGNIKLTGMVQDAQQNKLVVHPYTVRSDKLPEYTTDVNQLYDVLYNKAGVNGLFTDFPDKAVKFLNKE
>NZ_CP040886.1|WP_000948732.1|3902144_3903503_+|glycerol-3-phosphate-transporter
MLSIFKPAPHKARLPAAEIDPTYRRLRWQIFLGIFFGYAAYYLVRKNFALAMPYLVEQGFSRGDLGFALSGISIAYGFSKFIMGSVSDRSNPRVFLPAGLILAAAVMLFMGFVPWATSSIAVMFVLLFLCGWFQGMGWPPCGRTMVHWWSQKERGGIVSVWNCAHNVGGGIPPLLFLLGMAWFNDWHAALYMPAFCAILVALFAFAMMRDTPQSCGLPPIEEYKNDYPDDYNEKAEQELTAKQIFMQYVLPNKLLWYIAIANVFVYLLRYGILDWSPTYLKEVKHFALDKSSWAYFLYEYAGIPGTLLCGWMSDKVFRGNRGATGVFFMTLVTIATIVYWMNPAGNPTVDMICMIVIGFLIYGPVMLIGLHALELAPKKAAGTAAGFTGLFGYLGGSVAASAIVGYTVDFFGWDGGFMVMIGGSILAVILLIVVMIGEKRRHEQLLQKRNGG
>NZ_CP040886.1|WP_000857251.1|3900243_3901872_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A
MKTRDSQSSDVIIIGGGATGAGIARDCALRGLRVILVERHDIATGATGRNHGLLHSGARYAVTDAESARECISENQILKRIARHCVEPTNGLFITLPEDDLSFQATFIRACEEAGISAEAIDPQQARIIEPAVNPALIGAVKVPDGTVDPFRLTAANMLDAKEHGAVILTAHEVTGLIREGATVCGVRVRNHLTGETQALHAPVVVNAAGIWGQHIAEYADLRIRMFPAKGSLLIMDHRINQHVINRCRKPSDADILVPGDTISLIGTTSLRIDYNEIDDNRVTAEEVDILLREGEKLAPVMAKTRILRAYSGVRPLVASDDDPSGRNVSRGIVLLDHAERDGLDGFITITGGKLMTYRLMAEWATDAVCRKLGNTRPCTTADLALPGSQDPAEVTLRKVISLPAPLRGSAVYRHGDRTPAWLSEGRLHRSLVCECEAVTAGEVQYAVENLNVNSLLDLRRRTRVGMGTCQGELCACRAAGLLQRFNVTTSAQSIEQLSTFLNERWKGVQPIAWGDALRESEFTRWVYQGLCGLEKEQKDAL
>NZ_CP040886.1|WP_001209908.1|3898994_3900254_-|glycerol-3-phosphate-dehydrogenase-subunit-GlpB
MRFDTVIMGGGLAGLLCGLQLQKHGLRCAIVTRGQSALHFSSGSLDLLSHLPDGQPVADIHSGLESLRQQAPAHPYSLLGPQRVLDLACQAQALIAESGAQLQGSVELAHQRITPLGTLRSTWLSSPEVPVWPLPAKKICVVGISGLMDFQAHLAAASLRELDLSVETAEIELPELDVLRNNATEFRAVNIARFLDNEENWPLLLDALIPVANTCEMILMPACFGLADDKLWRWLNEKLPCSLMLLPTLPPSVLGIRLQNQLQRQFVRQGGVWMPGDEVKKVTCKNGVVNEIWTRNHADIPLRPRFAVLASGSFFSGGLVAERNGIREPILGLDVLQTATRGEWYKGDFFAPQPWQQFGVTTDETLRPSQAGQTIENLFAIGSVLGGFDPIAQGCGGGVCAVSALHAAQQIAQRAGGQQ
>NZ_CP040886.1|WP_001000370.1|3897807_3898998_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C
MNDTSFENCIKCTVCTTACPVSRVNPGYPGPKQAGPDGERLRLKDGALYDEALKYCINCKRCEVACPSDVKIGDIIQRARAKYDTTRPSLRNFVLSHTDLMGSVSTPFAPIVNTATSLKPVRQLLDAALKIDHRRTLPKYSFGTFRRWYRSVAAQQAQYKDQVAFFHGCFVNYNHPQLGKDLIKVLNAMGTGVQLLSKEKCCGVPLIANGFTAKARKQAITNVESIREAVGVKGIPVIATSSTCTFALRDEYPEVLNVDNKGLRDHIELATRWLWRKLDEGKTLPLKPLPLKVVYHTPCHMEKMGWTLYTLELLRKIPGLELTVLDSQCCGIAGTYGFKKENYPTSQAIGAPLFRQIEESGADLVVTDCETCKWQIEMSTSLRCEHPITLLAQALA
>NZ_CP040886.1|WP_001374259.1|3896715_3897615_-|ISNCY-family-transposase
MTESTTSSPHDAVFKTFMFTPETARDFLEIHLPEPLRKLCNLQTLRLEPTSFIEKSLRAYYSDVLWSVETSDGDGYIYCVIEHQSSAEKNMAFRLMRYATAAMQRHLDKGYDRVPLVVPLLFYHGETSPYPYSLNWLDEFDDPQLARQLYTEAFPLVDITIVPDDEIMQHRRIALLELIQKHIRDRDLIGMVDRITTLLVKGFTNDSQLQTLFNYLLQCGDTSRFTRFIEEIAKRSPLQKERLMTIAERLRQEGHQIGWQEGMHEQAIKIALRMLEQGFEREIVLATTQLTDADIPNCH
>NZ_CP040886.1|WP_001075164.1|3909858_3912144_-|ribonucleoside-diphosphate-reductase-subunit-alpha
MNQNLLVTKRDGSTERINLDKIHRVLDWAAEGLHNVSISQVELRSHIQFYDGIKTSDIHETIIKAAADLISRDAPDYQYLAARLAIFHLRKKAYGQFEPPALYDHVVKMVEMGKYDNHLLEDYTEEEFKQMDTFIDHDRDMTFSYAAVKQLEGKYLVQNRVTGEIYESAQFLYILVAACLFSNYPRETRLQYVKRFYDAVSTFKISLPTPIMSGVRTPTRQFSSCVLIECGDSLDSINATSSAIVKYVSQRAGIGINAGRIRALGSPIRGGEAFHTGCIPFYKHFQTAVKSCSQGGVRGGAATLFYPMWHLEVESLLVLKNNRGVEGNRVRHMDYGVQINKLMYTRLLKGEDITLFSPSDVPGLYDAFFADQEEFERLYTKYEKDDSIRKQRVKAVELFSLMMQERASTGRIYIQNVDHCNTHSPFDPAIAPVRQSNLCLEIALPTKPLNDVNDENGEIALCTLSAFNLGAINNLDELEELAILAVRALDALLDYQDYPIPAAKRGAMGRRTLGIGVINFAYYLAKHGKRYSDGSANNLTHKTFEAIQYYLLKASNELAKEQGACPWFNETTYAKGILPIDTYKKDLDTIANEPLHYDWEALRESIKTHGLRNSTLSALMPSETSSQISNATNGIEPPRGYVSIKASKDGILRQVVPDYEHLHDAYELLWEMPGNDGYLQLVGIMQKFIDQSISANTNYDPSRFPSGKVPMQQLLKDLLTAYKFGVKTLYYQNTRDGAEDAQDDLVPSIQDDGCESGACKI
>NZ_CP040886.1|WP_001220074.1|3912839_3916592_+|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC
MRIIFLRKEYLSLLPSMIASLFSANGVAAVTDSCQGYDVKASCQASRQSLSGITQDWSIADGQWLVFSDMTNNASGGAVFLQQGAEFSLLPENETGMTLFANNTVTGEYNNGGAIFAKENSTLNLTDVIFSGNVAGGYGGAIYSSGTNDTGAVDLRVTNAMFRNNIANDGKGGAIYTINNDVYLSDVIFDNNQAYTSTSYSDGDGGAIDVTDNNSDSKHPSGYTIVNNTAFTNNTAEGYGGAIYTNSVTAPYLIDISVDDSYSQNGGVLVDENNSAAGYGDGPSSAAGGFMYLGLSEVTFDIADGKTLVIGNTENDGAVDSIAGTGLITKTGSGDLVLNADNNDFTGEMQIENGEVTLGRSNSLMNVGDTHCQDDPQDCYGLTIGSIDQYQNQAELNVGSTQQTFVHALTGFQNGTLNIDAGGNVTVNQGSFAGIIEGAGQLTIAQNGSYVLAGAQSMALTGDIVVDDGAVLSLEGDAADLTALQDDPQSIVLNGGVLDLSDFSTWQSGTSYNDGLEVSGSSGTVIGSQDVVDLAGGDNLHIGGDGKDGVYVVVDASDGQVSLANNNSYLGTTQIASGTLMVSDNSQLGDTHYNRQVIFTDKQQESVMEITSDVDTRSDAAGHGRDIEMRADGEVAVDAGVDTQWGALMADSSGQHQDEGSTLTKTGAGTLELTASGTTQSAVRVEEGTLKGDVADILPYASSLWVGDGATFVTGADQDIQSIDAISSGTIDISDGTVLRLTGQDTSVALNASLFNGDGTLVNATDGVTLTGELNTNLETDSLTYLSNVTVNGNLTNTSGAVSLQNGVAGDTLTVNGDYTGGGTLLLDSELNGDDSVSDQLVMNGNTAGNTTVVVNSITGIGEPTSTGIKMVDFAADPTQFQNNAQFSLAGSGYVNMGAYDYTLVEDNNDWYLRSQEVTPPSPPDPDPTPDPDPTPDPDPTPDPEPTPAYQPVLNAKVGGYLNNLRAANQAFMMERRDHAGGDGQTLNLRVIGGDYHYTAAGQLAQHEDTSTVQLSGDLFSGRWGTDGEWMLGIVGGYSDNQGDSRSNMTGTRADNQNHGYAVGLTSSWFQHGNQKQGAWLDSWLQYAWFSNDVSEQEDGTDHYHSSGIIASLEAGYQWLPGRGVVIEPQAQVIYQGVQQDDFTAANRARVSQSQGDDIQTRLGLHSEWRTAVHVIPTLDLNYYHDPHSTEIEEDGSTISDDAVKQRGEIKVGVTGNISQRVSLRGSVAWQKGSDDFAQTAGFLSMTVKW
>NZ_CP040886.1|WP_000990756.1|3916719_3917442_-|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG
MNAEKSPENHNVDHEEIAKFEAVASRWWDLEGEFKPLHRINPLRLGYIAERAGGLFGKKVLDVGCGGGILAESMAREGATVTGLDMGFEPLQVAKLHALESGIQVDYVQETVEKHAAKHAGQYDVVTCMEMLEHVPDPQSVVRACAQLVKPGGDVFFSTLNRNGKSWLMAVVGAEYILRMVPKGTHDVKKFIKPAELLGWVDQTSLKERHITGLHYNPITNSFKLGPGVDVNYMLHTQNK
>NZ_CP040886.1|WP_001281225.1|3917588_3920216_+|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A
MSDLAREITPVNIEEELKSSYLDYAMSVIVGRALPDVRDGLKPVHRRVLYAMNVLGNDWNKAYKKSARVVGDVIGKYHPHGDLAVYNTIVRMAQPFSLRYMLVDGQGNFGSIDGDSAAAMRYTEIRLAKIAHELMADLEKETVDFVDNYDGTEKIPDVMPTKIPNLLVNGSSGIAVGMATNIPPHNLTEVINGCLAYIDDEDISIEGLMEHIPGPDFPTAAIINGRRGIEEAYRTGRGKVYIRARAEVEVDAKTGRETIIVHEIPYQVNKARLIEKIAELVKEKRVEGISALRDESDKDGMRIVIEVKRDAVGEVVLNNLYSQTQLQVSFGINMVALHHGQPKIMNLKDIIAAFVRHRREVVTRRTIFELRKARDRAHILEALAVALANIDPIIELIRHAPTPAEAKTALVANPWQLGNVAAMLERAGDDAARPEWLEPEFGVRDGLYYLTEQQAQAILDLRLQKLTGLEHEKLLDEYKELLDQIAELLRILGSADRLMEVIREELELVREQFGDKRRTEITANSADINLEDLITQEDVVVTLSHQGYVKYQPLSEYEAQRRGGKGKSAARIKEEDFIDRLLVANTHDHILCFSSRGRVYSMKVYQLPEATRGARGRPIVNLLPLEQDERITAILPVTEFEEGVKVFMATANGTVKKTVLTEFNRLRTAGKVAIKLVDGDELIGVDLTSGEDEVMLFSAEGKVVRFKESSVRAMGCNTTGVRGIRLGEGDKVVSLIVPRGDGAILTATQNGYGKRTAVAEYPTKSRATKGVISIKVTERNGLVVGAVQVDDCDQIMMITDAGTLVRTRVSEISIVGRNTQGVILIRTAEDENVVGLQRVAEPVDEEDLDTIDGSAAEGDDEIAPEVDVDDEPEEE
>NZ_CP040886.1|WP_000012305.1|3920364_3922053_+|DUF2138-domain-containing-protein
MSGEKKAKGWRFYGLVGFGAIALLSAGVWALQYAGSGPEKTLSPLVVHNNLQIDLNEPDLFLDSDSLSQLPKDLLTIPFLHDVLSEDFVFYYQNHADRLGIEGSIRRIVYEHDLTLKDKLFSSLLDQPAQAALWHDKQGHLSHYMVLIQRSGLSKLLEPLLFAATSDSQLSKTEISSIKINSETVPVYQLRYNGNNALMFATYQDKMLVFSSTDMLFKDDQQDTEATAIAGDLLSGKKRWQASFGLEERTAEKTPVRQRIVVSARWLGFGYQRLMPSFAGVRFEMGNDGWHSFVALNDESASVDASFDFTPVWNSMPAGASFCVAVPYSHGIAEEMLSHISQENDKLNGALDGAAGLCWYEDSKLQTPLFVGQFDGTAEQAQLPGKLFTQNIGAHESKAPEGVLPVSQTQQGEAQIWRREVSSRYGQYPKAQAAQPDQLMSDYFFRVSLAMQNKTLLFSLDDTLVNNALQTLNKTRPAMVDVIPTDGIVPLYINPQGIAKLLRNETLTSLPKNLEPVFYNAAQTLLMPKLDALSQQPRYVMKLAQMEPGAAWQWLPITWQPL
>NZ_CP040886.1|WP_001295211.1|3922049_3922673_+|DUF1175-domain-containing-protein
MRHGLLALICWLCCVVAHSEMLNVEQSGLFRAWFVRIAQEQLRQGPSPRWYQQDCAGLVRFAANETLKVHDSKWLKSNGLSSQYLPPEMTLTPEQRQLAQNWNQGNGKTGPYVTAINLIQYNSQFIGQDINQALPGDMIFFDQGDAQHLMVWMGRYVIYHTGSATKTDNGMRAVSLQQLMTWKDTRWIPNDSNPNFIGIYRLNFLAR
>NZ_CP040886.1|WP_122633159.1|3922816_3927211_+|alpha-2-macroglobulin-family-protein
MRLEAPGRDYRRYQMEEYGGVDVRLYRIPDPMAFLRQQKNLHRIVVQPQYLGDGLNNTLTWLWDNWYGKSRRVMQRTFSSQSRQNVTQALPELQLGNAIIKPSRYVQNNQFSPLKKYPLVEQFRYPLWQAKPFEPQQGVKLEGASSNFISPQPGNIYIPLGQQEPGLYLVEAMVGGYRATTVVFVSDTVALSKVSGNELLVWTAGKKQGEAKPGSEILWTDGLGVMTRGVTDDSGTLQLQHISPERSYILGKDAEGGVFVSENFFYESEIYNTRLYIFTDRPLYRAGDRVDVKVMGREFHDPLHSSPIVSAPAKLSVLDANGSLLQTVDVTLDARNGGQGSFRLPENAVAGGYELRLAYRNQVYSSSFRVANYIKPHFEIGLALAKKEFKTGEAVSGKLQLLYPDGEPVKNARVQLSLRAQQLSMVGNDLRYAGRFPVSLEGSETVSDASGHVALNLPAADKPSRYLLTVSASDGAAYRVTTTKEILIERGLAHYSLSTAAQYSNSGESVVFRYAALESSKQVPVTYEWLRLEDRTSHSGELPSGGKSFTVNFAKPGNYNLTLRDKDGLILAGLSHAVSGKGSTAHTGTVDIVADKTLYQPGETAKMLITFPEPIDEALLTLERDRVEQQSLLSHPANWLTLQRLNDTQYEARVPVSNSFAPNITFSVLYTRNGQYSFQNAGIKVAVPQLDIRVKTDKTHYQPGELVNVELTSSLKGKPVSAQLTVGVVDEMIYALQPEIAPNIGKFFYPLGRNNVRTSSSLSFISYDQALSSEPVAPGATNRSERRVKMLERPRREEVDTAAWMPSLTTDKQGKAYFTFLMPDSLTRWRITARGMNGDGLVGQGRAYLRSEKNLYMKWSMPTVYRVGDKPAAGLFIFSQQDNEPVALVTKFAGAEMRQTLTLHKGANYISLTQNIQQSGLLSAELQQNGQVQDSISTKLSFVDNSWPVEQQKNVMLGGGDNALMLPEQASNIRLQSSETPQEIFRNNLDALVDEPWGGVINTGSRLIPLSLAWRSLADHQSAAANDIRQMIQVNRLRLMQLAGPGARFTWWGEDGNGDAFLTAWAWYADWQASQAIGVTQQPEYWQHMLDSYAEQADNMPLLHRALVLAWAQEMNLPCKTLLKGLDEAIARRGTKTEDFSEEDTRDINDSLILDTPESPLADAVANVLTMTLLKKAQLKSTVMPQVQQYAWDKAANSNQPLAHTVVLLNSGGDATQAAAILSGLTAEQSTIERALAMNWLAKYMATMPPVVLPAPAGAWAKHKLTGGGEYWRWVGQGVPDILSFGDELSPQNVQVRWREPAKTAQQSNIPVTVERQLYRLITGEEEMSFTLQPVTSNEIDSDALYLDEITLTSEQDAVLRYGQVEVPLPPGADVERTTWGISVNKPNAAKQQGQLLEIARNEMGELAYMVPVKELTGTVTFRHLLRFSQKGQFVLPPARYMRSYAPAQQSVAAGSEWTRMQVK
>NZ_CP040886.1|WP_001104488.1|3927211_3928861_+|DUF2300-domain-containing-protein
MNWRRIVWLLALVTLPTLAEEPPLQLALRGAQHDQLYKLSSSGVTNVSTLPDTLTTPLGSLWKLYVYAWLEDTHQPEQPYQCRGNSPEEVYCCQAGESITRDTALVRSCGLYFAPQRLHIGADVWGQYWQQRQAPAWLASLTTLKPETSVTVKSLLDSLATLPAQNKAQEVLLDVVLDEAKIGVASMLGSRVRVKTWSWFADDKQEIRQGGFAGWLTDGTPLWVTGSGTSKTVLTRYATVLNRVLPVPTQVASGQCVEVELFARYPLKKITAEKSTTAVKPGVLNGRYRVTFTNGNHITFVSHGETTLLSEKGKLKLQSHLDREEYVARVLDREAKSTPPEAAKAMTVAIRTFLQQNANREGDCLTIPDSSATQRVSASPATTGARTMAAWTQDLIYAGDPVHYHGSRATEGTLSWRQATAQAGQGERYDQILAFAYPDNSLSRWGAPRSTCQLLPKAKAWLAKKMPQWRRILQAETGYNEPDVFAVCRLVSGFPYTDRQQKRLFIRNFFTLQDRLDLTHEYLHLAFDGYPTGLDENYIETLTRQLLMD
>NZ_CP040886.1|WP_001567753.1|3928865_3929642_+|YfaP-family-protein
MRKIFLPLLLVALSPVAHSEGVQEVEIDAPLSGWHPVEGEDASFSQSINYPASSVNMADDQNISAQIRGKIKNYAAAGKVQQGRLVVNGASMPQRIESDGSFARPYIFTEGSNSVQVISPDGQSRQKMQFYSTPGTGTIRARLRLVLSWDTDNTDLDLHVVTPDGEHAWYGNTVLKNSGALDMDVTTGYGPEIFAMPAPVHGRYQVYINYYGGRSETELTTAQLTLITDEGSVNEKQETFIVPMRNAGELTLVKSFDW
>NZ_CP040886.1|WP_000786548.1|3929715_3930900_-|acetyl-CoA-C-acetyltransferase
MKNCVIVSAVRTAIGSFNGSLASTSAIDLGATVIKAAIERAKIDSQHVDEVIMGNVLQAGLGQNPARQALLKSGLAETVCGFTVNKVCGSGLKSVALAAQAIQAGQAQSIVAGGMENMSLAPYLLDAKARSGYRLGDGQVYDVILRDGLMCATHGYHMGITAENVAKEYGITREMQDELALHSQRKAAAAIESGAFTAEIVPVNVVTRKKTFVFSQDEFPKANSTAEALGALRPAFDKAGTVTAGNASGINDGAAALVIMEESAALAAGLTPLARIKSYASGGVPPALMGMGPVPATQKALQLAGLQLADIDLIEANEAFAAQFLAVGKTLGFDPEKVNVNGGAIALGHPIGASGARILVTLLHAMQARDKTLGLATLCIGGGQGIAMVIERLN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040886_12

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040886_12

4600781-4600904

Orphan

Consensus_repeat	Method
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040886_12

>merge|NZ_CP040886|12|4600781-4600904|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTACGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAACGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

>NZ_CP040886|12|11|4600781-4600904|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAA
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040886.1\|WP_000701040.1\|4610055_4611225_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|225371
NZ_CP040886.1\|WP_001070230.1\|4592868_4593495_+\|ferredoxin-like-protein	unknown	unknown	gnl\|CDD\|182135
NZ_CP040886.1\|WP_000528342.1\|4592203_4592413_+\|fumarate-hydratase-FumD	unknown	unknown	gnl\|CDD\|182359
NZ_CP040886.1\|WP_001174942.1\|4602515_4603889_-\|multidrug-efflux-MATE-transporter-MdtK	unknown	unknown	gnl\|CDD\|234981
NZ_CP040886.1\|WP_000269501.1\|4607547_4608480_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|182948
NZ_CP040886.1\|WP_000102278.1\|4609800_4609890_+\|stress-response-protein-YnhF	unknown	unknown	unknown
NZ_CP040886.1\|WP_001678907.1\|4593515_4595618_+\|aldehyde-ferredoxin-oxidoreductase	unknown	unknown	gnl\|CDD\|236629
NZ_CP040886.1\|WP_000190982.1\|4608476_4609502_-\|HTH-type-transcriptional-repressor-PurR	unknown	unknown	gnl\|CDD\|236739
NZ_CP040886.1\|WP_000504352.1\|4595621_4596269_+\|YdhW-family-putative-oxidoreductase-system-protein	unknown	unknown	gnl\|CDD\|182160
NZ_CP040886.1\|WP_060503957.1\|4604784_4605933_-\|cyclopropane-fatty-acyl-phospholipid-synthase	unknown	unknown	gnl\|CDD\|183282
NZ_CP040886.1\|WP_000007283.1\|4611370_4611952_-\|superoxide-dismutase-[Fe]	unknown	unknown	gnl\|CDD\|182534
NZ_CP040886.1\|WP_001295403.1\|4590235_4591648_-\|pyruvate-kinase-PykF	unknown	unknown	gnl\|CDD\|181699
NZ_CP040886.1\|WP_001310861.1\|4596332_4597001_+\|4Fe-4S-dicluster-domain-containing-protein	unknown	unknown	gnl\|CDD\|274451
NZ_CP040886.1\|WP_001069997.1\|4596997_4597783_+\|thiosulfate-reductase-cytochrome-B-subunit	unknown	unknown	gnl\|CDD\|184968
NZ_CP040886.1\|WP_001373655.1\|4604103_4604745_+\|riboflavin-synthase	unknown	unknown	gnl\|CDD\|183846
NZ_CP040886.1\|WP_000587555.1\|4597786_4598599_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182159
NZ_CP040886.1\|WP_001182363.1\|4606223_4607435_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	unknown	unknown	gnl\|CDD\|182924
NZ_CP040886.1\|WP_000716929.1\|4598610_4600215_-\|FAD-NAD(P)-binding-protein	unknown	unknown	gnl\|CDD\|182134
NZ_CP040886.1\|WP_000534291.1\|4601218_4602475_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|137602
NZ_CP040886.1\|WP_000212657.1\|4600340_4600646_-\|monooxygenase	unknown	unknown	gnl\|CDD\|182975

Protein	Function_ID	Function_description	E-value
NZ_CP040886.1\|WP_000701040.1\|4610055_4611225_+\|MFS-transporter	gnl\|CDD\|225371	COG2814, AraJ, Arabinose efflux permease [Carbohydrate transport and metabolism].	1.92383e-98
NZ_CP040886.1\|WP_001070230.1\|4592868_4593495_+\|ferredoxin-like-protein	gnl\|CDD\|182135	PRK09898, PRK09898, ferredoxin-like protein.	6.99609e-140
NZ_CP040886.1\|WP_000528342.1\|4592203_4592413_+\|fumarate-hydratase-FumD	gnl\|CDD\|182359	PRK10292, PRK10292, fumarate hydratase FumD.	2.11502e-34
NZ_CP040886.1\|WP_001174942.1\|4602515_4603889_-\|multidrug-efflux-MATE-transporter-MdtK	gnl\|CDD\|234981	PRK01766, PRK01766, multidrug efflux protein; Reviewed.	0
NZ_CP040886.1\|WP_000269501.1\|4607547_4608480_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|182948	PRK11074, PRK11074, putative DNA-binding transcriptional regulator; Provisional.	0
NZ_CP040886.1\|WP_001678907.1\|4593515_4595618_+\|aldehyde-ferredoxin-oxidoreductase	gnl\|CDD\|236629	PRK09849, PRK09849, putative oxidoreductase; Provisional.	0
NZ_CP040886.1\|WP_000190982.1\|4608476_4609502_-\|HTH-type-transcriptional-repressor-PurR	gnl\|CDD\|236739	PRK10703, PRK10703, HTH-type transcriptional repressor PurR.	0
NZ_CP040886.1\|WP_000504352.1\|4595621_4596269_+\|YdhW-family-putative-oxidoreductase-system-protein	gnl\|CDD\|182160	PRK09947, PRK09947, YdhW family putative oxidoreductase system protein.	2.81741e-122
NZ_CP040886.1\|WP_060503957.1\|4604784_4605933_-\|cyclopropane-fatty-acyl-phospholipid-synthase	gnl\|CDD\|183282	PRK11705, PRK11705, cyclopropane fatty acyl phospholipid synthase.	0
NZ_CP040886.1\|WP_000007283.1\|4611370_4611952_-\|superoxide-dismutase-[Fe]	gnl\|CDD\|182534	PRK10543, PRK10543, superoxide dismutase [Fe].	3.77321e-138
NZ_CP040886.1\|WP_001295403.1\|4590235_4591648_-\|pyruvate-kinase-PykF	gnl\|CDD\|181699	PRK09206, PRK09206, pyruvate kinase PykF.	0
NZ_CP040886.1\|WP_001310861.1\|4596332_4597001_+\|4Fe-4S-dicluster-domain-containing-protein	gnl\|CDD\|274451	TIGR03149, cyt_nit_nrfC, cytochrome c nitrite reductase, Fe-S protein. Members of this protein family are the Fe-S protein, NrfC, of a cytochrome c nitrite reductase system for which the pentaheme cytochrome c protein, NrfB (family TIGR03146) is an unambiguous marker. Members of this protein family show similarity to other ferredoxin-like proteins, including a subunit of a polysulfide reductase. [Energy metabolism, Electron transport].	2.09652e-76
NZ_CP040886.1\|WP_001069997.1\|4596997_4597783_+\|thiosulfate-reductase-cytochrome-B-subunit	gnl\|CDD\|184968	PRK15006, PRK15006, thiosulfate reductase cytochrome B subunit; Provisional.	5.33298e-163
NZ_CP040886.1\|WP_001373655.1\|4604103_4604745_+\|riboflavin-synthase	gnl\|CDD\|183846	PRK13020, PRK13020, riboflavin synthase subunit alpha; Provisional.	2.8868e-122
NZ_CP040886.1\|WP_000587555.1\|4597786_4598599_+\|hypothetical-protein	gnl\|CDD\|182159	PRK09946, PRK09946, hypothetical protein; Provisional.	9.78241e-175
NZ_CP040886.1\|WP_001182363.1\|4606223_4607435_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	gnl\|CDD\|182924	PRK11043, PRK11043, Bcr/CflA family multidrug efflux MFS transporter.	0
NZ_CP040886.1\|WP_000716929.1\|4598610_4600215_-\|FAD-NAD(P)-binding-protein	gnl\|CDD\|182134	PRK09897, PRK09897, FAD-NAD(P)-binding protein.	0
NZ_CP040886.1\|WP_000534291.1\|4601218_4602475_+\|hypothetical-protein	gnl\|CDD\|137602	PRK09945, PRK09945, hypothetical protein; Provisional.	0
NZ_CP040886.1\|WP_000212657.1\|4600340_4600646_-\|monooxygenase	gnl\|CDD\|182975	PRK11118, PRK11118, putative monooxygenase; Provisional.	1.12003e-64

>NZ_CP040886.1|WP_000212657.1|4600340_4600646_-|monooxygenase
MATLLQLHFAFNGPFGDAMAEQLKPLAESINQEPGFLWKVWTESEKNHEAGGIYLFTDEKSALAYLEKHTARLKNLGVEEVVAKVFDVNEPLSQINQAKLA
>NZ_CP040886.1|WP_000716929.1|4598610_4600215_-|FAD-NAD(P)-binding-protein
MKKIAIVGAGPTGIYTLFSLLQQQTPLSISIFEQADEAGVGMPYSDEENSKMMLANIASIEIPPINCTYLEWLQKQEASHLQRYGVKKETLHDRQFLPRILLGEYFRDQFLRLVDQARQQKFAVAVYESCQVTDLQITNAGVMLATNQDLPSETFDLVVIATGHVWPDEEEATRTYFPSPWSGLMEAKVDACNVGIMGTSLSGLDAAMAVAIQHGSFIEDDKQHVVFNRDNASEKLNITLMSRTGILPEADFYCPIPYEPLHIVTDQALNAEIQKGEEGLLDRVFRLIVEEIKFADPDWSQRIALESLNVDSFAQAWFAERKQRDPFDWAEKNLQEVERNKREKHTVPWRYVILRLHEAVQEIVPHLNEHDHKRFSKGLARVFIDNYAAIPSESIRRLLALREAGIIHILALGEDYEMEINESRTVLKTEDNSYSFDVFIDARGQRPLKVKDIPFPGLREQLQKTGDEIPDVGEDYTLQQPEDIRGRVAFGALPWLMHDQPFVQGLTACAEIGEAMARAVVKPASRARRRLSFD
>NZ_CP040886.1|WP_000587555.1|4597786_4598599_+|hypothetical-protein
MIITRADLREWRIGAVMYRWFLRHFPRGGSYADIHHALIEEGYTDWAESLVEYAWKKWLADENFAHQEVSSMQKLATDPGEIPFCSQFARSDDHARIGCCEDNARIATAGYAAQIASMGYSVRIGSVGFNSHIGSSGERARVAVTGNSSRISSAGDSSRIANTGMRVRVCTLGERCHVASNGDLAQIASFGANARIANSGDNVHIIASGENSTVVSTGVVDSIILGPGGSAALAYHDGERVRFAVAIEGENNIRAGVRYRLNEQHQFVEC
>NZ_CP040886.1|WP_001069997.1|4596997_4597783_+|thiosulfate-reductase-cytochrome-B-subunit
MNPSQHAEQFQSQLANYVPQFTPEFWPVWLIIAGVLLVGMWLVLGLHALLRARGVKKSVTDYGEKIYLYCKAVRLWHWSNALLFVLLLASGLINHFALVGATAVKSLVAVHEVCGFLLLACWLGFVLINAVGGNGHHYRIRRQGWLERAAKQTRFYLFGIMQGEEHPFPATTQSKFNPLQQVAYVGVMYGLLPLLLLTGLLCLYPQAVGDVFPGVRYWLLQAHFALAFISLFFIFGHLYLCTTGRTPHETFKSMVDGYHRH
>NZ_CP040886.1|WP_001310861.1|4596332_4597001_+|4Fe-4S-dicluster-domain-containing-protein
MSFTRRKFVLGMGTVIFFTGSASSLLANTRQEKEVRYAMIHDESRCNGCNICARACRKTNHVPAQGSRLSIAHIPVTDNDNETQYHFFRQSCQHCEDAPCIDVCPTGASWRDEQGIVRVEKSQCIGCSYCIGACPYQVRYLNPVTKVADKCDFCAESRLAKGFPPICVSACPEHALIFGREDSPEIQAWLQQNKYYQYQLPGAGKPHLYRRFGQHLIKKENV
>NZ_CP040886.1|WP_000504352.1|4595621_4596269_+|YdhW-family-putative-oxidoreductase-system-protein
MGEMNHRDELPLAKVSEVDEAKRQWLQGMRHPVDTVTEPEPAEILAEFIRQHSAAGQLVARAVFLSPPYSVAEEELSVLLESIKQNGDYADIACMTGSQDDYYYSTQAMSENYAAMSLQVVEQDICRAIAHAVRFECQTYPRPYKVAMLMQAPYYFQEAQIEAAIAAMDVAPEYADIRQVESSTAVLYLFSERFMTYGKAYGLCEWFEVEQFQNP
>NZ_CP040886.1|WP_001678907.1|4593515_4595618_+|aldehyde-ferredoxin-oxidoreductase
MANGWTGNILRVNLTTGNITLEDSSKFKSFVGGMGFGYKIMYDEVPPGTKPFDEANKLVFATGPLTGSGAPCSSRVNITSLSTFTKGNLVVDAHMGGFFAAQMKFAGYDVIIIEGKAKSPVWLKIKDDKVSLEKADFLWGKGTRATTEEICRLTSPETCVAAIGQAGENLVPLSGMLNSRNHSGGAGTGAIMGSKNLKAIAVEGTKGVNIADRQEMKRLNDYMMTELIGANNNHVVPSTPQSWAEYSDPKSRWTARKELFWGAAEGGPIETGEIPPGNQNTVGFRTYKSVFDLGPAAEKYTVKMSGCHSCPIRCMTQMNIPRVKEFGVPSTGGNTCVANFVHTTIFPNGPKDFEDKDDGRVIGNLVGLNLFDDYGLWCNYGQLHRDFTYCYSKGVFKRVLPAEEYAEIHWDQLEAGDVNFIKDFYYRLAHRVGELSHLADGSYAIAERWNLGEEYWGYAKNKLWSPFGYPVHHANEASAQVGSIVNCMFNRDCMTHTHINFIGSGLPLKLQREVAKELFGSEDAYDETKNYTPINDAKIKYAKWSLLRVCLHNAVTLCNWVWPMTVSPLKSRNYRGDLALEAKFFKAITGEEMTQEKLDLAAERIFTLHRAYTVKLMQTKDMRNEHDLICSWVFDKDPQIPVFTEGTDKMDRDDMHASLTMFYKEMGWDPQLGCPTRETLQRLGLEDIAADLAAHNLLPV
>NZ_CP040886.1|WP_001070230.1|4592868_4593495_+|ferredoxin-like-protein
MNPVDRPLLDIGLTRLEFLRISGKGLAGLTIAPALLSLLGCKQEDIDSGTVGLINTPKGVLVTQRARCTGCHRCEISCTNFNDGSVGTFFSRIKIHRNYFFGDNGVGSGGGLYGDLNYTADTCRQCKEPQCMNVCPIGAITWQQKEGCITVDHKRCIGCSACTTACPWMMATVNTESKKSSKCVLCGECANACPTGALKIIEWKDITV
>NZ_CP040886.1|WP_000528342.1|4592203_4592413_+|fumarate-hydratase-FumD
MGNRTKEDELYREMCRVVGKVVLEMRDLGQEPKHIVIAGVLRTALANKRIQRSELEKQAMETVINALVK
>NZ_CP040886.1|WP_001295403.1|4590235_4591648_-|pyruvate-kinase-PykF
MKKTKIVCTIGPKTESEEMLAKMLDAGMNVMRLNFSHGDYAEHGQRIQNLRNVMSKTGKTAAILLDTKGPEIRTMKLEGGNDVSLKAGQTFTFTTDKSVIGNSEMVAVTYEGFTTDLSVGNTVLVDDGLIGMEVTAIEGNKVICKVLNNGDLGENKGVNLPGVSIALPALAEKDKQDLIFGCEQGVDFVAASFIRKRSDVIEIREHLKAHGGENIHIISKIENQEGLNNFDEILEASDGIMVARGDLGVEIPVEEVIFAQKMMIEKCIRARKVVITATQMLDSMIKNPRPTRAEAGDVANAILDGTDAVMLSGESAKGKYPLEAVSIMATICERTDRVMNSRLEFNNDNRKLRITEAVCRGAVETAEKLDAPLIVVATQGGKSARAVRKYFPDATILALTTNEKTAHQLVLSKGVVPQLVKEITSTDDFYRLGKELALQSGLAHKGDVVVMVSGALVPSGTTNTASVHVL
>NZ_CP040886.1|WP_000534291.1|4601218_4602475_+|hypothetical-protein
MGSDAKNLMSDGNVQIVKTGEVIGATQLTEGELIVEAGGRAENTVVTGAGWLKVATGGIAKCTQYGNNGTLSVSDGAIATDIVQSEGGAISLSTLATVNGRHPEGEFSVDQGYACGLLLENGGNLRVLEGHRAEKIILDQEGGLLVNGTTSAVVVDEGGELLVYPGGEASNCEINQGGVFMLAGKASDTLLAGGTMNNLGGEDSDTIVENGSIYRLGTDGLQLYSSGKTQNLSVNVGGRAEVHAGTLENAVIQGGTVILLSPTSADENFVVEEDRAPVELTGSVALLDGASMIIGYGADLQQSTITVQQGGVLILDGSTVKGDGVTFIVGNINLNGGKLWLITGAATHVQLKVKRLRGEGAICLQTSAKEISPDFINVKGEVTGDIHVEITDASRQTLCNALKLQPDEDGIGATLQPA
>NZ_CP040886.1|WP_001174942.1|4602515_4603889_-|multidrug-efflux-MATE-transporter-MdtK
MQKYISEARLLLALAIPVILAQIAQTAMGFVDTVMAGGYSATDMAAVAIGTSIWLPAILFGHGLLLALTPVIAQLNGSGRRERIAHQVRQGFWLAGFVSVLIMLVLWNAGYIIRSMENIDPALADKAVGYLRALLWGAPGYLFFQVARNQCEGLAKTKPGMVMGFIGLLVNIPVNYIFIYGHFGMPELGGVGCGVATAAVYWVMFLAMVSYIKRARSMRDIRNEKGTAKPDPAVMKRLIQLGLPIALALFFEVTLFAVVALLVSPLGIVDVAGHQIALNFSSLMFVLPMSLAAAVTIRVGYRLGQGSTLDAQTAARTGLMVGVCMATLTAIFTVSLREQIALLYNDNPEVVTLAAHLMLLAAVYQISDSIQVIGSGILRGYKDTRSIFYITFTAYWVLGLPSGYILALTDLVVEPMGPAGFWIGFIIGLTSAAIMMMLRMRFLQRLPSVIILQRASR
>NZ_CP040886.1|WP_001373655.1|4604103_4604745_+|riboflavin-synthase
MFTGIVQGTVKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLAARENAMNQPGTEA
>NZ_CP040886.1|WP_060503957.1|4604784_4605933_-|cyclopropane-fatty-acyl-phospholipid-synthase
MSSSCIEEVSVPDDNWYRIANELLSRAGIAINGSAPADIRVKNPDFFKRVLQEGSLGLGDSYMDGWWECDRLDMFFSKVLRAGLENQLPHHFKDTLRIASARLFNLQSKKRAWIVGKEHYDLGNDLFSRMLDPFMQYSCAYWKDADNLESAQQAKLKMICEKLQLKPGMRVLDIGCGWGGLAHYMASNYDVSVVGVTISAEQQKMAQERCEGLDVTILLQDYRDLNDQFDRIVSVGMFEHVGPKNYDTYFAVVDRNLKPEGIFLLHTIGSKKTDLNVDPWINKYIFPNGCLPSVRQIAQSSEPHFVMEDWHNFGADYDTTLMAWYERFLAAWPEIADNYSERFKRMFTYYLNACAGAFRARDIQLWQVVFSRGVENGLRVAR
>NZ_CP040886.1|WP_001182363.1|4606223_4607435_-|Bcr/CflA-family-multidrug-efflux-MFS-transporter
MQPGKRFLVWLAGLSVLGFLATDMYLPAFAAIQADLQTPASAVSASLSLFLAGFAAAQLLWGPLSDRYGRKPVLLIGLTIFALGSLGMLWVENAATLLVLRFVQAVGVCAAAVIWQALVTDYYPSQKVNRIFATIMPLVGLSPALAPLLGSWLLVHFSWQAIFATLFAITVVLILPIFWLKPTTKARNNSQDGLTFTDLLRSKTYRGNVLIYAACSASFFAWLTGSPFILSEMGYSPAVIGLSYVPQTIAFLIGGYGCRAALQKWQGKQLLPWLLVLFAVSVIATWAAGFISHVSLVEILIPFCVMAIANGAIYPIVVAQALRPFPHATGRAAALQNTLQLGLCFLASLVVSWLISISTPLLTTTSVMLSTVVLVALGYMMQRCEEVGCQNHGNAEVAHSESH
>NZ_CP040886.1|WP_000269501.1|4607547_4608480_+|LysR-family-transcriptional-regulator
MWSEYSLEVVDAVARNGSFSAAAQELHRVPSAVSYTVRQLEEWLAVPLFERRHRDVELTAAGAWFLKEGRSVVKKMQITRQQCQQIANGWRGQLAIAVDNIVRPERTRQMIVDFYRHFDDVELLVFQEVFNGVWDALSDGRVELAIGATRAIPVGGRYAFRDMGMLSWSCVVASHHPLALMDGPFSDDTLRNWPSLVREDTSRTLPKRITWLLDNQKRVVVPDWESSATCISAGLCIGMVPTHFAKPWLNEGKWVALELENPFPDSACCLTWQQNDMSPALTWLLEYLGDSETLNKEWLREPEETPATGD
>NZ_CP040886.1|WP_000190982.1|4608476_4609502_-|HTH-type-transcriptional-repressor-PurR
MATIKDVAKRANVSTTTVSHVINKTRFVAEETRNAVWAAIKELHYSPSAVARSLKVNHTKSIGLLATSSEAAYFAEIIEAVEKNCFQKGYTLILGNAWNNLEKQRAYLSMMAQKRVDGLLVMCSEYPEPLLAMLEEYRHIPMVVMDWGEAKADFTDAVIDNAFEGGYMAGRYLIERGHREIGVIPGPLERNTGAGRLAGFMKAMEEAMIKVPESWIVQGDFEPESGYRAMQQILSQPHRPTAVFCGGDIMAMGALCAADEMGLRVPQDVSLIGYDNVRNARYFTPALTTIHQPKDSLGETAFNMLLDRIVNKREEPQSIEVHPRLIERRSVADGPFRDYRR
>NZ_CP040886.1|WP_000102278.1|4609800_4609890_+|stress-response-protein-YnhF
MSTDLKFSLVTTIIVLGLIVAVGLTAALH
>NZ_CP040886.1|WP_000701040.1|4610055_4611225_+|MFS-transporter
MKINYPLLALAIGAFGIGTTEFSPMGLLPVIARGVDVSIPAAGMLISAYAVGVMVGAPLMTLLLSHRARRSALIFLMAIFTLGNVLSAIAPDYMTLMLSRILTSLNHGAFFGLGSVVAASVVPKHKQASAVATMFMGLTLANIGGVPAATWLGETIGWRMSFLATAGLGVISMVSLFFSLPKGGAGARPEVKKELAVLMRPQVLSALLTTVLGAGAMFTLYTYISPVLQSITHATPVFVTAMLVLIGVGFSIGNYLGGKLADRSVNGTLKGFLLLLMVIMLAIPFLARNEFGAAISMVVWGAATFAVVPPLQMRVMRVASEAPGLSSSVNIGAFNLGNALGAAAGGAVISAGLGYSFVPVMGAIVAGLALLLVFMSARKQPETVCVANS
>NZ_CP040886.1|WP_000007283.1|4611370_4611952_-|superoxide-dismutase-[Fe]
MSFELPALPYAKDALAPHISAETIEYHYGKHHQTYVTNLNNLIKGTAFEGKSLEEIIRSSEGGVFNNAAQVWNHTFYWNCLAPNAGGEPTGKVAEAIAASFGSFADFKAQFTDAAIKNFGSGWTWLVKNSDGKLAIVSTSNAGTPLTTDATPLLTVDVWEHAYYIDYRNARPGYLEHFWALVNWEFVAKNLAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP040886_1	1.1\|318298\|40\|NZ_CP040886\|CRISPRCasFinder	318298-318337	40	NZ_CP041417	Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence	47951-47990	0	1.0
NZ_CP040886_5	5.1\|1332411\|42\|NZ_CP040886\|PILER-CR	1332411-1332452	42	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	141085-141126	0	1.0
NZ_CP040886_5	5.2\|1332470\|40\|NZ_CP040886\|PILER-CR	1332470-1332509	40	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	141028-141067	1	0.975
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	NC_016160	Escherichia phage HK75, complete genome	28586-28632	1	0.979
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	NC_019705	Enterobacteria phage mEpX2, complete genome	29040-29086	1	0.979
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	NC_019719	Enterobacteria phage HK633, complete genome	31734-31780	1	0.979
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	JF974339	Enterobacteria phage IME10, complete genome	9717-9763	1	0.979
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	NC_019715	Enterobacterial phage mEp234, complete genome	30402-30448	2	0.957
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	NC_019711	Enterobacteria phage HK629, complete genome	37163-37209	2	0.957
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	NC_019768	Enterobacteria phage HK106, complete genome	32698-32744	2	0.957
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	KY979108	Escherichia phage ECP1, complete genome	421-467	2	0.957
NZ_CP040886_10	10.1\|3759522\|47\|NZ_CP040886\|CRISPRCasFinder	3759522-3759568	47	NC_005344	Enterobacteria phage Sf6, complete genome	28404-28450	2	0.957
NZ_CP040886_12	12.1\|4600824\|38\|NZ_CP040886\|CRISPRCasFinder	4600824-4600861	38	NZ_CP043437	Enterobacter sp. LU1 plasmid unnamed	113727-113764	2	0.947
NZ_CP040886_3	3.1\|1120087\|48\|NZ_CP040886\|CRISPRCasFinder	1120087-1120134	48	NZ_CP053606	Escherichia coli strain NEB_Turbo plasmid F', complete sequence	4089-4136	3	0.938
NZ_CP040886_3	3.1\|1120087\|48\|NZ_CP040886\|CRISPRCasFinder	1120087-1120134	48	NZ_CP053608	Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence	4088-4135	3	0.938
NZ_CP040886_3	3.1\|1120087\|48\|NZ_CP040886\|CRISPRCasFinder	1120087-1120134	48	NZ_CP014271	Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence	4088-4135	3	0.938
NZ_CP040886_3	3.1\|1120087\|48\|NZ_CP040886\|CRISPRCasFinder	1120087-1120134	48	NZ_CP014273	Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence	4088-4135	3	0.938
NZ_CP040886_6	6.1\|2926082\|42\|NZ_CP040886\|CRISPRCasFinder	2926082-2926123	42	NZ_CP010208	Escherichia coli strain M11 plasmid B, complete sequence	30214-30255	7	0.833
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_MG299151	Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence	51276-51307	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_KY471628	Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence	45716-45747	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_MG299131	Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence	51276-51307	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_KY471629	Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence	45716-45747	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_MG299133	Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence	51276-51307	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_MG299128	Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence	51276-51307	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_MG299147	Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence	51276-51307	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NC_018995	Escherichia coli plasmid pHUSEC41-1, complete sequence	29015-29046	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_CP053235	Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence	78292-78323	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_CP005999	Escherichia coli B7A plasmid pEB1, complete sequence	39563-39594	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	KU932021	Escherichia coli plasmid pEC3I, complete sequence	51902-51933	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_CP024154	Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence	18560-18591	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NC_011754	Escherichia coli ED1a plasmid pECOED, complete sequence	49240-49271	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_CP015141	Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence	81434-81465	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_LR213460	Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3	28916-28947	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_MH287044	Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence	36182-36213	7	0.781
NZ_CP040886_8	8.13\|3344710\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344710-3344741	32	NZ_MH618673	Escherichia coli strain 838B plasmid p838B-R, complete sequence	32230-32261	7	0.781
NZ_CP040886_9	9.1\|3367246\|31\|NZ_CP040886\|CRISPRCasFinder	3367246-3367276	31	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	62682-62712	7	0.774
NZ_CP040886_9	9.1\|3367246\|31\|NZ_CP040886\|CRISPRCasFinder	3367246-3367276	31	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1222106-1222136	7	0.774
NZ_CP040886_9	9.1\|3367246\|31\|NZ_CP040886\|CRISPRCasFinder	3367246-3367276	31	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2467672-2467702	7	0.774
NZ_CP040886_9	9.4\|3367429\|31\|NZ_CP040886\|CRISPRCasFinder	3367429-3367459	31	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	530641-530671	7	0.774
NZ_CP040886_6	6.1\|2926082\|42\|NZ_CP040886\|CRISPRCasFinder	2926082-2926123	42	NZ_CP048307	Escherichia coli strain 9 plasmid p009_C, complete sequence	24899-24940	8	0.81
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_MG299151	Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence	51275-51307	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_KY471628	Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence	45715-45747	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_MG299131	Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence	51275-51307	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_KY471629	Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence	45715-45747	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_MG299133	Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence	51275-51307	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_MG299128	Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence	51275-51307	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_MG299147	Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence	51275-51307	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NC_018995	Escherichia coli plasmid pHUSEC41-1, complete sequence	29014-29046	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_CP053235	Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence	78291-78323	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_CP024154	Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence	18559-18591	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NC_011754	Escherichia coli ED1a plasmid pECOED, complete sequence	49239-49271	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_CP015141	Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence	81433-81465	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_LR213460	Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3	28915-28947	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_MH287044	Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence	36181-36213	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_MH618673	Escherichia coli strain 838B plasmid p838B-R, complete sequence	32229-32261	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	NZ_CP005999	Escherichia coli B7A plasmid pEB1, complete sequence	39563-39595	8	0.758
NZ_CP040886_8	8.6\|3344709\|33\|NZ_CP040886\|PILER-CR	3344709-3344741	33	KU932021	Escherichia coli plasmid pEC3I, complete sequence	51902-51934	8	0.758
NZ_CP040886_8	8.12\|3344649\|32\|NZ_CP040886\|CRISPRCasFinder,CRT	3344649-3344680	32	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1417960-1417991	8	0.75
NZ_CP040886_9	9.4\|3367429\|31\|NZ_CP040886\|CRISPRCasFinder	3367429-3367459	31	NZ_CP036297	Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence	14953-14983	8	0.742
NZ_CP040886_9	9.4\|3367429\|31\|NZ_CP040886\|CRISPRCasFinder	3367429-3367459	31	NZ_CP036288	Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence	14983-15013	8	0.742
NZ_CP040886_9	9.4\|3367429\|31\|NZ_CP040886\|CRISPRCasFinder	3367429-3367459	31	NZ_CP015882	Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence	3454-3484	8	0.742
NZ_CP040886_9	9.4\|3367429\|31\|NZ_CP040886\|CRISPRCasFinder	3367429-3367459	31	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	148992-149022	8	0.742
NZ_CP040886_9	9.7\|3367246\|32\|NZ_CP040886\|PILER-CR,CRT	3367246-3367277	32	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	62682-62713	8	0.75
NZ_CP040886_9	9.7\|3367246\|32\|NZ_CP040886\|PILER-CR,CRT	3367246-3367277	32	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1222106-1222137	8	0.75
NZ_CP040886_9	9.7\|3367246\|32\|NZ_CP040886\|PILER-CR,CRT	3367246-3367277	32	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2467671-2467702	8	0.75
NZ_CP040886_9	9.7\|3367246\|32\|NZ_CP040886\|PILER-CR,CRT	3367246-3367277	32	NC_008759	Polaromonas naphthalenivorans CJ2 plasmid pPNAP03, complete sequence	12670-12701	8	0.75
NZ_CP040886_9	9.10\|3367429\|32\|NZ_CP040886\|PILER-CR,CRT	3367429-3367460	32	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	148991-149022	8	0.75
NZ_CP040886_9	9.10\|3367429\|32\|NZ_CP040886\|PILER-CR,CRT	3367429-3367460	32	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	530640-530671	8	0.75
NZ_CP040886_9	9.11\|3367490\|32\|NZ_CP040886\|PILER-CR,CRT	3367490-3367521	32	NZ_CP006991	Rhizobium sp. IE4771 plasmid pRetIE4771e, complete sequence	532343-532374	8	0.75
NZ_CP040886_6	6.1\|2926082\|42\|NZ_CP040886\|CRISPRCasFinder	2926082-2926123	42	NZ_CP048307	Escherichia coli strain 9 plasmid p009_C, complete sequence	24786-24827	9	0.786
NZ_CP040886_9	9.1\|3367246\|31\|NZ_CP040886\|CRISPRCasFinder	3367246-3367276	31	NC_011987	Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence	86182-86212	9	0.71
NZ_CP040886_9	9.2\|3367307\|31\|NZ_CP040886\|CRISPRCasFinder	3367307-3367337	31	CP011075	Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence	244686-244716	9	0.71
NZ_CP040886_9	9.2\|3367307\|31\|NZ_CP040886\|CRISPRCasFinder	3367307-3367337	31	GU075905	Prochlorococcus phage P-HM2, complete genome	78536-78566	9	0.71
NZ_CP040886_9	9.5\|3367490\|31\|NZ_CP040886\|CRISPRCasFinder	3367490-3367520	31	NZ_CP040723	Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence	35740-35770	9	0.71
NZ_CP040886_9	9.10\|3367429\|32\|NZ_CP040886\|PILER-CR,CRT	3367429-3367460	32	NZ_CP036297	Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence	14953-14984	9	0.719
NZ_CP040886_9	9.10\|3367429\|32\|NZ_CP040886\|PILER-CR,CRT	3367429-3367460	32	NZ_CP036288	Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence	14983-15014	9	0.719
NZ_CP040886_9	9.10\|3367429\|32\|NZ_CP040886\|PILER-CR,CRT	3367429-3367460	32	NZ_CP015882	Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence	3454-3485	9	0.719
NZ_CP040886_9	9.11\|3367490\|32\|NZ_CP040886\|PILER-CR,CRT	3367490-3367521	32	NZ_CP040723	Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence	35740-35771	9	0.719
NZ_CP040886_9	9.7\|3367246\|32\|NZ_CP040886\|PILER-CR,CRT	3367246-3367277	32	NC_011987	Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence	86181-86212	10	0.688
NZ_CP040886_9	9.8\|3367307\|32\|NZ_CP040886\|PILER-CR,CRT	3367307-3367338	32	CP011075	Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence	244686-244717	10	0.688
NZ_CP040886_9	9.8\|3367307\|32\|NZ_CP040886\|PILER-CR,CRT	3367307-3367338	32	GU075905	Prochlorococcus phage P-HM2, complete genome	78536-78567	10	0.688

1. spacer 1.1|318298|40|NZ_CP040886|CRISPRCasFinder matches to NZ_CP041417 (Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence) position: , mismatch: 0, identity: 1.0

gcgctgcgggtcattcttgaaattacccccgctgtgctgt	CRISPR spacer
gcgctgcgggtcattcttgaaattacccccgctgtgctgt	Protospacer
****************************************

2. spacer 5.1|1332411|42|NZ_CP040886|PILER-CR matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 0, identity: 1.0

tgtcacacgcagataaatccaactttcaatattgttaagttc	CRISPR spacer
tgtcacacgcagataaatccaactttcaatattgttaagttc	Protospacer
******************************************

3. spacer 5.2|1332470|40|NZ_CP040886|PILER-CR matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 1, identity: 0.975

catggcgtagcaaaaagaaattttcaatattgctttatgg	CRISPR spacer
catggcgtagaaaaaagaaattttcaatattgctttatgg	Protospacer
********** *****************************

4. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to NC_016160 (Escherichia phage HK75, complete genome) position: , mismatch: 1, identity: 0.979

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acggttgtccaacgcaaacaccagtaatggcgcggctctcagcggag	Protospacer
******************************************.****

5. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to NC_019705 (Enterobacteria phage mEpX2, complete genome) position: , mismatch: 1, identity: 0.979

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acggttgtccaacgcaaacaccagtaatggcgcggctctcagcggag	Protospacer
******************************************.****

6. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to NC_019719 (Enterobacteria phage HK633, complete genome) position: , mismatch: 1, identity: 0.979

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acggttgtccaacgcaaacaccagtaatggcgcggctctcagcggag	Protospacer
******************************************.****

7. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to JF974339 (Enterobacteria phage IME10, complete genome) position: , mismatch: 1, identity: 0.979

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acggttgtccaacgcaaacaccagtaatggcgcggctctcagcggag	Protospacer
******************************************.****

8. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to NC_019715 (Enterobacterial phage mEp234, complete genome) position: , mismatch: 2, identity: 0.957

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acggttgtccaacgcaaacaccagtaatggcgcggatctcagcggag	Protospacer
*********************************** ******.****

9. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to NC_019711 (Enterobacteria phage HK629, complete genome) position: , mismatch: 2, identity: 0.957

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acggttgtccaacgcaaacaccagtaatggcgcgtctctcagcggag	Protospacer
********************************** *******.****

10. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to NC_019768 (Enterobacteria phage HK106, complete genome) position: , mismatch: 2, identity: 0.957

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acggttgtccaacgcaaacaccagtaatggcgcggatctcagcggag	Protospacer
*********************************** ******.****

11. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to KY979108 (Escherichia phage ECP1, complete genome) position: , mismatch: 2, identity: 0.957

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acagttgtccaacgcaaacaccagtaatggcgcggctctcagcggag	Protospacer
**.***************************************.****

12. spacer 10.1|3759522|47|NZ_CP040886|CRISPRCasFinder matches to NC_005344 (Enterobacteria phage Sf6, complete genome) position: , mismatch: 2, identity: 0.957

acggttgtccaacgcaaacaccagtaatggcgcggctctcagtggag	CRISPR spacer
acgtttgtccaacgcaaacaccagtaatggcgcggctctcagcggag	Protospacer
*** **************************************.****

13. spacer 12.1|4600824|38|NZ_CP040886|CRISPRCasFinder matches to NZ_CP043437 (Enterobacter sp. LU1 plasmid unnamed) position: , mismatch: 2, identity: 0.947

cggacgcaggatggtgcgttcaattggactcgaaccaa	CRISPR spacer
cagacgcagaatggtgcgttcaattggactcgaaccaa	Protospacer
*.*******.****************************

14. spacer 3.1|1120087|48|NZ_CP040886|CRISPRCasFinder matches to NZ_CP053606 (Escherichia coli strain NEB_Turbo plasmid F', complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

15. spacer 3.1|1120087|48|NZ_CP040886|CRISPRCasFinder matches to NZ_CP053608 (Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

16. spacer 3.1|1120087|48|NZ_CP040886|CRISPRCasFinder matches to NZ_CP014271 (Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

17. spacer 3.1|1120087|48|NZ_CP040886|CRISPRCasFinder matches to NZ_CP014273 (Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

18. spacer 6.1|2926082|42|NZ_CP040886|CRISPRCasFinder matches to NZ_CP010208 (Escherichia coli strain M11 plasmid B, complete sequence) position: , mismatch: 7, identity: 0.833

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
acaaatgccggatgcggcgtaaacgccttatctggcctacgc	Protospacer
***.  *.****************.*********.******.

19. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_MG299151 (Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

20. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_KY471628 (Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

21. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_MG299131 (Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

22. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_KY471629 (Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

23. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_MG299133 (Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

24. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_MG299128 (Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

25. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_MG299147 (Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

26. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NC_018995 (Escherichia coli plasmid pHUSEC41-1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

27. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_CP053235 (Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

28. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_CP005999 (Escherichia coli B7A plasmid pEB1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

29. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to KU932021 (Escherichia coli plasmid pEC3I, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

30. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_CP024154 (Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

31. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NC_011754 (Escherichia coli ED1a plasmid pECOED, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

32. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_CP015141 (Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

33. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_LR213460 (Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

34. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_MH287044 (Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

35. spacer 8.13|3344710|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_MH618673 (Escherichia coli strain 838B plasmid p838B-R, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

36. spacer 9.1|3367246|31|NZ_CP040886|CRISPRCasFinder matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
tccctatcgcaatgccggcagcatccgcaat	Protospacer
*. *.  ****** **** ************

37. spacer 9.1|3367246|31|NZ_CP040886|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatc	Protospacer
**** ************ ***** *  ** .

38. spacer 9.1|3367246|31|NZ_CP040886|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatc	Protospacer
**** ************ ***** *  ** .

39. spacer 9.4|3367429|31|NZ_CP040886|CRISPRCasFinder matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.774

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
ccgaacaggtggcgaagcaggtgatgggcca	Protospacer
******.* **************.. ***

40. spacer 6.1|2926082|42|NZ_CP040886|CRISPRCasFinder matches to NZ_CP048307 (Escherichia coli strain 9 plasmid p009_C, complete sequence) position: , mismatch: 8, identity: 0.81

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
attgatgtcggatgcggcgtaaacgccttatccgacctacaa	Protospacer
*. *  ******************.*******.*******.

41. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_MG299151 (Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

42. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_KY471628 (Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

43. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_MG299131 (Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

44. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_KY471629 (Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

45. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_MG299133 (Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

46. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_MG299128 (Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

47. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_MG299147 (Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

48. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NC_018995 (Escherichia coli plasmid pHUSEC41-1, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

49. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_CP053235 (Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

50. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_CP024154 (Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

51. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NC_011754 (Escherichia coli ED1a plasmid pECOED, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

52. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_CP015141 (Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

53. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_LR213460 (Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

54. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_MH287044 (Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

55. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_MH618673 (Escherichia coli strain 838B plasmid p838B-R, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

56. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to NZ_CP005999 (Escherichia coli B7A plasmid pEB1, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

57. spacer 8.6|3344709|33|NZ_CP040886|PILER-CR matches to KU932021 (Escherichia coli plasmid pEC3I, complete sequence) position: , mismatch: 8, identity: 0.758

gaaatatccagggctgggctggaggcagacggc--	CRISPR spacer
acgttatccagggctgagctgcaggcag--ggcca	Protospacer
. . ************.**** ******  ***

58. spacer 8.12|3344649|32|NZ_CP040886|CRISPRCasFinder,CRT matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.75

tcaacgcgctcagacgttgcgtgagtgaacca	CRISPR spacer
acaacgcggtcggacgttgcgtgattaccccg	Protospacer
 ******* **.************ *.  **.

59. spacer 9.4|3367429|31|NZ_CP040886|CRISPRCasFinder matches to NZ_CP036297 (Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgt	Protospacer
   ..*.******** ********** ****

60. spacer 9.4|3367429|31|NZ_CP040886|CRISPRCasFinder matches to NZ_CP036288 (Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgt	Protospacer
   ..*.******** ********** ****

61. spacer 9.4|3367429|31|NZ_CP040886|CRISPRCasFinder matches to NZ_CP015882 (Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
ttgcgcagctggcgcagcaggtggctgccga	Protospacer
..* .*.******* ************ **

62. spacer 9.4|3367429|31|NZ_CP040886|CRISPRCasFinder matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
gggtacggctggcgaaggaggcggctgcgga	Protospacer
  * ************* ***.*****  *

63. spacer 9.7|3367246|32|NZ_CP040886|PILER-CR,CRT matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
tccctatcgcaatgccggcagcatccgcaatc	Protospacer
*. *.  ****** **** ************.

64. spacer 9.7|3367246|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatca	Protospacer
**** ************ ***** *  ** .

65. spacer 9.7|3367246|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatca	Protospacer
**** ************ ***** *  ** .

66. spacer 9.7|3367246|32|NZ_CP040886|PILER-CR,CRT matches to NC_008759 (Polaromonas naphthalenivorans CJ2 plasmid pPNAP03, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcg-----caattccgggagcatccgcaatt	CRISPR spacer
-----cgtgaaactcatttccgggagcatccgcattt	Protospacer
     **.*     ** ***************** **

67. spacer 9.10|3367429|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
gggtacggctggcgaaggaggcggctgcggaa	Protospacer
  * ************* ***.*****  * *

68. spacer 9.10|3367429|32|NZ_CP040886|PILER-CR,CRT matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.75

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
ccgaacaggtggcgaagcaggtgatgggccag	Protospacer
******.* **************.. ***  .

69. spacer 9.11|3367490|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP006991 (Rhizobium sp. IE4771 plasmid pRetIE4771e, complete sequence) position: , mismatch: 8, identity: 0.75

gtttaccgccccgcagaggcgctggcagatcc	CRISPR spacer
catcatcctcccgcagatgcgctggccgatcc	Protospacer
  *.*.* .******** ******** *****

70. spacer 6.1|2926082|42|NZ_CP040886|CRISPRCasFinder matches to NZ_CP048307 (Escherichia coli strain 9 plasmid p009_C, complete sequence) position: , mismatch: 9, identity: 0.786

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
gttgatgtcggatgcggcgtaaacgccttatccgacctacaa	Protospacer
.. *  ******************.*******.*******.

71. spacer 9.1|3367246|31|NZ_CP040886|CRISPRCasFinder matches to NC_011987 (Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence) position: , mismatch: 9, identity: 0.71

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
gctaccgcgcaattcgaggagcatccgctgg	Protospacer
 .  *********** .*********** .

72. spacer 9.2|3367307|31|NZ_CP040886|CRISPRCasFinder matches to CP011075 (Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.71

acggacaaaatatatattgatttgcgaatta	CRISPR spacer
tgaggcaaaatatagattgatttccgaaaat	Protospacer
  .*.********* ******** ****

73. spacer 9.2|3367307|31|NZ_CP040886|CRISPRCasFinder matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 9, identity: 0.71

acggacaaaatatatattgatttgcgaatta	CRISPR spacer
acggaaaaattatatattgattttacttctg	Protospacer
***** *** *************     .*.

74. spacer 9.5|3367490|31|NZ_CP040886|CRISPRCasFinder matches to NZ_CP040723 (Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.71

gtttaccgccccgcagaggcgctggcagatc	CRISPR spacer
cgagaccgcctcgccgaggcgctggcagcga	Protospacer
    ******.*** *************

75. spacer 9.10|3367429|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP036297 (Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgtg	Protospacer
   ..*.******** ********** ****.

76. spacer 9.10|3367429|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP036288 (Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgtg	Protospacer
   ..*.******** ********** ****.

77. spacer 9.10|3367429|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP015882 (Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
ttgcgcagctggcgcagcaggtggctgccgag	Protospacer
..* .*.******* ************ ** .

78. spacer 9.11|3367490|32|NZ_CP040886|PILER-CR,CRT matches to NZ_CP040723 (Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.719

gtttaccgccccgcagaggcgctggcagatcc	CRISPR spacer
cgagaccgcctcgccgaggcgctggcagcgac	Protospacer
    ******.*** *************   *

79. spacer 9.7|3367246|32|NZ_CP040886|PILER-CR,CRT matches to NC_011987 (Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence) position: , mismatch: 10, identity: 0.688

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
gctaccgcgcaattcgaggagcatccgctggg	Protospacer
 .  *********** .*********** .

80. spacer 9.8|3367307|32|NZ_CP040886|PILER-CR,CRT matches to CP011075 (Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

acggacaaaatatatattgatttgcgaattat	CRISPR spacer
tgaggcaaaatatagattgatttccgaaaata	Protospacer
  .*.********* ******** ****

81. spacer 9.8|3367307|32|NZ_CP040886|PILER-CR,CRT matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 10, identity: 0.688

acggacaaaatatatattgatttgcgaattat	CRISPR spacer
acggaaaaattatatattgattttacttctgg	Protospacer
***** *** *************     .*.

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

180920 : 191698

Enterobacteria_phage(40.0%)

integrase

attL 178893:178916|attR 190401:190424

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
178893:178916	attL	NA	NA	NA	NA
WP_000379042.1\|180920_182876_-	AAA domain-containing protein	K4I1H4	Acidithiobacillus_phage	7.5e-26	28.6
WP_001753331.1\|185240_185780_-	hypothetical protein	M9NZI6	Enterobacteria_phage	7.5e-61	65.6
WP_072163463.1\|185962_186274_+	recombinase	A0A0N7KZJ3	Stx2-converting_phage	2.4e-43	100.0
WP_001372461.1\|186270_186951_+	YqaJ viral recombinase family protein	A0A0P0ZCD4	Stx2-converting_phage	5.1e-131	98.7
WP_000149533.1\|186947_187106_+	DUF1317 family protein	M1FJ61	Enterobacteria_phage	6.4e-21	88.5
WP_001678641.1\|187102_188167_+	DGQHR domain-containing protein	T1SBJ4	Salmonella_phage	1.7e-133	64.8
WP_001678640.1\|188320_188539_+	TraR/DksA family transcriptional regulator	M1FQT7	Enterobacteria_phage	3.2e-34	94.4
WP_000488406.1\|188586_188826_+	DUF4222 domain-containing protein	M1FPC8	Enterobacteria_phage	3.9e-38	94.9
WP_000088653.1\|188965_189202_+	excisionase	NA	NA	NA	NA
WP_000741339.1\|189191_190334_+\|integrase	tyrosine-type recombinase/integrase	O21929	Phage_21	8.1e-206	99.7
WP_000444487.1\|190447_191698_-	NADP-dependent isocitrate dehydrogenase	Q77Z09	Phage_21	3.8e-23	100.0
190401:190424	attR	NA	NA	NA	NA

DBSCAN-SWA_2

506073 : 514843

Salmonella_phage(90.0%)

integrase

attL 505743:505756|attR 514885:514898

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
505743:505756	attL	NA	NA	NA	NA
WP_001376441.1\|506073_506262_-	hypothetical protein	A0A1S6L006	Salmonella_phage	2.0e-24	95.2
WP_001376443.1\|506420_508814_-	replication endonuclease	E5G6L9	Salmonella_phage	0.0e+00	93.7
WP_001544405.1\|508810_509668_-	DNA adenine methylase	E5G6L8	Salmonella_phage	9.5e-159	95.8
WP_000752610.1\|509664_509892_-	TraR/DksA family transcriptional regulator	E5G6L7	Salmonella_phage	7.8e-36	98.7
WP_001244224.1\|509891_510125_-	DUF2732 family protein	E5G6L6	Salmonella_phage	1.9e-32	97.4
WP_000996717.1\|510192_510534_-	DUF5347 domain-containing protein	E5G6L5	Salmonella_phage	1.7e-55	98.2
WP_000956192.1\|510651_510948_-	DUF2724 domain-containing protein	E5G6L4	Salmonella_phage	1.9e-21	88.5
WP_000460892.1\|510955_511465_-	phage regulatory CII family protein	E5G6L3	Salmonella_phage	1.3e-86	98.2
WP_000188448.1\|511497_511719_-	hypothetical protein	NA	NA	NA	NA
WP_001680871.1\|511864_512743_+	phage repressor protein CI	A0A1S6KZZ7	Salmonella_phage	1.7e-30	39.4
WP_001678408.1\|512754_513699_+	hypothetical protein	NA	NA	NA	NA
WP_001372563.1\|513790_514843_+\|integrase	tyrosine-type recombinase/integrase	A0A218M4I3	Erwinia_phage	1.4e-106	57.0
514885:514898	attR	NA	NA	NA	NA

DBSCAN-SWA_3

594426 : 621630

Enterobacteria_phage(47.06%)

capsid,lysis,integrase,tail

attL 596342:596356|attR 621704:621718

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001356070.1\|594426_595716_+	adenosylmethionine--8-amino-7-oxononanoate transaminase	A0A1V0SKB7	Klosneuvirus	3.4e-19	27.1
WP_000767389.1\|595774_596251_+	kinase inhibitor	NA	NA	NA	NA
596342:596356	attL	NA	NA	NA	NA
WP_001753290.1\|596996_598328_+	GGDEF domain-containing protein	A0A127AWB9	Bacillus_phage	1.4e-20	37.1
WP_072163407.1\|598401_598578_-\|tail	phage tail protein	K7PMH7	Enterobacteria_phage	9.4e-21	84.5
WP_000239881.1\|598727_599396_+	class I SAM-dependent methyltransferase	NA	NA	NA	NA
WP_072035100.1\|599340_599478_-\|capsid	nucleocapsid protein	NA	NA	NA	NA
WP_001372490.1\|600286_600847_-	DNA-packaging protein	A0A0K2FIG2	Enterobacteria_phage	4.9e-87	98.8
WP_000105084.1\|601235_601469_+	YlcI/YnfO family protein	A0A0K2FIR8	Escherichia_phage	7.3e-21	94.4
WP_000079508.1\|601525_601936_+	DUF1398 family protein	C6ZCX4	Enterobacteria_phage	1.3e-52	76.3
WP_001139678.1\|602287_602440_-	hypothetical protein	K7PKL2	Enterobacteria_phage	3.1e-20	96.0
WP_001228702.1\|602468_602675_-	hypothetical protein	H6WRZ6	Salmonella_phage	5.3e-31	98.5
WP_001372488.1\|602891_603389_-	lysozyme	A0A1B5FP97	Escherichia_phage	1.6e-89	97.0
WP_000839582.1\|603388_603604_-\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	1.2e-33	98.6
WP_000592543.1\|604873_605833_-	DUF523 and DUF1722 domain-containing protein	NA	NA	NA	NA
WP_000780581.1\|606025_606550_+	lipocalin family protein	A0A1W6JNX6	Morganella_phage	1.1e-48	54.1
WP_001204777.1\|606705_607083_-	antitermination protein	Q777W5	Enterobacteria_phage	7.3e-55	84.2
WP_000971068.1\|607168_607309_-	YlcG family protein	K7PHH3	Enterobacteria_phage	5.5e-08	67.4
WP_001372483.1\|607305_607668_-	crossover junction endodeoxyribonuclease RusA	K7PM48	Enterobacteria_phage	1.5e-60	97.4
WP_001372487.1\|607664_607955_-	DUF1364 domain-containing protein	K7PGZ6	Enterobacteria_phage	4.8e-46	91.7
WP_000224914.1\|607947_608118_-	hypothetical protein	K7P7K0	Enterobacteria_phage	2.4e-13	69.8
WP_001372486.1\|608117_608573_-	DNA base-flipping protein YbcN	I6PD71	Cronobacter_phage	5.9e-59	66.2
WP_072157016.1\|608569_608671_-	hypothetical protein	NA	NA	NA	NA
WP_000825400.1\|608763_609216_-	hypothetical protein	NA	NA	NA	NA
WP_000720581.1\|609212_609773_-	hypothetical protein	NA	NA	NA	NA
WP_001403556.1\|610029_610221_+	hypothetical protein	NA	NA	NA	NA
WP_000145917.1\|610257_610551_-	protein ren	A0A0N6WES4	Escherichia_phage	1.1e-42	95.7
WP_001372464.1\|610547_611249_-	replication P family protein	K7P6G2	Enterobacteria_phage	3.8e-129	99.6
WP_001415152.1\|611245_612175_-	replication protein	A0A0M5M7Y1	Salmonella_phage	1.2e-109	63.4
WP_001182899.1\|612261_612801_-	hypothetical protein	M9NZI6	Enterobacteria_phage	2.0e-61	66.1
WP_001067458.1\|612870_613101_-	helix-turn-helix domain-containing protein	A0A2H4FNF3	Salmonella_phage	1.5e-21	68.0
WP_000858975.1\|613205_613895_+	helix-turn-helix transcriptional regulator	Q76H56	Enterobacteria_phage	2.8e-92	75.0
WP_000389051.1\|614017_614767_+	hypothetical protein	NA	NA	NA	NA
WP_000210934.1\|614763_615591_+	DUF3037 domain-containing protein	NA	NA	NA	NA
WP_000233576.1\|616099_616306_+	phage encoded cell division inhibitor protein	K7P6H3	Enterobacteria_phage	3.2e-28	85.3
WP_000995439.1\|616381_616678_+	host-nuclease inhibitor protein Gam	A0A1I9LJN1	Stx_converting_phage	1.6e-49	100.0
WP_000100847.1\|616683_617469_+	phage recombination protein Bet	A0A1I9LJN0	Stx_converting_phage	6.3e-149	100.0
WP_001372450.1\|617465_618146_+	YqaJ viral recombinase family protein	A0A0P0ZCD4	Stx2-converting_phage	3.0e-131	98.7
WP_072126246.1\|618142_618325_+	DUF1317 domain-containing protein	A0A0N7CHV0	Escherichia_phage	2.2e-28	98.3
WP_023148020.1\|618297_618489_+	DUF1382 family protein	A0A0P0ZC67	Stx2-converting_phage	2.8e-26	98.4
WP_001395510.1\|618499_618781_+	cell division protein ZapA	A0A0P0ZE02	Stx2-converting_phage	2.5e-47	100.0
WP_000763365.1\|618879_619101_+	TraR/DksA family transcriptional regulator	A0A0N7C211	Escherichia_phage	1.4e-34	97.3
WP_000120065.1\|619311_619914_-	hypothetical protein	NA	NA	NA	NA
WP_071525073.1\|620038_620224_-	hypothetical protein	NA	NA	NA	NA
WP_000545745.1\|620156_620324_+	hypothetical protein	A5VWB7	Enterobacteria_phage	2.9e-27	98.2
WP_001303849.1\|620363_620582_+	excisionase	Q77WA4	Escherichia_phage	3.7e-35	100.0
WP_000533646.1\|620559_621630_+\|integrase	tyrosine-type recombinase/integrase	Q9MCR4	Enterobacteria_phage	1.9e-201	99.7
621704:621718	attR	NA	NA	NA	NA

DBSCAN-SWA_4

1406072 : 1421944

Escherichia_phage(35.29%)

capsid,integrase,tail

attL 1407598:1407617|attR 1422175:1422194

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000202566.1\|1406072_1407659_-	peptide chain release factor 3	D0R0F5	Streptococcus_phage	5.3e-30	24.9
1407598:1407617	attL	NA	NA	NA	NA
WP_001378647.1\|1408211_1408508_+	hypothetical protein	A0A291AWW6	Escherichia_phage	6.8e-48	99.0
WP_001378643.1\|1408843_1409347_-	hypothetical protein	A0A291AWW1	Escherichia_phage	1.1e-90	100.0
WP_071594465.1\|1409776_1409899_-\|capsid	nucleocapsid protein	NA	NA	NA	NA
WP_001171282.1\|1410302_1411265_+	hypothetical protein	A0A0A7NV63	Enterobacteria_phage	4.0e-174	91.1
WP_001681074.1\|1411268_1411796_+\|tail	tail fiber assembly protein	A0A077SK10	Escherichia_phage	1.9e-93	98.3
WP_000972143.1\|1411824_1412358_-\|tail	tail fiber assembly protein	C9DGR0	Escherichia_phage	6.4e-97	99.4
WP_000521508.1\|1413213_1413765_-	hypothetical protein	A0A291AWW8	Escherichia_phage	4.5e-101	100.0
WP_000649477.1\|1413808_1414009_-	transcriptional regulator	U5P445	Shigella_phage	7.9e-32	100.0
WP_000848748.1\|1414099_1414774_+	LexA family transcriptional repressor	U5P0T5	Shigella_phage	1.2e-132	100.0
WP_071587686.1\|1415225_1415426_+	hypothetical protein	NA	NA	NA	NA
WP_000135682.1\|1415440_1415803_+	hypothetical protein	U5P4J6	Shigella_phage	3.3e-60	100.0
WP_001763729.1\|1415868_1416693_+	DUF2303 family protein	U5P439	Shigella_phage	1.7e-149	99.6
WP_001401560.1\|1416821_1417358_+	5'-deoxynucleotidase	K7PKJ9	Enterobacteria_phage	2.2e-100	99.4
WP_001242749.1\|1417348_1417711_+	phage protein	U5P092	Shigella_phage	2.1e-67	100.0
WP_001377405.1\|1417710_1418331_+	DUF551 domain-containing protein	A5LH60	Enterobacteria_phage	1.2e-113	91.7
WP_001061361.1\|1418330_1418525_+	helix-turn-helix domain-containing protein	A5LH59	Enterobacteria_phage	1.3e-31	96.9
WP_001419254.1\|1418763_1420464_-	AIPR family protein	D0UIM0	Aggregatibacter_phage	4.0e-07	27.6
WP_001680166.1\|1420720_1421944_-\|integrase	site-specific integrase	A0A291AWU1	Escherichia_phage	7.6e-234	98.8
1422175:1422194	attR	NA	NA	NA	NA

DBSCAN-SWA_5

1510249 : 1516808

uncultured_Caudovirales_phage(16.67%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000684856.1\|1510249_1511206_+	Fe(3+) dicitrate ABC transporter permease subunit FecD	A0A2H4IY97	uncultured_Caudovirales_phage	1.1e-17	26.1
WP_000175457.1\|1511206_1511974_+	Fe(3+) dicitrate ABC transporter ATP-binding protein FecE	G3M9Y6	Bacillus_virus	6.4e-13	24.8
WP_000177060.1\|1512531_1512789_-	hypothetical protein	NA	NA	NA	NA
WP_001254876.1\|1513840_1514992_+\|transposase	IS30-like element IS30 family transposase	W5R8L2	Staphylococcus_phage	2.6e-42	36.0
WP_000747102.1\|1514911_1515262_-\|transposase	transposase	Q716C1	Shigella_phage	8.9e-39	97.7
WP_000227281.1\|1515362_1515935_+	hypothetical protein	Q858R9	Enterobacteria_phage	2.2e-71	69.0
WP_000594911.1\|1515983_1516808_-	hypothetical protein	L7TR00	Rhizobium_phage	3.0e-16	35.5

DBSCAN-SWA_6

1858480 : 1878526

Shigella_phage(37.5%)

lysis,integrase

attL 1849745:1849758|attR 1865092:1865105

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1849745:1849758	attL	NA	NA	NA	NA
WP_000332259.1\|1858480_1859578_+\|integrase	site-specific integrase	S5MDN5	Escherichia_phage	1.8e-210	99.2
WP_001217553.1\|1859638_1859887_+	DinI family protein	K7PLW4	Enterobacteria_phage	1.8e-38	100.0
WP_000543834.1\|1860109_1860661_+	SLATT domain-containing protein	NA	NA	NA	NA
WP_001678535.1\|1860638_1862009_+	reverse transcriptase	NA	NA	NA	NA
WP_000839596.1\|1862479_1862695_-\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	9.0e-34	100.0
WP_000799656.1\|1862762_1863815_-	site-specific DNA-methyltransferase	A5LH81	Enterobacteria_phage	2.7e-208	100.0
WP_001355891.1\|1863964_1864159_-	hypothetical protein	Q8SBE3	Shigella_phage	1.8e-28	100.0
WP_046657263.1\|1864405_1865572_+	nucleoid-associated protein	A0A291AUQ0	Sinorhizobium_phage	1.7e-12	25.3
1865092:1865105	attR	NA	NA	NA	NA
WP_046657265.1\|1865568_1866795_+	hypothetical protein	NA	NA	NA	NA
WP_016159280.1\|1866787_1867132_-	hypothetical protein	A0A0P0ZCW0	Stx2-converting_phage	3.3e-54	84.1
WP_001360050.1\|1867149_1868139_-	DUF968 domain-containing protein	A0A291AWV9	Escherichia_phage	1.5e-195	100.0
WP_001061404.1\|1868146_1868944_-	KilA-N domain-containing protein	A0A0P0ZCS0	Stx2-converting_phage	5.2e-151	100.0
WP_000767133.1\|1868963_1869353_-	RusA family crossover junction endodeoxyribonuclease	A5LH74	Enterobacteria_phage	1.6e-68	99.2
WP_032235543.1\|1869349_1869676_-	LexA family transcriptional regulator	A5LH73	Enterobacteria_phage	6.6e-52	98.1
WP_000066917.1\|1869672_1870326_-	phage N-6-adenine-methyltransferase	A5LH72	Enterobacteria_phage	1.9e-127	99.5
WP_072165319.1\|1870325_1870820_-	PerC family transcriptional regulator	U5P0U0	Shigella_phage	1.9e-87	97.6
WP_021527492.1\|1870816_1871635_-	helix-turn-helix domain-containing protein	Q8SBF1	Shigella_phage	3.1e-122	99.6
WP_001446924.1\|1871631_1871856_-	hypothetical protein	A0A291AX25	Escherichia_phage	7.0e-37	98.6
WP_032181493.1\|1871860_1872697_-	ash family protein	Q8SBF3	Shigella_phage	2.6e-137	91.7
WP_000515860.1\|1872693_1873245_-	hypothetical protein	Q8SBF4	Shigella_phage	7.6e-101	100.0
WP_000649477.1\|1873288_1873489_-	transcriptional regulator	U5P445	Shigella_phage	7.9e-32	100.0
WP_000859462.1\|1873579_1874254_+	LexA family transcriptional repressor	Q8SBF6	Shigella_phage	1.2e-132	100.0
WP_071587686.1\|1874705_1874906_+	hypothetical protein	NA	NA	NA	NA
WP_000135682.1\|1874920_1875283_+	hypothetical protein	U5P4J6	Shigella_phage	3.3e-60	100.0
WP_001753751.1\|1875348_1876173_+	DUF2303 family protein	U5P439	Shigella_phage	6.6e-149	99.3
WP_000610754.1\|1876359_1877142_+	hypothetical protein	NA	NA	NA	NA
WP_001093912.1\|1877178_1877448_+	hypothetical protein	S5MQM5	Escherichia_phage	2.5e-41	97.8
WP_000019186.1\|1877481_1878030_-	hypothetical protein	S5M7T3	Escherichia_phage	2.7e-82	89.6
WP_000287252.1\|1878052_1878526_-	SocA family protein	K4NZT7	Burkholderia_phage	2.4e-18	31.8

DBSCAN-SWA_7

2328224 : 2364590

Stx2-converting_phage(45.45%)

integrase,transposase

attL 2323647:2323670|attR 2364890:2364913

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
2323647:2323670	attL	NA	NA	NA	NA
WP_001298859.1\|2328224_2329766_+\|transposase	IS21-like element ISEc12 family transposase	K4I413	Acidithiobacillus_phage	1.7e-129	46.4
WP_053906593.1\|2329780_2330527_+	ATP-binding protein	U5N3V8	Enterobacteria_phage	6.0e-24	31.6
WP_053909994.1\|2330584_2331397_-	DUF945 domain-containing protein	A0A2C9CX26	Yersinia_phage	5.1e-45	39.8
WP_071596305.1\|2331417_2331552_-	cytoplasmic protein	NA	NA	NA	NA
WP_001323397.1\|2331551_2331710_-	DUF905 family protein	NA	NA	NA	NA
WP_060503901.1\|2331780_2334627_-	autotransporter adhesin Ag43	NA	NA	NA	NA
WP_032179701.1\|2334998_2335871_-	GTPase family protein	NA	NA	NA	NA
WP_000241617.1\|2335969_2336842_-	hypothetical protein	NA	NA	NA	NA
WP_001171554.1\|2338795_2339176_+	IS66 family insertion sequence hypothetical protein	A0A0P0ZBP6	Stx2-converting_phage	1.4e-66	100.0
WP_000612591.1\|2339172_2339520_+	IS66 family insertion sequence element accessory protein TnpB	A0A0P0ZBY2	Stx2-converting_phage	2.2e-61	100.0
WP_000998068.1\|2339569_2341108_+\|transposase	IS66 family transposase	A0A0P0ZBS5	Stx2-converting_phage	3.1e-293	97.3
WP_014966159.1\|2342555_2342753_+	hypothetical protein	NA	NA	NA	NA
WP_001387788.1\|2342655_2343258_-	hypothetical protein	NA	NA	NA	NA
WP_072153745.1\|2343352_2343631_-	AlpA family transcriptional regulator	NA	NA	NA	NA
WP_072153746.1\|2344454_2344640_-	hypothetical protein	NA	NA	NA	NA
WP_001545803.1\|2344820_2345018_-	hypothetical protein	NA	NA	NA	NA
WP_000148641.1\|2345221_2345791_+	inovirus Gp2 family protein	NA	NA	NA	NA
WP_000271020.1\|2345956_2346340_+	hypothetical protein	NA	NA	NA	NA
WP_032181455.1\|2346336_2346762_+	hypothetical protein	NA	NA	NA	NA
WP_000080195.1\|2347241_2348855_-\|transposase	IS66-like element ISEc23 family transposase	A0A0P0ZEB3	Stx2-converting_phage	3.0e-182	63.6
WP_000624711.1\|2348885_2349236_-	IS66 family insertion sequence element accessory protein TnpB	A0A0P0ZBY2	Stx2-converting_phage	4.0e-39	65.5
WP_001322394.1\|2349599_2350616_+\|transposase	IS5-like element IS5 family transposase	Q38213	Escherichia_phage	1.1e-185	99.4
WP_001618954.1\|2351660_2353691_-	hypothetical protein	NA	NA	NA	NA
WP_001618955.1\|2353696_2354887_-	hypothetical protein	NA	NA	NA	NA
WP_001618956.1\|2354907_2357025_-	hypothetical protein	NA	NA	NA	NA
WP_001618957.1\|2357029_2358439_-	ABC transporter ATP-binding protein	NA	NA	NA	NA
WP_024190230.1\|2358428_2359241_-	ABC transporter permease	NA	NA	NA	NA
WP_001618959.1\|2359246_2360392_-	glycosyltransferase family 4 protein	NA	NA	NA	NA
WP_086937185.1\|2360620_2361425_-\|transposase	IS5 family transposase	A0A0M5M147	Mycobacterium_phage	1.9e-31	38.4
WP_001218908.1\|2363405_2364590_-\|integrase	tyrosine-type recombinase/integrase	Q7M297	Enterobacteria_phage	3.4e-162	69.9
2364890:2364913	attR	NA	NA	NA	NA

DBSCAN-SWA_8

3375036 : 3388219

Escherichia_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001374723.1\|3375036_3375798_+	5'/3'-nucleotidase SurE	A0A1B1ITZ2	uncultured_Mediterranean_phage	2.0e-59	48.0
WP_000254708.1\|3375791_3376418_+	protein-L-isoaspartate O-methyltransferase	A0A1B1IU40	uncultured_Mediterranean_phage	5.7e-36	49.7
WP_001272592.1\|3376557_3377697_+	murein hydrolase activator NlpD	D7RWE0	Brochothrix_phage	1.7e-06	35.6
WP_000081550.1\|3377759_3378752_+	RNA polymerase sigma factor RpoS	G8CLC7	Synechococcus_phage	6.1e-32	37.6
WP_000104456.1\|3378845_3380210_-	GntP family transporter	NA	NA	NA	NA
WP_001136918.1\|3380298_3381075_-	HPr family phosphocarrier protein	NA	NA	NA	NA
WP_001278994.1\|3381079_3381718_-	aldolase	A0A077SK32	Escherichia_phage	1.4e-82	75.0
WP_000590392.1\|3381714_3382977_-	3-oxo-tetronate kinase	A0A077SLJ7	Escherichia_phage	1.3e-135	61.4
WP_000847985.1\|3382973_3383882_-	NAD(P)-dependent oxidoreductase	A0A077SLF7	Escherichia_phage	3.0e-118	76.9
WP_001297141.1\|3384077_3384845_+	DeoR/GlpR transcriptional regulator	A0A077SK06	Escherichia_phage	3.3e-70	56.7
WP_001141340.1\|3384895_3385552_-	protein-serine/threonine phosphatase	A0A222YWF0	Escherichia_phage	8.0e-49	46.3
WP_001272924.1\|3385657_3388219_-	DNA mismatch repair protein MutS	E3T5Q7	Cafeteria_roenbergensis_virus	1.7e-30	20.6

DBSCAN-SWA_9

3746219 : 3790394

Enterobacteria_phage(47.46%)

holin,integrase,lysis,terminase,portal,head

attL 3743739:3743755|attR 3793649:3793665

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
3743739:3743755	attL	NA	NA	NA	NA
WP_000194515.1\|3746219_3747653_-	glycoside hydrolase family 32 protein	F8WPR5	Bacillus_phage	7.0e-29	25.4
WP_001274871.1\|3747868_3748783_+	aminoimidazole riboside kinase	NA	NA	NA	NA
WP_001163428.1\|3750630_3750831_-	response regulator inhibitor TorI	K7P7V0	Enterobacteria_phage	2.4e-33	100.0
WP_001281201.1\|3750954_3751299_-	hypothetical protein	A0A0P0ZB93	Stx2-converting_phage	1.1e-57	97.4
WP_001277766.1\|3751399_3751579_-	Eag protein	K7PL40	Enterobacteria_phage	2.8e-28	96.6
WP_060503998.1\|3751675_3752245_-	DUF551 domain-containing protein	K7PK20	Enterobacteria_phage	3.1e-33	95.5
WP_060504002.1\|3752241_3752679_-	ead/Ea22-like family protein	K7P6T4	Enterobacteria_phage	5.9e-40	47.6
WP_060504005.1\|3752675_3752843_-	DUF2737 family protein	K7PJV9	Enterobacteria_phage	4.3e-23	96.4
WP_060504006.1\|3752853_3753150_-	DUF2856 family protein	Q76H42	Enterobacteria_phage	4.7e-41	87.8
WP_001016186.1\|3753166_3753715_-	3'-5' exoribonuclease	K7PM77	Enterobacteria_phage	9.5e-104	98.9
WP_023277046.1\|3753723_3754203_-	hypothetical protein	Q716E9	Shigella_phage	4.6e-94	99.4
WP_024167014.1\|3754212_3754686_-	single-stranded DNA-binding protein	Q716E8	Shigella_phage	1.2e-59	99.4
WP_060504008.1\|3754686_3755394_-	recombinase	K7PKU3	Enterobacteria_phage	1.3e-134	97.9
WP_001243355.1\|3755648_3755801_-	host cell division inhibitory peptide Kil	A5VWA5	Enterobacteria_phage	4.7e-21	100.0
WP_000972063.1\|3755785_3755920_-	hypothetical protein	K7PHK2	Enterobacteria_phage	3.1e-16	100.0
WP_001609782.1\|3755995_3756307_-	superinfection exclusion protein	A0A0N7BTN9	Escherichia_phage	1.0e-54	97.1
WP_000167595.1\|3756450_3756921_-	hypothetical protein	A0A1I9LJN4	Stx_converting_phage	3.7e-88	100.0
WP_060504010.1\|3756929_3757229_-	hypothetical protein	A5VW99	Enterobacteria_phage	6.5e-30	97.0
WP_000856967.1\|3757631_3758282_-	LexA family transcriptional regulator	A5VW98	Enterobacteria_phage	1.1e-122	100.0
WP_000276886.1\|3758362_3758548_+	hypothetical protein	A5VW97	Enterobacteria_phage	1.6e-26	100.0
WP_001177653.1\|3758656_3758935_+	transcriptional regulator	Q8VNP9	Enterobacteria_phage	3.6e-43	100.0
WP_000539336.1\|3759117_3760008_+	hypothetical protein	G5DA89	Enterobacteria_phage	3.4e-159	99.7
WP_001549089.1\|3759997_3761434_+	AAA family ATPase	K7PGR8	Enterobacteria_phage	7.9e-275	100.0
WP_000796282.1\|3761509_3761836_+	hypothetical protein	Q716D0	Shigella_phage	3.3e-59	100.0
WP_000049638.1\|3761832_3762033_+	hypothetical protein	Q716C9	Shigella_phage	4.6e-32	100.0
WP_060504012.1\|3762044_3762311_+	hypothetical protein	Q716C8	Shigella_phage	4.3e-25	63.1
WP_001515066.1\|3762313_3762520_+	hypothetical protein	NA	NA	NA	NA
WP_060504015.1\|3762528_3762939_+	recombination protein NinB	A0A0P0ZCW6	Stx2-converting_phage	1.5e-69	97.1
WP_001254255.1\|3762935_3763112_+	NinE family protein	A5VW90	Enterobacteria_phage	4.6e-28	100.0
WP_060504017.1\|3763108_3764059_+	DNA cytosine methyltransferase	Q858D4	Salmonella_phage	2.6e-96	47.3
WP_000950963.1\|3764051_3764228_+	protein ninF	Q76H71	Enterobacteria_phage	6.7e-27	100.0
WP_060504019.1\|3764220_3764832_+	recombination protein NinG	A0A088CQ20	Enterobacteria_phage	3.9e-98	98.0
WP_000144614.1\|3764828_3765035_+	protein ninH	Q716C0	Shigella_phage	7.3e-33	100.0
WP_060504021.1\|3765012_3765678_+	serine/threonine protein phosphatase	A0A088CPU5	Enterobacteria_phage	6.1e-129	97.3
WP_060504023.1\|3765674_3766298_+	antitermination protein	K7PM87	Enterobacteria_phage	9.8e-113	99.0
WP_000839574.1\|3766845_3767061_+\|holin	holin	M1FN85	Enterobacteria_phage	2.4e-34	100.0
WP_060504025.1\|3767060_3767558_+	lysozyme	M1FJA0	Enterobacteria_phage	1.7e-91	98.8
WP_060504028.1\|3767554_3767998_+\|lysis	lysis protein	Q9MCN3	Enterobacteria_phage	1.2e-67	94.4
WP_032181221.1\|3767985_3768138_+	hypothetical protein	K7PKL2	Enterobacteria_phage	1.5e-19	94.0
WP_000877024.1\|3768343_3768874_+	KilA-N domain-containing protein	B8K1H1	Salmonella_phage	3.4e-90	95.5
WP_000807785.1\|3769130_3769373_+	DUF2560 family protein	A0A0M4R322	Salmonella_phage	7.5e-37	100.0
WP_000179915.1\|3769452_3769878_+	hypothetical protein	Q716H4	Shigella_phage	1.9e-67	90.8
WP_060504031.1\|3769874_3771287_+\|terminase	PBSX family phage terminase large subunit	Q716H3	Shigella_phage	1.4e-276	99.4
WP_060504033.1\|3771289_3773416_+\|portal	portal protein	Q716H2	Shigella_phage	0.0e+00	99.9
WP_000426736.1\|3773429_3774314_+	hypothetical protein	Q716H1	Shigella_phage	4.7e-145	100.0
WP_060504035.1\|3774325_3775597_+\|head	head protein	Q716H0	Shigella_phage	3.0e-241	99.8
WP_000375639.1\|3775639_3775825_+	hypothetical protein	Q716G9	Shigella_phage	4.6e-26	98.4
WP_050484735.1\|3775799_3776231_+	packaged DNA stabilization protein p27	Q716G8	Shigella_phage	1.7e-76	99.3
WP_060504038.1\|3776290_3777709_+	hypothetical protein	Q9AYZ4	Salmonella_phage	5.4e-276	99.6
WP_060504040.1\|3777708_3778662_+	hypothetical protein	Q716G6	Shigella_phage	5.4e-94	84.9
WP_000614037.1\|3778661_3779117_+	DUF2824 family protein	A0A088CQ57	Enterobacteria_phage	8.8e-87	99.3
WP_032191772.1\|3779119_3779812_+	hypothetical protein	A5VW66	Enterobacteria_phage	2.2e-113	97.4
WP_060504042.1\|3779822_3781238_+	DNA transfer protein	I6RSG0	Salmonella_phage	3.1e-199	80.0
WP_060504043.1\|3781237_3783241_+	hypothetical protein	A0A2I7QW93	Vibrio_phage	1.4e-96	36.8
WP_000275950.1\|3783249_3783570_-	hypothetical protein	NA	NA	NA	NA
WP_000757526.1\|3783600_3783966_+	hypothetical protein	A0A192Y6W5	Salmonella_phage	2.1e-67	100.0
WP_000151196.1\|3784229_3784415_+	hypothetical protein	I6RSG3	Salmonella_phage	1.1e-08	100.0
WP_001036007.1\|3784389_3784599_-	hypothetical protein	I6R975	Salmonella_phage	5.9e-30	98.6
WP_001549440.1\|3784595_3784832_-	Arc family DNA-binding protein	G0ZNE9	Cronobacter_phage	2.2e-17	59.2
WP_001549438.1\|3784920_3785094_+	Arc family DNA-binding protein	NA	NA	NA	NA
WP_060504045.1\|3785156_3786035_+	antirepressor	I6R977	Salmonella_phage	4.0e-96	78.5
WP_072156916.1\|3786145_3786640_-	hypothetical protein	A0A173GC65	Salmonella_phage	2.0e-28	41.6
WP_060504054.1\|3789236_3790394_-\|integrase	prophage integrase IntS	A5VW56	Enterobacteria_phage	1.4e-221	99.2
3793649:3793665	attR	NA	NA	NA	NA

DBSCAN-SWA_10

4038034 : 4047476

Enterobacteria_phage(85.71%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000569361.1\|4038034_4038961_+	glycine betaine ABC transporter ATP binding protein YehX	F2Y1V5	Organic_Lake_phycodnavirus	5.7e-08	26.8
WP_000783120.1\|4038965_4039697_+	glycine betaine ABC transporter permease YehW	NA	NA	NA	NA
WP_001216963.1\|4039677_4039785_-	protein YohO	NA	NA	NA	NA
WP_001240401.1\|4039844_4040576_-	HTH-type transcriptional regulator MlrA	Q9EYF2	Enterobacteria_phage	9.7e-112	99.5
WP_001295431.1\|4040797_4042483_+	two-component regulatory system sensor histidine kinase BtsS	Q9EYF3	Enterobacteria_phage	2.5e-304	99.6
WP_000598641.1\|4042479_4043199_+	two-component system response regulator BtsR	NA	NA	NA	NA
WP_001295430.1\|4043245_4043716_+	DUF1456 family protein	Q9EYF4	Enterobacteria_phage	1.8e-82	100.0
WP_001295429.1\|4043756_4044218_-	YehR family lipoprotein	Q9EYF5	Enterobacteria_phage	1.9e-76	100.0
WP_001374182.1\|4044342_4046343_-	SWIM zinc finger family protein	Q9EYF6	Enterobacteria_phage	0.0e+00	96.3
WP_001292773.1\|4046339_4047476_-	VWA domain-containing protein	Q9EYF7	Enterobacteria_phage	3.2e-162	97.4

DBSCAN-SWA_11

4692223 : 4716004

Enterobacteria_phage(26.32%)

lysis,integrase,tail

attL 4687689:4687703|attR 4712244:4712258

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
4687689:4687703	attL	NA	NA	NA	NA
WP_000598292.1\|4692223_4692550_+	YnfA family protein	A0A218MNG8	uncultured_virus	9.9e-24	55.6
WP_001295394.1\|4692755_4693970_+	starvation-sensing protein RspA	Q6A202	Oenococcus_phage	1.4e-46	29.0
WP_000836058.1\|4693981_4695001_+	Zn-dependent oxidoreductase	E3SJ82	Synechococcus_phage	4.3e-17	26.2
WP_001360138.1\|4695058_4695169_+	hypothetical protein	NA	NA	NA	NA
WP_000877001.1\|4695188_4696469_-\|integrase	site-specific integrase	B6DZ48	Enterobacteria_phage	6.6e-156	62.3
WP_001296941.1\|4696503_4696740_-	excisionase family protein	S4TND0	Salmonella_phage	6.1e-15	50.7
WP_001372999.1\|4696827_4699299_-	exonuclease	K7PLW7	Enterobacteria_phage	6.1e-57	59.8
WP_001083281.1\|4699392_4699584_-\|lysis	lysis protein YdfD	NA	NA	NA	NA
WP_000854559.1\|4699580_4699769_-	cell division inhibition protein DicB	NA	NA	NA	NA
WP_072163420.1\|4699852_4700095_+	hypothetical protein	NA	NA	NA	NA
WP_000054501.1\|4700075_4701041_+	hypothetical protein	U5P0A0	Shigella_phage	9.7e-59	63.9
WP_001373616.1\|4701081_4701504_+	DUF977 family protein	A0A0U2QQN3	Escherichia_phage	2.0e-61	85.6
WP_001678528.1\|4701633_4702578_-	hypothetical protein	NA	NA	NA	NA
WP_001678529.1\|4703125_4704475_-	hypothetical protein	A0A1W6JNS5	Morganella_phage	5.7e-259	98.0
WP_023147793.1\|4704792_4705395_+\|integrase	tyrosine-type recombinase/integrase	A0A1V0E036	Clostridioides_phage	3.7e-08	31.2
WP_023147794.1\|4705754_4706735_+	hypothetical protein	NA	NA	NA	NA
WP_032181055.1\|4706939_4707248_+	hypothetical protein	NA	NA	NA	NA
WP_122083109.1\|4707254_4707362_-	hypothetical protein	Q7Y2Q9	Escherichia_phage	3.8e-09	100.0
WP_001013632.1\|4707406_4707619_+	type I toxin-antitoxin system Hok family toxin	A0A0U2QV81	Escherichia_phage	2.0e-25	95.4
WP_000980999.1\|4707834_4708086_+	hypothetical protein	NA	NA	NA	NA
WP_023147795.1\|4708152_4708431_+	hypothetical protein	I6PCV7	Cronobacter_phage	7.4e-12	48.4
WP_001373319.1\|4708432_4709482_+	DUF968 domain-containing protein	U5P0K4	Shigella_phage	4.2e-108	54.3
WP_000904112.1\|4709494_4709869_+	RusA family crossover junction endodeoxyribonuclease	V5URS4	Shigella_phage	8.4e-35	62.7
WP_000762889.1\|4709865_4710687_+	antitermination protein	K7P7B9	Enterobacteria_phage	2.7e-78	59.0
WP_001373320.1\|4711432_4713595_+	DUF1983 domain-containing protein	A0A291AWT4	Escherichia_phage	0.0e+00	96.6
4712244:4712258	attR	NA	NA	NA	NA
WP_032181053.1\|4714426_4715824_+	chaperone of endosialidase	K7PGT9	Enterobacteria_phage	1.4e-204	85.2
WP_072163404.1\|4715878_4716004_+\|tail	phage tail protein	K7PMH7	Enterobacteria_phage	1.5e-12	82.5

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP040885

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. NZ_CP040884

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

3. NZ_CP040886

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection