CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP020368	Escherichia coli strain BLR(DE3) chromosome, complete genome	7 crisprs	DinG,RT,cas3,c2c9_V-U4,DEDDh,csa3,cas2,cas1,cas6e,cas5,cas7,cse2gr11,cas8e	0	11	8	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP020368_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP020368_1

344489-344635

Orphan

Consensus_repeat	Method
TCCGGCCTACGGATGGCGCGAGAATTTGTAGGCCTGATAAGACGCG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP020368_1

>merge|NZ_CP020368|1|344489-344635|CRISPRCasFinder
TCCGGCCTACGGATGGCGCGAGAATTTGTAGGCCTGATAAGACGCGTTAGCGTCGCATCAGGCATCTGCGCACGACTGCCGGATGCGGCGTAAACGCCTTATCCGGCCTACGGATGGCGCGGGAATTTGTAGGCCTGATAAGACGCG

>NZ_CP020368|1|1|344489-344635|CRISPRCasFinder
TCCGGCCTACGGATGGCGCGAGAATTTGTAGGCCTGATAAGACGCG	TTAGCGTCGCATCAGGCATCTGCGCACGACTGCCGGATGCGGCGTAAACGCCTTA
TCCGGCCTACGGATGGCGCGGGAATTTGTAGGCCTGATAAGACGCG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP020368.1\|WP_001096705.1\|346106_346646_+\|DUF2058-domain-containing-protein	unknown	unknown	gnl\|CDD\|225664
NZ_CP020368.1\|WP_000419042.1\|346871_347705_-\|S-formylglutathione-hydrolase-FrmB	unknown	unknown	gnl\|CDD\|131868
NZ_CP020368.1\|WP_000044314.1\|342455_343406_+\|acetaldehyde-dehydrogenase-(acetylating)	unknown	unknown	gnl\|CDD\|236227
NZ_CP020368.1\|WP_000114585.1\|352857_353685_+\|taurine-ABC-transporter-permease-TauC	unknown	unknown	gnl\|CDD\|182276
NZ_CP020368.1\|WP_000004024.1\|353681_354533_+\|taurine-dioxygenase	unknown	unknown	gnl\|CDD\|181947
NZ_CP020368.1\|WP_000121898.1\|340773_341640_+\|2-hydroxy-6-oxononadienedioate/2-hydroxy-6--oxononatrienedioate-hydrolase	unknown	unknown	gnl\|CDD\|132386
NZ_CP020368.1\|WP_000543457.1\|339811_340756_+\|2,3-dihydroxyphenylpropionate/2,-3-dihydroxicinnamic-acid-1,2-dioxygenase	unknown	unknown	gnl\|CDD\|153377
NZ_CP020368.1\|WP_001320653.1\|330783_331395_-\|galactoside-O-acetyltransferase	unknown	unknown	gnl\|CDD\|181930
NZ_CP020368.1\|WP_001141271.1\|348941_349217_-\|formaldehyde-responsive-transcriptional-repressor-FrmR	unknown	unknown	gnl\|CDD\|183095
NZ_CP020368.1\|WP_000160727.1\|341649_342459_+\|2-keto-4-pentenoate-hydratase	unknown	unknown	gnl\|CDD\|183092
NZ_CP020368.1\|WP_000291549.1\|331460_332714_-\|lactose-permease	unknown	unknown	gnl\|CDD\|236549
NZ_CP020368.1\|WP_001018416.1\|351118_352081_+\|taurine-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|183158
NZ_CP020368.1\|WP_001007410.1\|338145_339810_+\|bifunctional-3-(3-hydroxy-phenyl)propionate/3-hydroxycinnamic-acid-hydroxylase	unknown	unknown	gnl\|CDD\|235727
NZ_CP020368.1\|WP_000107627.1\|344793_346005_+\|3-(3-hydroxy-phenyl)propionate-transporter	unknown	unknown	gnl\|CDD\|236927
NZ_CP020368.1\|WP_001310587.1\|337121_338069_-\|DNA-binding-transcriptional-activator-MhpR	unknown	unknown	gnl\|CDD\|182100
NZ_CP020368.1\|WP_000939399.1\|352093_352861_+\|taurine-ABC-transporter-ATP-binding-subunit	unknown	unknown	gnl\|CDD\|183056
NZ_CP020368.1\|WP_000596085.1\|349402_350176_-\|YaiO-family-outer-membrane-beta-barrel-protein	unknown	unknown	gnl\|CDD\|275183
NZ_CP020368.1\|WP_001013494.1\|343402_344416_+\|4-hydroxy-2-oxovalerate-aldolase	unknown	unknown	gnl\|CDD\|181282
NZ_CP020368.1\|WP_000842100.1\|347797_348907_-\|S-(hydroxymethyl)glutathione-dehydrogenase/class-III-alcohol-dehydrogenase	unknown	unknown	gnl\|CDD\|176260
NZ_CP020368.1\|WP_000805902.1\|335962_337045_-\|LacI-family-DNA-binding-transcriptional-regulator	unknown	unknown	gnl\|CDD\|181929

Protein	Function_ID	Function_description	E-value
NZ_CP020368.1\|WP_001096705.1\|346106_346646_+\|DUF2058-domain-containing-protein	gnl\|CDD\|225664	COG3122, COG3122, Uncharacterized protein conserved in bacteria [Function unknown].	8.4008e-82
NZ_CP020368.1\|WP_000419042.1\|346871_347705_-\|S-formylglutathione-hydrolase-FrmB	gnl\|CDD\|131868	TIGR02821, S-formylglutathione_hydrolase, S-formylglutathione hydrolase. This model describes a protein family from bacteria, yeast, and human, with a conserved critical role in formaldehyde detoxification as S-formylglutathione hydrolase (EC 3.1.2.12). Members in eukaryotes such as the human protein are better known as esterase D (EC 3.1.1.1), an enzyme with broad specificity, although S-formylglutathione hydrolase has now been demonstrated as well. [Cellular processes, Detoxification].	2.04108e-131
NZ_CP020368.1\|WP_000044314.1\|342455_343406_+\|acetaldehyde-dehydrogenase-(acetylating)	gnl\|CDD\|236227	PRK08300, PRK08300, acetaldehyde dehydrogenase; Validated.	0
NZ_CP020368.1\|WP_000114585.1\|352857_353685_+\|taurine-ABC-transporter-permease-TauC	gnl\|CDD\|182276	PRK10160, PRK10160, taurine ABC transporter permease TauC.	2.50028e-169
NZ_CP020368.1\|WP_000004024.1\|353681_354533_+\|taurine-dioxygenase	gnl\|CDD\|181947	PRK09553, tauD, taurine dioxygenase; Reviewed.	0
NZ_CP020368.1\|WP_000121898.1\|340773_341640_+\|2-hydroxy-6-oxononadienedioate/2-hydroxy-6--oxononatrienedioate-hydrolase	gnl\|CDD\|132386	TIGR03343, 2-hydroxy-6-oxo-6-phenylhexa-24-dienoate_hydrolase, 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase. Members of this family are 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase, or HOPD hydrolase, the BphD protein of biphenyl degradation. BphD acts on the product of ring meta-cleavage by BphC. Many species carrying bphC and bphD are capable of degrading polychlorinated biphenyls as well as biphenyl itself.	1.18395e-119
NZ_CP020368.1\|WP_000543457.1\|339811_340756_+\|2,3-dihydroxyphenylpropionate/2,-3-dihydroxicinnamic-acid-1,2-dioxygenase	gnl\|CDD\|153377	cd07365, MhpB_like, Subunit B of the Class III Extradiol ring-cleavage dioxygenase, 2,3-dihydroxyphenylpropionate 1,2-dioxygenase (MhpB), which catalyzes the oxidization and subsequent ring-opening of 2,3-dihydroxyphenylpropionate. 2,3-dihydroxyphenylpropionate 1,2-dioxygenase (MhpB) catalyzes the oxidization and subsequent ring-opening of 2,3-dihydroxyphenylpropionate, yielding the product 2-hydroxy-6-oxo-nona-2,4-diene 1,9-dicarboxylate. It is an essential enzyme in the beta-phenylpropionic degradation pathway, in which beta-phenylpropionic is first hydrolyzed to produce 2,3-dihydroxyphenylpropionate. The enzyme is a member of the class III extradiol dioxygenase family, a group of enzymes which use a non-heme Fe(II) to cleave aromatic rings between a hydroxylated carbon and an adjacent non-hydroxylated carbon. LigAB-like class III enzymes are usually composed of two subunits, designated A and B, which form a tetramer composed of two copies of each subunit. This model represents the catalytic subunit, B. MhpB is likely to be a tetramer.	0
NZ_CP020368.1\|WP_001320653.1\|330783_331395_-\|galactoside-O-acetyltransferase	gnl\|CDD\|181930	PRK09527, lacA, galactoside O-acetyltransferase; Reviewed.	8.18293e-144
NZ_CP020368.1\|WP_001141271.1\|348941_349217_-\|formaldehyde-responsive-transcriptional-repressor-FrmR	gnl\|CDD\|183095	PRK11352, PRK11352, formaldehyde-responsive transcriptional repressor FrmR.	1.58302e-51
NZ_CP020368.1\|WP_000160727.1\|341649_342459_+\|2-keto-4-pentenoate-hydratase	gnl\|CDD\|183092	PRK11342, mhpD, 2-keto-4-pentenoate hydratase; Provisional.	0
NZ_CP020368.1\|WP_000291549.1\|331460_332714_-\|lactose-permease	gnl\|CDD\|236549	PRK09528, lacY, galactoside permease; Reviewed.	0
NZ_CP020368.1\|WP_001018416.1\|351118_352081_+\|taurine-ABC-transporter-substrate-binding-protein	gnl\|CDD\|183158	PRK11480, tauA, taurine transporter substrate binding subunit; Provisional.	0
NZ_CP020368.1\|WP_001007410.1\|338145_339810_+\|bifunctional-3-(3-hydroxy-phenyl)propionate/3-hydroxycinnamic-acid-hydroxylase	gnl\|CDD\|235727	PRK06183, mhpA, bifunctional 3-(3-hydroxy-phenyl)propionate/3-hydroxycinnamic acid hydroxylase.	0
NZ_CP020368.1\|WP_000107627.1\|344793_346005_+\|3-(3-hydroxy-phenyl)propionate-transporter	gnl\|CDD\|236927	PRK11551, PRK11551, putative 3-hydroxyphenylpropionic transporter MhpT; Provisional.	0
NZ_CP020368.1\|WP_001310587.1\|337121_338069_-\|DNA-binding-transcriptional-activator-MhpR	gnl\|CDD\|182100	PRK09834, PRK09834, DNA-binding transcriptional regulator.	4.4315e-150
NZ_CP020368.1\|WP_000939399.1\|352093_352861_+\|taurine-ABC-transporter-ATP-binding-subunit	gnl\|CDD\|183056	PRK11248, tauB, taurine ABC transporter ATP-binding subunit.	0
NZ_CP020368.1\|WP_000596085.1\|349402_350176_-\|YaiO-family-outer-membrane-beta-barrel-protein	gnl\|CDD\|275183	TIGR04390, hypothetical_protein, outer membrane protein, YaiO family. Members of this family share a domain of bacterial outer membrane beta barrel, up to the protein C-terminal residue (usually Phe or Trp). The member YaiO was shown experimentally to be localized to the outer membrane. [Unknown function, General].	5.60946e-48
NZ_CP020368.1\|WP_001013494.1\|343402_344416_+\|4-hydroxy-2-oxovalerate-aldolase	gnl\|CDD\|181282	PRK08195, PRK08195, 4-hyroxy-2-oxovalerate/4-hydroxy-2-oxopentanoic acid aldolase,; Validated.	0
NZ_CP020368.1\|WP_000842100.1\|347797_348907_-\|S-(hydroxymethyl)glutathione-dehydrogenase/class-III-alcohol-dehydrogenase	gnl\|CDD\|176260	cd08300, alcohol_DH_class_III, class III alcohol dehydrogenases. Members identified as glutathione-dependent formaldehyde dehydrogenase(FDH), a member of the zinc dependent/medium chain alcohol dehydrogenase family. FDH converts formaldehyde and NAD(P) to formate and NAD(P)H. The initial step in this process the spontaneous formation of a S-(hydroxymethyl)glutathione adduct from formaldehyde and glutathione, followed by FDH-mediated oxidation (and detoxification) of the adduct to S-formylglutathione. MDH family uses NAD(H) as a cofactor in the interconversion of alcohols and aldehydes or ketones. Like many zinc-dependent alcohol dehydrogenases (ADH) of the medium chain alcohol dehydrogenase/reductase family (MDR), these FDHs form dimers, with 4 zinc ions per dimer. The medium chain alcohol dehydrogenase family (MDR) have a NAD(P)(H)-binding domain in a Rossmann fold of a beta-alpha form. The N-terminal region typically has an all-beta catalytic domain. These proteins typically form dimers (typically higher plants, mammals) or tetramers (yeast, bacteria), and have 2 tightly bound zinc atoms per subunit. Alcohol dehydrogenase in the liver converts ethanol and NAD+ to acetaldehyde and NADH, while in yeast and some other microorganisms ADH catalyzes the conversion acetaldehyde to ethanol in alcoholic fermentation. ADH is a member of the medium chain alcohol dehydrogenase family (MDR), which have a NAD(P)(H)-binding domain in a Rossmann fold of a beta-alpha form. The NAD(H)-binding region is comprised of 2 structurally similar halves, each of which contacts a mononucleotide. A GxGxxG motif after the first mononucleotide contact half allows the close contact of the coenzyme with the ADH backbone. The N-terminal catalytic domain has a distant homology to GroES. These proteins typically form dimers (typically higher plants, mammals) or tetramers (yeast, bacteria), and have 2 tightly bound zinc atoms per subunit, a catalytic zinc at the active site and a structural zinc in a lobe of the catalytic domain. NAD(H) binding occurs in the cleft between the catalytic and coenzyme-binding domains at the active site, and coenzyme binding induces a conformational closing of this cleft. Coenzyme binding typically precedes and contributes to substrate binding.	0
NZ_CP020368.1\|WP_000805902.1\|335962_337045_-\|LacI-family-DNA-binding-transcriptional-regulator	gnl\|CDD\|181929	PRK09526, lacI, lac repressor; Reviewed.	0

>NZ_CP020368.1|WP_001013494.1|343402_344416_+|4-hydroxy-2-oxovalerate-aldolase
MNGKKLYISDVTLRDGMHAIRHQYSLENVRQIAKALDDAHVDSIEVAHGDGLQGSSFNYGFGAHSDLEWIEAAADVVKHAKIATLLLPGIGTIHDLKNAWQAGARVVRVATHCTEADVSAQHIQYARELGMDTVGFLMMSHMTTPENLAKQAKLMEGYGATCIYVVDSGGAMNMSDIRDRFRALKAVLKPETQTGMHAHHNLSLGVANSIEAVEEGCDRIDASLAGMGAGAGNAPLEVFIAAADKLGWQHGTDLYALMDAADDLVRPLQDRPVRVDRETLALGYAGVYSSFLRHCETAAARYGLSAVDILVELGKRRMVGGQEDMIVDVALDLRNNK
>NZ_CP020368.1|WP_000044314.1|342455_343406_+|acetaldehyde-dehydrogenase-(acetylating)
MSKRKVAIIGSGNIGTDLMIKILRHGQHLEMAVMVGIDPQSDGLARARRMGVATTHEGVIGLMNMPEFADIDIVFDATSAGAHVKNDAALREAKPDIRLIDLTPAAIGPYCVPVVNLEANVDQLNVNMVTCGGQATIPMVAAVSRVARVHYAEIIASIASKSAGPGTRANIDEFTETTSRAIEVVGGAAKGKAIIVLNPAEPPLMMRDTVYVLSDEASQDDIEASINEMAEAVQAYVPGYRLKQRVQFEVIPQDKPVNLPGVGQFSGLKTAVWLEVEGAAHYLPAYAGNLDIMTSSALATAEKMAQSLARKAGEAA
>NZ_CP020368.1|WP_000160727.1|341649_342459_+|2-keto-4-pentenoate-hydratase
MTKHTLEQLAADLRRAAEQGEAIAPLRDLIGIDNAEAAYAIQHINVQYDVAQGRRVVGRKVGLTHPKVQQQLGVDQPDFGTLFADMCYGDNEIIPFSRVLQPRIEAEIALVLNRDLPATDITFDELYNAIEWVLPALEVVGSRIRDWSIQFVDTVADNASCGVYVIGGPAQRPAGLDLKNCAMKMTRNNEEVSSGRGSECLGHPLNAAVWLARKMASLGEPLRTGDIILTGALGPMVAVNAGDRFEAHIEGIGSVAATFSSAAPKGSLS
>NZ_CP020368.1|WP_000121898.1|340773_341640_+|2-hydroxy-6-oxononadienedioate/2-hydroxy-6--oxononatrienedioate-hydrolase
MSYQPQTEAATSRFLNVEEAGKTLRIHFNDCGQGDETVVLLHGSGPGATGWANFSRNIDPLVEAGYRVILLDCPGWGKSDSIVNSGSRSDLNARILKSVVDQLDIAKIHLLGNSMGGHSSVAFTLNWPERVGKLVLMGGGTGGMSLFTPMPTEGIKRLNQLYRQPTIENLKLMMDIFVFDTSDLTDALFEARLNNMLSRRDHLENFVKSLEANPKQFPDFGPRLAEIKAQTLIVWGRNDRFVPMDAGLRLLSGIAGSELHIFRDCGHWAQWEHADAFNQLVLNFLARP
>NZ_CP020368.1|WP_000543457.1|339811_340756_+|2,3-dihydroxyphenylpropionate/2,-3-dihydroxicinnamic-acid-1,2-dioxygenase
MHAYLHCLSHSPLVGYVDPAQEVLDEVNGVIASARERIAAFSPELVVLFAPDHYNGFFYDVMPPFCLGVGATAIGDFGSAAGELPVPVELAEACAHAVMKSGIDLAVSYCMQVDHGFAQPLEFLLGGLDKVPVLPVFINGVATPLPGFQRTRMLGEAIGRFTSTLNKRVLFLGSGGLSHQPPVPELAKADAHMRDRLLGSGKDLPASERELRQQRVISAAEKFVEDQRTLHPLNPIWDNQFMTLLEQGRIQELDAVSNEELSAIAGKSTHEIKTWVAAFAAISAFGNWRSEGRYYRPIPEWIAGFGSLSARTEN
>NZ_CP020368.1|WP_001007410.1|338145_339810_+|bifunctional-3-(3-hydroxy-phenyl)propionate/3-hydroxycinnamic-acid-hydroxylase
MAIQHPDIQPAVNHSVQVAIAGAGPVGLMMANYLGQMGIDVLVVEKLDKLIDYPRAIGIDDEALRTMQSVGLVDDVLPHTTPWHAMRFLTPKGRCFADIQPMTDEFGWPRRNAFIQPQVDAVMLEGVSRFPNVRCLFSRELEAFSQQDDEVTLHLKTAEGQREIVKAQWLVACDGGASFVRRTLNVPFEGKTAPNQWIVVDIANDPLSTPHIYLCCDPVRPYVSAALPHAVRRFEFMVMPGETEEQLREPQNMRKLLSKVLPNPDNVELIRQRVYTHNARLAQRFRIDRVLLAGDAAHIMPVWQGQGYNSGMRDAFNLAWKLALVIQGKARDALLDTYQQERRDHAKAMIDLSVTAGNVLAPPKRWQGTLRDGVSWLLNYLPPVKRYFLEMRFKPMPQYYGGALVREGEAKHSPVGKMFIQPKVTLENGDVTLLDNAIGANFAVIGWGCNPLWGMSDEQIQQWRALGTRFIQVVPEVQIHTAQDNHDGVLRVGDTQGRLRSWFAQHNASLVVMRPDRFVAATAIPQTLGNTLNKLASVMTLTRPDADVSVEKVA
>NZ_CP020368.1|WP_001310587.1|337121_338069_-|DNA-binding-transcriptional-activator-MhpR
MIFYCALSIGRVFSATIKTCPNVHQVHHVVLTIEMSINMQNNEQTEYKTVRGLTRGLMLLNMLNKLDGGASVGLLAELSGLHRTTVRRLLETLQEEGYVRRSPSDDSFRLTIKVRQLSEGFRDEQWISALAAPLLGDLLREVVWPTDVSTLDVDAMVVRETTHRFSRLSFHRAMVGRRLPLLKTASGLTWLAFCPEQDRKELIEMLASRPGDDYQLAREPLKLEAILARARKEGYGQNYRGWDQEEKIASIAVPLRSEQRVIGCLNLVYMASAMTIEQAAEKHLPALQRVAKQIEEGVESQAILVAGRRSGMHLR
>NZ_CP020368.1|WP_000805902.1|335962_337045_-|LacI-family-DNA-binding-transcriptional-regulator
MKPVTLYDVAEYAGVSYQTVSRVVNQASHVSAKTREKVEAAMAELNYIPNRVAQQLAGKQSLLIGVATSSLALHAPSQIVAAIKSRADQLGASVVVSMVERSGVEACKAAVHNLLAQRVSGLIINYPLDDQDAIAVEAACTNVPALFLDVSDQTPINSIIFSHEDGTRLGVEHLVALGHQQIALLAGPLSSVSARLRLAGWHKYLTRNQIQPIAEREGDWSAMSGFQQTMQMLNEGIVPTAMLVANDQMALGAMRAITESGLRVGADISVVGYDDTEDSSCYIPPLTTIKQDFRLLGQTSVDRLLQLSQGQAVKGNQLLPVSLVKRKTTLAPNTQTASPRALADSLMQLARQVSRLESGQ
>NZ_CP020368.1|WP_000291549.1|331460_332714_-|lactose-permease
MYYLKNTNFWMFGLFFFFYFFIMGAYFPFFPIWLHDINHISKSDTGIIFAAISLFSLLFQPLFGLLSDKLGLRKYLLWIITGMLVMFAPFFIFIFGPLLQYNILVGSIVGGIYLGFCFNAGAPAVEAFIEKVSRRSNFEFGRARMFGCVGWALCASIVGIMFTINNQFVFWLGSGCALILAVLLFFAKTDAPSSATVANAVGANHSAFSLKLALELFRQPKLWFLSLYVIGVSCTYDVFDQQFANFFTSFFATGEQGTRVFGYVTTMGELLNASIMFFAPLIINRIGGKNALLLAGTIMSVRIIGSSFATSALEVVILKTLHMFEVPFLLVGCFKYITSQFEVRFSATIYLVCFCFFKQLAMIFMSVLAGNMYESIGFQGAYLVLGLVALGFTLISVFTLSGPGPLSLLRRQVNEVA
>NZ_CP020368.1|WP_001320653.1|330783_331395_-|galactoside-O-acetyltransferase
MNMPMTERIKAGKLFTDMCEGLPEKRLRGKTLMYEFNHSHPSEVEKRESLIKEMFATVGENAWVEPPVYFSYGSNIHIGRNFYANFNLTIVDDYTVTIGDNVLIAPNVTLSVTGHPVHHELRKNGEMYSFPITIGNNVWIGSHVVINPGVTIGDNSVIGAGSIVTKDIPPNVVAAGVPCRVIREINDRDKHYYFKDYKVESSV
>NZ_CP020368.1|WP_000107627.1|344793_346005_+|3-(3-hydroxy-phenyl)propionate-transporter
MSTRTPSSSSSRLMLTIGLCFLVALMEGLDLQAAGIAAGGIAQAFALDKMQMGWIFSAGILGLLPGALVGGMLADRYGRKRILIGSVALFGLFSLATAIAWDFPSLVFARLMTGVGLGAALPNLIALTSEAAGPRFRGTAVSLMYCGVPIGAALAATLGFAGANLAWQTVFWVGGVVPLILVPLLMRWLPESAVFAGEKQSAPPLRALFAPETATATLLLWLCYFFTLLVVYMLINWLPLLLVEQGFQPSQAAGVMFALQMGAASGTLMLGALMDKLRPVTMSLLIYSGMLASLLALGTVSSFNGMLLAGFVAGLFATGGQSVLYALAPLFYSSQIRATGVGTAVAVGRLGAMSGPLLAGKMLALGTGTVGVMAASAPGILVAGLAVFILMSRRSRIQPCADA
>NZ_CP020368.1|WP_001096705.1|346106_346646_+|DUF2058-domain-containing-protein
MAKLTLQEQLLKAGLVTSKKAAKVERTAKKSRVQAREARAAVEENKKAQLERDKQLSEQQKQAALAKEYKAQVKQLIEMNRITIANGDIGFNFTDGNLIKKIFVDKLTQAQLINGRLAIARLLVDNNSEGEYAIIPASVADKIAQRDASSIVLHSALSAEEQDEDDPYADFKVPDDLMW
>NZ_CP020368.1|WP_000419042.1|346871_347705_-|S-formylglutathione-hydrolase-FrmB
MELIEKHASFGGWQNVYRHYSQSLKCEMNVGVYLPPKAANEKLPVLYWLSGLTCNEQNFITKSGMQRYAAEHNIIVVAPDTSPRGSHVADADRYDLGQGAGFYLNATQAPWNEHYKMYDYIRNELPDLVMHHFPATAKKSISGHSMGGLGALVLALRNPDEYVSVSAFSPIVSPSQVPWGQQAFAAYLAENKDAWLDYDPVSLISQGQRVAEIMVDQGLSDDFYAEQLRTPNLEKICQEMNIKTLIRYHEGYDHSYYFVSSFIGEHIAYHANKLNMR
>NZ_CP020368.1|WP_000842100.1|347797_348907_-|S-(hydroxymethyl)glutathione-dehydrogenase/class-III-alcohol-dehydrogenase
MKSRAAVAFAPGKPLEIVEIDVAPPKKGEVLIKVTHTGVCHTDAFTLSGDDPEGVFPVVLGHEGAGVVVEVGEGVTSVKPGDHVIPLYTAECGECEFCRSGKTNLCVAVRETQGKGLMPDGTTRFSYNGQPLYHYMGCSTFSEYTVVAEVSLAKINPEANHEHVCLLGCGVTTGIGAVHNTAKVQPGDSVAVFGLGAIGLAVVQGARQAKAGRIIAIDTNPKKFDLARRFGATDCINPNDYDKPIKDVLLDINKWGIDHTFECIGNVNVMRAALESAHRGWGQSVIIGVAGAGQEISTRPFQLVTGRVWKGSAFGGVKGRSQLPGMVEDAMKGDIDLEPFVTHTMSLDEINDAFDLMHEGKSIRTVIRY
>NZ_CP020368.1|WP_001141271.1|348941_349217_-|formaldehyde-responsive-transcriptional-repressor-FrmR
MPSTPEEKKKVLTRVRRIRGQIDALERSLEGDAECRAILQQIAAVRGAANGLMAEVLESHIRETFDRNDCYSREVSQSVDDTIELVRAYLK
>NZ_CP020368.1|WP_000596085.1|349402_350176_-|YaiO-family-outer-membrane-beta-barrel-protein
MIKRTLLAAAIFSALPAYAGLTSITAGYDFTDYSGDHGNRNLAYAELVAKVENATLLFNLSQGRRDYETEHFNATRGQGAVWYKWNNWLTTRTGIAFADNTPVFARQDFRQDINLALLPKTLFTTGYRYTKYYDDVEVDAWQGGVSLYTGPVITSYRYTHYDSSDAGGSYSNMISVRLNDPRGTGYTQLWLSRGTGAYTYDWTPETRYGSMKSVSLQRIQPLTEQLNLGLTAGKVWYDTPTDDYNGLQLAAHLTWKF
>NZ_CP020368.1|WP_001018416.1|351118_352081_+|taurine-ABC-transporter-substrate-binding-protein
MAISSRNTLLAALAFIAFQAQAVNVTVAYQTSAEPAKVAQADNTFAKESGATVDWRKFDSGASIVRALASGDVQIGNLGSSPLAVAASQQVPIEVFLLASKLGNSEALVVKKTISKPEDLIGKRIAVPFISTTHYSLLAALKHWGIKPGQVEIVNLQPPAIIAAWQRGDIDGAYVWAPAVNALEKDGKVLTDSEQVGQWGAPTLDVWVVRKDFAEKHPEVVKAFAKSAIDAQQPYIANPDAWLKQPENISKLARLSGVPEGDVPGLVKGNTYLTPQQQTAELTGPVNKAIIDTAQFLKEQGKVPAVANDYSQYVTSRFVQ
>NZ_CP020368.1|WP_000939399.1|352093_352861_+|taurine-ABC-transporter-ATP-binding-subunit
MLQISHLYANYGGKPALEDINLTLESGELLVVLGPSGCGKTTLLNLIAGFVPYQHGSIQLAGKRIEGPGAERGVVFQNEGLLPWRNVQNNVAFGLQLAGIEKMQRLEIAHQMLKKVGLEGAEKRYIWQLSGGQRQRVGIARALAANPQLLLLDEPFGALDAFTRDQMQTLLLKLWQETGKQVLLITHDIEEAVFMATELVLLSPGPGRVLERLPLNFARRFVAGESSRSIKSDPQFIAMREYVLSRVFEQREAFS
>NZ_CP020368.1|WP_000114585.1|352857_353685_+|taurine-ABC-transporter-permease-TauC
MSVLINEKLHSHRLKWRWPLSRQVTLSIGTLAVLLTVWWAVAALQLISPLFLPPPQQVLAKLLTIAGPQGFMDATLWQHLAASLTRIVLALLAAVVIGIPVGIAMGLSPTVRGILDPIIELYRPVPPLAYLPLMVIWFGIGENSKILLIYLAIFAPVAMSALAGVKSVQQVRIRAARSLGASRAQVLWFVILPGALPEILTGLRIGLGVGWSTLVAAELIAATRGLGFMVQSAGEFLATDVVLAGIAVIAIIAFLLELGLRALQRRLTPWHGEVQ
>NZ_CP020368.1|WP_000004024.1|353681_354533_+|taurine-dioxygenase
MSERLSITPLGPYIGAQISGADLTRPLSDNQFEQLYHAVLRHQVVFLRDQAITPQQQRALAQRFGELHIHPVYPHAEGVDEIIVLDTHNDNPPDNDNWHTDVTFIETPPAGAILAAKELPSTGGDTLWTSGIAAYEALSVPFRQLLSGLRAEHDFRKSFPEYKYRKTEEEHQRWREAVAKNPPLLHPVVRTHPVSGKQALFVNEGFTTRIVDVSEKESEALLGFLFAHITKPEFQVRWRWQPNDIAIWDNRVTQHYANADYLPQRRIMHRATILGDKPFYRAG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP020368_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP020368_2

376478-376622

Orphan

Consensus_repeat	Method
ATGCCTGATGCGACGCTTGCCGCGTCTTATCAGGCCTACAAAA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP020368_2

>merge|NZ_CP020368|2|376478-376622|CRISPRCasFinder
ATGCCTGATGCGACGCTTGCCGCGTCTTATCAGGCCTACAAAAGGTGCCAGAACCGTAGGCCGGATAAGGCGTTCACGCCGCATCCGGCAATAAGTGCTCCGATGCCTGATGCGACGCTTGCCGCGTCTTATCAGGCCTGCAAAA

>NZ_CP020368|2|2|376478-376622|CRISPRCasFinder
ATGCCTGATGCGACGCTTGCCGCGTCTTATCAGGCCTACAAAA	GGTGCCAGAACCGTAGGCCGGATAAGGCGTTCACGCCGCATCCGGCAATAAGTGCTCCG
ATGCCTGATGCGACGCTTGCCGCGTCTTATCAGGCCTGCAAAA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP020368.1\|WP_001266503.1\|390412_391483_+\|tRNA-preQ1(34)-S-adenosylmethionine-ribosyltransferase-isomerase-QueA	unknown	unknown	gnl\|CDD\|234666
NZ_CP020368.1\|WP_001276425.1\|372052_372730_+\|AroM-family-protein	unknown	unknown	gnl\|CDD\|182491
NZ_CP020368.1\|WP_001295329.1\|386387_387761_+\|proline-specific-permease-ProY	unknown	unknown	gnl\|CDD\|182566
NZ_CP020368.1\|WP_000113933.1\|382543_383233_+\|phosphate-response-regulator-transcription-factor-PhoB	unknown	unknown	gnl\|CDD\|182277
NZ_CP020368.1\|WP_000698909.1\|378008_381155_-\|exonuclease-subunit-SbcC	unknown	unknown	gnl\|CDD\|182330
NZ_CP020368.1\|WP_001142439.1\|371603_371795_+\|protein-YaiA	unknown	unknown	gnl\|CDD\|182421
NZ_CP020368.1\|WP_000893580.1\|383290_384586_+\|phosphate-regulon-sensor-histidine-kinase-PhoR	unknown	unknown	gnl\|CDD\|182895
NZ_CP020368.1\|WP_001298537.1\|374509_375421_-\|recombination-associated-protein-RdgC	unknown	unknown	gnl\|CDD\|225521
NZ_CP020368.1\|WP_120795376.1\|373571_373655_+\|protein-YkiD	unknown	unknown	unknown
NZ_CP020368.1\|WP_012767698.1\|376698_377883_-\|MFS-transporter-AraJ	unknown	unknown	gnl\|CDD\|182234
NZ_CP020368.1\|WP_001221319.1\|381151_382354_-\|exonuclease-subunit-SbcD	unknown	unknown	gnl\|CDD\|182871
NZ_CP020368.1\|WP_000149639.1\|384992_386312_+\|branched-chain-amino-acid-transporter-carrier-protein-BrnQ	unknown	unknown	gnl\|CDD\|185331
NZ_CP020368.1\|WP_001300528.1\|387916_389734_+\|maltodextrin-glucosidase	unknown	unknown	gnl\|CDD\|236759
NZ_CP020368.1\|WP_000158159.1\|370388_370847_+\|YaiI/YqxD-family-protein	unknown	unknown	gnl\|CDD\|178882
NZ_CP020368.1\|WP_000484048.1\|368327_369443_+\|diguanylate-cyclase-AdrA	unknown	unknown	gnl\|CDD\|182329
NZ_CP020368.1\|WP_001219309.1\|375545_376454_+\|fructokinase	unknown	unknown	gnl\|CDD\|236565
NZ_CP020368.1\|WP_000193393.1\|371029_371554_+\|shikimate-kinase-AroL	unknown	unknown	gnl\|CDD\|235153
NZ_CP020368.1\|WP_001295331.1\|369459_370269_-\|pyrroline-5-carboxylate-reductase	unknown	unknown	gnl\|CDD\|237008
NZ_CP020368.1\|WP_001009885.1\|389738_390320_-\|ACP-phosphodiesterase	unknown	unknown	gnl\|CDD\|182207
NZ_CP020368.1\|WP_000941942.1\|372801_373086_+\|pyrimidine/purine-nucleoside-phosphorylase	unknown	unknown	gnl\|CDD\|182565

Protein	Function_ID	Function_description	E-value
NZ_CP020368.1\|WP_001266503.1\|390412_391483_+\|tRNA-preQ1(34)-S-adenosylmethionine-ribosyltransferase-isomerase-QueA	gnl\|CDD\|234666	PRK00147, queA, S-adenosylmethionine:tRNA ribosyltransferase-isomerase; Provisional.	0
NZ_CP020368.1\|WP_001142439.1\|371603_371795_+\|protein-YaiA	gnl\|CDD\|182421	PRK10380, PRK10380, hypothetical protein; Provisional.	5.14477e-31
NZ_CP020368.1\|WP_001295329.1\|386387_387761_+\|proline-specific-permease-ProY	gnl\|CDD\|182566	PRK10580, proY, putative proline-specific permease; Provisional.	0
NZ_CP020368.1\|WP_000113933.1\|382543_383233_+\|phosphate-response-regulator-transcription-factor-PhoB	gnl\|CDD\|182277	PRK10161, PRK10161, phosphate response regulator transcription factor PhoB.	5.1688e-159
NZ_CP020368.1\|WP_000698909.1\|378008_381155_-\|exonuclease-subunit-SbcC	gnl\|CDD\|182330	PRK10246, PRK10246, exonuclease subunit SbcC; Provisional.	0
NZ_CP020368.1\|WP_001276425.1\|372052_372730_+\|AroM-family-protein	gnl\|CDD\|182491	PRK10481, PRK10481, hypothetical protein; Provisional.	1.41906e-119
NZ_CP020368.1\|WP_001298537.1\|374509_375421_-\|recombination-associated-protein-RdgC	gnl\|CDD\|225521	COG2974, RdgC, DNA recombination-dependent growth factor C [DNA replication, recombination, and repair].	0
NZ_CP020368.1\|WP_000893580.1\|383290_384586_+\|phosphate-regulon-sensor-histidine-kinase-PhoR	gnl\|CDD\|182895	PRK11006, phoR, phosphate regulon sensor histidine kinase PhoR.	0
NZ_CP020368.1\|WP_012767698.1\|376698_377883_-\|MFS-transporter-AraJ	gnl\|CDD\|182234	PRK10091, PRK10091, MFS transport protein AraJ; Provisional.	0
NZ_CP020368.1\|WP_001221319.1\|381151_382354_-\|exonuclease-subunit-SbcD	gnl\|CDD\|182871	PRK10966, PRK10966, exonuclease subunit SbcD; Provisional.	0
NZ_CP020368.1\|WP_000149639.1\|384992_386312_+\|branched-chain-amino-acid-transporter-carrier-protein-BrnQ	gnl\|CDD\|185331	PRK15433, PRK15433, branched-chain amino acid transporter carrier protein BrnQ.	0
NZ_CP020368.1\|WP_001300528.1\|387916_389734_+\|maltodextrin-glucosidase	gnl\|CDD\|236759	PRK10785, PRK10785, maltodextrin glucosidase; Provisional.	0
NZ_CP020368.1\|WP_000158159.1\|370388_370847_+\|YaiI/YqxD-family-protein	gnl\|CDD\|178882	PRK00124, PRK00124, YaiI/YqxD family protein.	2.50663e-80
NZ_CP020368.1\|WP_000484048.1\|368327_369443_+\|diguanylate-cyclase-AdrA	gnl\|CDD\|182329	PRK10245, adrA, diguanylate cyclase AdrA; Provisional.	0
NZ_CP020368.1\|WP_001219309.1\|375545_376454_+\|fructokinase	gnl\|CDD\|236565	PRK09557, PRK09557, fructokinase; Reviewed.	0
NZ_CP020368.1\|WP_000193393.1\|371029_371554_+\|shikimate-kinase-AroL	gnl\|CDD\|235153	PRK03731, aroL, shikimate kinase AroL.	2.43812e-108
NZ_CP020368.1\|WP_001295331.1\|369459_370269_-\|pyrroline-5-carboxylate-reductase	gnl\|CDD\|237008	PRK11880, PRK11880, pyrroline-5-carboxylate reductase; Reviewed.	1.87564e-128
NZ_CP020368.1\|WP_001009885.1\|389738_390320_-\|ACP-phosphodiesterase	gnl\|CDD\|182207	PRK10045, PRK10045, ACP phosphodiesterase.	3.03368e-136
NZ_CP020368.1\|WP_000941942.1\|372801_373086_+\|pyrimidine/purine-nucleoside-phosphorylase	gnl\|CDD\|182565	PRK10579, PRK10579, pyrimidine/purine nucleoside phosphorylase.	5.85948e-64

>NZ_CP020368.1|WP_001219309.1|375545_376454_+|fructokinase
MRIGIDLGGTKTEVIALGDAGEQLYRHRLPTPRDDYRQTIETIATLVDMAEQATGQRGTVGMGIPGSISPYTGVVKNANSTWLNGQPFDKDLSARLQREVRLANDANCLAVSEAVDGAAAGAQTVFAVIIGTGCGAGVAFNGRAHIGGNGTAGEWGHNPLPWMDEDELRYREEVPCYCGKQGCIETFISGTGFAMDYRRLSGHALKGSEIIRLVEESDPVAELALRRYELRLAKSLAHVVNILDPDVIVLGGGMSNVDRLYQTVGQLIKQFVFGGECETPVRKAKHGDSSGVRGAAWLWPQE
>NZ_CP020368.1|WP_001298537.1|374509_375421_-|recombination-associated-protein-RdgC
MLWFKNLMVYRLSREISLRAEEMEKQLASMAFTPCGSQDMAKMGWVPPMGSHSDALTHVANGQIVICARKEEKILPSPVIKQALEAKIAKLEAEQARKLKKTEKDSLKDEVLHSLLPRAFSRFSQTMMWIDTVNGLIMVDCASAKKAEDTLALLRKSLGSLPVVPLSMENPIELTLTEWVRSGSAAQGFQLLDEAELKSLLEDGGVIRAKKQDLTSEEITNHIEAGKVVTKLALDWQQRIQFVMCDDGSLKRLKFCDELRDQNEDIDREDFAQRFDADFILMTGELAALIQNLIEGLGGEAQR
>NZ_CP020368.1|WP_120795376.1|373571_373655_+|protein-YkiD
MTQRPWSKLQRKTHNIAALKIIARRSE
>NZ_CP020368.1|WP_000941942.1|372801_373086_+|pyrimidine/purine-nucleoside-phosphorylase
MLQSNEYFSGKVKSIGFSSSSTGRASVGVMVEGEYTFSTAEPEEMTVISGALNVLLPDATDWQVYEAGSVFNVPGHSEFHLQVAEPTSYLCRYL
>NZ_CP020368.1|WP_001276425.1|372052_372730_+|AroM-family-protein
MSASLAILTIGIVPMQEVLPLLTEYIDEDNISHHSLLGKLSREEVMAEYAPEAGEDTILTLLNDNQLAHVSRRKVERDLQGVVEVLDNRGYDVIILMSTANISSMTARNTIFLEPSRILPPLVSSIVEDHQVGVIVPVEEMLPVQAQKWQILQKSPVFSLGNPIHDSEQKIIDAGKELLAKGADVIMLDCLGFHQRHRDLLQKQLDVPVLLSNVLIARLAAELLV
>NZ_CP020368.1|WP_001142439.1|371603_371795_+|protein-YaiA
MPTKPPYPREAYIVTIEKGKPGQTVTWYQLRADHPKPDSLISEHPTAQEAMDAKKRYEDPDKE
>NZ_CP020368.1|WP_000193393.1|371029_371554_+|shikimate-kinase-AroL
MTQPLFLIGPRGCGKTTVGMALADSLNRRFVDTDQWLQSQLNMTVAEIVEREEWAGFRARETAALEAVTAPSTVIATGGGIILTEFNRHFMQNNGIVVYLCAPVSVLVNRLQAAPEEDLRPTLTGKPLSEEVQEVLEERDALYREVAHIIIDATNEPSQVISEIRSALAQTINC
>NZ_CP020368.1|WP_000158159.1|370388_370847_+|YaiI/YqxD-family-protein
MTIWVDADACPNVIKEILYRAAERMQMPLVLVANQSLRVPPSRFIRTLRVAAGFDVADNEIVRQCEAGDLVITADIPLAAEAIEKGAAALNPRGERYTPATIRERLTMRDFMDTLRASGIQTGGPDSLSQRDRQAFAAELEKWWLEVQRSRG
>NZ_CP020368.1|WP_001295331.1|369459_370269_-|pyrroline-5-carboxylate-reductase
MEKKIGFIGCGNMGKAILGGLIASGQVLPGQIWVYTPSPDKVAALHDQFGINAAESAQEVAQIADIIFAAVKPGIMIKVLSEITSSLNKDSLVVSIAAGVTLDQLARALGHDRKIIRAMPNTPALVNAGMTSVTPNALVTPEDTADVLNIFRCFGEAEVIAEPMIHPVVGVSGSSPAYVFMFIEAMADAAVLGGMPRAQAYKFAAQAVMGSAKMVLETGEHPGALKDMVCSPGGTTIEAVRVLEEKGFRAAVIEAMTKCMEKSEKLSKS
>NZ_CP020368.1|WP_000484048.1|368327_369443_+|diguanylate-cyclase-AdrA
MFPKIMNDENFFKKAAAHGEEPPLTPQNEHQRSGLRFARRVRLPRAVGLAGMFLPIASTLVSHPPPGWWWLVLVGWAFVWPHLAWQIASRAVDPLSREIYNLKTDAVLAGMWVGVMGVNVLPSTAMLMIMCLNLMGAGGPRLFVAGLVLMVVSCLVTLELTGITVSFNSAPLEWWLSLPIIVIYPLLFGWVSYQTATKLAEHKRRLQVMSTRDGMTGVYNRRHWETMLRNEFDNCRRHNRDATLLIIDIDHFKSINDTWGHDVGDEAIVALTRQLQITLRGSDVIGRFGGDEFAVIMSGTPAESAITAMLRVHEGLNTLRLPNTPQVTLRISVGVAPLNPQMSHYREWLKSADLALYKAKKAGRNRTEVAA
>NZ_CP020368.1|WP_012767698.1|376698_377883_-|MFS-transporter-AraJ
MKKVILSLALGTFGLGMAEFGIMGVLTELAHNVGISIPAAGHMISYYALGVVVGAPIIALFSSRYSLKHILLFLVALCVIGNAMFTLSSSYLMLAIGRLVSGFPHGAFFGVGAIVLSKIIKPGKVTAAVAGMVSGMTVANLLGIPLGTYLSQEFSWRYTFLLIAVFNIAVMASVYFWVPDICDEAKGNLREQFHFLRSPAPWLIFAATMFGNAGVFAWFSYVKPYMMFISGFSETAMTFIMMLVGLGMVLGNMLSGRISGRYSPLRIAAVTDFIIVLALLMLFFCGGMKTTSLIFAFICCAGLFALSAPLQILLLQNAKGGELLGAAGGQIAFNLGSAVGAYCGGMMLTLGLAYNYVALPAALLSFAAMSSLLLYGRYKRQQAADTPVLAKPLG
>NZ_CP020368.1|WP_000698909.1|378008_381155_-|exonuclease-subunit-SbcC
MKILSLRLKNLNSLKGEWKIDFTREPFASNGLFAITGPTGAGKTTLLDAICLALYHETPRLSNVSQSQNDLMTRDTAECLAEVEFEVKGEAYRAFWSQNRARNQPDGNLQVPRVELARCADGKILADKVKDKLELTATLTGLDYGRFTRSMLLSQGQFAAFLNAKPKERAELLEELTGTEIYGQISAMVFEQHKSARTELEKLQAQASGVALLTPEQVQSLTASLQVLTDEEKQLLTAQQQEQQSLNWLTRLDELQQEASRRQQALQQALAEEEKAQPQLAALSLAQPARNLRPHWERIAEHSAALAHTRQQIEEVNTRLQSTMALRASIRHHAAKQSAELQQQQQSLNTWLQEHDRFRQWNNELAGWRAQFSQQTSDREHLRQWQQQLTHAEQKLNALAAITLTLTADEVATALAQHAEQRPLRQHLVALHGQIVPQQKRLAQLQVAIQNVTQEQTQRNAALNEMRQRYKEKTQQLADVKTICEQEARIKTLEAQRAQLQAGQPCPLCGSTSHPAVEAYQALEPGVNQSRLLALENEVKKLGEEGATLRGQLDAITKQLQRDENEAQSLRQDEQALTQQWQAVTASLNITLQPLDDIQPWLDAQDEHERQLRLLSQRHELQGQIAAHNQQIIQYQQQIEQRQQLLLTTLTGYALTLPQEDEEESWLATRQQEAQSWQQRQNELTALQNRIQQLTPILETLPQSDELPHCEETVVLENWRQVHEQCLALHSQQQTLQQQDVLAAQSLQKAQAQFDTALQASVFDDQQAFLAALMDEQTLTQLEQLKQNLENQRRQAQTLVTQTAETLAQHQQHRPDDGLALTVTVEQIQQELAQTHQKLRENTTSQGEIRQQLKQDADNRQQQQTLMQQIAQMTQQVEDWGYLNSLIGSKEGDKFRKFAQGLTLDNLVHLANQQLTRLHGRYLLQRKASEALEVEVVDTWQADAVRDTRTLSGGESFLVSLALALALSDLVSHKTRIDSLFLDEGFGTLDSETLDTALDALDALNASGKTIGVISHVEAMKERIPVQIKVKKINGLGYSKLESTFAVK
>NZ_CP020368.1|WP_001221319.1|381151_382354_-|exonuclease-subunit-SbcD
MRILHTSDWHLGQNFYSKSREAEHQAFLDWLLETAQTHQVDAIIVAGDVFDTGSPPSYARTLYNRFVVNLQQTGCHLVVLAGNHDSVATLNESRDIMAFLNTTVVASAGHAPQILPRRDGTPGAVLCPIPFLRPRDIITSQAGLNGIEKQQHLLAAITDYYQQHYADACKLRGDQPLPIIATGHLTTVGASKSDAVRDIYIGTLDAFPAQNFPPADYIALGHIHRAQIIGGMEHVRYCGSPIPLSFDECGKSKYVHLVTFSNGKLESVENLNVPVTQPMAVLKGDLASITAQLEQWRDVSQEPPVWLDIEITTDEYLHDIQRKIQALTESLPVEVLLVRRSREQRERVLASQQRETLSELSVEEVFNRRLALEELDESQQQRLQHLFTTTLHTLAGEHEA
>NZ_CP020368.1|WP_000113933.1|382543_383233_+|phosphate-response-regulator-transcription-factor-PhoB
MARRILVVEDEAPIREMVCFVLEQNGFQPVEAEDYDSAVNQLNEPWPDLILLDWMLPGGSGIQFIKHLKRESMTRDIPVVMLTARGEEEDRVRGLETGADDYITKPFSPKELVARIKAVMRRISPMAVEEVIEMQGLSLDPTSHRVMAGEEPLEMGPTEFKLLHFFMTHPERVYSREQLLNHVWGTNVYVEDRTVDVHIRRLRKALEPGGHDRMVQTVRGTGYRFSTRF
>NZ_CP020368.1|WP_000893580.1|383290_384586_+|phosphate-regulon-sensor-histidine-kinase-PhoR
MLERLSWKRLVLELLLCCFPAFILGAFFGYLPWFLLASVTGLLIWHFWNLLRLSWWLWVDRSMTPPPGRGSWEPLLYGLHQMQLRNKKRRRELGNLIKRFRSGAESLPDAVVLTTEEGGIFWCNGLAQQILGLRWPEDNGQNILNLLRYPEFTQYLKTRDFSRPLNLVLNTGRHLEIRVMPYTHKQLLMVARDVTQMHQLEGARRNFFANVSHELRTPLTVLQGYLEMMDEQPLEGAVREKALHTMREQTQRMEGLVKQLLTLSKIEAAPTQLLNEKVDVPMMLRVVEREAQTLSQKKQTFTFEIDNGLKVSGNEDQLRSAISNLVYNAVNHTPEGTHITVRWLRVPHGAEFSVEDNGPGIAPEHIPRLTERFYRVDKARSRQTGGSGLGLAIVKHAVNHHESRLNIESTVGKGTRFSFVIPERLIAKNSD
>NZ_CP020368.1|WP_000149639.1|384992_386312_+|branched-chain-amino-acid-transporter-carrier-protein-BrnQ
MTHQLRSRDIIALGFMTFALFVGAGNIIFPPMVGLQAGEHVWTAAFGFLITAVGLPVLTVVALAKVGGGVDSLSTPIGKVAGVLLATVCYLAVGPLFATPRTATVSFEVGIAPLTGDSALPLFIYSLVYFAIVILVSLYPGKLLDTVGNFLAPLKIIALVILSVAAIVWPAGSISTATEAYQNAAFSNGFVNGYLTMDTLGAMVFGIVIVNAARSRGVTEARLLTRYTVWAGLMAGVGLTLLYLALFRLGSDSASLVDQSANGAAILHAYVQHTFGGGGSFLLAALIFIACLVTAVGLTCACAEFFAQYVPLSYRTLVFILGGFSMVVSNLGLSQLIQISVPVLTAIYPPCIALVVLSFTRSWWHNSSRVIAPPMFISLLFGILDGIKASAFSDILPSWAQRLPLAEQGLAWLMPTVVMVVLAIIWDRAAGRQVTSSAH
>NZ_CP020368.1|WP_001295329.1|386387_387761_+|proline-specific-permease-ProY
MESKNKLKRGLSTRHIRFMALGSAIGTGLFYGSADAIKMAGPSVLLAYIIGGIAAYIIMRALGEMSVHNPAASSFSRYAQENLGPLAGYITGWTYCFEILIVAIADVTAFGIYMGVWFPTVPHWIWVLSVVLIICAVNLMSVKVFGELEFWFSFFKVATIIIMIVAGFGIIIWGIGNGGQPTGIHNLWSNGGFFSNGWLGMVMSLQMVMFAYGGIEIIGITAGEAKDPEKSIPRAINSVPMRILVFYVGTLFVIMSIYPWNQVGTAGSPFVLTFQHMGITFAASILNFVVLTASLSAINSDVFGVGRMLHGMAEQGSAPKIFSKTSRRGIPWVTVLVMTTALLFAVYLNYIMPENVFLVIASLATFATVWVWIMILLSQIAFRRRLPPEEVKALKFKVPGGVATTIGGLIFLLFIIGLIGYHPDTRISLYVGFAWIVVLLIGWMFKRRHDRQLAENQ
>NZ_CP020368.1|WP_001300528.1|387916_389734_+|maltodextrin-glucosidase
MMLNAWHLPVPPFVKQSKDQLLITLWLTGEDPPQRIMLRTEHDNEEMSVPMHKQRSQPQPGVTAWRAAIDLSSGQPRRRYSFKLLWHDRQRWFTPQGFSRMPPARLEQFAVDVPDIGPQWAADQIFYQIFPDRFARSLPREAEQDHVYYHHAAGQEIILRDWDEPVTAQAGGSTFYGGDLDGISEKLPYLKKLGVTALYLNPVFKAPSVHKYDTEDYRHVDPQFGGDGALLRLRHNTQQLGMRLVLDGVFNHSGDSHAWFDRHNRGTGGACHNPESPWRDWYSFSDDGTALDWLGYASLPKLDYQSESLVNEIYRGEDSIVRHWLKAPWSMDGWRLDVVHMLGEAGGARNNMQHVAGITEAAKETQPEAYIVGEHFGDARQWLQADVEDAAMNYRGFTFPLWGFLANTDISYDPQQIDAQTCMAWMDNYRAGLSHQQQLRMFNQLDSHDTARFKTLLGRDIARLPLAVVWLFTWPGVPCIYYGDEVGLDGKNDPFCRKPFPWQVEKQDTALFALYQRMIALRKKSQALRHGGCQVLYAEDNVVVFVRVLNQQRVLVAINRGEACEVVLPASPFLNAVQWQCKEGHGQLTDGILALPAISATVWMN
>NZ_CP020368.1|WP_001009885.1|389738_390320_-|ACP-phosphodiesterase
MNFLAHLHLAHLAESSLSGNLLADFVRGNPEESFPPDVVAGIHMHRRIDVLTDNLPEVREAREWFRSETRRVAPITLDVMWDHFLSRHWSQLSPDFPLQEFVCYAREQVMTILPDSPPRFINLNNYLWSEQWLVRYRDMDFIQNVLNGMASRRPRLDALRDSWYDLDAHYDALETRFWQFYPRMMAQASRKAL
>NZ_CP020368.1|WP_001266503.1|390412_391483_+|tRNA-preQ1(34)-S-adenosylmethionine-ribosyltransferase-isomerase-QueA
MRVTDFSFELPESLIAHYPMPERSSCRLLSLDGPTGALTHGTFTDLLDKLNPGDLLVFNNTRVIPARLFGRKASGGKIEVLVERMLDDKRILAHIRASKAPKPGAELLLGDDESINATMTARHGALFEVEFNDERSVLDILNSIGHMPLPPYIDRPDEDADRELYQTVYSEKPGAVAAPTAGLHFDEPLLEKLRAKGVEMAFVTLHVGAGTFQPVRVDTIEDHIMHSEYAEVPQDVVDAVLAAKARGNRVIAVGTTSVRSLESAAQAAKNDLIEPFFDDTQIFIYPGFQYKVVDALVTNFHLPESTLIMLVSAFAGYQHTMNAYKAAVEEKYRFFSYGDAMFITYNPQAINERVGE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP020368_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP020368_3

2219714-2219829

Orphan

Consensus_repeat	Method
GCGTAAACGCCTTATCCGGCCTACGGCTC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP020368_3

>merge|NZ_CP020368|3|2219714-2219829|CRISPRCasFinder
GCGTAAACGCCTTATCCGGCCTACGGCTCGGTTTGTAGGCCTGATAAGACGCGCCAGCGTCGCATCAGGCTCCGGGTGCCGGATGCAGCGTGAACGCCTTATCCGGCCTACGGCTC

>NZ_CP020368|3|3|2219714-2219829|CRISPRCasFinder
GCGTAAACGCCTTATCCGGCCTACGGCTC	GGTTTGTAGGCCTGATAAGACGCGCCAGCGTCGCATCAGGCTCCGGGTGCCGGATGCA
GCGTGAACGCCTTATCCGGCCTACGGCTC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP020368.1\|WP_000135040.1\|2221065_2221320_+\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	unknown	unknown	gnl\|CDD\|182668
NZ_CP020368.1\|WP_001075164.1\|2217408_2219694_+\|ribonucleoside-diphosphate-reductase-1-subunit-alpha	unknown	unknown	gnl\|CDD\|181649
NZ_CP020368.1\|WP_001225852.1\|2199910_2200687_-\|YfaP-family-protein	unknown	unknown	gnl\|CDD\|227021
NZ_CP020368.1\|WP_000857257.1\|2225198_2226827_+\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	unknown	unknown	gnl\|CDD\|236847
NZ_CP020368.1\|WP_001209902.1\|2226816_2228076_+\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	unknown	unknown	gnl\|CDD\|225617
NZ_CP020368.1\|WP_001220069.1\|2212960_2216713_-\|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC	unknown	unknown	gnl\|CDD\|182059
NZ_CP020368.1\|WP_001000359.1\|2228072_2229263_+\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	unknown	unknown	gnl\|CDD\|132422
NZ_CP020368.1\|WP_001104549.1\|2200691_2202341_-\|DUF2300-domain-containing-protein	unknown	unknown	gnl\|CDD\|227732
NZ_CP020368.1\|WP_000992954.1\|2230398_2231202_-\|2-keto-3-deoxy-L-rhamnonate-aldolase	unknown	unknown	gnl\|CDD\|182257
NZ_CP020368.1\|WP_000332036.1\|2219935_2221066_+\|ribonucleotide-diphosphate-reductase-subunit-beta	unknown	unknown	gnl\|CDD\|181647
NZ_CP020368.1\|WP_000301050.1\|2221373_2222024_-\|lipopolysaccharide-kinase-InaA	unknown	unknown	gnl\|CDD\|182136
NZ_CP020368.1\|WP_000779102.1\|2222486_2223563_-\|glycerophosphodiester-phosphodiesterase	unknown	unknown	gnl\|CDD\|236859
NZ_CP020368.1\|WP_000948732.1\|2223567_2224926_-\|glycerol-3-phosphate-transporter	unknown	unknown	gnl\|CDD\|236889
NZ_CP020368.1\|WP_001300976.1\|2206879_2207503_-\|DUF1175-domain-containing-protein	unknown	unknown	gnl\|CDD\|225774
NZ_CP020368.1\|WP_000990753.1\|2212110_2212833_+\|bifunctional-3-demethylubiquinone-3-O-methyltransferase/2-octaprenyl-6-hydroxy-phenol-methylase	unknown	unknown	gnl\|CDD\|235350
NZ_CP020368.1\|WP_122987104.1\|2202341_2206736_-\|alpha-2-macroglobulin-family-protein	unknown	unknown	gnl\|CDD\|225248
NZ_CP020368.1\|WP_000140557.1\|2229455_2230358_+\|ISNCY-family-transposase	unknown	unknown	gnl\|CDD\|182167
NZ_CP020368.1\|WP_000012273.1\|2207499_2209188_-\|DUF2138-domain-containing-protein	unknown	unknown	gnl\|CDD\|227030
NZ_CP020368.1\|WP_001281254.1\|2209336_2211964_-\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	unknown	unknown	gnl\|CDD\|235502
NZ_CP020368.1\|WP_000786547.1\|2198652_2199837_+\|acetyl-CoA-C-acetyltransferase	unknown	unknown	gnl\|CDD\|180261

Protein	Function_ID	Function_description	E-value
NZ_CP020368.1\|WP_000135040.1\|2221065_2221320_+\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	gnl\|CDD\|182668	PRK10713, PRK10713, 2Fe-2S ferredoxin-like protein.	2.72138e-53
NZ_CP020368.1\|WP_001075164.1\|2217408_2219694_+\|ribonucleoside-diphosphate-reductase-1-subunit-alpha	gnl\|CDD\|181649	PRK09103, PRK09103, ribonucleoside-diphosphate reductase subunit alpha.	0
NZ_CP020368.1\|WP_001225852.1\|2199910_2200687_-\|YfaP-family-protein	gnl\|CDD\|227021	COG4676, COG4676, Uncharacterized protein conserved in bacteria [Function unknown].	4.17009e-153
NZ_CP020368.1\|WP_000857257.1\|2225198_2226827_+\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	gnl\|CDD\|236847	PRK11101, glpA, anaerobic glycerol-3-phosphate dehydrogenase subunit A.	0
NZ_CP020368.1\|WP_001209902.1\|2226816_2228076_+\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	gnl\|CDD\|225617	COG3075, GlpB, Anaerobic glycerol-3-phosphate dehydrogenase [Amino acid transport and metabolism].	0
NZ_CP020368.1\|WP_001220069.1\|2212960_2216713_-\|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC	gnl\|CDD\|182059	PRK09752, PRK09752, AIDA-I family autotransporter YfaL.	0
NZ_CP020368.1\|WP_001000359.1\|2228072_2229263_+\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	gnl\|CDD\|132422	TIGR03379, glycerol3P_GlpC, glycerol-3-phosphate dehydrogenase, anaerobic, C subunit. Members of this protein family are the membrane-anchoring, non-catalytic C subunit, product of the glpC gene, of a three-subunit, FAD-dependent, anaerobic glycerol-3-phosphate dehydrogenase. GlpC lasks classical hydrophobic transmembrane helices; Cole, et al suggest interaction with the membrane may involve amphipathic helices. GlcC has conserved Cys-containing motifs suggestive of iron-sulfur binding. This complex is found mostly in Escherichia coli and closely related species. [Energy metabolism, Anaerobic].	0
NZ_CP020368.1\|WP_001104549.1\|2200691_2202341_-\|DUF2300-domain-containing-protein	gnl\|CDD\|227732	COG5445, COG5445, Predicted secreted protein [Function unknown].	3.75964e-127
NZ_CP020368.1\|WP_000992954.1\|2230398_2231202_-\|2-keto-3-deoxy-L-rhamnonate-aldolase	gnl\|CDD\|182257	PRK10128, PRK10128, 2-keto-3-deoxy-L-rhamnonate aldolase; Provisional.	0
NZ_CP020368.1\|WP_000332036.1\|2219935_2221066_+\|ribonucleotide-diphosphate-reductase-subunit-beta	gnl\|CDD\|181647	PRK09101, nrdB, ribonucleotide-diphosphate reductase subunit beta; Reviewed.	0
NZ_CP020368.1\|WP_000301050.1\|2221373_2222024_-\|lipopolysaccharide-kinase-InaA	gnl\|CDD\|182136	PRK09902, PRK09902, lipopolysaccharide kinase InaA.	2.86156e-158
NZ_CP020368.1\|WP_000779102.1\|2222486_2223563_-\|glycerophosphodiester-phosphodiesterase	gnl\|CDD\|236859	PRK11143, glpQ, glycerophosphodiester phosphodiesterase; Provisional.	0
NZ_CP020368.1\|WP_000948732.1\|2223567_2224926_-\|glycerol-3-phosphate-transporter	gnl\|CDD\|236889	PRK11273, glpT, glycerol-3-phosphate transporter.	0
NZ_CP020368.1\|WP_001300976.1\|2206879_2207503_-\|DUF1175-domain-containing-protein	gnl\|CDD\|225774	COG3234, COG3234, Uncharacterized protein conserved in bacteria [Function unknown].	3.77001e-140
NZ_CP020368.1\|WP_000990753.1\|2212110_2212833_+\|bifunctional-3-demethylubiquinone-3-O-methyltransferase/2-octaprenyl-6-hydroxy-phenol-methylase	gnl\|CDD\|235350	PRK05134, PRK05134, bifunctional 2-polyprenyl-6-hydroxyphenol methylase/3-demethylubiquinol 3-O-methyltransferase UbiG.	1.58484e-171
NZ_CP020368.1\|WP_122987104.1\|2202341_2206736_-\|alpha-2-macroglobulin-family-protein	gnl\|CDD\|225248	COG2373, COG2373, Large extracellular alpha-helical protein [General function prediction only].	0
NZ_CP020368.1\|WP_000140557.1\|2229455_2230358_+\|ISNCY-family-transposase	gnl\|CDD\|182167	PRK09956, PRK09956, ISNCY family transposase.	0
NZ_CP020368.1\|WP_000012273.1\|2207499_2209188_-\|DUF2138-domain-containing-protein	gnl\|CDD\|227030	COG4685, COG4685, Uncharacterized protein conserved in bacteria [Function unknown].	0
NZ_CP020368.1\|WP_001281254.1\|2209336_2211964_-\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	gnl\|CDD\|235502	PRK05560, PRK05560, DNA gyrase subunit A; Validated.	0
NZ_CP020368.1\|WP_000786547.1\|2198652_2199837_+\|acetyl-CoA-C-acetyltransferase	gnl\|CDD\|180261	PRK05790, PRK05790, putative acyltransferase; Provisional.	0

>NZ_CP020368.1|WP_001075164.1|2217408_2219694_+|ribonucleoside-diphosphate-reductase-1-subunit-alpha
MNQNLLVTKRDGSTERINLDKIHRVLDWAAEGLHNVSISQVELRSHIQFYDGIKTSDIHETIIKAAADLISRDAPDYQYLAARLAIFHLRKKAYGQFEPPALYDHVVKMVEMGKYDNHLLEDYTEEEFKQMDTFIDHDRDMTFSYAAVKQLEGKYLVQNRVTGEIYESAQFLYILVAACLFSNYPRETRLQYVKRFYDAVSTFKISLPTPIMSGVRTPTRQFSSCVLIECGDSLDSINATSSAIVKYVSQRAGIGINAGRIRALGSPIRGGEAFHTGCIPFYKHFQTAVKSCSQGGVRGGAATLFYPMWHLEVESLLVLKNNRGVEGNRVRHMDYGVQINKLMYTRLLKGEDITLFSPSDVPGLYDAFFADQEEFERLYTKYEKDDSIRKQRVKAVELFSLMMQERASTGRIYIQNVDHCNTHSPFDPAIAPVRQSNLCLEIALPTKPLNDVNDENGEIALCTLSAFNLGAINNLDELEELAILAVRALDALLDYQDYPIPAAKRGAMGRRTLGIGVINFAYYLAKHGKRYSDGSANNLTHKTFEAIQYYLLKASNELAKEQGACPWFNETTYAKGILPIDTYKKDLDTIANEPLHYDWEALRESIKTHGLRNSTLSALMPSETSSQISNATNGIEPPRGYVSIKASKDGILRQVVPDYEHLHDAYELLWEMPGNDGYLQLVGIMQKFIDQSISANTNYDPSRFPSGKVPMQQLLKDLLTAYKFGVKTLYYQNTRDGAEDAQDDLVPSIQDDGCESGACKI
>NZ_CP020368.1|WP_001220069.1|2212960_2216713_-|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC
MRIIFLRKEYLSLLPSMIASLFSANGVAAVTDSCQGYDVKASCQASRQSLSGITQDWSIADGQWLVFSDMTNNASGGAVFLQQGAEFSLLPENETGMTLFANNTVTGEYNNGGAIFAKENSTLNLTDVIFSGNVAGGYGGAIYSSGTNDTGAVDLRVTNAMFRNNIANDGKGGAIYTINNDVYLSDVIFDNNQAYTSTSYSDGDGGAIDVTDNNSDSKHPSGYTIVNNTAFTNNTAEGYGGAIYTNSVTAPYLIDISVDDSYSQNGGVLVDENNSAAGYGDGPSSAAGGFMYLGLSEVTFDIADGKTLVIGNTENDGAVDSIAGTGLITKTGSGDLVLNADNNDFTGEMQIENGEVTLGRSNSLMNVGDTHCQDDPQDCYGLTIGSIDQYQNQAELNVGSTQQTFVHALTGFQNGTLNIDAGGNVTVNQGSFAGIIEGAGQLTIAQNGSYVLAGAQPMALTGDIVVDDGAVLSLEGDAADLTALQDDPQSIVLNGGVLDLSDFSTWQSGTSYNDGLEVSGSSGTVIGSQDVVDLAGGDNLHIGGDGKDGVYVVVDASDGQVSLANNNSYLGTTQIASGTLMVSDNSQLGDTHYNRQVIFTDKQQESVMEITSDVDTRSDAAGHGRDIEMRADGEVAVDAGVDTQWGALMADSSGEHQDEGSTLTKTGAGTLELTASGTTQSAVRVEEGTLKGDVADILPYASSLWVGDGATFVTGADQDIQSIDTTSSGTIDISDGTVLRLTGQDTSVALNASLFNGDGTLVNATDGVTLTGELNTNLETDSLTYLSNVTVNGNLTNTSGAVSLQNGVAGDTLTVNGDYTGGGTLLLDSELNGDDSASDQLVLNGNTAGNTTVVINPITGIGEPISTGIKVVDFAADPTQFQNNAQFSLAGSGYVNMGAYDYTLVEDNNDWYLRSQEVTPPSPPDPDPTPDPDPTPDPDPTPDPEPTPAYQPVLNAKVGGYLNNLRAANQAFMMERRDHAGGDGQTLNLRVIGGDYHYTAAGQLAQHEDTSTVQLSVDLFRGRWGDDGEWMLGIVGGYSDNQGDSRSSMTGTRADNQNHGYAVGLTSSWFQHGKQKQGAWLDNWLQYAWFSNDVSEHEDGTDHYHSSGIIALLEAGYQWLPGRGVVIEPQAQVIYQGVQQDDFTAANRARVSQSQGDDIQTRLGLHSEWRTAVHVIPTLDLNYYHDPHSTEIEEDGSTISDDAVKQRGEIKVGVTGNISQRVSLRGSVAWQKGSDDFAQTAGFLSMTVKW
>NZ_CP020368.1|WP_000990753.1|2212110_2212833_+|bifunctional-3-demethylubiquinone-3-O-methyltransferase/2-octaprenyl-6-hydroxy-phenol-methylase
MNAEKSPENHNVDHEEIAKFEAVASRWWDLEGEFKPLHRINPLRLGYIAERAGGLFGKKVLDVGCGGGILAESMAREGATVTGLDMGFEPLQVAKLHALESGIQVDYVQETVEEHAAKHAGQYDVVTCMEMLEHVPDPQSVVRACAQLVKPGGDVFFSTLNRNGKSWLMAVVGAEYILRMVPKGTHDVKKFIKPAELLGWVDQTSLKERHITGLHYNPITNTFKLGPGVDVNYMLHTQNK
>NZ_CP020368.1|WP_001281254.1|2209336_2211964_-|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A
MSDLAREITPVNIEEELKSSYLDYAMSVIVGRALPDVRDGLKPVHRRVLYAMNVLGNDWNKAYKKSARVVGDVIGKYHPHGDSAVYDTIVRMAQPFSLRYMLVDGQGNFGSIDGDSAAAMRYTEIRLAKIAHELMADLEKETVDFVDNYDGTEKIPDVMPTKIPNLLVNGSSGIAVGMATNIPPHNLTEVINGCLAYIDDEDISIEGLMEHIPGPDFPTAAIINGRRGIEEAYRTGRGKVYIRARAEVEVDAKTGRETIIVHEIPYQVNKARLIEKIAELVKEKRVEGISALRDESDKDGMRIVIEVKRDAVGEVVLNNLYSQTQLQVSFGINMVALHHGQPKIMNLKDIIAAFVRHRREVVTRRTIFELRKARDRAHILEALAVALANIDPIIELIRHAPTPAEAKTALVANPWQLGNVAAMLERAGDDAARPEWLEPEFGVRDGLYYLTEQQAQAILDLRLQKLTGLEHEKLLDEYKELLDQIAELLRILGSADRLMEVIREELELVREQFGDKRRTEITANSADINLEDLITQEDVVVTLSHQGYVKYQPLSEYEAQRRGGKGKSAARIKEEDFIDRLLVANTHDHILCFSSRGRVYSMKVYQLPEATRGARGRPIVNLLPLEQDERITAILPVTEFEEGVKVFMATANGTVKKTVLTEFNRLRTAGKVAIKLVEGDELIGVDLTSGEDEVMLFSAEGKVVRFKESSVRAMGCNTTGVRGIRLGEGDKVVSLIVPRGEGAILTATQNGYGKRTAVAEYPTKSRATKGVISIKVTERNGLVVGAVQVDDCDQIMMITDAGTLVRTRVSEISIVGRNTQGVILIRTAEDENVVGLQRVAEPVDEEDLDTIDGSAAEGDDEIAPEVDVDDEPEEE
>NZ_CP020368.1|WP_000012273.1|2207499_2209188_-|DUF2138-domain-containing-protein
MSGEKKAKGWRFYGLVGFGAIALLSAGVWALQYAGSGPEKTLSPLVVHNNLQIDLNEPDLFLDSDSLSQLPKDLITIPFLHDVLSEDFVFYYQNHADRLGIEGSIRRIVYEHDLTLKDKLFSSLLDQPAQAALWHDKQGHLSHYMVLIQRSGLSKLLEPLLFAATSDSQLSKTEISSIKINSETVPVYQLRYNGNNALMFATYQDKMLVFSSTDMLFKDDQQDTEATAIAGDLLSGKKRWQASFGLEERTAEKTPVRQRIVVSARWLGFGYQRLMPSFAGVHFEMGNDGWHSFVALNDESASVDASFDFTPVWNSMPAGASFCVAVPYSHGIAEEMLSHISQENDKLNGALDGAAGLCWYEDSKLQTPLFVGQFDGTAEQAQLPGKLFTQNIGAHESKAPEGVLPVSQTQQGEAQIWRREVSSRYGQYPKAQAAQPDQLMSDYFFRVSLAMQNKTLLFSLDDTLVNNALQTLNKTRPAMVDVIPTDGIVPLYINPQGIAKLLRNETLTSLPKNLEPVFYNAAQTLLMPKLDALSQQPRYVMKLAQMEPGAAWQWLPITWQPL
>NZ_CP020368.1|WP_001300976.1|2206879_2207503_-|DUF1175-domain-containing-protein
MRHGLLALICWLCCVVVHSEMLNVEQSGLFRAWFVRIAQEQLRQGPSPRWYQQDCAGLVRFAANETLKVHDSKWLKSNGLSSQYLPPEMTLTPEQRQLAQNWNQGNGKTGPYVTAINLIQYNSQFIGQDINQALPGDMIFFDQGDAQHLMVWMGRYVIYHTGSATKTDNGMRAVSLQQLMTWKDTRWIPNDSNPNFIGIYRLNFLVR
>NZ_CP020368.1|WP_122987104.1|2202341_2206736_-|alpha-2-macroglobulin-family-protein
MRLEAPGRDYRRYQMEEYGGVDVRLYRIPDPMAFLRQQKNLHRIVVQPQYLGDGLNNTLTWLWDNWYGKSRRVMQRTFSSQSRQNVTQALPELQLGNAIIKPSRYVQNNQFSPLKKYPLVEQFRYPLWQAKPFEPQQGVKLEGASSNFISPQPGNIYIPLGQQEPGLYLVEAMVGGYRATTVVFVSDTVALSKVSGKELLVWTAGKKQGEAKPGSEILWTDGLGVMTRGVTDDSGTLQLQHISPERSYILGKDAEGGVFVSENFFYESEIYNTRLYIFTDRPLYRAGDRVDVKVIGREFHDPLHSSPIVSAPAKLSVLDANGSLLQTVNVTLDARNGGQGSFRLPENAVAGGYELRLAYRNQVYSSSFRVANYIKPHFEIGLALDKKEFKTGEAVSGKLQLLYPDGEPVKNARVQLSLRAQQLSMVGNDLRYAGRFPVSLEGSETVSDASGHVTLNLPAADKPSRYLLTVSASDGAAYRVTTTKEILIERGLAHYSLSTAAQYSNSGESVVFRYAALESSKQVPVTYEWLRLEDRTSHSGELPSGGKSFTVNFAKPGNYNLTLRDKDGLILAGLSHAVSGKGSTAHTGTVDIVADKTLYQPGETAKMLITFPEPIDEALLTLERDRVEQQSLLSHPANWLTLQRLNDTQYEARVPVSNSFAPNITFSVLYTRNGQYSFQNAGIKVAVPQLDIRVKTDKTHYQPGELVNVELTSSLKGKPVSAQLTVGVVDEMIYALQPEIAPNIGKFFYPLGRNNVRTSSSLSFISYDQALSSEPVAPGATNRSERRVKMLERPRREEVDTAAWMPSLTTDKQGKAYFTFLMPDSLTRWRITARGMNGDGLVGQGRAYLRSEKNLYMKWSMPTVYRVGDKPAAGLFIFSQQDNEPVALVTKFAGAEMRQTLTLHKGANYISLTQNIQQSGLLSAELQQNGQVQDSISTKLSFVDNSWPVEQQKNVMLGGGDNALMLPEQASNIRLQSSETPQEIFRNNLDALVDEPWGGVINTGSRLIPLSLAWRSLADHQSAAANDIRQMIQDNRLRLMQLAGPGARFTWWGEDGNGDAFLTAWAWYADWQASQAIGVTQQPEYWQHMLDSYAEQADNMPLLHRALVLAWAQEMNLPCKTLLKGLDEAIARRGTKTEDFSEEDTRDINDSLILDTPESPLADAVANVLTMTLLKKAQLKSTVMPQVQQYAWDKAANSNQPLAHTVVLLNSGGDATQTAAILSGLTAEQSTIERALAMNWLAKYMATMPPVVLPAPAGAWAKHKLTGGGEDWRWVGQGVPDILSFGDELSPQNVQVRWREPAKTAQQSNIPVTVERQLYWLIPGEEEMSFTLQPVTSNEIDSDALYLDEITLTSEQDAVLRYGQVEVPLPPGADVERTTWGISVNKPNAAKQQGQLLEKARNEMGELAYMLPVKELTGTVTFRHLLRFSQKGQFVLPPARYVRSYAPAQQSVAAGSEWTGMQVK
>NZ_CP020368.1|WP_001104549.1|2200691_2202341_-|DUF2300-domain-containing-protein
MNWRRIVWLLALVTLPTLAEETPLQLVLRGAQHDQLYQLSSSGVTKVSALPDSLTTPLGSLWKLYVYAWLEDTHQPEQPYQCRGNSPEEVYCCQAGESITRDTALVRSCGLYFAPQRLHIGADVWGQYWQQRQAPAWLASLTTLKPETSVTVKSLLDSLATLPAQNKAQEVLLDVVLDEAKIGVASMLGSRVRVKTWSWFADDKQEIRQGGFAGWLTDGTPLWVTGSGTSKTVLTRYATVLNRVLPVPTQVASGQCVEVELFARYPLKKITAEKSTTAVNPGVLNGRYRVTFTNGNHITFVSHGETTLLSEKGKLKLQSHLDREEYVARVLDREAKSTPPEAAKAMTVAIRTFLQQNANREGDCLTIPDSSATQRVSASPATTGARTMTAWTQDLIYAGDPVHYHGSRATEGTLSWRQATAQAGQGERYDQILAFAYPDNSLSRWGAPRSTCQLLPKAKAWLAKKMPQWRRILQAETGYNEPDVFAVCRLVSGFPYTDRQQKRLFIRNFFTLQDRLDLTHEYLHLAFDGYPTGLDENYIETLTRQLLMD
>NZ_CP020368.1|WP_001225852.1|2199910_2200687_-|YfaP-family-protein
MRKIFLPLLLVALSPVAHSEGVQEVEIDAPLSGWHPAEGEDASFSQSINYPASSVNMADDQNISAQIRGKIKNYAAAGKVQQGRLVVNGASMPQRIESDGSFARPYIFTEGSNSVQVISPDGQSRQKMQFYSTPGTGTIRARLRLVLSWDTDNTDLDLHVVTPDGEHAWYGNTVLKNSGALDMDVTTGYGPEIFAMPAPIHGRYQVYINYYGGRSETELTTAQLTLITDEGSVNEKQETFIVPMRNAGELTLVKSFDW
>NZ_CP020368.1|WP_000786547.1|2198652_2199837_+|acetyl-CoA-C-acetyltransferase
MKNCVIVSAVRTAIGSFNGSLASTSAIDLGATVIKAAIERAKIDSQHVDEVIMGNVLQAGLGQNPARQALLKSGLAETVCGFTVNKVCGSGLKSVALAAQAIQAGQAQSIVAGGMENMSLAPYLLDAKARSGYRLGDGQVYDVILRDGLMCATHGYHMGITAENVAKEYGITREMQDELALHSQRKAAAAIESGAFTAEIVPVNVVTRKKTFVFSQDEFPKANSTAEALGALRPAFDKAGTVTAGNASGINDGAAALVIMEESAALAAGLTPLARIKSYASGGVPPALMGMGPVPATQKALQLAGLQLADIDLIEANEAFAAQFLAVGKNLGFDSEKVNVNGGAIALGHPIGASGARILVTLLHAMQARDKTLGLATLCIGGGQGIAMVIERLN
>NZ_CP020368.1|WP_000332036.1|2219935_2221066_+|ribonucleotide-diphosphate-reductase-subunit-beta
MAYTTFSQTKNDQLKEPMFFGQPVNVARYDQQKYDIFEKLIEKQLSFFWRPEEVDVSRDRIDYQALPEHEKHIFISNLKYQTLLDSIQGRSPNVALLPLISIPELETWVETWAFSETIHSRSYTHIIRNIVNDPSVVFDDIVTNEQIQKRAEGISSYYDELIEMTSYWHLLGEGTHTVNGKTVTVSLRELKKKLYLCLMSVNALEAIRFYVSFACSFAFAERELMEGNAKIIRLIARDEALHLTGTQHMLNLLRSGADDPEMAEIAEECKQECYDLFVQAAQQEKDWADYLFRDGSMIGLNKDILCQYVEYITNIRMQAVGLDLPFQTRSNPIPWINTWLVSDNVQVAPQEVEVSSYLVGQIDAEVDTDDLSNFQL
>NZ_CP020368.1|WP_000135040.1|2221065_2221320_+|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE
MARVTLRITGTQLLCQDEHPSLLAALESHNVAVEYQCREGYCGSCRTRLVAGQVDWIAEPLAFIQPGEILPCCCRAKGDIEIEM
>NZ_CP020368.1|WP_000301050.1|2221373_2222024_-|lipopolysaccharide-kinase-InaA
MAVSAKYDEFNHWWATEGDWVEEPNYRRNGMSGVQCVERNGKKLYVKRMTHHLFHSVRYPFGRPTIVREVAVIKELERAGVIVPKIVFGEAVKIEGEWRALLVTEDMAGFISIADWYAQHAVSPYSDEVRQAMLKAVALAFKKMHSINRQHGCCYVRHIYVKTEGNAEAGFLDLEKSRRRLRRDKAINHDFRQLEKYLEPIPKADWEQVKAYYYAM
>NZ_CP020368.1|WP_000779102.1|2222486_2223563_-|glycerophosphodiester-phosphodiesterase
MKLTLKNLSMAIMMSTIVMGSSAMAADSNEKIVIAHRGASGYLPEHTLPAKAMAYAQGADYLEQDLVMTKDDNLVVLHDHYLDRVTDVADRFPDRARKDGRYYAIDFTLDEIKSLKFTEGFDIENGKKVQTYPGRFPMGKSDFRVHTFEEEIEFVQGLNHSTGKNIGIYPEIKAPWFHHQEGKDIAAKTLEVLKKYGYTGKDDKVYLQCFDADELKRIKNELEPKMGMDLNLVQLIAYTDWNETQQKQPDGSWVNYNYDWMFKPGAMKQVAEYADGIGPDYHMLIEETSQPGNIKLTGMVQDAQQNKLVVHPYTVRSDKLPEYTTDVNQLYDALYNKAGVNGLFTDFPDKAVKFLNKE
>NZ_CP020368.1|WP_000948732.1|2223567_2224926_-|glycerol-3-phosphate-transporter
MLSIFKPAPHKARLPAAEIDPTYRRLRWQIFLGIFFGYAAYYLVRKNFALAMPYLVEQGFSRGDLGFALSGISIAYGFSKFIMGSVSDRSNPRVFLPAGLILAAAVMLFMGFVPWATSSIAVMFVLLFLCGWFQGMGWPPCGRTMVHWWSQKERGGIVSVWNCAHNVGGGIPPLLFLLGMAWFNDWHAALYMPAFCAILVALFAFAMMRDTPQSCGLPPIEEYKNDYPDDYNEKAEQELTAKQIFMQYVLPNKLLWYIAIANVFVYLLRYGILDWSPTYLKEVKHFALDKSSWAYFLYEYAGIPGTLLCGWMSDKVFRGNRGATGVFFMTLVTIATIVYWMNPAGNPTVDMICMIVIGFLIYGPVMLIGLHALELAPKKAAGTAAGFTGLFGYLGGSVAASAIVGYTVDFFGWDGGFMVMIGGSILAVILLIVVMIGEKRRHEQLLQKRNGG
>NZ_CP020368.1|WP_000857257.1|2225198_2226827_+|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A
MKTRDSQSSDVIIIGGGATGAGIARDCALRGLRVILVERHDIATGATGRNHGLLHSGARYAVTDAESARECISENQILKRIARHCVEPTNGLFITLPEDDLSFQATFIRACEEAGISAEAIDPQQARIIEPAVNPALIGAVKVPDGTVDPFRLTAANMLDAKEHGAVILTAHEVTGLIREGATVCGVRVRNHLTGETQALHAPVVVNAAGIWGQHIAEYADLRIRMFPAKGSLLIMDHRINQHVINRCRKPSDADILVPGDTISLIGTTSLRIDYNEIDDNRVTAEEVDILLREGEKLAPVMAKTRILRAYSGVRPLVASDDDPSGRNVSRGIVLLDHAERDGLDGFITITGGKLMTYRLMAEWATDAVCRKLGNTRPCTTADLALPGSQEPAEVTLRKVISLPAPLRGSAVYRHGDRTPAWLSEGRLHRSLVCECEAVTAGEVQYAVENLNVNSLLDLRRRTRVGMGTCQGELCACRAAGLLQRFNVTTSAQSIEQLSTFLNERWKGVQPIAWGDALRESEFTRWVYQGLCGLEKEQKDAL
>NZ_CP020368.1|WP_001209902.1|2226816_2228076_+|glycerol-3-phosphate-dehydrogenase-subunit-GlpB
MRFDTVIMGGGLAGLLCGLQLQKHGLRCAIVTRGQSALHFSSGSLDLLSHLPDGQPVADIHSGLESLRQQAPAHPYSLLGPQRVLDLACQAQALIAESGAQLQGSVELAHQRITPLGTLRSTWLSSPEVPVWPLPAKKICVVGISGLMDFQAHLAAASLRELDLSVETAEIELPELDVLRNNATEFRAVNIARFLDNEENWPLLLDALIPVANTCEMILMPACFGLADDKLWRWLNEKLPCSLMLLPTLPPSVLGIRLQNQLQRQFVHQGGVWMPGDEVKKVTCKNGVVNEIWTRNHADIPLRPRFAVLASGSFFSGGLVAERNGIREPILGLDVLQTATRGEWYKGDFFAPQPWQQFGVTTDETLRPSQAGQTIENLFAIGSVLGGFDPIAQGCGGGVCAVSALHAAQQIAQRAGGQQ
>NZ_CP020368.1|WP_001000359.1|2228072_2229263_+|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C
MNDTSFENCIKCTVCTTACPVSRVNPGYPGPKQAGPDGERLRLKDGALYDEALKYCINCKRCEVACPSDVKIGDIIQRARAKYDTTRPSLRNFVLSHTDLMGSVSTPFAPIVNTATSLKPVRQLLDAALKIDHRRTLPKYSFGTFRRWYRSIAAQQAQYKDQVAFFHGCFVNYNHPQLGKDLIKVLNAMGTGVQLLSKEKCCGVPLIANGFTDKARKQAITNVESIREAVGVKGIPVIATSSTCTFALRDEYPEVLNVDNKGLRDHIELATRWLWRKLDEGKTLPLKPLPLKVVYHTPCHMEKMGWTLYTLELLRKIPGLELTVLDSQCCGIAGTYGFKKENYPTSQAIGAPLFRQIEESGADLVVTDCETCKWQIEMSTSLRCEHPITLLAQALA
>NZ_CP020368.1|WP_000140557.1|2229455_2230358_+|ISNCY-family-transposase
MTESTTSSPHDAVFKTFMFTPETARDFLEIHLPEPLRKLCNLQTLRLEPTSFIEKSLRAYYSDVLWSVETSDGDGYINCVIEHQSSAEKNMAFRLMRYATAAMQRHLDKGYDRVPLVVPLLFYHGETSPYPYSLNWLDEFDDPQLARQLYTEAFPLVDITIVPDDEIMQHRRIALLELIQKHIRDRDLIGMVDRITTLLVRGFTNDSQLQTLFNYLLQCGDTSRFTRFIEEIAERSPLQKERLMTIAERLRQEGHQIGWQEGMHEQAIKIALRMLEQGFDRDQVLAATQLSEADLAANNH
>NZ_CP020368.1|WP_000992954.1|2230398_2231202_-|2-keto-3-deoxy-L-rhamnonate-aldolase
MNALLSNPFKERLRKGEVQIGLWLSSTTAYMAEIAATSGYDWLLIDGEHAPNTIQDLYHQLQAVAPYASQPVIRPVEGSKPLIKQVLDIGAQTLLIPMVDTAEQARQVVSATRYPPYGERGVGASVARAARWGRIENYMAQVNDSLCLLVQVESKTALDNLDEILDVEGIDGVFIGPADLSASLGYPDNAGHPEVQRIIETSIRRIRAAGKAAGFLAVAPDMAQQCLAWGANFVAVGVDTMLYSDALDQRLAMFKSGKNGPRIKGSY

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP020368_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP020368_4

2630215-2630359

Orphan

Consensus_repeat	Method
CACAATGCCTGATGCGACGCTGGAGCGTCTTATCATGCCTACAAA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP020368_4

>merge|NZ_CP020368|4|2630215-2630359|CRISPRCasFinder
CACAATGCCTGATGCGACGCTGGAGCGTCTTATCATGCCTACAAAATACACTCATTCCGTATGGCGGATAAGGCGTTTTCGCCGCATCCGCCGTTCTGTGCACAATGCCTGATGCGACGCTGGCGCGTCTTATCATGCCTACAAA

>NZ_CP020368|4|4|2630215-2630359|CRISPRCasFinder
CACAATGCCTGATGCGACGCTGGAGCGTCTTATCATGCCTACAAA	ATACACTCATTCCGTATGGCGGATAAGGCGTTTTCGCCGCATCCGCCGTTCTGTG
CACAATGCCTGATGCGACGCTGGCGCGTCTTATCATGCCTACAAA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP020368.1\|WP_001130211.1\|2636366_2636882_-\|S-ribosylhomocysteine-lyase	unknown	unknown	gnl\|CDD\|179399
NZ_CP020368.1\|WP_000985494.1\|2626856_2628059_+\|proline/glycine-betaine-ABC-transporter-ATP-binding-protein-ProV	unknown	unknown	gnl\|CDD\|182221
NZ_CP020368.1\|WP_000445651.1\|2631765_2632503_+\|AzlC-family-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|224215
NZ_CP020368.1\|WP_001216521.1\|2629173_2630166_+\|glycine-betaine/L-proline-ABC-transporter-substrate-binding-protein-ProX	unknown	unknown	gnl\|CDD\|236852
NZ_CP020368.1\|WP_001613650.1\|2621691_2622036_-\|YgaC-family-protein	unknown	unknown	gnl\|CDD\|182545
NZ_CP020368.1\|WP_000492656.1\|2621205_2621655_+\|L-alanine-exporter-AlaE	unknown	unknown	gnl\|CDD\|368998
NZ_CP020368.1\|WP_000080947.1\|2623006_2623417_+\|class-Ib-ribonucleoside-diphosphate-reductase-assembly-flavoprotein-NrdI	unknown	unknown	gnl\|CDD\|179603
NZ_CP020368.1\|WP_000119763.1\|2632492_2632828_+\|L-valine-transporter-subunit-YgaH	unknown	unknown	gnl\|CDD\|182434
NZ_CP020368.1\|WP_000246527.1\|2623389_2625534_+\|class-1b-ribonucleoside-diphosphate-reductase-subunit-alpha	unknown	unknown	gnl\|CDD\|236179
NZ_CP020368.1\|WP_001223227.1\|2622764_2623010_+\|glutaredoxin-like-protein-NrdH	unknown	unknown	gnl\|CDD\|182381
NZ_CP020368.1\|WP_001295174.1\|2622187_2622517_+\|DUF883-domain-containing-protein	unknown	unknown	gnl\|CDD\|182259
NZ_CP020368.1\|WP_001295176.1\|2634764_2636303_+\|multidrug-efflux-MFS-transporter-permease-subunit-EmrB	unknown	unknown	gnl\|CDD\|129794
NZ_CP020368.1\|WP_001287454.1\|2638660_2639089_-\|DedA-family-protein	unknown	unknown	gnl\|CDD\|224159
NZ_CP020368.1\|WP_000378442.1\|2632918_2633449_+\|multidrug-efflux-transporter-EmrAB-transcriptional-repressor-EmrR	unknown	unknown	gnl\|CDD\|182795
NZ_CP020368.1\|WP_000273290.1\|2639085_2639652_-\|fructose-1-phosphate/6-phosphogluconate-phosphatase	unknown	unknown	gnl\|CDD\|182679
NZ_CP020368.1\|WP_000165699.1\|2630457_2631642_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340882
NZ_CP020368.1\|WP_000777972.1\|2625543_2626503_+\|class-1b-ribonucleoside-diphosphate-reductase-subunit-beta	unknown	unknown	gnl\|CDD\|275027
NZ_CP020368.1\|WP_001295175.1\|2633575_2634748_+\|multidrug-efflux-MFS-transporter-periplasmic-adaptor-subunit-EmrA	unknown	unknown	gnl\|CDD\|185090
NZ_CP020368.1\|WP_000774988.1\|2628051_2629116_+\|glycine-betaine/L-proline-ABC-transporter-permease-ProW	unknown	unknown	gnl\|CDD\|236805
NZ_CP020368.1\|WP_000611804.1\|2637031_2638588_-\|glutamate--cysteine-ligase	unknown	unknown	gnl\|CDD\|235001

Protein	Function_ID	Function_description	E-value
NZ_CP020368.1\|WP_001130211.1\|2636366_2636882_-\|S-ribosylhomocysteine-lyase	gnl\|CDD\|179399	PRK02260, PRK02260, S-ribosylhomocysteine lyase.	6.57105e-109
NZ_CP020368.1\|WP_000985494.1\|2626856_2628059_+\|proline/glycine-betaine-ABC-transporter-ATP-binding-protein-ProV	gnl\|CDD\|182221	PRK10070, PRK10070, proline/glycine betaine ABC transporter ATP-binding protein ProV.	0
NZ_CP020368.1\|WP_000445651.1\|2631765_2632503_+\|AzlC-family-ABC-transporter-permease	gnl\|CDD\|224215	COG1296, AzlC, Predicted branched-chain amino acid permease (azaleucine resistance) [Amino acid transport and metabolism].	7.65174e-63
NZ_CP020368.1\|WP_001216521.1\|2629173_2630166_+\|glycine-betaine/L-proline-ABC-transporter-substrate-binding-protein-ProX	gnl\|CDD\|236852	PRK11119, proX, proline/glycine betaine ABC transporter substrate-binding protein ProX.	0
NZ_CP020368.1\|WP_001613650.1\|2621691_2622036_-\|YgaC-family-protein	gnl\|CDD\|182545	PRK10556, PRK10556, hypothetical protein; Provisional.	4.33679e-81
NZ_CP020368.1\|WP_000492656.1\|2621205_2621655_+\|L-alanine-exporter-AlaE	gnl\|CDD\|368998	pfam06610, AlaE, L-alanine exporter. AlaE is a family of Gram-negative amino-acid transporters. It is not entirely clear why bacteria export metabolites but recent studies have shown that many excrete alanine. AlaE is likely to be the exporter protein for L-alanine. UniProtKB:A8ANM6, UniProt:G4R961 and UniProt:H5SVY7 are classified as putative alanine exporters.	2.17273e-71
NZ_CP020368.1\|WP_000080947.1\|2623006_2623417_+\|class-Ib-ribonucleoside-diphosphate-reductase-assembly-flavoprotein-NrdI	gnl\|CDD\|179603	PRK03600, nrdI, class Ib ribonucleoside-diphosphate reductase assembly flavoprotein NrdI.	3.43096e-93
NZ_CP020368.1\|WP_000119763.1\|2632492_2632828_+\|L-valine-transporter-subunit-YgaH	gnl\|CDD\|182434	PRK10408, PRK10408, L-valine transporter subunit YgaH.	3.62349e-56
NZ_CP020368.1\|WP_000246527.1\|2623389_2625534_+\|class-1b-ribonucleoside-diphosphate-reductase-subunit-alpha	gnl\|CDD\|236179	PRK08188, PRK08188, ribonucleotide-diphosphate reductase subunit alpha; Validated.	0
NZ_CP020368.1\|WP_001223227.1\|2622764_2623010_+\|glutaredoxin-like-protein-NrdH	gnl\|CDD\|182381	PRK10329, PRK10329, glutaredoxin-like protein NrdH.	1.67524e-55
NZ_CP020368.1\|WP_001295174.1\|2622187_2622517_+\|DUF883-domain-containing-protein	gnl\|CDD\|182259	PRK10132, PRK10132, hypothetical protein; Provisional.	1.02216e-67
NZ_CP020368.1\|WP_001295176.1\|2634764_2636303_+\|multidrug-efflux-MFS-transporter-permease-subunit-EmrB	gnl\|CDD\|129794	TIGR00711, Uncharacterized_MFS-type_transporter_YhcA, drug resistance transporter, EmrB/QacA subfamily. This subfamily of drug efflux proteins, a part of the major faciliator family, is predicted to have 14 potential membrane-spanning regions. Members with known activities include EmrB (multiple drug resistance efflux pump) in E. coli, FarB (antibacterial fatty acid resistance) in Neisseria gonorrhoeae, TcmA (tetracenomycin C resistance) in Streptomyces glaucescens, etc. In most cases, the efflux pump is described as having a second component encoded in the same operon, such as EmrA of E. coli. [Cellular processes, Toxin production and resistance, Transport and binding proteins, Other].	0
NZ_CP020368.1\|WP_001287454.1\|2638660_2639089_-\|DedA-family-protein	gnl\|CDD\|224159	COG1238, COG1238, Predicted membrane protein [Function unknown].	1.33324e-39
NZ_CP020368.1\|WP_000378442.1\|2632918_2633449_+\|multidrug-efflux-transporter-EmrAB-transcriptional-repressor-EmrR	gnl\|CDD\|182795	PRK10870, PRK10870, transcriptional repressor MprA; Provisional.	5.52795e-123
NZ_CP020368.1\|WP_000273290.1\|2639085_2639652_-\|fructose-1-phosphate/6-phosphogluconate-phosphatase	gnl\|CDD\|182679	PRK10725, PRK10725, fructose-1-phosphate/6-phosphogluconate phosphatase.	5.97267e-144
NZ_CP020368.1\|WP_000165699.1\|2630457_2631642_+\|MFS-transporter	gnl\|CDD\|340882	cd17324, MFS_NepI_like, Purine ribonucleoside efflux pump NepI and similar transporters of the Major Facilitator Superfamily. This family is composed of purine efflux pumps such as Escherichia coli NepI and Bacillus subtilis PbuE, sugar efflux transporters such as Corynebacterium glutamicum arabinose efflux permease, multidrug resistance (MDR) transporters such as Streptomyces lividans chloramphenicol resistance protein (CmlR), and similar proteins. NepI and PbuE are involved in the efflux of purine ribonucleosides such as guanosine, adenosine and inosine, as well as purine bases like guanine, adenine, and hypoxanthine, and purine base analogs. They play a role in the maintenance of cellular purine base pools, as well as in protecting the cells and conferring resistance against toxic purine base analogs such as 6-mercaptopurine. MDR transporters are drug/H+ antiporters (DHA) that mediate the efflux of a variety of drugs and toxic compounds, and confer resistance to these compounds. The NepI-like family belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	2.8815e-79
NZ_CP020368.1\|WP_000777972.1\|2625543_2626503_+\|class-1b-ribonucleoside-diphosphate-reductase-subunit-beta	gnl\|CDD\|275027	TIGR04171, ribonucleotide-diphosphate_reductase_subunit_beta, ribonucleoside-diphosphate reductase, class 1b, beta subunit. Members of this family are NrdF, the beta subunit of class 1b ribonucleotide reductase. This form uses a dimanganese moiety associated with a tyrosine radical to reduce the cellular requirement for iron. [Purines, pyrimidines, nucleosides, and nucleotides, 2'-Deoxyribonucleotide metabolism].	0
NZ_CP020368.1\|WP_001295175.1\|2633575_2634748_+\|multidrug-efflux-MFS-transporter-periplasmic-adaptor-subunit-EmrA	gnl\|CDD\|185090	PRK15136, PRK15136, multidrug efflux MFS transporter periplasmic adaptor subunit EmrA.	0
NZ_CP020368.1\|WP_000774988.1\|2628051_2629116_+\|glycine-betaine/L-proline-ABC-transporter-permease-ProW	gnl\|CDD\|236805	PRK10952, PRK10952, proline/glycine betaine ABC transporter permease ProW.	0
NZ_CP020368.1\|WP_000611804.1\|2637031_2638588_-\|glutamate--cysteine-ligase	gnl\|CDD\|235001	PRK02107, PRK02107, glutamate--cysteine ligase; Provisional.	0

>NZ_CP020368.1|WP_001216521.1|2629173_2630166_+|glycine-betaine/L-proline-ABC-transporter-substrate-binding-protein-ProX
MRHSVLFATAFATLISTQTFAADLPGKGITVNPVQSTITEETFQTLLVSRALEKLGYTVNKPSEVDYNVGYTSLASGDATFTAVNWTPLHDNMYEAAGGDKKFYREGVFVNGAAQGYLIDKKTADQYKITNIAQLKDPKIAKLFDTNGDGKADLTGCNPGWGCEGAINHQLAAYELTHTVTHNQGNYAAMMADTISRYKEGKPVFYYTWTPYWVSNELKPGKDVVWLQVPFSALPGDKNADTKLPNGANYGFPVSTMHIVANKAWAEKNPAAAKLFAIMQLPVADINAQNAIMHDGKASEGDIQGHVDGWIKAHQQQFDGWVNEALAAQK
>NZ_CP020368.1|WP_000774988.1|2628051_2629116_+|glycine-betaine/L-proline-ABC-transporter-permease-ProW
MADQNNPWDTTPAADSAAQSADAWGTPTTAPTDGGGADWLTSTPAPNVEHFNILDPFHKTLIPLDSWVTEGIDWVVTHFRPVFQGVRVPVDYILNGFQQLLLGMPAPVAIIVFALIAWQISGVGMGVATLVSLIAIGAIGAWSQAMVTLALVLTALLFCIVIGLPLGIWLARSPRAAKIIRPLLDAMQTTPAFVYLVPIVMLFGIGNVPGVVVTIIFALPPIIRLTILGINQVPADLIEASRSFGASPRQMLFKVQLPLAMPTIMAGVNQTLMLALSMVVIASMIAVGGLGQMVLRGIGRLDMGLATVGGVGIVILAIILDRLTQAVGRDSRSRGNRRWYTTGPVGLLTRPFIK
>NZ_CP020368.1|WP_000985494.1|2626856_2628059_+|proline/glycine-betaine-ABC-transporter-ATP-binding-protein-ProV
MAIKLEIKNLYKIFGEHPQRAFKYIEQGLSKEQILEKTGLSLGVKDASLAIEEGEIFVIMGLSGSGKSTMVRLLNRLIEPTRGQVLIDGVDIAKISDAELREVRRKKIAMVFQSFALMPHMTVLDNTAFGMELAGINAEERREKALDALRQVGLENYAHSYPDELSGGMRQRVGLARALAINPDILLMDEAFSALDPLIRTEMQDELVKLQAKHQRTIVFISHDLDEAMRIGDRIAIMQNGEVVQVGTPDEILNNPANDYVRTFFRGVDISQVFSAKDIARRTPNGLIRKTPGFGPRSALKLLQDEDREYGYVIERGNKFVGAVSIDSLKTALTQQQGLDAALIDAPLAVDAQTPLSELLSHVGQAPCAVPVVDEDQQYVGIISKGMLLRALDREGVNNG
>NZ_CP020368.1|WP_000777972.1|2625543_2626503_+|class-1b-ribonucleoside-diphosphate-reductase-subunit-beta
MKLSRISAINWNKISDDKDLEVWNRLTSNFWLPEKVPLSNDIPAWQTLTVVEQQLTMRVFTGLTLLDTLQNVIGAPSLMPDALTPHEEAVLSNISFMEAVHARSYSSIFSTLCQTKDVDAAYAWSEENAPLQRKAQIIQQHYRGDDPLKKKIASVFLESFLFYSGFWLPMYFSSRGKLTNTADLIRLIIRDEAVHGYYIGYKYQKNMEKISLGQREELKSFAFDLLLELYDNELQYTDELYAETPWADDVKAFLCYNANKALMNLGYKPLFPAEMAEVNPAILAALSPNADENHDFFSGSGSSYVMGKAVETEDEDWNF
>NZ_CP020368.1|WP_000246527.1|2623389_2625534_+|class-1b-ribonucleoside-diphosphate-reductase-subunit-alpha
MATTTAECLTQETMDYHALNAMLNLYDSAGRIQFDKDRQAVDAFIATHVRPNSVTFSSQQQRLNWLVNEGYYDESVLNRYSRDFVITLFAHAHTSGFRFQTFLGAWKFYTSYTLKTFDGKRYLEDFADRVTMVALTLAQGDETLALQLTDEMLSGRFQPATPTFLNCGKQQRGELVSCFLLRIEDNMESIGRAVNSALQLSKRGGGVAFLLSNLREAGAPIKRIENQSSGVIPVMKMLEDAFSYANQLGARQGAGAVYLHAHHPDILRFLDTKRENADEKIRIKTLSLGVVIPDITFHLAKENAQMALFSPYDVERVYGKPFADVAISQHYDELVADERIRKKYLNARDFFQRLAEIQFESGYPYIMYEDTVNRANPIAGRINMSNLCSEILQVNSASEYDENLDYTRTGHDISCNLGSLNIAHTMDSPDFARTVETAVRGLTAVSDMSHIRSVPSIEAGNAASHAIGLGQMNLHGYLAREGIAYGSPEALDFTNLYFYAITWHALRTSMLLARERGETFAGFKQSRYASGEYFSQYLQGNWQPKTAKVGELFTRSGITLPTREMWAQLRDDVMRYGIYNQNLQAVPPTGSISYINHATSSIHPIVAKVEIRKEGKTGRVYYPAPFMTNENLALYQDAYEIGAEKIIDTYAEATRHVDQGLSLTLFFPDTATTRDINKAQIYAWRKGIKTLYYIRLRQMALEGTEIEGCVSCAL
>NZ_CP020368.1|WP_000080947.1|2623006_2623417_+|class-Ib-ribonucleoside-diphosphate-reductase-assembly-flavoprotein-NrdI
MSQLVYFSSSSENTQRFIERLGLPAVRIPLNERERIQVDEPYILIVPSYGGGGTAGAVPRQVIRFLNDEHNRALLRGVIASGNRNFGEAYGRAGDVIARKCGVPWLYRFELMGTQSDIENVRKGVTEFWQRQPQNA
>NZ_CP020368.1|WP_001223227.1|2622764_2623010_+|glutaredoxin-like-protein-NrdH
MRITIYTRNDCVQCHATKRAMENRGFDFEMINVDRVPEAAEALRAQGFRQLPVVIAGDLSWSGFRPDMINRLHPAPHAASA
>NZ_CP020368.1|WP_001295174.1|2622187_2622517_+|DUF883-domain-containing-protein
MFNRPNRNDVDDGVQDIQNDVNQLADSLESVLKSWGSDAKGEAEAARSKAQALLKETRARMHGRTRVQQAARDAVGCADSFVRERPWCSVGTAAAVGIFIGALLSMRKS
>NZ_CP020368.1|WP_001613650.1|2621691_2622036_-|YgaC-family-protein
MYLRPDEVARVLEKVGFTVDVVTQKTYGYRRGENYVYVNREARMGRTALVIHPTLKERSSTLAEPASDIKTCDHYQQFPLYLAGERHEHYGIPHGFSSRVALERYLNGLFGEAS
>NZ_CP020368.1|WP_000492656.1|2621205_2621655_+|L-alanine-exporter-AlaE
MFSPQSRLRHAVADTFAMVVYCSVVNMCIEVFLSGMSFEQSFYSRLVAIPVNILIAWPYGMYRDLFMRAARKVSPSGWIKNLADILAYVTFQSPVYVAILLVVGADWHQIMAAVSSNIVVSMLMGAVYGYFLDYCRRLFKVSRYQQVKA
>NZ_CP020368.1|WP_000165699.1|2630457_2631642_+|MFS-transporter
MTKPNHELSPALIVLMSIATGLAVASNYYAQPLLDTIARNFSLSASSAGFIVTAAQLGYAAGLLFLVPLGDMFERRRLIVSMTLLAAGGMLITASSQSLAMMILGTALTGLFSVVAQILVPLAATLASPDKRGKVVGTIMSGLLLGILLARTVAGLLANLGGWRTVFWVASVLMALMALALWRGLPQMKSETHLNYPQLLGSVFSMFISDKILRTRALLGCLTFANFSILWTSMAFLLAAPPFNYSDGVIGLFGLAGAAGALGARPAGGFADKGKSHHTTTFGLLLLLLSWLAIWFGHTSVLALIIGILVLDLTVQGVHITNQTVIYRIHPDARNRLTAGYMTSYFIGGAAGSLISASAWQHGGWAGVCLAGATIALVNLLVWWRGFHRQEAAN
>NZ_CP020368.1|WP_000445651.1|2631765_2632503_+|AzlC-family-ABC-transporter-permease
MESPTPQPAPGSATFMEGCKDSLPIVISYIPVAFAFGLNATRLGFSPLESVFFSCIIYAGASQFVITAMLAAGSSLWIAALTVMAMDVRHVLYGPSLRSRIIQRLQKSKTALWAFGLTDEVFAAATAKLVRNNRRWSENWMIGIAFSSWSSWVFGTVIGAFSGSGLLQGYPAVEAALGFMLPALFMSFLLASFQRKQSLCVTAALVGALAGVTLFSIPVAILAGIVCGCLTALIQAFWQGAPDEL
>NZ_CP020368.1|WP_000119763.1|2632492_2632828_+|L-valine-transporter-subunit-YgaH
MSYEVLLLGLLVGVANYCFRYLPLRLRVGNARPTKRGAVGILLDTIGIASICALLVVSTAPEVMHDTRRFVPTLVGFAVLGASFYKTRSIIIPTLLSALAYGLAWKVMAII
>NZ_CP020368.1|WP_000378442.1|2632918_2633449_+|multidrug-efflux-transporter-EmrAB-transcriptional-repressor-EmrR
MDSSFTPIEQMLKFRASRHEDFPYQEILLTRLCMHMQSKLLENRNKMLKAQGINETLFMALITLESQENHSIQPSELSCALGSSRTNATRIADELEKRGWIERRESDNDRRCLHLQLTEKGHEFLREVLPPQHNCLHQLWSALSTTEKDQLEQITRKLLSRLDQMEQDGVVLEAMS
>NZ_CP020368.1|WP_001295175.1|2633575_2634748_+|multidrug-efflux-MFS-transporter-periplasmic-adaptor-subunit-EmrA
MSANAETQTPQQPVKKSGKRKRLLLLLTLLFIIIAVAIGIYWFLVLRHFEETDDAYVAGNQIQIMSQVSGSVTKVWADNTDFVKEGDVLVTLDPTDARQAFEKAKTALASSVRQTHQLMINSKQLQANIEVQKIALAKAQSDYNRRVPLGNANLIGREELQHARDAVTSAQAQLDVAIQQYNANQAMILGTKLEDQPAVQQAATEVRNAWLALERTRIVSPMTGYVSRRAVQPGAQISPTTPLMAVVPATNMWVDANFKETQIANMRIGQPVTITTDIYGDDVKYTGKVVGLDMGTGSAFSLLPAQNATGNWIKVVQRLPVRIELDQKQLEQYPLRIGLSTLVSVNTTNRDGQVLANKVRSTPVAVSTAREISLAPVNKLIDDIVKANAG
>NZ_CP020368.1|WP_001295176.1|2634764_2636303_+|multidrug-efflux-MFS-transporter-permease-subunit-EmrB
MQQQKPLEGAQLVIMTIALSLATFMQVLDSTIANVAIPTIAGNLGSSLSQGTWVITSFGVANAISIPLTGWLAKRVGEVKLFLWSTIAFAIASWACGVSSSLNMLIFFRVIQGIVAGPLIPLSQSLLLNNYPPAKRSIALALWSMTVIVAPICGPILGGYISDNYHWGWIFFINVPIGVAVVLMTLQTLRGRETRTERRRIDAVGLALLVIGIGSLQIMLDRGKELDWFSSQEIIILTVVAVVAICFLIVWELTDDNPIVDLSLFKSRNFTIGCLCISLAYMLYFGAIVLLPQLLQEVYGYTATWAGLASAPVGIIPVILSPIIGRFAHKLDMRRLVTFSFIMYAVCFYWRAYTFEPGMDFGASAWPQFIQGFAVACFFMPLTTITLSGLPPERLAAASSLSNFTRTLAGSIGTSITTTMWTNRESMHHAQLTESVNPFNPNAQAMYSQLEGLGMTQQQASGWIAQQITNQGLIISANEIFWMSAGIFLVLLGLVWFAKPPFGAGGGGGGAH
>NZ_CP020368.1|WP_001130211.1|2636366_2636882_-|S-ribosylhomocysteine-lyase
MPLLDSFTVDHTRMEAPAVRVAKTMNTPHGDAITVFDLRFCVPNKEVMPERGIHTLEHLFAGFMRNHLNGNGVEIIDISPMGCRTGFYMSLIGTPDEQRVADAWKAAMEDVLKVQDQNQIPELNVYQCGTYQMHSLQEAQDIARSILERDVRINSNEELALPKEKLQELHI
>NZ_CP020368.1|WP_000611804.1|2637031_2638588_-|glutamate--cysteine-ligase
MIPDVSQALAWLEKHPQALKGIQRGLERETLRVNADGTLATTGHPEALGSALTHKWITTDFAEALLEFITPVDGDIEHMLTFMRDLHRYTARNMGDERMWPLSMPCYIAEGQDIELAQYGTSNTGRFKTLYREGLKNRYGALMQTISGVHYNFSLPMAFWQAKCGDISGADAKEKISAGYFRVIRNYYRFGWVIPYLFGASPAICSSFLQGKPTSLPFEKTECGMYYLPYATSLRLSDLGYTNKSQSNLGITFNDLYEYVAGLKQAIKTPSEEYAKIGIEKDGKRLQINSNVLQIENELYAPIRPKRVTRSGESPSDALLRGGIEYIEVRSLDINPFSPIGVDEQQVRFLDLFMVWCALADAPEMSSSELACTRVNWNRVILEGRKPGLTLGIGCETAQFPLPQVGKDLFRDLKRVAQTLDSINGGEAYQKVCDELVACFDNPDLTFSARILRSMIDTGIGGTGKAFAEAYRNLLREEPLEILREEDFVAEREASERRQQEMEAADTEPFAVWLEKHA
>NZ_CP020368.1|WP_001287454.1|2638660_2639089_-|DedA-family-protein
MSEALSLFSLFASSFLSATLLPGNSEVVLVAMLLSGISHPWVLVLTATMGNSLGGLTNVILGRFFPLRKTSRWQEKATGWLKRYGAVTLLLSWMPVVGDLLCLLAGWMRISWGPVIFFLCLGKALRYVAVAAATVQGMMWWH
>NZ_CP020368.1|WP_000273290.1|2639085_2639652_-|fructose-1-phosphate/6-phosphogluconate-phosphatase
MYERYAGLIFDMDGTILDTEPTHRKAWREVLGHYGLQYDIQAMIALNGSPTWRIAQAIIELNQADLDPHALAREKTEAVRSMLLDSVEPLPLVDVVKSWHGRRPMAVGTGSESAIAEALLAHLGLRHYFDAVVAADHVKHHKPAPDTFLLCAQRMGVQPTQCVVFEDADFGIQAARAAGMDAVDVRLL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP020368_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP020368_5

2702148-2702910

TypeI-E

I-E

Consensus_repeat	Method
CGGTTTATCCCCGCTGGCGCGGGGAACTC	CRISPRCasFinder
CGGTTTATCCCCGCTGGCGCGGGGAACTC	CRT
CGGTTTATCCCCGCTGGCGCGGGGAACTC	PILER-CR

12 spacers

cas2,cas1,cas6e,cas5,cas7,cse2gr11,cas8e,cas3

The CRISPR arrays of NZ_CP020368_5

>merge|NZ_CP020368|5|2702148-2702910|CRISPRCasFinder,CRT,PILER-CR
CGGTTTATCCCCGCTGATGCGGGGAACACCAGCGTCAGGCGTGAAATCTCACCGTCGTTGCCGGTTTATCCCTGCTGGCGCGGGGAACTCTCGGTTCAGGCGTTGCAAACCTGGCTACCGGGCGGTTTATCCCCGCTAACGCGGGGAACTCGTAGTCCATCATTCCACCTATGTCTGAACTCCCGGTTTATCCCCGCTGGCGCGGGGAACTCCGGGGGGATAATGTTTACGGTCATGCGCCCCCCGGTTTATCCCCGCTGGCGCGGGGAACTCTGGGCGGCTTGCCTTGCAGCCAGCTCCAGCAGCGGTTTATCCCCGCTGGCGCGGGGAACTCAAGCTGGCTGGCAATCTCTTTCGGGGTGAGTCCGGTTTATCCCCGCTGGCGCGGGGAACTCTAGTTTCCGTATCTCCGGATTTATAAAGCTGACGGTTTATCCCCGCTGGCGCGGGGAACTCGCAGGCGGCGACGCGCAGGGTATGCGCGATTCGCGGTTTATCCCCGCTGGCGCGGGGAACTCGCGACCGCTCAGAAATTCCAGACCCGATCCAAACGGTTTATCCCCGCTGGCGCGGGGAACTCTCAACATTATCAATTACAACCGACAGGGAGCCCGGTTTATCCCCGCTGGCGCGGGGAACTCAGCGTGTTCGGCATCACCTTTGGCTTCGGCTGCGGTTTATCCCCGCTGGCGCGGGGAACTCTGCGTGAGCGTATCGCCGCGCGTCTGCGAAAGCGGTTTATCCCCGCTGGCGCGGGGAACTC

>NZ_CP020368|5|5|2702148-2702910|CRISPRCasFinder
CGGTTTATCCCCGCTGATGCGGGGAACAC	CAGCGTCAGGCGTGAAATCTCACCGTCGTTGC
CGGTTTATCCCTGCTGGCGCGGGGAACTC	TCGGTTCAGGCGTTGCAAACCTGGCTACCGGG
CGGTTTATCCCCGCTAACGCGGGGAACTC	GTAGTCCATCATTCCACCTATGTCTGAACTCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	CGGGGGGATAATGTTTACGGTCATGCGCCCCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TGGGCGGCTTGCCTTGCAGCCAGCTCCAGCAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	AAGCTGGCTGGCAATCTCTTTCGGGGTGAGTC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TAGTTTCCGTATCTCCGGATTTATAAAGCTGA
CGGTTTATCCCCGCTGGCGCGGGGAACTC	GCAGGCGGCGACGCGCAGGGTATGCGCGATTCG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	GCGACCGCTCAGAAATTCCAGACCCGATCCAAA
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TCAACATTATCAATTACAACCGACAGGGAGCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	AGCGTGTTCGGCATCACCTTTGGCTTCGGCTG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TGCGTGAGCGTATCGCCGCGCGTCTGCGAAAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC

>NZ_CP020368|5|1|2702148-2702910|CRT
CGGTTTATCCCCGCTGATGCGGGGAACAC	CAGCGTCAGGCGTGAAATCTCACCGTCGTTGC
CGGTTTATCCCTGCTGGCGCGGGGAACTC	TCGGTTCAGGCGTTGCAAACCTGGCTACCGGG
CGGTTTATCCCCGCTAACGCGGGGAACTC	GTAGTCCATCATTCCACCTATGTCTGAACTCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	CGGGGGGATAATGTTTACGGTCATGCGCCCCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TGGGCGGCTTGCCTTGCAGCCAGCTCCAGCAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	AAGCTGGCTGGCAATCTCTTTCGGGGTGAGTC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TAGTTTCCGTATCTCCGGATTTATAAAGCTGA
CGGTTTATCCCCGCTGGCGCGGGGAACTC	GCAGGCGGCGACGCGCAGGGTATGCGCGATTCG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	GCGACCGCTCAGAAATTCCAGACCCGATCCAAA
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TCAACATTATCAATTACAACCGACAGGGAGCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	AGCGTGTTCGGCATCACCTTTGGCTTCGGCTG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TGCGTGAGCGTATCGCCGCGCGTCTGCGAAAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC

>NZ_CP020368|5|1|2702331-2702910|PILER-CR
CGGTTTATCCCCGCTGGCGCGGGGAACTC	CGGGGGGATAATGTTTACGGTCATGCGCCCCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TGGGCGGCTTGCCTTGCAGCCAGCTCCAGCAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	AAGCTGGCTGGCAATCTCTTTCGGGGTGAGTC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TAGTTTCCGTATCTCCGGATTTATAAAGCTGA
CGGTTTATCCCCGCTGGCGCGGGGAACTC	GCAGGCGGCGACGCGCAGGGTATGCGCGATTCG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	GCGACCGCTCAGAAATTCCAGACCCGATCCAAA
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TCAACATTATCAATTACAACCGACAGGGAGCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC	AGCGTGTTCGGCATCACCTTTGGCTTCGGCTG
CGGTTTATCCCCGCTGGCGCGGGGAACTC	TGCGTGAGCGTATCGCCGCGCGTCTGCGAAAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP020368.1\|WP_000490428.1\|2701027_2702065_+\|aminopeptidase	unknown	unknown	gnl\|CDD\|182299
NZ_CP020368.1\|WP_000568943.1\|2694701_2695751_-\|tRNA-pseudouridine(13)-synthase-TruD	unknown	unknown	gnl\|CDD\|234884
NZ_CP020368.1\|WP_001246104.1\|2697460_2697784_-\|DUF3561-family-protein	unknown	unknown	gnl\|CDD\|371891
NZ_CP020368.1\|WP_001090361.1\|2698438_2699866_-\|sulfate-adenylyltransferase-subunit-CysN	unknown	unknown	gnl\|CDD\|235349
NZ_CP020368.1\|WP_001290679.1\|2712833_2714546_-\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	unknown	unknown	gnl\|CDD\|237402
NZ_CP020368.1\|WP_000752800.1\|2706601_2707084_-\|type-I-E-CRISPR-associated-protein-Cse2/CasB	cse2gr11	cd09670_cse2gr11_CAS-I-E	gnl\|CDD\|187801
NZ_CP020368.1\|WP_000372108.1\|2699867_2700776_-\|sulfate-adenylyltransferase-subunit-CysD	unknown	unknown	gnl\|CDD\|235375
NZ_CP020368.1\|WP_000220066.1\|2703301_2704219_-\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NZ_CP020368.1\|WP_001295182.1\|2693959_2694721_-\|5'/3'-nucleotidase-SurE	unknown	unknown	gnl\|CDD\|234732
NZ_CP020368.1\|WP_000433152.1\|2708999_2711666_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|182031
NZ_CP020368.1\|WP_001381369.1\|2703015_2703300_-\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	cd09648_cas2_CAS-I-E	gnl\|CDD\|236930
NZ_CP020368.1\|WP_000039850.1\|2712024_2712759_-\|phosphoadenosine-phosphosulfate-reductase	unknown	unknown	gnl\|CDD\|234997
NZ_CP020368.1\|WP_000281400.1\|2704234_2704834_-\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	cd09664_cas6e_CAS-I-E	gnl\|CDD\|273869
NZ_CP020368.1\|WP_001173673.1\|2697833_2698439_-\|adenylyl-sulfate-kinase	unknown	unknown	gnl\|CDD\|179661
NZ_CP020368.1\|WP_000064450.1\|2705497_2706589_-\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	cas7	cd09646_cas7_CAS-I-E	gnl\|CDD\|273843
NZ_CP020368.1\|WP_000517476.1\|2696955_2697267_-\|cell-division-protein-FtsB	unknown	unknown	gnl\|CDD\|179156
NZ_CP020368.1\|WP_001334996.1\|2704820_2705495_-\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|273842
NZ_CP020368.1\|WP_001219242.1\|2695747_2696227_-\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	unknown	unknown	gnl\|CDD\|178851
NZ_CP020368.1\|WP_001050401.1\|2707076_2708585_-\|type-I-E-CRISPR-associated-protein-Cse1/CasA	cas8e	cd09669_cas8e_CAS-I-E	gnl\|CDD\|236613
NZ_CP020368.1\|WP_000246138.1\|2696226_2696937_-\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	unknown	unknown	gnl\|CDD\|234670

Protein	Function_ID	Function_description	E-value
NZ_CP020368.1\|WP_000490428.1\|2701027_2702065_+\|aminopeptidase	gnl\|CDD\|182299	PRK10199, PRK10199, alkaline phosphatase isozyme conversion aminopeptidase; Provisional.	0
NZ_CP020368.1\|WP_000568943.1\|2694701_2695751_-\|tRNA-pseudouridine(13)-synthase-TruD	gnl\|CDD\|234884	PRK00984, truD, tRNA pseudouridine synthase D; Reviewed.	0
NZ_CP020368.1\|WP_001246104.1\|2697460_2697784_-\|DUF3561-family-protein	gnl\|CDD\|371891	pfam12084, DUF3561, Protein of unknown function (DUF3561). This family of proteins is functionally uncharacterized. This protein is found in bacteria. Proteins in this family are about 110 amino acids in length.	1.22003e-52
NZ_CP020368.1\|WP_001090361.1\|2698438_2699866_-\|sulfate-adenylyltransferase-subunit-CysN	gnl\|CDD\|235349	PRK05124, cysN, sulfate adenylyltransferase subunit 1; Provisional.	0
NZ_CP020368.1\|WP_001290679.1\|2712833_2714546_-\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	gnl\|CDD\|237402	PRK13504, PRK13504, NADPH-dependent assimilatory sulfite reductase hemoprotein subunit.	0
NZ_CP020368.1\|WP_000752800.1\|2706601_2707084_-\|type-I-E-CRISPR-associated-protein-Cse2/CasB	gnl\|CDD\|187801	cd09670, Cse2_I-E, CRISPR/Cas system-associated protein Cse2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; also known as Cse2/CasB/YgcK family; specific gene for I-E subtype;.	1.76293e-33
NZ_CP020368.1\|WP_000372108.1\|2699867_2700776_-\|sulfate-adenylyltransferase-subunit-CysD	gnl\|CDD\|235375	PRK05253, PRK05253, sulfate adenylyltransferase subunit CysD.	0
NZ_CP020368.1\|WP_000220066.1\|2703301_2704219_-\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	2.68794e-159
NZ_CP020368.1\|WP_001295182.1\|2693959_2694721_-\|5'/3'-nucleotidase-SurE	gnl\|CDD\|234732	PRK00346, surE, 5'(3')-nucleotidase/polyphosphatase; Provisional.	1.92279e-150
NZ_CP020368.1\|WP_000433152.1\|2708999_2711666_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	0
NZ_CP020368.1\|WP_001381369.1\|2703015_2703300_-\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|236930	PRK11558, PRK11558, putative ssRNA endonuclease; Provisional.	4.76227e-62
NZ_CP020368.1\|WP_000039850.1\|2712024_2712759_-\|phosphoadenosine-phosphosulfate-reductase	gnl\|CDD\|234997	PRK02090, PRK02090, phosphoadenylyl-sulfate reductase.	2.39575e-137
NZ_CP020368.1\|WP_000281400.1\|2704234_2704834_-\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|273869	TIGR01907, CRISPR_system_Cascade_subunit_CasE, CRISPR-associated protein Cas6/Cse3/CasE, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model family, represented by CT1974 from Chlorobium tepidum, is found in the Ecoli subtype of CRISPR/Cas regions and is designated Cse3 (CRISPR/Cas Subtype Ecoli protein 3). The representative of this family from Thermus thermophilus HB8 (TTHB192) has been crystallized and found to have a structure consisting of two domains with opposing parallel beta-sheets known as a beta-sheet platform. This structure is similar to those found in the Sex-lethal protein and poly(A)-binding protein. This structure is consistent with an RNA-binding function.	1.81669e-101
NZ_CP020368.1\|WP_001173673.1\|2697833_2698439_-\|adenylyl-sulfate-kinase	gnl\|CDD\|179661	PRK03846, PRK03846, adenylylsulfate kinase; Provisional.	7.34447e-148
NZ_CP020368.1\|WP_000064450.1\|2705497_2706589_-\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	gnl\|CDD\|273843	TIGR01869, CRISPR_system_Cascade_subunit_CasC, CRISPR-associated protein Cas7/Cse4/CasC, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum and is part of the Ecoli subtype of CRISPR/Cas locis. It is designated Cse4, for CRISPR/Cas Subtype Ecoli protein 4.	5.43824e-154
NZ_CP020368.1\|WP_000517476.1\|2696955_2697267_-\|cell-division-protein-FtsB	gnl\|CDD\|179156	PRK00888, ftsB, cell division protein FtsB; Reviewed.	5.55235e-62
NZ_CP020368.1\|WP_001334996.1\|2704820_2705495_-\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|273842	TIGR01868, hypothetical_protein, CRISPR-associated protein Cas5/CasD, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is part of the ECOLI subtype CRISPR/Cas locus, and now characterized as part of the CASCADE complex of that system. It shares a small N-terminal homology region with members of several other CRISPR/Cas subtypes, and we view the families that share this region as being Cas5.	2.15381e-103
NZ_CP020368.1\|WP_001219242.1\|2695747_2696227_-\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	gnl\|CDD\|178851	PRK00084, ispF, 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase; Reviewed.	1.56248e-104
NZ_CP020368.1\|WP_001050401.1\|2707076_2708585_-\|type-I-E-CRISPR-associated-protein-Cse1/CasA	gnl\|CDD\|236613	PRK09693, PRK09693, Cascade antiviral complex protein; Validated.	0
NZ_CP020368.1\|WP_000246138.1\|2696226_2696937_-\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	gnl\|CDD\|234670	PRK00155, ispD, D-ribitol-5-phosphate cytidylyltransferase.	3.26939e-121

>NZ_CP020368.1|WP_000490428.1|2701027_2702065_+|aminopeptidase
MFSALRHRTAALALGVCFILPVHASSPKPGDFANTQARHIATFFPGRMTGTPAEMLSADYIRQQFQQMGYRSDIRTFNSRYIYTARDNRKSWHNVTGSTVIAAHEGKAPQQIIIMAHLDTYAPLSDADADANLGGLTLQGMDDNAAGLGVMLELAERLKNTPTEYGIRFVATSGEEEGKLGAENLLKRMSDTEKKNTLLVINLDNLIVGDKLYFNSGVKTPEAVRKLTRDRALAIARSHGIAATTNPGLNKNYPKGTGCCNDAEIFDKAGIAVLSVEATNWNLGNKDGYQQRAKTPAFPAGNSWHDVRLDNHQHIDKALPGRIERRCRDVMRIMLPLVKELAKAS
>NZ_CP020368.1|WP_000372108.1|2699867_2700776_-|sulfate-adenylyltransferase-subunit-CysD
MDQIRLTHLRQLEAESIHIIREVAAEFSNPVMLYSIGKDSSVMLHLARKAFYPGTLPFPLLHVDTGWKFREMYEFRDRTAKAYGCELLVHKNPEGVAMGINPFVHGSAKHTDIMKTEGLKQALNKYGFDAAFGGARRDEEKSRAKERIYSFRDRFHRWDPKNQRPELWHNYNGQINKGESIRVFPLSNWTEQDIWQYIWLENIDIVPLYLAAERPVLERDGMLMMIDDNRIDLQPGEVIKKRMVRFRTLGCWPLTGAVESNAQTLPEIIEEMLVSTTSERQGRVIDRDQAGSMELKKRQGYF
>NZ_CP020368.1|WP_001090361.1|2698438_2699866_-|sulfate-adenylyltransferase-subunit-CysN
MNTALAQQIANEGGVEAWMIAQQHKSLLRFLTCGSVDDGKSTLIGRLLHDTRQIYEDQLSSLHNDSKRHGTQGEKLDLALLVDGLQAEREQGITIDVAYRYFSTEKRKFIIADTPGHEQYTRNMATGASTCELAILLIDARKGVLDQTRRHSFISTLLGIKHLVVAINKMDLVDYSEETFTRIREDYLTFAGQLPGNLDIRFVPLSALEGDNVASQSESMPWYSGPTLLEVLETVEIQRVVDAQPMRFPVQYVNRPNLDFRGYAGTLASGRVEVGQRVKVLPSGVESNVARIVTFDGDREEAFAGEAITLVLTDEIDISRGDLLLAADEALPAVQSASVDVVWMAEQPLSPGQSYDIKIAGKKTRARVDGIRYQVDINNLTQREVENLPLNGIGLVDLTFDEPLVLDRYQQNPVTGGLIFIDRLSNVTVGAGMVHEPVSQATAAPSEFSAFELELNALVRRHFPHWGARDLLGDK
>NZ_CP020368.1|WP_001173673.1|2697833_2698439_-|adenylyl-sulfate-kinase
MALHDENVVWHSHPVTVQQRELHHGHRGVVLWFTGLSGSGKSTVAGALEEALHKLGVSTYLLDGDNVRHGLCSDLGFSDADRKENIRRVGEVANLMVEAGLVVLTAFISPHRAERQMVRERVGEGRFIEVFVDTPLAICEARDPKGLYKKARAGELRNFTGIDSVYEAPESAEIHLNGEQLVTNLVQQLLDLLRQNDIIRS
>NZ_CP020368.1|WP_001246104.1|2697460_2697784_-|DUF3561-family-protein
MRNSHNITLTNNDSLTEDEETTWSLPGAVVGFISWLFALAMPMLIYGSNTLFFFIYTWPFFLALMPVAVVVGIALHSLMDGKLRYSIVFTLVTVGIMFGALFMWLLG
>NZ_CP020368.1|WP_000517476.1|2696955_2697267_-|cell-division-protein-FtsB
MGKLTLLLLAILVWLQYSLWFGKNGIHDYTRVNDDVAAQQATNAKLKARNDQLFAEIDDLNGGQEALEERARNELSMTRPGETFYRLVPDASKRAQSAGQNNR
>NZ_CP020368.1|WP_000246138.1|2696226_2696937_-|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase
MATTHLDVCAVVPAAGFGRRMQTECPKQYLSIGNQTILEHSVHALLAHPRVKRVVIAISPGDSRFAQLPLANHPQITVVDGGDERADSVLAGLKAAGDAQWVLVHDAARPCLHQDDLARLLALSETSRTGGILAAPVRDTMKRAEPGKNAIAHTVDRNGLWHALTPQFFPRELLHDCLTRALNEGATITDEASALEYCGFHPQLVEGRADNIKVTRPEDLALAEFYLTRTIHQENT
>NZ_CP020368.1|WP_001219242.1|2695747_2696227_-|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase
MRIGHGFDVHAFGGEGPIIIGGVRIPYEKGLLAHSDGDVALHALTDALLGAAALGDIGKLFPDTDPAFKGADSRELLREAWRRIQAKGYTLGNVDVTIIAQAPKMLPHIPQMRVFIAEDLGCHMDDVNVKATTTEKLGFTGRGEGIACEAVALLIKATK
>NZ_CP020368.1|WP_000568943.1|2694701_2695751_-|tRNA-pseudouridine(13)-synthase-TruD
MIEFDNLTYLHGKPQGTGLLKANPEDFVVVEDLGFEPDGEGEHILVRILKNGCNTRFVADALAKFLKIHAREVSFAGQKDKHAVTEQWLCARVPGKEMPDLSAFQLEGCQVLEYARHKRKLRLGALKGNAFTLVLREVSNRDDVEQRLIDICVKGVPNYFGAQRFGIGGSNLQGAQRWAQTNTPVRDRNKRSFWLSAARSALFNQIVAERLKKADVNQVVDGDALQLAGRGSWFVATTEELAELQRRVNDKELMITAALPGSGEWGTQREALAFEQAAVAAETELQALLVREKVEAARRAMLLYPQQLSWNWWDDVTVEIRFWLPAGSFATSVVRELINTTGDYAHIAE
>NZ_CP020368.1|WP_001295182.1|2693959_2694721_-|5'/3'-nucleotidase-SurE
MRILLSNDDGVHAPGIQTLAKALREFADVQVVAPDRNRSGASNSLTLESSLRTFTFENGDIAVQMGTPTDCVYLGVNALMRPRPDIVVSGINAGPNLGDDVIYSGTVAAAMEGRHLGFPALAVSLDGHKHYDTAAAVTCSILRALCKEPLRTGRILNINVPDLPLDQIKGIRVTRCGTRHPADQVIPQQDPRGNTLYWIGPPGGKCDAGPGTDFAAVDEGYVSITPLHVDLTAHSAQDVVSDWLNSVGVGTQW
>NZ_CP020368.1|WP_001381369.1|2703015_2703300_-|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MSMLVVVTENVPPRLRGRLAIWLLEVRAGVYVGDVSAKIREMIWEQIAGLAEEGNVVMAWATNTETGFEFQTFGLNRRTPVDLDGLRLVSFLPV
>NZ_CP020368.1|WP_000220066.1|2703301_2704219_-|type-I-E-CRISPR-associated-endonuclease-Cas1
MTWLPLNPIPLKDRVSMIFLQYGQIDVIDGAFVLIDKTGIRTHIPVGSVACIMLEPGTRVSHAAVRLAAQVGTLLVWVGEAGVRVYASGQPGGARSDKLLYQAKLALDEDLRLKVVRKMFELRFGEPAPARRSVEQLRGIEGSRVRATYALLAKQYGVTWNGRRYDPKDWEKGDTINQCISAATSCLYGVTEAAILAAGYAPAIGFVHTGKPLSFVYDIADIIKFDTVVPKAFEIARRNPGEPDREVRLACRDIFRSSKTLAKLIPLIEDVLAAGEIQPPAPPEDAQPVAIPLPVSLGDAGHRSS
>NZ_CP020368.1|WP_000281400.1|2704234_2704834_-|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQSAQMPVSTAVATVIKTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCRVPLIKEAEQIAWLQRKLGNAARVEDVHPISERPQYFSGDGKSGKIQTVCFEGVLTINDAPALIDLVQQGIGPAKSMGCGLLSLAPL
>NZ_CP020368.1|WP_001334996.1|2704820_2705495_-|type-I-E-CRISPR-associated-protein-Cas5/CasD
MRSYLILRLAGPMQAWGQPTFEGTRPTGRFPTRSGLLGLLGACLGIQRDDTSSLQALSESVQFAVRCDELILDDRRVSVTGLRDYHTVLGAREDYRGLKSHETIQTWREYLCDASFTVALWLTPHATMVISELEKAVLKPRYTPYLGRRSCPLTHPLFLGTCQASDPQKALLNYEPVGGDIYSEESVTGHHLKFTARDEPMITLPRQFASREWYVIKGGMDVSQ
>NZ_CP020368.1|WP_000064450.1|2705497_2706589_-|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC
MSNFINIHVLISHSPSCLNRDDMNMQKDAIFGGKRRVRISSQSLKRAMRKSGYYAQNIGESSLRTIHLAQLRDVLRQKLGERFDQKIIDKTLALLSGKSVDEAEKISADAVTPWVVGEIAWFCEQVAKAEADNLDDKKLLKVLKEDIAAIRVNLQQGVDIALSGRMATSGMMTELGKVDGAMSIAHAITTHQVDSDIDWFTAVDDLQEQGSAHLGTQEFSSGVFYRYANINLAQLQENLGGASREQALEIATHVVHMLATEVPGAKQRTYAAFNPADMVMVNFSDMPLSMANAFEKAVKAKDGFLQPSIQAFNQYWDRVANGYGLNGAAAQFSLSDVDPITAQVKQMPTLEQLKSWVRNNGEA
>NZ_CP020368.1|WP_000752800.1|2706601_2707084_-|type-I-E-CRISPR-associated-protein-Cse2/CasB
MADEIDAMALYRAWQQLDNGSCAQIRRVSEPDELRDIPAFYRLVQPFGWENPRHQQALLRMVFCLSAGKNVIRHQDKKSEQTTGISLGRALANSGRINERRIFQLIRADRTADMVQLRRLLTHAEPVLDWPLMARMLTWWGKRERQQLLEDFVLTTNKNA
>NZ_CP020368.1|WP_001050401.1|2707076_2708585_-|type-I-E-CRISPR-associated-protein-Cse1/CasA
MNLLIDNWIPVRPRNGGKVQIINLQSLYCSRDQWRLSLPRDDMELAALALLVCIGQIIAPAKDDVEFRHRIMNPLTEDEFQQLIAPWIDMFYLNHAEHPFMQTKGVKANDVTPMEKLLAGVSGATNCAFVNQPGQGEALCGGCTAIALFNQANQAPGFGGGFKSGLRGGTPVTTFVRGIDLRSTVLLNVLTLPRLQKQFPNESHTENQPTWIKPIKSNESIPASSIGFVRGLFWQPAHIELCDPIGIGKCSCCGQESNLRYTGFLKEKFTFTVNGLWPHPHSPCLVTVKKGEVEEKFLAFTTSAPSWTQISRVVVDKIIQNENGNRVAAVVNQFRNIAPQSPLELIMGGYRNNQASILERRHDVLMFNQGWQQYGNVINEIVTVGLGYKTALRKALYTFAEGFKNKDFKGAGVSVHETAERHFYRQSELLIPDVLANVNFSQADEVIADLRDKLHQLCEMLFNQSVAPYAHHPKLISTLALARATLYKHLRELKPQGGPSNG
>NZ_CP020368.1|WP_000433152.1|2708999_2711666_-|CRISPR-associated-helicase/endonuclease-Cas3
MEPFKYICHYWGKSSKSLTKGNDIHLLIYHCLDVAAVADCWWDQSVVLQNTFCRNEMLSKQRVKAWLLFFIALHDIGKFDIRFQYKSAESWLKLNPATPSLNGPSTQMCRKFNHGAAGLYWFNQDSLSEQSLGDFFSFFDAAPHPYESWFPWVEAVTGHHGFILHSQDQDKSRWEMPASLASYAAQDKQAREEWISVLEALFLTPAGLSINDIPPDCSSLLAGFCSLADWLGSWTTTNTFLFNEDAPSDINALRTYFQDRQQDASRVLELSGLVSNKRCYEGVHALLDNGYQPRQLQVLVDALPVAPGLTVIEAPTGSGKTETALAYAWKLIDQQIADSVIFALPTQATANAMLTRMEASASHLFSSPNLILAHGNSRFNHLFQSIKSRAITEQGQEEAWVQCCQWLSQSNKKVFLGQIGVCTIDQVLISVLPVKHRFIRGLGIGRSVLIVDEVHAYDTYMNGLLEAVLKAQADVGGSVILLSATLPMKQKQKLLDTYGLHTDPVENNSAYPLINWRGVNGAQRFDLLAHPEQLPPRFSIQPEPICLADMLPDLTMLERMIAAANAGAQVCLICNLVDVAQVCYQRLKELNNTQVDIDLFHARFTLNDRREKENRVISNFGKNGKRNVGRILVATQVVEQSLDVDFDWLITQHCPADLLFQRLGRLHRHHRKYRPAGFEIPVATILLPDGEGYGRHEHIYSNVRVMWRTQQHIEELNGASLFFPDAYRQWLDSIYDDAEMDEPEWVGNGMDKFESAECEKRFKARKVLQWAEEYSLQDNDETILAVTRDGEMSLPLLPYVQTSSGKQLLDGQVYEDLSHEQQYEALALNRVNVPFTWKRSFSEVVDEDGLLWLEGKQNLDGWVWQGNSIVITYTGDEGMTRVIPANPK
>NZ_CP020368.1|WP_000039850.1|2712024_2712759_-|phosphoadenosine-phosphosulfate-reductase
MSKLDLNALNELPKVDRILALAETNAELEKLDAEGRVAWALDNLPGEYVLSSSFGIQAAVSLHLVNQIRPDIPVILTDTGYLFPETYRFIDELTDKLKLNLKVYRATESAAWQEARYGKLWEQGVEGIEKYNDINKVEPMNRALKELNAQTWFAGLRREQSGSRANLPVLAIQRGVFKVLPIIDWDNRTIYQYLQKHGLKYHPLWDEGYLSVGDTHTTRKWEPGMAEEETRFFGLKRECGLHEG
>NZ_CP020368.1|WP_001290679.1|2712833_2714546_-|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit
MSEKHPGPLVVEGKLTDAERMKHESNYLRGTIAEDLNDGLTGGFKGDNFLLIRFHGMYQQDDRDIRAERAEQKLEPRHAMLLRCRLPGGVITTKQWQAIDKFAGENTIYGSIRLTNRQTFQFHGILKKNVKPVHQMLHSVGLDALATANDMNRNVLCTSNPYESQLHAEAYEWAKKISEHLLPRTRAYAEIWLDQEKVATTDEEPILGQTYLPRKFKTTVVIPPQNDIDLHANDMNFVAIAENGKLVGFNLLVGGGLSIEHGNKKTYARTASEFGYLPLEHTLAVAEAVVTTQRDWGNRTDRKNAKTKYTLERVGVETFKAEVERRAGIKFEPIRPYEFTGRGDRIGWVKGIDDNWHLTLFIENGRILDYPARPLKTGLLEIAKIHKGDFRITANQNLIIAGVPESEKAKIEKIAKESGLMNAVTPQRENSMACVSFPTCPLAMAEAERFLPSFIDNIDNLMAKHGVSDEHIVMRVTGCPNGCGRAMLAEVGLVGKAPGRYNLHLGGNRIGTRIPRMYKENITEPEILASLDELIGRWAKEREAGEGFGDFTVRAGIIRPVLDPARDLWD

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP020368_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP020368_6

2728461-2728854

Unclear

I-E

Consensus_repeat	Method
GGTTTATCCCCGCTGGCGCGGGGAACAC	CRISPRCasFinder
GGTTTATCCCCGCTGGCGCGGGGAACAC	CRT
GGTTTATCCCCGCTGGCGCGGGGAACAC	PILER-CR

6 spacers

The CRISPR arrays of NZ_CP020368_6

>merge|NZ_CP020368|6|2728461-2728854|CRISPRCasFinder,CRT,PILER-CR
GGTTTATCCCCGCTGGCGCGGGGAACTCGACAGAACGGCCTCAGTAGTCTCGTCAGGCTCCGGTTTATCCCCGCTGGCGCGGGGAACACCTGTTTTCGCAAATCTATGGACTATTGCTATTCGGTTTATCCCCGCTGGCGCGGGGAACACGGGCGCACGGAATACAAAGCCGTGTATCTGCTCGGTTTATCCCCGCTGGCGCGGGGAACACTGGCTCTGCAACAGCAGCACCCATGACCACGTCGGTTTATCCCCGCTGGCGCGGGGAACACGAAATGCTGGTGAGCGTTAATGCCGCAAACACAGGTTTATCCCCGCTGGCGCGGGGAACACATTACGCCTTTTTGCGATTGCCCGGTTTTTGCCGGTTTATCCCCGCTGGCGCGGGGAACAC

>NZ_CP020368|6|6|2728461-2728854|CRISPRCasFinder
GGTTTATCCCCGCTGGCGCGGGGAACTC	GACAGAACGGCCTCAGTAGTCTCGTCAGGCTCC
GGTTTATCCCCGCTGGCGCGGGGAACAC	CTGTTTTCGCAAATCTATGGACTATTGCTATTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	GGGCGCACGGAATACAAAGCCGTGTATCTGCTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	TGGCTCTGCAACAGCAGCACCCATGACCACGTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	GAAATGCTGGTGAGCGTTAATGCCGCAAACACA
GGTTTATCCCCGCTGGCGCGGGGAACAC	ATTACGCCTTTTTGCGATTGCCCGGTTTTTGCC
GGTTTATCCCCGCTGGCGCGGGGAACAC

>NZ_CP020368|6|2|2728461-2728854|CRT
GGTTTATCCCCGCTGGCGCGGGGAACTC	GACAGAACGGCCTCAGTAGTCTCGTCAGGCTCC
GGTTTATCCCCGCTGGCGCGGGGAACAC	CTGTTTTCGCAAATCTATGGACTATTGCTATTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	GGGCGCACGGAATACAAAGCCGTGTATCTGCTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	TGGCTCTGCAACAGCAGCACCCATGACCACGTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	GAAATGCTGGTGAGCGTTAATGCCGCAAACACA
GGTTTATCCCCGCTGGCGCGGGGAACAC	ATTACGCCTTTTTGCGATTGCCCGGTTTTTGCC
GGTTTATCCCCGCTGGCGCGGGGAACAC

>NZ_CP020368|6|2|2728522-2728854|PILER-CR
GGTTTATCCCCGCTGGCGCGGGGAACAC	CTGTTTTCGCAAATCTATGGACTATTGCTATTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	GGGCGCACGGAATACAAAGCCGTGTATCTGCTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	TGGCTCTGCAACAGCAGCACCCATGACCACGTC
GGTTTATCCCCGCTGGCGCGGGGAACAC	GAAATGCTGGTGAGCGTTAATGCCGCAAACACA
GGTTTATCCCCGCTGGCGCGGGGAACAC	ATTACGCCTTTTTGCGATTGCCCGGTTTTTGCC
GGTTTATCCCCGCTGGCGCGGGGAACAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP020368.1\|WP_001098105.1\|2720979_2722317_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
NZ_CP020368.1\|WP_001288228.1\|2730003_2730144_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP020368.1\|WP_001071638.1\|2734340_2735132_-\|nucleoside-triphosphate-pyrophosphohydrolase	unknown	unknown	gnl\|CDD\|236569
NZ_CP020368.1\|WP_001164544.1\|2725038_2726316_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|349949
NZ_CP020368.1\|WP_000046810.1\|2738145_2739447_-\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	unknown	unknown	gnl\|CDD\|237291
NZ_CP020368.1\|WP_000109529.1\|2718365_2718626_+\|ferredoxin-family-protein	unknown	unknown	gnl\|CDD\|225289
NZ_CP020368.1\|WP_001299652.1\|2720222_2721002_-\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	unknown	unknown	gnl\|CDD\|224997
NZ_CP020368.1\|WP_000039688.1\|2726342_2727821_+\|kinase	unknown	unknown	gnl\|CDD\|212662
NZ_CP020368.1\|WP_000226815.1\|2735863_2738098_-\|GTP-pyrophosphokinase	unknown	unknown	gnl\|CDD\|182797
NZ_CP020368.1\|WP_001301334.1\|2717103_2718375_+\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
NZ_CP020368.1\|WP_000210878.1\|2732475_2734113_-\|CTP-synthase-(glutamine-hydrolyzing)	unknown	unknown	gnl\|CDD\|235437
NZ_CP020368.1\|WP_001268460.1\|2730157_2731030_+\|YgcG-family-protein	unknown	unknown	gnl\|CDD\|224429
NZ_CP020368.1\|WP_001299097.1\|2719365_2720226_-\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|224936
NZ_CP020368.1\|WP_001199973.1\|2729193_2729865_-\|7-carboxy-7-deazaguanine-synthase-QueE	unknown	unknown	gnl\|CDD\|275126
NZ_CP020368.1\|WP_000036723.1\|2731089_2732388_-\|phosphopyruvate-hydratase	unknown	unknown	gnl\|CDD\|234617
NZ_CP020368.1\|WP_000059307.1\|2722410_2723865_-\|FAD-linked-oxidoreductase	unknown	unknown	gnl\|CDD\|223354
NZ_CP020368.1\|WP_001130266.1\|2718642_2719218_+\|glycerol-3-phosphate-responsive-antiterminator	unknown	unknown	gnl\|CDD\|224865
NZ_CP020368.1\|WP_000581937.1\|2735537_2735786_-\|type-II-toxin-antitoxin-system-antitoxin-MazE	unknown	unknown	gnl\|CDD\|182082
NZ_CP020368.1\|WP_000254738.1\|2735202_2735538_-\|endoribonuclease-MazF	unknown	unknown	gnl\|CDD\|182138
NZ_CP020368.1\|WP_000021334.1\|2723934_2724720_-\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|187605

Protein	Function_ID	Function_description	E-value
NZ_CP020368.1\|WP_001098105.1\|2720979_2722317_-\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	3.74708e-50
NZ_CP020368.1\|WP_001071638.1\|2734340_2735132_-\|nucleoside-triphosphate-pyrophosphohydrolase	gnl\|CDD\|236569	PRK09562, mazG, nucleoside triphosphate pyrophosphohydrolase; Reviewed.	4.08591e-159
NZ_CP020368.1\|WP_001164544.1\|2725038_2726316_+\|MFS-transporter	gnl\|CDD\|349949	cd06174, MFS, Major Facilitator Superfamily. The Major Facilitator Superfamily (MFS) is a large and diverse group of secondary transporters that includes uniporters, symporters, and antiporters. MFS proteins facilitate the transport across cytoplasmic or internal membranes of a variety of substrates including ions, sugar phosphates, drugs, neurotransmitters, nucleosides, amino acids, and peptides. They do so using the electrochemical potential of the transported substrates. Uniporters transport a single substrate, while symporters and antiporters transport two substrates in the same or in opposite directions, respectively, across membranes. MFS proteins are typically 400 to 600 amino acids in length, and the majority contain 12 transmembrane alpha helices (TMs) connected by hydrophilic loops. The N- and C-terminal halves of these proteins display weak similarity and may be the result of a gene duplication/fusion event. Based on kinetic studies and the structures of a few bacterial superfamily members, GlpT (glycerol-3-phosphate transporter), LacY (lactose permease), and EmrD (multidrug transporter), MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement. Bacterial members function primarily for nutrient uptake, and as drug-efflux pumps to confer antibiotic resistance. Some MFS proteins have medical significance in humans such as the glucose transporter Glut4, which is impaired in type II diabetes, and glucose-6-phosphate transporter (G6PT), which causes glycogen storage disease when mutated.	1.60446e-29
NZ_CP020368.1\|WP_000046810.1\|2738145_2739447_-\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	gnl\|CDD\|237291	PRK13168, rumA, 23S rRNA (uracil(1939)-C(5))-methyltransferase RlmD.	0
NZ_CP020368.1\|WP_000109529.1\|2718365_2718626_+\|ferredoxin-family-protein	gnl\|CDD\|225289	COG2440, FixX, Ferredoxin-like protein [Energy production and conversion].	7.43419e-42
NZ_CP020368.1\|WP_001299652.1\|2720222_2721002_-\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	gnl\|CDD\|224997	COG2086, FixA, Electron transfer flavoprotein, beta subunit [Energy production and conversion].	1.56693e-62
NZ_CP020368.1\|WP_000039688.1\|2726342_2727821_+\|kinase	gnl\|CDD\|212662	cd07779, FGGY_ygcE_like, uncharacterized ygcE-like proteins. This subfamily consists of uncharacterized hypothetical bacterial proteins with similarity to Escherichia coli sugar kinase ygcE , whose functional roles are not yet clear. Escherichia coli ygcE is recognized by this model, but is not present in the alignment as it contains a deletion relative to other members of the group. These proteins belong to the FGGY family of carbohydrate kinases, the monomers of which contain two large domains, which are separated by a deep cleft that forms the active site. This model includes both the N-terminal domain, which adopts a ribonuclease H-like fold, and the structurally related C-terminal domain.	1.27376e-109
NZ_CP020368.1\|WP_000226815.1\|2735863_2738098_-\|GTP-pyrophosphokinase	gnl\|CDD\|182797	PRK10872, relA, (p)ppGpp synthetase I/GTP pyrophosphokinase; Provisional.	0
NZ_CP020368.1\|WP_001301334.1\|2717103_2718375_+\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	5.03655e-125
NZ_CP020368.1\|WP_000210878.1\|2732475_2734113_-\|CTP-synthase-(glutamine-hydrolyzing)	gnl\|CDD\|235437	PRK05380, pyrG, CTP synthetase; Validated.	0
NZ_CP020368.1\|WP_001268460.1\|2730157_2731030_+\|YgcG-family-protein	gnl\|CDD\|224429	COG1512, COG1512, Beta-propeller domains of methanol dehydrogenase type [General function prediction only].	3.25867e-100
NZ_CP020368.1\|WP_001299097.1\|2719365_2720226_-\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|224936	COG2025, FixB, Electron transfer flavoprotein, alpha subunit [Energy production and conversion].	7.42017e-90
NZ_CP020368.1\|WP_001199973.1\|2729193_2729865_-\|7-carboxy-7-deazaguanine-synthase-QueE	gnl\|CDD\|275126	TIGR04322, organic_radical_activating_enzyme, putative 7-cyano-7-deazaguanosine (preQ0) biosynthesis protein QueE. Members of this radical SAM domain protein family appear to be the E. coli form of the queuosine biosynthesis protein QueE. QueE is involved in making preQ0 (7-cyano-7-deazaquanine), a precursor of both the bacterial/eukaryotic modified tRNA base queuosine and the archaeal modified base archaeosine. Members occur in species that lack known forms of QueE but usually are not found in queuosine biosynthesis operons. Members of this family tend to form bi-directional best hit matches to members of known (TIGR03365) and putative (TIGR03963) QueE families from other lineages.	3.98248e-155
NZ_CP020368.1\|WP_000036723.1\|2731089_2732388_-\|phosphopyruvate-hydratase	gnl\|CDD\|234617	PRK00077, eno, enolase; Provisional.	0
NZ_CP020368.1\|WP_000059307.1\|2722410_2723865_-\|FAD-linked-oxidoreductase	gnl\|CDD\|223354	COG0277, GlcD, FAD/FMN-containing dehydrogenases [Energy production and conversion].	2.73778e-83
NZ_CP020368.1\|WP_001130266.1\|2718642_2719218_+\|glycerol-3-phosphate-responsive-antiterminator	gnl\|CDD\|224865	COG1954, GlpP, Glycerol-3-phosphate responsive antiterminator (mRNA-binding) [Transcription].	5.83077e-88
NZ_CP020368.1\|WP_000581937.1\|2735537_2735786_-\|type-II-toxin-antitoxin-system-antitoxin-MazE	gnl\|CDD\|182082	PRK09798, PRK09798, MazF-MazE toxin-antitoxin system antitoxin MazE.	6.19513e-48
NZ_CP020368.1\|WP_000254738.1\|2735202_2735538_-\|endoribonuclease-MazF	gnl\|CDD\|182138	PRK09907, PRK09907, endoribonuclease MazF.	1.17475e-74
NZ_CP020368.1\|WP_000021334.1\|2723934_2724720_-\|SDR-family-oxidoreductase	gnl\|CDD\|187605	cd05347, Ga5DH-like_SDR_c, gluconate 5-dehydrogenase (Ga5DH)-like, classical (c) SDRs. Ga5DH catalyzes the NADP-dependent conversion of carbon source D-gluconate and 5-keto-D-gluconate. This SDR subgroup has a classical Gly-rich NAD(P)-binding motif and a conserved active site tetrad pattern. However, it has been proposed that Arg104 (Streptococcus suis Ga5DH numbering), as well as an active site Ca2+, play a critical role in catalysis. In addition to Ga5DHs this subgroup contains Erwinia chrysanthemi KduD which is involved in pectin degradation, and is a putative 2,5-diketo-3-deoxygluconate dehydrogenase. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase (15-PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, 15-PGDH numbering) and/or an Asn (Asn-107,15-PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	7.96451e-139

>NZ_CP020368.1|WP_000039688.1|2726342_2727821_+|kinase
MSKKYIIGIDGGSQSTKVVMYDLEGNVVCEGKGLLQPMHTPDADTAEHPDDDLWASLCFAGHDLMSQFAGNKEDIVGIGLGSIRCCRALLKADGTPAAPLISWQDARVTRPYEHTNPDVAYVTSFSGYLTHRLTGEFKDNIANYFGQWPVDYKSWAWSEDAAVMDKFNIPRHMLFDVQMPGTVLGHITPQAALATHFPAGLPVVCTTSDKPVEALGAGLLDDETAVISLGTYIALMMNGKALPKDPVAYWPIMSSIPQTLLYEGYGIRKGMWTVSWLRDMLGESLIQDARAQDLSPEDLLNKKASCVPPGCNGLMTVLDWLTNPWEPYKRGIMIGFDSSMDYAWIYRSILESVALTLKNNYDNMCNEMNHFAKHVIITGGGSNSDLFMQIFADVFNLPARRNAINGCASLGAAINTAVGLGLYPDYATAVDNMVRVKDIFIPIESNAKRYDAMNKGIFKDLTKHTDVILKKSYEVMHGELGNVDSIQSWSNA
>NZ_CP020368.1|WP_001164544.1|2725038_2726316_+|MFS-transporter
MQHNSYRRWITLAIISFSGGVSFDLAYLRYIYQIPMAKFMGFSNTEIGLIMSTFGIAAIILYAPSGVIADKFSHRKMITSAMIITGLLGLLMATYPPLWVMLCIQIAFAITTILMLWSVSIKAASLLGDHSEQGKIMGWMEGLRGVGVMSLAVFTMWVFSRFAPDDSTSLKTVIIIYSVVYILLGILCWFFVSDNNNLRSANNEEKQSFQLSDILAVLRISTTWYCSMVIFGVFTIYAILSYSTNYLTEMYGMSLVAASYMGIVINKIFRALCGPLGGIITTYSKVKSPTRVIQILSVLGLLTLTALLVTNSNPQSVAMGIGLILLLGFTCYASRGLYWACPGEARTPSYIMGTTVGICSVIGFLPDVFVYPIIGHWQDTLPAAEAYRNMWLMGMAALGMVIVFTFLLFQKIRTADSAPAMASSK
>NZ_CP020368.1|WP_000021334.1|2723934_2724720_-|SDR-family-oxidoreductase
MSIESLNAFSMDFFSLKGKTAIVTGGNSGLGQAFAMALAKAGANIFIPSFVKDNGETKEMIEKQGVEVDFMQVGITAEGAPQKIIAACCERFGTVDILVNNAGICKLNKVLDFGRADWDPMIDVNLTAAFELSYEAAKIMIPQKSGKIINICSLFSYLGGQWSPAYSATKHALAGFTKAYCDELGQYNIQVNGIAPGYYATDITLATRSNPETNQRVLDHIPANRWGDTQDLMGAAVFLASPASNYVNGHLLVVDGGYLVR
>NZ_CP020368.1|WP_000059307.1|2722410_2723865_-|FAD-linked-oxidoreductase
MSLSRAAIVDQLKEIVGADRVITDETVLKKNSIDRFRKFPDIHGIYTLPIPAAVVKLGSTEQVSRVLNFMNAHKINGVPRTGASATEGGLETVVENSVVLDGSAMNQIINIDIENMQATAQCGVPLEVLENALREKGYTTGHSPQSKPLAQMGGLVATRSIGQFSTLYGAIEDMVVGLEAVLADGTVTRIKNVPRRAAGPDIRHIIIGNEGALCYITEVTVKIFKFTPENNLFYGYILEDMKTGFNILREIMVEGYRPSIARLYDAEDGTQHFTHFADGKCVLIFMAEGNPRIAKVTGEGIAEIVARYPQCQRVDSKLIETWFNNLNWGPDKVAAERVQILKTGNMGFTTEVSGCWSCIHEIYESVINRIRTEFPHADDITMLGGHSSHSYQNGTNMYFVYDYNVVDCKPEEEIDKYHNPLNKIICEETIRLGGSMVHHHGIGKHRVHWSKLEHGSAWALLEGLKKQFDPNGIMNTGTIYPIEK
>NZ_CP020368.1|WP_001098105.1|2720979_2722317_-|MFS-transporter
MNTSPVRMDDLPLNRFHCRIAALTFGAHLTDGYVLGVIGYAIIQLTPAMQLTPFMAGMIGGSALLGLFLGSLVLGWISDHIGRQKIFTFSFLLITLASFLQFFATTPEHLIGLRILIGIGLGGDYSVGHTLLAEFSPRRHRGILLGAFSVVWTVGYVLASIAGHHFISENPEAWRWLLASAALPALLITLLRWGTPESPRWLLRQGRFAEAHAIVHRYFGPHVLLGDEVVTATHKHIKTLFSSRYWRRTAFNSVFFVCLVIPWFVIYTWLPTIAQTIGLEDALTASLMLNALLIVGALLGLVLTHLLAHRKFLLGSFLLLAATLVVMACLPSGSSLTLLLFVLFSTTISAVSNLVGILPAESFPTDIRSLGVGFATAMSRLGAAVSTGLLPWVLAQWGMQVTLLLLATVLLVGFVVTWLWAPETKALPLVAAGNVGGANEHSVSV
>NZ_CP020368.1|WP_001299652.1|2720222_2721002_-|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein
MNILLAFKAEPDAGMLAEKEWQAAAQGKSGPDISLLRSLLGADEQAAAALLLAQRKNGTPMSLTALSMGDERALHWLRYLMALGFEEAVLLETAADLRFAPEFVARHIAEWQHQNPLDLIITGCQSSEGQNGQTPFLLAEMLGWPCFTQVERFTLDALFITLEQRTEHGLRCCRVRLPAVIAVRQCGEVALPVPGMRQRMAAGKAEIIRKTVAAEMPAMQCLQLARAEQRRGATLIDGQTVAEKAQKLWQDYLRQRMQP
>NZ_CP020368.1|WP_001299097.1|2719365_2720226_-|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MNIAIVTINQENAAIASWLAAQDFSGCTLAHWQIEPQPVVAEQVLDALVEQWQRTPADVVLFPPGTFGDELSTRLAWRLHGASICQVTSLDIPTVSVRKSHWGNALTATLQTEKRPLCLSLARQAGAAKNATLPSGMQQLNIVPGALPDWLVSTEDLKNVTRDPLAEARRVLVVGQGGEADNQEIAMLAEKLGAEVGYSRARVMNGGVDAEKVIGISGHLLAPEVCIVVGASGAAALMAGVRNSKFVVAINHDASAAVFSQADVGVVDDWKVVLEALVTNIHADCQ
>NZ_CP020368.1|WP_001130266.1|2718642_2719218_+|glycerol-3-phosphate-responsive-antiterminator
MPLLHLLRQNPVIAAVKDNASLQLAIDSECQFISVLYGNICTISNIVKKIKNAGKYAFIHVDLLEGASNKEVVIQFLKLVTEADGIISTKASMLKAARAEGFFCIHRLFIVDSISFHNIDKQVAQSNPDCIEILPGCMPKVLGWVTEKIRQPLIAGGLVCDEEDARNAINAGVVALSTTNTGVWTLAKKLL
>NZ_CP020368.1|WP_000109529.1|2718365_2718626_+|ferredoxin-family-protein
MSVARNLWRVADAPHIVPADSVERQTAERLINACPAGLFSLTPEGNLRIDYRSCLECGTCRLLCDESTLQQWRYPPSGFGITYRFG
>NZ_CP020368.1|WP_001301334.1|2717103_2718375_+|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERRITHESLSLLTPDGVTTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGRICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL
>NZ_CP020368.1|WP_001199973.1|2729193_2729865_-|7-carboxy-7-deazaguanine-synthase-QueE
MQYPINEMFQTLQGEGYFTGVPAIFIRLQGCPVGCAWCDTKHTWEKLEDREVSLFSILAKTKESDKWGAASSEDLLAVIGRQGYTARHVVITGGEPCIHDLLPLTDLLEKNGFSCQIETSGTHEVRCTPNTWVTVSPKLNMRGGYEVLSQALERANEIKHPVGRVRDIEALDELLATLTDDKPRVIALQPISQKDDATRLCIETCIARNWRLSMQTHKYLNIA
>NZ_CP020368.1|WP_001288228.1|2730003_2730144_+|hypothetical-protein
MSEENKENGFNHVKTFTKIIFIFSVLVFNDNEYKITDAAVNLFIQI
>NZ_CP020368.1|WP_001268460.1|2730157_2731030_+|YgcG-family-protein
MRYFILMFTFVCSFVAAQPTIVPQLQQQVTDLTSSLNSQEKKELTHKLESIFNNTQVQIAVLIVPTTKDETIEQYATRVFDNWRLGDAKRNDGILIVVAWSDRTVRIQVGYGLEEKVTDALAGDIIRSNMIPAFKQQKLAKGLELAINALNNQLTSQHQYPTNPSESESASSSDHYYFAIFWVFAVMFFPFWFFHQGSNFCRACKSGVCISAIYLLDLFLFSDKIFSIAVFSFFFTFTIFMVFTCLCVLQKRASGRSYHSDNSGSAGGSDSGGFSGGGGSSGGGGASGRW
>NZ_CP020368.1|WP_000036723.1|2731089_2732388_-|phosphopyruvate-hydratase
MSKIVKIIGREIIDSRGNPTVEAEVHLEGGFVGMAAAPSGASTGSREALELRDGDKSRFLGKGVTKAVAAVNGPIAQALIGKDAKDQAGIDKIMIDLDGTENKSKFGANAILAVSLANAKAAAAAKGMPLYEHIAELNGTPGKYSMPVPMMNIINGGEHADNNVDIQEFMIQPVGAKTVKEAIRMGSEVFHHLAKVLKAKGMNTAVGDEGGYAPNLGSNAEALAVIAEAVKAAGYELGKDITLAMDCAASEFYKDGKYVLAGEGNKAFTSEEFTHFLEELTKQYPIVSIEDGLDESDWDGFAYQTKVLGDKIQLVGDDLFVTNTKILKEGIEKGIANSILIKFNQIGSLTETLAAIKMAKDAGYTAVISHRSGETEDATIADLAVGTAAGQIKTGSMSRSDRVAKYNQLIRIEEALGEKAPYNGRKEIKGQA
>NZ_CP020368.1|WP_000210878.1|2732475_2734113_-|CTP-synthase-(glutamine-hydrolyzing)
MTTNYIFVTGGVVSSLGKGIAAASLAAILEARGLNVTIMKLDPYINVDPGTMSPIQHGEVFVTEDGAETDLDLGHYERFIRTKMSRRNNFTTGRIYSDVLRKERRGDYLGATVQVIPHITNAIKERVLEGGEGHDVVLVEIGGTVGDIESLPFLEAIRQMAVEIGREHTLFMHLTLVPYMAASGEVKTKPTQHSVKELLSIGIQPDILICRSDRAVPANERAKIALFCNVPEKAVISLKDVDSIYKIPGLLKSQGLDDYICKRFSLNCPEANLSEWEQVIFEEANPVSEVTIGMVGKYIELPDAYKSVIEALKHGGLKNRVSVNIKLIDSQDVETRGVEILKGLDAILVPGGFGYRGVEGMITTARFARENNIPYLGICLGMQVALIDYARHVANMENANSTEFVPDCKYPVVALITEWRDENGNVEVRSEKSDLGGTMRLGAQQCQLVDDSLVRQLYNAPTIVERHRHRYEVNNMLLKQIEDAGLRVAGRSGDDQLVEIIEVPNHPWFVACQFHPEFTSTPRDGHPLFAGFVKAASEFQKRQAK
>NZ_CP020368.1|WP_001071638.1|2734340_2735132_-|nucleoside-triphosphate-pyrophosphohydrolase
MNQIDRLLTIMQRLRDPENGCPWDKEQTFATIAPYTLEETYEVLDAIAREDFDDLRGELGDLLFQVVFYAQMAQEEGRFDFNDICAAISDKLERRHPHVFADSSAENSSEVLACWEQIKTEERAQKAQHSALDDIPRSLPALMRAQKIQKRCANVGFDWTTLGPVVDKVYEEIDEVMYEARQAVVDQAKLEEEMGDLLFATVNLARHLGTKAEIALQKANEKFERRFREVERIVAARGLEMTGVDLETMEEVWQQVKRQEIDL
>NZ_CP020368.1|WP_000254738.1|2735202_2735538_-|endoribonuclease-MazF
MVSRYVPDMGDLIWVDFDPTKGSEQAGHRPAVVLSPFMYNNKTGMCLCVPCTTQSKGYPFEVVLSGQERDGVALADQVKSIAWRARGATKKGTVAPEELQLIKAKINVLIG
>NZ_CP020368.1|WP_000581937.1|2735537_2735786_-|type-II-toxin-antitoxin-system-antitoxin-MazE
MIHSSVKRWGNSPAVRIPATLMQALNLNIDDEVKIDLVDGKLIIEPVRKEPVFTLAELVNDITPENLHENIDWGEPKDKEVW
>NZ_CP020368.1|WP_000226815.1|2735863_2738098_-|GTP-pyrophosphokinase
MVAVRSAHINKAGEFDPEKWIASLGITSQKSCECLAETWAYCLQQTQGHPDASLLLWRGVEMVEILSTLSMDIDTLRAALLFPLADANVVSEDVLRESVGKSVVNLIHGVRDMAAIRQLKATHTDSVSSEQVDNVRRMLLAMVDDFRCVVIKLAERIAHLREVKDAPEDERVLAAKECTNIYAPLANRLGIGQLKWELEDYCFRYLHPTEYKRIAKLLHERRLDREHYIEEFVGHLRAEMKAEGVKAEVYGRPKHIYSIWRKMQKKNLAFDELFDVRAVRIVAERLQDCYAALGIVHTHYRHLPDEFDDYVANPKPNGYQSIHTVVLGPGGKTVEIQIRTKQMHEDAELGVAAHWKYKEGAAAGGARSGHEDRIAWLRKLIAWQEEMADSGEMLDEVRSQVFDDRVYVFTPKGDVVDLPAGSTPLDFAYHIHSDVGHRCIGAKIGGRIVPFTYQLQMGDQIEIITQKQPNPSRDWLNPNLGYVTTSRGRSKIHAWFRKQDRDKNILAGRQILDDELEHLGISLKEAEKHLLPRYNFNDVDELLAAIGGGDIRLNQMVNFLQSQFNKPSAEEQDAAALKQLQQKSYTPQNRSKDNGRVVVEGVGNLMHHIARCCQPIPGDEIVGFITQGRGISVHRADCEQLAELRSHAPERIVDAVWGESYSAGYSLVVRVVANDRSGLLRDITTILANEKVNVLGVASRSDTKQQLATIDMTIEIYNLQVLGRVLGKLNQVPDVIDARRLHGS
>NZ_CP020368.1|WP_000046810.1|2738145_2739447_-|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD
MAQFYSAKRRTTTRQIITVSVNDLDSFGQGVARHNGKTLFIPGLLPQENAEVTVTEDKKQYARAKVVRRLSDSPERETPRCPHFGVCGGCQQQHASVDLQQRSKSAALARLMKHDVSEVIADVPWGYRRRARLSLNYLPKTQQLQMGFRKAGSSDIVDVKQCPILAPQLEALLPKVRACLGSLQAMRHLGHVELVQATSGTLMILRHTAPLSSADREKLERFSHSEGLDLYLAPDSEILETVSGEMPWYDSNGLRLTFSPRDFIQVNAGVNQKMVARALELLDVQPEDRVLDLFCGMGNFTLPLATQAASVVGVEGVPALVEKGQQNARLNGLQNVTFYHENLEEDVTKQPWAKNGFDKVLLDPARAGAAGVMQQIIKLEPIRIVYVSCNPATLARDSEALLKAGYTIARLAMLDMFPHTGHLESMVLFSRVK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP020368_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP020368_7

4387704-4387853

Orphan

Consensus_repeat	Method
CGCGTCTTATCAGGCCTACGAGTTCGGTGCTGTGTAGGTCGGATAAGGCGTTCA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP020368_7

>merge|NZ_CP020368|7|4387704-4387853|CRISPRCasFinder
CGCGTCTTATCAGGCCTACGAGTTCGGTGCTGTGTAGGTCGGATAAGGCGTTCATGCCGCATCCGACAATAACAGCATTGCCTGATGCGACGCTTGCGCGTCTTATCAGGCCTACGAGTTCAGTGCTGTGTAGGTCGGATAAGGCGTTCA

>NZ_CP020368|7|7|4387704-4387853|CRISPRCasFinder
CGCGTCTTATCAGGCCTACGAGTTCGGTGCTGTGTAGGTCGGATAAGGCGTTCA	TGCCGCATCCGACAATAACAGCATTGCCTGATGCGACGCTTG
CGCGTCTTATCAGGCCTACGAGTTCAGTGCTGTGTAGGTCGGATAAGGCGTTCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP020368.1\|WP_000998695.1\|4396037_4396802_-\|gluconate-5-dehydrogenase	unknown	unknown	gnl\|CDD\|181225
NZ_CP020368.1\|WP_000012907.1\|4380661_4381666_-\|ornithine-carbamoyltransferase	unknown	unknown	gnl\|CDD\|179587
NZ_CP020368.1\|WP_000002953.1\|4381827_4382244_+\|ribonuclease-E-inhibitor-RraB	unknown	unknown	gnl\|CDD\|236876
NZ_CP020368.1\|WP_001319730.1\|4378361_4378814_+\|DUF386-domain-containing-protein	unknown	unknown	gnl\|CDD\|225345
NZ_CP020368.1\|WP_001318460.1\|4398640_4399660_-\|NADPH-dependent-aldehyde-reductase-Ahr	unknown	unknown	gnl\|CDD\|176186
NZ_CP020368.1\|WP_001294573.1\|4392010_4393513_-\|DUF853-domain-containing-protein	unknown	unknown	gnl\|CDD\|283518
NZ_CP020368.1\|WP_000079628.1\|4382985_4384182_+\|DUF898-domain-containing-protein	unknown	unknown	gnl\|CDD\|226719
NZ_CP020368.1\|WP_001197411.1\|4396825_4397857_-\|L-idonate-5-dehydrogenase	unknown	unknown	gnl\|CDD\|182130
NZ_CP020368.1\|WP_001128347.1\|4394655_4395975_-\|gnt-II-system-L-idonate-transporter	unknown	unknown	gnl\|CDD\|129873
NZ_CP020368.1\|WP_001309159.1\|4393590_4394589_-\|DNA-binding-transcriptional-regulator-IdnR	unknown	unknown	gnl\|CDD\|380489
NZ_CP020368.1\|WP_001059397.1\|4382289_4382793_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|366181
NZ_CP020368.1\|WP_000896738.1\|4398073_4398637_+\|gluconokinase	unknown	unknown	gnl\|CDD\|182097
NZ_CP020368.1\|WP_000036440.1\|4378936_4380589_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP020368.1\|WP_000416403.1\|4384237_4387093_-\|valine--tRNA-ligase	unknown	unknown	gnl\|CDD\|235582
NZ_CP020368.1\|WP_000500685.1\|4376839_4377553_-\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|183714
NZ_CP020368.1\|WP_001319729.1\|4377623_4378217_+\|TetR/AcrR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224228
NZ_CP020368.1\|WP_001295681.1\|4390767_4391850_+\|LPS-export-ABC-transporter-permease-LptG	unknown	unknown	gnl\|CDD\|237900
NZ_CP020368.1\|WP_000584114.1\|4389667_4390768_+\|LPS-export-ABC-transporter-permease-LptF	unknown	unknown	gnl\|CDD\|185075
NZ_CP020368.1\|WP_000786393.1\|4387092_4387536_-\|DNA-polymerase-III-subunit-chi	unknown	unknown	gnl\|CDD\|235581
NZ_CP020368.1\|WP_000397144.1\|4387889_4389401_-\|leucyl-aminopeptidase	unknown	unknown	gnl\|CDD\|234863

Protein	Function_ID	Function_description	E-value
NZ_CP020368.1\|WP_000998695.1\|4396037_4396802_-\|gluconate-5-dehydrogenase	gnl\|CDD\|181225	PRK08085, PRK08085, gluconate 5-dehydrogenase; Provisional.	0
NZ_CP020368.1\|WP_000012907.1\|4380661_4381666_-\|ornithine-carbamoyltransferase	gnl\|CDD\|179587	PRK03515, PRK03515, ornithine carbamoyltransferase subunit I; Provisional.	0
NZ_CP020368.1\|WP_000002953.1\|4381827_4382244_+\|ribonuclease-E-inhibitor-RraB	gnl\|CDD\|236876	PRK11191, PRK11191, ribonuclease E inhibitor RraB.	4.50628e-69
NZ_CP020368.1\|WP_001319730.1\|4378361_4378814_+\|DUF386-domain-containing-protein	gnl\|CDD\|225345	COG2731, EbgC, Beta-galactosidase, beta subunit [Carbohydrate transport and metabolism].	4.05799e-70
NZ_CP020368.1\|WP_001318460.1\|4398640_4399660_-\|NADPH-dependent-aldehyde-reductase-Ahr	gnl\|CDD\|176186	cd05283, CAD1, Cinnamyl alcohol dehydrogenases (CAD). Cinnamyl alcohol dehydrogenases (CAD), members of the medium chain dehydrogenase/reductase family, reduce cinnamaldehydes to cinnamyl alcohols in the last step of monolignal metabolism in plant cells walls. CAD binds 2 zinc ions and is NADPH- dependent. CAD family members are also found in non-plant species, e.g. in yeast where they have an aldehyde reductase activity. The medium chain dehydrogenases/reductase (MDR)/zinc-dependent alcohol dehydrogenase-like family, which contains the zinc-dependent alcohol dehydrogenase (ADH-Zn) and related proteins, is a diverse group of proteins related to the first identified member, class I mammalian ADH. MDRs display a broad range of activities and are distinguished from the smaller short chain dehydrogenases (~ 250 amino acids vs. the ~ 350 amino acids of the MDR). The MDR proteins have 2 domains: a C-terminal NAD(P) binding-Rossmann fold domain of a beta-alpha form and an N-terminal catalytic domain with distant homology to GroES. The MDR group contains a host of activities, including the founding alcohol dehydrogenase (ADH), quinone reductase, sorbitol dehydrogenase, formaldehyde dehydrogenase, butanediol DH, ketose reductase, cinnamyl reductase, and numerous others. The zinc-dependent alcohol dehydrogenases (ADHs) catalyze the NAD(P)(H)-dependent interconversion of alcohols to aldehydes or ketones. Active site zinc has a catalytic role, while structural zinc aids in stability. ADH-like proteins typically form dimers (typically higher plants, mammals) or tetramers (yeast, bacteria), and generally have 2 tightly bound zinc atoms per subunit. The active site zinc is coordinated by a histidine, two cysteines, and a water molecule. The second zinc seems to play a structural role, affects subunit interactions, and is typically coordinated by 4 cysteines.	1.21683e-169
NZ_CP020368.1\|WP_001294573.1\|4392010_4393513_-\|DUF853-domain-containing-protein	gnl\|CDD\|283518	pfam05872, DUF853, Bacterial protein of unknown function (DUF853). This family consists of several bacterial proteins of unknown function. BMEI1370 is thought to be an ATPase.	0
NZ_CP020368.1\|WP_000079628.1\|4382985_4384182_+\|DUF898-domain-containing-protein	gnl\|CDD\|226719	COG4269, COG4269, Predicted membrane protein [Function unknown].	4.19169e-151
NZ_CP020368.1\|WP_001197411.1\|4396825_4397857_-\|L-idonate-5-dehydrogenase	gnl\|CDD\|182130	PRK09880, PRK09880, L-idonate 5-dehydrogenase; Provisional.	0
NZ_CP020368.1\|WP_001128347.1\|4394655_4395975_-\|gnt-II-system-L-idonate-transporter	gnl\|CDD\|129873	TIGR00791, Gluconate_permease, gluconate transporter. This family includes known gluconate transporters of E. coli and Bacillus species as well as an idonate transporter from E. coli. [Transport and binding proteins, Carbohydrates, organic alcohols, and acids].	0
NZ_CP020368.1\|WP_001309159.1\|4393590_4394589_-\|DNA-binding-transcriptional-regulator-IdnR	gnl\|CDD\|380489	cd01575, PBP1_GntR, ligand-binding domain of DNA transcription repressor GntR specific for gluconate, a member of the LacI-GalR family of bacterial transcription regulators. This group represents the ligand-binding domain of DNA transcription repressor GntR specific for gluconate, a member of the LacI-GalR family of bacterial transcription regulators. The ligand-binding domain of GntR is structurally homologous to the periplasmic sugar-binding domain of ABC-type transporters and both domains contain the type 1 periplasmic binding protein-like fold. The LacI-GalR family repressors are composed of two functional domains: an N-terminal HTH (helix-turn-helix) domain, which is responsible for the DNA-binding specificity, and a C-terminal ligand-binding domain, which is homologous to the type 1 periplasmic binding proteins. As also observed in the periplasmic binding proteins, the C-terminal domain of the bacterial transcription repressor undergoes a conformational change upon ligand binding, which in turn changes the DNA binding affinity of the repressor.	1.4437e-109
NZ_CP020368.1\|WP_001059397.1\|4382289_4382793_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|366181	pfam00583, Acetyltransf_1, Acetyltransferase (GNAT) family. This family contains proteins with N-acetyltransferase functions such as Elp3-related proteins.	3.52162e-19
NZ_CP020368.1\|WP_000896738.1\|4398073_4398637_+\|gluconokinase	gnl\|CDD\|182097	PRK09825, idnK, gluconokinase.	1.3617e-126
NZ_CP020368.1\|WP_000416403.1\|4384237_4387093_-\|valine--tRNA-ligase	gnl\|CDD\|235582	PRK05729, valS, valyl-tRNA synthetase; Reviewed.	0
NZ_CP020368.1\|WP_000500685.1\|4376839_4377553_-\|SDR-family-oxidoreductase	gnl\|CDD\|183714	PRK12742, PRK12742, SDR family oxidoreductase.	1.79073e-149
NZ_CP020368.1\|WP_001319729.1\|4377623_4378217_+\|TetR/AcrR-family-transcriptional-regulator	gnl\|CDD\|224228	COG1309, AcrR, Transcriptional regulator [Transcription].	7.68552e-10
NZ_CP020368.1\|WP_001295681.1\|4390767_4391850_+\|LPS-export-ABC-transporter-permease-LptG	gnl\|CDD\|237900	PRK15071, PRK15071, lipopolysaccharide ABC transporter permease; Provisional.	0
NZ_CP020368.1\|WP_000584114.1\|4389667_4390768_+\|LPS-export-ABC-transporter-permease-LptF	gnl\|CDD\|185075	PRK15120, PRK15120, lipopolysaccharide ABC transporter permease LptF; Provisional.	0
NZ_CP020368.1\|WP_000786393.1\|4387092_4387536_-\|DNA-polymerase-III-subunit-chi	gnl\|CDD\|235581	PRK05728, PRK05728, DNA polymerase III subunit chi; Validated.	3.51045e-66
NZ_CP020368.1\|WP_000397144.1\|4387889_4389401_-\|leucyl-aminopeptidase	gnl\|CDD\|234863	PRK00913, PRK00913, multifunctional aminopeptidase A; Provisional.	0

>NZ_CP020368.1|WP_000786393.1|4387092_4387536_-|DNA-polymerase-III-subunit-chi
MKNATFYLLDNDTTIDGLSAVEQLVCEIAAERWRSGKRVLIACEDEKQAYRLDEALWARPAESFVPHNLAGEGPRGGAPVEIAWPQKRSSSPRDILISLRTSFADFATAFTEVVDFVPYEDSLKQLARERYKAYRVAGFNLNTATWK
>NZ_CP020368.1|WP_000416403.1|4384237_4387093_-|valine--tRNA-ligase
MEKTYNPQDIEQPLYEHWEKQGYFKPNGDESQESFCIMIPPPNVTGSLHMGHAFQQTIMDTMIRYQRMQGKNTLWQVGTDHAGIATQMVVERKIAAEEGKTRHDYGREAFIDKIWEWKAESGGTITRQMRRLGNSVDWERERFTMDEGLSNAVKEVFVRLYKEDLIYRGKRLVNWDPKLRTAISDLEVENRESKGSMWHIRYPLADGAKTADGKDYLVVATTRPETLLGDTGVAVNPEDPRYKDLIGKYVILPLVNRRIPIVGDEHADMEKGTGCVKITPAHDFNDYEVGKRHALPMINILTFDGDIRESAQVFDTKGNESDVYSSEIPAEFQKLERFAARKAVVAAVDALGLLEEIKPHDLTVPYGDRGGVVIEPMLTDQWYVRADVLAKPAVEAVENGDIQFVPKQYENMYFSWMRDIQDWCISRQLWWGHRIPAWYDEAGNVYVGRNEEEVRKENNLGADVALRQDEDVLDTWFSSALWTFSTLGWPENTDALRQFHPTSVMVSGFDIIFFWIARMIMMTMHFIKDENGKPQVPFHTVYMTGLIRDDEGQKMSKSKGNVIDPLDMVDGISLPELLEKRTGNMMQPQLADKIRKRTEKQFPNGIEPHGTDALRFTLAALASTGRDINWDMKRLEGYRNFCNKLWNASRFVLMNTEGQDCGFNGGEMTLSLADRWILAEFNQTIKAYREALDSFRFDIAAGILYEFTWNQFCDWYLELTKPVMNGGTEAELRGTRHTLVTVLEGLLRLAHPIIPFITETIWQRVKVLCGITADTIMLQPFPQYDASQVDEAALADTEWLKQAIVAVRNIRAEMNIAPGKPLELLLRGCSADAERRVNENRGFLQTLARLESITVLPADDKGPVSVAKIIDGAELLIPMAGLINKEDELARLAKEVAKIEGEISRIENKLANEGFVARAPEAVIAKEREKLEGYAEAKAKLIEQQAVIAAL
>NZ_CP020368.1|WP_000079628.1|4382985_4384182_+|DUF898-domain-containing-protein
MAQVINEMDVPSHSFVFHGTGERYFLICVVNVLLTIITLGIYLPWALMKCKRYLYANMEVNGQRFSYGITGGNVFFSCLVFVFFYFAILMTVSADMPLVGCVLTLSLLVLLIFMAAKGLRYQALMTSLNGVRFSFNCSMKGFWWVTFFLPILMAIGMGTVFFISTKMLHANSSSSVIISVVLMAIVGIVSIGIFNGTLYSLVMSFLWSNTSFGIHRFKVKLDTTYCIKYAILAFLALLPFLAVAGYIIFDQILNAYDSSVYANDDIENLQQFMEMQRKMIIAQLIYYFGIAVSTSYLTVSLRNHFMSNLSLNDGRIRFRSTLTYHGMLYRMCALVVISGITGGLAYPLLKIWMIDWQAKNTYLLGDLDDLPLINKEEQPDKGFLASISRGIMPSLPFL
>NZ_CP020368.1|WP_001059397.1|4382289_4382793_-|GNAT-family-N-acetyltransferase
MNNIAPQSPVMRRLTLQDNPAIARVIRQVSAEYGLTADKGYTVADPNLDELYQVYSQPGHAYWVVEYEGEVVGGGGIAPLAGSESDICELQKMYFLPAIRGKGLAKKLALKAMEEAREMGFKRCYLETTAFLKEAIGLYEHLGFQHIDYALGCTGHVDCEVRMLREL
>NZ_CP020368.1|WP_000002953.1|4381827_4382244_+|ribonuclease-E-inhibitor-RraB
MANPEQLEEQREETRLIIEELLEDGSDPDALYTIEHHLSADDLETLEKAAVEAFKLGYEVTDPEELEVEDGDIVICCDILSECALNADLIDAQVEQLMTLAEKFDVEYDGWGTYFEDPNGEDGDDEDFVDEDDDGVRH
>NZ_CP020368.1|WP_000012907.1|4380661_4381666_-|ornithine-carbamoyltransferase
MSGFYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIALIFEKDSTRTRCSFEVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGRMYDGIQYRGYGQEIVETLAEYAGVPVWNGLTNEFHPTQLLADLLTMQEHLPGKAFNEMTLVYAGDARNNMGNSMLEAAALTGLDLRLVAPQACWPEAALVTECRALAQQNGGNITLTEDVAKGVEGADFIYTDVWVSMGEAKEKWAERIALLRDYQVNSKMMQLTGNPEVKFLHCLPAFHDDQTTLGKKMAEEFGLHGGMEVTDEVFESAASIVFDQAENRMHTIKAVMVATLSK
>NZ_CP020368.1|WP_000036440.1|4378936_4380589_+|hypothetical-protein
MSKISDLNYSQHITLADNFKQKSEVLNTWRVGMNNFARNAEGQDNTRNILDPKTFLEFLVKIFTLGYVDFSKRSNEAGRNMMAHIESSSYIKNNDGSEIMKFVMNNPEGERADLSKVEIEITLSAFTTMGTRQGHTAIIFQQPDGSTNRYEGKSFERKDESSLHLITNKILACYQREANKEIARLLNIPQELNNSQDLNNSQVSCKDSVDSTITDLLEKPLNNALLAIRKEHLLLMPYVCNESISYLLGEKGILKEIDDLNAVNNYLLNNKKATDNEINDIKVNLSHILIDSLDDAKVNLTPVIDSILETFLKSPYINDVRILDWCFNKRMQYFGDSEKIKYACSVINHIDFSRDQSKDFSCDQSKIKIAETLFFNLDKEPYKNSRKLQELIWDKLVAYVNDFNLSNQEKSRLILRLFDDVKLLFDEVPVSILVNDIFLKGFFMKQPDFAKWYFYQLLKKYEGEQLYLNELGYVYGNEEKTNEIVKKHPGYVVEIFEEKMGNELKIRTRMMEILRDGKINICEYINKEQLEKLNPPEDLRIAIKKLGWNN
>NZ_CP020368.1|WP_001319730.1|4378361_4378814_+|DUF386-domain-containing-protein
MIIGNIHNLQPWLPQELRQAIEHIKAHVTAETPKGKHDIEGNRLFYLISEDMTEPYEARRAEYHARYLDIQIVLRGQEGMTFSTQPAGTPDTDWLADKDIAFLPEGVDEKTVILNEGDFVVFYPGEVHKPLCAVGAPARVRKAVVKMLMA
>NZ_CP020368.1|WP_001319729.1|4377623_4378217_+|TetR/AcrR-family-transcriptional-regulator
MVTKKQSRVPGRPRRFAPEQAVSAAKVLFHQKGFDAVSVAEVTDYLGINPPSLYAAFGNKAGLFSRVLNEYVGTEAIPLADILRDDRPVGECLAEVLKEAARRYSQNGGCAGCMVLEGIHSHDPQARDIAVQYYHAAETTIYDYIARRHPQSAQCVTDFMSTVMSGLSAKAREGHSIEQLCATAALAGEAIKTILKE
>NZ_CP020368.1|WP_000500685.1|4376839_4377553_-|SDR-family-oxidoreductase
MGAFTGKTVLILGGSRGIGAAIVRRFVTDGANVRFTYAGSKDAAEHLAQETGATAVFTDSADRDAVIDVVRKSGALDILVVNAGIGVFGDALELNADDIDRLFKINIHAPYHASVEAARQMPEGGRILIIGSVNGDRMPVAGMAAYAASKSALQGMARGLARDFGPRGITINVVQPGPIDTDANPANGPMRDMLHGFMAIKRHGQPEEVAGMVAWLAGPEASFVTGAMHTIDGAFGA
>NZ_CP020368.1|WP_000397144.1|4387889_4389401_-|leucyl-aminopeptidase
MEFSVKSGSPEKQRSACIVVGVFEPRRLSPIAEQLDKISDGYISALLRRGELEGKPGQTLLLHHVPNVLSERILLIGCGKERELDERQYKQVIQKTINTLNDTGSMEAVCFLTELHVKGRNNYWKVRQAVETAKETLYSFDQLKTNKSEPRRPLRKMVFNVPTRRELTSGERAIQHGLAIAAGIKAAKDLGNMPPNICNAAYLASQARQLADSYSKNVITRVIGEQQMKELGMHSYLAVGQGSQNESLMSVIEYKGNASEDARPIVLVGKGLTFDSGGISIKPSEGMDEMKYDMCGAAAVYGVMRMVAELQLPINVIGVLAGCENMPGGRAYRPGDVLTTMSGQTVEVLNTDAEGRLVLCDVLTYVERFEPEAVIDVATLTGACVIALGHHITGLMANHNPLAHELIAASEQSGDRAWRLPLGDEYQEQLESNFADMANIGGRPGGAITAGCFLSRFTRKYNWAHLDIAGTAWRSGKAKGATGRPVALLAQFLLNRAGFNGEE
>NZ_CP020368.1|WP_000584114.1|4389667_4390768_+|LPS-export-ABC-transporter-permease-LptF
MIIIRYLVRETLKSQLAILFILLLIFFCQKLVRILGAAVDGDIPANLVLSLLGLGVPEMAQLILPLSLFLGLLMTLGKLYTESEITVMHACGLSKAVLVKAAMILAVFTAIVAAVNVMWAGPWSSRHQDEVLAEAKANPGMAALAQGQFQQATNGSSVLFIESVDGSDFKDVFLAQIRPKGNARPSVVVADSGHLTQLRDGSQVVTLNQGTRFEGTALLRDFRITDFQDYQAIIGHQAVALDPNDTDQMDMRTLWNTDTDRARAELNWRITLVFTVFMMALMVVPLSVVNPRQGRVLSMLPAMLLYLLFFLIQTSLKSNGGKGKLDPTLWMWTVNLIYLALAIVLNLWDTVPVRRLRASFSRKGAV
>NZ_CP020368.1|WP_001295681.1|4390767_4391850_+|LPS-export-ABC-transporter-permease-LptG
MQPFGVLDRYIGKTIFTTIMMTLFMLVSLSGIIKFVDQLKKAGQGSYDALGAGMYTLLSVPKDVQIFFPMAALLGALLGLGMLAQRSELVVMQASGFTRMQVALSVMKTAIPLVLLTMAIGEWVAPQGEQMARNYRAQAMYGGSLLSTQQGLWAKDGNNFVYIERVKGDEELGGISIYAFNENRRLQSVRYAATAKFDPEHKVWRLSQVDESDLTNPKQITGSQTVSGTWKTNLTPDKLGVVALDPDALSISGLHNYVKYLKSSGQDAGRYQLNMWSKIFQPLSVAVMMLMALSFIFGPLRSVPMGVRVVTGISFGFVFYVLDQIFGPLTLVYGIPPIIGALLPSASFFLISLWLLMRKS
>NZ_CP020368.1|WP_001294573.1|4392010_4393513_-|DUF853-domain-containing-protein
MSEPLLIARTPDTELFLLPGMANRHGLITGATGTGKTVTLQKLAESLSEIGVPVFMADVKGDLTGVAQAGTVSEKLLARLKNIGVNDWQPHANPVVVWDIFGEKGHPVRATVSDLGPLLLARLLNLNDVQSGVLNIIFRIADDQGLLLLDFKDLRAITQYIGDNAKSFQNQYGNISSASVGAIQRGLLSLEQQGAAHFFGEPMLDIKDWMRTDANGKGVINILSAEKLYQMPKLYAASLLWMLSELYEQLPEAGDLEKPKLVFFFDEAHLLFNDAPQVLLDKIEQVIRLIRSKGVGVWFVSQNPSDIPDNVLGQLGNRVQHALRAFTPKDQKAVKAAAQTMRANPAFDTEKAIQELGTGEALISFLDAKGSPSVVERAMVIAPCSRMGPVTEDERNGLINHSPVYGKYEDEVDRESAYEMLQKGFQASTEQQNNPPAKGKEVAVDDGILGGLKDILFGTTGPRGGKKDGVVQTMAKSAARQVTNQIVRGMLGSLLGGRRR
>NZ_CP020368.1|WP_001309159.1|4393590_4394589_-|DNA-binding-transcriptional-regulator-IdnR
MRNHRISLQDIATLAGVTKMTVSRYIRSPKKVAKETGERIAKIMEEINYIPNRAPGMLLNAQSYTLGILIPSFQNQLFADILAGIESVTSEHNYQTLIANYNYDRDSEEESVINLLSYNIDGIILSEKYHTIRTVKFLRSATIPVVELMDVQGERLDMEVGFDNRQAAFDMVCTMLEKRVRHKILYLGSKDDTRDEQRYQGYCDAMMLHNLSPLRMNPRAISSIHLGMQLMRDALSANPDLDGVFCTNDDIAMGALLLCRERNLAVPEQISIAGFHGLEIGRQMIPSLASVITPRFDIGRMAAQMLLSKIKNNDHNHNTVDLGYQIYHGNTL
>NZ_CP020368.1|WP_001128347.1|4394655_4395975_-|gnt-II-system-L-idonate-transporter
MPLIIIAAGVALLLILMIVFKVNGFIALVLVAAVVGFAEGMDAQAVLHSIQNGIGSTLGGLAMILGFGAMLGKLISDTGAAQRIATTLIATFGKKRVQWALVITGLVVGLAMFFEVGFVLLLPLVFTIVASSGLPLLYVGVPMVAALSVTHCFLPPHPGPTAIATIFEANLGTTLLYGFIITIPTVIVAGPLFSKLLTRFEKAPPEGLFNPHLFSEEEMPSFWNSIFAAVIPVILMAIAAVCEITLPKTNTVRLFFEFVGNPAVALFIAIVIAIFTLGRRNGRTIEQIMDIIGDSIGAIAMIVFIIAGGGAFKQVLVDSGVGHYISHLMTGTTLSPLLMCWTVAALLRIALGSATVAAITTAGVVLPIINVTHADPALMVLATGAGSVIASHVNDPGFWLFKGYFNLTVGETLRTWTVMETLISIMGLLGVLAINAVLH
>NZ_CP020368.1|WP_000998695.1|4396037_4396802_-|gluconate-5-dehydrogenase
MNDLFSLAGKNILITGSAQGIGFLLATGLGKYGAQIIINDITAERAELAVEKLHQEGIQAVAAPFNVTHKHEIDAAVEHIEKDIGPIDVLVNNAGIQRRHPFTEFPEQEWNDVIAVNQTAVFLVSQAVTRHMVERKAGKVINICSMQSELGRDTITPYAASKGAVKMLTRGMCVELARHNIQVNGIAPGYFKTEMTKALVEDEAFTAWLCKRTPAARWGDPQELIGAAVFLSSKASDFVNGHLLFVDGGMLVAV
>NZ_CP020368.1|WP_001197411.1|4396825_4397857_-|L-idonate-5-dehydrogenase
MQVKTQSCVVAGKKTVAVTEQTIDWNNNGTLVQITRGGICGSDLHYYQEGKVGNFMIKAPMVLGHEVIGKVIHSDSSELHEGQTVAINPSKPCGHCKYCIEHNENQCTDMRFFGSAMYFPHVDGGFTRYKMVETSQCVPYPAKADEKVMAFAEPLAVAIHAAHQAGELQGKRVFISGVGPIGCLIVSAVKTLGAAEIVCADVSPRSLSLGKEMGADVLVNPQNDDMDHWKAEKGYFDVSFEVSGHPSSVNTCLEVTRARGVMVQVGMGGAMAEFPMMTLIGKEISLRGSFRFTSEFNTAVSWLANGVINPLPLLSAEYPFTDLEEALRFAGDKTQAAKVQLVF
>NZ_CP020368.1|WP_000896738.1|4398073_4398637_+|gluconokinase
MAGESFILMGVSGSGKTLIGSKVAALLSAKFIDGDDLHPAKNIDKMSQGIPLSDEDRLPWLERLNDASYSLYKKNETGFIVCSSLKKQYRDILRKGSPHVHFLWLDGDYETILARMQRRAGHFMPVALLKSQFEALERPQADEQDIVRIDINHDIANVTEQCRQAVLAIRQNRICAKEGSASDQRCE
>NZ_CP020368.1|WP_001318460.1|4398640_4399660_-|NADPH-dependent-aldehyde-reductase-Ahr
MSMIKSYAAKEAGGELEVYEYDPGELRPQDVEVQVDYCGICHSDLSMIDNEWGFSQYPLVAGHEVIGRVVALGSAAQDKGLQVGQRVGIGWTARSCGHCDACISGNQINCEQGAVPTIMNRGGFAEKLRADWQWVIPLPENIDIESAGPLLCGGITVFKPLLMHHITATSRVGVIGIGGLGHIAIKLLHAMGCEVTAFSSNPAKEQEVLAMGADKVVNSRDPQALKALAGQFDLIINTVNVSLDWQPYFEALTYGGNFHTVGAVLTPLSVPAFTLIAGDRSVSGSATGTPYELRKLMRFAARSKVAPTTELFPMSKINDAIQHVRDGKARYRVVLKADY

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053606	Escherichia coli strain NEB_Turbo plasmid F', complete sequence	229362-229416	0	1.0
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053608	Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence	239856-239910	0	1.0
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014271	Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence	230768-230822	0	1.0
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014273	Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence	211738-211792	0	1.0
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053606	Escherichia coli strain NEB_Turbo plasmid F', complete sequence	229160-229214	1	0.982
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053606	Escherichia coli strain NEB_Turbo plasmid F', complete sequence	229261-229315	1	0.982
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053608	Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence	239654-239708	1	0.982
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053608	Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence	239755-239809	1	0.982
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014271	Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence	230566-230620	1	0.982
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014271	Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence	230667-230721	1	0.982
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014273	Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence	211536-211590	1	0.982
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014273	Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence	211637-211691	1	0.982
NZ_CP020368_6	6.5\|2728733\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2728733-2728765	33	NZ_LR134258	Klebsiella aerogenes strain NCTC9644 plasmid 5, complete sequence	3574-3606	4	0.879
NZ_CP020368_6	6.5\|2728733\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2728733-2728765	33	LR134281	Klebsiella aerogenes strain NCTC9793 genome assembly, plasmid: 6	3567-3599	4	0.879
NZ_CP020368_6	6.5\|2728733\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2728733-2728765	33	KY271401	Klebsiella phage 1 LV-2017, complete genome	21043-21075	4	0.879
NZ_CP020368_5	5.5\|2702421\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702421-2702452	32	NC_021229	Arthrobacter nicotinovorans pAO1 megaplasmid sequence, strain ATCC 49919	65474-65505	5	0.844
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053606	Escherichia coli strain NEB_Turbo plasmid F', complete sequence	229463-229517	6	0.891
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP053608	Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence	239957-240011	6	0.891
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014271	Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence	230869-230923	6	0.891
NZ_CP020368_1	1.1\|344535\|55\|NZ_CP020368\|CRISPRCasFinder	344535-344589	55	NZ_CP014273	Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence	211839-211893	6	0.891
NZ_CP020368_5	5.5\|2702421\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702421-2702452	32	NZ_CP017422	Arthrobacter sp. ZXY-2 plasmid pZXY21, complete sequence	208287-208318	6	0.812
NZ_CP020368_5	5.11\|2702789\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702789-2702820	32	KY883647	Vibrio phage JSF33, complete genome	9760-9791	6	0.812
NZ_CP020368_5	5.12\|2702850\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702850-2702881	32	NZ_CP009293	Novosphingobium pentaromativorans US6-1 plasmid pLA4, complete sequence	152196-152227	6	0.812
NZ_CP020368_6	6.5\|2728733\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2728733-2728765	33	KY653119	Morganella phage IME1369_02, complete genome	18216-18248	6	0.818
NZ_CP020368_5	5.1\|2702177\|32\|NZ_CP020368\|CRISPRCasFinder,CRT	2702177-2702208	32	NZ_AP018516	Acetobacter orientalis strain FAN1 plasmid pAOF1, complete sequence	48296-48327	8	0.75
NZ_CP020368_5	5.5\|2702421\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702421-2702452	32	MK113951	Phage 5P_3, complete genome	11967-11998	8	0.75
NZ_CP020368_5	5.5\|2702421\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702421-2702452	32	AP017924	Ralstonia phage RP12 DNA, complete genome	11643-11674	8	0.75
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NC_013856	Azospirillum sp. B510 plasmid pAB510b, complete sequence	375744-375776	8	0.758
NZ_CP020368_5	5.11\|2702789\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702789-2702820	32	MN855762	Bacteriophage sp. isolate 505, complete genome	4840-4871	8	0.75
NZ_CP020368_5	5.11\|2702789\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702789-2702820	32	NC_020548	Azoarcus sp. KH32C plasmid pAZKH, complete sequence	224460-224491	8	0.75
NZ_CP020368_5	5.12\|2702850\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702850-2702881	32	NZ_CP007130	Gemmatirosa kalamazoonesis strain KBS708 plasmid 2, complete sequence	750410-750441	8	0.75
NZ_CP020368_6	6.4\|2728672\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2728672-2728704	33	NZ_CP007129	Gemmatirosa kalamazoonesis strain KBS708 plasmid 1, complete sequence	755172-755204	8	0.758
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_CP010957	Sphingobium sp. YBL2 plasmid 3pYBL2-3, complete sequence	26182-26214	9	0.727
NZ_CP020368_5	5.11\|2702789\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702789-2702820	32	NZ_CP015585	Roseomonas gilardii strain U14-5 plasmid 1, complete sequence	104261-104292	9	0.719
NZ_CP020368_5	5.11\|2702789\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702789-2702820	32	NZ_CP054618	Azospirillum oryzae strain KACC 14407 plasmid unnamed4, complete sequence	142898-142929	9	0.719
NZ_CP020368_5	5.12\|2702850\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702850-2702881	32	MN234174	Mycobacterium phage Efra2, complete genome	35614-35645	9	0.719
NZ_CP020368_5	5.12\|2702850\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702850-2702881	32	MN234165	Mycobacterium phage Yunkel11, complete genome	35570-35601	9	0.719
NZ_CP020368_5	5.12\|2702850\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702850-2702881	32	MN234201	Mycobacterium phage Guanica15, complete genome	35571-35602	9	0.719
NZ_CP020368_2	2.1\|376521\|59\|NZ_CP020368\|CRISPRCasFinder	376521-376579	59	MT230312	Escherichia coli strain DH5alpha plasmid pESBL31, complete sequence	97-155	10	0.831
NZ_CP020368_5	5.5\|2702421\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702421-2702452	32	NC_002580	Propionibacterium freudenreichii plasmid p545, complete sequence	2898-2929	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NZ_CP028970	Aminobacter sp. MSH1 plasmid pUSP2, complete sequence	156123-156154	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NZ_CP053984	Achromobacter pestifer strain FDAARGOS_790 plasmid unnamed, complete sequence	21888-21919	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NC_010935	Comamonas testosteroni CNB-1 plasmid pCNB, complete sequence	28766-28797	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	JX469826	Uncultured bacterium plasmid pB12, complete sequence	11283-11314	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	JN106171	Uncultured bacterium plasmid pAKD26, complete sequence	11289-11320	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NC_016968	Comamonas testosteroni plasmid pTB30, complete sequence	11287-11318	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NC_016978	Comamonas testosteroni plasmid pI2, complete sequence	11272-11303	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NZ_CP017760	Cupriavidus necator strain NH9 plasmid pENH91, complete sequence	67078-67109	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NZ_CP053554	Diaphorobacter sp. JS3050 plasmid pDCNB, complete sequence	4235-4266	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NC_019263	Delftia acidovorans plasmid pLME1, complete sequence	11288-11319	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NC_019264	Delftia acidovorans plasmid pNB8c, complete sequence	11288-11319	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NC_019283	Delftia acidovorans plasmid pC1-1, complete sequence	11288-11319	10	0.688
NZ_CP020368_5	5.6\|2702482\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702482-2702513	32	NC_006830	Achromobacter xylosoxidans A8 plasmid pA81, complete sequence	11350-11381	10	0.688
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	CP046443	Pseudomonas coronafaciens pv. coronafaciens strain B19001 plasmid unnamed2, complete sequence	31933-31965	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_LT963392	Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence	103013-103045	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_LT963392	Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence	110510-110542	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_CP034079	Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-1, complete sequence	48454-48486	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_CP034080	Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-2, complete sequence	39480-39512	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NC_005918	Pseudomonas syringae pv. maculicola strain ES4326 plasmid pPMA4326A, complete sequence	31117-31149	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_CP047262	Pseudomonas syringae pv. maculicola str. ES4326 plasmid pPma4326A, complete sequence	30966-30998	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_CP026560	Pseudomonas amygdali pv. morsprunorum strain R15244 plasmid p3_tig5, complete sequence	19118-19150	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_LT963406	Pseudomonas syringae pv. avii isolate CFBP3846 plasmid PP4, complete sequence	54820-54852	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	LT985193	Pseudomonas syringae strain CFBP 2116 genome assembly, plasmid: PP2	32077-32109	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_LT963393	Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP2, complete sequence	50597-50629	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_LT985210	Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP1, complete sequence	105842-105874	10	0.697
NZ_CP020368_5	5.8\|2702604\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702604-2702636	33	NZ_LT985211	Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP2, complete sequence	84272-84304	10	0.697
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052797	Salmonella enterica subsp. enterica serovar Infantis strain CVM N18S2039 plasmid pN18S2039, complete sequence	45808-45839	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052795	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0125 plasmid pN19S0125, complete sequence	282589-282620	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP047882	Salmonella enterica subsp. enterica serovar Infantis strain 119944 plasmid pESI, complete sequence	94965-94996	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052804	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S973 plasmid pN17S0973, complete sequence	304288-304319	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP038508	Salmonella enterica subsp. enterica serovar Infantis strain FARPER-219 plasmid p-F219, complete sequence	112376-112407	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052802	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S976 plasmid pN17S0976, complete sequence	315682-315713	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052788	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0611 plasmid pN19S0611, complete sequence	203378-203409	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052840	Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S024 plasmid pN16S024, complete sequence	127648-127679	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052786	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0641 plasmid pN19S0641, complete sequence	215302-215333	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052838	Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S097 plasmid pN16S097, complete sequence	214483-214514	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP028316	Salmonella enterica subsp. enterica serovar Typhimurium var. 5- strain CFSAN067217 plasmid pSC-31-2, complete sequence	108893-108924	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP051676	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1234 plasmid pN16S1234, complete sequence	83669-83700	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052783	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0679 plasmid pN19S0679-1, complete sequence	194119-194150	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052836	Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S103 plasmid pN16S103, complete sequence	18410-18441	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP022063	Salmonella enterica strain FDAARGOS_312 plasmid unnamed3, complete sequence	64615-64646	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052781	Salmonella enterica strain CVM N19S0949 plasmid pN19S0949, complete sequence	169480-169511	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052834	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S041 plasmid pN17S0041, complete sequence	6457-6488	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052793	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0388 plasmid pN19S0388, complete sequence	25758-25789	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052779	Salmonella enterica strain 19TN07GT06K-S plasmid pN19S1233, complete sequence	140403-140434	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052832	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1040 plasmid pN17S1040, complete sequence	160727-160758	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP031362	Salmonella enterica subsp. enterica serovar Heidelberg strain 5 plasmid p3, complete sequence	140152-140183	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052830	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1105 plasmid pN17S1105, complete sequence	193709-193740	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052828	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1126 plasmid pN17S1126, complete sequence	126974-127005	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052826	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1245 plasmid pN17S0637, complete sequence	110984-111015	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP016409	Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502916 plasmid pFSIS1502916, complete sequence	94916-94947	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052824	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1265 plasmid pN17S1265, complete sequence	91497-91528	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052822	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1349 plasmid pN17S1349, complete sequence	110984-111015	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP016407	Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502169 plasmid pFSIS1502169, complete sequence	94916-94947	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052820	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1442 plasmid pN17S1442, complete sequence	94916-94947	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP016413	Salmonella enterica subsp. enterica serovar Infantis strain CVM44454 plasmid pCVM44454, complete sequence	94916-94947	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP016411	Salmonella enterica subsp. enterica serovar Infantis strain N55391 plasmid pN55391, complete sequence	94916-94947	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052816	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1598 plasmid pN17S1598	165317-165348	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052814	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S349 plasmid pN17S0349, complete sequence	99109-99140	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP022662	Salmonella enterica subsp. enterica strain RM11065 plasmid pRM11065-2, complete sequence	54379-54410	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052812	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S376 plasmid pN17S0376, complete sequence	1671-1702	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052810	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S535 plasmid pN17S0535, complete sequence	212751-212782	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052808	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S637 plasmid pN17S0637, complete sequence	306376-306407	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052806	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S816 plasmid pN17S0816, complete sequence	164579-164610	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052791	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0552 plasmid pN17S0637, complete sequence	168074-168105	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052818	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1509 plasmid pN17S1509, complete sequence	190524-190555	10	0.688
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	CP052799	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S990 plasmid pN17S0990-1, complete sequence	6457-6488	10	0.688
NZ_CP020368_2	2.1\|376521\|59\|NZ_CP020368\|CRISPRCasFinder	376521-376579	59	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	40375-40433	11	0.814
NZ_CP020368_5	5.10\|2702728\|32\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2702728-2702759	32	NZ_CP026128	Acinetobacter baumannii strain ABNIH28 plasmid pABA-1fe1, complete sequence	49165-49196	11	0.656
NZ_CP020368_6	6.5\|2728733\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2728733-2728765	33	MF158039	Shigella phage Sf12, complete genome	4974-5006	11	0.667
NZ_CP020368_6	6.5\|2728733\|33\|NZ_CP020368\|CRISPRCasFinder,CRT,PILER-CR	2728733-2728765	33	MF158042	Shigella phage Sd1, complete genome	937-969	11	0.667

1. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053606 (Escherichia coli strain NEB_Turbo plasmid F', complete sequence) position: , mismatch: 0, identity: 1.0

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	Protospacer
*******************************************************

2. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053608 (Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence) position: , mismatch: 0, identity: 1.0

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	Protospacer
*******************************************************

3. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014271 (Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence) position: , mismatch: 0, identity: 1.0

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	Protospacer
*******************************************************

4. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014273 (Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence) position: , mismatch: 0, identity: 1.0

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	Protospacer
*******************************************************

5. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053606 (Escherichia coli strain NEB_Turbo plasmid F', complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

6. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053606 (Escherichia coli strain NEB_Turbo plasmid F', complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

7. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053608 (Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

8. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053608 (Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

9. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014271 (Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

10. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014271 (Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

11. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014273 (Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

12. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014273 (Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence) position: , mismatch: 1, identity: 0.982

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta	CRISPR spacer
ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtgaacgcctta	Protospacer
*********************************************.*********

13. spacer 6.5|2728733|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LR134258 (Klebsiella aerogenes strain NCTC9644 plasmid 5, complete sequence) position: , mismatch: 4, identity: 0.879

gaaatgctggtgagcgttaatgccgcaaacaca	CRISPR spacer
gaaatgctggtgagcgttaacgccgcgaacccc	Protospacer
********************.*****.*** *

14. spacer 6.5|2728733|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to LR134281 (Klebsiella aerogenes strain NCTC9793 genome assembly, plasmid: 6) position: , mismatch: 4, identity: 0.879

gaaatgctggtgagcgttaatgccgcaaacaca	CRISPR spacer
gaaatgctggtgagcgttaacgccgcgaacccc	Protospacer
********************.*****.*** *

15. spacer 6.5|2728733|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to KY271401 (Klebsiella phage 1 LV-2017, complete genome) position: , mismatch: 4, identity: 0.879

gaaatgctggtgagcgttaatgccgcaaacaca	CRISPR spacer
gaaatgctggtgagcgttaacgccgcgaacccc	Protospacer
********************.*****.*** *

16. spacer 5.5|2702421|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_021229 (Arthrobacter nicotinovorans pAO1 megaplasmid sequence, strain ATCC 49919) position: , mismatch: 5, identity: 0.844

tgggcggcttgccttgcagccagctccagcag-	CRISPR spacer
tgggcggcttgcgttgcagcctgc-cgagcgga	Protospacer
************ ******** ** * ***.*

17. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053606 (Escherichia coli strain NEB_Turbo plasmid F', complete sequence) position: , mismatch: 6, identity: 0.891

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta--	CRISPR spacer
ttagcgtcgcatcaggcatctgcacacgactgccggatgcg--ataaacgtcttgtc	Protospacer
***********************.*****************  .******.***.

18. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP053608 (Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence) position: , mismatch: 6, identity: 0.891

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta--	CRISPR spacer
ttagcgtcgcatcaggcatctgcacacgactgccggatgcg--ataaacgtcttgtc	Protospacer
***********************.*****************  .******.***.

19. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014271 (Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence) position: , mismatch: 6, identity: 0.891

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta--	CRISPR spacer
ttagcgtcgcatcaggcatctgcacacgactgccggatgcg--ataaacgtcttgtc	Protospacer
***********************.*****************  .******.***.

20. spacer 1.1|344535|55|NZ_CP020368|CRISPRCasFinder matches to NZ_CP014273 (Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence) position: , mismatch: 6, identity: 0.891

ttagcgtcgcatcaggcatctgcgcacgactgccggatgcggcgtaaacgcctta--	CRISPR spacer
ttagcgtcgcatcaggcatctgcacacgactgccggatgcg--ataaacgtcttgtc	Protospacer
***********************.*****************  .******.***.

21. spacer 5.5|2702421|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP017422 (Arthrobacter sp. ZXY-2 plasmid pZXY21, complete sequence) position: , mismatch: 6, identity: 0.812

tgggcggcttgccttgcagccagctccagcag-	CRISPR spacer
ggggcggcttgcgttgcagcctgc-cgagcgga	Protospacer
 *********** ******** ** * ***.*

22. spacer 5.11|2702789|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to KY883647 (Vibrio phage JSF33, complete genome) position: , mismatch: 6, identity: 0.812

agcgtgttcggcatcacctttggcttcggctg	CRISPR spacer
agcagtttcggcatcagctttggctttggctt	Protospacer
***.  ********** *********.****

23. spacer 5.12|2702850|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP009293 (Novosphingobium pentaromativorans US6-1 plasmid pLA4, complete sequence) position: , mismatch: 6, identity: 0.812

tgcgtgagcgtatcgccgcgcgtctgcgaaag	CRISPR spacer
agaatgagcgtgtcgccgcgcgtctgcgtgag	Protospacer
 * .*******.**************** .**

24. spacer 6.5|2728733|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to KY653119 (Morganella phage IME1369_02, complete genome) position: , mismatch: 6, identity: 0.818

gaaatgctggtgagcgttaatgccgcaaacaca	CRISPR spacer
gaaatgctggtcagcgttaacgccgcacaacct	Protospacer
*********** ********.****** *  *

25. spacer 5.1|2702177|32|NZ_CP020368|CRISPRCasFinder,CRT matches to NZ_AP018516 (Acetobacter orientalis strain FAN1 plasmid pAOF1, complete sequence) position: , mismatch: 8, identity: 0.75

cagcgtcaggcgtgaaatctcaccgtcgttgc	CRISPR spacer
attctttaggcgtgacatcttaccgtcgttga	Protospacer
   * *.******** ****.**********

26. spacer 5.5|2702421|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to MK113951 (Phage 5P_3, complete genome) position: , mismatch: 8, identity: 0.75

tgggcggcttgccttgcagccagctccagcag	CRISPR spacer
ggggcagcttgccttgcagccagccgatgctc	Protospacer
 ****.******************.   **

27. spacer 5.5|2702421|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to AP017924 (Ralstonia phage RP12 DNA, complete genome) position: , mismatch: 8, identity: 0.75

tgggcggcttgccttgcagccagctccagcag	CRISPR spacer
tgggccgcttgccgtgcagccagcgcttccgc	Protospacer
***** ******* ********** *.  *.

28. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_013856 (Azospirillum sp. B510 plasmid pAB510b, complete sequence) position: , mismatch: 8, identity: 0.758

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
cgcgtcggcgacgcgcaggtaatgcgcgatcag	Protospacer
   * **************  *********. *

29. spacer 5.11|2702789|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to MN855762 (Bacteriophage sp. isolate 505, complete genome) position: , mismatch: 8, identity: 0.75

agcgtgttcggcatcacctttggcttcggctg	CRISPR spacer
gaccagctcgaaatcacctttggcttcggctt	Protospacer
..*  *.***. *******************

30. spacer 5.11|2702789|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_020548 (Azoarcus sp. KH32C plasmid pAZKH, complete sequence) position: , mismatch: 8, identity: 0.75

agcgtgtt---cggcatcacctttggcttcggctg	CRISPR spacer
---ctgctcgccggcatcaccttcggcttctgcta	Protospacer
    **.*   ************.****** ***.

31. spacer 5.12|2702850|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP007130 (Gemmatirosa kalamazoonesis strain KBS708 plasmid 2, complete sequence) position: , mismatch: 8, identity: 0.75

tgcgtgagcgtatcgccgcgcgtctgcgaaag-	CRISPR spacer
agcgagagcgtatcgccgcgc-ttcgtgaagcc	Protospacer
 *** **************** *..*.***.

32. spacer 6.4|2728672|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP007129 (Gemmatirosa kalamazoonesis strain KBS708 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.758

tggctctgcaacagcagcacccatgaccacgtc	CRISPR spacer
cgctccagcaacagcagcacccacgaccacgga	Protospacer
.* ..* ****************.*******

33. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP010957 (Sphingobium sp. YBL2 plasmid 3pYBL2-3, complete sequence) position: , mismatch: 9, identity: 0.727

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
cgaggcggcgacacgcaaggtatgcgggtcgag	Protospacer
  **********.****.******** * .  *

34. spacer 5.11|2702789|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP015585 (Roseomonas gilardii strain U14-5 plasmid 1, complete sequence) position: , mismatch: 9, identity: 0.719

agcgtgttcggcatcacctttggcttcggctg	CRISPR spacer
atccgcacgggcatcacctttggctccagctg	Protospacer
* *    . ****************.*.****

35. spacer 5.11|2702789|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP054618 (Azospirillum oryzae strain KACC 14407 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.719

agcgtgttcggcatcacctttggcttcggctg	CRISPR spacer
ctcggcctcggcaacacctttgccttcggcgc	Protospacer
  **  .****** ******** *******

36. spacer 5.12|2702850|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to MN234174 (Mycobacterium phage Efra2, complete genome) position: , mismatch: 9, identity: 0.719

tgcgtgagcgtatcgccgcgcgtctgcgaaag	CRISPR spacer
gccgtgagcgtgacgccgcgcgtctggtgatc	Protospacer
  *********. *************  .*

37. spacer 5.12|2702850|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to MN234165 (Mycobacterium phage Yunkel11, complete genome) position: , mismatch: 9, identity: 0.719

tgcgtgagcgtatcgccgcgcgtctgcgaaag	CRISPR spacer
gccgtgagcgtgacgccgcgcgtctggtgatc	Protospacer
  *********. *************  .*

38. spacer 5.12|2702850|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to MN234201 (Mycobacterium phage Guanica15, complete genome) position: , mismatch: 9, identity: 0.719

tgcgtgagcgtatcgccgcgcgtctgcgaaag	CRISPR spacer
gccgtgagcgtgacgccgcgcgtctggtgatc	Protospacer
  *********. *************  .*

39. spacer 2.1|376521|59|NZ_CP020368|CRISPRCasFinder matches to MT230312 (Escherichia coli strain DH5alpha plasmid pESBL31, complete sequence) position: , mismatch: 10, identity: 0.831

ggtgccagaaccgtaggccggataaggcgttcacgccgcatccggcaataagtgctccg-	CRISPR spacer
gagcacagaaccgtaggacggataaggcgttcacgccgcatccggcgat-cgtgcactga	Protospacer
*.   ************ ****************************.**  **** *.*

40. spacer 5.5|2702421|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_002580 (Propionibacterium freudenreichii plasmid p545, complete sequence) position: , mismatch: 10, identity: 0.688

tgggcggcttgccttgcagccagctccagcag	CRISPR spacer
ccagcggcttgcgtggcagccagctctcaggg	Protospacer
. .********* * ***********. . .*

41. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP028970 (Aminobacter sp. MSH1 plasmid pUSP2, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
gcgtgtgctggcaatcgcttccggggtgacgt	Protospacer
. *.  ********** ***.********  .

42. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP053984 (Achromobacter pestifer strain FDAARGOS_790 plasmid unnamed, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

43. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_010935 (Comamonas testosteroni CNB-1 plasmid pCNB, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

44. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to JX469826 (Uncultured bacterium plasmid pB12, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

45. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to JN106171 (Uncultured bacterium plasmid pAKD26, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

46. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_016968 (Comamonas testosteroni plasmid pTB30, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

47. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_016978 (Comamonas testosteroni plasmid pI2, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

48. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP017760 (Cupriavidus necator strain NH9 plasmid pENH91, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

49. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP053554 (Diaphorobacter sp. JS3050 plasmid pDCNB, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

50. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_019263 (Delftia acidovorans plasmid pLME1, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

51. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_019264 (Delftia acidovorans plasmid pNB8c, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

52. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_019283 (Delftia acidovorans plasmid pC1-1, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

53. spacer 5.6|2702482|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_006830 (Achromobacter xylosoxidans A8 plasmid pA81, complete sequence) position: , mismatch: 10, identity: 0.688

aagctggctggcaatctctttcggggtgagtc	CRISPR spacer
aagctggctggcattctcattcgtcagtacct	Protospacer
************* **** ****  .  * ..

54. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP046443 (Pseudomonas coronafaciens pv. coronafaciens strain B19001 plasmid unnamed2, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

55. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LT963392 (Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

56. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LT963392 (Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

57. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP034079 (Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-1, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

58. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP034080 (Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-2, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

59. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NC_005918 (Pseudomonas syringae pv. maculicola strain ES4326 plasmid pPMA4326A, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

60. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP047262 (Pseudomonas syringae pv. maculicola str. ES4326 plasmid pPma4326A, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

61. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP026560 (Pseudomonas amygdali pv. morsprunorum strain R15244 plasmid p3_tig5, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

62. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LT963406 (Pseudomonas syringae pv. avii isolate CFBP3846 plasmid PP4, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

63. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to LT985193 (Pseudomonas syringae strain CFBP 2116 genome assembly, plasmid: PP2) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

64. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LT963393 (Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP2, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

65. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LT985210 (Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP1, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

66. spacer 5.8|2702604|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LT985211 (Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP2, complete sequence) position: , mismatch: 10, identity: 0.697

gcaggcggcgacgcgcagggtatgcgcgattcg	CRISPR spacer
accggcggcgacgcgcaggagatgcgcagcgaa	Protospacer
.* ****************. ******...  .

67. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052797 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N18S2039 plasmid pN18S2039, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

68. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052795 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0125 plasmid pN19S0125, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

69. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP047882 (Salmonella enterica subsp. enterica serovar Infantis strain 119944 plasmid pESI, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

70. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052804 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S973 plasmid pN17S0973, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

71. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP038508 (Salmonella enterica subsp. enterica serovar Infantis strain FARPER-219 plasmid p-F219, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

72. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052802 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S976 plasmid pN17S0976, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

73. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052788 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0611 plasmid pN19S0611, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

74. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052840 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S024 plasmid pN16S024, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

75. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052786 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0641 plasmid pN19S0641, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

76. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052838 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S097 plasmid pN16S097, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

77. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP028316 (Salmonella enterica subsp. enterica serovar Typhimurium var. 5- strain CFSAN067217 plasmid pSC-31-2, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

78. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP051676 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1234 plasmid pN16S1234, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

79. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052783 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0679 plasmid pN19S0679-1, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

80. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052836 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S103 plasmid pN16S103, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

81. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022063 (Salmonella enterica strain FDAARGOS_312 plasmid unnamed3, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

82. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052781 (Salmonella enterica strain CVM N19S0949 plasmid pN19S0949, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

83. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052834 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S041 plasmid pN17S0041, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

84. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052793 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0388 plasmid pN19S0388, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

85. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052779 (Salmonella enterica strain 19TN07GT06K-S plasmid pN19S1233, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

86. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052832 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1040 plasmid pN17S1040, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

87. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP031362 (Salmonella enterica subsp. enterica serovar Heidelberg strain 5 plasmid p3, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

88. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052830 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1105 plasmid pN17S1105, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

89. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052828 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1126 plasmid pN17S1126, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

90. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052826 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1245 plasmid pN17S0637, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

91. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016409 (Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502916 plasmid pFSIS1502916, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

92. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052824 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1265 plasmid pN17S1265, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

93. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052822 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1349 plasmid pN17S1349, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

94. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016407 (Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502169 plasmid pFSIS1502169, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

95. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052820 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1442 plasmid pN17S1442, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

96. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016413 (Salmonella enterica subsp. enterica serovar Infantis strain CVM44454 plasmid pCVM44454, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

97. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016411 (Salmonella enterica subsp. enterica serovar Infantis strain N55391 plasmid pN55391, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

98. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052816 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1598 plasmid pN17S1598) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

99. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052814 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S349 plasmid pN17S0349, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

100. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022662 (Salmonella enterica subsp. enterica strain RM11065 plasmid pRM11065-2, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

101. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052812 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S376 plasmid pN17S0376, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

102. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052810 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S535 plasmid pN17S0535, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

103. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052808 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S637 plasmid pN17S0637, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

104. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052806 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S816 plasmid pN17S0816, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

105. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052791 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0552 plasmid pN17S0637, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

106. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052818 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1509 plasmid pN17S1509, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

107. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to CP052799 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S990 plasmid pN17S0990-1, complete sequence) position: , mismatch: 10, identity: 0.688

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gaggcgctatcaaacacaaccgacagggagta	Protospacer
  ..*..****** .***************.

108. spacer 2.1|376521|59|NZ_CP020368|CRISPRCasFinder matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 11, identity: 0.814

-ggtgccagaaccgtaggccggataaggcgttcacgccgcatccggcaataagtgctccg	CRISPR spacer
tcgcacca-aaccgtaggccggataaggcgtttacgccgcatccggcaaaaagccgtacc	Protospacer
  *..*** ***********************.**************** ***.  * *

109. spacer 5.10|2702728|32|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP026128 (Acinetobacter baumannii strain ABNIH28 plasmid pABA-1fe1, complete sequence) position: , mismatch: 11, identity: 0.656

tcaacattatcaattacaaccgacagggagcc	CRISPR spacer
gatacattgccaattacaaccgacagttcaaa	Protospacer
   *****..****************   .

110. spacer 6.5|2728733|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to MF158039 (Shigella phage Sf12, complete genome) position: , mismatch: 11, identity: 0.667

gaaatgctggtgagcgttaatgccgcaaacaca	CRISPR spacer
cggcacttggggagcgttaatgctgcaaacaat	Protospacer
 ..   .*** ************.*******

111. spacer 6.5|2728733|33|NZ_CP020368|CRISPRCasFinder,CRT,PILER-CR matches to MF158042 (Shigella phage Sd1, complete genome) position: , mismatch: 11, identity: 0.667

gaaatgctggtgagcgttaatgccgcaaacaca	CRISPR spacer
cggcacttggagagcgttaatgctgcaaacaat	Protospacer
 ..   .*** ************.*******

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

533907 : 550491

Enterobacteria_phage(66.67%)

integrase,lysis

attL 532675:532688|attR 539992:540005

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
532675:532688	attL	NA	NA	NA	NA
WP_001318654.1\|533907_535071_-\|integrase	site-specific integrase	A0A088CD23	Shigella_phage	1.3e-198	86.0
WP_000446905.1\|534926_535298_-	helix-turn-helix domain-containing protein	M1FJ59	Enterobacteria_phage	2.1e-46	81.0
WP_000488419.1\|535269_535548_-	DUF4222 domain-containing protein	M1FPC8	Enterobacteria_phage	1.7e-48	98.9
WP_000763373.1\|535595_535814_-	TraR/DksA family transcriptional regulator	M1FQT7	Enterobacteria_phage	1.8e-34	95.8
WP_001386642.1\|535912_536194_-	cell division protein ZapA	A0A0P0ZE02	Stx2-converting_phage	5.5e-47	98.9
WP_129486119.1\|536568_536655_+	hypothetical protein	NA	NA	NA	NA
WP_001070454.1\|536909_537242_+	SMR family multidrug efflux protein EmrE	NA	NA	NA	NA
WP_001299444.1\|537289_537439_+	hypothetical protein	NA	NA	NA	NA
WP_000709082.1\|537496_539023_+	recombinase family protein	Q3HQV4	Burkholderia_phage	7.9e-31	27.8
WP_001306955.1\|539487_540039_+	Raf kinase inhibitor-like protein YbcL	NA	NA	NA	NA
539992:540005	attR	NA	NA	NA	NA
WP_000881075.1\|540048_540846_+	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_001303586.1\|540962_541064_+	hypothetical protein	NA	NA	NA	NA
WP_001054340.1\|541060_541516_+	DNA base-flipping protein YbcN	I6PD71	Cronobacter_phage	4.1e-60	66.9
WP_000224907.1\|541515_541686_+	hypothetical protein	K7P7K0	Enterobacteria_phage	5.3e-13	67.9
WP_000774479.1\|541678_541969_+	DUF1364 domain-containing protein	K7PGZ6	Enterobacteria_phage	2.3e-48	95.8
WP_001099655.1\|541965_542328_+	RusA family crossover junction endodeoxyribonuclease	K7PM48	Enterobacteria_phage	7.3e-60	97.4
WP_000971071.1\|542324_542465_+	YlcG family protein	K7PHH3	Enterobacteria_phage	2.5e-08	69.8
WP_001204780.1\|542550_542934_+	antitermination protein QuuD	A0A088CD47	Shigella_phage	4.0e-56	84.2
WP_000839596.1\|545571_545787_+\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	9.0e-34	100.0
WP_001135280.1\|545786_546284_+	lysozyme	M1FJA0	Enterobacteria_phage	1.1e-90	97.6
WP_001228695.1\|546500_546683_+\|lysis	prophage lysis lipoprotein RzoD	K7PHU6	Enterobacteria_phage	2.9e-17	98.3
WP_000738423.1\|546773_547067_-	increased serum survival lipoprotein Iss	K7PL54	Enterobacteria_phage	2.0e-44	91.8
WP_001415975.1\|547427_547622_-	YlcI/YnfO family protein	A0A0K2FIR8	Escherichia_phage	4.3e-27	96.9
WP_072094231.1\|548682_550491_+	host specificity protein J	Q9EYE7	Enterobacteria_phage	7.6e-307	88.4

DBSCAN-SWA_2

748735 : 770243

Enterobacteria_phage(90.0%)

capsid,protease,head

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000805902.1\|748735_749818_+	LacI family DNA-binding transcriptional regulator	C6ZCU4	Enterobacteria_phage	7.5e-193	100.0
WP_001092355.1\|750420_753072_+	hypothetical protein	C1KTT1	Enterobacteria_phage	0.0e+00	100.0
WP_002414258.1\|753980_754199_-	excisionase	C6ZCU6	Enterobacteria_phage	1.3e-35	100.0
WP_000545733.1\|754238_754406_-	hypothetical protein	A0A0K2FJ46	Enterobacteria_phage	1.3e-27	100.0
WP_000026224.1\|754494_754776_-	hypothetical protein	A0A0K2FIU9	Enterobacteria_phage	2.8e-51	100.0
WP_001289873.1\|754967_755516_-	ead/Ea22-like family protein	A0A0K2FJF6	Enterobacteria_phage	2.2e-100	100.0
WP_000763367.1\|755512_755734_-	TraR/DksA family transcriptional regulator	A0A0K2FI84	Escherichia_phage	2.9e-35	100.0
WP_000548551.1\|756125_756317_-	DUF1382 family protein	A0A0K2FJ42	Enterobacteria_phage	2.8e-26	100.0
WP_000149542.1\|756289_756472_-	DUF1317 domain-containing protein	A0A1U8QQC1	Enterobacteria_phage	1.6e-28	100.0
WP_000186891.1\|756468_757149_-	YqaJ viral recombinase family protein	C6ZCV3	Enterobacteria_phage	3.5e-132	100.0
WP_000100844.1\|757145_757931_-	phage recombination protein Bet	A0A0K2FJF1	Enterobacteria_phage	1.4e-148	100.0
WP_000995451.1\|757936_758233_-	host-nuclease inhibitor protein Gam	C6ZCV5	Enterobacteria_phage	2.1e-49	100.0
WP_000372937.1\|758307_758451_-	host cell division inhibitory peptide Kil	A0A0N7C2U2	Escherichia_phage	1.2e-18	100.0
WP_001198861.1\|758419_758584_-\|protease	protease FtsH-inhibitory lysogeny factor CIII	Q776Q5	Enterobacteria_phage	1.1e-26	100.0
WP_000065374.1\|758656_759025_-	DUF2528 family protein	M1FPD2	Enterobacteria_phage	2.0e-65	100.0
WP_000213975.1\|759207_759408_-	Restriction inhibitor protein ral	A0A0K2FJE6	Enterobacteria_phage	1.4e-33	100.0
WP_000256575.1\|759486_759786_-	hypothetical protein	C6ZCW1	Enterobacteria_phage	3.8e-46	100.0
WP_001095982.1\|760100_760751_-	LexA family transcriptional regulator	K7PM82	Enterobacteria_phage	4.9e-123	100.0
WP_000276885.1\|760831_761017_+	hypothetical protein	K7PHK4	Enterobacteria_phage	1.2e-26	100.0
WP_084454367.1\|761054_761495_+	prophage endopeptidase RzpD	A0A0K2FJD0	Enterobacteria_phage	4.1e-73	99.3
WP_000738491.1\|761526_761820_-	serum resistance lipoprotein Bor	C6ZCX3	Enterobacteria_phage	4.0e-48	100.0
WP_012775990.1\|762109_762520_-	DUF1398 domain-containing protein	C6ZCX4	Enterobacteria_phage	2.5e-72	100.0
WP_001031427.1\|762805_763012_+	hypothetical protein	A0A0K2FJ18	Enterobacteria_phage	5.8e-30	100.0
WP_001421937.1\|763176_763371_-	YlcI/YnfO family protein	A0A0K2FIR8	Escherichia_phage	8.7e-28	100.0
WP_000453580.1\|763759_764305_+	DNA-packaging protein	A0A0K2FIG2	Enterobacteria_phage	2.8e-95	100.0
WP_000123343.1\|766198_767518_+	S49 family peptidase	A0A0K2FI53	Enterobacteria_phage	7.9e-237	100.0
WP_001297109.1\|767527_767860_+\|head	head decoration protein	C6ZCY1	Enterobacteria_phage	2.2e-55	100.0
WP_000063280.1\|767915_768941_+\|capsid	major capsid protein	C6ZCY2	Enterobacteria_phage	7.1e-193	100.0
WP_084454370.1\|768982_769561_+	hypothetical protein	C6ZCZ5	Enterobacteria_phage	3.2e-57	100.0
WP_001246632.1\|769622_770243_+	outer membrane beta-barrel protein Lom	A0A1U8QHD6	Enterobacteria_phage	8.3e-112	100.0

DBSCAN-SWA_3

854681 : 927994

Salmonella_phage(36.84%)

capsid,integrase,terminase,plate,portal,tail,tRNA,protease,lysis

attL 851580:851595|attR 935017:935032

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
851580:851595	attL	NA	NA	NA	NA
WP_000290930.1\|854681_855698_-\|integrase	tyrosine-type recombinase/integrase	A0A218M4I3	Erwinia_phage	3.2e-105	56.7
WP_001321204.1\|855884_856076_-	hypothetical protein	A0A0R6PIH8	Moraxella_phage	4.0e-09	68.2
WP_001047321.1\|856091_856661_-	phage repressor protein CI	A0A1S6KZZ7	Salmonella_phage	3.8e-39	43.4
WP_001247707.1\|856786_857008_+	hypothetical protein	NA	NA	NA	NA
WP_000460887.1\|857040_858486_+	hypothetical protein	E5G6L9	Salmonella_phage	4.5e-209	97.0
WP_001154431.1\|858638_858827_+	hypothetical protein	E5G6M0	Salmonella_phage	1.6e-26	96.8
WP_001217575.1\|858837_859071_+	DinI family protein	E5G6M1	Salmonella_phage	4.7e-36	100.0
WP_001059831.1\|859263_859599_-	hypothetical protein	NA	NA	NA	NA
WP_001034589.1\|860071_860995_+	hypothetical protein	NA	NA	NA	NA
WP_001320043.1\|861157_862120_+	RNA-directed DNA polymerase	NA	NA	NA	NA
WP_000520360.1\|862137_863163_-\|portal	phage portal protein	A0A1S6KZW5	Salmonella_phage	7.6e-171	86.7
WP_001098413.1\|863162_864929_-\|terminase	terminase ATPase subunit family protein	A0A1S6KZW3	Salmonella_phage	0.0e+00	99.1
WP_000216259.1\|865071_865824_+\|capsid	GPO family capsid scaffolding protein	A0A1S6KZW9	Salmonella_phage	3.1e-113	94.7
WP_000196203.1\|865960_866389_+\|lysis	LysB family phage lysis regulatory protein	E5G6N2	Salmonella_phage	8.1e-58	88.7
WP_001039932.1\|866484_866916_+\|tail	phage tail protein	E5G6N3	Salmonella_phage	3.8e-71	93.0
WP_000829156.1\|866908_867355_+	phage virion morphogenesis protein	A0A1S6L001	Salmonella_phage	7.6e-59	83.7
WP_000115390.1\|867296_868103_-	hypothetical protein	NA	NA	NA	NA
WP_000993743.1\|868206_868785_+\|plate	phage baseplate assembly protein V	A0A1S6KZX7	Salmonella_phage	3.6e-93	85.9
WP_000177591.1\|868781_869141_+\|plate	baseplate assembly protein	A0A1S6KZZ4	Salmonella_phage	8.0e-51	85.7
WP_000268294.1\|869127_870036_+\|plate	baseplate assembly protein	A0A1S6KZY6	Salmonella_phage	4.1e-144	91.1
WP_001086815.1\|870028_870634_+\|tail	phage tail protein I	A0A1S6L000	Salmonella_phage	2.3e-111	93.0
WP_000104800.1\|870630_872253_+	hypothetical protein	M1TAS6	Escherichia_phage	6.2e-151	78.5
WP_000280166.1\|872254_872692_+\|tail	tail assembly chaperone	A0A0F7LDZ0	Escherichia_phage	1.7e-55	75.0
WP_000368077.1\|872663_873266_-\|tail	tail fiber assembly protein	M1SV83	Escherichia_phage	2.3e-98	89.5
WP_001318481.1\|873265_873805_-\|tail	tail fiber protein	A0A0F7LCR3	Escherichia_phage	1.5e-56	62.5
WP_000972391.1\|874566_874785_+	transcriptional activator Ogr/delta	Q53ZE7	Salmonella_virus	7.5e-20	69.0
WP_001024876.1\|875020_876706_-	transporter	NA	NA	NA	NA
WP_000681108.1\|876975_877353_+	hypothetical protein	NA	NA	NA	NA
WP_001195240.1\|877382_877640_-	GrxA family glutaredoxin	A0A2I7SAE2	Vibrio_phage	8.6e-23	61.9
WP_001201560.1\|877799_878087_+	DUF1418 family protein	NA	NA	NA	NA
WP_000189159.1\|878070_878793_+	nitroreductase NfsA	NA	NA	NA	NA
WP_000684321.1\|878853_879756_+	30S ribosomal protein S6--L-glutamate ligase	I3ULC9	Synechococcus_phage	2.6e-37	34.4
WP_000203025.1\|879843_880320_+	YbjN domain-containing protein	NA	NA	NA	NA
WP_000126069.1\|880670_881783_+	spermidine/putrescine ABC transporter substrate-binding protein PotF	NA	NA	NA	NA
WP_000996005.1\|881877_883011_+	putrescine ABC transporter ATP-binding subunit PotG	G3M9Y6	Bacillus_virus	1.4e-29	34.0
WP_000105444.1\|883020_883974_+	putrescine ABC transporter permease PotH	NA	NA	NA	NA
WP_001061667.1\|883970_884816_+	putrescine ABC transporter permease PotI	NA	NA	NA	NA
WP_000389260.1\|884875_885364_+	YbjO family protein	NA	NA	NA	NA
WP_001149743.1\|885404_886532_+	23S rRNA (uracil(747)-C(5))-methyltransferase RlmC	A0A1X9I6F4	Streptococcus_phage	6.0e-28	27.0
WP_001295905.1\|886730_887462_-	arginine ABC transporter substrate-binding protein	NA	NA	NA	NA
WP_000464491.1\|887752_888421_-	arginine ABC transporter permease ArtM	NA	NA	NA	NA
WP_001001691.1\|888420_889137_-	arginine ABC transporter permease ArtQ	NA	NA	NA	NA
WP_000756569.1\|889143_889875_-	arginine ABC transporter substrate-binding protein	NA	NA	NA	NA
WP_000027205.1\|889892_890621_-	arginine ABC transporter ATP-binding protein ArtP	G9BWD6	Planktothrix_phage	6.0e-29	36.7
WP_001270734.1\|890838_891354_-	lipoprotein	NA	NA	NA	NA
WP_001160737.1\|891479_891803_+	heavy metal-binding domain-containing protein	NA	NA	NA	NA
WP_001255168.1\|891799_892630_+	N-acetylmuramoyl-L-alanine amidase	A0A1B0UZW5	Roseobacter_phage	5.7e-07	30.0
WP_001338420.1\|892626_893640_-	NAD(P)-dependent oxidoreductase	NA	NA	NA	NA
WP_001136577.1\|893738_895169_-	SDR family oxidoreductase	NA	NA	NA	NA
WP_000566356.1\|895179_896181_-	low-specificity L-threonine aldolase	NA	NA	NA	NA
WP_000815335.1\|896217_897936_-	ubiquinone-dependent pyruvate dehydrogenase	A0A0P0YLY7	Yellowstone_lake_phycodnavirus	2.3e-31	24.0
WP_000178677.1\|898068_899037_-	NADH oxidoreductase	NA	NA	NA	NA
WP_000458809.1\|899048_900701_-	hydroxylamine reductase	NA	NA	NA	NA
WP_000491142.1\|900844_901744_-	L-lysine exporter LysO	NA	NA	NA	NA
WP_001298299.1\|902238_902934_-	aquaporin Z	NA	NA	NA	NA
WP_000599802.1\|903358_905017_+	ATP-dependent endonuclease	NA	NA	NA	NA
WP_001355621.1\|905013_905970_-	DUF535 domain-containing protein	NA	NA	NA	NA
WP_000746443.1\|906120_907236_+	macrolide transporter subunit MacA	NA	NA	NA	NA
WP_000188180.1\|907232_909179_+	macrolide ABC transporter ATP-binding protein/permease MacB	G9BWD6	Planktothrix_phage	1.1e-37	40.1
WP_000410785.1\|909251_909476_-	cold shock-like protein CspD	A0A2H4N7Y6	Lake_Baikal_phage	2.3e-16	61.2
WP_000520781.1\|909798_910119_+\|protease	ATP-dependent Clp protease adapter ClpS	A0A1B1IT64	uncultured_Mediterranean_phage	1.6e-13	44.4
WP_000934045.1\|910149_912426_+\|protease	ATP-dependent Clp protease ATP-binding subunit ClpA	A0A223W0B1	Agrobacterium_phage	2.5e-166	42.5
WP_001040187.1\|913463_913682_-	translation initiation factor IF-1	NA	NA	NA	NA
WP_001241678.1\|913966_914671_-\|tRNA	leucyl/phenylalanyl-tRNA--protein transferase	NA	NA	NA	NA
WP_001202189.1\|914712_916434_-	cysteine/glutathione ABC transporter ATP-binding protein/permease CydC	W8CYL7	Bacillus_phage	2.9e-21	25.2
WP_001043577.1\|916434_918201_-	cysteine/glutathione ABC transporter permease/ATP-binding protein CydD	W8CYL7	Bacillus_phage	7.0e-23	24.3
WP_000537418.1\|918323_919289_-	thioredoxin-disulfide reductase	A0A2I2L5E1	Orpheovirus	8.5e-63	44.6
WP_000228473.1\|919833_920328_+	leucine-responsive transcriptional regulator Lrp	NA	NA	NA	NA
WP_000077053.1\|920462_924491_+	DNA translocase FtsK	A0A218M9A2	Mycobacterium_phage	1.2e-86	48.7
WP_001295343.1\|924645_925257_+	outer membrane lipoprotein chaperone LolA	NA	NA	NA	NA
WP_000067755.1\|925267_926611_+	replication-associated recombination protein A	G3MBE0	Bacillus_virus	2.1e-80	40.8
WP_000886683.1\|926701_927994_+\|tRNA	serine--tRNA ligase	A0A1B1IVT2	uncultured_Mediterranean_phage	1.5e-94	48.2
935017:935032	attR	NA	NA	NA	NA

DBSCAN-SWA_4

1373913 : 1394635

Escherichia_phage(34.78%)

tRNA,integrase,lysis

attL 1374739:1374753|attR 1396910:1396924

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001301114.1\|1373913_1375146_-	diguanylate cyclase DgcM	A0A127AWB9	Bacillus_phage	3.1e-17	35.0
1374739:1374753	attL	NA	NA	NA	NA
WP_000387388.1\|1375400_1376384_+	zinc transporter ZntB	NA	NA	NA	NA
WP_000123737.1\|1376861_1378235_+	ATP-dependent RNA helicase DbpA	Q5GF26	Diachasmimorpha_longicaudata_entomopoxvirus	6.6e-53	33.1
WP_001157407.1\|1378363_1379299_-\|tRNA	tRNA 2-thiocytidine(32) synthetase TtcA	A0A0U2S5Z2	Escherichia_phage	5.9e-146	98.8
WP_000040858.1\|1379350_1380586_-\|integrase	site-specific integrase	A0A0U2JGI6	Escherichia_phage	1.6e-239	98.5
WP_000079604.1\|1380587_1380803_-	excisionase XisR	A0A0U2RY08	Escherichia_phage	1.8e-37	100.0
WP_000276809.1\|1380881_1381091_-	double-strand break reduction protein RcbA	A0A0U2QL97	Escherichia_phage	6.1e-27	98.4
WP_001317028.1\|1381083_1381278_-	type I toxin-antitoxin system endodeoxyribonuclease toxin RalR	A0A0U2QQP4	Escherichia_phage	5.8e-32	96.9
WP_000166319.1\|1381334_1382144_-	recombination protein RecT	A0A1P8DTF2	Proteus_phage	8.8e-106	71.5
WP_000632297.1\|1383337_1383613_-	protein RacC	A0A0U2QW85	Escherichia_phage	1.4e-42	96.7
WP_001352098.1\|1383687_1383858_-	conserved protein, Rac prophage	A0A0U2SHB5	Escherichia_phage	3.6e-17	71.4
WP_000560223.1\|1383857_1384079_-	killing protein KilR	A0A0U2RTC4	Escherichia_phage	2.0e-36	98.6
WP_001312793.1\|1384520_1385009_+	superinfection exclusion protein B	NA	NA	NA	NA
WP_001169151.1\|1385005_1385161_-	YdaF family protein	M4QQ57	Salicola_phage	6.1e-08	55.3
WP_012775985.1\|1385304_1385517_+\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	3.0e-29	96.9
WP_000193293.1\|1385521_1385866_+	YdfR family protein	K7PGU6	Enterobacteria_phage	1.4e-36	94.0
WP_000370546.1\|1385831_1386104_-	hypothetical protein	NA	NA	NA	NA
WP_000992105.1\|1386209_1386743_+	lysozyme	K7PLY1	Enterobacteria_phage	4.8e-100	96.0
WP_001228696.1\|1386959_1387145_+\|lysis	prophage lysis lipoprotein RzoD	K7PHU6	Enterobacteria_phage	2.8e-15	98.2
WP_001097897.1\|1387341_1388799_+	potassium transporter TrkG	NA	NA	NA	NA
WP_012775984.1\|1388936_1389332_+	chromosome partitioning protein ParB	A0A0R6PD10	Moraxella_phage	3.1e-19	58.7
WP_000654171.1\|1390013_1390292_+	hypothetical protein	A0A0E3JSQ1	Enterobacteria_phage	2.9e-24	55.4
WP_000355360.1\|1390304_1390598_+	hypothetical protein	NA	NA	NA	NA
WP_000078178.1\|1390825_1391416_-	recombinase family protein	A0A0A7NPV4	Enterobacteria_phage	1.6e-24	38.8
WP_000836768.1\|1391732_1391966_-	cold shock protein YdfK	A0A192Y6D5	Salmonella_phage	1.1e-32	88.3
WP_120795384.1\|1392034_1392148_-	Rac prophage; protein YnaM	A0A1C9IHU6	Salmonella_phage	8.4e-07	80.6
WP_001157925.1\|1392487_1392661_+	hypothetical protein	NA	NA	NA	NA
WP_001300461.1\|1392926_1393361_-	universal stress protein UspF	A0A1W6JNV4	Morganella_phage	1.8e-28	52.8
WP_000837924.1\|1393501_1394635_-	porin OmpN	Q1MVN1	Enterobacteria_phage	8.3e-118	58.8
1396910:1396924	attR	NA	NA	NA	NA

DBSCAN-SWA_5

1560932 : 1576555

Enterobacteria_phage(18.75%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000527826.1\|1560932_1562393_-	mannitol dehydrogenase family protein	G8DCZ3	Micromonas_pusilla_virus	2.8e-41	29.3
WP_000347482.1\|1562481_1563765_-	MHS family MFS transporter	NA	NA	NA	NA
WP_120795384.1\|1564368_1564482_+	Rac prophage; protein YnaM	A0A1C9IHU6	Salmonella_phage	8.4e-07	80.6
WP_000836768.1\|1564550_1564784_+	cold shock protein YdfK	A0A192Y6D5	Salmonella_phage	1.1e-32	88.3
WP_000086527.1\|1565099_1565690_+	recombinase family protein	A0A0A7NPV4	Enterobacteria_phage	1.6e-24	38.8
WP_000355603.1\|1565917_1566211_-	hypothetical protein	NA	NA	NA	NA
WP_000235975.1\|1566221_1566926_-	hypothetical protein	A0A1X7QGH6	Escherichia_phage	5.4e-59	62.3
WP_001205170.1\|1566935_1567217_-	hypothetical protein	A0A1X7QHA1	Escherichia_phage	4.5e-17	47.8
WP_000879385.1\|1567216_1568470_-	hypothetical protein	A0A0E3M194	Enterobacteria_phage	3.7e-127	54.3
WP_000896277.1\|1568789_1568951_+	hypothetical protein	NA	NA	NA	NA
WP_085947598.1\|1569178_1570340_+\|transposase	IS3-like element IS3 family transposase	A0A0P0I4A4	Acinetobacter_phage	4.0e-51	40.6
WP_000780584.1\|1570710_1571235_+	lipocalin family protein	A0A1W6JNX6	Morganella_phage	1.0e-46	52.9
WP_001204787.1\|1571390_1571768_-	antitermination protein	Q777W5	Enterobacteria_phage	1.8e-53	82.5
WP_001265279.1\|1571785_1572436_-	DUF968 domain-containing protein	Q8SBE5	Shigella_phage	2.6e-68	70.3
WP_012775982.1\|1572437_1572716_-	hypothetical protein	I6PCV7	Cronobacter_phage	5.7e-12	48.4
WP_000981003.1\|1572782_1573034_-	hypothetical protein	NA	NA	NA	NA
WP_000887491.1\|1573250_1573463_-	type I toxin-antitoxin system Hok family toxin	A0A0U2QV81	Escherichia_phage	1.7e-29	97.1
WP_000054497.1\|1574067_1575033_-	hypothetical protein	U5P0A0	Shigella_phage	5.0e-55	60.2
WP_000705360.1\|1575013_1575535_-	hypothetical protein	NA	NA	NA	NA
WP_000921596.1\|1575518_1575746_-	transcriptional regulator	NA	NA	NA	NA
WP_000381212.1\|1575826_1576234_+	helix-turn-helix domain-containing protein	I6PD69	Cronobacter_phage	7.2e-32	51.9
WP_000379591.1\|1576402_1576555_+	DUF1391 domain-containing protein	M4QQ57	Salicola_phage	6.6e-07	53.2

DBSCAN-SWA_6

1988254 : 1997111

Enterobacteria_phage(42.86%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000998544.1\|1988254_1989367_-	DegT/DnrJ/EryC1/StrS family aminotransferase	A0A0P0YLZ6	Yellowstone_lake_phycodnavirus	1.3e-14	25.7
WP_001060532.1\|1989376_1990801_-	lipopolysaccharide biosynthesis protein	NA	NA	NA	NA
WP_001100801.1\|1990804_1991350_-	dTDP-4-dehydrorhamnose 3,5-epimerase	I7HJC4	Enterobacteria_phage	1.6e-47	53.9
WP_000857508.1\|1991354_1992233_-	glucose-1-phosphate thymidylyltransferase RfbA	I7I009	Enterobacteria_phage	8.7e-107	64.1
WP_001023616.1\|1992291_1993191_-	dTDP-4-dehydrorhamnose reductase	A0A291LA50	Escherichia_phage	8.2e-28	34.5
WP_000699450.1\|1993190_1994276_-	dTDP-glucose 4,6-dehydratase	I7HTA3	Enterobacteria_phage	3.9e-101	53.9
WP_000183060.1\|1994648_1995542_-	UTP--glucose-1-phosphate uridylyltransferase GalF	A0A127AW70	Bacillus_phage	1.0e-46	42.0
WP_001115981.1\|1995716_1997111_-	colanic acid biosynthesis protein WcaM	A0A291LBB9	Klebsiella_phage	1.3e-19	33.5

DBSCAN-SWA_7

2085011 : 2094453

Enterobacteria_phage(85.71%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001300968.1\|2085011_2086148_+	VWA domain-containing protein	Q9EYF7	Enterobacteria_phage	3.2e-162	97.4
WP_001300967.1\|2086144_2088145_+	hypothetical protein	Q9EYF6	Enterobacteria_phage	0.0e+00	96.6
WP_001296231.1\|2088269_2088731_+	YehR family lipoprotein	Q9EYF5	Enterobacteria_phage	3.2e-76	99.3
WP_001295430.1\|2088771_2089242_-	DUF1456 family protein	Q9EYF4	Enterobacteria_phage	1.8e-82	100.0
WP_000598641.1\|2089288_2090008_-	two-component system response regulator BtsR	NA	NA	NA	NA
WP_001295431.1\|2090004_2091690_-	two-component regulatory system sensor histidine kinase BtsS	Q9EYF3	Enterobacteria_phage	2.5e-304	99.6
WP_001240403.1\|2091911_2092643_+	HTH-type transcriptional regulator MlrA	Q9EYF2	Enterobacteria_phage	9.7e-112	99.5
WP_001216966.1\|2092702_2092810_+	protein YohO	NA	NA	NA	NA
WP_000783120.1\|2092790_2093522_-	glycine betaine ABC transporter permease YehW	NA	NA	NA	NA
WP_000569344.1\|2093526_2094453_-	glycine betaine ABC transporter ATP binding protein YehX	F2Y1V5	Organic_Lake_phycodnavirus	5.7e-08	26.8

DBSCAN-SWA_8

2681539 : 2688678

Escherichia_phage(83.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001272928.1\|2681539_2684101_+	DNA mismatch repair protein MutS	E3T5Q7	Cafeteria_roenbergensis_virus	3.0e-30	20.6
WP_001141337.1\|2684206_2684863_+	protein-serine/threonine phosphatase	A0A222YWF0	Escherichia_phage	4.7e-49	46.3
WP_001300386.1\|2684913_2685681_-	DeoR/GlpR transcriptional regulator	A0A077SK06	Escherichia_phage	7.4e-70	56.3
WP_000848004.1\|2685876_2686785_+	NAD(P)-dependent oxidoreductase	A0A077SLF7	Escherichia_phage	4.3e-117	76.5
WP_001393459.1\|2686781_2687948_+	four-carbon acid sugar kinase family protein	A0A077SLJ7	Escherichia_phage	1.1e-120	60.6
WP_001278994.1\|2688039_2688678_+	aldolase	A0A077SK32	Escherichia_phage	1.4e-82	75.0

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP020368

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection