CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP044107	Enterobacter hormaechei strain FDAARGOS_642 chromosome, complete genome	2 crisprs	RT,WYL,DEDDh,csa3,cas3,DinG	0	6	3	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP044107_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP044107_1

3601266-3601427

Orphan

Consensus_repeat	Method
TCTCCCGTAGGCCCGGTAAGCGCAGCGCCACCGGGCAACGGTTTTAACCGGA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP044107_1

>merge|NZ_CP044107|1|3601266-3601427|CRISPRCasFinder
TCTCCCGTAGGCCCGGTAAGCGCAGCGCCACCGGGCAACGGTTTTAACCGGAGAAACGATAAAAAGCCGGGTGGCGGCTACGCCTTACCCGGCCTACATGTTCTACATATTCTCCCGTAGGCCCGGTAAGCGCAGCGCCACCGGGCAACGGTTTTAGCCGGA

>NZ_CP044107|1|1|3601266-3601427|CRISPRCasFinder
TCTCCCGTAGGCCCGGTAAGCGCAGCGCCACCGGGCAACGGTTTTAACCGGA	GAAACGATAAAAAGCCGGGTGGCGGCTACGCCTTACCCGGCCTACATGTTCTACATAT
TCTCCCGTAGGCCCGGTAAGCGCAGCGCCACCGGGCAACGGTTTTAGCCGGA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP044107.1\|WP_003857304.1\|3610685_3611120_+\|DMT-family-transporter	unknown	unknown	gnl\|CDD\|377396
NZ_CP044107.1\|WP_150391149.1\|3571750_3589756_-\|BapA-prefix-like-domain-containing-protein	unknown	unknown	gnl\|CDD\|380150
NZ_CP044107.1\|WP_032669925.1\|3592705_3593773_+\|oxidoreductase	unknown	unknown	gnl\|CDD\|183212
NZ_CP044107.1\|WP_032669924.1\|3591948_3592692_+\|DeoR/GlpR-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224268
NZ_CP044107.1\|WP_017384500.1\|3606914_3607454_-\|DUF2058-domain-containing-protein	unknown	unknown	gnl\|CDD\|225664
NZ_CP044107.1\|WP_111962054.1\|3611579_3612113_-\|DUF3833-domain-containing-protein	unknown	unknown	gnl\|CDD\|378992
NZ_CP044107.1\|WP_017693458.1\|3598755_3599838_+\|HlyD-family-secretion-protein	unknown	unknown	gnl\|CDD\|224482
NZ_CP044107.1\|WP_047733386.1\|3589878_3591216_-\|TolC-family-outer-membrane-protein	unknown	unknown	gnl\|CDD\|273829
NZ_CP044107.1\|WP_045141532.1\|3612591_3613812_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|225139
NZ_CP044107.1\|WP_023296571.1\|3607622_3608597_+\|DUF1852-domain-containing-protein	unknown	unknown	gnl\|CDD\|370181
NZ_CP044107.1\|WP_015570577.1\|3605524_3606130_+\|FMN-dependent-NADH-azoreductase	unknown	unknown	gnl\|CDD\|234675
NZ_CP044107.1\|WP_033486781.1\|3609654_3610587_-\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176114
NZ_CP044107.1\|WP_003857305.1\|3611124_3611583_+\|DMT-family-transporter	unknown	unknown	gnl\|CDD\|377396
NZ_CP044107.1\|WP_047637364.1\|3594432_3595872_-\|aldehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|182233
NZ_CP044107.1\|WP_063135140.1\|3606220_3606907_+\|RluA-family-pseudouridine-synthase	unknown	unknown	gnl\|CDD\|223638
NZ_CP044107.1\|WP_017384495.1\|3596070_3596865_-\|YdcF-family-protein	unknown	unknown	gnl\|CDD\|224351
NZ_CP044107.1\|WP_150326207.1\|3608622_3609651_+\|methionine-synthase	unknown	unknown	gnl\|CDD\|181659
NZ_CP044107.1\|WP_047637363.1\|3593814_3594345_-\|cytochrome-b561	unknown	unknown	gnl\|CDD\|236921
NZ_CP044107.1\|WP_115503847.1\|3597086_3598733_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|129794
NZ_CP044107.1\|WP_033486784.1\|3599834_3601214_+\|efflux-transporter-outer-membrane-subunit	unknown	unknown	gnl\|CDD\|273830

Protein	Function_ID	Function_description	E-value
NZ_CP044107.1\|WP_003857304.1\|3610685_3611120_+\|DMT-family-transporter	gnl\|CDD\|377396	pfam04657, DMT_YdcZ, Putative inner membrane exporter, YdcZ. DMT_YdcZ is a family of putative inner membrane exporters from both Gram-positive and Gram-negative bacteria.	2.22711e-23
NZ_CP044107.1\|WP_150391149.1\|3571750_3589756_-\|BapA-prefix-like-domain-containing-protein	gnl\|CDD\|380150	NF012196, Ig_like_ice, Ig-like domain-containing protein. This variant form of the Ig-like domain occurs as a repeat in a number of large adhesins, including a 1.5-MDa ice-binding adhesin, the Marinomonas primoryensis antifreeze protein.	8.22662e-14
NZ_CP044107.1\|WP_032669925.1\|3592705_3593773_+\|oxidoreductase	gnl\|CDD\|183212	PRK11579, PRK11579, putative oxidoreductase; Provisional.	8.50287e-147
NZ_CP044107.1\|WP_032669924.1\|3591948_3592692_+\|DeoR/GlpR-transcriptional-regulator	gnl\|CDD\|224268	COG1349, GlpR, Transcriptional regulators of sugar metabolism [Transcription / Carbohydrate transport and metabolism].	1.37008e-73
NZ_CP044107.1\|WP_017384500.1\|3606914_3607454_-\|DUF2058-domain-containing-protein	gnl\|CDD\|225664	COG3122, COG3122, Uncharacterized protein conserved in bacteria [Function unknown].	1.03752e-76
NZ_CP044107.1\|WP_111962054.1\|3611579_3612113_-\|DUF3833-domain-containing-protein	gnl\|CDD\|378992	pfam12915, DUF3833, Protein of unknown function (DUF3833). This is a family of uncharacterized proteins found in Proteobacteria.	2.04315e-92
NZ_CP044107.1\|WP_017693458.1\|3598755_3599838_+\|HlyD-family-secretion-protein	gnl\|CDD\|224482	COG1566, EmrA, Multidrug resistance efflux pump [Defense mechanisms].	1.21598e-94
NZ_CP044107.1\|WP_047733386.1\|3589878_3591216_-\|TolC-family-outer-membrane-protein	gnl\|CDD\|273829	TIGR01844, Proteases_secretion_protein_PrtF, type I secretion outer membrane protein, TolC family. Members of this model are outer membrane proteins from the TolC subfamily within the RND (Resistance-Nodulation-cell Division) efflux systems. These proteins, unlike the NodT subfamily, appear not to be lipoproteins. All are believed to participate in type I protein secretion, an ABC transporter system for protein secretion without cleavage of a signal sequence, although they may, like TolC, participate also in the efflux of smaller molecules as well. This family includes the well-documented examples TolC (E. coli), PrtF (Erwinia), and AprF (Pseudomonas aeruginosa). [Protein fate, Protein and peptide secretion and trafficking, Transport and binding proteins, Porins].	4.13861e-87
NZ_CP044107.1\|WP_045141532.1\|3612591_3613812_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|225139	COG2230, Cfa, Cyclopropane fatty acid synthase and related methyltransferases [Cell envelope biogenesis, outer membrane].	3.00902e-111
NZ_CP044107.1\|WP_023296571.1\|3607622_3608597_+\|DUF1852-domain-containing-protein	gnl\|CDD\|370181	pfam08908, DUF1852, Domain of unknown function (DUF1852). This family of proteins are functionally uncharacterized.	0
NZ_CP044107.1\|WP_015570577.1\|3605524_3606130_+\|FMN-dependent-NADH-azoreductase	gnl\|CDD\|234675	PRK00170, PRK00170, azoreductase; Reviewed.	1.54157e-130
NZ_CP044107.1\|WP_033486781.1\|3609654_3610587_-\|LysR-family-transcriptional-regulator	gnl\|CDD\|176114	cd08422, PBP2_CrgA_like, The C-terminal substrate binding domain of LysR-type transcriptional regulator CrgA and its related homologs, contains the type 2 periplasmic binding domain. This CD includes the substrate binding domain of LysR-type transcriptional regulator (LTTR) CrgA and its related homologs. The LTTRs are acting as both auto-repressors and activators of target promoters, controlling operons involved in a wide variety of cellular processes such as amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to name a few. In contrast to the tetrameric form of other LTTRs, CrgA from Neisseria meningitides assembles into an octameric ring, which can bind up to four 63-bp DNA oligonucleotides. Phylogenetic cluster analysis further showed that the CrgA-like regulators form a subclass of the LTTRs that function as octamers. The CrgA is an auto-repressor of its own gene and activates the expression of the mdaB gene which coding for an NADPH-quinone reductase and that its action is increased by MBL (alpha-methylene-gamma-butyrolactone), an inducer of NADPH-quinone oxidoreductase. The structural topology of this substrate-binding domain is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	2.55794e-73
NZ_CP044107.1\|WP_003857305.1\|3611124_3611583_+\|DMT-family-transporter	gnl\|CDD\|377396	pfam04657, DMT_YdcZ, Putative inner membrane exporter, YdcZ. DMT_YdcZ is a family of putative inner membrane exporters from both Gram-positive and Gram-negative bacteria.	5.29058e-30
NZ_CP044107.1\|WP_047637364.1\|3594432_3595872_-\|aldehyde-dehydrogenase	gnl\|CDD\|182233	PRK10090, PRK10090, aldehyde dehydrogenase A; Provisional.	0
NZ_CP044107.1\|WP_063135140.1\|3606220_3606907_+\|RluA-family-pseudouridine-synthase	gnl\|CDD\|223638	COG0564, RluA, Pseudouridylate synthases, 23S RNA-specific [Translation, ribosomal structure and biogenesis].	4.92788e-68
NZ_CP044107.1\|WP_017384495.1\|3596070_3596865_-\|YdcF-family-protein	gnl\|CDD\|224351	COG1434, COG1434, Uncharacterized conserved protein [Function unknown].	1.02937e-19
NZ_CP044107.1\|WP_150326207.1\|3608622_3609651_+\|methionine-synthase	gnl\|CDD\|181659	PRK09121, PRK09121, methionine synthase.	0
NZ_CP044107.1\|WP_047637363.1\|3593814_3594345_-\|cytochrome-b561	gnl\|CDD\|236921	PRK11513, PRK11513, cytochrome b561; Provisional.	9.7522e-118
NZ_CP044107.1\|WP_115503847.1\|3597086_3598733_+\|MFS-transporter	gnl\|CDD\|129794	TIGR00711, Uncharacterized_MFS-type_transporter_YhcA, drug resistance transporter, EmrB/QacA subfamily. This subfamily of drug efflux proteins, a part of the major faciliator family, is predicted to have 14 potential membrane-spanning regions. Members with known activities include EmrB (multiple drug resistance efflux pump) in E. coli, FarB (antibacterial fatty acid resistance) in Neisseria gonorrhoeae, TcmA (tetracenomycin C resistance) in Streptomyces glaucescens, etc. In most cases, the efflux pump is described as having a second component encoded in the same operon, such as EmrA of E. coli. [Cellular processes, Toxin production and resistance, Transport and binding proteins, Other].	2.4911e-23
NZ_CP044107.1\|WP_033486784.1\|3599834_3601214_+\|efflux-transporter-outer-membrane-subunit	gnl\|CDD\|273830	TIGR01845, Outer_membrane_protein_OprM, efflux transporter, outer membrane factor (OMF) lipoprotein, NodT family. Members of this model comprise a subfamily of the Outer Membrane Factor (TCDB 1.B.17) porins. OMF proteins operate in conjunction with a primary transporter of the RND, MFS, ABC, or PET systems, and a MFP (membrane fusion protein) to tranport substrates across membranes. The complex thus formed allows transport (export) of various solutes (heavy metal cations; drugs, oligosaccharides, proteins, etc.) across the two envelopes of the Gram-negative bacterial cell envelope in a single energy-coupled step. Current data suggest that the OMF (and not the MFP) is largely responsible for the formation of both the trans-outer membrane and trans-periplasmic channels. The roles played by the MFP have yet to be determined. [Cellular processes, Detoxification, Transport and binding proteins, Porins].	2.50726e-93

>NZ_CP044107.1|WP_033486784.1|3599834_3601214_+|efflux-transporter-outer-membrane-subunit
MTLRPIAGLLIMTILAGCQSVDVEPAKSSLHIPAQWRATSGPASPTEQLWWRNFHDSNLNRYVDQALKNNSDVLIARERINEYQARVYAADGSLFPSLDAGVTGTRARSQSAATGLPVYGTLYKGSLTASYDVDIWGVNRSTSRAAEASLEAQKAAAAAADLTVASSVASGYVTLLSLDEQLRVTRSTLKSREEAFNLAKRQFETGYSSRLELMQSDSELRATRAQVPLLQHQIAQQENALSLLLGSNPGDVARGESFDALTPLKLPSQLPSTLLNRRPDIVQAERQLIAADATLAASRASLLPSINLTATGSVQDRTLSGLLDNPLQLWSVGGSILAPLLNRQALNAQVDISQSQRNQALYSYEKTVRNAFAEVNDSLDAITRYQEQLTELLAQQTVAQETLRIAQNRYRNGYSSYLDELDAQRTLFSVQTSVVQVKNNLLLAQIDLYKALGGGWVSA
>NZ_CP044107.1|WP_017693458.1|3598755_3599838_+|HlyD-family-secretion-protein
MSQQDAAKEQANTRKNVRVVSIFTAAAIGIVGVLVILYAWQLPPFTRHAQFTDNAYVRGQTTFISPQVNGYITEVHVQDFAQVKKGELLLQIDDRIYRQRVHQAEAQLAMKIAALNNNLQQRKSAEAVIAKNEAALKNARAQSLKTQADLKRVKELTADGSLSIRERDSALASAAQGSADIDQAKATLEMSRQDLQTVIVNRGSLEADVENAKAALELAQIDLQNTRIVAPRDGQLGQIAVRLGAYVTAGTHLTTLVPPQHWVIANIKETQLANLRVGQPVKFTVDALNDKAYQGRVESISPATGVEFSAITPDNATGNFVKIAQRIPVRIEVLGEPEAYRLLRPGMSVQVTIDTREAKQ
>NZ_CP044107.1|WP_115503847.1|3597086_3598733_+|MFS-transporter
MPQRDPYAPREWQPHEKPALLGSPSTPEHPTSKRIAYGVVGLLVCLTGALGNAVVTANLQNLQGTFGAWSTEIAWLPAVYVMTNVSINLLLVKFRQQYGLRAFTEGFLVLYVLVTFFHLFVNDLSSALMVRAAHGMVAAALSSLGIYYQIQAWPAKHRLKALTIGITGSSLAIPLARLFSTELLQLDEWRGLYFFELGLALISLACVMALKLPPGDRRKVFEKKDFITFFLLAPGMALLCAVLSLGRLDWWFEAPWIGWALALSLVLIVSAIVFEHNRNNPLLNTRWLSSGSIVRLGLIMLLIRIVLAEQNTGVIGWLQYVGLQNEQMTHLAWAIFAGIVCGIVTSCLTIKPTKLAWPIITSLALMIIASLLDSQSNNLTRPDQLIFSQFLLGFGSAFFLAPAMLAAIGGVIADPRNLVSFSVMFGMSQNLGGLLGSAILGTFQTWREKYHSSLLADQLTTLNPLVNERIQLYTQMYKSLVGDSSLLGTQAITQLQSVTTLEANILAYNDTYLLTASIATATLVWILWRLLRLRITARMALKNATGNK
>NZ_CP044107.1|WP_017384495.1|3596070_3596865_-|YdcF-family-protein
MTMALFPCLPGTTLDAVNTVGAWLAQDDYQDNQPVDLVILAGNAVIPAIDAACKIAAEQGVPLIISGGIGHSTTFLYAAIAKHPRYNRIPTTGRAEAAILADIAREFWNIPAEHLHVEDQSTNCGENARFSRALMKQSGLNAARVLVVQDPTMQRRTMATFARVCRDEAASPAWVSHPGLTPVLQNSDDGLVFSGPVEGLWPVERYLSLVLGEFPRLRDDINGYGPAGRDFIAHVDIPADVDAAWQILRNDVILTDALVSRSLL
>NZ_CP044107.1|WP_047637364.1|3594432_3595872_-|aldehyde-dehydrogenase
MTVPVQHPMYIDGQFVAWQGDAWIEVINPATEEVISRIPDGSAEDARKAIDAADRAQAGWEALPAIERASWLRKISAGIRERVSEISALIVAEGGKIQQLAEVEVNFTADYIDYMAEWARRYEGEIIQSDRPGENILVFKRALGVTIGILPWNFPFFLIARKLAPALLTGNTIVIKPSEFTPNNAIAFAKIVDEIGLPKGVFNLVLGRGETVGQELAGNPKVAMVSMTGSVGAGEKIMAAAAKNITKVGLELGGKAPAIVMDDADLELAVKAIVDSRVINTGQVCNCAERVYVQKGIYDRFVNRLGEAMKAVQFGNPAERTDIAMGPLINAAALERVEQKVARAVQEGAKVVLGGKAAEGKGYFYPPTLLLDVRQDMAIMHEETFGPVLPVVAFDTLEEALNMANDSDYGLTSSVYTQDLNVAMKAIKGLKFGETYINRENFEAMQGFHAGWRKSGIGGADGKHGLNEYLQTQVVYLQS
>NZ_CP044107.1|WP_047637363.1|3593814_3594345_-|cytochrome-b561
MRTKYTGLQISIHWLVFLLVIMAYCAMEFRGWFPRTDRPLINMIHVSCGISILVLMVARLLIRLKFPAPPIQPKPKAMITGLSHLGHLVIYLLFITLPLIGMVMMYNRGNDWFAFGLTMPHAAEGNFDLVDTLKEWHVTLANLGYFVIGLHAFAALMHHYFWKDNTLLRMMPKKRQ
>NZ_CP044107.1|WP_032669925.1|3592705_3593773_+|oxidoreductase
MNKVKTMNIALIGYGFVGKTFHAPLIQSVEGLKLAVVSSRDEEKVKRDLPDVLVVATPEEAIQHPDIDLVVIASPNATHAPLATLALNAGKHVVVDKPFTLDMQEARDLIALAQEKQRLLSVFHNRRWDSDFLGIKQVIEQGRIGKVKHFESHIDRFRPEVRVRWREQNVPGSGLWFDLGPHMIDQTLQLFGLPQSVQGNIATLRDGAEINDWAHVVLNYPEHKVVLHCSMLVAGGVARFTVHGDKASVVKAHIDQQEAQLLAGVVPGSESWGEDSDAMVLFNAQGEASAIPAPKGDQRQYYINVRDALNGKIDNPVHPVEALAVMAVLEAAVKSSETGSTQELDLTAQERAQLQ
>NZ_CP044107.1|WP_032669924.1|3591948_3592692_+|DeoR/GlpR-transcriptional-regulator
MHKTARQKYVLDIITEQGQASITELAERLQVSADTIRRDLTDLEKQGLAQKNHGGAIALNLSTMTRVSRNSLLPEIKQRLGKQVAQCVPAGSTLFLDAGSTLLAVASFLKGPLTIITPSLDIAQQVSDREDIDLILLGGKWDQKQRLFAGSATLSLLSRYRADIAILGACAIHAELGLSASQEADAEVKRAMLAASQAHWVVADHLKLNQCEPYLVSGLSEIHQLFLDRPWAELGDHSALQVTVGAH
>NZ_CP044107.1|WP_047733386.1|3589878_3591216_-|TolC-family-outer-membrane-protein
MKMKCNNRLLRLSVSLTLISLVVTAANANNGQAGISPVAAMTMKESILFALDRDPSVSQQAAQLGIGQAQIDEARSGWMPQIALNGSTGHSQTTDSSGSLRNSAAWGLSLTQLVYDFGKTNNSIRQSSAQRDSYRYQLMSTMSAVAEKTALSYVEVKRYSDLLQAAKENVQALKNVEQLAKLRADAGVSSTSDELQTRTRIAGMQATVEQYNASLNSARARLAVLTGIQAERYSPVPGGLAVEPDSLNRIDYSLIPTVMAAQNMERSAQYGVETARSQHWPTLSLKGGRTRYESDNRAYWDDQIQLNIDAPLYQGGAVSARVRQAEGARAMASSQVDQARFDVLQKASVAQADWTGARGRMEAGKRQLENALRARDVYKNEYTLSKRSINDLLSVEQDVWSATSAKIMAEYDGWSAAINYASAVDNLMPLIGIEKNAAAKLPDLS
>NZ_CP044107.1|WP_150391149.1|3571750_3589756_-|BapA-prefix-like-domain-containing-protein
MSTAKVVDVIIRKTAEKTKLTGEGNLSVSISSPSVIEIQGSAQDVVRYVRQGNDLLIYMKYGSVIRCNNYFVEDTETHNHSELVFNDNQELTHISFADAGEASGVAATELTAQAAPISSIEPFLEQGSVLSDAPWGWIAGAALGGGAIGALLAHGGDGETKTRVIDNTKEVESATPTFLLTDNAGDKQGVLSAKEVTDDNTPTFSGTGQPGATIQVKDGNGSTIASTMVAKDGTWTVTLPTQADGEHTWSVVQIDGSKTTSAGSITVTVSTADTSVTLATTAGDNVINASEQAAGFTLSGTSKNLAQGTALTVTLNGKTYTAEVGANGAWSVKVPAADAQALGDGTWTVNVSGKDAAGNTVSGSQTIGVDTASPVISVDTIAQDNIINAAEHNQPLTLTGKTDAEAGQIVTVTLNGKNHTATVGSDGSWSVTLPASEVQALANGEHTLTVNVSDKAGNGSSTTADFTVDTAAPVVTINTVAGDDILNTSEQGQAQIISGQANGAAEGDIVTVTVGGKTFTGAVQADGSWSVGVPASVIGALGEGSHSISVSVTDAAGNTGSATHGITLSGNPPEFTLDPISQDNVLNAQEAMQPLSLSGTSNLPNGSAVTVTLNNVNYQATVENGRWSVQVPVSDVLDLANTLYTVSVSGTDSVGNSGSAEANLLVDTVLPQVIVNTFAGDNLVNNAEAAVDQTLSGRVTGAAAGDTVSVTVGGKSYTATVGSDLKWSVTIPSADLQAFGDGDLTFSASVTNAHGNTGTGERDININAELPGLRVNTISGDDVINAIEQQQDLAVTGSSTHLAEGTQITVTINNVEYVTTVNASGNWQIGVPAADLQAWTAGGMTVSVSAEDAWGNTVAAEHPIELDLNAVAVTIDTVTTDDMLNAAEKGADVTLSGQTQGVEAGQTVVVKFADQTFTAQVQQDGSWRLTVPASAMETLIDGRAQVSVSVTNVNGNSADASRVVIVDTQPPAITLDNLTDDNIINAAEAQQDLVLSGSTTAEAGQTVTVTLNGKSYQTTVQADGRWQLNVPAADVGALTDGNVTVTATVSDVAGNSSSADRVGLVDATVPQVIINDFVTDTNTVNQLAHAQAQILSGSVTGAAAGDLVTITINNVDYTTVVDAAGNWSLGLPASVVQGLTDGTWTINVSVTDQSGNTGSSSVDVVVNTVTPIIGINTLAADDVINAAEKGEDLLLSGTSNQPEGTTITVNLNGINYTATTDASGNWSVTVPASAVSALGEANYTVTASVTDNVGNSAAATHDVLVDSSLPVVTINTLAGDNIVNAAEVAAGQTLTGKVSNAASGDTVTIILGGQTYTATVQDDLTWSLPLTQSQLTALGNGDLTVSASVTNAHGNTGSFSLDVTIDAQLPGLRIDTVAGDDVINVIEHAQNLVISGTSTDLAAGSTVTVTINGKSYSASVLADGTWQAAVPAADVSRWADGSLTISASAQDTSGNPVNIGTVVDVDLAPVAISINSVTDDNVLNAAEKGQDLVLSGSSSNVEAGQTVTIIFAGKTWTTTVDANGDWTCTVPAADLSGLKDGDASVQVSVTNVNGNAASSSQAFSVDTAAPAVTINTISGDNMLNAAEAAQDLTLSGTSTAEAGQTVTVTFNGNQYTAQVQANGSWTLDVPAADLAGIADGSAAVTVTVSDKAGNPASAGASVLVDTTVPQITFNIVAGDDIVNIAEHGQALIVTGKVTGAQAGDVITLSLNGKDYTAMLDASGNWSVGIPATDVGALANGDQTISATLTDKAGNSTSATHAFDVSLTAPVIAINTLAVDDVINATEKGQDLLISGTSNQPDGTRISVTLNGISYAATTDASGNWSVTVPAANVSVLGEASYSVTASVTDTAGNSANTSHSVLVDSALPQVTINAVATDDVINAAEVASGQTMSGKVSGAASGDTVTIGIGGNTYTATVQDDLSWSVNVASDVLTAIGNGDLTVTASVTNGHGNTGTGERDITIDASLPGLRVDTVAGDDVINSIEHGQNLIITGSSDGLASGSALTVTVNGKTYAATVLADGTWTAAIPAADVGALSAGTITVTVDGQSAAGNPVSISHDVKVDLAAVAISINPIASDDVINAAEKGADLVLSGSTTNVEENQTVTITFGGKLYTATVDASGNWTATVPSADLGGLKDGDASVQVSVTNVNGNSASAGREYSVDATAPTVSIEIVSDNNIINAAEAQQDLVINGVSNAEAGQTVTVTLNGVDYTTTVQANGSWSVTVPSADIGAITDGDYTITAAVADKAGNPASADRDVLVDTTVPQLTINTVSDDDVINSAEHAQALIVTGSVTGAAAGDVVTVTINNKDYTATLDTSGRWSVGVPAADVSALAAGDYTITAALTDKAGNSNSTTHEVEVNLTAPVLTIDTVSGDDVINSSEKTQDLTITGTASGLAAGAVVTVMLNGKAYSATVDTNGQWTTTVPASEVGQLGEALYTVSASATDSVGNSSSTSHTVNVESVLPGVIINTVAGDDVINAAELATGQTISGTVVNAEAGNTVTVSVGGHSYTATVQDNLTWSVSVPESVLAALGNGDLTVTASVTNGVGNSGSGERDITIDANLPGLRVDTVAGDDVINSIEHGQNLIITGSSDGLTAGTALTVTVNGKTYPATVLADGTWSAAIPSADVSALAAGTVTVNVEGQSSAGNPVTINHDVTVDLANVAISIDAIASDDVINAAERGADLVLTGTTSNVEENQIVTITFGGKNYTATVDAEGKWTATVPSADLTGLKDGDASVQVSVTNVNGNSASAGREYSVDATAPSVTINTIATDDILNASEAQSDLAISGTSTAEAGQTVTVSLNGKDYTTTVSANGSWTLNVPAADLAGLTDGSVTMTAAVSDKAGNPASVDHTLTVDVTVPAVTIHTVAGDDVINVAEHNQAQIISGSATGAAAGDKVTVTIGGQTYTTVLDAAGNWSVGVPASVISGLSDGSVTVTASVTDAAGNTGSGTHNVTVDTGLPSVSFNAISDDNVLNAVEKGQDLSVSGTSANLAEGTVVTVTLNGKNYTATTAADGTWSLTVPAADLAGLGQASYTLNATATNGVGNSVSSSANLLVDTALPTVTINTVAGDNVINAAEVAAGQTLSGTVANAEAGNTVTVTIGGHSYTATVQNNLSWSVNVPSDVLTALGNGSLSVTATVTNGHGNTGTGEREIAIDANLPGLRVNTVAGDDVVNTIEHAQNLVVSGSSDGLTAGTALTVTVNGKDYAATVLADGTWSAAIPSADVSAWPEGTVKISVTGDSAAGNPITISHDVTVDLATVAISINALATDDVINAAEKGADLVLSGVTTNVEAGQTVTISLNGRIYTTTVDDSGNWTYTVPSADLAGLKDGDASVQVSVTNVNGNSASAGREYSVDATAPSVTINTIATDDILNATEAQSDLAISGTSTAEAGQTLTVSLNGKDYTTTVSANGSWTLNVPAVDLAGLTDGSVTVTASVSDKAGNPASVDHTLTVDVTVPAVTIHTVAGDDVINVAEHNQAQIVSGSATGAAAGDTVTVTIGGQSYTTVLDAAGNWSVGVPANVISGLSDGSVTVTASVTDAAGNTGSGTHNVTVDTGLPSVSFNAISDDNVLNAVEKGQDLSVNGTSANLAEGTVVTVTLNGKNYTATTAADGTWSLTVPAADLSGLGEASYTLSATATNGVGNSISTTANLLVDTALPTVTINTVAGDNVINAAEVAAGQTISGKVANAEAGNTVTVTIGGNSYTATVQSDLTWSVNVPETVLTALGNGELTVSATVTNGHGNTGAGEREIVIDASLPGLRVDTVAGDDVINSIEHGQNLIVTGSSDGLAAGTTLTVTVNGKTYAASVLAEGTWSAAIPAADVGALAAGTVTVTVAGQSAAGNPVTISHDVTVDLAAVAISIDAIATDDVINAAEKGADLVLSGSTSNVEENQTVTITFGGKSYTVKVDADGNWTATVPSSDLAGLKDGDASVQVSVTNVNGNSASAGREYSVDATAPTVTIDTVAGDNVINGSEAAAGVAISGTTTAEVGQTVTVNLGGNSYTAQVQQGGVWSINVPAADLSTLADNGYTVQVSVSDAAGNPGSAGKAITLDTTPPTVSFNVVAGDDVINSVEHGQAQVVSGTATGASVGDKLVITIGSNQYTTTVDASGKWSVGVPASDISALTDGTVTLSATITDSAGNSSTQTHDVVVNTASVALTVNTLSGDDVINAAEAGASLVINGSSAQFASGTQVTITLNGKSYTATIQSDGSWTTTVPAADVGTLADGASYQVSVSAQDSAGNSASATHTISVDTTAPVISVNTLSGDDVLNAAEAQQPLTVHGSSSAEAGQTVTVTLGGKTYTALVANDGTWTLDVPAADLANLSEGALTVTASVNDKAGNNGQTTHTLTVDTVAPAVTISTVADDDIVNDAEQLAGQTISGTTTAEQGQTVTVSFNGHSYQATVAANGSWSVFVPGRDFLGLSDGDYTITATVSDKAGNPGSATHDVTLNGDVPTIAINTFAQDDIVNAAEHGTPLVISGTTDAPTGQTVTITLNGKTYTATVQNDGTWSYTVGSADVTALADGGSYVINAQVSNAIGNSASDNHTVIVDLTAPSMGISIDSLHNDTGLSANDFITNDSQVVVNGSLTAQLGNNEKAQISLDGGTTWIDLTVTGTTWRYTDGRTLTDGTYQYQVRVIDNAGNVGATDSQDVVIDLTKPAAATITVDSVSQDTGLSDSDFITSDNQISLKGTLGAALGSGDHAQISLDGGATWTDVSVSGLSWTYVDGRTLADGDYNYQLRVIDDAGNISATTSQVVTIDTVAPDASKTIAIDSISDDTGLSSSDFITNDTSLTLHGSLGATLADGEYAQISIDGGVTWQDVIVTGNSWYYVDGRTLGNQTYDYYVRVVDAAGNVGASAHQQVTVDTVAPDAAITVTVDNITVDTGFDNNDFLTSSTSYTLNGTLGAELGAGEYVQVSMDGGTTWVYATVSGTRWSYNDTRTLADGDYRYQVRVVDQAGNVGATTTQDVTVDTQAPQYGITIDSISEDTGQSGSDFITMDTSLTINGSLGSALASDERVQISLDGGNTWIDTTVTNQRWSYTDSRDLADGDYTYQVRIIDQAGNVGSTSSQVVTVDTTPPDTVGTVVSYTDGEGERTGTYGASVATDDTSPLINGTLNRAPEDGEIVQLYRDGILLGQVTMNGSASWSYQDNGLLDGNHTYILRVTDKAGNYTESDGFVLNVDTSIPTTTAAITAQTTSDTTPIVSGTVSADLVNGEYLVVTVNGKTYTSQTGGAVVVDPDHNTWYLQIPDSDALSVASYDVTAQVKSSAGNGNTTGTATGSLVIDTTSVNTDWATTAGNSNNSTMTLGMNSSGLWNIIANGQSYSSSDDSTYAGNTLTNTRSYYVVSQTAADFDRNGTQDIFATENTYAGSTQVMWTYDGSSYTASQLAMGTTIWYGGVIAYDKTGDGYLDLAYGDAGMDSLTYLVNTNGVPSPDGTGGEGGFYGQFDSGREISGVDLNNDGTVDIVQHTNRSGAYSLTVINNNGNGTLSIGQNLTNVFVANASNTTTAASMTWADFNGDGYMDLYLGSSYNNNGGVIYYNDGTGQLSTTKSAVEASNATAGYLSVAVDWNGDGQMDIIKLSTYGSSQTATLFTNNGYGSTWTSSQLASGLANVTGVAAVDYNWDGAQDLLVSQQNGKVVLVQNNAEIADGTAMHLHIVDSEGINAYYGNTVNLYNAAGVLVASQIINAQSGIGSNDTSALVSFYGLDPNETYSAEIVKITNGVSDNVTWTGLDAGNGKEGYVLTAEAATGGHSGTITGTGYNDTFIAEDGTYTYNGSGGWNTHSDYDTWSNTGGMDVVDYRNATSGITVDLRLSTAQDTGFGTTRLLNIEGINGSDYDDVITGNSGDNQFEGRGGNDTFNIGSGGHDTLLYKLINASDATGGNGSDVVNGFTVGTWEGTADTDRIDLRDLLSDSGYTGTGSASYVNGVATLDSSAGNIADYIRVVQNGSNTEIQVDLDGTGGQFTPTTLVTLNGVQTDLATLLANHQLLIA
>NZ_CP044107.1|WP_015570577.1|3605524_3606130_+|FMN-dependent-NADH-azoreductase
MSKVLVLKSSILAGYSQSGQLSDYFVEQWREQHSADEITVRDLAANPIPVLDGELVGALRPSDAPLTPRQQEALALSDELIAELQAHDVIVINAPMYNFNIPTQLKNYFDLVARAGVTFRYTENGPEGLVKGKRAVVLTSRGGIHKDTPTDLVAPYLTLFLGFIGITDVNFVFAEGIAYGPEVATKAQTDAKAAIDSLVAA
>NZ_CP044107.1|WP_063135140.1|3606220_3606907_+|RluA-family-pseudouridine-synthase
MSVIIDTFIAPPCHDDIEILWQDEHLLLINKPSGLLSLSGKNPQNLDSVHHRLVQTFPGCTLVHRLDFGTSGLMVIARNKAINAALCHQFSQRAVNKVYTALLCGHVEQDEGTVDAPIAKDPALFPLMTICARTGKPARSRYRVVERIYQDTTMPLTRVELTPETGRTHQLRIHCQRLGHPILGCDLYGGLEWPGAEETPRLMLHASALNFIHPLSGETINARHAAPF
>NZ_CP044107.1|WP_017384500.1|3606914_3607454_-|DUF2058-domain-containing-protein
MTKLTLQEQMLKAGLVSSKKMAKVQRTAKKSRVQAREAREAVEENKKAQLERDKQLSEQQKQAVLAKEFRAQVKQLIEMNRITVAKGNITFNFTDGNLIKKIEVDKQTQTQLINGRLAIARLVINANGDCDYAIIPAVVADKIAQRDADSIVLNSALSQEEQDEDDPYADFKIPDDLMW
>NZ_CP044107.1|WP_023296571.1|3607622_3608597_+|DUF1852-domain-containing-protein
MSQAFTFTLKRSCFDENYNPSENTRTTTNFANLARGEKRQENLRNTLVMINNRFNALASWDNPKADRYAVELEIISVDMNIGGDFTFPAIEILQTTIVDKKTHERIEGIVGNNFSSYVRDYDFSVLLLEHNKDRARFSLPENFGELHGNIFKSFVHSAEYQANFKKAPVICLSVSSKDTYRRTGNHHPVLGYEYQPDGESLTEQYFAKMGLKVRYFMPENSVAPFAFFFTGDLLRDYTNLELIGTISTMETFQKIYRPEIYNANSAAGQCYQPDLNQQDHSLTKIVYDREERSRLAIEQGKYTEERFIKPYKTLLEQWSQHFTL
>NZ_CP044107.1|WP_150326207.1|3608622_3609651_+|methionine-synthase
MKTLLPTSTAGSLPKPTWLAQPETLWSPWKLQDEELLAGKQDALRLSLDEQIRAGIDIVSDGEQTRQHFVTTFIEHLRGVDFENRQTVRIRNRYDASVPTVVDAVARQKPVFVDDAKYLRQLTDKPIKWALPGPMTMIDTLYDAHYKSREKLAWEFAKILNQEARELEAAGVDIIQFDEPAFNVFFDEVNDWGIAALERAIEGLKCETAVHICYGYGIKANTDWKKTLGSEWRQYEEAFPKLQTSKIDIISLECHNSRVPMDLLELIRGKKVMVGAIDVATQTIETPEEVADTLRKALQFVDADKLYPSTNCGMAPLSRQVANGKLKALSAGADIIRRELAR
>NZ_CP044107.1|WP_033486781.1|3609654_3610587_-|LysR-family-transcriptional-regulator
MMGAGHISIRALLIFIDVYETQNFSVVARREGISASQVSRVIHQLEDALGQQLFYRNTRAIMPTESGHLFVRYARAMAGNMEDARRELDERAREPSGTLRINGPVFFGQRHIAPGLPGLLARYPRLSIELTLTDDFIDPHRDAADVIFRIGALTDSSFHARVFGQQFYHLAASPDYLQKHGAPEGPDDLSRHHCLVYRGSSGPNRWLIRRPGEAWVHYPIVPLMTSNNAETLLIAALGGMGVVLFPDWMVSERLKSGELVALLPEMECSINTEPLTIAAIYPNARHPPLNVRAVIDYYIERFGTPLYWQT
>NZ_CP044107.1|WP_003857304.1|3610685_3611120_+|DMT-family-transporter
MHIILILLVIAGGMGLSVEAGLLGPLGAEVGDLWAAFSIFSVGTGLTFLLMLFFSPRNSPSFFAQPSWHLLGGVLGPVYVIILTIATPAIGIAMTMIGILAGQVFKSLIIDHYGLLGTPHRRIDTKRIIALGFIIAALILVAQG
>NZ_CP044107.1|WP_003857305.1|3611124_3611583_+|DMT-family-transporter
MTVIMIILAVIGGATLSIQAAINGQLGSSVGVFKSAFLTFSVGALVTALLIFFFEPKQAVSLMDVPKWQLLGALCGVPYIVIMVLAVQRIGTAVATVAVILGQLAMSMLIDNFGWLNNEAIPFSVSRFGAVVCLSIALFFIYSSSKPQPEED
>NZ_CP044107.1|WP_111962054.1|3611579_3612113_-|DUF3833-domain-containing-protein
MKSFLLMALALTMLVAGCSTEVTEYRQQQPRLDIFTYFQGKTEAWGMVQDRSGKQIRRFHVEIAGDVIGDTLTLNEHFVYDDGEKQQRVWHIRRVGQNRYEGTAGDIEGVATGQAAGNALNWRYSMNVKADGKTWLLHFDDWMYLQDSTRLFNKTEMKKFGVTVATVTLFFTRKEGG
>NZ_CP044107.1|WP_045141532.1|3612591_3613812_-|class-I-SAM-dependent-methyltransferase
MTNPVFALEPDIPRNVRVARWLLFRLLNGLHGGSLTLREGAQTFQFGDASAALHAEVQVLAPGVYWRILTGGSLAAAQAWMDGDWETPHLTPLLELIARNSQILGKLEKGFRLLGKPVERLRHWMRRNSRAQARENIAAHYDLGNAFYAHFLDEHLLYSSALFSGDEQDLTAAQQAKMARLCDQLALTANDHLLEIGTGWGAMAEYAARHYGCRVTTTTLSQEQYHWATARIARAGLQDRVEVLLCDYRDLTGVYDKLVSVEMIEAVGQRYLPTFFRTCQARLRPGGRMAIQAITIQDQRYRDYSKSVDFIQRYIFPGGFLPSITAMNELMTRHTDFVVRNLFDMGPDYARTLAHWRQRFVHAWQEIEKLGFDDRFRRMWLYYLGYCEAGFNARTISVVQLTAERV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP044107_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP044107_2

4182764-4182972

Orphan

I-F

Consensus_repeat	Method
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC	CRT
AGATTTCTAAGCTGCCTGCCCGGCAGTGAAC	PILER-CR
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC	CRISPRCasFinder

3 spacers

The CRISPR arrays of NZ_CP044107_2

>merge|NZ_CP044107|2|4182764-4182972|CRT,PILER-CR,CRISPRCasFinder
TTGTGCCTACGGCCTGTACGGCAGTGAACCGTGACTAAAGGCATGAGCAAATCAGGCAAGATTTCTAAGCTGCCTGCCCGGCAGTGAACAAAACACGCTGGCGCGTGTCGGTGTCGCCGTATTTCTAAGCTGCCTGCCCGGCAGTGAACGAGGGAGAAAGCCAGGAAGTCTGGCAGTTAGATTTCTAAGCTGCCTGCCCGGCAGTGAAC

>NZ_CP044107|2|1|4182764-4182972|CRT
TTGTGCCTACGGCCTGTACGGCAGTGAAC	CGTGACTAAAGGCATGAGCAAATCAGGCAAG
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC	AAAACACGCTGGCGCGTGTCGGTGTCGCCGT
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC	GAGGGAGAAAGCCAGGAAGTCTGGCAGTTAG
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC

>NZ_CP044107|2|1|4182822-4182972|PILER-CR
AGATTTCTAAGCTGCCTGCCCGGCAGTGAAC	AAAACACGCTGGCGCGTGTCGGTGTCGCC
GTATTTCTAAGCTGCCTGCCCGGCAGTGAAC	GAGGGAGAAAGCCAGGAAGTCTGGCAGTT
AGATTTCTAAGCTGCCTGCCCGGCAGTGAAC

>NZ_CP044107|2|2|4182824-4182972|CRISPRCasFinder
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC	AAAACACGCTGGCGCGTGTCGGTGTCGCCGT
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC	GAGGGAGAAAGCCAGGAAGTCTGGCAGTTAG
ATTTCTAAGCTGCCTGCCCGGCAGTGAAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP044107.1\|WP_150391221.1\|4194941_4195427_-\|type-II-secretion-system-protein-M	unknown	unknown	gnl\|CDD\|377391
NZ_CP044107.1\|WP_006809408.1\|4171360_4171582_+\|cold-shock-like-protein-CspD	unknown	unknown	gnl\|CDD\|184960
NZ_CP044107.1\|WP_032647854.1\|4195423_4196557_-\|general-secretion-pathway-protein-GspL	unknown	unknown	gnl\|CDD\|273768
NZ_CP044107.1\|WP_150391220.1\|4191190_4193893_-\|PKD-domain-containing-protein	unknown	unknown	gnl\|CDD\|119365
NZ_CP044107.1\|WP_017384842.1\|4173589_4174705_-\|macrolide-transporter-subunit-MacA	unknown	unknown	gnl\|CDD\|183211
NZ_CP044107.1\|WP_150391218.1\|4186020_4187457_+\|DUF2867-domain-containing-protein	unknown	unknown	gnl\|CDD\|187556
NZ_CP044107.1\|WP_017693707.1\|4174864_4175821_+\|DUF535-domain-containing-protein	unknown	unknown	gnl\|CDD\|377343
NZ_CP044107.1\|WP_032670227.1\|4185008_4186010_+\|low-specificity-L-threonine-aldolase	unknown	unknown	gnl\|CDD\|236710
NZ_CP044107.1\|WP_015570997.1\|4194147_4194945_-\|prepilin-peptidase	unknown	unknown	gnl\|CDD\|224900
NZ_CP044107.1\|WP_017693708.1\|4175817_4177476_-\|ATP-dependent-endonuclease	unknown	unknown	gnl\|CDD\|226121
NZ_CP044107.1\|WP_026080729.1\|4177767_4178463_+\|aquaporin-Z	unknown	unknown	gnl\|CDD\|235453
NZ_CP044107.1\|WP_045339555.1\|4190647_4191088_-\|type-III-secretion-system-invasion-protein-IagB	unknown	unknown	gnl\|CDD\|185228
NZ_CP044107.1\|WP_017384852.1\|4187549_4188563_+\|NAD(P)-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|223528
NZ_CP044107.1\|WP_015570988.1\|4178639_4179539_+\|lysine-exporter-LysO-family-protein	unknown	unknown	gnl\|CDD\|225287
NZ_CP044107.1\|WP_150391219.1\|4188701_4190513_-\|PKD-domain-containing-protein	unknown	unknown	gnl\|CDD\|381595
NZ_CP044107.1\|WP_150391217.1\|4181346_4182315_+\|NADH-oxidoreductase	unknown	unknown	gnl\|CDD\|236735
NZ_CP044107.1\|WP_150391216.1\|4171652_4173593_-\|macrolide-ABC-transporter-ATP-binding-protein/permease-MacB	unknown	unknown	gnl\|CDD\|182528
NZ_CP044107.1\|WP_006174393.1\|4170772_4171093_-\|ATP-dependent-Clp-protease-adapter-ClpS	unknown	unknown	gnl\|CDD\|178809
NZ_CP044107.1\|WP_017384847.1\|4179683_4181336_+\|hydroxylamine-reductase	unknown	unknown	gnl\|CDD\|235391
NZ_CP044107.1\|WP_032653119.1\|4183251_4184970_+\|ubiquinone-dependent-pyruvate-dehydrogenase	unknown	unknown	gnl\|CDD\|181661

Protein	Function_ID	Function_description	E-value
NZ_CP044107.1\|WP_150391221.1\|4194941_4195427_-\|type-II-secretion-system-protein-M	gnl\|CDD\|377391	pfam04612, T2SSM, Type II secretion system (T2SS), protein M. This family of membrane proteins consists of Type II secretion system protein M sequences from several Gram-negative (diderm) bacteria. The precise function of these proteins is unknown, though in Vibrio cholerae, the T2SM (EpsM) protein interacts with the T2SL (EpsL) protein, and also forms homodimers.	2.29073e-29
NZ_CP044107.1\|WP_006809408.1\|4171360_4171582_+\|cold-shock-like-protein-CspD	gnl\|CDD\|184960	PRK14998, PRK14998, cold shock-like protein CspD; Provisional.	9.14248e-48
NZ_CP044107.1\|WP_032647854.1\|4195423_4196557_-\|general-secretion-pathway-protein-GspL	gnl\|CDD\|273768	TIGR01709, Type_II_secretion_system_protein_L, type II secretion system protein L. This model represents GspL, protein L of the main terminal branch of the general secretion pathway, also called type II secretion. It transports folded proteins across the bacterial outer membrane and is widely distributed in Gram-negative pathogens. [Protein fate, Protein and peptide secretion and trafficking].	1.2395e-39
NZ_CP044107.1\|WP_150391220.1\|4191190_4193893_-\|PKD-domain-containing-protein	gnl\|CDD\|119365	cd06548, GH18_chitinase, The GH18 (glycosyl hydrolases, family 18) type II chitinases hydrolyze chitin, an abundant polymer of N-acetylglucosamine and have been identified in bacteria, fungi, insects, plants, viruses, and protozoan parasites. The structure of this domain is an eight-stranded alpha/beta barrel with a pronounced active-site cleft at the C-terminal end of the beta-barrel.	1.51769e-124
NZ_CP044107.1\|WP_017384842.1\|4173589_4174705_-\|macrolide-transporter-subunit-MacA	gnl\|CDD\|183211	PRK11578, PRK11578, macrolide transporter subunit MacA; Provisional.	0
NZ_CP044107.1\|WP_150391218.1\|4186020_4187457_+\|DUF2867-domain-containing-protein	gnl\|CDD\|187556	cd05245, SDR_a2, atypical (a) SDRs, subgroup 2. This subgroup contains atypical SDRs, one member is identified as Escherichia coli protein ybjT, function unknown. Atypical SDRs are distinct from classical SDRs. Members of this subgroup have a glycine-rich NAD(P)-binding motif consensus that generally matches the extended SDRs, TGXXGXXG, but lacks the characteristic active site residues of the SDRs. This subgroup has basic residues (HXXXR) in place of the active site motif YXXXK, these may have a catalytic role. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Atypical SDRs include biliverdin IX beta reductase (BVR-B,aka flavin reductase), NMRa (a negative transcriptional regulator of various fungi), progesterone 5-beta-reductase like proteins, phenylcoumaran benzylic ether and pinoresinol-lariciresinol reductases, phenylpropene synthases, eugenol synthase, triphenylmethane reductase, isoflavone reductases, and others. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. In addition to the Rossmann fold core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	6.19653e-141
NZ_CP044107.1\|WP_017693707.1\|4174864_4175821_+\|DUF535-domain-containing-protein	gnl\|CDD\|377343	pfam04393, DUF535, Protein of unknown function (DUF535). Family member Shigella flexneri VirK is a virulence protein required for the expression, or correct membrane localization of IcsA (VirG) on the bacterial cell surface,. This family also includes Pasteurella haemolytica lapB, which is thought to be membrane-associated.	3.82706e-128
NZ_CP044107.1\|WP_032670227.1\|4185008_4186010_+\|low-specificity-L-threonine-aldolase	gnl\|CDD\|236710	PRK10534, PRK10534, L-threonine aldolase; Provisional.	0
NZ_CP044107.1\|WP_015570997.1\|4194147_4194945_-\|prepilin-peptidase	gnl\|CDD\|224900	COG1989, PulO, Type II secretory pathway, prepilin signal peptidase PulO and related peptidases [Cell motility and secretion / Posttranslational modification, protein turnover, chaperones / Intracellular trafficking and secretion].	1.59401e-41
NZ_CP044107.1\|WP_017693708.1\|4175817_4177476_-\|ATP-dependent-endonuclease	gnl\|CDD\|226121	COG3593, COG3593, Predicted ATP-dependent endonuclease of the OLD family [DNA replication, recombination, and repair].	0
NZ_CP044107.1\|WP_026080729.1\|4177767_4178463_+\|aquaporin-Z	gnl\|CDD\|235453	PRK05420, PRK05420, aquaporin Z; Provisional.	1.82782e-146
NZ_CP044107.1\|WP_045339555.1\|4190647_4191088_-\|type-III-secretion-system-invasion-protein-IagB	gnl\|CDD\|185228	PRK15328, PRK15328, type III secretion system invasion protein IagB.	3.91287e-87
NZ_CP044107.1\|WP_017384852.1\|4187549_4188563_+\|NAD(P)-dependent-oxidoreductase	gnl\|CDD\|223528	COG0451, WcaG, Nucleoside-diphosphate-sugar epimerases [Cell envelope biogenesis, outer membrane / Carbohydrate transport and metabolism].	1.05058e-52
NZ_CP044107.1\|WP_015570988.1\|4178639_4179539_+\|lysine-exporter-LysO-family-protein	gnl\|CDD\|225287	COG2431, COG2431, Predicted membrane protein [Function unknown].	2.69399e-117
NZ_CP044107.1\|WP_150391219.1\|4188701_4190513_-\|PKD-domain-containing-protein	gnl\|CDD\|381595	cd00325, chitinase_GH19, Glycoside hydrolase family 19, chitinase domain. Chitinases are enzymes that catalyze the hydrolysis of the beta-1,4-N-acetyl-D-glucosamine linkages in chitin polymers. Glycoside hydrolase family 19 chitinases are found primarily in plants (classes I, III, and IV), but some are found in bacteria. Class I and II chitinases are similar in their catalytic domains. Class I chitinases have an N-terminal cysteine-rich, chitin-binding domain which is separated from the catalytic domain by a proline and glycine-rich hinge region. Class II chitinases lack both the chitin-binding domain and the hinge region. Class IV chitinases are similar to class I chitinases, but they are smaller in size due to certain deletions. Despite lacking any significant sequence homology with lysozymes, structural analysis reveals that family 19 chitinases, together with family 46 chitosanases, are similar to several lysozymes including those from T4-phage and from goose. The structures reveal that the different enzyme groups arose from a common ancestor glycohydrolase antecedent to the prokaryotic/eukaryotic divergence.	3.14704e-72
NZ_CP044107.1\|WP_150391217.1\|4181346_4182315_+\|NADH-oxidoreductase	gnl\|CDD\|236735	PRK10684, PRK10684, HCP oxidoreductase, NADH-dependent; Provisional.	0
NZ_CP044107.1\|WP_150391216.1\|4171652_4173593_-\|macrolide-ABC-transporter-ATP-binding-protein/permease-MacB	gnl\|CDD\|182528	PRK10535, PRK10535, macrolide ABC transporter ATP-binding protein/permease MacB.	0
NZ_CP044107.1\|WP_006174393.1\|4170772_4171093_-\|ATP-dependent-Clp-protease-adapter-ClpS	gnl\|CDD\|178809	PRK00033, clpS, ATP-dependent Clp protease adaptor protein ClpS; Reviewed.	9.90991e-48
NZ_CP044107.1\|WP_017384847.1\|4179683_4181336_+\|hydroxylamine-reductase	gnl\|CDD\|235391	PRK05290, PRK05290, hybrid cluster protein; Provisional.	0
NZ_CP044107.1\|WP_032653119.1\|4183251_4184970_+\|ubiquinone-dependent-pyruvate-dehydrogenase	gnl\|CDD\|181661	PRK09124, PRK09124, ubiquinone-dependent pyruvate dehydrogenase.	0

>NZ_CP044107.1|WP_150391217.1|4181346_4182315_+|NADH-oxidoreductase
MTMPTSQCPWRMQVHHIHQETPDVWTLSLLCHDYYPYRAGQYALVSVRNSADTLRAYTISSTPGVSEYITLTVRRIDDGAGSEWLTRDVKRGDYIWLSDAQGEFTCDDKTEDKFLLLAAGCGVTPIMSMRRWLAKYRPQADVQVIFSVRSPEDVIFAEEWRNYPVTLVAEHNATHGFVAGRLSRELLQSVPDIANRIVMTCGPAPYMEIVEKEVKALGVTRFFKEQFFTPVAEAATSGMKFTKLQPAQTFFGRVGTTLLEALESNNVPVAAACRAGVCGYCKTKVVSGEYTVTSTMTLTDAEIAEGYVLACSCHPQGDLVLA
>NZ_CP044107.1|WP_017384847.1|4179683_4181336_+|hydroxylamine-reductase
MFCVQCEQTIRTPAGNGCSYAQGMCGKTAETSDLQDLLIAALQGLSAWAFKAREYGIVDHYVDSFAPRAFFSTLTNVNFDSPRIVGYAREAIALREALKAQCLNADASARVDNPMAELQLVSDDLGELQRQAAEFTPNKDKAAIGENILGLRLLCLYGLKGAAAYMEHAHVLGQYDNAIYAQYHKIMAWLGTWPSDMNALLECSMEIGQMNFKVMSILDAGETSTYGHPTPTQVNVKATEGKCILISGHDLKDLYNLLKQTEGTGVNVYTHGEMLPAHGYPELRKFKHLIGNYGSGWQNQQVEFARFPGPIVMTSNCIIDPTVGAYDDRIWTRSIVGWPGVSHLEGDDFGPVIAQAQQMAGFPYSEIPHLITVGFGRETLLGAADSLIDLVSREKLRHIFLIGGCDGARGERNYFTDFATRVPEDCLILTLACGKYRFNKLDFGNIEGLPRLVDAGQCNDAYSAIILAVTLAEKLGCGVNDLPLSLVLSWFEQKAIVILLTLLSLGVTNIVTGPTAPGFLTPDLLAILNEKFGLRSVTNVEDDMKQLLSA
>NZ_CP044107.1|WP_015570988.1|4178639_4179539_+|lysine-exporter-LysO-family-protein
MFSGLLIILLPLIVGYLIPLRHESALKLINRFLSWIVYVILFFMGISLAFLDNLATNLLSILHYSAVTVVVILLCNIAALFWLERTIPWKNHHHQEKLPSRIAMALESLKLCGVVVLGFLLGLTGWAFLQHATEASEYTLIFLLFLIGIQLRNNGMTLKQIVLNRRGMMVAVIVVASSLAGGVINAFILDLPLKTSLAMASGFGWYSLSGILLTESFGPVIGSAAFFNDLARELIAIMLIPGLVRRSRSTALGLCGATSMDFTLPVLQRSGGLEMVPAAIVHGFILSLLVPILMAFFSA
>NZ_CP044107.1|WP_026080729.1|4177767_4178463_+|aquaporin-Z
MFRKLAAECFGTFWLVFGGCGSAVLAAAFPELGIGFVGVALAFGLTVLTMAFAVGHISGGHFNPAVTLGLWAGGRFPAKDIIGYIIAQVIGGIIAAAVLYVIASGKAGFDAAASGFASNGFGEHSPGGYSMLSAIVIEIVLTAGFLLVIHGATDKYAPAGFAPIAIGLALTLIHLISIPVTNTSVNPARSTAVAIFQGGWALEQLWLFWVMPIIGGILGGVLYRTLLEKRD
>NZ_CP044107.1|WP_017693708.1|4175817_4177476_-|ATP-dependent-endonuclease
MLLERVEIVGFRGINRLSLQLEQNNVLIGENAWGKSSLLDALTLLLSPEENLYHFVHDDFWFPPGDVNGREKHLHIILTFRESEPGRHRVRRFRPMSPCWVPCEDGFQRIFYRLEGEMAQNDGVLTLREFLDEKGNPIPLDNIDELARHLIRLSPVLRLRDARFMRRIRNGTVPNMPEVEVTARELDFLARELVSRPQNLTDGQIRQGLSAMVQLLEHYFSEQGTGQARHRLMRRRSHDEQRSWRYLDIINRMIDRPGGRTHRVILLGLFSTLLQAKGTVRLDRDARPLLLVEDPETRLHPIMLSVAWHLLNLLPLQRVTTTNSGELLSLTPVEYVCRLVRESSRVTAYRLGPGGLNAEDGRRIAFHIRFNRASSLFARCWLLVEGETETWVINELARQCGHHFDAEGIKVIEFAQSGLKPLIKFARRMGIEWHVLVDGDEAGKKYAATVRSLLNNDREEEREHLTALPAMDMEHFMYRQGFDDVFHRVAMIPVDVPMNMRRVIAKAIHRSSKPDLAIEVATEAGRRGVESVPTLLRKMFSRVLWLARGRAD
>NZ_CP044107.1|WP_017693707.1|4174864_4175821_+|DUF535-domain-containing-protein
MSSIVDTPYSTLPQPKSGWQLFKSLASGSLTPGLAWQNPAYRRKFMLRSLATPFTTARLLGNLAKQPRLMQILRVQPGLPCRLHRPWLTVNMGRQTTLDALNDHYEMMSRHLPASLLNGYLSSQGITLVTLTGKEEQQFSVRLSADAFLDKEGEATLTFCDHQNTVLAELTFTLCTYQGKPTLFIGGMQGAKAHVPHEHIQLATKACHGLFPKRLLVEAVMTLAGAFPVEQILAVSNATHIYRSWRYRKKKEGKLLADYDSFWRSLGGQQQDNGNFALPLTMPRKPMEEIASKKRSEYRRRYALLDSLIQQVSQATAR
>NZ_CP044107.1|WP_017384842.1|4173589_4174705_-|macrolide-transporter-subunit-MacA
MNLKGKRRKLFLLLAVVVLAGGFWLWKVLNAPVPQYQTLIVRPGELQQNVLATGKLDALRKVDVGAQVSGQLKTLSVEIGDKVKKGQLLGVIDPEQAQNQIREVEATLMELRAQRAQAQAERNLAQVTLTRQQALAKTQAISKQDLDTAATELAVKQAQIGTIDAQIKRNQASLDTAKTNLDYTQIVAPMAGEVTQITTLQGQTVIAAQQAPNILTLADMSTMLVKAQVSEADVIHLKPGQKAWFTVLGDPQTRYEGVLKDILPTPEKVNDAIFYYARFEVPNPQGVLRLDMTAQVHIQLTGVKNVLTVPLSALGESAGDNRYKVKVLRNGETREREVVIGARNDTDVVVVKGLEEGEEVVTSETLPGAAQ
>NZ_CP044107.1|WP_150391216.1|4171652_4173593_-|macrolide-ABC-transporter-ATP-binding-protein/permease-MacB
MTALLELNDIRRNYPSGDGPVEVLKGISLRVEAGEMVAIVGASGSGKSTLMNILGCLDKPTSGTYHVAGTDVSTLDGDALAKLRREHFGFIFQRYHLLSHLSAAQNVEVPAVYAGVERKKRLERAKALLTRLGLAERVDYQPSQLSGGQQQRVSIARALMNGGQVILADEPTGALDSRSGEEVMAILHQLRDQGHTVIIVTHDPQVAAQAERIIEIHDGELVSNPPPRQSRAAAPKEALPASTGWGQFSSGFREALTMAWLAMAANKMRTLLTMLGIIIGIASVVSIVVVGDAAKQLVLADIRAIGTNTIDVYPGKDFGDDEPQYQQALKYDDLAAIQKQPWVNSATPAVSQNLRLRYGNIDVAASANGVSGDYFNVYGMTFSEGATFNAEQLAGRAQVVVLDANSRRQLFPNKTRVVGEVILVGNMPATVIGVAEEKQSMFGSSKILRVWLPYSTISGRIMGQSWLNSITVRVKEGYDSALAEQQLERLLTLRHGKKDFFTWNMDGLLKTAEKTTRTLQLFLTLVAVISLVVGGIGVMNIMLVSVTERTREIGIRMAVGARASDVLQQFLIEAVLVCLVGGAMGIALSMMIAFALQLFLPGWEIGFSPVAILTAFLCSTFTGILFGWLPARNAARLDPVDALARE
>NZ_CP044107.1|WP_006809408.1|4171360_4171582_+|cold-shock-like-protein-CspD
MEMGTVKWFNNAKGFGFICPEGGGEDIFAHYSTIQMDGYRTLKAGQSVRFDVHQGPKGNHASLIVPVEAETVA
>NZ_CP044107.1|WP_006174393.1|4170772_4171093_-|ATP-dependent-Clp-protease-adapter-ClpS
MGKTNDWLDFDQLAEDKVRDALKPPSMYKVMLMNDDYTPMEFVIDVLQKFFSYDVERATQLMLTVHYRGKAICGIFTAEVAETKVAMVNDYARENEHPLLCTLEKA
>NZ_CP044107.1|WP_032653119.1|4183251_4184970_+|ubiquinone-dependent-pyruvate-dehydrogenase
MKQTVAAYIAKTLEQAGVKRIWGVTGDSLNGLSDSLNKMKTIEWMPTRHEEVAAFAAGAEAQLTGELAVCAGSCGPGNLHLINGLFDCHRNHVPVLAIAAHIPSSEIGSGYFQETHPQELFRECSHYCELVSSPEQIPQVLAIAMRKAILNRGVSVVVLPGDVALKAAPETATTHWYSAPQPTITPADEELKKLAQLLRYSSNIALMCGSGCAGAHKELVEFAGKLKAPVVHALRGKEHVEYDNPYDVGMTGLIGFSSGFHTMMNADTLILLGTQFPYRAFYPTDAKIIQIDINPGSIGAHSKVDMALIGDIKSTLAALLPLLEEKTDRKFLDKALSDYRDARKGLDDLAKPSEKAIHPQYLAQQISHFADDDAIFTCDVGTPTVWAARYLKMNGKRRLLGSFNHGSMANAMPQALGAKATAPERQVVAMCGDGGFSMLMGDFLSVAQMKLPLKIVVFNNSVLGFVAMEMKAGGYLTDGTELHDTNFARIAEACGITGIRVEKASEVDDALQRAFAIDGPVLVDVVVAKEELAIPPQIKLEQAKGFSLYMLRAIISGRGDEVIELAKTNWLR
>NZ_CP044107.1|WP_032670227.1|4185008_4186010_+|low-specificity-L-threonine-aldolase
MIDLRSDTVTRPSRAMLEEMMAAPVGDDVYGDDPTVNELQRYAAELSGKEAALFLPTGTQANLVALLSHCERGEEYIVGQGAHNYLYEAGGAAVLGSIQPQPIDAAPDGTLPLDKVAAKIKADDIHFARTKLLSLENTHNGKVLPREYLKAAWDFTRERKLGLHVDGARIFNAVVEYGCELKAITQYCDSFTICLSKGLGTPVGSLLVGSADYIRRANRWRKMTGGGMRQAGILAAAGLYALKNNVSRLKNDHDNAAWMAAQLREIGADVMRHDTNMLFVRVGDEHAAALGDFMKARGVLINASPVVRLVMHLDVNREQLTEVVKHWQAFLQR
>NZ_CP044107.1|WP_150391218.1|4186020_4187457_+|DUF2867-domain-containing-protein
MPQRILVLGASGYIGQHLTTALSQQGHQVLAAARNTERLQKLHLPGVTCHNVDLNWPKALPALLEGVDTLYYLVHSMGEGGDFIAHERQVAMNVRDALRQTPVKQVIFLSSLQAPEHEQSDHLRARQLTAETLRSARIPVTELRAGIIVGAGSAAFEVMRDMVYNLPVLTPPRWVRSRTTPIALENLLHYLVALLDHPAEQHRVLEAAGPEVLSYQAQFEHFMRVSGRHRWLIPIPFPTRWISVWFLNVITSVPPTTAKALIQGLKHDLLADDLALRALIPQELIRFDDAVRNTLKEEEKLVNSSDWGYDAQAFARWRPEYGYYPKQAGCTVKTTASLAALWEVVNQIGGKERYFFGNILWQTRGALDLLVGHRLAKGRPAHPWLKVGDTVDSWKVIIVEPEKQLALLFGMKAPGLGRLCFTLKDNGDHRELDVRAWWHPHGMPGLFYWLLMIPAHLFIFRGMAKRIAQLAEEKRENN
>NZ_CP044107.1|WP_017384852.1|4187549_4188563_+|NAD(P)-dependent-oxidoreductase
MKVLVTGATSGLGRNAVEFLRNKGISVRATGRNEAMGKLLQKMGAEFVHADLTELVSSQAKVMLAGIDTLWHCSSFTSPWGTQEAFDLANVRATRRLGEWAVAWGVRNFIHISSPSLYFDYHHHRDIQEDFRPARFACEFARSKAAGEEVIDLLAQSNPHTRFTVLRPQSLFGPHDKVFIPRLAQMMHHYGSVLLPRGGDALVDMTYYENAVHAMWLASQPECDKLVSGRAYNITNGEPCTLRSIVQRLIDELKIDCRIRSVPYPMLDMIARSMERFGSKSAKEPALTHYGVSKLNFDFTLDISRAENELGYKPIVSLDEGIVRTAAWLRDHGKLHR
>NZ_CP044107.1|WP_150391219.1|4188701_4190513_-|PKD-domain-containing-protein
MNKRTLLSVLIAGACVAPLMAQAANLKETSSEPYTIKDSDLAKKEKELTDFPLMASVKETIQTLDNAQVELIEPGRAANPDNVKRVEGIVKASDWEYLFPLRAQAYTYSNFLKAVGKFPALCKTYNDGRDSDAICRKELATMFAHFAQETGGHESWRPEAEWRQALVHVREMGWSEGQKGGYNGECNPDVWQGQTWPCGKDKDGDFLSYFGRGAKQLSYNYNYGPFSEAMYGDVRTLLDKPELVADTWLNLASAIFFFAYPQPPKPSMLQVIDGTWQPNDHDKANGLVPGFGVTTQIINGGVECGGPTEIAQSQNRIKYYKEFANYLKVPVPANEVLGCANMKQFDEGGAGALKIYWEQDWGWSADTPDGKTYSCQLVGYQTPFSAFKDGDYSKCVQHFFNVKIVNDDGSSVTPDETPVTPTPTPSGDETPAPTPTPDETPVVVNHAPVAQIAGPIGAVEAGAQVSLSAEGSTDPDGNTLTYTWRSQDGQTVTGQDKAVVTFTAPESATAQQYEVSLTVSDGELSSTTSYLLNVKAKAATPSGEDTSYPAWSANSKYNAGDIVNNHGKLFQCKPFPYSGWCNNAPTYYEPGAGLAWAEAWTAL
>NZ_CP044107.1|WP_045339555.1|4190647_4191088_-|type-III-secretion-system-invasion-protein-IagB
MKKLILLLLIISQSALANCWNKAAHYYHVDPYLLYAIANVESGMNPYAIGQNRDGTRDVGLMQINSSHFTALESRGIDEYRLITEPCTSIMVGASILAGMIRVYGYNWEAVGAYNAGLKKENYPQRMKYAHKVWAKYQQLKLAARY
>NZ_CP044107.1|WP_150391220.1|4191190_4193893_-|PKD-domain-containing-protein
MKFMKPKYLALFIAAATSSAFAAAPGAPTIGYGNDKFALVEVDQAAQDYNNLVKVHNDGVDVKVEWNVWSGDAPTSAKVLLDGQTVWTGAAGATGSATFKVKKGGRYQEQVEVCNASGCAKSASKLIIVADTDGSHLLPLNTSLKENNKAFAKHTDKVVAAYFPEWGVYDRNFPVDKIPAANLNHILYGFIPICGGDGINDGLKTIEGGNSFRVLQNDCKGRPDYTVAIHDPWAALQKPQAGVSGWDDPYKGNFGQLMALKKAHPDLKVLPSIGGWTLSDPFFHMGDPAIRARFVSSVKEFLQTWKFFDGVDIDWEFPGGGGVSENLGNPQQDKATYTALMHDLRTMLNELSAQTGRTYELTSAIGAGRDKIEDVDYTAAQQYLDHIFLMSYDFYGGWSNTVLGHQAALRAPAWRPDTDYTTENGVNALLSQGVQPGKIVVGAGMYGRGWTGVHGYTGNNPFTGTATGMVKGTWEPGVVDYRQIVNEYKGKPGWEYGYDADAEAPYVFNKTTGDLITYEDARSTTAKGKYVLANKLGGLFAWSIDSDTGDILNAMNESLLGGDATPVDPEVTNHAPIASSADQDVSGPVTVTLDGSASSDPDGDAITYKWTQVSGPSVTITNSTKAKATFNVAAATSDQTMVFRLTVTDAKGLSNAIDIQVVNKAPKANQAPVLNPMEAITLESGETYALHAQAADPDGDALTYAWSVPADMHATGTDSANVNITAPEVSSTSTYTLSVVVSDGKTSVQSNVQVTVNPKAAPAPVPDDEDTNPADDVTPPADDVTPPSDKGSCDAPVDANASKYAAWESSKIYNGGDTVSFDHLVWKAKYWTQGNQPGFGVDAWELVSNVKMNWRSDLVYNGGDTTTYEGNVYRAKWWTRGDNPANSDVWVKEGASTDCK
>NZ_CP044107.1|WP_015570997.1|4194147_4194945_-|prepilin-peptidase
MNTFSLMRDACPVGFPIMSAILGGIVGSFLGVVAERVPGMVMDEEGSGNLLFPASHCPVCQHALAAWENIPLLSWLLLRGRCHQCGSAIPLRLFLVELISALFFGITAWCMPDVQALFSLWLLAAFLLPLAMIDWQHQLLPDCLTQPLLWAGLVLHAFDHTLPLRDALFGAVAGYLSLWLLYWAFRLITGREGLGYGDFKLLAALGAWCGWQALPSIELAAALSGIVGYFAVNNLNKNNLTISFGPYLAFAGIGVFMSQQFAFTF
>NZ_CP044107.1|WP_150391221.1|4194941_4195427_-|type-II-secretion-system-protein-M
MKERIAQLKSRYQNYSTREKIILKICAVAIVGAVVYYTGVIPLDNMIQNSKSTIKRQKETLNWMRSEIDKNHLQVQIVKTNNPRTVVENSAHEINLSLTDMRQEGQTLSFVLNRVNVYELRSWLREINQTSGVRLQKINLTPVDHLSDVKAQVQLTWSKNA
>NZ_CP044107.1|WP_032647854.1|4195423_4196557_-|general-secretion-pathway-protein-GspL
MKQVLFVRPDSREGGKIMWCESGSERVEVVDSLEMLAEHPLATRVCLLLPASDMIFRHFTLPKKVASQAMAFSWMAEETLIGDVDNLHWTVLHKKGADVDAVAIDADRLRAALTRCQEAGLNVIQALPDAWLLPVTTGGSTLVAQDDSYWLRLSPHVAGEMEATLLPLLMQKAGVGEVWCYGDAPAKVHVDVQHAWQHPLALIQPQWQTCRVNLLHGEFSLKAGHGRAAKSMKAAMVAVGVLSVALLLGPRIAMAWMLVQQENRVQEEIVQVYQHHFPSMRQQTNIKYHFGQSLKKQSKGFFLQLDELENARQSVPAMEIELLEYDAQQNTLTLSVSAQNQPALQAFVNQTSENFDFTLQPVSTTEPYTAMIAGKHK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK972693	Salmonella phage SI23, complete genome	6397-6427	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK770415	Salmonella phage SF11, complete genome	15202-15232	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK972694	Salmonella phage SE22, complete genome	27485-27515	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK770414	Salmonella phage SE16, complete genome	19098-19128	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	NC_013059	Salmonella phage c341, complete genome	37506-37536	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK972686	Salmonella phage SF3, complete genome	38552-38582	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK972685	Salmonella phage SE10, complete genome	39771-39801	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK972687	Salmonella phage SE1 (in:P22virus), complete genome	30045-30075	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	FJ000341	Salmonella phage g341c, complete genome	37506-37536	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	EU570103	Salmonella phage epsilon34, complete genome	39547-39577	2	0.935
NZ_CP044107_2	2.1\|4182793\|31\|NZ_CP044107\|CRT	4182793-4182823	31	MK972692	Salmonella phage SE21, complete genome	26621-26651	2	0.935
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	JF974302	Vibrio phage VBpm10, * SEQUENCING IN PROGRESS *, 8 unordered pieces	21037-21067	6	0.806
NZ_CP044107_2	2.4\|4182853\|29\|NZ_CP044107\|PILER-CR	4182853-4182881	29	NZ_AP023151	Klebsiella pneumoniae strain SMKP03 plasmid pSMKP03S, complete sequence	22220-22248	6	0.793
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592513	Vibrio phage 1.142.O._10N.261.49.E11, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592412	Vibrio phage 1.028.O._10N.286.45.B6, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592527	Vibrio phage 1.159.O._10N.261.46.F12, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592588	Vibrio phage 1.217.O._10N.261.45.A1, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592589	Vibrio phage 1.219.O._10N.261.45.E2, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592524	Vibrio phage 1.156.O._10N.261.45.A6, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592669	Vibrio phage 2.159.A._10N.261.46.F12, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592670	Vibrio phage 2.159.B._10N.261.46.F12, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	MG592507	Vibrio phage 1.136.O._10N.261.45.E11, partial genome	26631-26661	7	0.774
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	NZ_CP043441	Cupriavidus campinensis strain MJ1 plasmid unnamed1, complete sequence	1534665-1534695	7	0.774
NZ_CP044107_2	2.4\|4182853\|29\|NZ_CP044107\|PILER-CR	4182853-4182881	29	NC_015184	Agrobacterium sp. H13-3 plasmid pAspH13-3a, complete sequence	62536-62564	7	0.759
NZ_CP044107_2	2.5\|4182913\|29\|NZ_CP044107\|PILER-CR	4182913-4182941	29	NC_023006	Pseudomonas phage PPpW-3 DNA, complete sequence	36335-36363	7	0.759
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	NC_015184	Agrobacterium sp. H13-3 plasmid pAspH13-3a, complete sequence	62534-62564	8	0.742
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	NZ_CP035511	Haematobacter massiliensis strain OT1 plasmid pOT1-1, complete sequence	283146-283176	8	0.742
NZ_CP044107_2	2.3\|4182913\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182913-4182943	31	NC_023006	Pseudomonas phage PPpW-3 DNA, complete sequence	36335-36365	8	0.742
NZ_CP044107_2	2.4\|4182853\|29\|NZ_CP044107\|PILER-CR	4182853-4182881	29	NZ_CP054621	Azospirillum oryzae strain KACC 14407 plasmid unnamed6, complete sequence	714186-714214	8	0.724
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	NZ_CP054620	Azospirillum oryzae strain KACC 14407 plasmid unnamed5, complete sequence	22328-22358	9	0.71
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	NC_013859	Azospirillum sp. B510 plasmid pAB510e, complete sequence	475099-475129	9	0.71
NZ_CP044107_2	2.2\|4182853\|31\|NZ_CP044107\|CRT,CRISPRCasFinder	4182853-4182883	31	NZ_CP054621	Azospirillum oryzae strain KACC 14407 plasmid unnamed6, complete sequence	714186-714216	10	0.677
NZ_CP044107_1	1.1\|3601318\|58\|NZ_CP044107\|CRISPRCasFinder	3601318-3601375	58	NZ_LN868946	Salmonella enterica subsp. enterica serovar Senftenberg strain NCTC10384 plasmid 4, complete sequence	15954-16011	12	0.793

1. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK972693 (Salmonella phage SI23, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

2. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK770415 (Salmonella phage SF11, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

3. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK972694 (Salmonella phage SE22, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

4. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK770414 (Salmonella phage SE16, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

5. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to NC_013059 (Salmonella phage c341, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

6. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK972686 (Salmonella phage SF3, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

7. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK972685 (Salmonella phage SE10, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

8. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK972687 (Salmonella phage SE1 (in:P22virus), complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

9. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to FJ000341 (Salmonella phage g341c, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

10. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to EU570103 (Salmonella phage epsilon34, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

11. spacer 2.1|4182793|31|NZ_CP044107|CRT matches to MK972692 (Salmonella phage SE21, complete genome) position: , mismatch: 2, identity: 0.935

cgtgactaaaggcatgagcaaatcaggcaag	CRISPR spacer
cgtgactaatggcatgagcaaatcaggcagg	Protospacer
********* *******************.*

12. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to JF974302 (Vibrio phage VBpm10, *** SEQUENCING IN PROGRESS ***, 8 unordered pieces) position: , mismatch: 6, identity: 0.806

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
acaatgctctggcgcgtttcagtgtcgccgt	Protospacer
* **..* ********* **.**********

13. spacer 2.4|4182853|29|NZ_CP044107|PILER-CR matches to NZ_AP023151 (Klebsiella pneumoniae strain SMKP03 plasmid pSMKP03S, complete sequence) position: , mismatch: 6, identity: 0.793

aaaacacgctggcgcgtgtcggtgtcgcc	CRISPR spacer
aaaacacgctggcgcgtgtcgtgcgcttc	Protospacer
*********************    * .*

14. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592513 (Vibrio phage 1.142.O._10N.261.49.E11, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

15. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592412 (Vibrio phage 1.028.O._10N.286.45.B6, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

16. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592527 (Vibrio phage 1.159.O._10N.261.46.F12, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

17. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592588 (Vibrio phage 1.217.O._10N.261.45.A1, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

18. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592589 (Vibrio phage 1.219.O._10N.261.45.E2, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

19. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592524 (Vibrio phage 1.156.O._10N.261.45.A6, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

20. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592669 (Vibrio phage 2.159.A._10N.261.46.F12, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

21. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592670 (Vibrio phage 2.159.B._10N.261.46.F12, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

22. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to MG592507 (Vibrio phage 1.136.O._10N.261.45.E11, partial genome) position: , mismatch: 7, identity: 0.774

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
actatgctctggcgcgtttcagtgtcgccgt	Protospacer
*  *..* ********* **.**********

23. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to NZ_CP043441 (Cupriavidus campinensis strain MJ1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.774

aaaacacg----ctggcgcgtgtcggtgtcgccgt	CRISPR spacer
----cccggcacctggcgcgtgacggtctcgccgt	Protospacer
    * **    ********** **** *******

24. spacer 2.4|4182853|29|NZ_CP044107|PILER-CR matches to NC_015184 (Agrobacterium sp. H13-3 plasmid pAspH13-3a, complete sequence) position: , mismatch: 7, identity: 0.759

aaaacacgctggcgcgtgtcggtgtcgcc	CRISPR spacer
tgagatcgcgggcgagtgtcggtgtcgcc	Protospacer
 .*.  *** **** **************

25. spacer 2.5|4182913|29|NZ_CP044107|PILER-CR matches to NC_023006 (Pseudomonas phage PPpW-3 DNA, complete sequence) position: , mismatch: 7, identity: 0.759

gagggagaaagccaggaagtctggcagtt	CRISPR spacer
cggcgagaaggccaggaagtcgggcagca	Protospacer
 .* *****.*********** *****.

26. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to NC_015184 (Agrobacterium sp. H13-3 plasmid pAspH13-3a, complete sequence) position: , mismatch: 8, identity: 0.742

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
tgagatcgcgggcgagtgtcggtgtcgccgc	Protospacer
 .*.  *** **** ***************.

27. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to NZ_CP035511 (Haematobacter massiliensis strain OT1 plasmid pOT1-1, complete sequence) position: , mismatch: 8, identity: 0.742

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
tagaactgctggcgcgtgtcggcatcgccga	Protospacer
 *.*  .***************..******

28. spacer 2.3|4182913|31|NZ_CP044107|CRT,CRISPRCasFinder matches to NC_023006 (Pseudomonas phage PPpW-3 DNA, complete sequence) position: , mismatch: 8, identity: 0.742

gagggagaaagccaggaagtctggcagttag	CRISPR spacer
cggcgagaaggccaggaagtcgggcagcaaa	Protospacer
 .* *****.*********** *****. *.

29. spacer 2.4|4182853|29|NZ_CP044107|PILER-CR matches to NZ_CP054621 (Azospirillum oryzae strain KACC 14407 plasmid unnamed6, complete sequence) position: , mismatch: 8, identity: 0.724

aaaacacgctggcgcgtgtcggtgtcgcc	CRISPR spacer
ctgcggcgctggcgcgggtcggagtcgcc	Protospacer
  .  .********** ***** ******

30. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to NZ_CP054620 (Azospirillum oryzae strain KACC 14407 plasmid unnamed5, complete sequence) position: , mismatch: 9, identity: 0.71

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
atcctgggctgccgcgtgtcgatgtcgccgg	Protospacer
*   .. **** *********.********

31. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to NC_013859 (Azospirillum sp. B510 plasmid pAB510e, complete sequence) position: , mismatch: 9, identity: 0.71

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
atcctgggctgccgggtgtcggtgtcgccgg	Protospacer
*   .. **** ** ***************

32. spacer 2.2|4182853|31|NZ_CP044107|CRT,CRISPRCasFinder matches to NZ_CP054621 (Azospirillum oryzae strain KACC 14407 plasmid unnamed6, complete sequence) position: , mismatch: 10, identity: 0.677

aaaacacgctggcgcgtgtcggtgtcgccgt	CRISPR spacer
ctgcggcgctggcgcgggtcggagtcgcccc	Protospacer
  .  .********** ***** ****** .

33. spacer 1.1|3601318|58|NZ_CP044107|CRISPRCasFinder matches to NZ_LN868946 (Salmonella enterica subsp. enterica serovar Senftenberg strain NCTC10384 plasmid 4, complete sequence) position: , mismatch: 12, identity: 0.793

gaaacgataaaaagccgggtggcggctacgccttacccggcctacatgttctacatat	CRISPR spacer
tcgcaaataaaaagccgggtggcggctacgccttacccggcctacatcgtctgcttga	Protospacer
  .  .*****************************************  ***.* *.

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

2656359 : 2709677

Klebsiella_phage(24.49%)

head,tail,portal,protease,capsid,terminase,holin

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_032103230.1\|2656359_2656869_-\|protease	serine protease inhibitor ecotin	NA	NA	NA	NA
WP_006811332.1\|2657072_2657333_+	DUF2534 family protein	NA	NA	NA	NA
WP_150391000.1\|2657271_2657547_-	hypothetical protein	NA	NA	NA	NA
WP_150391001.1\|2657640_2658498_+	hypothetical protein	NA	NA	NA	NA
WP_150391002.1\|2658590_2659769_-	recombinase	A0A2D1GN00	Marinobacter_phage	5.2e-30	30.2
WP_150391003.1\|2659771_2659981_-	hypothetical protein	NA	NA	NA	NA
WP_150391284.1\|2660025_2660598_-	3'-5' exoribonuclease	K7PLW7	Enterobacteria_phage	5.1e-92	82.4
WP_150391004.1\|2660875_2661073_-	hypothetical protein	NA	NA	NA	NA
WP_150391285.1\|2661060_2661600_-	HD family hydrolase	A0A192Y8M4	Salmonella_phage	2.5e-72	74.3
WP_150391005.1\|2661736_2662567_-	DUF2303 family protein	A0A192Y6E5	Salmonella_phage	4.3e-116	76.8
WP_150391006.1\|2662620_2662992_-	hypothetical protein	Q8HAA1	Salmonella_phage	4.2e-55	89.4
WP_069598597.1\|2663710_2664406_-	helix-turn-helix domain-containing protein	Q8HAA0	Salmonella_phage	7.9e-87	69.6
WP_150391007.1\|2664503_2664767_+	helix-turn-helix domain-containing protein	A0A0P0ZCZ7	Stx2-converting_phage	1.3e-18	57.5
WP_150391008.1\|2664759_2665308_+	DNA-binding protein	A0A1C9II13	Salmonella_phage	8.4e-68	67.6
WP_032676944.1\|2665480_2665660_+	DUF4222 domain-containing protein	S5M7S5	Escherichia_phage	6.6e-14	69.2
WP_150391009.1\|2665649_2666474_+	GntR family transcriptional regulator	A0A1C9IHW0	Salmonella_phage	8.3e-51	82.4
WP_150391010.1\|2666470_2667805_+	phage N-6-adenine-methyltransferase	Q8HA94	Salmonella_phage	9.1e-116	50.3
WP_150391286.1\|2667797_2669735_+	DNA cytosine methyltransferase	H9C171	Pectobacterium_phage	5.6e-199	53.5
WP_150391011.1\|2669749_2670442_+	phage regulatory protein/antirepressor Ant	G0ZND1	Cronobacter_phage	8.2e-60	55.1
WP_150391012.1\|2670438_2671500_+	DUF968 domain-containing protein	A0A291AWV9	Escherichia_phage	1.7e-112	55.7
WP_150391013.1\|2671521_2672214_+	antitermination protein	NA	NA	NA	NA
WP_150391287.1\|2672412_2672946_+	hypothetical protein	NA	NA	NA	NA
WP_150391014.1\|2673143_2673329_+	hypothetical protein	NA	NA	NA	NA
WP_150391015.1\|2673608_2674661_+	site-specific DNA-methyltransferase	A5LH81	Enterobacteria_phage	2.8e-176	81.1
WP_000286102.1\|2674731_2674947_+\|holin	holin	Q9ZWW2	Enterobacteria_phage	6.3e-27	80.3
WP_045347923.1\|2674946_2675483_+	lysozyme	K7PM52	Enterobacteria_phage	7.0e-83	81.1
WP_150391016.1\|2675479_2675995_+	hypothetical protein	K7PHH7	Enterobacteria_phage	1.9e-82	94.2
WP_150391017.1\|2676151_2676940_+	protein kinase	I6PD73	Cronobacter_phage	5.9e-54	44.3
WP_150391018.1\|2676936_2677686_+	serine/threonine-protein phosphatase	I6PCV8	Cronobacter_phage	8.9e-60	49.4
WP_150391019.1\|2678190_2678553_+	HNH endonuclease	Q6UAS2	Klebsiella_phage	1.0e-53	78.3
WP_080975379.1\|2678801_2679125_+\|terminase	P27 family phage terminase small subunit	Q6UAY1	Klebsiella_phage	1.4e-46	82.2
WP_150391020.1\|2679159_2680875_+\|terminase	terminase large subunit	Q6UAY0	Klebsiella_phage	1.1e-278	79.7
WP_058609097.1\|2680868_2681048_+	hypothetical protein	Q6UAX9	Klebsiella_phage	7.3e-05	47.4
WP_058609096.1\|2681047_2682307_+\|portal	phage portal protein	Q6UAX8	Klebsiella_phage	8.1e-191	77.2
WP_150391021.1\|2682339_2683257_+	S49 family peptidase	Q6UAX7	Klebsiella_phage	5.5e-112	69.2
WP_150391022.1\|2683325_2684621_+\|capsid	phage major capsid protein	Q6UAX6	Klebsiella_phage	3.8e-175	73.7
WP_150391023.1\|2684680_2685133_+	hypothetical protein	Q6UAX5	Klebsiella_phage	2.6e-14	63.3
WP_042889858.1\|2685113_2685437_+\|head,tail	phage gp6-like head-tail connector protein	Q7Y407	Yersinia_phage	1.5e-32	64.2
WP_150391024.1\|2685433_2685775_+\|head,tail	head-tail adaptor protein	Q6UAX3	Klebsiella_phage	6.2e-37	65.5
WP_150391025.1\|2685755_2686136_+	hypothetical protein	Q6UAX2	Klebsiella_phage	2.2e-43	70.2
WP_150391026.1\|2686141_2686552_+	hypothetical protein	Q6UAX1	Klebsiella_phage	2.3e-38	67.2
WP_150391027.1\|2686569_2687043_+\|tail	phage tail protein	NA	NA	NA	NA
WP_150391028.1\|2687099_2687444_+\|tail	phage tail protein	NA	NA	NA	NA
WP_150391288.1\|2687464_2687683_+	hypothetical protein	NA	NA	NA	NA
WP_150391029.1\|2687672_2690645_+\|tail	phage tail tape measure protein	A0A2H4J107	uncultured_Caudovirales_phage	3.2e-28	25.7
WP_150391030.1\|2690644_2690992_+\|tail	phage tail protein	Q6UAW6	Klebsiella_phage	1.7e-21	37.8
WP_150391031.1\|2690975_2691542_+	hypothetical protein	NA	NA	NA	NA
WP_150391032.1\|2691620_2692370_+\|tail	phage minor tail protein L	K7PGX3	Enterobacteria_phage	1.0e-84	57.2
WP_150391033.1\|2692372_2693089_+	peptidase P60	A0A2H4J1J7	uncultured_Caudovirales_phage	9.0e-62	45.2
WP_150391034.1\|2693069_2693672_+\|tail	tail assembly protein	K7PHE5	Enterobacteria_phage	8.2e-48	54.6
WP_150391035.1\|2693737_2697313_+	DUF1983 domain-containing protein	Q9MCR7	Enterobacteria_phage	1.3e-305	57.0
WP_150391036.1\|2697314_2698280_+	hypothetical protein	G1CSU0	Cronobacter_virus	8.7e-60	39.7
WP_150391289.1\|2698340_2699660_+\|tail	tail fiber domain-containing protein	K7PGY2	Enterobacteria_phage	1.0e-82	48.7
WP_150391037.1\|2699807_2700494_+	hypothetical protein	NA	NA	NA	NA
WP_150391038.1\|2700532_2701159_-\|tail	tail fiber domain-containing protein	G9JXH9	Shigella_phage	5.0e-24	43.2
WP_150391039.1\|2701289_2701847_+	recombinase family protein	A0A1S6L009	Salmonella_phage	7.2e-75	77.6
WP_142503495.1\|2702019_2702439_+	translesion error-prone DNA polymerase V autoproteolytic subunit	A0A1W6JNS2	Morganella_phage	1.4e-35	56.7
WP_150391040.1\|2702441_2703710_+	translesion error-prone DNA polymerase V subunit UmuC	I6RSM4	Salmonella_phage	2.0e-229	91.9
WP_063157296.1\|2704069_2704552_-	ImmA/IrrE family metallo-endopeptidase	L7THB5	Pseudomonas_virus	3.4e-20	35.9
WP_040242227.1\|2704569_2704923_-	helix-turn-helix domain-containing protein	L7TKV7	Pseudomonas_virus	1.7e-24	54.3
WP_150391041.1\|2705028_2705700_-	SOS response-associated peptidase	A0A2H4J5W2	uncultured_Caudovirales_phage	1.4e-80	61.4
WP_063667174.1\|2705925_2706165_-	DinI family protein	K7PKM2	Enterobacterial_phage	3.8e-33	89.9
WP_150391042.1\|2706527_2708288_-	DUF3413 domain-containing protein	NA	NA	NA	NA
WP_001135586.1\|2708307_2708535_-	YejL family protein	NA	NA	NA	NA
WP_015572297.1\|2708669_2709677_+	nucleoid-associated protein YejK	A0A1V0E8C0	Vibrio_phage	2.2e-82	48.6

DBSCAN-SWA_2

2888368 : 2897073

Organic_Lake_phycodnavirus(14.29%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_059295499.1\|2888368_2889175_+	glycosyltransferase	F2Y1U7	Organic_Lake_phycodnavirus	4.1e-18	30.7
WP_023303973.1\|2889326_2890733_+	NADP-dependent phosphogluconate dehydrogenase	M4QQM4	Ostreococcus_lucimarinus_virus	4.0e-37	28.3
WP_047056191.1\|2890822_2891908_+	dTDP-glucose 4,6-dehydratase	A0A291LAD7	Escherichia_phage	1.4e-98	52.5
WP_017693099.1\|2891908_2892790_+	glucose-1-phosphate thymidylyltransferase RfbA	I7I009	Enterobacteria_phage	9.0e-104	62.7
WP_045343191.1\|2893029_2894196_+	UDP-glucose 6-dehydrogenase	A0A1J0FA55	Only_Syngen_Nebraska_virus	5.9e-111	53.2
WP_150391068.1\|2894244_2895249_-	SDR family NAD(P)-dependent oxidoreductase	A0A2K9L0I7	Tupanvirus	5.0e-34	29.3
WP_150391069.1\|2895441_2896422_+	LPS O-antigen chain length determinant protein WzzB	NA	NA	NA	NA
WP_017693103.1\|2896461_2897073_-	bifunctional phosphoribosyl-AMP cyclohydrolase/phosphoribosyl-ATP diphosphatase HisIE	A0A2H4UVM0	Bodo_saltans_virus	1.6e-14	29.3

DBSCAN-SWA_3

3677351 : 3684893

Escherichia_phage(83.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_003857421.1\|3677351_3678206_+	benzoate transporter	M1I711	Paramecium_bursaria_Chlorella_virus	8.1e-25	33.2
WP_003857424.1\|3678308_3678614_+	DUF1161 domain-containing protein	NA	NA	NA	NA
WP_150391155.1\|3678744_3681183_+	molybdopterin-dependent oxidoreductase	A0A077SK27	Escherichia_phage	1.2e-217	49.6
WP_017384545.1\|3681193_3681811_+	dimethylsulfoxide reductase subunit B	A0A077SL61	Escherichia_phage	1.0e-74	59.1
WP_032653420.1\|3681812_3682667_+	dimethyl sulfoxide reductase anchor subunit	A0A077SK59	Escherichia_phage	3.4e-23	34.6
WP_150391156.1\|3682711_3683326_+	Tat proofreading chaperone DmsD	A0A077SLS7	Escherichia_phage	7.3e-28	34.7
WP_017384548.1\|3683436_3683748_+	YebG family protein	NA	NA	NA	NA
WP_017694081.1\|3683862_3684177_-	hypothetical protein	NA	NA	NA	NA
WP_015570622.1\|3684215_3684893_-	type A chloramphenicol O-acetyltransferase	G3CFL0	Escherichia_phage	2.1e-76	62.6

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP044107

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection