CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_020515	Bibersteinia trehalosi USDA-ARS-USMARC-192, complete sequence	5 crisprs	cas14j,csa3,DEDDh,cas3,cas2,cas1,cas9,cas5,cas8c,cas7,cas4,DinG	3	28	4	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_020515_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020515_1

843484-844575

TypeII

Consensus_repeat	Method
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	PILER-CR
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CRISPRCasFinder
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CRT

16 spacers

cas2,cas1,cas9

The CRISPR arrays of NC_020515_1

>merge|NC_020515|1|843484-844575|PILER-CR,CRISPRCasFinder,CRT
GTTGTAGCTCCCTTTTTCATTTCGCAGTGCTACAATGCCGATTTTAAATTCCATCTCAAGCTTTTCGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATAAAGTCCCACGTCAAAATAATACTTGACAAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATATGCTGACAAATTATTAGGCGTATGGCAACGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATGGGCAGTTGCAAGACATGTATCAAAATCTTGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCACAATCAAAAGCGATTGTTGATGATTCAAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCGTACATTCGGTTATACATCAACGCTTAAAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCCTCTTTGAGATGTTCCACGAACCACAACGGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCAGTGTATTCGCATTGGAAAGCGTAAAAGAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATTATTTTCTGTACCACAACCTTGCCTTGCTTGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCGTACATTCGGTTATACATCAACGCTTAAAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCCTCTTTGAGATGTTCCACGAACCACAACGGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCAGTGTATTCGCATTGGAAAGCGTAAAAGAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATTATTTTCTGTACCACAACCTTGCCTTGCTTGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCGAAGTAAAAATCATTGGTTATGTAGGGCAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATAAGTAAATATTACACAGGAATTATGGGAGAGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAATCCGGCTCGGTGATTTGAGCAATGAGGTAATGTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT

>NC_020515|1|1|843484-844377|PILER-CR
GTTGTAGCTCCCTTTTTCATTTCGCAGTGCTACAAT	GCCGATTTTAAATTCCATCTCAAGCTTTTC
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	AAAGTCCCACGTCAAAATAATACTTGACAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	ATGCTGACAAATTATTAGGCGTATGGCAAC
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	GGGCAGTTGCAAGACATGTATCAAAATCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CACAATCAAAAGCGATTGTTGATGATTCAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGTACATTCGGTTATACATCAACGCTTAAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCTCTTTGAGATGTTCCACGAACCACAACG
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CAGTGTATTCGCATTGGAAAGCGTAAAAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	TATTTTCTGTACCACAACCTTGCCTTGCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGTACATTCGGTTATACATCAACGCTTAAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCTCTTTGAGATGTTCCACGAACCACAACG
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CAGTGTATTCGCATTGGAAAGCGTAAAAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	TATTTTCTGTACCACAACCTTGCCTTGCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT

>NC_020515|1|1|843484-844575|CRISPRCasFinder
GTTGTAGCTCCCTTTTTCATTTCGCAGTGCTACAAT	GCCGATTTTAAATTCCATCTCAAGCTTTTC
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	AAAGTCCCACGTCAAAATAATACTTGACAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	ATGCTGACAAATTATTAGGCGTATGGCAAC
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	GGGCAGTTGCAAGACATGTATCAAAATCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CACAATCAAAAGCGATTGTTGATGATTCAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGTACATTCGGTTATACATCAACGCTTAAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCTCTTTGAGATGTTCCACGAACCACAACG
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CAGTGTATTCGCATTGGAAAGCGTAAAAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	TATTTTCTGTACCACAACCTTGCCTTGCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGTACATTCGGTTATACATCAACGCTTAAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCTCTTTGAGATGTTCCACGAACCACAACG
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CAGTGTATTCGCATTGGAAAGCGTAAAAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	TATTTTCTGTACCACAACCTTGCCTTGCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGAAGTAAAAATCATTGGTTATGTAGGGCA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	AAGTAAATATTACACAGGAATTATGGGAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCGGCTCGGTGATTTGAGCAATGAGGTAAT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT

>NC_020515|1|1|843484-844575|CRT
GTTGTAGCTCCCTTTTTCATTTCGCAGTGCTACAAT	GCCGATTTTAAATTCCATCTCAAGCTTTTC
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	AAAGTCCCACGTCAAAATAATACTTGACAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	ATGCTGACAAATTATTAGGCGTATGGCAAC
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	GGGCAGTTGCAAGACATGTATCAAAATCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CACAATCAAAAGCGATTGTTGATGATTCAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGTACATTCGGTTATACATCAACGCTTAAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCTCTTTGAGATGTTCCACGAACCACAACG
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CAGTGTATTCGCATTGGAAAGCGTAAAAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	TATTTTCTGTACCACAACCTTGCCTTGCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGTACATTCGGTTATACATCAACGCTTAAA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCTCTTTGAGATGTTCCACGAACCACAACG
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CAGTGTATTCGCATTGGAAAGCGTAAAAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	TATTTTCTGTACCACAACCTTGCCTTGCTT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CGAAGTAAAAATCATTGGTTATGTAGGGCA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	AAGTAAATATTACACAGGAATTATGGGAGA
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT	CCGGCTCGGTGATTTGAGCAATGAGGTAAT
GTTGTAGCTCCCTTTCTCATTTCGCAGTGCTACAAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_020515.1\|WP_025267173.1\|851947_852904_+\|transcriptional-regulator	unknown	unknown	gnl\|CDD\|238045
NC_020515.1\|WP_015432204.1\|850159_851815_-\|PhnD/SsuA/transferrin-family-substrate-binding-protein	unknown	unknown	gnl\|CDD\|236901
NC_020515.1\|WP_025328974.1\|838642_838999_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182322
NC_020515.1\|WP_015432195.1\|839060_839705_+\|hexitol-phosphatase-HxpB	unknown	unknown	gnl\|CDD\|236770
NC_020515.1\|WP_015432207.1\|853803_854901_+\|polysulfide-reductase-NrfD	unknown	unknown	gnl\|CDD\|184954
NC_020515.1\|WP_015432202.1\|846119_849257_-\|type-II-CRISPR-RNA-guided-endonuclease-Cas9	cas9	COG3513_cas9_CAS-II-A:CAS-II-B:CAS-II-C	gnl\|CDD\|226044
NC_020515.1\|WP_015432196.1\|839731_840493_+\|DNA-binding-transcriptional-repressor	unknown	unknown	gnl\|CDD\|182457
NC_020515.1\|WP_015432209.1\|856293_860289_+\|hypothetical-protein	unknown	unknown	unknown
NC_020515.1\|WP_015432191.1\|836427_837426_+\|PTS-glucitol/sorbitol-transporter-subunit-IIB	unknown	unknown	gnl\|CDD\|226255
NC_020515.1\|WP_015432192.1\|837435_837801_+\|PTS-glucitol/sorbitol-transporter-subunit-IIA	unknown	unknown	gnl\|CDD\|182419
NC_020515.1\|WP_015432200.1\|844833_845160_-\|CRISPR-associated-endonuclease-Cas2	cas2	COG3512_cas2_CAS-II-A:CAS-II-B:CAS-II-C	gnl\|CDD\|226043
NC_020515.1\|WP_015432201.1\|845152_846067_-\|type-II-CRISPR-associated-endonuclease-Cas1	cas1	cd09720_cas1_CAS-II-A:CAS-II-B:CAS-II-C	gnl\|CDD\|187851
NC_020515.1\|WP_015432199.1\|842071_843472_+\|PLP-dependent-aminotransferase-family-protein	unknown	unknown	gnl\|CDD\|224089
NC_020515.1\|WP_015432193.1\|837814_838594_+\|sorbitol-6-phosphate-dehydrogenase	unknown	unknown	gnl\|CDD\|183489
NC_020515.1\|WP_015432206.1\|853076_853802_+\|tetrathionate-reductase-subunit-TtrB	unknown	unknown	gnl\|CDD\|184955
NC_020515.1\|WP_015432190.1\|835844_836399_+\|PTS-glucitol/sorbitol-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|129901
NC_020515.1\|WP_015432208.1\|855079_856297_+\|ATP-binding-protein	unknown	unknown	gnl\|CDD\|224292
NC_020515.1\|WP_025267174.1\|849446_850034_-\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|226932
NC_020515.1\|WP_025328973.1\|841101_841974_-\|pyridoxal-5'-phosphate-synthase-lyase-subunit-PdxS	unknown	unknown	gnl\|CDD\|179769
NC_020515.1\|WP_015432197.1\|840535_841102_-\|pyridoxal-5'-phosphate-synthase-glutaminase-subunit-PdxT	unknown	unknown	gnl\|CDD\|237411

Protein	Function_ID	Function_description	E-value
NC_020515.1\|WP_025267173.1\|851947_852904_+\|transcriptional-regulator	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	0.00185717
NC_020515.1\|WP_015432204.1\|850159_851815_-\|PhnD/SsuA/transferrin-family-substrate-binding-protein	gnl\|CDD\|236901	PRK11360, PRK11360, two-component system sensor histidine kinase AtoS.	2.86139e-30
NC_020515.1\|WP_025328974.1\|838642_838999_+\|hypothetical-protein	gnl\|CDD\|182322	PRK10234, PRK10234, transcriptional regulator GutM.	1.82573e-43
NC_020515.1\|WP_015432195.1\|839060_839705_+\|hexitol-phosphatase-HxpB	gnl\|CDD\|236770	PRK10826, PRK10826, hexitol phosphatase HxpB.	4.32216e-69
NC_020515.1\|WP_015432207.1\|853803_854901_+\|polysulfide-reductase-NrfD	gnl\|CDD\|184954	PRK14992, PRK14992, tetrathionate reductase subunit TtrC.	8.05993e-43
NC_020515.1\|WP_015432202.1\|846119_849257_-\|type-II-CRISPR-RNA-guided-endonuclease-Cas9	gnl\|CDD\|226044	COG3513, COG3513, Predicted CRISPR-associated nuclease, contains McrA/HNH-nuclease and RuvC-like nuclease domain [Defense mechanisms].	0
NC_020515.1\|WP_015432196.1\|839731_840493_+\|DNA-binding-transcriptional-repressor	gnl\|CDD\|182457	PRK10434, srlR, DNA-binding transcriptional repressor.	6.76383e-152
NC_020515.1\|WP_015432191.1\|836427_837426_+\|PTS-glucitol/sorbitol-transporter-subunit-IIB	gnl\|CDD\|226255	COG3732, SrlE, Phosphotransferase system sorbitol-specific component IIBC [Carbohydrate transport and metabolism].	0
NC_020515.1\|WP_015432192.1\|837435_837801_+\|PTS-glucitol/sorbitol-transporter-subunit-IIA	gnl\|CDD\|182419	PRK10377, PRK10377, PTS glucitol/sorbitol transporter subunit IIA.	4.16903e-56
NC_020515.1\|WP_015432200.1\|844833_845160_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|226043	COG3512, COG3512, CRISPR-associated protein, Cas2 homolog [Defense mechanisms].	2.0781e-55
NC_020515.1\|WP_015432201.1\|845152_846067_-\|type-II-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187851	cd09720, Cas1_II, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer intergration. Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	4.27204e-133
NC_020515.1\|WP_015432199.1\|842071_843472_+\|PLP-dependent-aminotransferase-family-protein	gnl\|CDD\|224089	COG1167, ARO8, Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs [Transcription / Amino acid transport and metabolism].	2.7335e-107
NC_020515.1\|WP_015432193.1\|837814_838594_+\|sorbitol-6-phosphate-dehydrogenase	gnl\|CDD\|183489	PRK12384, PRK12384, sorbitol-6-phosphate dehydrogenase; Provisional.	0
NC_020515.1\|WP_015432206.1\|853076_853802_+\|tetrathionate-reductase-subunit-TtrB	gnl\|CDD\|184955	PRK14993, PRK14993, tetrathionate reductase subunit TtrB.	8.88593e-147
NC_020515.1\|WP_015432190.1\|835844_836399_+\|PTS-glucitol/sorbitol-transporter-subunit-IIC	gnl\|CDD\|129901	TIGR00821, Glucitol/sorbitol_permease_IIC_component, PTS system, glucitol/sorbitol-specific, IIC component. Bacterial PTS transporters transport and concomitantly phosphorylate their sugar substrates, and typically consist of multiple subunits or protein domains. The Gut family consists only of glucitol-specific transporters, but these occur both in Gram-negative and Gram-positive bacteria.E. coli consists of IIA protein, a IIC protein and a IIBC protein. This family is specific for the IIC component. [Transport and binding proteins, Carbohydrates, organic alcohols, and acids, Signal transduction, PTS].	1.69631e-112
NC_020515.1\|WP_015432208.1\|855079_856297_+\|ATP-binding-protein	gnl\|CDD\|224292	COG1373, COG1373, Predicted ATPase (AAA+ superfamily) [General function prediction only].	2.10542e-79
NC_020515.1\|WP_025267174.1\|849446_850034_-\|response-regulator-transcription-factor	gnl\|CDD\|226932	COG4566, TtrR, Response regulator [Signal transduction mechanisms].	1.46202e-72
NC_020515.1\|WP_025328973.1\|841101_841974_-\|pyridoxal-5'-phosphate-synthase-lyase-subunit-PdxS	gnl\|CDD\|179769	PRK04180, PRK04180, pyridoxal 5'-phosphate synthase lyase subunit PdxS.	0
NC_020515.1\|WP_015432197.1\|840535_841102_-\|pyridoxal-5'-phosphate-synthase-glutaminase-subunit-PdxT	gnl\|CDD\|237411	PRK13525, PRK13525, pyridoxal 5'-phosphate synthase glutaminase subunit PdxT.	4.36319e-103

>NC_020515.1|WP_015432199.1|842071_843472_+|PLP-dependent-aminotransferase-family-protein
MVTYTFKKNNIPLYEQLYCFIKLDIEQGDIIAGEKLPSKRAFAKHLGISVMTVETAYQQLVAEGYLSAKAKQGFFVNPLNLPKTSTSRSVFTETSGSKPIENSKKWQADLTNSQTSAENFPFSVWTKLVREVLKHHQSALMERAESGGVLMLRQAIAKHLHDFRGMNVSPAQIIVGAGTEYLYGLLVQLLGLDKTYALPDPSYDKLHKIFQSYGLNHISISMDYATNVLKNVNVLHTSPSHHFPTGLVMPIAKRYELLAWAAEKADRYIIEDDYDSEFRFVGQPIPALQSIDMLGKVIYMNTFSKTLSSTVRIAYMVLPPELLTRFHQQLGFYASTVSNFEQYVLAEFIQQGYFEKHINRMRAYYQKKRDHLLFSLKNSPLAEKITIKEENAGLHFIVQFHTELSDEQILQSANEQGIKMVSLARYYQDKSQAPKNAFVVGYSNLADKQVDEVVRWLKNIFSRRVL
>NC_020515.1|WP_025328973.1|841101_841974_-|pyridoxal-5'-phosphate-synthase-lyase-subunit-PdxS
MTHRYDLNKQLAQMLKGGVIMDVTTPEQARIAEEAGACAVMALEKIPADIRAAGGVSRMSDPKMIKSIQEAVSIPVMAKVRIGHFTEAQILQAIEIDYIDESEVLSPADDTFHINKREFDVPFVCGAKDLGEALRRINEGAAMIRSKGEPGTGDVVQAVRHLRKIKQEIARVASLSTDELYHAAKELQVPFDLIQYVHQHKKLPVVTFAAGGVATPADAALMMQLGAEGVFVGSGIFKSGDPAKRARAIVQAVTNYNDAKLLAELSEDLGEAMVGINEQEIELLMAARGI
>NC_020515.1|WP_015432197.1|840535_841102_-|pyridoxal-5'-phosphate-synthase-glutaminase-subunit-PdxT
MKIAILALQGAFAEHADKLKQLGVESVEIRQLADLNQDFDGLILPGGESTVQGKLLRELGLFEPLRQKILNGLPTLGTCAGLILLAEKLANDDKQHFATLPVTVKRNAYGRQLGSFLTESEVKHIGKIPLPFIRAPYVESIGEGMEILAEVSGNIVGVKCKNQIGISFHPEVSDDLRFHRYFVEMCKN
>NC_020515.1|WP_015432196.1|839731_840493_+|DNA-binding-transcriptional-repressor
MKPIERQKQILDYLSQHGRTDVEVLAEYFKLTGATIRKDLTVLEQQNKVLRTYGSVVILQDEVFDASIDQKNHINLLQKQKIGQKASELINDGDSIIMDAGSTVLQMIPHLVKFDNLTVMTNSLHIINGITQLKKNYNLMISGGTYRERSASFHGYFAESAFNDSTFDTLFIGTDGFDLEVGLTTFNEIYGVSSAMCRAAKKIVVLADSTKFGRKSPNIVCGLEKIDVVISDNQLSEEMKERIEQKGIQVIIV
>NC_020515.1|WP_015432195.1|839060_839705_+|hexitol-phosphatase-HxpB
MQIKAVIFDMDGVIIDSEPMWAEAQIKTLHALGQQITEQDCEHLTRGKRIDQIAHIWIERYQLNANAEEVANQILRYAYEAILAQGCAMEGLYPLLDLLQKKNIPLALATSSAPMIIEAVFNKLNLWDYFRVQCSANDEAYGKPHPAVYLTAVQKLNVNINDCLVIEDSVTGLIAAKAAGLQTVIVNPNYADPRFSLADKRVDSLSKLMATFSY
>NC_020515.1|WP_025328974.1|838642_838999_+|hypothetical-protein
MSSTAILIGFAVCMWLLQILLGWRQIRLFNQAYAEIAKKGKVLVGRNEGRFTPKAVIVLAVDNHNIVQECLTMQGFSVFAKPAFSTVLTGKSLTEIQPEQAFPNNKALQNALKIALIR
>NC_020515.1|WP_015432193.1|837814_838594_+|sorbitol-6-phosphate-dehydrogenase
MKKVAVVVGGGQTLGAFLSEGLADSGYRVVVADLNGENAQAVAGIINGKYGAENAIGVQVDATNETSVEAMAKATDEAFGRVDLVVYSAGTAKAAKITDFDLKDFDLSVKVNLTGYFLSAKHFSRLMIRDGIKGRIIQINSKSGKVGSKHNSGYSAAKFGGVGLTQSLALDLAEHGITVHSLMLGNLLKSPMFQSLIPQYAKKLGIPESEVEQVYIDKVPLKRGCDYQDVLNVLRFYASEQAAYCTGQSINITGGQVMF
>NC_020515.1|WP_015432192.1|837435_837801_+|PTS-glucitol/sorbitol-transporter-subunit-IIA
MSVIYQVVVEQIGDFAQDALQDNMLIMFKSGAPADVVDYCFVHSHDDLKQPLAVGGELQINAKRYPITAVGEVASENLAQLGHITLFFDGASEAQFPGSIHLQGDVPNEISVGSEFVFLNN
>NC_020515.1|WP_015432191.1|836427_837426_+|PTS-glucitol/sorbitol-transporter-subunit-IIB
MSKVIYIEKGNGGWGGPLSIPVVEGKKIVYVTGGTRPAIVDRLVELTGWEAVDGFKDGEPPQEEIGVAIIDCGGVLRCGLYPKRRIPTINIHTTGKSGPLAQFIVEDIYVSAVKPNNIHVKDDDVQAVQSTENSAKNSENPTAYREYDSSKKITEQSDGLLAKIGTGMGSVVAVFYQAGRETIETVLKTILPFMAFVSALIGIIMASGIGDLIAHALTPLATNPLGLVTLALICSFPLLSPFLGPGAVIAQVIGVLVGVQIGLGNIPPHLALPALFAINAQAACDFIPVGLSMAEAKQDTVRVGVPSVLVSRFLTGAPTVLVAWLVSGFIYS
>NC_020515.1|WP_015432190.1|835844_836399_+|PTS-glucitol/sorbitol-transporter-subunit-IIC
MIESITKGAEWFIGLFQKGGEVFVGMVTGILPLLISLLVVMNALIYFIGQERIERLAQRSSGNPFSRYFLLPLIGTFVFCNPMTLSLGRFLPERYKPSYYAAASYSCHSMNGLFPHINPGELFVYLGIAQGLTTLGLPLGPLAVSYFLVGLFTNFFRGWITDFTTRIFEKRMGIQLEREVHLAK
>NC_020515.1|WP_015432200.1|844833_845160_-|CRISPR-associated-endonuclease-Cas2
MSEATFMRIIVFFDLPVTTKAKRKAANQFRQFLLKDGYQMLQLSVYTRIVRGRDSLEKHNKRLTAHLPEEGSVRCLEITEKQFTSMLLLVGELKPQEEKVNANQLLLF
>NC_020515.1|WP_015432201.1|845152_846067_-|type-II-CRISPR-associated-endonuclease-Cas1
MSWRSILISNGGKLSLRQNQMVIWQEEQEFCVPLEDIAVIVIEHRETVITTPLLSALALNGITLLTCDEQFIPCGQWLPFGQYHRQLKTLKLQLEMSQPLKKQLWQVIVQQKIRNQAFVLVQTKRLDMAEKLQHLAKRVKSGDKENLEAQAALIYFQTAFGSDFRRWQENAINAHLNYAYTVLRSAVARSLVLYGWLPTLGLFHHSELNPFNLADDMIEPFRPLVDLMVWQLWQDDKLADSLTPHNKQKLVGLLHYQMRFQDQTFSTLAAIDRTIGSLQNAISQKDPSLLKLPEILPLKEHQYE
>NC_020515.1|WP_015432202.1|846119_849257_-|type-II-CRISPR-RNA-guided-endonuclease-Cas9
MKPRNLNYILGLDLGIASVGWSVVEIDENEYPIRLIDVGVRTFERAEVPKTGESLALARRLARSTRRLIRRRAFRLLKAKRLLKHHQIVNAEELTQLPNQCWELRVKGLDSLLSNTEWAAVLLHLLKHRGYLSQRKNEAQNADKELGKLREGMDNNSKLLLENNYRTPADIAVKKFAVEEGHMRNQRGAYTHTFNRLDILAEMQLLFKTQRELGSTYANGELEQAFCELLLWQKQALNRSQMLSLVGKCTFEKEEKRAAKASYSAERFVAIQKLQNLRILENGEERGLFDSEFSLLLENAYNLKSGLTYKQVRKILSLSENAIFKGLPYLSDDLEKPEKTQFLAFKFYHQLADILKNNGFSDEWQKLSQEPTLLDKLGTELSLCKEENEFIAQFNGELPEAMLSTLFNHTNFDKFIHISLKALNNILPLMEQGNDYTKAWRKVYPEPTKKDEKTLPPIPADEIRNPVVLRSLSQARKVINAVIRLYGSPARIHIETARELGKSYDDRQKIKKQQDKNSDERDQAVKKFLEECPNFANKVKGKDILKIRLYINQDGKCLYSGKPLDPHRLLEIGYVEIDHALPFSRTWDDSQNNKVLVLANENQNKGNQTPFEWLGKDEHQWALFVARVNGCRFPYAKKQRILTKKLDEQGFLKRNLNDTRYVSAYLMKHIKENLHLVGKGSDKVFASNGQVTNFLRRCWGLEKKREEGDRHHALDAIVVACSTASMRQKITLFKKYQRWNLKTGKHIDQETGEIIPLHFPAPWDFFRQEVMIRIFSEMPQEDLIMQLPDRPQANHEFVQPLFVSRAPSRKMSGQGHEAKLRSARMLEATGKSIKKEFLTDLTIKNLEHMVNKEREPELYQALVEHFKKYGDKPKEKFFKKGGVEVKSIRISKTQNKSVNLGNKTIADNGDIVRTDLFLKNKKYYFVNIYAWQVSKGILPKETTTGNILDNSYEFQFSLFKNDLLEIPHPKNENDSILAYFIRPDDERRWILKFHDNAKIPDIYGKKDETSIRLSIQGQKFIKKYQVDELGKNIRPCRPTKRQGVR
>NC_020515.1|WP_025267174.1|849446_850034_-|response-regulator-transcription-factor
MIIHILDDEESILDAMSFLLAPLGIEIQTWQSSVDFLAQADLHQQGVLLLDIRMPLPDGQQVHQQLREVQSTLAVVIMTAHGDVPMAVAELKKGAVDFLQKPASFEQLKQAITQVKTVSEQAVKIREISQNYAKLTEKERNLVPLIMQGFTNKQIADHLAISVRTVEVHRANVMEKMQAESLAELVQKLGLLPTP
>NC_020515.1|WP_015432204.1|850159_851815_-|PhnD/SsuA/transferrin-family-substrate-binding-protein
MKRLFLFFLFLSHTVLAETWHIGILAQRGETYTRTHWQPWVDWLNEQFPNERFELVPLGLGEANERAELDFLLTNQAQFFYLSRQNVRWLATLGSPFTENGEQGAVGSSIWVRADSHYRQLSDLKNQTISAVDNDAFGGFLLGLYQFHQAGMQQNRDFSVQFSGFPVENALALLAEKQVEAAIVPVCLLEELEKEGKFKRSDFRLILQNPQAQGCLASTPLLPNWSLAAMENVPNELAVQFATRLLNSHNPDLPRWTLPFSSAQADHILRELYRHPQQKSLWATVLDWVRLNKFGLLAVALFILLNLVALRYQVYRKSKALQQAHRKMQQYQQELTRADRLALLGEMTTGFAHELKQPLSAVRMYAEGLKSQNSNPYQQRILDKLIAQVDRAVKTMQSIRDWVQNRPSGEPQAVILNQLIANVIEFVAVENRQNAQISLIADRTFRLNLHATVLEQVLTNCLLNALQAGASEITVRLQAVENGLEIAIEDNGGGFSPAQLEFPFVPFRTDKPHGLGLGLVLCQRLMQSLNGRIVLTNGEKGARVSLFIPDD
>NC_020515.1|WP_025267173.1|851947_852904_+|transcriptional-regulator
MSLSMIELAMQILSCSQKELANKLSVSPSQITKWKKGEYMSFDMENKVRKLLDIGDLDPNVILAFGHISYAQKWQKIITQLAESANDNGETGFNVAPLIDETDLILSNLVDSLRMIGYKFPLSFPPELENDYDHYIDWSDSFIETIYSNEFCSLIYSIFCSFADVYSFYEAYISELDTQLSMENPEFSNLIVDIEANLLNLAIIKADTILPELTGFQKLKRETEKDYREWLQQLKLYAFKSNIPLRAELMHLIDDEHDNLGVEAEAEYLGFNDNRLHPDIYMNELLVGMRLLHQVLPVILDKLEIKDFDIDNKSLRKF
>NC_020515.1|WP_015432206.1|853076_853802_+|tetrathionate-reductase-subunit-TtrB
MDLSKRSFLKELSALTVGASFVPLQSAQAFMPARREGDENKRYAMLIDLRKCIGCQACTVSCLVENATPLHSFRTTVRQYEITNGTQVANNVVLPRLCNHCDQPPCVPVCPVQATFQRKDGVVVINNEQCIGCGYCVQACPYDARFINEETKTADKCTFCTHRLEAGLLPACVESCVGGARVIGDLNDPKSQISQLYQTHKDDLKVLKPEAGTVPHVFYVGLIEAFVSKIDGQPMLWTGEA
>NC_020515.1|WP_015432207.1|853803_854901_+|polysulfide-reductase-NrfD
MIREVLVEPQHIVWLPWIVHYFFFVGVAATAVFTAVLFAKKQRQNACVLNVGSANGPKGASEQCSRVKPTACELAAVTVALIGSIVAPVALTADLHQPSRILHFYTDFAWWSPMAWGAMILPLFSVAVAGYFVLALAHHTQPNLPKWLAWLQFPILKNQDLLWAFRLFAALTAVGIIGYTVLETYQTGTRILWHSAWLLPIMLFSAWAVALGLTQVISQFLLPLAGEVPEQPSGAGGKICLILTALSIIGLAFSSETAQRDFALLFNGSITAYLVGIFWLIALVCNFSAKNHRLQWLGVLALIAFGWLLRWVLVIQVQTIAKTNALQNPYHFDWTAVDGGLGIVSILGLAVLVTVGVGQIISLTT
>NC_020515.1|WP_015432208.1|855079_856297_+|ATP-binding-protein
MINRPNYLQQLKPFINTPLIKVMTGIRRSGKSTVMKLLREELISQGIAEQQIIHINFESFAFSDFKTADKLYMLVKEKILTTDKYYLLLDEIQEVSEWEKAVNAFMVDFNLDLYITGSNSHLLSSELSTYLAGRYVEIPIFTLSFQEFLDFKTAYSPETSSNPTALFHEYLRKGGFPMVHTANYEAETVYKIVQDIYASVILRDTVQRHKIRDVELLERIVKYAFDNIGNTFSGKNVADYFKSQQRKIDLNTVYNYLKALESAFILHRVERFDIKGKEILKTQEKFYLGDVSLLYATMGFRTSLISGILENLVYLELKRRGYQVYIGKLDKQEIDFIAQKQNEKIYIQVAYKLESEETVKREFSPLQEIADNYPKYVITMDELWKENLGGVEHIYTTDFFMRDAL
>NC_020515.1|WP_015432209.1|856293_860289_+|hypothetical-protein
MSFYIDRTLYNSDNQEIKESELISLIPKVIIILAEPGAGKSYLLNNISQQLGVQKKTANIFIHLPVEKTKLLIIDAFDELVRIDSSSVTKSLVMAEKTSAEKIILSSRSSEWSESYSQTCKELFREAPLLLYLKPFNQQEQKEIFNSYYPEENAEIFLQEAGKIELAPLLSNPLFLRLFSKSYIENNKIFENRYSAFKIAIEGLARESNPSHSSSLPGNKKVELVEDVFCKLILSGSEGISTSDFSSKHLFPNIKNLNSDTNIFQILSTQFFTPGENQGQHRPIHKIVVEYCAGRYLANKLTSSTPLSLNKILSIIAPNNIVRDELRGLFSWIAVLSENQQIQEKLINLDPYAILANGDPSLLLPRSKRILLSRLKDVNQKDPYFTRHDIWRNFSISDFFSDDMIDELKELLSEKYRSGNLQRVLLKLLLESSVVSKVVDELRTIICDTNPKYKELSIRRLAGECLLKVKDYPIKDVWAQLISEKNSVSLSIASEIMNLSDRSYFDINDYITFLNICSELYPTNYEIERVFGKRYFIRLFIQELELDLTIKLLDSLSNNLACTCQKKYDCECRVGISKIIGMLLDRYFELSSKFNMSKIWEWIKNLYFQNGISKEQSLSVKTLSENDELRQGIIKLAFENLWVREEIHNMKFYHFEWHSHSGLNFQYQDLRFIIDLSFETNNIELWKYFIARHDFYNKEKKPNLLRRYMRNQALQKPAFLMAWYRINQESKEFYQRNTLKYNCKKSIRNINRKQRKSLARNIKYIQQNRELIENGSHWDSLLSFSYTFLQEPEKIAEKFGDEQLVRNALYNCINYIQSNIPNLTDLAKLHSDSSVLNIEIILYASCIEIFTREGTLKSLPKDILEALYTNFSVYLIGMEHNIRRQLKNETEKSLFNNIEAIEKFINDYIEPQLSNANYKNSPVCWLEKDLFKQFQKKYALEWLIKYPHLKLPEIEKLMSMAIQSGNRESLKLLVKKRCDELVSGANNQQNGGQKTQRDFWYIHAFYLLDKDYESYWKELTKDPNSIFILEKDLGIFGDYKDWLALSPEKIELILDTFWQEYPEVELSDIYGSESPDDEKAYRFLTNVIFFLGKNESDNTITVIDRLLNTPEFINLHSDLKSIRYNYLKKTVMQSFQAPKPEQIVKLIERDEIISVENLRAVIIEELQSYQDDLNGHDITTKSIFYNGNMELTNRVDENTATQYIAERLRRLENRQIIVSREHYMKDDKRCDIVLSKLIEGNRKIVPIEVKGQWHSEVYSAFENQLNRLYSIHPDSDGQGIYLVLWFGSDEKIAGVKRHGINSAQELYWKVYEKISEELRNRIDLFVLDLSS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020515_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020515_2

950110-950541

Orphan

Consensus_repeat	Method
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	CRT
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	PILER-CR
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	CRISPRCasFinder

6 spacers

The CRISPR arrays of NC_020515_2

>merge|NC_020515|2|950110-950541|CRT,PILER-CR,CRISPRCasFinder
AAATAGAATGGCAGCTACCCGTAGGTAGCTGCTACTTGAGGGGGTAACGGTATGCAAAACCATTAAGTTTCAACTCTCAGCCACCTACAGGTAGCTGCGATTACCTGCTACACGATTTACCCAACCTTTGCCGTTTCAACTCTCAGCCACCTACAGGTAGCTGCGCACGAACTCCGCCGTGTTCTTTCATAAAGTTGCGGTTTCAACTCTCAGCCACCTACAGGTAGCTGCATTTCTGAAACAGGGATTTGCGTTTCATTCCATTTGTTTCAACTCTCAGCCACCTACAGGTAGCTGCTTGCTGCCGTCTCTAAATAGCCACTATCAGCAAATGTTTCAACTCTCAGCCACCTACAGGTAGCTGCCAAGCAACACGATTTATTTGTAATACCGCTCTGTCGTTTCAACTCTCAGCCACCTACAGGTAGCTGC

>NC_020515|2|2|950110-950541|CRT
AAATAGAATGGCAGCTACCCGTAGGTAGCTGC	TACTTGAGGGGGTAACGGTATGCAAAACCATTAA
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	GATTACCTGCTACACGATTTACCCAACCTTTGCC
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	GCACGAACTCCGCCGTGTTCTTTCATAAAGTTGCG
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	ATTTCTGAAACAGGGATTTGCGTTTCATTCCATTT
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	TTGCTGCCGTCTCTAAATAGCCACTATCAGCAAAT
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	CAAGCAACACGATTTATTTGTAATACCGCTCTGTC
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC

>NC_020515|2|2|950176-950541|PILER-CR
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	GATTACCTGCTACACGATTTACCCAACCTTTGCC
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	GCACGAACTCCGCCGTGTTCTTTCATAAAGTTGCG
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	ATTTCTGAAACAGGGATTTGCGTTTCATTCCATTT
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	TTGCTGCCGTCTCTAAATAGCCACTATCAGCAAAT
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	CAAGCAACACGATTTATTTGTAATACCGCTCTGTC
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC

>NC_020515|2|2|950176-950541|CRISPRCasFinder
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	GATTACCTGCTACACGATTTACCCAACCTTTGCC
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	GCACGAACTCCGCCGTGTTCTTTCATAAAGTTGCG
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	ATTTCTGAAACAGGGATTTGCGTTTCATTCCATTT
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	TTGCTGCCGTCTCTAAATAGCCACTATCAGCAAAT
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC	CAAGCAACACGATTTATTTGTAATACCGCTCTGTC
GTTTCAACTCTCAGCCACCTACAGGTAGCTGC

Protein	Signature genes	Signature genes Name	Protein_function
NC_020515.1\|WP_015432289.1\|944516_945932_-\|bifunctional-indole-3-glycerol-phosphate-synthase-TrpC/phosphoribosylanthranilate-isomerase-TrpF	unknown	unknown	gnl\|CDD\|236509
NC_020515.1\|WP_015432296.1\|950876_952001_-\|alanine-racemase	unknown	unknown	gnl\|CDD\|143500
NC_020515.1\|WP_025267144.1\|945983_946292_+\|YqcC-family-protein	unknown	unknown	gnl\|CDD\|377282
NC_020515.1\|WP_025267143.1\|946341_947070_+\|tRNA-pseudouridine(65)-synthase-TruC	unknown	unknown	gnl\|CDD\|182971
NC_020515.1\|WP_025267140.1\|962278_962566_-\|ribosome-associated-translation-inhibitor-RaiA	unknown	unknown	gnl\|CDD\|182378
NC_020515.1\|WP_015432304.1\|959431_961198_+\|aspartate--tRNA-ligase	unknown	unknown	gnl\|CDD\|234775
NC_020515.1\|WP_015432298.1\|953084_953522_+\|NfeD-family-protein	unknown	unknown	gnl\|CDD\|224501
NC_020515.1\|WP_015432301.1\|957816_958269_-\|DUF441-domain-containing-protein	unknown	unknown	gnl\|CDD\|377279
NC_020515.1\|WP_015432305.1\|961312_962227_+\|glutaminase	unknown	unknown	gnl\|CDD\|234880
NC_020515.1\|WP_015432302.1\|958329_958599_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|369525
NC_020515.1\|WP_015432307.1\|962742_963684_+\|LpxL/LpxP-family-Kdo(2)-lipid-IV(A)-lauroyl/palmitoleoyl-acyltransferasee	unknown	unknown	gnl\|CDD\|235880
NC_020515.1\|WP_015432303.1\|958695_959271_-\|nucleotide-exchange-factor-GrpE	unknown	unknown	gnl\|CDD\|184539
NC_020515.1\|WP_015432293.1\|947243_947708_+\|hypothetical-protein	unknown	unknown	unknown
NC_020515.1\|WP_015432295.1\|948686_950093_+\|YcjX-family-protein	unknown	unknown	gnl\|CDD\|367902
NC_020515.1\|WP_015432287.1\|942225_943455_+\|molybdopterin-molybdotransferase-MoeA	unknown	unknown	gnl\|CDD\|182643
NC_020515.1\|WP_015432292.1\|947087_947243_+\|YoaH-family-protein	unknown	unknown	gnl\|CDD\|179941
NC_020515.1\|WP_015432294.1\|947759_948599_-\|CYTH-domain-containing-protein	unknown	unknown	gnl\|CDD\|143624
NC_020515.1\|WP_025267145.1\|941589_942210_+\|MarC-family-protein	unknown	unknown	gnl\|CDD\|225006
NC_020515.1\|WP_015432297.1\|952124_953048_+\|SPFH/Band-7/PHB-domain-protein	unknown	unknown	gnl\|CDD\|223407
NC_020515.1\|WP_015432288.1\|943474_944233_+\|molybdopterin-synthase-adenylyltransferase-MoeB	unknown	unknown	gnl\|CDD\|180204

Protein	Function_ID	Function_description	E-value
NC_020515.1\|WP_015432289.1\|944516_945932_-\|bifunctional-indole-3-glycerol-phosphate-synthase-TrpC/phosphoribosylanthranilate-isomerase-TrpF	gnl\|CDD\|236509	PRK09427, PRK09427, bifunctional indole-3-glycerol-phosphate synthase TrpC/phosphoribosylanthranilate isomerase TrpF.	0
NC_020515.1\|WP_015432296.1\|950876_952001_-\|alanine-racemase	gnl\|CDD\|143500	cd06827, PLPDE_III_AR_proteobact, Type III Pyridoxal 5-phosphate (PLP)-Dependent Enzymes, Proteobacterial Alanine Racemases. This subfamily is composed mainly of proteobacterial alanine racemases (EC 5.1.1.1), fold type III PLP-dependent enzymes that catalyze the interconversion between L- and D-alanine, which is an essential component of the peptidoglycan layer of bacterial cell walls. hese proteins are similar to other bacterial ARs and are fold type III PLP-dependent enzymes containing contains an N-terminal PLP-binding TIM-barrel domain and a C-terminal beta-sandwich domain. They exist as homodimers with active sites that lie at the interface between the TIM barrel domain of one subunit and the beta-sandwich domain of the other subunit. Homodimer formation and the presence of the PLP cofactor are required for catalytic activity.	0
NC_020515.1\|WP_025267144.1\|945983_946292_+\|YqcC-family-protein	gnl\|CDD\|377282	pfam04287, DUF446, tRNA pseudouridine synthase C. This family is suggested to be the catalytic domain of tRNA pseudouridine synthase C by association. The structure has been solved for one member, as Structure 2HGK, which by inference is designated in this way.	4.97483e-38
NC_020515.1\|WP_025267143.1\|946341_947070_+\|tRNA-pseudouridine(65)-synthase-TruC	gnl\|CDD\|182971	PRK11112, PRK11112, tRNA pseudouridine synthase C; Provisional.	5.81629e-161
NC_020515.1\|WP_025267140.1\|962278_962566_-\|ribosome-associated-translation-inhibitor-RaiA	gnl\|CDD\|182378	PRK10324, PRK10324, ribosome-associated translation inhibitor RaiA.	1.67791e-31
NC_020515.1\|WP_015432304.1\|959431_961198_+\|aspartate--tRNA-ligase	gnl\|CDD\|234775	PRK00476, aspS, aspartyl-tRNA synthetase; Validated.	0
NC_020515.1\|WP_015432298.1\|953084_953522_+\|NfeD-family-protein	gnl\|CDD\|224501	COG1585, COG1585, Membrane protein implicated in regulation of membrane protease activity [Posttranslational modification, protein turnover, chaperones / Intracellular trafficking and secretion].	1.01202e-28
NC_020515.1\|WP_015432301.1\|957816_958269_-\|DUF441-domain-containing-protein	gnl\|CDD\|377279	pfam04284, DUF441, Protein of unknown function (DUF441). Predicted to be an integral membrane protein.	3.07983e-44
NC_020515.1\|WP_015432302.1\|958329_958599_-\|hypothetical-protein	gnl\|CDD\|369525	pfam07798, DUF1640, Protein of unknown function (DUF1640). This family consists of sequences derived from hypothetical eukaryotic proteins. A region approximately 100 residues in length is featured.	0.000805204
NC_020515.1\|WP_015432307.1\|962742_963684_+\|LpxL/LpxP-family-Kdo(2)-lipid-IV(A)-lauroyl/palmitoleoyl-acyltransferasee	gnl\|CDD\|235880	PRK06860, PRK06860, lipid A biosynthesis lauroyl acyltransferase; Provisional.	0
NC_020515.1\|WP_015432303.1\|958695_959271_-\|nucleotide-exchange-factor-GrpE	gnl\|CDD\|184539	PRK14150, PRK14150, heat shock protein GrpE; Provisional.	1.24116e-91
NC_020515.1\|WP_015432305.1\|961312_962227_+\|glutaminase	gnl\|CDD\|234880	PRK00971, PRK00971, glutaminase; Provisional.	5.74121e-165
NC_020515.1\|WP_015432295.1\|948686_950093_+\|YcjX-family-protein	gnl\|CDD\|367902	pfam04317, DUF463, YcjX-like family, DUF463. These proteins possess a P-loop motif.	0
NC_020515.1\|WP_015432287.1\|942225_943455_+\|molybdopterin-molybdotransferase-MoeA	gnl\|CDD\|182643	PRK10680, PRK10680, molybdopterin biosynthesis protein MoeA; Provisional.	0
NC_020515.1\|WP_015432292.1\|947087_947243_+\|YoaH-family-protein	gnl\|CDD\|179941	PRK05114, PRK05114, YoaH family protein.	3.9368e-17
NC_020515.1\|WP_015432294.1\|947759_948599_-\|CYTH-domain-containing-protein	gnl\|CDD\|143624	cd07756, CYTH-like_Pase_CHAD, Uncharacterized subgroup of the CYTH-like superfamily having an associated CHAD domain. This subgroup belongs to the CYTH-like (also known as triphosphate tunnel metalloenzyme (TTM)-like) superfamily. Members of this superfamily hydrolyze triphosphate-containing substrates, require metal cations as cofactors, and have a unique active site located at the center of an eight-stranded antiparallel beta barrel tunnel (the triphosphate tunnel). A number of proteins in this subgroup also contain a C-terminal CHAD (Conserved Histidine Alpha-helical Domain) domain which may participate in metal chelation or act as a phosphor-acceptor. The name CYTH originated from the gene designation for bacterial class IV adenylyl cyclases (CyaB) and from thiamine triphosphatase. Class IV adenylate cyclases catalyze the conversion of ATP to 3',5'-cyclic AMP (cAMP) and PPi. Thiamine triphosphatase is a soluble cytosolic enzyme which converts thiamine triphosphate to thiamine diphosphate. This domain superfamily also contains RNA triphosphatases, membrane-associated polyphosphate polymerases, tripolyphosphatases, nucleoside triphosphatases, nucleoside tetraphosphatases and other proteins with unknown functions. Proteins of this subgroup have not been characterized.	8.67051e-68
NC_020515.1\|WP_025267145.1\|941589_942210_+\|MarC-family-protein	gnl\|CDD\|225006	COG2095, MarC, Multiple antibiotic transporter [Intracellular trafficking and secretion].	2.21918e-47
NC_020515.1\|WP_015432297.1\|952124_953048_+\|SPFH/Band-7/PHB-domain-protein	gnl\|CDD\|223407	COG0330, HflC, Membrane protease subunits, stomatin/prohibitin homologs [Posttranslational modification, protein turnover, chaperones].	4.37774e-75
NC_020515.1\|WP_015432288.1\|943474_944233_+\|molybdopterin-synthase-adenylyltransferase-MoeB	gnl\|CDD\|180204	PRK05690, PRK05690, molybdopterin biosynthesis protein MoeB; Provisional.	3.69221e-164

>NC_020515.1|WP_015432295.1|948686_950093_+|YcjX-family-protein
MFNRIQNKVTHFVQRGFDNHIRLAVTGLSRSGKTAFITSFVDQLLHIQPEKNAHLNLFAAARNGQILSVKRIAQGDPTVPRFEYDRNRACFEQEEPKWCPSTTGISEIRLAIRYRNRSSFSRIFKETSTLYLDIFDYPGEWLLDLPLMSQSFKEWSQAQQVVHTGERAKLAQAWLNEVKKLDLSAVADENRLADLSDIYTAYLLQCKQAGMQYIQPGRFVLPNAERGAPVYQFFPLLDLSEQEWQSLENSAVNSVFHTLKKRYRQYQDKIVKPFYKDYFSQFDRQVILADCLTPLNHSQQAFIEMKIGLQQLFKHFHYGNRSLFHRLFSSNIDKLLFAATKADHITSDQLPNLESLMRQLVQEGGRHAEFDGIETAYQAISAIRATEAVTVSENGQSFKAIRGVRTKDKRQVTQFAGSVPNRLPNSDFWQNHTFDFDQFEPRKIDFDQALPHLRMDSVLQFLLGDLFE
>NC_020515.1|WP_015432294.1|947759_948599_-|CYTH-domain-containing-protein
MQDEIEIKIMLLPENIALIKQWLTQQPIQKYQRQTLGNTYFDTPELFFAKAQMGLRVRTKNNQHEITLKMKGDIVGGLHIRPEYNLDLPNSQPDFKRLVSHYNLQIANSDAIAENLQATFSTDFERESWLLNYQHSQIEIALDMGIIKNRFGEEPICEVEFELKQGNLADLFALIQNMPKRDGMWLSSLSKAQRGYFVGRMDKIAKEIEKLSACHLDNMAEVERYQVQQQMADFLRLSPEATILRSQLGLEHIPLGDIFDYLTSARYLDQQLSHMQQRC
>NC_020515.1|WP_015432293.1|947243_947708_+|hypothetical-protein
MKKLLALASIATVGALTVSVQAVAQTAEIPRAYLSVMDMSGKVAKNTGNQIYSVSNSNLQLCWAASGIPLEPANLNKVTELFIAPSVKAKFVKPGATIKVENERSAITSMMGSADGKMIQTCWRFDQNDPLGKYKLRLNVNDIQFDDLVFELVK
>NC_020515.1|WP_015432292.1|947087_947243_+|YoaH-family-protein
MDNLLLNLTHEQQQQAVEKIQQLMQQGVSSGEAIAIVAQELRHTYSKNSEN
>NC_020515.1|WP_025267143.1|946341_947070_+|tRNA-pseudouridine(65)-synthase-TruC
MTLDILYRDESLIAINKPAGMLVHRSWLDKHETVFAMQTLRDQIGQHVFPIHRLDRPTSGVLLFALNAEMARQMSEQFEQHQLMKSYLAVVRGYLNGEARIDYPLKVKLDKIADKFSTAKEAQQAVTDYKHLAGIEMPYPAGKYQTARYSLVQLWPQTGRKHQLRRHMKHLFHPIMGDTNYGDLHQNRALTENTGCDRLFLHANSLQFTHPDTLQKIMINAPLDHQWQQLFLQFGWNFPQFF
>NC_020515.1|WP_025267144.1|945983_946292_+|YqcC-family-protein
MKTQVRVQLDRLQVVLHRYQLWETEAPSTEKLASTQPFALDTLTATQWLQWIFIPRMHALLDANAELPTNFAVSPYLEESLKNERYLAELVQPIVEIEKLLK
>NC_020515.1|WP_015432289.1|944516_945932_-|bifunctional-indole-3-glycerol-phosphate-synthase-TrpC/phosphoribosylanthranilate-isomerase-TrpF
MQNQPTILQKIVKDKALWVANAEQQFPLSLFQAQLQPSDRDFYAALAKGSHQQPVYILECKKASPSKGLIRAEFDLDAIAQVYKHYASVISVLTDEQYFQGNFHFISQVRNQVSQPILCKDFMISSYQVYLARYHHADAILLMLSVVDDPTYRQLSDLAHSLGMGVLTETSNEQEFERALALGAKVIGVNNRNLHDLSIDMNRIIALVAKYRDQIPADVRLISESGIYDHSQVKSISQSAHGFLIGSSLMGSHDLNNAVRAVIFGENKICGLTRPQDVQAAYANGALYGGLIFAEKSVRALSLRQAQELVVQALLRFVGVFQNQAVEFVVKIAKQLELYAVQLHGNEDELYIAQLAEQLEGNVQIWKAISIDVDAQRFDFADNPLIQRYILDSKTTNQQGGTGKTFNWALIPEKLKSKAILAGGINLENLEQALQVGCLGVDLNSGLETAKGIKHADKIAQAFQLIRLHAK
>NC_020515.1|WP_015432288.1|943474_944233_+|molybdopterin-synthase-adenylyltransferase-MoeB
MELSDQEMLRYNRQIVLKNVDFDGQEKLKASRVLVVGVGGLGCAASQYLASGGIGHLTLVDFDSVSLSNLQRQILHTDATIGEPKVFSAQQRLQQLNPHIEIKPIHAELSELQWQTLIPEYDVVLDCTDNVNIRNLLNQICFQHKIPLVSGSAIRFEGQLSVFRYTDNEPCYQCLSTLFGENILSCVEAGVIAPIVGVVGSLQALECIKVLLGIGKTLSGKLLMIDGLNFSVREMKLPKQPHCQICKNFLES
>NC_020515.1|WP_015432287.1|942225_943455_+|molybdopterin-molybdotransferase-MoeA
MSLLSLSSALENLLTCLPMPNQFETIALHEAANRVLAEDVFSPINVPNFDNSAMDGYAISLQNFVENQPLAVIGKAFAGNPFSGKIQSGQCVRIMTGAKIPENTDAVVMQEDTIIRDDGTMMITKPVKLGANIRRVGEDVAQGSLVLAKGSQLNVSSLPLLASLGIAEVKVFPKVKVAILSTGDELVSVGEPLNEGQIYDTNRFTVRLMLEKLNCEILDFGTLPDNPEIFERTFVQAQRQADVLITSGGVSVGEADFTKTVIEKLGKIDFWKIAMKPGKPFAFGKLEKAWFFGLPGNPVSALVTFYQLAQPALMKLAGFSAEKIANFSPKLTACAAVSMKKAVGRQDFQRGFFYADENGQLVVKTVGTQGSHIFSAFNESNCFIVLEQERGNVEVGERVVIQPFNLLLS
>NC_020515.1|WP_025267145.1|941589_942210_+|MarC-family-protein
MFDSLVVQFVVLWAVIDPVGSIPVYLAKTIGLSPDDRRKIARNATLIAAGILLFFLVLGQWLLEAMQIPLSAFQIAGGLVLLLFALTMIFGQSKPDQEIKMKSSLSELAVYPLAVPSIASPGAMMAVVLLTDNHRYNLLEQAITGGIMLAVVAITYVLLLLANHIQKYIGNAGAAIISRVMGLILSAVAVNNILVGLRDFVQQAAL
>NC_020515.1|WP_015432296.1|950876_952001_-|alanine-racemase
MKPATATLSGKNLRHNMQLIKTLAPHSKHCAVAKANAYGQGLHHLVRNLNDLVDGFCVARIKEALAIQESGYEGKILLLEGFFDREELLKTVSRRFDTVVHCIEQLELLEQVSAEWQTEQAKGFWKRKAKIYFPITVWLKIDTGMHRLGIHPEQIAEFHQRLTACALVEKVNFVSHFSRADEPDCGYTEKQIAIFEQATKGYEGERSISASNGILYWQQAHYDWVRPGIIMHGISPHTHPITSLGFKPVMKFASSLIAIRSHKAGEPVGYGGAWVAEQDTKIGVIAVGYGDGYPRNAPPGTPVFINGRRVPIVGRVSMDMMTVDLGINSNDKVGDEAELWGENLLIEEVANAMGVINYELITKLTPRVLFEYLD
>NC_020515.1|WP_015432297.1|952124_953048_+|SPFH/Band-7/PHB-domain-protein
MFGLDFSLLPILFVLLIVFTLSSTIKIVPQGYHWTVERFGRYTKTLTPGLNIVVPFIERIGRKINMMEQVLDIPSQEVISKDNASVAIDAVCFVQVVEARRAAYEVNNLEDAIVNLTMTNMRTVLGSMDLDDMLSQRDLINGKLLTIVDEATNIWGVKVTRIEIRDVRPPRELVEAMNAQMKAERNKRADILEAEGIRQAEILRAEGEKQSRILKAEGERQEAFLQAEARERAAEAEAKATQMVSEAIAKGDTTAINYFIAQKYTEALKDIGSADNSKVVLMPLEAGNLIGSVAGIAELLKSNKSSS
>NC_020515.1|WP_015432298.1|953084_953522_+|NfeD-family-protein
MDWLLNWAGWLSLGFLLLALELIVPGVFIMWWGLAALILAAVSALLPNLEPAYQVTIFAVLAITFSLVWWKYQHGKDQQDDEHSSLNSREHAMIGARGVIVEILENGIARGKFDDTTWRVIGENLRIGDSVQVFRVEGITLFVKK
>NC_020515.1|WP_015432301.1|957816_958269_-|DUF441-domain-containing-protein
MTLQFNAVALLLVVLIILGFISQNSAVTISAAVLLIMQQTLLSKFIPFVDQYGLKIGIIILTIGVLSPLVSGRITLPELSQLLNWKMALSIVAGVLVAWLGGRGVNLMGSQPVLVTGLLIGTVIGVAFLKGVPVGPLIAAGILSLVLGKS
>NC_020515.1|WP_015432302.1|958329_958599_-|hypothetical-protein
MDSTMSLRFDKLRFVKRLQEANQTPEMAEAFADALDGALEQSQSPLATKADLQLELEKLKNEINTTIFKAITLNITILGFLMAMMKFIN
>NC_020515.1|WP_015432303.1|958695_959271_-|nucleotide-exchange-factor-GrpE
MTNQTEKEPVEQEIVEETVEQAVETEQENANVEIDPLDAANARIAELEAYIAEADAREQDIALRARAEIENVRRRAEQDVEKAHKFALEKFSKELLNVVDNLERGLQALEGAEESVKSGVELTHKGLVSTLAQFGVEAVGVVGEAFNPDLHQAISMQPAEGIEANHISVVLQKGYTLQGRVIRPAMVMVAG
>NC_020515.1|WP_015432304.1|959431_961198_+|aspartate--tRNA-ligase
MMRSHYCGALNRSNVGEQVTLSGWVHRVRNLGRFIFMQIRDREGIVQVFFDEKDEALFKAASALRNEACVQIKGEVIARDESQINPDMATGEIEVLVRELKVYNNAEVLPLDFNQNNTEEQRLKYRYLDLRRPEMAEKLKTRAKITSFVRRFMDDHGFLDIETPMLTKATPEGARDYLVPSRVHKGKFYALPQSPQLFKQLLMMSGFDRYYQIVKCFRDEDLRADRQPEFTQIDVETSFMTAEEVRSTMEEMIHGLWLDRLNVDLGKFPMMTWQEAMTRFGSDKPDLRNPLELVDVADILKNVEFKVFAEPANSPDGRVTVLRVPNGASLTRKQIDEYTQFVGIYGAKGLAWAKINDVNAGLEGVQSPVAKFLNEEVINALIERTQAQTGDILFFGADKWQTVTDSMGALRLKVGRDLELTDLTAWKPLWVVDFPMFERDEEGNLSAMHHPFTSPKDFTPEQLAADPTNAVANAYDMVINGYEVGGGSVRIYDPKMQQTVFNILGINEEEQREKFGFLLDALKFGTPPHAGLAFGLDRLTMLITGTENIRDVIAFPKTTAAACLMTEAPSFANPQALEELAIRTIPQE
>NC_020515.1|WP_015432305.1|961312_962227_+|glutaminase
MNYQTIISTIYQRIRAEENGGELAMYIPELANISPDKFGVAYFDLKDSTIGVGDYQEKFSIQSIVKVLSLVFAYKHLGDSIWKRVNVEPSGTSFNSLLQLETDCGIPRNPFINAGAIVICDILLSLFENPKQAFLDFVRDLANNSNIHYSEKVAESEKAVGYRNFALCYYIKSFGNIQNDPNEVLDFYFHICSIEMSCEEIAYAFSFLANDGVKLHDNQQVLNKSQIKRTNALMQTCGFYDESGEFAFRVGLPGKSGVGGGIVAIMPNHHCITVWSPKLNEKGNSYRGMKFLEEFTTQTKISVF
>NC_020515.1|WP_025267140.1|962278_962566_-|ribosome-associated-translation-inhibitor-RaiA
MTINISSKQMDVTPAIRSHIEDRLAKLNKWHTQLINPHFMIHKLPNEYEVEASIGTPIGDLFAKAKHEDLYQAINEVEVKLEGQLVKLKEKKEHR
>NC_020515.1|WP_015432307.1|962742_963684_+|LpxL/LpxP-family-Kdo(2)-lipid-IV(A)-lauroyl/palmitoleoyl-acyltransferasee
MAAEKSLPPFQMTFLHPKFWGLWLGLGLFRLMLCLPYPVLVKIGLGLGKLFGSLGFGKKRIRIAKKNLELCFPEYSEAQIQQILAKNIQSVGMAIIETGMAWFWSDKRILKWSKIEGLEHLKNPPQGTGIIFVGVHFLTLELGARIVGLHHQGIGVYRPNDNPLLDWIQFRGRVRSNKAMLDRKDLRGMIKVLRAGETIWYAPDHDYGRKNSVYVPFFAFPTACTTAGTRMLLRSAPNSIVVPFTPMRNEDFSGYTVKISPMVDFGDCDDEISTATKMNKVVEQEIMQAQSQYMWLHRRFKHLPDGTDGKLYS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020515_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020515_3

956232-956348

Orphan

Consensus_repeat	Method
AGTGCCATCATTAGAATGGTTTTCCCCCCCCCCT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_020515_3

>merge|NC_020515|3|956232-956348|CRISPRCasFinder
AGTGCCATCATTAGAATGGTTTTCCCCCCCCCCTCTCACGCTCGCGCGTCGTCGTACGTCGTACGTACGTACGTAGTACGTTAAGTGCCATCATTAGAATGGTTTTCCCCCCTCCCT

>NC_020515|3|3|956232-956348|CRISPRCasFinder
AGTGCCATCATTAGAATGGTTTTCCCCCCCCCCT	CTCACGCTCGCGCGTCGTCGTACGTCGTACGTACGTACGTAGTACGTTA
AGTGCCATCATTAGAATGGTTTTCCCCCCTCCCT

Protein	Signature genes	Signature genes Name	Protein_function
NC_020515.1\|WP_015432289.1\|944516_945932_-\|bifunctional-indole-3-glycerol-phosphate-synthase-TrpC/phosphoribosylanthranilate-isomerase-TrpF	unknown	unknown	gnl\|CDD\|236509
NC_020515.1\|WP_015432296.1\|950876_952001_-\|alanine-racemase	unknown	unknown	gnl\|CDD\|143500
NC_020515.1\|WP_025267144.1\|945983_946292_+\|YqcC-family-protein	unknown	unknown	gnl\|CDD\|377282
NC_020515.1\|WP_025267143.1\|946341_947070_+\|tRNA-pseudouridine(65)-synthase-TruC	unknown	unknown	gnl\|CDD\|182971
NC_020515.1\|WP_025267140.1\|962278_962566_-\|ribosome-associated-translation-inhibitor-RaiA	unknown	unknown	gnl\|CDD\|182378
NC_020515.1\|WP_015432304.1\|959431_961198_+\|aspartate--tRNA-ligase	unknown	unknown	gnl\|CDD\|234775
NC_020515.1\|WP_015432298.1\|953084_953522_+\|NfeD-family-protein	unknown	unknown	gnl\|CDD\|224501
NC_020515.1\|WP_015432301.1\|957816_958269_-\|DUF441-domain-containing-protein	unknown	unknown	gnl\|CDD\|377279
NC_020515.1\|WP_015432305.1\|961312_962227_+\|glutaminase	unknown	unknown	gnl\|CDD\|234880
NC_020515.1\|WP_015432302.1\|958329_958599_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|369525
NC_020515.1\|WP_015432307.1\|962742_963684_+\|LpxL/LpxP-family-Kdo(2)-lipid-IV(A)-lauroyl/palmitoleoyl-acyltransferasee	unknown	unknown	gnl\|CDD\|235880
NC_020515.1\|WP_015432303.1\|958695_959271_-\|nucleotide-exchange-factor-GrpE	unknown	unknown	gnl\|CDD\|184539
NC_020515.1\|WP_015432308.1\|963771_964368_+\|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase	unknown	unknown	gnl\|CDD\|234648
NC_020515.1\|WP_015432293.1\|947243_947708_+\|hypothetical-protein	unknown	unknown	unknown
NC_020515.1\|WP_015432295.1\|948686_950093_+\|YcjX-family-protein	unknown	unknown	gnl\|CDD\|367902
NC_020515.1\|WP_015432310.1\|964695_965160_+\|YcgN-family-cysteine-cluster-protein	unknown	unknown	gnl\|CDD\|235356
NC_020515.1\|WP_015432292.1\|947087_947243_+\|YoaH-family-protein	unknown	unknown	gnl\|CDD\|179941
NC_020515.1\|WP_015432309.1\|964378_964696_+\|YbjQ-family-protein	unknown	unknown	gnl\|CDD\|376657
NC_020515.1\|WP_015432294.1\|947759_948599_-\|CYTH-domain-containing-protein	unknown	unknown	gnl\|CDD\|143624
NC_020515.1\|WP_015432297.1\|952124_953048_+\|SPFH/Band-7/PHB-domain-protein	unknown	unknown	gnl\|CDD\|223407

Protein	Function_ID	Function_description	E-value
NC_020515.1\|WP_015432289.1\|944516_945932_-\|bifunctional-indole-3-glycerol-phosphate-synthase-TrpC/phosphoribosylanthranilate-isomerase-TrpF	gnl\|CDD\|236509	PRK09427, PRK09427, bifunctional indole-3-glycerol-phosphate synthase TrpC/phosphoribosylanthranilate isomerase TrpF.	0
NC_020515.1\|WP_015432296.1\|950876_952001_-\|alanine-racemase	gnl\|CDD\|143500	cd06827, PLPDE_III_AR_proteobact, Type III Pyridoxal 5-phosphate (PLP)-Dependent Enzymes, Proteobacterial Alanine Racemases. This subfamily is composed mainly of proteobacterial alanine racemases (EC 5.1.1.1), fold type III PLP-dependent enzymes that catalyze the interconversion between L- and D-alanine, which is an essential component of the peptidoglycan layer of bacterial cell walls. hese proteins are similar to other bacterial ARs and are fold type III PLP-dependent enzymes containing contains an N-terminal PLP-binding TIM-barrel domain and a C-terminal beta-sandwich domain. They exist as homodimers with active sites that lie at the interface between the TIM barrel domain of one subunit and the beta-sandwich domain of the other subunit. Homodimer formation and the presence of the PLP cofactor are required for catalytic activity.	0
NC_020515.1\|WP_025267144.1\|945983_946292_+\|YqcC-family-protein	gnl\|CDD\|377282	pfam04287, DUF446, tRNA pseudouridine synthase C. This family is suggested to be the catalytic domain of tRNA pseudouridine synthase C by association. The structure has been solved for one member, as Structure 2HGK, which by inference is designated in this way.	4.97483e-38
NC_020515.1\|WP_025267143.1\|946341_947070_+\|tRNA-pseudouridine(65)-synthase-TruC	gnl\|CDD\|182971	PRK11112, PRK11112, tRNA pseudouridine synthase C; Provisional.	5.81629e-161
NC_020515.1\|WP_025267140.1\|962278_962566_-\|ribosome-associated-translation-inhibitor-RaiA	gnl\|CDD\|182378	PRK10324, PRK10324, ribosome-associated translation inhibitor RaiA.	1.67791e-31
NC_020515.1\|WP_015432304.1\|959431_961198_+\|aspartate--tRNA-ligase	gnl\|CDD\|234775	PRK00476, aspS, aspartyl-tRNA synthetase; Validated.	0
NC_020515.1\|WP_015432298.1\|953084_953522_+\|NfeD-family-protein	gnl\|CDD\|224501	COG1585, COG1585, Membrane protein implicated in regulation of membrane protease activity [Posttranslational modification, protein turnover, chaperones / Intracellular trafficking and secretion].	1.01202e-28
NC_020515.1\|WP_015432301.1\|957816_958269_-\|DUF441-domain-containing-protein	gnl\|CDD\|377279	pfam04284, DUF441, Protein of unknown function (DUF441). Predicted to be an integral membrane protein.	3.07983e-44
NC_020515.1\|WP_015432302.1\|958329_958599_-\|hypothetical-protein	gnl\|CDD\|369525	pfam07798, DUF1640, Protein of unknown function (DUF1640). This family consists of sequences derived from hypothetical eukaryotic proteins. A region approximately 100 residues in length is featured.	0.000805204
NC_020515.1\|WP_015432307.1\|962742_963684_+\|LpxL/LpxP-family-Kdo(2)-lipid-IV(A)-lauroyl/palmitoleoyl-acyltransferasee	gnl\|CDD\|235880	PRK06860, PRK06860, lipid A biosynthesis lauroyl acyltransferase; Provisional.	0
NC_020515.1\|WP_015432303.1\|958695_959271_-\|nucleotide-exchange-factor-GrpE	gnl\|CDD\|184539	PRK14150, PRK14150, heat shock protein GrpE; Provisional.	1.24116e-91
NC_020515.1\|WP_015432308.1\|963771_964368_+\|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase	gnl\|CDD\|234648	PRK00120, PRK00120, dITP/XTP pyrophosphatase; Reviewed.	6.42249e-118
NC_020515.1\|WP_015432305.1\|961312_962227_+\|glutaminase	gnl\|CDD\|234880	PRK00971, PRK00971, glutaminase; Provisional.	5.74121e-165
NC_020515.1\|WP_015432295.1\|948686_950093_+\|YcjX-family-protein	gnl\|CDD\|367902	pfam04317, DUF463, YcjX-like family, DUF463. These proteins possess a P-loop motif.	0
NC_020515.1\|WP_015432310.1\|964695_965160_+\|YcgN-family-cysteine-cluster-protein	gnl\|CDD\|235356	PRK05170, PRK05170, YcgN family cysteine cluster protein.	2.47605e-79
NC_020515.1\|WP_015432292.1\|947087_947243_+\|YoaH-family-protein	gnl\|CDD\|179941	PRK05114, PRK05114, YoaH family protein.	3.9368e-17
NC_020515.1\|WP_015432309.1\|964378_964696_+\|YbjQ-family-protein	gnl\|CDD\|376657	pfam01906, YbjQ_1, Putative heavy-metal-binding. From comparative structural analysis, this family is likely to be a heavy-metal binding domain. The domain oligomerizes as a pentamer. The domain is about 100 amino acids long and is found in prokaryotes.	5.67362e-43
NC_020515.1\|WP_015432294.1\|947759_948599_-\|CYTH-domain-containing-protein	gnl\|CDD\|143624	cd07756, CYTH-like_Pase_CHAD, Uncharacterized subgroup of the CYTH-like superfamily having an associated CHAD domain. This subgroup belongs to the CYTH-like (also known as triphosphate tunnel metalloenzyme (TTM)-like) superfamily. Members of this superfamily hydrolyze triphosphate-containing substrates, require metal cations as cofactors, and have a unique active site located at the center of an eight-stranded antiparallel beta barrel tunnel (the triphosphate tunnel). A number of proteins in this subgroup also contain a C-terminal CHAD (Conserved Histidine Alpha-helical Domain) domain which may participate in metal chelation or act as a phosphor-acceptor. The name CYTH originated from the gene designation for bacterial class IV adenylyl cyclases (CyaB) and from thiamine triphosphatase. Class IV adenylate cyclases catalyze the conversion of ATP to 3',5'-cyclic AMP (cAMP) and PPi. Thiamine triphosphatase is a soluble cytosolic enzyme which converts thiamine triphosphate to thiamine diphosphate. This domain superfamily also contains RNA triphosphatases, membrane-associated polyphosphate polymerases, tripolyphosphatases, nucleoside triphosphatases, nucleoside tetraphosphatases and other proteins with unknown functions. Proteins of this subgroup have not been characterized.	8.67051e-68
NC_020515.1\|WP_015432297.1\|952124_953048_+\|SPFH/Band-7/PHB-domain-protein	gnl\|CDD\|223407	COG0330, HflC, Membrane protease subunits, stomatin/prohibitin homologs [Posttranslational modification, protein turnover, chaperones].	4.37774e-75

>NC_020515.1|WP_015432298.1|953084_953522_+|NfeD-family-protein
MDWLLNWAGWLSLGFLLLALELIVPGVFIMWWGLAALILAAVSALLPNLEPAYQVTIFAVLAITFSLVWWKYQHGKDQQDDEHSSLNSREHAMIGARGVIVEILENGIARGKFDDTTWRVIGENLRIGDSVQVFRVEGITLFVKK
>NC_020515.1|WP_015432297.1|952124_953048_+|SPFH/Band-7/PHB-domain-protein
MFGLDFSLLPILFVLLIVFTLSSTIKIVPQGYHWTVERFGRYTKTLTPGLNIVVPFIERIGRKINMMEQVLDIPSQEVISKDNASVAIDAVCFVQVVEARRAAYEVNNLEDAIVNLTMTNMRTVLGSMDLDDMLSQRDLINGKLLTIVDEATNIWGVKVTRIEIRDVRPPRELVEAMNAQMKAERNKRADILEAEGIRQAEILRAEGEKQSRILKAEGERQEAFLQAEARERAAEAEAKATQMVSEAIAKGDTTAINYFIAQKYTEALKDIGSADNSKVVLMPLEAGNLIGSVAGIAELLKSNKSSS
>NC_020515.1|WP_015432296.1|950876_952001_-|alanine-racemase
MKPATATLSGKNLRHNMQLIKTLAPHSKHCAVAKANAYGQGLHHLVRNLNDLVDGFCVARIKEALAIQESGYEGKILLLEGFFDREELLKTVSRRFDTVVHCIEQLELLEQVSAEWQTEQAKGFWKRKAKIYFPITVWLKIDTGMHRLGIHPEQIAEFHQRLTACALVEKVNFVSHFSRADEPDCGYTEKQIAIFEQATKGYEGERSISASNGILYWQQAHYDWVRPGIIMHGISPHTHPITSLGFKPVMKFASSLIAIRSHKAGEPVGYGGAWVAEQDTKIGVIAVGYGDGYPRNAPPGTPVFINGRRVPIVGRVSMDMMTVDLGINSNDKVGDEAELWGENLLIEEVANAMGVINYELITKLTPRVLFEYLD
>NC_020515.1|WP_015432295.1|948686_950093_+|YcjX-family-protein
MFNRIQNKVTHFVQRGFDNHIRLAVTGLSRSGKTAFITSFVDQLLHIQPEKNAHLNLFAAARNGQILSVKRIAQGDPTVPRFEYDRNRACFEQEEPKWCPSTTGISEIRLAIRYRNRSSFSRIFKETSTLYLDIFDYPGEWLLDLPLMSQSFKEWSQAQQVVHTGERAKLAQAWLNEVKKLDLSAVADENRLADLSDIYTAYLLQCKQAGMQYIQPGRFVLPNAERGAPVYQFFPLLDLSEQEWQSLENSAVNSVFHTLKKRYRQYQDKIVKPFYKDYFSQFDRQVILADCLTPLNHSQQAFIEMKIGLQQLFKHFHYGNRSLFHRLFSSNIDKLLFAATKADHITSDQLPNLESLMRQLVQEGGRHAEFDGIETAYQAISAIRATEAVTVSENGQSFKAIRGVRTKDKRQVTQFAGSVPNRLPNSDFWQNHTFDFDQFEPRKIDFDQALPHLRMDSVLQFLLGDLFE
>NC_020515.1|WP_015432294.1|947759_948599_-|CYTH-domain-containing-protein
MQDEIEIKIMLLPENIALIKQWLTQQPIQKYQRQTLGNTYFDTPELFFAKAQMGLRVRTKNNQHEITLKMKGDIVGGLHIRPEYNLDLPNSQPDFKRLVSHYNLQIANSDAIAENLQATFSTDFERESWLLNYQHSQIEIALDMGIIKNRFGEEPICEVEFELKQGNLADLFALIQNMPKRDGMWLSSLSKAQRGYFVGRMDKIAKEIEKLSACHLDNMAEVERYQVQQQMADFLRLSPEATILRSQLGLEHIPLGDIFDYLTSARYLDQQLSHMQQRC
>NC_020515.1|WP_015432293.1|947243_947708_+|hypothetical-protein
MKKLLALASIATVGALTVSVQAVAQTAEIPRAYLSVMDMSGKVAKNTGNQIYSVSNSNLQLCWAASGIPLEPANLNKVTELFIAPSVKAKFVKPGATIKVENERSAITSMMGSADGKMIQTCWRFDQNDPLGKYKLRLNVNDIQFDDLVFELVK
>NC_020515.1|WP_015432292.1|947087_947243_+|YoaH-family-protein
MDNLLLNLTHEQQQQAVEKIQQLMQQGVSSGEAIAIVAQELRHTYSKNSEN
>NC_020515.1|WP_025267143.1|946341_947070_+|tRNA-pseudouridine(65)-synthase-TruC
MTLDILYRDESLIAINKPAGMLVHRSWLDKHETVFAMQTLRDQIGQHVFPIHRLDRPTSGVLLFALNAEMARQMSEQFEQHQLMKSYLAVVRGYLNGEARIDYPLKVKLDKIADKFSTAKEAQQAVTDYKHLAGIEMPYPAGKYQTARYSLVQLWPQTGRKHQLRRHMKHLFHPIMGDTNYGDLHQNRALTENTGCDRLFLHANSLQFTHPDTLQKIMINAPLDHQWQQLFLQFGWNFPQFF
>NC_020515.1|WP_025267144.1|945983_946292_+|YqcC-family-protein
MKTQVRVQLDRLQVVLHRYQLWETEAPSTEKLASTQPFALDTLTATQWLQWIFIPRMHALLDANAELPTNFAVSPYLEESLKNERYLAELVQPIVEIEKLLK
>NC_020515.1|WP_015432289.1|944516_945932_-|bifunctional-indole-3-glycerol-phosphate-synthase-TrpC/phosphoribosylanthranilate-isomerase-TrpF
MQNQPTILQKIVKDKALWVANAEQQFPLSLFQAQLQPSDRDFYAALAKGSHQQPVYILECKKASPSKGLIRAEFDLDAIAQVYKHYASVISVLTDEQYFQGNFHFISQVRNQVSQPILCKDFMISSYQVYLARYHHADAILLMLSVVDDPTYRQLSDLAHSLGMGVLTETSNEQEFERALALGAKVIGVNNRNLHDLSIDMNRIIALVAKYRDQIPADVRLISESGIYDHSQVKSISQSAHGFLIGSSLMGSHDLNNAVRAVIFGENKICGLTRPQDVQAAYANGALYGGLIFAEKSVRALSLRQAQELVVQALLRFVGVFQNQAVEFVVKIAKQLELYAVQLHGNEDELYIAQLAEQLEGNVQIWKAISIDVDAQRFDFADNPLIQRYILDSKTTNQQGGTGKTFNWALIPEKLKSKAILAGGINLENLEQALQVGCLGVDLNSGLETAKGIKHADKIAQAFQLIRLHAK
>NC_020515.1|WP_015432301.1|957816_958269_-|DUF441-domain-containing-protein
MTLQFNAVALLLVVLIILGFISQNSAVTISAAVLLIMQQTLLSKFIPFVDQYGLKIGIIILTIGVLSPLVSGRITLPELSQLLNWKMALSIVAGVLVAWLGGRGVNLMGSQPVLVTGLLIGTVIGVAFLKGVPVGPLIAAGILSLVLGKS
>NC_020515.1|WP_015432302.1|958329_958599_-|hypothetical-protein
MDSTMSLRFDKLRFVKRLQEANQTPEMAEAFADALDGALEQSQSPLATKADLQLELEKLKNEINTTIFKAITLNITILGFLMAMMKFIN
>NC_020515.1|WP_015432303.1|958695_959271_-|nucleotide-exchange-factor-GrpE
MTNQTEKEPVEQEIVEETVEQAVETEQENANVEIDPLDAANARIAELEAYIAEADAREQDIALRARAEIENVRRRAEQDVEKAHKFALEKFSKELLNVVDNLERGLQALEGAEESVKSGVELTHKGLVSTLAQFGVEAVGVVGEAFNPDLHQAISMQPAEGIEANHISVVLQKGYTLQGRVIRPAMVMVAG
>NC_020515.1|WP_015432304.1|959431_961198_+|aspartate--tRNA-ligase
MMRSHYCGALNRSNVGEQVTLSGWVHRVRNLGRFIFMQIRDREGIVQVFFDEKDEALFKAASALRNEACVQIKGEVIARDESQINPDMATGEIEVLVRELKVYNNAEVLPLDFNQNNTEEQRLKYRYLDLRRPEMAEKLKTRAKITSFVRRFMDDHGFLDIETPMLTKATPEGARDYLVPSRVHKGKFYALPQSPQLFKQLLMMSGFDRYYQIVKCFRDEDLRADRQPEFTQIDVETSFMTAEEVRSTMEEMIHGLWLDRLNVDLGKFPMMTWQEAMTRFGSDKPDLRNPLELVDVADILKNVEFKVFAEPANSPDGRVTVLRVPNGASLTRKQIDEYTQFVGIYGAKGLAWAKINDVNAGLEGVQSPVAKFLNEEVINALIERTQAQTGDILFFGADKWQTVTDSMGALRLKVGRDLELTDLTAWKPLWVVDFPMFERDEEGNLSAMHHPFTSPKDFTPEQLAADPTNAVANAYDMVINGYEVGGGSVRIYDPKMQQTVFNILGINEEEQREKFGFLLDALKFGTPPHAGLAFGLDRLTMLITGTENIRDVIAFPKTTAAACLMTEAPSFANPQALEELAIRTIPQE
>NC_020515.1|WP_015432305.1|961312_962227_+|glutaminase
MNYQTIISTIYQRIRAEENGGELAMYIPELANISPDKFGVAYFDLKDSTIGVGDYQEKFSIQSIVKVLSLVFAYKHLGDSIWKRVNVEPSGTSFNSLLQLETDCGIPRNPFINAGAIVICDILLSLFENPKQAFLDFVRDLANNSNIHYSEKVAESEKAVGYRNFALCYYIKSFGNIQNDPNEVLDFYFHICSIEMSCEEIAYAFSFLANDGVKLHDNQQVLNKSQIKRTNALMQTCGFYDESGEFAFRVGLPGKSGVGGGIVAIMPNHHCITVWSPKLNEKGNSYRGMKFLEEFTTQTKISVF
>NC_020515.1|WP_025267140.1|962278_962566_-|ribosome-associated-translation-inhibitor-RaiA
MTINISSKQMDVTPAIRSHIEDRLAKLNKWHTQLINPHFMIHKLPNEYEVEASIGTPIGDLFAKAKHEDLYQAINEVEVKLEGQLVKLKEKKEHR
>NC_020515.1|WP_015432307.1|962742_963684_+|LpxL/LpxP-family-Kdo(2)-lipid-IV(A)-lauroyl/palmitoleoyl-acyltransferasee
MAAEKSLPPFQMTFLHPKFWGLWLGLGLFRLMLCLPYPVLVKIGLGLGKLFGSLGFGKKRIRIAKKNLELCFPEYSEAQIQQILAKNIQSVGMAIIETGMAWFWSDKRILKWSKIEGLEHLKNPPQGTGIIFVGVHFLTLELGARIVGLHHQGIGVYRPNDNPLLDWIQFRGRVRSNKAMLDRKDLRGMIKVLRAGETIWYAPDHDYGRKNSVYVPFFAFPTACTTAGTRMLLRSAPNSIVVPFTPMRNEDFSGYTVKISPMVDFGDCDDEISTATKMNKVVEQEIMQAQSQYMWLHRRFKHLPDGTDGKLYS
>NC_020515.1|WP_015432308.1|963771_964368_+|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase
MTKQKIVLATGNKGKVKEMADVLADFGFEVVAQSEFGIESPEETGLTFVENALIKARYAAQMTGLPAIADDSGLAVDALGGEPGLYSARYAGVDGDDAANRQKLLTEMANVADENRTAKFVSCIVMLQHATDPTPKIAIGECFGTILNEERGENGFGYDSLFFYPPKNCSFAELETVEKKKISHRAIALQSLKQQLQK
>NC_020515.1|WP_015432309.1|964378_964696_+|YbjQ-family-protein
MIITTTPTIEGKQISEYKGLVFGEVVVGANIIRDFFAGITDIIGGRSGAYESKLNAARKEALKELEFEARKAGANAVVGVSFDYQTLGTKDMFVVAATGTAVVVQ
>NC_020515.1|WP_015432310.1|964695_965160_+|YcgN-family-cysteine-cluster-protein
MLQKNSQNLPLEPNFWQKKSLLEMNETEWEALCDGCGKCCYRKYIQGRGKRERLYYTRVACNLLDVETGKCTNYPNRFKIECDCTKLTKKNLPDFGWLPQTCAYRLLYEGKPLPDWHPLISKDAHSVKTAGMLIPNGIHEKDVIDWFEFVIDEI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020515_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020515_4

1552928-1554892

TypeI

Consensus_repeat	Method
GTTTCAACTCACAGCTACGCGTACGTAGCTGG	PILER-CR
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CRISPRCasFinder
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CRT

29 spacers

cas3,cas5,cas8c,cas7,cas4,cas1,cas2

The CRISPR arrays of NC_020515_4

>merge|NC_020515|4|1552928-1554892|PILER-CR,CRISPRCasFinder,CRT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAACAGGTTAAATCTAGACGAGATAATGGAGATTGCCAACCAGCTACGTACGCGTAGCTGTGAGTTGAAACTGTTAAAAATAAACCCTGCACGGGGCAGGGTCGGCCAGCTACGTACGCGTAGCTGTGAGTTGAAACACCGAAACCGAAATCTGGGCAAGTGAGAGCGACACCAGCTACGTACGCGTAGCTGTGAGTTGAAACACATTAGGAACGCAAGACCAAGCCTCATTACAAGGCCCAGCTACGTACGCGTAGCTGTGAGTTGAAACTTGCAGAGGATAGAAATTTCCGCACCCATATTTTCGCCAGCTACGTACGCGTAGCTGTGAGTTGAAACTTGATATTATTGATAATATGGAAAAAGAGATGACCCAGCTACGTACGCGTAGCTGTGAGTTGAAACACTCGAAGCCTTAGAGCCGGATTTTGTGCCAATCCCAGCTACGTACGCGTAGCTGTGAGTTGAAACAAATGAAAGCGTATAAATCTCGCCACTTTGCAATCCAGCTACGTACGCGTAGCTGTGAGTTGAAACTGGCGTGGTAAGTACCGATAACATTCCCGAAGACCCAGCTACGTACGCGTAGCTGTGAGTTGAAACTATTACAACATTTGACAATCAAACATTATGGGAGCCAGCTACGTACGCGTAGCTGTGAGTTGAAACCAAAGGTGCTATTGTACTTAGTAGCAAGTCAATTCCCAGCTACGTACGCGTAGCTGTGAGTTGAAACTAAGCAATTATAAAGAAAGAATAAAAGACGTTGCCCAGCTACGTACGCGTAGCTGTGAGTTGAAACATCACCGTCCAACTTACCTTTGTTGAATGCTTGTGAGCCAGCTACGTACGCGTAGCTGTGAGTTGAAACTAATATGCCCTTGCATAAATTCCACTTTGCCGTGCCAGCTACGTACGCGTAGCTGTGAGTTGAAACCTGCCGAGTAATAAGCCAAGCAGAATTTCAAGCACCAGCTACGTACGCGTAGCTGTGAGTTGAAACTTGTGAACATCGAGCAAAATATCGGTCATTGCACCCAGCTACGTACGCGTAGCTGTGAGTTGAAACATCATAAGTGGCTTTACGAGTGGCTCTTGGCTCTTCCAGCTACGTACGCGTAGCTGTGAGTTGAAACCCTAGCCCCCAAGCACCTTTGGCAATAGTCTGTGCCAGCTACGTACGCGTAGCTGTGAGTTGAAACGAGATTTAGTAATTGCTCCATTGAAACGTGGAGACCAGCTACGTACGCGTAGCTGTGAGTTGAAACGTGCCGAGACTTGCCGGTGTATCGGTCACAGCTAAACCCAGCTACGTACGCGTAGCTGTGAGTTGAAACATAGCCGCCCAGCTCCTTAATCTTATCCAGCGACATCCAGCTACGTACGCGTAGCTGTGAGTTGAAACAAATTATGCCTTAATAATACTTTAAGTTTTTAAAACCAGCTACGTACGCGTAGCTGTGAGTTGAAACTCTTCTGAGCTTTCCAGGCATTAAAACCTTGCTCACCAGCTACGTACGCGTAGCTGTGAGTTGAAACTCAGGGTCGCATAACTCCACTTTGCAGCGATGTTCCAGCTACGTACGCGTAGCTGTGAGTTGAAACAGTGAATATACCGCTCAGCGTGCGTTAGAAAATCCCAGCTACGTACGCGTAGCTGTGAGTTGAAACGCCGTTTAGATAACCTTGTCAGGCTTGGCACGATTCCAGCTACGTACGCGTAGCTGTGAGTTGAAACACTATTTTTCACGTTATAGAGATCGTATTAGCAACCAGCTACGTACGCGTAGCTGTGAGTTGAAACATTACCCTGCCAAATTATCGGTTGGCTGAGTTCGCCAGCTACGTACGCGTAGCTGTGAGTTGAAACTCATCGGGCTTTAAGGTCAAGGCATTATCCACTAACCAGCTACGTACGCGTAGCTGGTGAGCTAAAA

>NC_020515|4|3|1552928-1554825|PILER-CR
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AGGTTAAATCTAGACGAGATAATGGAGATTGCCAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TGTTAAAAATAAACCCTGCACGGGGCAGGGTCGG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACCGAAACCGAAATCTGGGCAAGTGAGAGCGACA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACATTAGGAACGCAAGACCAAGCCTCATTACAAGGC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGCAGAGGATAGAAATTTCCGCACCCATATTTTCG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGATATTATTGATAATATGGAAAAAGAGATGAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACTCGAAGCCTTAGAGCCGGATTTTGTGCCAATC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AAATGAAAGCGTATAAATCTCGCCACTTTGCAAT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TGGCGTGGTAAGTACCGATAACATTCCCGAAGAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TATTACAACATTTGACAATCAAACATTATGGGAG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CAAAGGTGCTATTGTACTTAGTAGCAAGTCAATTC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TAAGCAATTATAAAGAAAGAATAAAAGACGTTGC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATCACCGTCCAACTTACCTTTGTTGAATGCTTGTGAG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TAATATGCCCTTGCATAAATTCCACTTTGCCGTG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CTGCCGAGTAATAAGCCAAGCAGAATTTCAAGCA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGTGAACATCGAGCAAAATATCGGTCATTGCAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATCATAAGTGGCTTTACGAGTGGCTCTTGGCTCTT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CCTAGCCCCCAAGCACCTTTGGCAATAGTCTGTG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GAGATTTAGTAATTGCTCCATTGAAACGTGGAGA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GTGCCGAGACTTGCCGGTGTATCGGTCACAGCTAAAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATAGCCGCCCAGCTCCTTAATCTTATCCAGCGACAT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AAATTATGCCTTAATAATACTTTAAGTTTTTAAAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCTTCTGAGCTTTCCAGGCATTAAAACCTTGCTCA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCAGGGTCGCATAACTCCACTTTGCAGCGATGTT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AGTGAATATACCGCTCAGCGTGCGTTAGAAAATC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GCCGTTTAGATAACCTTGTCAGGCTTGGCACGATT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACTATTTTTCACGTTATAGAGATCGTATTAGCAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATTACCCTGCCAAATTATCGGTTGGCTGAGTTCG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC

>NC_020515|4|4|1552928-1554892|CRISPRCasFinder
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AGGTTAAATCTAGACGAGATAATGGAGATTGCCAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TGTTAAAAATAAACCCTGCACGGGGCAGGGTCGG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACCGAAACCGAAATCTGGGCAAGTGAGAGCGACA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACATTAGGAACGCAAGACCAAGCCTCATTACAAGGC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGCAGAGGATAGAAATTTCCGCACCCATATTTTCG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGATATTATTGATAATATGGAAAAAGAGATGAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACTCGAAGCCTTAGAGCCGGATTTTGTGCCAATC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AAATGAAAGCGTATAAATCTCGCCACTTTGCAAT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TGGCGTGGTAAGTACCGATAACATTCCCGAAGAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TATTACAACATTTGACAATCAAACATTATGGGAG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CAAAGGTGCTATTGTACTTAGTAGCAAGTCAATTC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TAAGCAATTATAAAGAAAGAATAAAAGACGTTGC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATCACCGTCCAACTTACCTTTGTTGAATGCTTGTGAG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TAATATGCCCTTGCATAAATTCCACTTTGCCGTG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CTGCCGAGTAATAAGCCAAGCAGAATTTCAAGCA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGTGAACATCGAGCAAAATATCGGTCATTGCAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATCATAAGTGGCTTTACGAGTGGCTCTTGGCTCTT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CCTAGCCCCCAAGCACCTTTGGCAATAGTCTGTG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GAGATTTAGTAATTGCTCCATTGAAACGTGGAGA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GTGCCGAGACTTGCCGGTGTATCGGTCACAGCTAAAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATAGCCGCCCAGCTCCTTAATCTTATCCAGCGACAT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AAATTATGCCTTAATAATACTTTAAGTTTTTAAAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCTTCTGAGCTTTCCAGGCATTAAAACCTTGCTCA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCAGGGTCGCATAACTCCACTTTGCAGCGATGTT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AGTGAATATACCGCTCAGCGTGCGTTAGAAAATC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GCCGTTTAGATAACCTTGTCAGGCTTGGCACGATT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACTATTTTTCACGTTATAGAGATCGTATTAGCAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATTACCCTGCCAAATTATCGGTTGGCTGAGTTCG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCATCGGGCTTTAAGGTCAAGGCATTATCCACTAA
CCAGCTACGTACGCGTAGCTGGTGAGCTAAAA

>NC_020515|4|3|1552928-1554892|CRT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AGGTTAAATCTAGACGAGATAATGGAGATTGCCAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TGTTAAAAATAAACCCTGCACGGGGCAGGGTCGG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACCGAAACCGAAATCTGGGCAAGTGAGAGCGACA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACATTAGGAACGCAAGACCAAGCCTCATTACAAGGC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGCAGAGGATAGAAATTTCCGCACCCATATTTTCG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGATATTATTGATAATATGGAAAAAGAGATGAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACTCGAAGCCTTAGAGCCGGATTTTGTGCCAATC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AAATGAAAGCGTATAAATCTCGCCACTTTGCAAT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TGGCGTGGTAAGTACCGATAACATTCCCGAAGAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TATTACAACATTTGACAATCAAACATTATGGGAG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CAAAGGTGCTATTGTACTTAGTAGCAAGTCAATTC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TAAGCAATTATAAAGAAAGAATAAAAGACGTTGC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATCACCGTCCAACTTACCTTTGTTGAATGCTTGTGAG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TAATATGCCCTTGCATAAATTCCACTTTGCCGTG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CTGCCGAGTAATAAGCCAAGCAGAATTTCAAGCA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TTGTGAACATCGAGCAAAATATCGGTCATTGCAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATCATAAGTGGCTTTACGAGTGGCTCTTGGCTCTT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	CCTAGCCCCCAAGCACCTTTGGCAATAGTCTGTG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GAGATTTAGTAATTGCTCCATTGAAACGTGGAGA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GTGCCGAGACTTGCCGGTGTATCGGTCACAGCTAAAC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATAGCCGCCCAGCTCCTTAATCTTATCCAGCGACAT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AAATTATGCCTTAATAATACTTTAAGTTTTTAAAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCTTCTGAGCTTTCCAGGCATTAAAACCTTGCTCA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCAGGGTCGCATAACTCCACTTTGCAGCGATGTT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	AGTGAATATACCGCTCAGCGTGCGTTAGAAAATC
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	GCCGTTTAGATAACCTTGTCAGGCTTGGCACGATT
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ACTATTTTTCACGTTATAGAGATCGTATTAGCAA
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	ATTACCCTGCCAAATTATCGGTTGGCTGAGTTCG
CCAGCTACGTACGCGTAGCTGTGAGTTGAAAC	TCATCGGGCTTTAAGGTCAAGGCATTATCCACTAA
CCAGCTACGTACGCGTAGCTGGTGAGCTAAAA

Protein	Signature genes	Signature genes Name	Protein_function
NC_020515.1\|WP_015432819.1\|1546998_1549209_-\|GTP-diphosphokinase	unknown	unknown	gnl\|CDD\|182797
NC_020515.1\|WP_015432829.1\|1563415_1563709_+\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_020515.1\|WP_015432824.1\|1557546_1558287_+\|type-I-C-CRISPR-associated-protein-Cas5	cas5	cd09752_cas5_CAS-I-C	gnl\|CDD\|187782
NC_020515.1\|WP_015432812.1\|1538619_1539774_+\|hypothetical-protein	unknown	unknown	unknown
NC_020515.1\|WP_015432827.1\|1561147_1561810_+\|CRISPR-associated-protein-Cas4	cas4	cd09637_cas4_CAS-I:CAS-II:CAS-V	gnl\|CDD\|273040
NC_020515.1\|WP_015432828.1\|1562357_1563371_+\|type-I-C-CRISPR-associated-endonuclease-Cas1	cas1	cd09721_cas1_CAS-I-C	gnl\|CDD\|188360
NC_020515.1\|WP_025328951.1\|1555072_1557535_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|224124
NC_020515.1\|WP_015432816.1\|1544111_1544723_+\|hypothetical-protein	unknown	unknown	unknown
NC_020515.1\|WP_015432817.1\|1544796_1545987_-\|1-deoxy-D-xylulose-5-phosphate-reductoisomerase	unknown	unknown	gnl\|CDD\|235472
NC_020515.1\|WP_015432826.1\|1560304_1561147_+\|type-I-C-CRISPR-associated-protein-Cas7/Csd2	cas7	cd09689_cas7_CAS-I-C	gnl\|CDD\|187820
NC_020515.1\|WP_025266962.1\|1540020_1541175_-\|methionine-adenosyltransferase	unknown	unknown	gnl\|CDD\|235374
NC_020515.1\|WP_015432814.1\|1541454_1542369_+\|homocysteine-S-methyltransferase-family-protein	unknown	unknown	gnl\|CDD\|376828
NC_020515.1\|WP_015432833.1\|1566798_1567740_+\|peptidylprolyl-isomerase	unknown	unknown	gnl\|CDD\|236758
NC_020515.1\|WP_025328950.1\|1558283_1560275_+\|type-I-C-CRISPR-associated-protein-Cas8c/Csd1	cas8c	pfam09709_cas8c_CAS-I-C	gnl\|CDD\|187887
NC_020515.1\|WP_015432820.1\|1549507_1550821_+\|glutamyl-tRNA-reductase	unknown	unknown	gnl\|CDD\|234592
NC_020515.1\|WP_015432818.1\|1546069_1546990_-\|glycosyltransferase	unknown	unknown	gnl\|CDD\|182223
NC_020515.1\|WP_015432832.1\|1565309_1566737_+\|bifunctional-D-glycero-beta-D-manno-heptose-7-phosphate-kinase/D-glycero-beta-D-manno-heptose-1-phosphate-adenylyltransferase-HldE	unknown	unknown	gnl\|CDD\|183085
NC_020515.1\|WP_015432834.1\|1567839_1568706_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	unknown	unknown	gnl\|CDD\|234708
NC_020515.1\|WP_025266960.1\|1551140_1552658_+\|ribosome-biogenesis-GTPase-Der	unknown	unknown	gnl\|CDD\|234628
NC_020515.1\|WP_015432815.1\|1542381_1543791_+\|amino-acid-permease	unknown	unknown	gnl\|CDD\|163522

Protein	Function_ID	Function_description	E-value
NC_020515.1\|WP_015432819.1\|1546998_1549209_-\|GTP-diphosphokinase	gnl\|CDD\|182797	PRK10872, relA, (p)ppGpp synthetase I/GTP pyrophosphokinase; Provisional.	0
NC_020515.1\|WP_015432829.1\|1563415_1563709_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	9.8602e-32
NC_020515.1\|WP_015432824.1\|1557546_1558287_+\|type-I-C-CRISPR-associated-protein-Cas5	gnl\|CDD\|187782	cd09651, Cas5_I-C, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex; in subtype I-C this protein might be the endoribonuclease that generates crRNAs; also known as DevS family.	3.40471e-83
NC_020515.1\|WP_015432832.1\|1565309_1566737_+\|bifunctional-D-glycero-beta-D-manno-heptose-7-phosphate-kinase/D-glycero-beta-D-manno-heptose-1-phosphate-adenylyltransferase-HldE	gnl\|CDD\|183085	PRK11316, PRK11316, bifunctional D-glycero-beta-D-manno-heptose-7-phosphate kinase/D-glycero-beta-D-manno-heptose 1-phosphate adenylyltransferase HldE.	0
NC_020515.1\|WP_015432827.1\|1561147_1561810_+\|CRISPR-associated-protein-Cas4	gnl\|CDD\|273040	TIGR00372, conserved_hypothetical_protein, CRISPR-associated protein Cas4. This model represents a family of proteins associated with CRISPR repeats in a wide set of prokaryotic genomes. This scope of this model has been broadened since it was first built to describe an archaeal subset only. The function of the protein is undefined. Distantly related proteins, excluded from this model, include ORFs from Mycobacteriophage D29 and Sulfolobus islandicus filamentous virus and a region of the Schizosaccharomyces pombe DNA replication helicase Dna2p.	1.24734e-40
NC_020515.1\|WP_015432828.1\|1562357_1563371_+\|type-I-C-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|188360	TIGR03640, cas1_DVULG, CRISPR-associated endonuclease Cas1, subtype I-C/DVULG. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the DVULG subtype of CRISPR/Cas system.	0
NC_020515.1\|WP_025328951.1\|1555072_1557535_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	2.55874e-53
NC_020515.1\|WP_015432817.1\|1544796_1545987_-\|1-deoxy-D-xylulose-5-phosphate-reductoisomerase	gnl\|CDD\|235472	PRK05447, PRK05447, 1-deoxy-D-xylulose 5-phosphate reductoisomerase; Provisional.	0
NC_020515.1\|WP_015432826.1\|1560304_1561147_+\|type-I-C-CRISPR-associated-protein-Cas7/Csd2	gnl\|CDD\|187820	cd09689, Cas7_I-C, CRISPR/Cas system-associated RAMP superfamily protein Cas7. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas7 is a RAMP superfamily protein; Subunit of the Cascade complex; also known as Csd2 family.	2.84518e-111
NC_020515.1\|WP_025266962.1\|1540020_1541175_-\|methionine-adenosyltransferase	gnl\|CDD\|235374	PRK05250, PRK05250, S-adenosylmethionine synthetase; Validated.	0
NC_020515.1\|WP_015432814.1\|1541454_1542369_+\|homocysteine-S-methyltransferase-family-protein	gnl\|CDD\|376828	pfam02574, S-methyl_trans, Homocysteine S-methyltransferase. This is a family of related homocysteine S-methyltransferases enzymes: 5-methyltetrahydrofolate--homocysteine S-methyltransferases also known EC:2.1.1.13; Betaine--homocysteine S-methyltransferase (vitamin B12 dependent), EC:2.1.1.5; and Homocysteine S-methyltransferase, EC:2.1.1.10,.	5.4891e-69
NC_020515.1\|WP_015432833.1\|1566798_1567740_+\|peptidylprolyl-isomerase	gnl\|CDD\|236758	PRK10770, PRK10770, peptidyl-prolyl cis-trans isomerase SurA; Provisional.	4.48128e-36
NC_020515.1\|WP_025328950.1\|1558283_1560275_+\|type-I-C-CRISPR-associated-protein-Cas8c/Csd1	gnl\|CDD\|187887	cd09757, Cas8c_I-C, CRISPR/Cas system-associated protein Cas8c. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Zn-finger domain containing protein, distant homologs of Cas8 proteins; signature gene for I-C subtype; also known as Csd1 family.	5.07541e-175
NC_020515.1\|WP_015432820.1\|1549507_1550821_+\|glutamyl-tRNA-reductase	gnl\|CDD\|234592	PRK00045, hemA, glutamyl-tRNA reductase; Reviewed.	0
NC_020515.1\|WP_015432818.1\|1546069_1546990_-\|glycosyltransferase	gnl\|CDD\|182223	PRK10073, PRK10073, putative glycosyl transferase; Provisional.	5.36683e-32
NC_020515.1\|WP_015432834.1\|1567839_1568706_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	gnl\|CDD\|234708	PRK00274, ksgA, 16S rRNA (adenine(1518)-N(6)/adenine(1519)-N(6))-dimethyltransferase RsmA.	2.22796e-147
NC_020515.1\|WP_025266960.1\|1551140_1552658_+\|ribosome-biogenesis-GTPase-Der	gnl\|CDD\|234628	PRK00093, PRK00093, GTP-binding protein Der; Reviewed.	0
NC_020515.1\|WP_015432815.1\|1542381_1543791_+\|amino-acid-permease	gnl\|CDD\|163522	TIGR03810, arginine-ornithine_antiporter, arginine-ornithine antiporter. Members of this protein family are the arginine/ornithine antiporter, ArcD. This exchanger of ornithine for arginine occurs in a system with arginine deiminase, ornithine carbamoyltransferase, and carbamate kinase, with together turn arginine to ornithine with the generation of ATP and release of CO2. [Transport and binding proteins, Amino acids, peptides and amines].	2.40128e-153

>NC_020515.1|WP_025266960.1|1551140_1552658_+|ribosome-biogenesis-GTPase-Der
MTPVVALVGRPNVGKSTLFNRLTRTRDALVADFPGLTRDRKYGQANIAGHDFIVIDTGGIDGTEEGVEEKMAEQSLLAIEEADVVLFLVDARAGLVPADIGIAQYLRQRDKTTVVVANKTDGIDADSHIAEFYQLGLGDVEPIAAAQGRGVTQLIEQVLAPLAEKIEEQAVENAENSANTTEEQDEWENNFDFENEEDTALLDEALEESEEESDKNIKIAIVGRPNVGKSTLTNRILGEDRVVVYDMPGTTRDSIYIPMERDGQQYTIIDTAGVRKRGKVHLAVEKFSVIKTLQAIQDANVVLLTIDARDGVSDQDLSLLGFILNAGKSLVIVVNKWDGLSQDIKDNVKSELDRRLDFIDFARVHFISALHGSGVGNLFDSIQEAYACATKKMTTAMLTRILQMATDEHQPPLVNGRRVKLKYAHPGGYNPPIIVIHGNQIERLPDSYKRYLSNYYRKSLKIIGSPIRVLFQEGNNPFAGKRNKLTPSQLRKRKRLMKFIKKNRK
>NC_020515.1|WP_015432820.1|1549507_1550821_+|glutamyl-tRNA-reductase
MTILALGINHKTASVSLREKVAFVESKRQLAFEQISQQNLAESAVILSTCNRTELYFHQADIPPQEDHPENIAWRERCFQWFAEIHQLDHNELRQCIYFKQNMDTARHLMEVACGLDSLILGEPQILGQVKQAYQDSEYFYHQQGKSISTNLSRLFQKTFSTAKRVRSETEIGASAVSVAYAACGLARQIFDDFAKLRFLLVGAGETIELVARYLIQHGAQNLMVANRTHIRAEMLAEKLETPMQILSLSALQVGLNQADVVISSTGSPDLLISKEMVETAQKQRRFDPMLLIDIAVPRDIDEKAGELDSVYAYSVDDLQHIIQQNLAQRQQAAEQAKEIVEQECKDFFAWLKQQQSSQLIKHYRQNAEEIRLDLLEKARNALEQGQDSEKILQELSYKLMNQLLHAPTSALQNLAKDGNVKGLQRFSQALKLDDIN
>NC_020515.1|WP_015432819.1|1546998_1549209_-|GTP-diphosphokinase
MVAIRHSHQLDPNNFELASWSAGLKMSPVTFDELQTAWRYAEEKLDTEQLHLMWVGLEMVEILHGLNMDDDSLVAAMLFPLVKHNIADLAQIKEQFGNGVKNLVKGVLEMENIRQLNANNASDLQIDNIRRMLLAMVDDFRCVVIKLAERIVYLRDTEHHSEEDLVLAAKECSHIYAPLANRLGIGQLKWELEDYSFRALHPQDYRQIAKFDLAERRLDREQFIADFVAHLTACIGEEIDNVQVYGRPKHIYSIWKKMQKKNLRFDQLFDIRAVRIIVQNLEECYTALSIVHSHYKHLPEHFDDYIADPKPNGYQSLHTVVLGKGDKPIEVQIRTQKMHDDAELGVAAHWKYKEGAGAGRSGYEEKIVWLRKLLAWQNDIADSGEMVDDLRSQVFDDRVYVFTPKGEVIDLPSNATPLDFAYSIHSEIGHRCIGAKVAGKIVPFTYILQMGDQVEIITQKNPNPSRDWLNPSQGFVNTPRARSKIIAWFKKLDREKNLPIGKEMLESEMVKHQFSLKQIEDYALPRYNLKQLDDLYAAIGGGDIKLNNLMNYLQGKLVKTSAEQADEAILKHMAHKAQHTQTKTGRAGAIIVDGVGNLMHHIARCCQPIPGDKIVGYITQGRGISIHRADCEQLFDLQSSSPERVVDAEWGGNFTSGFSLVIRVIANDRNGLLRDVSAIMANEKVNVIGVASRTDIKRSIATIDIEVELNNIELLDKLLKRIMQLDDVIEAKRLSN
>NC_020515.1|WP_015432818.1|1546069_1546990_-|glycosyltransferase
MTSPKISFIIPIYNTAIYLSECIESILTQRVELEIILVDDGSTDDSLTICLNYVKKYSFITLVHSQNKGQSAARNKAINLAQGKYIYFIDSDDYITGDHFPEIIRVADQYGVDMIRLQAEKVAQLTGKRLAIPTLKANNNVNQGYLLSGKETLSLMVQQTWIPAICWTLIRREFLLKHQLNFIEGIKAEDQLFYLQLLTIDPNATLIELPFWVYCYRIRPNSITTTINPAYFYDHFRMIELINQYFEQHNLLSDESIYHDGKHIVLNLCRTAFNMLNKFPPEVRHECENYLTQNWQNLTNIWNYFK
>NC_020515.1|WP_015432817.1|1544796_1545987_-|1-deoxy-D-xylulose-5-phosphate-reductoisomerase
MKKLVILGSTGSIGKSTLSVVKHNPEKYAVFALVGGKNVALMTEQAVQFRPEFVAMDDENAAKQLAQNLKQANVNCEVVAGQKAICELAAHPEVDQVMAAIVGAAGLLPTLSAVQAGKTVLLANKESLVTCGQLFIDEAKKSGAKLLPVDSEHNAIFQSLPPEAQEKVGFCPLAELGVSKIILTGSGGPFRIKPLAEFSAITPEQAVAHPNWSMGKKISVDSATMMNKGLEYIEARWLFNASADEMEIIIHPQSIIHSMVRYIDGSVIAQMGNPDMRTPIAHTMAYPDRIHAGVAPLDFFQLKELTFIEPDFVRYPNLKLAMDAFTEGQYATTAMNAANEVAVDAFLNGRIRFTDIVAVNRATVENITPIAVREIADVLHIDKLAREVAQQQIFQC
>NC_020515.1|WP_015432816.1|1544111_1544723_+|hypothetical-protein
MVLIFTGLYYFFGELISILFSDVGLSSYTKHTTIELLLPKDFVVNEKSGSLTPLFYTMQLAFQLQAWNFILGYIICVTYITGQKLRLLGVLFSLLFSIGSSIISASQGGHYSTFGYLQNLGFEVTFLIGNLAMVAIGFAIDNNHIKRFKYYSIIAGLIGLSCIISTVFITTAYTPWLERISIYSLMIWEISLGFAVLKAMESK
>NC_020515.1|WP_015432815.1|1542381_1543791_+|amino-acid-permease
MSNKKIGLISLTALVLSSMIGSGIFSLPQNMAEVAGAEALLIGWGITGVGIIFLGLSFFFISRLRPDLDGGIYTYAREGFGELVGFMSAWGYWLCATIGIVGYLVVAFEGIGTFTDSETNIIFGQGNTLAAFIGASIIVWLVHILVASGVKEAASVNLVATIVKVFPLVLFIGLAIWYFSPNTFTQDIQATSLNNGVSDQVKNTMLITLWVFTGVEGASVLSAHARKKSDVGLATVLGIIIALVLYVAITVLSLGILPRETIANMSNPSMAGLLEAMIGSSGKIIITLCLIVSVLASYVSWTMYSAEVPYRGAKNGAFPKILDKLNANDVPINSLWFTGFVVQFCLFLVLLTGKSYNALLLISTSMILVPYFLIGAYLLKLAIQQKAKWYIQLTGFIASLYGLWIVYAAGIDYLLLSVLLYVPGIGLFLYSRRQQQKAPLTTVEKVILTIIALLFIWAVYHSFTQVNWE
>NC_020515.1|WP_015432814.1|1541454_1542369_+|homocysteine-S-methyltransferase-family-protein
MTTHITILDGGMGRELARVGAPFKQPEWSALALYEAPPAVIRVHQDFIHAGAEVITTNSYAVVPFHIGEKRFQADGFTLAKLSGQLAKQAVDTSTNSATDSKKVKIAGSLPPLFGSYRFDLFQADQVERVARPLIDGLSAYADFWLFETQSHSQEVLSVIPFLPHDNRPIWVSFTLQDECLTDTPYLRSGERVVDAVKAVLEQGVQAVLFNCCQPEVIEQAIIAAKQVIGKKAVQLGAYANAFPPQSKEATANDGLDEIRTDLDPNAYLAWAQKWRNAGATIIGGCCGITPAHIQVLAQHLNSN
>NC_020515.1|WP_025266962.1|1540020_1541175_-|methionine-adenosyltransferase
MAINLFTSESVSEGHPDKIADQISDAVLDEILRQDPKARVACETYVKTGMALVGGEITTSAWVDVENLTRQVICDIGYTHSEMGFDGHSCAVLNAIGKQSSDINQGVDRENPLDQGAGDQGIMFGYATNETEVLMPAPITYAHRLMEQQAKVRKSGKLNWLRPDAKSQLTFAYENNKIVGIDAVVLSTQHAEDVDQKTVYEGVMEEIIKPILPSEWLSQNTKFFINPTGRFVIGGPMGDCGLTGRKIIVDTYGGAARHGGGAFSGKDPSKVDRSAAYAARYVAKNIVAAGLADRCEIQLSYAIGVAEPTSIMVETFGTGKVANDVLVKLIYQFFDLRPYGLIKMLDLIRPIYRETAAYGHFGREHFPWEKTDKAAELREAAGLK
>NC_020515.1|WP_015432812.1|1538619_1539774_+|hypothetical-protein
MKKLSLTLVSLLSTSLFAQIQLSPFPMQAIGKAAQLAVSDKDELFIINTQGELWQATPIMNKLSDGFSTQIAPSVAYNRVAGADKQGNFMLWTAKQLYTSTIPLAKQAGMYPLAFATIAVSKQGKQHKLVRIKTKGTQAEITAMASTEVLPDAQPMQIDFKHSAPNQGHIAILAKPDNSTYLHGVLGDAIEAAEVQYLERHTLEPLAEGLSMKGLVFEANRFEHFATNNGAKLVSVMSGNGEGGRTVLIGEQNGKLVLEQSSSSLPNNRWQSPFVFNRKLYAVQMPHLRGKLVEYTPQGAKLAEHSMQDGFSNHRYGEYETNLAASASHFAVLPLRDYRHIAILDSQGQLQTLAQTLPAEIQKTRASKDSVYLLLENGQIWLAQ
>NC_020515.1|WP_025328951.1|1555072_1557535_+|CRISPR-associated-helicase/endonuclease-Cas3
MSKTEFIAHVRKSNKQLQSVSNHLLETASIARTLAAKLDLADAGELLGLMHDFGKYSKKFQTYIRHVTGILTYADLDSEDENNGGDHSTAGAQWIYGRLRKLGAAKNADGKIIGIGELVGQILGLCIASHHGAGLIDCLSPEGSEKPKWRERFDKDDKLTHLSECEKNADAVIINRAEELVGIDLVRLVDKPIRAILNQKEIPFKLKEFYLGCLTRFLFSCLIDADRINTSDFENERQKEIRNLTNTPNWQKAIDKLESHLSGFSIKYPIDGIRREISESCLERSTDQQGIYTLTVPTGGGKTLSSLRYALHHAKLHNLDRIIYIIPYTSIIDQNAQAVRKILGEEWVLEHHSNIEPDQQTWQNKLLSENWDKPIVFTTMVQFLDAWFGSGTRGVRHIHAMTKSVLIFDEIQTLPIKCVHLFCNVLNWLTHFGKSSAVLCTATQPLLNSLKNPHLGQIQLADNAELIGNQFKIRELFDKLSRVEVNYCPQTGGYSLENAGEFLLEQFGQYSSCLFIVNTKKWAQDLYRYCQNRNLPQEALFHLSTNQCSAHRKTIFDKIKARLNNKEPVICISTQLIEAGVDISMACVIRALGGLDSIAQAAGRCNRHGENKGKGQVYVLNLQEPNLESVLPDIYIGQQQSERVFNDFEGQDILQPNAMSQYFDYYFYNRSNEMGYSLPNNYSGTLLDWLSDNAQNTYVPKNNQRKTVFPLLMQSFKSAGKLFQTIDAPTQAVIVPYENAKELIATLCGTDDNEKKYKALSQAQRYSVNVFPNVWKKLQENEAIQETQLGSGIFYLKDRHYTEEYGLSIEETGNLTFYDL
>NC_020515.1|WP_015432824.1|1557546_1558287_+|type-I-C-CRISPR-associated-protein-Cas5
MSNENTFRSRLFSFRVWGRQALFTDPITKIGGEKFTYPVPTYEALKGILRSIYWKPTLIWHISRIRVMKPIQTQAKSTKPLDWNGGNTLAIYTFLHNVEYQVEAYFTWNMHWEELAGDRNVGKHTAIIERMLERGGRQDIFLGTRDCQGYIAPCQFGEGEGFYDKVDEPIDFGLMFHSFGYPEETGNHELISRFWQANMQKGVIKFPAVSDGELKTRFIKKMKPFKPFKRGENVKAVEEEAKELEL
>NC_020515.1|WP_025328950.1|1558283_1560275_+|type-I-C-CRISPR-associated-protein-Cas8c/Csd1
MSWMQKLYRTYEAALQKASNLSEEPLTPIGHTQQNAHIVIVLNGDGEFRTAQVMPPKTAIMLPATESSENRTSGEAPHPLADKIQYVARDYSAYGGEKKAYFQGYLNQLQAWCDSAASHPKVSAVLHYVKKGKVVEDLITAGVFQLGADGKVLSKWVEKGDAPAIFSTLPKTKGEIEFGSALVCWRVEIKGDPQSDTWTDVTVQQSWIDYLALADSQTGFCFIQGKESPVSNMHPAKLRHTGDKAKLISSNDTAGYTFRGRFETAEEAASISTEVSAKAHSALRWLISRQGIRNGEQVTVAWAISGEKVPSPLQDPFDECYDYDLEEISAVENNVESEMPSETRGKIDHSVDLGKNAAEMIKKKYQGYKAKLKAHEQISLLMLDSATPGRMALTYYQEFLPADYFANLDAWIDDFSWYQRHSIETKNGKKNDKRLVWAIVPPSPFAIGNAVYSKSLSDSLKKQLYARLLPVIAGGKSVPIPYDLVQQSFQVACNPHGCENWEWQRNIGVACALYKGWRARHHNESERRTYDMSLDKENRSRDYLYGRLLAVAENIEAYALYLAGEKRSTNAERYMPKFANRPFYTWRNIEIALKPYQERLRNHNKDTGSQALAEITDLFVTEDYTNDSPLSAEFLLGYHCQKMEIARQLAELTAKKSKTTETE
>NC_020515.1|WP_015432826.1|1560304_1561147_+|type-I-C-CRISPR-associated-protein-Cas7/Csd2
MSLTKKIDFALIISVKNANPNGDPLNGNRPRTDFHGFGEITDVCLKRKIRDRLQDAGESIFVQSDEKKTDSMTSLANRAKDKDVGLGSDAFNAKKSSRDETAKKACKKWLDVRSFGQVFAFGKSDDGAGVSIAVRGPVTIHSAFSVAPVSVTSTQITKSVSGEGDGSKKSSDTMGMKHRVDGGVYVAYGAMSPQLAERTGFSDSDAEKIKSVLTKLFEGDASSARPEGSMQVVKLIWWEHNCKSGQYSSAKVHSSLKVNADGSYELNALDSLIPQEIDGF
>NC_020515.1|WP_015432827.1|1561147_1561810_+|CRISPR-associated-protein-Cas4
MLSVLQKTEQNQSLVTEDKQLIVPLSALQHYAFCPRQCALIYNEQAWAENYLTAQGQALHERVDSGEPETRKGVRFERTVHVAAEKLGISGILDLVERDLKTGELKPVEYKRGKPKPEPMDEIQLCAQALCLEEMTGQTINEGALWYMQTRHRVPVVFSDGLRQATLDTIAQVRALLISGKTPLPEYGKHCKACSLVEICQPKLLEKDKSAGYVKGVFEE
>NC_020515.1|WP_015432828.1|1562357_1563371_+|type-I-C-CRISPR-associated-endonuclease-Cas1
MRKLQNTLYITTQGSYLHKERETLVVEQDRKKVAQLPVHSIGHIFCFGNVLVSPFLMGFCGENNVNLAFFTENGRYLGRLQGRQNGNVLLRRAQYKKSETNPEPVARNIIAAKIQASKRVLQRRLRNHGECEPVEQAVTALNMSLKQLQKADNLDLIRGIEGDAASRYFGVFQHLLSEQCEFHFDGRNRRPPRDGVNALLSFLYSIVGKDISGALQGVGLDPQIGFLHADRPGRDSLAQDILEEFRAWWVDRMVLSLINRGQIKPNDFITESGGAVMLKPEVRKLLFQTLQAKKQEKIIHPFLGEEVEIGLLPYIQAMLLARYLRGDLAEYPPFLMR
>NC_020515.1|WP_015432829.1|1563415_1563709_+|CRISPR-associated-endonuclease-Cas2
MMMLITYDISFDDAEGQKRLRRIAKHCLDYGIRAQYSVFECDVTPDQWVKLKQKLLDTYNPETDSLRFYHLGSKWRNKVEHHGTKKAVDIFKDTLIL
>NC_020515.1|WP_015432832.1|1565309_1566737_+|bifunctional-D-glycero-beta-D-manno-heptose-7-phosphate-kinase/D-glycero-beta-D-manno-heptose-1-phosphate-adenylyltransferase-HldE
MMMHYSSQFNHAKVLVLGDVMLDRYWFGSTNRISPEAPVPVVKVQENEERAGGAANVAMNIAALNVPVTLHGLVGQDDAGSALDKLLNSHQIQNHCVALDSHPTITKLRILSRHQQLLRLDFEEGFHNVDSSELLAKLSSEITAYGALILSDYGKGTLNDVQKMIQIARQANVPILIDPKGTDFERYRGATLLTPNMSEFEAVVGHCATEDDIVHKGLKMIADFELSALLVTRSEKGMTLLRPNFEPFHLPTQAREVYDVTGAGDTVISVLATAIADGRNLEEACYIANAAAGVVVGKLGTSTVSPSELEQAIHQRTETGFGVVSEAELKQIVQQSKARGEKIVMTNGCFDILHPGHVSYLENARKLGDRLIVAVNTDNSVKRLKGENRPINDLASRMAVLAGLASVDWVVPFDEDTPQRLIGEILPNLLVKGGDYKVEEIAGHQEVLANGGEVRVLNFENGCSTTNVIKKIQSL
>NC_020515.1|WP_015432833.1|1566798_1567740_+|peptidylprolyl-isomerase
MKFISLKSLFVATFALFAVSQIHAVEERVVASVDGHPIMQSQVLKTLGKRKNTEANRKAATDDLINDFLVQRAIQQSGIKVNTAYVDQVIENMVVQNGITYGQFLDYLDYNNISLNQYRQQIAHQILMDNVKQQAIGQSIRVEPQDVQSLATKMLEEAKTNGKLKTITALQHRVSHILIKTNPILNDAQAKAKLNSIVADIKAGKISFEDAARANSVDYASGAEGGDLGWNFLDAYDKTFAQTAQKSKLGVISAPFKSQFGWHVLKVTDTRQSDRTEDAYFQRAYEQLFDKQAQDASKDWVKALKNRAEIKYY
>NC_020515.1|WP_015432834.1|1567839_1568706_+|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA
MSSNSKKHLGHTARKRFGQNFLHDMNVIHNIVAAINPKKDQFLLEIGPGLGALTEPVAEQVEQLTVVELDRDLAERLRHHPFLHHKLTIIEQDALRFNFREYFESLNLPEGQGVRVFGNLPYNISTPLMFHLFKFHDLVQDMHFMLQKEVVKRLCAAPNSKAYGRLTIMAQYYCQVMPVLEVPPNAFKPAPKVDSAVVRLVPYKTLPYPVKDIYWLNRVTTQAFNQRRKTLRNALSTLFTPEQLEALNIDLNARAENLAIADYTRLANWLCDNPPAAGKIEIIENDVE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020515_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020515_5

1563910-1565142

TypeI

Consensus_repeat	Method
GTTTCAACTCACAGCCACCCGAAGGTGGCTGC	PILER-CR
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CRISPRCasFinder
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CRT

18 spacers

cas2,cas1,cas4,cas7,cas8c,cas5,cas3

The CRISPR arrays of NC_020515_5

>merge|NC_020515|5|1563910-1565142|PILER-CR,CRISPRCasFinder,CRT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAACAAAATTGCGTGGACGGACAATCCGGCGTGGATTTTGGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACTAAAATTATGTTACTACACTTGGTTGACGTAACATGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACGCTTCTGAATATGATGCTCAAGAATGGCTAAATGCGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACACAGTCATAACGTTGGTGCAGCACAAAGCCGTTATGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACTTGCCAGTTTAAGTAATACCATTTCCACAGCAGCTGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACGTGTTTTACCAGGATTTCTTTTGCTAGTGTCTCAGGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACTTTCGCACGTTGTGGCGATAAAGCAGGAAATAAAGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACTAGTTCTTTACTTTAATGAACTAAAAGTACATAAGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACGTACGTAGCTGGATACAAAAGGCGCAACCGTTAGAGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACTTTTATGTACACTAAACGTATAATGAAGTCAATGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACTAAATAACGGAGCAAATCATCAAGACAACTATCAAGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACAAAATGACGTGGTCGGAGCAATGCCGAAAAGCCAAGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACATCTATTGAAGGCTGATAATATGCTTGACTCTGAGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACAATTAAGTACCGTACGTTGATGACGGAACTTGAAGGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACGCTATGGGGGATTCGTCAATTTCAATTTTATGGTGGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACCATTGCAACCTGCCATTCACTACGAAATCTACATGCAGCCACCTTCGGGTGGCTGTGAGTTGAAACCGATAAGCCGGTCAAATTACCGAAATGCTCCAATGCAGCCACCTCCGGGTGGCTGTGAGTTGAAACCTTGCGAGTGTTGATACGGTCAATTAGCGAGAAGTTGCAGCCACCTGCGAGTGGCTGTGAGTTGAAAC

>NC_020515|5|4|1563910-1565142|PILER-CR
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AAAATTGCGTGGACGGACAATCCGGCGTGGATTTTG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAAAATTATGTTACTACACTTGGTTGACGTAACAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GCTTCTGAATATGATGCTCAAGAATGGCTAAATGC
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	ACAGTCATAACGTTGGTGCAGCACAAAGCCGTTAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTGCCAGTTTAAGTAATACCATTTCCACAGCAGCT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GTGTTTTACCAGGATTTCTTTTGCTAGTGTCTCAG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTTCGCACGTTGTGGCGATAAAGCAGGAAATAAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAGTTCTTTACTTTAATGAACTAAAAGTACATAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GTACGTAGCTGGATACAAAAGGCGCAACCGTTAGA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTTTATGTACACTAAACGTATAATGAAGTCAAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAAATAACGGAGCAAATCATCAAGACAACTATCAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AAAATGACGTGGTCGGAGCAATGCCGAAAAGCCAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	ATCTATTGAAGGCTGATAATATGCTTGACTCTGA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AATTAAGTACCGTACGTTGATGACGGAACTTGAAG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GCTATGGGGGATTCGTCAATTTCAATTTTATGGTG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CATTGCAACCTGCCATTCACTACGAAATCTACAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CGATAAGCCGGTCAAATTACCGAAATGCTCCAAT
GCAGCCACCTCCGGGTGGCTGTGAGTTGAAAC	CTTGCGAGTGTTGATACGGTCAATTAGCGAGAAGTT
GCAGCCACCTGCGAGTGGCTGTGAGTTGAAAC

>NC_020515|5|5|1563910-1565142|CRISPRCasFinder
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AAAATTGCGTGGACGGACAATCCGGCGTGGATTTTG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAAAATTATGTTACTACACTTGGTTGACGTAACAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GCTTCTGAATATGATGCTCAAGAATGGCTAAATGC
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	ACAGTCATAACGTTGGTGCAGCACAAAGCCGTTAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTGCCAGTTTAAGTAATACCATTTCCACAGCAGCT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GTGTTTTACCAGGATTTCTTTTGCTAGTGTCTCAG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTTCGCACGTTGTGGCGATAAAGCAGGAAATAAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAGTTCTTTACTTTAATGAACTAAAAGTACATAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GTACGTAGCTGGATACAAAAGGCGCAACCGTTAGA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTTTATGTACACTAAACGTATAATGAAGTCAAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAAATAACGGAGCAAATCATCAAGACAACTATCAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AAAATGACGTGGTCGGAGCAATGCCGAAAAGCCAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	ATCTATTGAAGGCTGATAATATGCTTGACTCTGA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AATTAAGTACCGTACGTTGATGACGGAACTTGAAG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GCTATGGGGGATTCGTCAATTTCAATTTTATGGTG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CATTGCAACCTGCCATTCACTACGAAATCTACAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CGATAAGCCGGTCAAATTACCGAAATGCTCCAAT
GCAGCCACCTCCGGGTGGCTGTGAGTTGAAAC	CTTGCGAGTGTTGATACGGTCAATTAGCGAGAAGTT
GCAGCCACCTGCGAGTGGCTGTGAGTTGAAAC

>NC_020515|5|4|1563910-1565142|CRT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AAAATTGCGTGGACGGACAATCCGGCGTGGATTTTG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAAAATTATGTTACTACACTTGGTTGACGTAACAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GCTTCTGAATATGATGCTCAAGAATGGCTAAATGC
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	ACAGTCATAACGTTGGTGCAGCACAAAGCCGTTAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTGCCAGTTTAAGTAATACCATTTCCACAGCAGCT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GTGTTTTACCAGGATTTCTTTTGCTAGTGTCTCAG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTTCGCACGTTGTGGCGATAAAGCAGGAAATAAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAGTTCTTTACTTTAATGAACTAAAAGTACATAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GTACGTAGCTGGATACAAAAGGCGCAACCGTTAGA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TTTTATGTACACTAAACGTATAATGAAGTCAAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	TAAATAACGGAGCAAATCATCAAGACAACTATCAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AAAATGACGTGGTCGGAGCAATGCCGAAAAGCCAA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	ATCTATTGAAGGCTGATAATATGCTTGACTCTGA
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	AATTAAGTACCGTACGTTGATGACGGAACTTGAAG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	GCTATGGGGGATTCGTCAATTTCAATTTTATGGTG
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CATTGCAACCTGCCATTCACTACGAAATCTACAT
GCAGCCACCTTCGGGTGGCTGTGAGTTGAAAC	CGATAAGCCGGTCAAATTACCGAAATGCTCCAAT
GCAGCCACCTCCGGGTGGCTGTGAGTTGAAAC	CTTGCGAGTGTTGATACGGTCAATTAGCGAGAAGTT
GCAGCCACCTGCGAGTGGCTGTGAGTTGAAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_020515.1\|WP_015432841.1\|1575683_1576130_-\|acyl-CoA-thioester-hydrolase-YciA	unknown	unknown	gnl\|CDD\|236736
NC_020515.1\|WP_015432829.1\|1563415_1563709_+\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NC_020515.1\|WP_015432824.1\|1557546_1558287_+\|type-I-C-CRISPR-associated-protein-Cas5	cas5	cd09752_cas5_CAS-I-C	gnl\|CDD\|187782
NC_020515.1\|WP_015432832.1\|1565309_1566737_+\|bifunctional-D-glycero-beta-D-manno-heptose-7-phosphate-kinase/D-glycero-beta-D-manno-heptose-1-phosphate-adenylyltransferase-HldE	unknown	unknown	gnl\|CDD\|183085
NC_020515.1\|WP_015432837.1\|1570929_1571889_-\|MucB/RseB-C-terminal-domain-containing-protein	unknown	unknown	gnl\|CDD\|236525
NC_020515.1\|WP_015432827.1\|1561147_1561810_+\|CRISPR-associated-protein-Cas4	cas4	cd09637_cas4_CAS-I:CAS-II:CAS-V	gnl\|CDD\|273040
NC_020515.1\|WP_015432828.1\|1562357_1563371_+\|type-I-C-CRISPR-associated-endonuclease-Cas1	cas1	cd09721_cas1_CAS-I-C	gnl\|CDD\|188360
NC_020515.1\|WP_025328951.1\|1555072_1557535_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|224124
NC_020515.1\|WP_015432839.1\|1572416_1575320_-\|bifunctional-[glutamate--ammonia-ligase]-adenylyl-L-tyrosine-phosphorylase/[glutamate--ammonia-ligase]-adenylyltransferase	unknown	unknown	gnl\|CDD\|236836
NC_020515.1\|WP_015432838.1\|1572023_1572413_-\|hypothetical-protein	unknown	unknown	unknown
NC_020515.1\|WP_015432826.1\|1560304_1561147_+\|type-I-C-CRISPR-associated-protein-Cas7/Csd2	cas7	cd09689_cas7_CAS-I-C	gnl\|CDD\|187820
NC_020515.1\|WP_025266960.1\|1551140_1552658_+\|ribosome-biogenesis-GTPase-Der	unknown	unknown	gnl\|CDD\|234628
NC_020515.1\|WP_015432833.1\|1566798_1567740_+\|peptidylprolyl-isomerase	unknown	unknown	gnl\|CDD\|236758
NC_020515.1\|WP_025328950.1\|1558283_1560275_+\|type-I-C-CRISPR-associated-protein-Cas8c/Csd1	cas8c	pfam09709_cas8c_CAS-I-C	gnl\|CDD\|187887
NC_020515.1\|WP_015432820.1\|1549507_1550821_+\|glutamyl-tRNA-reductase	unknown	unknown	gnl\|CDD\|234592
NC_020515.1\|WP_015432835.1\|1568797_1570483_-\|long-chain-fatty-acid--CoA-ligase-FadD	unknown	unknown	gnl\|CDD\|236359
NC_020515.1\|WP_015432819.1\|1546998_1549209_-\|GTP-diphosphokinase	unknown	unknown	gnl\|CDD\|182797
NC_020515.1\|WP_015432834.1\|1567839_1568706_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	unknown	unknown	gnl\|CDD\|234708
NC_020515.1\|WP_025289530.1\|1575366_1575663_-\|YciI-family-protein	unknown	unknown	gnl\|CDD\|183103
NC_020515.1\|WP_015432836.1\|1570492_1570918_-\|SoxR-reducing-system-RseC-family-protein	unknown	unknown	gnl\|CDD\|377263

Protein	Function_ID	Function_description	E-value
NC_020515.1\|WP_015432829.1\|1563415_1563709_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	9.8602e-32
NC_020515.1\|WP_015432824.1\|1557546_1558287_+\|type-I-C-CRISPR-associated-protein-Cas5	gnl\|CDD\|187782	cd09651, Cas5_I-C, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex; in subtype I-C this protein might be the endoribonuclease that generates crRNAs; also known as DevS family.	3.40471e-83
NC_020515.1\|WP_015432832.1\|1565309_1566737_+\|bifunctional-D-glycero-beta-D-manno-heptose-7-phosphate-kinase/D-glycero-beta-D-manno-heptose-1-phosphate-adenylyltransferase-HldE	gnl\|CDD\|183085	PRK11316, PRK11316, bifunctional D-glycero-beta-D-manno-heptose-7-phosphate kinase/D-glycero-beta-D-manno-heptose 1-phosphate adenylyltransferase HldE.	0
NC_020515.1\|WP_015432837.1\|1570929_1571889_-\|MucB/RseB-C-terminal-domain-containing-protein	gnl\|CDD\|236525	PRK09455, rseB, anti-sigma E factor; Provisional.	1.1588e-107
NC_020515.1\|WP_015432827.1\|1561147_1561810_+\|CRISPR-associated-protein-Cas4	gnl\|CDD\|273040	TIGR00372, conserved_hypothetical_protein, CRISPR-associated protein Cas4. This model represents a family of proteins associated with CRISPR repeats in a wide set of prokaryotic genomes. This scope of this model has been broadened since it was first built to describe an archaeal subset only. The function of the protein is undefined. Distantly related proteins, excluded from this model, include ORFs from Mycobacteriophage D29 and Sulfolobus islandicus filamentous virus and a region of the Schizosaccharomyces pombe DNA replication helicase Dna2p.	1.24734e-40
NC_020515.1\|WP_015432828.1\|1562357_1563371_+\|type-I-C-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|188360	TIGR03640, cas1_DVULG, CRISPR-associated endonuclease Cas1, subtype I-C/DVULG. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the DVULG subtype of CRISPR/Cas system.	0
NC_020515.1\|WP_025328951.1\|1555072_1557535_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	2.55874e-53
NC_020515.1\|WP_015432839.1\|1572416_1575320_-\|bifunctional-[glutamate--ammonia-ligase]-adenylyl-L-tyrosine-phosphorylase/[glutamate--ammonia-ligase]-adenylyltransferase	gnl\|CDD\|236836	PRK11072, PRK11072, bifunctional [glutamate--ammonia ligase]-adenylyl-L-tyrosine phosphorylase/[glutamate--ammonia-ligase] adenylyltransferase.	0
NC_020515.1\|WP_015432841.1\|1575683_1576130_-\|acyl-CoA-thioester-hydrolase-YciA	gnl\|CDD\|236736	PRK10694, PRK10694, acyl-CoA thioester hydrolase YciA.	1.95304e-70
NC_020515.1\|WP_015432826.1\|1560304_1561147_+\|type-I-C-CRISPR-associated-protein-Cas7/Csd2	gnl\|CDD\|187820	cd09689, Cas7_I-C, CRISPR/Cas system-associated RAMP superfamily protein Cas7. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas7 is a RAMP superfamily protein; Subunit of the Cascade complex; also known as Csd2 family.	2.84518e-111
NC_020515.1\|WP_025266960.1\|1551140_1552658_+\|ribosome-biogenesis-GTPase-Der	gnl\|CDD\|234628	PRK00093, PRK00093, GTP-binding protein Der; Reviewed.	0
NC_020515.1\|WP_015432833.1\|1566798_1567740_+\|peptidylprolyl-isomerase	gnl\|CDD\|236758	PRK10770, PRK10770, peptidyl-prolyl cis-trans isomerase SurA; Provisional.	4.48128e-36
NC_020515.1\|WP_025328950.1\|1558283_1560275_+\|type-I-C-CRISPR-associated-protein-Cas8c/Csd1	gnl\|CDD\|187887	cd09757, Cas8c_I-C, CRISPR/Cas system-associated protein Cas8c. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Zn-finger domain containing protein, distant homologs of Cas8 proteins; signature gene for I-C subtype; also known as Csd1 family.	5.07541e-175
NC_020515.1\|WP_015432820.1\|1549507_1550821_+\|glutamyl-tRNA-reductase	gnl\|CDD\|234592	PRK00045, hemA, glutamyl-tRNA reductase; Reviewed.	0
NC_020515.1\|WP_015432835.1\|1568797_1570483_-\|long-chain-fatty-acid--CoA-ligase-FadD	gnl\|CDD\|236359	PRK08974, PRK08974, long-chain-fatty-acid--CoA ligase FadD.	0
NC_020515.1\|WP_015432819.1\|1546998_1549209_-\|GTP-diphosphokinase	gnl\|CDD\|182797	PRK10872, relA, (p)ppGpp synthetase I/GTP pyrophosphokinase; Provisional.	0
NC_020515.1\|WP_015432834.1\|1567839_1568706_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	gnl\|CDD\|234708	PRK00274, ksgA, 16S rRNA (adenine(1518)-N(6)/adenine(1519)-N(6))-dimethyltransferase RsmA.	2.22796e-147
NC_020515.1\|WP_025289530.1\|1575366_1575663_-\|YciI-family-protein	gnl\|CDD\|183103	PRK11370, PRK11370, YciI family protein.	9.29563e-63
NC_020515.1\|WP_015432836.1\|1570492_1570918_-\|SoxR-reducing-system-RseC-family-protein	gnl\|CDD\|377263	pfam04246, RseC_MucC, Positive regulator of sigma(E), RseC/MucC. This bacterial family of integral membrane proteins represents a positive regulator of the sigma(E) transcription factor, namely RseC/MucC. The sigma(E) transcription factor is up-regulated by cell envelope protein misfolding, and regulates the expression of genes that are collectively termed ECF (devoted to Extra-Cellular Functions). In Pseudomonas aeruginosa, de-repression of sigma(E) is associated with the alginate-overproducing phenotype characteristic of chronic respiratory tract colonisation in cystic fibrosis patients. The mechanism by which RseC/MucC positively regulates the sigma(E) transcription factor is unknown. RseC is also thought to have a role in thiamine biosynthesis in Salmonella typhimurium. In addition, this family also includes an N-terminal part of RnfF, a Rhodobacter capsulatus protein, of unknown function, that is essential for nitrogen fixation. This protein also contains an ApbE domain pfam02424, which is itself involved in thiamine biosynthesis.	9.61851e-26

>NC_020515.1|WP_015432829.1|1563415_1563709_+|CRISPR-associated-endonuclease-Cas2
MMMLITYDISFDDAEGQKRLRRIAKHCLDYGIRAQYSVFECDVTPDQWVKLKQKLLDTYNPETDSLRFYHLGSKWRNKVEHHGTKKAVDIFKDTLIL
>NC_020515.1|WP_015432828.1|1562357_1563371_+|type-I-C-CRISPR-associated-endonuclease-Cas1
MRKLQNTLYITTQGSYLHKERETLVVEQDRKKVAQLPVHSIGHIFCFGNVLVSPFLMGFCGENNVNLAFFTENGRYLGRLQGRQNGNVLLRRAQYKKSETNPEPVARNIIAAKIQASKRVLQRRLRNHGECEPVEQAVTALNMSLKQLQKADNLDLIRGIEGDAASRYFGVFQHLLSEQCEFHFDGRNRRPPRDGVNALLSFLYSIVGKDISGALQGVGLDPQIGFLHADRPGRDSLAQDILEEFRAWWVDRMVLSLINRGQIKPNDFITESGGAVMLKPEVRKLLFQTLQAKKQEKIIHPFLGEEVEIGLLPYIQAMLLARYLRGDLAEYPPFLMR
>NC_020515.1|WP_015432827.1|1561147_1561810_+|CRISPR-associated-protein-Cas4
MLSVLQKTEQNQSLVTEDKQLIVPLSALQHYAFCPRQCALIYNEQAWAENYLTAQGQALHERVDSGEPETRKGVRFERTVHVAAEKLGISGILDLVERDLKTGELKPVEYKRGKPKPEPMDEIQLCAQALCLEEMTGQTINEGALWYMQTRHRVPVVFSDGLRQATLDTIAQVRALLISGKTPLPEYGKHCKACSLVEICQPKLLEKDKSAGYVKGVFEE
>NC_020515.1|WP_015432826.1|1560304_1561147_+|type-I-C-CRISPR-associated-protein-Cas7/Csd2
MSLTKKIDFALIISVKNANPNGDPLNGNRPRTDFHGFGEITDVCLKRKIRDRLQDAGESIFVQSDEKKTDSMTSLANRAKDKDVGLGSDAFNAKKSSRDETAKKACKKWLDVRSFGQVFAFGKSDDGAGVSIAVRGPVTIHSAFSVAPVSVTSTQITKSVSGEGDGSKKSSDTMGMKHRVDGGVYVAYGAMSPQLAERTGFSDSDAEKIKSVLTKLFEGDASSARPEGSMQVVKLIWWEHNCKSGQYSSAKVHSSLKVNADGSYELNALDSLIPQEIDGF
>NC_020515.1|WP_025328950.1|1558283_1560275_+|type-I-C-CRISPR-associated-protein-Cas8c/Csd1
MSWMQKLYRTYEAALQKASNLSEEPLTPIGHTQQNAHIVIVLNGDGEFRTAQVMPPKTAIMLPATESSENRTSGEAPHPLADKIQYVARDYSAYGGEKKAYFQGYLNQLQAWCDSAASHPKVSAVLHYVKKGKVVEDLITAGVFQLGADGKVLSKWVEKGDAPAIFSTLPKTKGEIEFGSALVCWRVEIKGDPQSDTWTDVTVQQSWIDYLALADSQTGFCFIQGKESPVSNMHPAKLRHTGDKAKLISSNDTAGYTFRGRFETAEEAASISTEVSAKAHSALRWLISRQGIRNGEQVTVAWAISGEKVPSPLQDPFDECYDYDLEEISAVENNVESEMPSETRGKIDHSVDLGKNAAEMIKKKYQGYKAKLKAHEQISLLMLDSATPGRMALTYYQEFLPADYFANLDAWIDDFSWYQRHSIETKNGKKNDKRLVWAIVPPSPFAIGNAVYSKSLSDSLKKQLYARLLPVIAGGKSVPIPYDLVQQSFQVACNPHGCENWEWQRNIGVACALYKGWRARHHNESERRTYDMSLDKENRSRDYLYGRLLAVAENIEAYALYLAGEKRSTNAERYMPKFANRPFYTWRNIEIALKPYQERLRNHNKDTGSQALAEITDLFVTEDYTNDSPLSAEFLLGYHCQKMEIARQLAELTAKKSKTTETE
>NC_020515.1|WP_015432824.1|1557546_1558287_+|type-I-C-CRISPR-associated-protein-Cas5
MSNENTFRSRLFSFRVWGRQALFTDPITKIGGEKFTYPVPTYEALKGILRSIYWKPTLIWHISRIRVMKPIQTQAKSTKPLDWNGGNTLAIYTFLHNVEYQVEAYFTWNMHWEELAGDRNVGKHTAIIERMLERGGRQDIFLGTRDCQGYIAPCQFGEGEGFYDKVDEPIDFGLMFHSFGYPEETGNHELISRFWQANMQKGVIKFPAVSDGELKTRFIKKMKPFKPFKRGENVKAVEEEAKELEL
>NC_020515.1|WP_025328951.1|1555072_1557535_+|CRISPR-associated-helicase/endonuclease-Cas3
MSKTEFIAHVRKSNKQLQSVSNHLLETASIARTLAAKLDLADAGELLGLMHDFGKYSKKFQTYIRHVTGILTYADLDSEDENNGGDHSTAGAQWIYGRLRKLGAAKNADGKIIGIGELVGQILGLCIASHHGAGLIDCLSPEGSEKPKWRERFDKDDKLTHLSECEKNADAVIINRAEELVGIDLVRLVDKPIRAILNQKEIPFKLKEFYLGCLTRFLFSCLIDADRINTSDFENERQKEIRNLTNTPNWQKAIDKLESHLSGFSIKYPIDGIRREISESCLERSTDQQGIYTLTVPTGGGKTLSSLRYALHHAKLHNLDRIIYIIPYTSIIDQNAQAVRKILGEEWVLEHHSNIEPDQQTWQNKLLSENWDKPIVFTTMVQFLDAWFGSGTRGVRHIHAMTKSVLIFDEIQTLPIKCVHLFCNVLNWLTHFGKSSAVLCTATQPLLNSLKNPHLGQIQLADNAELIGNQFKIRELFDKLSRVEVNYCPQTGGYSLENAGEFLLEQFGQYSSCLFIVNTKKWAQDLYRYCQNRNLPQEALFHLSTNQCSAHRKTIFDKIKARLNNKEPVICISTQLIEAGVDISMACVIRALGGLDSIAQAAGRCNRHGENKGKGQVYVLNLQEPNLESVLPDIYIGQQQSERVFNDFEGQDILQPNAMSQYFDYYFYNRSNEMGYSLPNNYSGTLLDWLSDNAQNTYVPKNNQRKTVFPLLMQSFKSAGKLFQTIDAPTQAVIVPYENAKELIATLCGTDDNEKKYKALSQAQRYSVNVFPNVWKKLQENEAIQETQLGSGIFYLKDRHYTEEYGLSIEETGNLTFYDL
>NC_020515.1|WP_025266960.1|1551140_1552658_+|ribosome-biogenesis-GTPase-Der
MTPVVALVGRPNVGKSTLFNRLTRTRDALVADFPGLTRDRKYGQANIAGHDFIVIDTGGIDGTEEGVEEKMAEQSLLAIEEADVVLFLVDARAGLVPADIGIAQYLRQRDKTTVVVANKTDGIDADSHIAEFYQLGLGDVEPIAAAQGRGVTQLIEQVLAPLAEKIEEQAVENAENSANTTEEQDEWENNFDFENEEDTALLDEALEESEEESDKNIKIAIVGRPNVGKSTLTNRILGEDRVVVYDMPGTTRDSIYIPMERDGQQYTIIDTAGVRKRGKVHLAVEKFSVIKTLQAIQDANVVLLTIDARDGVSDQDLSLLGFILNAGKSLVIVVNKWDGLSQDIKDNVKSELDRRLDFIDFARVHFISALHGSGVGNLFDSIQEAYACATKKMTTAMLTRILQMATDEHQPPLVNGRRVKLKYAHPGGYNPPIIVIHGNQIERLPDSYKRYLSNYYRKSLKIIGSPIRVLFQEGNNPFAGKRNKLTPSQLRKRKRLMKFIKKNRK
>NC_020515.1|WP_015432820.1|1549507_1550821_+|glutamyl-tRNA-reductase
MTILALGINHKTASVSLREKVAFVESKRQLAFEQISQQNLAESAVILSTCNRTELYFHQADIPPQEDHPENIAWRERCFQWFAEIHQLDHNELRQCIYFKQNMDTARHLMEVACGLDSLILGEPQILGQVKQAYQDSEYFYHQQGKSISTNLSRLFQKTFSTAKRVRSETEIGASAVSVAYAACGLARQIFDDFAKLRFLLVGAGETIELVARYLIQHGAQNLMVANRTHIRAEMLAEKLETPMQILSLSALQVGLNQADVVISSTGSPDLLISKEMVETAQKQRRFDPMLLIDIAVPRDIDEKAGELDSVYAYSVDDLQHIIQQNLAQRQQAAEQAKEIVEQECKDFFAWLKQQQSSQLIKHYRQNAEEIRLDLLEKARNALEQGQDSEKILQELSYKLMNQLLHAPTSALQNLAKDGNVKGLQRFSQALKLDDIN
>NC_020515.1|WP_015432819.1|1546998_1549209_-|GTP-diphosphokinase
MVAIRHSHQLDPNNFELASWSAGLKMSPVTFDELQTAWRYAEEKLDTEQLHLMWVGLEMVEILHGLNMDDDSLVAAMLFPLVKHNIADLAQIKEQFGNGVKNLVKGVLEMENIRQLNANNASDLQIDNIRRMLLAMVDDFRCVVIKLAERIVYLRDTEHHSEEDLVLAAKECSHIYAPLANRLGIGQLKWELEDYSFRALHPQDYRQIAKFDLAERRLDREQFIADFVAHLTACIGEEIDNVQVYGRPKHIYSIWKKMQKKNLRFDQLFDIRAVRIIVQNLEECYTALSIVHSHYKHLPEHFDDYIADPKPNGYQSLHTVVLGKGDKPIEVQIRTQKMHDDAELGVAAHWKYKEGAGAGRSGYEEKIVWLRKLLAWQNDIADSGEMVDDLRSQVFDDRVYVFTPKGEVIDLPSNATPLDFAYSIHSEIGHRCIGAKVAGKIVPFTYILQMGDQVEIITQKNPNPSRDWLNPSQGFVNTPRARSKIIAWFKKLDREKNLPIGKEMLESEMVKHQFSLKQIEDYALPRYNLKQLDDLYAAIGGGDIKLNNLMNYLQGKLVKTSAEQADEAILKHMAHKAQHTQTKTGRAGAIIVDGVGNLMHHIARCCQPIPGDKIVGYITQGRGISIHRADCEQLFDLQSSSPERVVDAEWGGNFTSGFSLVIRVIANDRNGLLRDVSAIMANEKVNVIGVASRTDIKRSIATIDIEVELNNIELLDKLLKRIMQLDDVIEAKRLSN
>NC_020515.1|WP_015432832.1|1565309_1566737_+|bifunctional-D-glycero-beta-D-manno-heptose-7-phosphate-kinase/D-glycero-beta-D-manno-heptose-1-phosphate-adenylyltransferase-HldE
MMMHYSSQFNHAKVLVLGDVMLDRYWFGSTNRISPEAPVPVVKVQENEERAGGAANVAMNIAALNVPVTLHGLVGQDDAGSALDKLLNSHQIQNHCVALDSHPTITKLRILSRHQQLLRLDFEEGFHNVDSSELLAKLSSEITAYGALILSDYGKGTLNDVQKMIQIARQANVPILIDPKGTDFERYRGATLLTPNMSEFEAVVGHCATEDDIVHKGLKMIADFELSALLVTRSEKGMTLLRPNFEPFHLPTQAREVYDVTGAGDTVISVLATAIADGRNLEEACYIANAAAGVVVGKLGTSTVSPSELEQAIHQRTETGFGVVSEAELKQIVQQSKARGEKIVMTNGCFDILHPGHVSYLENARKLGDRLIVAVNTDNSVKRLKGENRPINDLASRMAVLAGLASVDWVVPFDEDTPQRLIGEILPNLLVKGGDYKVEEIAGHQEVLANGGEVRVLNFENGCSTTNVIKKIQSL
>NC_020515.1|WP_015432833.1|1566798_1567740_+|peptidylprolyl-isomerase
MKFISLKSLFVATFALFAVSQIHAVEERVVASVDGHPIMQSQVLKTLGKRKNTEANRKAATDDLINDFLVQRAIQQSGIKVNTAYVDQVIENMVVQNGITYGQFLDYLDYNNISLNQYRQQIAHQILMDNVKQQAIGQSIRVEPQDVQSLATKMLEEAKTNGKLKTITALQHRVSHILIKTNPILNDAQAKAKLNSIVADIKAGKISFEDAARANSVDYASGAEGGDLGWNFLDAYDKTFAQTAQKSKLGVISAPFKSQFGWHVLKVTDTRQSDRTEDAYFQRAYEQLFDKQAQDASKDWVKALKNRAEIKYY
>NC_020515.1|WP_015432834.1|1567839_1568706_+|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA
MSSNSKKHLGHTARKRFGQNFLHDMNVIHNIVAAINPKKDQFLLEIGPGLGALTEPVAEQVEQLTVVELDRDLAERLRHHPFLHHKLTIIEQDALRFNFREYFESLNLPEGQGVRVFGNLPYNISTPLMFHLFKFHDLVQDMHFMLQKEVVKRLCAAPNSKAYGRLTIMAQYYCQVMPVLEVPPNAFKPAPKVDSAVVRLVPYKTLPYPVKDIYWLNRVTTQAFNQRRKTLRNALSTLFTPEQLEALNIDLNARAENLAIADYTRLANWLCDNPPAAGKIEIIENDVE
>NC_020515.1|WP_015432835.1|1568797_1570483_-|long-chain-fatty-acid--CoA-ligase-FadD
MEKIWFENYPPNAERIIDVEPYESLVEMFEKAVQRHPDLAAYINMGQVLTYRKLEERSRAFAAYLQNELRLEKGDRIALMMPNLLQYPIALFGALRAGLVVVNVNPLYTPRELEHQLNDSGAKAIVVVSNFAATLEKIVFNTAVKHVILTRMGDQLSFGKRTLVNFVVKYVKKLVPKYKLPHAVSFREALSIGKQRQYVRPTIYQDDLAFLQYTGGTTGVAKGAMLSHRNMVANIMQAKWVAYPLTQARQNRLAVIALPLYHVFALSANCLLFIELGVTGLLITNPRDIPGFVKELKKYPVMAITGVNTLFNALLNNEHFSEADFSNLKLSIGGGAAIQRSVADRWHKATGCHIIEGYGMTECSPLISATRNDSIEYSGSIGVPVPNTDIRVVDDAGNDVPVGERGELWVKGPQVMRGYWQRPDETAEVLKDGWMATGDIVTFGEDLNLRIVDRKKDMIIVSGFNVYPNEIEDVVALHPKVNEVVAVGIPSEKSGESIKVYVTKKDESLTREELRNHCRQHLTGYKIPRDIEFRDDLPKSNVGKILRRVLRDEEIARMEKS
>NC_020515.1|WP_015432836.1|1570492_1570918_-|SoxR-reducing-system-RseC-family-protein
MMLEQALVLRYQNGIATIQAFAKSGCGGCAAEGCGTKSLSALVGEKRAPQFDIAVSQHLNSGDQIEIGITENHLLLSVFWLYAVPLFVLIASTLLFSMWFANELVIAGLILCSTLVAFISIKKIIKRQIINGLNPIFVRKL
>NC_020515.1|WP_015432837.1|1570929_1571889_-|MucB/RseB-C-terminal-domain-containing-protein
MIKKSSLLALLSVWCFSLVVRAETMATPLSYLVAMSQAQQQANYEQFYLFQEGRSPESWRYRHVHWDNQQYAQLLSLDGSREEFLQQDNLVGYFGDFQPFSLQTNKILDNRPMVLYGDFNRLEGYSFIDMGKDRIANRVARQIRIVPKDEFRYQYRLWIDEESKLLLKSELLDREHNVLELFRVINLRLDDQLLDMVDAIRPLILPPMIPSKAPMNSDNLSWQPKWLPRGFRLQSVAREQLPDGEEVDSQLYSDGLFSFTIYLSDSKELPLNEHTWQDGKTTVYTLSLAQKDLVLVGEIPLTTARHILQNIKIKQPLEK
>NC_020515.1|WP_015432838.1|1572023_1572413_-|hypothetical-protein
MKFPSKLALISSALLLSACALTPEQKAAQEAKRLRAEQALQVKLARQCDTEAAQLLHQQFNPPLSQTEQQKQEFEQRYAEKIGQPMFQACYKLALENYKAQEELEYMRQRYYWDDYPRWGWHRFCYSCW
>NC_020515.1|WP_015432839.1|1572416_1575320_-|bifunctional-[glutamate--ammonia-ligase]-adenylyl-L-tyrosine-phosphorylase/[glutamate--ammonia-ligase]-adenylyltransferase
MESLLFQSAEQKLQTLFSSQRIPDILQNSAQIAPLVKAIAMSDFVYTTLQNQPELLTKWLEMPPTEQHCEHYSTRLHQLLDSVETEEELHSTLRHFRHRELAALSYLQSNNPHLVQVVFEKLSELAEALIINARDWLFTRLCQDYGTPMNEQGEVQELIIIGMGKLGGRELNFSSDIDLIFAYPDMGETTGGRKPMENSKFFTRLGQRLIQALDQITEDGFVYRTDMRLRPFGESGALVLSFTAMEDYYQEQGRDWERYAMIKGRILGENLQNHNHRYLSQMLRPFVYRRYLDFSAIQSLREMKLKISREVARRGLTENIKLGAGGIREIEFIVQAFQMMRGGRDKILQQRSLLKVLPHLAELKLLSNEQVAQLQQAYLFLRLVENSLQAIEDKQTQTLPHDEKEREILIYLTKQYLASTAKENVHSWQDFLAVLAQHQKNVRAIFNELVGEEDESEKSDEKQTYAAWRDILHYQITLEELIVNLRAYTVQEKDYAEIFQHLSTILQEWVKRPIGVRGRDVLRQLMPRVVDQIFSQQDYLVLLPRILKIIDQIVTRTTYLELLLEKEQILPQLLSLCGKSVMIAEQIARFPILLDELIVQKSLTRVIGLDEYPAALQEYLMRIPEEDEEALMDSLRQFKQSQILRIAAADILGVLPVMKISDHLTYLAEAIIAVVVKLAWQSVARRFGVPGHLQDAAQDFVVVGYGKLGGIELGYNSDLDLVFLHNAPENSETQGGKKSISAHQFYLKLAQKINGIFNLNTAAGVLYEVDMRLRPSGEAGLLVSTFEAYDFYQKNEAWTWESQALVRARAVYGSPELRQKFARIRQETLCQKRASGQLSEEICKMRSKMHMHFAKNQSDVFHLKNDRGGITDIEFIAQFLVLNYAAYYPEMAVWSDNVRIFDSAIACGILSAEQGELLKQCYICLRNRVHQLNLLNQESYVVKTEFATEREIVCQIWNNLFSSLKQE
>NC_020515.1|WP_025289530.1|1575366_1575663_-|YciI-family-protein
MYYVIFAQDLPNSLEKRLSVRDKHLARLQALQAEERLLTAGPNPAVDSSTPGEAGFSGSTVIAKFPSLEAAKEWASQDPYVEAGVYGDVIVKPFIKVF
>NC_020515.1|WP_015432841.1|1575683_1576130_-|acyl-CoA-thioester-hydrolase-YciA
MTESNERPHGSLVLRTLAMPADTNANGDIFGGWLMSQMDLGGAILAKEIAKGRVVTVCVDKMVFLTPVSIGDVVCCYGSCTRVGRSSMEVKVEIWIKKVYDGTGRRTKVTEAHFTYVAVGEDKKPRPIPRENNPELDQALALIERHSN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Identity
NC_020515_1	1.4\|843718\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843718-843747	30	NC_020515.1	1395473-1395502	1.0
NC_020515_1	1.16\|844510\|30\|NC_020515\|CRISPRCasFinder,CRT	844510-844539	30	NC_020515.1	2057273-2057302	1.0
NC_020515_4	4.15\|1553893\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553893-1553926	34	NC_020515.1	1146994-1147027	1.0

1. spacer 1.4|843718|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to position: 1395473-1395502, mismatch: 0, identity: 1.0

gggcagttgcaagacatgtatcaaaatctt	CRISPR spacer
gggcagttgcaagacatgtatcaaaatctt	Protospacer
******************************

2. spacer 1.16|844510|30|NC_020515|CRISPRCasFinder,CRT matches to position: 2057273-2057302, mismatch: 0, identity: 1.0

ccggctcggtgatttgagcaatgaggtaat	CRISPR spacer
ccggctcggtgatttgagcaatgaggtaat	Protospacer
******************************

3. spacer 4.15|1553893|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to position: 1146994-1147027, mismatch: 0, identity: 1.0

ctgccgagtaataagccaagcagaatttcaagca	CRISPR spacer
ctgccgagtaataagccaagcagaatttcaagca	Protospacer
**********************************

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	NC_008201	Mannheimia phage phiMHaA1, complete genome	25331-25364	1	0.971
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	DQ426905	Bacteriophage phi-MhaA1-BAA410, complete genome	25406-25439	1	0.971
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	KP137432	Mannheimia phage vB_MhM_535AP1, complete genome	25371-25404	1	0.971
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	JN255163	Mannheimia phage vB_MhM_1152AP, complete genome	25525-25558	1	0.971
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	KP137438	Mannheimia phage vB_MhM_2256AP1, complete genome	25732-25765	1	0.971
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	NC_047750	Mannheimia phage vB_MhM_1127AP1, complete genome	26560-26593	1	0.971
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	NC_028898	Mannheimia phage vB_MhM_587AP1, complete genome	26568-26601	1	0.971
NC_020515_4	4.14\|1553827\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553827-1553860	34	DQ426904	Bacteriophage phi-MhaA1-PHL101, complete genome	25331-25364	1	0.971
NC_020515_4	4.21\|1554293\|36\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1554293-1554328	36	NC_028743	Mannheimia phage vB_MhS_587AP2, complete genome	42889-42924	1	0.972
NC_020515_1	1.7\|843916\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843916-843945	30	NC_007206	Haemophilus influenzae biotype aegyptius plasmid pF1947, complete sequence	27680-27709	2	0.933
NC_020515_1	1.11\|844180\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	844180-844209	30	NC_007206	Haemophilus influenzae biotype aegyptius plasmid pF1947, complete sequence	27680-27709	2	0.933
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	NZ_CP054197	Glaesserella parasuis strain YHP170504 plasmid unnamed1, complete sequence	21958-21991	2	0.941
NC_020515_1	1.9\|844048\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	844048-844077	30	NZ_CP054197	Glaesserella parasuis strain YHP170504 plasmid unnamed1, complete sequence	36646-36675	3	0.9
NC_020515_1	1.13\|844312\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	844312-844341	30	NZ_CP054197	Glaesserella parasuis strain YHP170504 plasmid unnamed1, complete sequence	36646-36675	3	0.9
NC_020515_5	5.14\|1564809\|35\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1564809-1564843	35	NC_028766	Mannheimia phage vB_MhM_3927AP2, complete genome	11699-11733	3	0.914
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	NC_021724	Aggregatibacter actinomycetemcomitans plasmid pS23A, complete sequence	9066-9099	4	0.882
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	NC_021724	Aggregatibacter actinomycetemcomitans plasmid pS23A, complete sequence	5656-5689	4	0.882
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	NC_002579	Aggregatibacter actinomycetemcomitans plasmid pVT745, complete sequence	6923-6956	4	0.882
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	GQ866235	Aggregatibacter actinomycetemcomitans strain D11S-1 plasmid S57, complete sequence	8534-8567	4	0.882
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	GQ866235	Aggregatibacter actinomycetemcomitans strain D11S-1 plasmid S57, complete sequence	4686-4719	4	0.882
NC_020515_2	2.4\|950341\|35\|NC_020515\|CRT,PILER-CR,CRISPRCasFinder	950341-950375	35	NZ_CP045829	Escherichia coli strain AUSMDU00014361 plasmid pAUSMDU00014361_02, complete sequence	75334-75368	5	0.857
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MN694671	Marine virus AFVG_250M145, complete genome	25900-25929	6	0.8
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MN694753	Marine virus AFVG_250M144, complete genome	28198-28227	6	0.8
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MN694231	Marine virus AFVG_250M143, complete genome	18426-18455	6	0.8
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MN693981	Marine virus AFVG_250M146, complete genome	16038-16067	6	0.8
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	NZ_KX753679	Pasteurella multocida strain RCAD0259 plasmid pRCADGH-2, complete sequence	24884-24917	6	0.824
NC_020515_2	2.4\|950341\|35\|NC_020515\|CRT,PILER-CR,CRISPRCasFinder	950341-950375	35	MK422450	Klebsiella phage ST13-OXA48phi12.4, complete genome	33739-33773	6	0.829
NC_020515_5	5.1\|1563942\|36\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1563942-1563977	36	KM389287	UNVERIFIED: Escherichia phage Phi06_2987 S clone contig00001 genomic sequence	12565-12600	6	0.833
NC_020515_5	5.1\|1563942\|36\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1563942-1563977	36	NZ_AP019820	Enterobacter hormaechei subsp. hoffmannii strain OIPH-N069 plasmid pN069_3, complete sequence	3539-3574	6	0.833
NC_020515_1	1.1\|843520\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843520-843549	30	NZ_KX853854	Enterococcus faecium strain A120 plasmid pEMA120, complete sequence	26737-26766	7	0.767
NC_020515_1	1.1\|843520\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843520-843549	30	NC_016967	Enterococcus faecium plasmid pZB18, complete sequence	42283-42312	7	0.767
NC_020515_1	1.1\|843520\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843520-843549	30	NZ_KX976485	Enterococcus avium strain 19081 plasmid pEA19081, complete sequence	49676-49705	7	0.767
NC_020515_1	1.1\|843520\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843520-843549	30	MG592433	Vibrio phage 1.052.A._10N.286.46.C3, partial genome	40892-40921	7	0.767
NC_020515_1	1.3\|843652\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843652-843681	30	NZ_CP026267	Aminobacter sp. MSH1 plasmid pBAM2, complete sequence	3769-3798	7	0.767
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	NZ_CP025078	Enterococcus faecium strain LS170308 plasmid unnamed, complete sequence	12559-12588	7	0.767
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	NZ_CP015437	Anoxybacillus sp. B7M1 plasmid unnamed, complete sequence	43728-43757	7	0.767
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MG969411	UNVERIFIED: Salmonella phage GE_vB_MG, complete genome	53917-53946	7	0.767
NC_020515_2	2.1\|950142\|34\|NC_020515\|CRT	950142-950175	34	NZ_KX753679	Pasteurella multocida strain RCAD0259 plasmid pRCADGH-2, complete sequence	26889-26922	7	0.794
NC_020515_2	2.4\|950341\|35\|NC_020515\|CRT,PILER-CR,CRISPRCasFinder	950341-950375	35	CP051275	Salmonella phage SW-37, complete genome	23834-23868	7	0.8
NC_020515_4	4.6\|1553295\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553295-1553328	34	NZ_CP020439	Streptococcus equinus strain FDAARGOS_251 plasmid unamed1 sequence	177770-177803	7	0.794
NC_020515_4	4.6\|1553295\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553295-1553328	34	NZ_CP018188	Streptococcus salivarius strain ICDC2 plasmid, complete sequence	60391-60424	7	0.794
NC_020515_5	5.1\|1563942\|36\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1563942-1563977	36	FJ982340	Burkholderia phage KS9, complete genome	29821-29856	7	0.806
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	NZ_CP045339	Vibrio sp. THAF190c plasmid pTHAF190c_a, complete sequence	415673-415702	8	0.733
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MK448712	Streptococcus phage Javan237, complete genome	26250-26279	8	0.733
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MK448880	Streptococcus phage Javan238, complete genome	26250-26279	8	0.733
NC_020515_1	1.14\|844378\|30\|NC_020515\|CRISPRCasFinder,CRT	844378-844407	30	MT234670	Pseudanabaena phage PA-SR01, complete genome	106347-106376	8	0.733
NC_020515_1	1.15\|844444\|30\|NC_020515\|CRISPRCasFinder,CRT	844444-844473	30	NZ_CP022536	Spiroplasma corruscae strain EC-1 plasmid unnamed, complete sequence	16419-16448	8	0.733
NC_020515_4	4.6\|1553295\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553295-1553328	34	NC_048107	Staphylococcus phage Pabna, complete genome	13011-13044	8	0.765
NC_020515_4	4.8\|1553427\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553427-1553460	34	NC_041925	Proteus phage VB_PmiS-Isfahan, complete genome	29323-29356	8	0.765
NC_020515_4	4.8\|1553427\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553427-1553460	34	MN840487	Proteus phage 2207-N35, complete genome	17007-17040	8	0.765
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	MN694439	Marine virus AFVG_250M296, complete genome	4136-4169	8	0.765
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	MN694282	Marine virus AFVG_250M297, complete genome	4153-4186	8	0.765
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	GQ443085	Clostridium phage CP26F, complete genome	37097-37130	8	0.765
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	JF767210	Clostridium phage phi9O, complete genome	37503-37536	8	0.765
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NC_011318	Clostridium phage 39-O, complete genome	36601-36634	8	0.765
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NC_019496	Clostridium phage phiCP26F, complete genome	37097-37130	8	0.765
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NC_015917	Borreliella bissettii DN127 plasmid lp28-4, complete sequence	12351-12384	8	0.765
NC_020515_4	4.20\|1554224\|37\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1554224-1554260	37	NZ_CP045223	Achromobacter xylosoxidans strain DN002 plasmid unnamed	120350-120386	8	0.784
NC_020515_5	5.1\|1563942\|36\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1563942-1563977	36	KT367887	Klebsiella phage vB_Kp3, complete genome	30636-30671	8	0.778
NC_020515_5	5.1\|1563942\|36\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1563942-1563977	36	MT075871	Klebsiella phage vB_KleS-HSE3, complete genome	29442-29477	8	0.778
NC_020515_1	1.4\|843718\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843718-843747	30	MK250029	Prevotella phage Lak-C1, complete genome	260871-260900	9	0.7
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MN693046	Marine virus AFVG_25M413, complete genome	14633-14662	9	0.7
NC_020515_1	1.5\|843784\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843784-843813	30	MN693008	Marine virus AFVG_117M9, complete genome	14614-14643	9	0.7
NC_020515_1	1.8\|843982\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	843982-844011	30	AJ783769	Sulfolobus tengchongensis spindle-shaped virus STSV1 complete genome	21133-21162	9	0.7
NC_020515_1	1.12\|844246\|30\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	844246-844275	30	AJ783769	Sulfolobus tengchongensis spindle-shaped virus STSV1 complete genome	21133-21162	9	0.7
NC_020515_1	1.14\|844378\|30\|NC_020515\|CRISPRCasFinder,CRT	844378-844407	30	NZ_CP032532	Bacillus megaterium NCT-2 plasmid pNCT2_4, complete sequence	96830-96859	9	0.7
NC_020515_2	2.4\|950341\|35\|NC_020515\|CRT,PILER-CR,CRISPRCasFinder	950341-950375	35	MT028491	Ochrobactrum phage vB_OspM_OC, complete genome	25031-25065	9	0.743
NC_020515_4	4.6\|1553295\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553295-1553328	34	NZ_CP010312	Geoalkalibacter subterraneus strain Red1 plasmid pGSUB1, complete sequence	161523-161556	9	0.735
NC_020515_4	4.10\|1553559\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553559-1553592	34	MN694724	Marine virus AFVG_250M441, complete genome	4883-4916	9	0.735
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NC_011251	Borrelia duttonii Ly plasmid pl41, complete sequence	348-381	9	0.735
NC_020515_5	5.15\|1564876\|35\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1564876-1564910	35	NZ_CP013487	Vibrio alginolyticus strain ATCC 33787 plasmid pMBL287, complete sequence	109315-109349	9	0.743
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	NC_041977	Citrobacter phage Mordin, complete genome	10862-10895	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	NC_028247	Citrobacter phage Michonne, complete genome	81118-81151	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	MF158044	Shigella phage Sf18, complete genome	49096-49129	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	MF158040	Shigella phage Sf13, complete genome	33142-33175	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	KM236239	Citrobacter phage Moogle, complete genome	80508-80541	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	MF158041	Shigella phage Sf15, complete genome	1130-1163	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	MH920362	Citrobacter phage Maleficent, complete genome	81154-81187	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	KY654690	Citrobacter phage Mijalis, complete genome	80507-80540	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	MF327003	Shigella phage Sf14, complete genome	83779-83812	10	0.706
NC_020515_4	4.2\|1553027\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553027-1553060	34	MF327005	Shigella phage Sf19, complete genome	86019-86052	10	0.706
NC_020515_4	4.6\|1553295\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553295-1553328	34	MN694255	Marine virus AFVG_250M362, complete genome	32274-32307	10	0.706
NC_020515_4	4.6\|1553295\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553295-1553328	34	NC_013544	Lactobacillus paracasei subsp. paracasei plasmid pCD02, complete sequence	4533-4566	10	0.706
NC_020515_4	4.6\|1553295\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553295-1553328	34	KC013023	Leuconostoc phage phiLN04, complete genome	22507-22540	10	0.706
NC_020515_4	4.8\|1553427\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553427-1553460	34	MH586730	Salmonella phage Solent, complete genome	33662-33695	10	0.706
NC_020515_4	4.8\|1553427\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553427-1553460	34	NC_047786	Salmonella phage vB_SenS_Sasha, complete genome	30544-30577	10	0.706
NC_020515_4	4.8\|1553427\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553427-1553460	34	KY002061	Salmonella phage vB_SenS_Sergei, complete genome	33476-33509	10	0.706
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NZ_CP024238	Escherichia coli O15:H11 strain 90-9272 plasmid unnamed	166303-166336	10	0.706
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NC_013507	Escherichia coli ETEC H10407 plasmid pEntH10407, complete sequence	38240-38273	10	0.706
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NZ_CP024249	Escherichia coli O182:H21 strain D181 plasmid unnamed1, complete sequence	6097-6130	10	0.706
NC_020515_4	4.12\|1553692\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553692-1553725	34	NC_017722	Escherichia coli ETEC H10407 plasmid p666, complete sequence	65168-65201	10	0.706
NC_020515_4	4.22\|1554361\|35\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1554361-1554395	35	KT588073	Acinetobacter phage Ab105-3phi, partial genome	57805-57839	10	0.714
NC_020515_4	4.23\|1554428\|35\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1554428-1554462	35	NZ_CP017773	Paenibacillus crassostreae strain LPB0068 plasmid pPC03, complete sequence	23790-23824	10	0.714
NC_020515_4	4.8\|1553427\|34\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1553427-1553460	34	NZ_CP033124	Acinetobacter wuhouensis strain WCHAW010062 plasmid p4_010062, complete sequence	9550-9583	11	0.676
NC_020515_5	5.6\|1564278\|35\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1564278-1564312	35	NC_048765	Vibrio phage VAP7, complete genome	99485-99519	11	0.686
NC_020515_5	5.14\|1564809\|35\|NC_020515\|PILER-CR,CRISPRCasFinder,CRT	1564809-1564843	35	NZ_CP044084	Pseudomonas luteola strain FDAARGOS_637 plasmid unnamed1, complete sequence	520031-520065	12	0.657

1. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_008201 (Mannheimia phage phiMHaA1, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

2. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to DQ426905 (Bacteriophage phi-MhaA1-BAA410, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

3. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KP137432 (Mannheimia phage vB_MhM_535AP1, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

4. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to JN255163 (Mannheimia phage vB_MhM_1152AP, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

5. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KP137438 (Mannheimia phage vB_MhM_2256AP1, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

6. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_047750 (Mannheimia phage vB_MhM_1127AP1, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

7. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_028898 (Mannheimia phage vB_MhM_587AP1, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

8. spacer 4.14|1553827|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to DQ426904 (Bacteriophage phi-MhaA1-PHL101, complete genome) position: , mismatch: 1, identity: 0.971

taatatgcccttgcataaattccactttgccgtg	CRISPR spacer
taatatgcccttgcataaattccactttaccgtg	Protospacer
****************************.*****

9. spacer 4.21|1554293|36|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_028743 (Mannheimia phage vB_MhS_587AP2, complete genome) position: , mismatch: 1, identity: 0.972

atagccgcccagctccttaatcttatccagcgacat	CRISPR spacer
atagccgcccagctccttaatcttatccagcggcat	Protospacer
********************************.***

10. spacer 1.7|843916|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_007206 (Haemophilus influenzae biotype aegyptius plasmid pF1947, complete sequence) position: , mismatch: 2, identity: 0.933

cctctttgagatgttccacgaaccacaacg	CRISPR spacer
cctctttgagttgctccacgaaccacaacg	Protospacer
********** **.****************

11. spacer 1.11|844180|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_007206 (Haemophilus influenzae biotype aegyptius plasmid pF1947, complete sequence) position: , mismatch: 2, identity: 0.933

cctctttgagatgttccacgaaccacaacg	CRISPR spacer
cctctttgagttgctccacgaaccacaacg	Protospacer
********** **.****************

12. spacer 2.1|950142|34|NC_020515|CRT matches to NZ_CP054197 (Glaesserella parasuis strain YHP170504 plasmid unnamed1, complete sequence) position: , mismatch: 2, identity: 0.941

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
cgcttgagggggtaacggtatgcaaaaccattaa	Protospacer
..********************************

13. spacer 1.9|844048|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP054197 (Glaesserella parasuis strain YHP170504 plasmid unnamed1, complete sequence) position: , mismatch: 3, identity: 0.9

tattttctgtaccacaaccttgccttgctt	CRISPR spacer
tattttctgtaccgcaaccttgtcttgcct	Protospacer
*************.********.*****.*

14. spacer 1.13|844312|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP054197 (Glaesserella parasuis strain YHP170504 plasmid unnamed1, complete sequence) position: , mismatch: 3, identity: 0.9

tattttctgtaccacaaccttgccttgctt	CRISPR spacer
tattttctgtaccgcaaccttgtcttgcct	Protospacer
*************.********.*****.*

15. spacer 5.14|1564809|35|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_028766 (Mannheimia phage vB_MhM_3927AP2, complete genome) position: , mismatch: 3, identity: 0.914

aattaagtaccgtacgttgatgacggaacttgaag	CRISPR spacer
aattaagtaccgcacgttgatgacggagcttgagg	Protospacer
************.**************.*****.*

16. spacer 2.1|950142|34|NC_020515|CRT matches to NC_021724 (Aggregatibacter actinomycetemcomitans plasmid pS23A, complete sequence) position: , mismatch: 4, identity: 0.882

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
caaatgagggggtaacggtatgctaaaccattaa	Protospacer
.*  ******************* **********

17. spacer 2.1|950142|34|NC_020515|CRT matches to NC_021724 (Aggregatibacter actinomycetemcomitans plasmid pS23A, complete sequence) position: , mismatch: 4, identity: 0.882

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
caaatgagggggtaacggtatgctaaaccattaa	Protospacer
.*  ******************* **********

18. spacer 2.1|950142|34|NC_020515|CRT matches to NC_002579 (Aggregatibacter actinomycetemcomitans plasmid pVT745, complete sequence) position: , mismatch: 4, identity: 0.882

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
aaaatgagggggtaacggtatgctaaaccattaa	Protospacer
 *  ******************* **********

19. spacer 2.1|950142|34|NC_020515|CRT matches to GQ866235 (Aggregatibacter actinomycetemcomitans strain D11S-1 plasmid S57, complete sequence) position: , mismatch: 4, identity: 0.882

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
caaatgagggggtaacggtatgctaaaccattaa	Protospacer
.*  ******************* **********

20. spacer 2.1|950142|34|NC_020515|CRT matches to GQ866235 (Aggregatibacter actinomycetemcomitans strain D11S-1 plasmid S57, complete sequence) position: , mismatch: 4, identity: 0.882

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
caaatgagggggtaacggtatgctaaaccattaa	Protospacer
.*  ******************* **********

21. spacer 2.4|950341|35|NC_020515|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP045829 (Escherichia coli strain AUSMDU00014361 plasmid pAUSMDU00014361_02, complete sequence) position: , mismatch: 5, identity: 0.857

atttctgaaacagggatttgcgtttcattccattt	CRISPR spacer
atttggcgaacaggtatttgcgtttcattccattt	Protospacer
****   .****** ********************

22. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN694671 (Marine virus AFVG_250M145, complete genome) position: , mismatch: 6, identity: 0.8

cacaatc--aaaagcgattgttgatgattcaa	CRISPR spacer
--ccattaaaaaagagattgttaatgattcaa	Protospacer
  * **.  ***** *******.*********

23. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN694753 (Marine virus AFVG_250M144, complete genome) position: , mismatch: 6, identity: 0.8

cacaatc--aaaagcgattgttgatgattcaa	CRISPR spacer
--ccattaaaaaagagattgttaatgattcaa	Protospacer
  * **.  ***** *******.*********

24. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN694231 (Marine virus AFVG_250M143, complete genome) position: , mismatch: 6, identity: 0.8

cacaatc--aaaagcgattgttgatgattcaa	CRISPR spacer
--ccattaaaaaagagattgttaatgattcaa	Protospacer
  * **.  ***** *******.*********

25. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN693981 (Marine virus AFVG_250M146, complete genome) position: , mismatch: 6, identity: 0.8

cacaatc--aaaagcgattgttgatgattcaa	CRISPR spacer
--ccattaaaaaagagattgttaatgattcaa	Protospacer
  * **.  ***** *******.*********

26. spacer 2.1|950142|34|NC_020515|CRT matches to NZ_KX753679 (Pasteurella multocida strain RCAD0259 plasmid pRCADGH-2, complete sequence) position: , mismatch: 6, identity: 0.824

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
aaatgaggggggtaacggtatgctaaaccattaa	Protospacer
 * * ..**************** **********

27. spacer 2.4|950341|35|NC_020515|CRT,PILER-CR,CRISPRCasFinder matches to MK422450 (Klebsiella phage ST13-OXA48phi12.4, complete genome) position: , mismatch: 6, identity: 0.829

atttctgaaacagggatttgcgtttcattccattt	CRISPR spacer
atttggctaacggggatttgggtttcattccattt	Protospacer
****    ***.******** **************

28. spacer 5.1|1563942|36|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KM389287 (UNVERIFIED: Escherichia phage Phi06_2987 S clone contig00001 genomic sequence) position: , mismatch: 6, identity: 0.833

aaaattgcgtggacggacaatccggcgtggattttg	CRISPR spacer
aagtgggcatggacggacaatccggcgtggattttt	Protospacer
**.   **.**************************

29. spacer 5.1|1563942|36|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_AP019820 (Enterobacter hormaechei subsp. hoffmannii strain OIPH-N069 plasmid pN069_3, complete sequence) position: , mismatch: 6, identity: 0.833

aaaattgcgtggacggacaatccggcgtggattttg	CRISPR spacer
aaatgggcgtggacagacaatccggcctggattttt	Protospacer
***   ********.*********** ********

30. spacer 1.1|843520|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_KX853854 (Enterococcus faecium strain A120 plasmid pEMA120, complete sequence) position: , mismatch: 7, identity: 0.767

gccgattttaaattccatctcaagcttttc	CRISPR spacer
gccaattttaaattccatttcaagtatggt	Protospacer
***.**************.*****. *  .

31. spacer 1.1|843520|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_016967 (Enterococcus faecium plasmid pZB18, complete sequence) position: , mismatch: 7, identity: 0.767

gccgattttaaattccatctcaagcttttc	CRISPR spacer
gccaattttaaattccatttcaagtatggt	Protospacer
***.**************.*****. *  .

32. spacer 1.1|843520|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_KX976485 (Enterococcus avium strain 19081 plasmid pEA19081, complete sequence) position: , mismatch: 7, identity: 0.767

gccgattttaaattccatctcaagcttttc	CRISPR spacer
gccaattttaaattccatttcaagtatggt	Protospacer
***.**************.*****. *  .

33. spacer 1.1|843520|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MG592433 (Vibrio phage 1.052.A._10N.286.46.C3, partial genome) position: , mismatch: 7, identity: 0.767

gccgattttaaattccatctcaagcttttc	CRISPR spacer
ccctccttaaaattccatctaaagcttttg	Protospacer
 **  .** *********** ********

34. spacer 1.3|843652|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP026267 (Aminobacter sp. MSH1 plasmid pBAM2, complete sequence) position: , mismatch: 7, identity: 0.767

atgctgacaaattattaggcgtatggcaac	CRISPR spacer
tggctgacaaattattaggcatattgtcat	Protospacer
  ******************.*** *. *.

35. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP025078 (Enterococcus faecium strain LS170308 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
acaaatcacaagtgattgttgatgataaaa	Protospacer
   ***** ***.*************  **

36. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP015437 (Anoxybacillus sp. B7M1 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
aagagcgaaaagcgcttgttgaagattcaa	Protospacer
 * *.. ******* ******* *******

37. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MG969411 (UNVERIFIED: Salmonella phage GE_vB_MG, complete genome) position: , mismatch: 7, identity: 0.767

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
cacaatcaaacacgattgttgataagctca	Protospacer
********** .***********.* .. *

38. spacer 2.1|950142|34|NC_020515|CRT matches to NZ_KX753679 (Pasteurella multocida strain RCAD0259 plasmid pRCADGH-2, complete sequence) position: , mismatch: 7, identity: 0.794

tacttgagggggtaacggtatgcaaaaccattaa	CRISPR spacer
aaatgaggggggtaacagtatgctaaaccattaa	Protospacer
 * * ..*********.****** **********

39. spacer 2.4|950341|35|NC_020515|CRT,PILER-CR,CRISPRCasFinder matches to CP051275 (Salmonella phage SW-37, complete genome) position: , mismatch: 7, identity: 0.8

atttctgaaacagggatttgcgtttcattccattt	CRISPR spacer
atctggctaaccgggatctgcgtttcattccattt	Protospacer
**.*    *** *****.*****************

40. spacer 4.6|1553295|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP020439 (Streptococcus equinus strain FDAARGOS_251 plasmid unamed1 sequence) position: , mismatch: 7, identity: 0.794

ttgatattattgataatatggaaaaag-agatgac	CRISPR spacer
aatttattattgataatgtgaaaaaagaagatga-	Protospacer
    *************.**.****** ******

41. spacer 4.6|1553295|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP018188 (Streptococcus salivarius strain ICDC2 plasmid, complete sequence) position: , mismatch: 7, identity: 0.794

ttgatattattgataatatggaaaaag-agatgac	CRISPR spacer
aatttattattgataatgtgaaaaaagaagatga-	Protospacer
    *************.**.****** ******

42. spacer 5.1|1563942|36|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to FJ982340 (Burkholderia phage KS9, complete genome) position: , mismatch: 7, identity: 0.806

aaaattgcgtggacggacaatccggcgtggattttg	CRISPR spacer
aagccggcgtggacgaacaacccggcgtggattttc	Protospacer
**. . *********.****.**************

43. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP045339 (Vibrio sp. THAF190c plasmid pTHAF190c_a, complete sequence) position: , mismatch: 8, identity: 0.733

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
ttcaatcaaaagcgattggtgttgaaatca	Protospacer
. **************** ** ***  . *

44. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MK448712 (Streptococcus phage Javan237, complete genome) position: , mismatch: 8, identity: 0.733

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
aacaatcaaaagcgactgtggatgccatca	Protospacer
 **************.*** **** . . *

45. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MK448880 (Streptococcus phage Javan238, complete genome) position: , mismatch: 8, identity: 0.733

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
aacaatcaaaagcgactgtggatgccatca	Protospacer
 **************.*** **** . . *

46. spacer 1.14|844378|30|NC_020515|CRISPRCasFinder,CRT matches to MT234670 (Pseudanabaena phage PA-SR01, complete genome) position: , mismatch: 8, identity: 0.733

cgaagtaaaaatcattggttatgtagggca	CRISPR spacer
tacagtaaaaatcaatggtcatgtagctct	Protospacer
.. *********** ****.******  *

47. spacer 1.15|844444|30|NC_020515|CRISPRCasFinder,CRT matches to NZ_CP022536 (Spiroplasma corruscae strain EC-1 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.733

aagtaaatattacacaggaattatgggaga	CRISPR spacer
taggaaatattacacaggtattattcaact	Protospacer
 ** ************** *****  .*

48. spacer 4.6|1553295|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_048107 (Staphylococcus phage Pabna, complete genome) position: , mismatch: 8, identity: 0.765

ttgatattattgataatatggaaaaagagatgac	CRISPR spacer
aaaatcacattgataatgtggaaaaagaaatgac	Protospacer
  .**  .*********.**********.*****

49. spacer 4.8|1553427|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_041925 (Proteus phage VB_PmiS-Isfahan, complete genome) position: , mismatch: 8, identity: 0.765

aaatgaaagcgtataaatctcgccactttgcaat	CRISPR spacer
gagtcacagcgtataaatctcgccattttacagc	Protospacer
.*.* * ******************.***.**..

50. spacer 4.8|1553427|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN840487 (Proteus phage 2207-N35, complete genome) position: , mismatch: 8, identity: 0.765

aaatgaaagcgtataaatctcgccactttgcaat	CRISPR spacer
gagtcacagcgtataaatctcgccattttacagc	Protospacer
.*.* * ******************.***.**..

51. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN694439 (Marine virus AFVG_250M296, complete genome) position: , mismatch: 8, identity: 0.765

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
gtaaaatttctaaagaaagaataaaagatgttga	Protospacer
  *. * ** ******************.****

52. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN694282 (Marine virus AFVG_250M297, complete genome) position: , mismatch: 8, identity: 0.765

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
gtaaaatttctaaagaaagaataaaagatgttga	Protospacer
  *. * ** ******************.****

53. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to GQ443085 (Clostridium phage CP26F, complete genome) position: , mismatch: 8, identity: 0.765

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
agagaaggtataaagaaagaacaaaagaagttgt	Protospacer
 .** *. *************.****** ****.

54. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to JF767210 (Clostridium phage phi9O, complete genome) position: , mismatch: 8, identity: 0.765

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
agagaaggtataaagaaagaacaaaagaagttgt	Protospacer
 .** *. *************.****** ****.

55. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_011318 (Clostridium phage 39-O, complete genome) position: , mismatch: 8, identity: 0.765

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
agagaaggtataaagaaagaacaaaagaagttgt	Protospacer
 .** *. *************.****** ****.

56. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_019496 (Clostridium phage phiCP26F, complete genome) position: , mismatch: 8, identity: 0.765

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
agagaaggtataaagaaagaacaaaagaagttgt	Protospacer
 .** *. *************.****** ****.

57. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_015917 (Borreliella bissettii DN127 plasmid lp28-4, complete sequence) position: , mismatch: 8, identity: 0.765

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
ttagaaattataaagaaagaaaaaaataaaatgg	Protospacer
* ** **************** **** * . **

58. spacer 4.20|1554224|37|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP045223 (Achromobacter xylosoxidans strain DN002 plasmid unnamed) position: , mismatch: 8, identity: 0.784

gtgccgagacttgccggtgtatcggtc---acagctaaac	CRISPR spacer
gtggcgagaattgccggtgtatcggtctggacggcct---	Protospacer
*** ***** *****************   **.**.

59. spacer 5.1|1563942|36|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KT367887 (Klebsiella phage vB_Kp3, complete genome) position: , mismatch: 8, identity: 0.778

aaaattgcgtggacggacaatccggcgtggattttg	CRISPR spacer
aaacaggcgtggacggataacccggcgtggatcgtc	Protospacer
***   ***********.**.***********. *

60. spacer 5.1|1563942|36|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MT075871 (Klebsiella phage vB_KleS-HSE3, complete genome) position: , mismatch: 8, identity: 0.778

aaaattgcgtggacggacaatccggcgtggattttg	CRISPR spacer
aaacaagcgtggactgacaacccggcgtggatcgtt	Protospacer
***   ******** *****.***********. *

61. spacer 1.4|843718|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MK250029 (Prevotella phage Lak-C1, complete genome) position: , mismatch: 9, identity: 0.7

gggcagttgcaagacatgtatcaaaatctt	CRISPR spacer
tattctcttcaagacatgtttcaaaatctt	Protospacer
 . .  .* ********** **********

62. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN693046 (Marine virus AFVG_25M413, complete genome) position: , mismatch: 9, identity: 0.7

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
ctttcattaaagcgattgtggatgattcat	Protospacer
* .   . *********** *********

63. spacer 1.5|843784|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN693008 (Marine virus AFVG_117M9, complete genome) position: , mismatch: 9, identity: 0.7

cacaatcaaaagcgattgttgatgattcaa	CRISPR spacer
ctttcattaaagcgattgtggatgattcat	Protospacer
* .   . *********** *********

64. spacer 1.8|843982|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to AJ783769 (Sulfolobus tengchongensis spindle-shaped virus STSV1 complete genome) position: , mismatch: 9, identity: 0.7

cagtgtattcgcattggaaagcgtaaaaga	CRISPR spacer
aaagagatacgcattggaaagcgtaaatat	Protospacer
 *. . ** ****************** .

65. spacer 1.12|844246|30|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to AJ783769 (Sulfolobus tengchongensis spindle-shaped virus STSV1 complete genome) position: , mismatch: 9, identity: 0.7

cagtgtattcgcattggaaagcgtaaaaga	CRISPR spacer
aaagagatacgcattggaaagcgtaaatat	Protospacer
 *. . ** ****************** .

66. spacer 1.14|844378|30|NC_020515|CRISPRCasFinder,CRT matches to NZ_CP032532 (Bacillus megaterium NCT-2 plasmid pNCT2_4, complete sequence) position: , mismatch: 9, identity: 0.7

cgaagtaaaaatcattggttatgtagggca	CRISPR spacer
tgaagtaaaaatcattgattattttaccgt	Protospacer
.****************.**** * .

67. spacer 2.4|950341|35|NC_020515|CRT,PILER-CR,CRISPRCasFinder matches to MT028491 (Ochrobactrum phage vB_OspM_OC, complete genome) position: , mismatch: 9, identity: 0.743

atttctgaaacagggatttgcgtttcattccattt	CRISPR spacer
atttctgaaacagggaattgcttttgctcgccagt	Protospacer
**************** **** ***  *. *   *

68. spacer 4.6|1553295|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP010312 (Geoalkalibacter subterraneus strain Red1 plasmid pGSUB1, complete sequence) position: , mismatch: 9, identity: 0.735

ttgatattattgataatatggaaaaagagatgac	CRISPR spacer
gtcgcgtgattgattatttggaaaaagagatgtc	Protospacer
 * ...* ****** ** ************** *

69. spacer 4.10|1553559|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN694724 (Marine virus AFVG_250M441, complete genome) position: , mismatch: 9, identity: 0.735

tattacaacatttgacaatcaaacattatgggag	CRISPR spacer
tggtcaaacatttgatagtcaaacattatgctac	Protospacer
*. *  *********.*.************  *

70. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_011251 (Borrelia duttonii Ly plasmid pl41, complete sequence) position: , mismatch: 9, identity: 0.735

taagcaattataaagaaagaataaaagacgttgc	CRISPR spacer
tgttatacaataaagaaagaataaaagattttgc	Protospacer
*.    *. *******************. ****

71. spacer 5.15|1564876|35|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP013487 (Vibrio alginolyticus strain ATCC 33787 plasmid pMBL287, complete sequence) position: , mismatch: 9, identity: 0.743

gctatggg--ggattcgtcaatttcaattttatggtg	CRISPR spacer
--tgtgaatcaaattcgtcaatttcaatttattggtg	Protospacer
  *.**..  ..******************  *****

72. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_041977 (Citrobacter phage Mordin, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

73. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_028247 (Citrobacter phage Michonne, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

74. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MF158044 (Shigella phage Sf18, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttctaga	Protospacer
  *************.**.*******    * *.

75. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MF158040 (Shigella phage Sf13, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

76. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KM236239 (Citrobacter phage Moogle, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

77. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MF158041 (Shigella phage Sf15, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

78. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MH920362 (Citrobacter phage Maleficent, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

79. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KY654690 (Citrobacter phage Mijalis, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

80. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MF327003 (Shigella phage Sf14, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

81. spacer 4.2|1553027|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MF327005 (Shigella phage Sf19, complete genome) position: , mismatch: 10, identity: 0.706

tgttaaaaataaaccctgcacggggcagggtcgg	CRISPR spacer
atttaaaaataaaccttgtacggggctttttaga	Protospacer
  *************.**.*******    * *.

82. spacer 4.6|1553295|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MN694255 (Marine virus AFVG_250M362, complete genome) position: , mismatch: 10, identity: 0.706

ttgatattattgataatatggaaaaagagatgac	CRISPR spacer
ataatattattgataatattgataaagtaggaat	Protospacer
 *.**************** ** **** .. .*.

83. spacer 4.6|1553295|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_013544 (Lactobacillus paracasei subsp. paracasei plasmid pCD02, complete sequence) position: , mismatch: 10, identity: 0.706

ttgatattattgataatatggaaaaagagatgac	CRISPR spacer
ttgatagtattgataatatagaaattaaaccgca	Protospacer
****** ************.****  .*. .*

84. spacer 4.6|1553295|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KC013023 (Leuconostoc phage phiLN04, complete genome) position: , mismatch: 10, identity: 0.706

ttgatattattgataatatggaaaaagagatgac	CRISPR spacer
agattattattgataatattgaaaaggaaaataa	Protospacer
  . *************** *****.**.*  *

85. spacer 4.8|1553427|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to MH586730 (Salmonella phage Solent, complete genome) position: , mismatch: 10, identity: 0.706

aaatgaaagcgtataaatctcgccactttgcaat	CRISPR spacer
tcgtgatagcgtataaatcgcgccacttaatgtt	Protospacer
  .*** ************ ******** ... *

86. spacer 4.8|1553427|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_047786 (Salmonella phage vB_SenS_Sasha, complete genome) position: , mismatch: 10, identity: 0.706

aaatgaaagcgtataaatctcgccactttgcaat	CRISPR spacer
tcgtgatagcgtataaatcgcgccacttaatgtt	Protospacer
  .*** ************ ******** ... *

87. spacer 4.8|1553427|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KY002061 (Salmonella phage vB_SenS_Sergei, complete genome) position: , mismatch: 10, identity: 0.706

aaatgaaagcgtataaatctcgccactttgcaat	CRISPR spacer
tcgtgatagcgtataaatcgcgccacttaatgtt	Protospacer
  .*** ************ ******** ... *

88. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024238 (Escherichia coli O15:H11 strain 90-9272 plasmid unnamed) position: , mismatch: 10, identity: 0.706

taagcaattataaagaaagaat-aaaagacgttgc	CRISPR spacer
accgcaattataatgaaagaatcaaaggataata-	Protospacer
   ********** ******** ***.**.. *.

89. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_013507 (Escherichia coli ETEC H10407 plasmid pEntH10407, complete sequence) position: , mismatch: 10, identity: 0.706

taagcaattataaagaaagaat-aaaagacgttgc	CRISPR spacer
accgcaattataatgaaagaatcaaaggataata-	Protospacer
   ********** ******** ***.**.. *.

90. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024249 (Escherichia coli O182:H21 strain D181 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.706

taagcaattataaagaaagaat-aaaagacgttgc	CRISPR spacer
accgcaattataatgaaagaatcaaaggataata-	Protospacer
   ********** ******** ***.**.. *.

91. spacer 4.12|1553692|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_017722 (Escherichia coli ETEC H10407 plasmid p666, complete sequence) position: , mismatch: 10, identity: 0.706

taagcaattataaagaaagaat-aaaagacgttgc	CRISPR spacer
accgcaattataatgaaagaatcaaaggataata-	Protospacer
   ********** ******** ***.**.. *.

92. spacer 4.22|1554361|35|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to KT588073 (Acinetobacter phage Ab105-3phi, partial genome) position: , mismatch: 10, identity: 0.714

aaattatgccttaataatactttaagtttttaaaa	CRISPR spacer
ttgctttcatttaataatactttaacttttaaaaa	Protospacer
  ..* *  .*************** **** ****

93. spacer 4.23|1554428|35|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP017773 (Paenibacillus crassostreae strain LPB0068 plasmid pPC03, complete sequence) position: , mismatch: 10, identity: 0.714

tcttctgagctttccaggcattaaaaccttgctca	CRISPR spacer
gccctagatccttccaggcattaaaaccttgaacc	Protospacer
 *... ** *.********************  *

94. spacer 4.8|1553427|34|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP033124 (Acinetobacter wuhouensis strain WCHAW010062 plasmid p4_010062, complete sequence) position: , mismatch: 11, identity: 0.676

aaatgaaagcgtataaatctcgccactttgcaat	CRISPR spacer
gcgccaaagcgtacaaatctggccactttttatc	Protospacer
. .. ********.****** ******** .* .

95. spacer 5.6|1564278|35|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NC_048765 (Vibrio phage VAP7, complete genome) position: , mismatch: 11, identity: 0.686

gtgttttaccaggatttcttttgctagtgtctcag	CRISPR spacer
gatacgagccaggatttcttttgcttgtttctctt	Protospacer
*   .  .***************** ** ****

96. spacer 5.14|1564809|35|NC_020515|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP044084 (Pseudomonas luteola strain FDAARGOS_637 plasmid unnamed1, complete sequence) position: , mismatch: 12, identity: 0.657

aattaagtaccgtacgttgatgacggaacttgaag	CRISPR spacer
tgagaagtaccgttcgttgatgacgaaaccaccct	Protospacer
 .  ********* ***********.***.

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1202953 : 1209983

Synechococcus_phage(50.0%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015432525.1\|1202953_1204552_-	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase	Q58MG4	Prochlorococcus_phage	5.9e-69	48.4
WP_015432526.1\|1204609_1205176_-	phosphoribosylglycinamide formyltransferase	M4QRX9	Synechococcus_phage	7.5e-19	30.3
WP_015432527.1\|1205404_1206424_-	phosphoribosylformylglycinamidine cyclo-ligase	A0A0E3F760	Synechococcus_phage	1.4e-63	41.9
WP_015432528.1\|1206416_1207898_-	amidophosphoribosyltransferase	A0A0M3SGR2	Mollivirus	5.7e-50	32.8
WP_015432529.1\|1207987_1208698_-	phosphoribosylaminoimidazolesuccinocarboxamide synthase	G8EYA2	Synechococcus_phage	6.2e-47	42.6
WP_015432530.1\|1208885_1209983_+	histidinol-phosphate transaminase	A0A142C026	Faustovirus	2.0e-20	25.8

DBSCAN-SWA_2

1338111 : 1352806

Bacteriophage(11.11%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015432625.1\|1338111_1340151_-	DNA polymerase III subunit gamma/tau	A0A1L2BWV7	Bacteriophage	2.8e-47	38.6
WP_025267013.1\|1340294_1340834_-	adenine phosphoribosyltransferase	A0A1V0SKE5	Klosneuvirus	2.5e-24	43.2
WP_015432627.1\|1340923_1342096_-	3-phenylpropionate MFS transporter	NA	NA	NA	NA
WP_015432628.1\|1342092_1342911_-	pyrroline-5-carboxylate reductase	A0A1X9I6T5	Streptococcus_phage	8.9e-21	30.5
WP_015432629.1\|1342986_1343889_+	recombination-associated protein RdgC	S4TWL4	Salmonella_phage	1.2e-66	48.0
WP_015432630.1\|1343889_1345128_+	multifunctional CCA addition/repair protein	A0A0F6YPT7	Sinorhizobium_phage	5.7e-96	50.3
WP_025328958.1\|1345230_1347798_-	ATP-dependent chaperone ClpB	H6X3M6	Enterobacteria_phage	4.5e-127	34.5
WP_015432633.1\|1348203_1348788_-	dCTP deaminase	I4AZP2	Saccharomonospora_phage	3.8e-26	41.1
WP_015432634.1\|1348796_1349447_-	uridine kinase	A0A1V0SAA3	Catovirus	2.1e-33	37.1
WP_015432635.1\|1349530_1350160_+	amino acid transporter	NA	NA	NA	NA
WP_155800264.1\|1350301_1352806_-	translation initiation factor IF-2	A0A2H4UTS4	Bodo_saltans_virus	1.3e-27	25.5

DBSCAN-SWA_3

1852002 : 1903953

Shigella_phage(32.26%)

head,tRNA,transposase,tail,plate

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015433104.1\|1852002_1853361_-\|tRNA	tRNA uridine-5-carboxymethylaminomethyl(34) synthesis GTPase MnmE	NA	NA	NA	NA
WP_015433105.1\|1853370_1854252_-	DUF535 domain-containing protein	NA	NA	NA	NA
WP_015433106.1\|1854441_1855023_-	NapC/NirT family cytochrome c	NA	NA	NA	NA
WP_015433107.1\|1855022_1855445_-	nitrate reductase cytochrome c-type subunit	NA	NA	NA	NA
WP_015433108.1\|1855561_1856437_-	quinol dehydrogenase ferredoxin subunit NapH	NA	NA	NA	NA
WP_015433109.1\|1856436_1857351_-	ferredoxin-type protein NapG	NA	NA	NA	NA
WP_015433110.1\|1857513_1859997_-	nitrate reductase catalytic subunit NapA	NA	NA	NA	NA
WP_025266826.1\|1860170_1860443_-	chaperone NapD	NA	NA	NA	NA
WP_015433112.1\|1860432_1860981_-	ferredoxin-type protein NapF	NA	NA	NA	NA
WP_015433113.1\|1861212_1861338_-	50S ribosomal protein L36	NA	NA	NA	NA
WP_015433114.1\|1861347_1861614_-	type B 50S ribosomal protein L31	NA	NA	NA	NA
WP_015433115.1\|1861863_1862544_+	ribulose-phosphate 3-epimerase	NA	NA	NA	NA
WP_015433116.1\|1862698_1864138_-	glycerol-3-phosphate transporter	NA	NA	NA	NA
WP_025289718.1\|1864206_1865274_-	glycerophosphodiester phosphodiesterase	A0A220BYK6	Staphylococcus_phage	8.6e-08	47.3
WP_015433118.1\|1865519_1867211_+	anaerobic glycerol-3-phosphate dehydrogenase subunit A	NA	NA	NA	NA
WP_015433119.1\|1867200_1868475_+	glycerol-3-phosphate dehydrogenase subunit GlpB	NA	NA	NA	NA
WP_015433120.1\|1868476_1869754_+	anaerobic glycerol-3-phosphate dehydrogenase subunit C	NA	NA	NA	NA
WP_025328931.1\|1870142_1870814_-	transcriptional regulator	A0A2I7S9A5	Vibrio_phage	1.0e-27	41.4
WP_015433123.1\|1871003_1871222_+	helix-turn-helix domain-containing protein	A0A2I7S995	Vibrio_phage	2.8e-14	56.1
WP_015433124.1\|1871232_1873236_+\|transposase	Mu transposase C-terminal domain-containing protein	M4M9R2	Vibrio_phage	8.0e-116	38.9
WP_015433125.1\|1873332_1874253_+	AAA family ATPase	A0A2I7S9C3	Vibrio_phage	1.2e-66	44.9
WP_015433126.1\|1874245_1874557_+	hypothetical protein	NA	NA	NA	NA
WP_015433127.1\|1874574_1874841_+	hypothetical protein	NA	NA	NA	NA
WP_015433128.1\|1874830_1875343_+	host-nuclease inhibitor Gam family protein	F6MIJ0	Haemophilus_phage	1.3e-65	75.3
WP_015433130.1\|1875530_1875707_+	ANR family transcriptional regulator	NA	NA	NA	NA
WP_015433131.1\|1875712_1875889_+	hypothetical protein	NA	NA	NA	NA
WP_015433132.1\|1875898_1876324_+	hypothetical protein	NA	NA	NA	NA
WP_015433133.1\|1876459_1876933_+	regulatory protein GemA	NA	NA	NA	NA
WP_015433134.1\|1876929_1877472_+	hypothetical protein	A0A0M3LPP6	Mannheimia_phage	2.1e-39	46.2
WP_015433135.1\|1877616_1878048_+	Mor transcription activator	A0A0C4UQZ9	Shigella_phage	3.8e-23	42.0
WP_025328930.1\|1878056_1878488_+	DUF4236 domain-containing protein	NA	NA	NA	NA
WP_015433136.1\|1878568_1879126_+	N-acetylmuramoyl-L-alanine amidase	F6MIJ9	Haemophilus_phage	7.7e-85	77.7
WP_015433137.1\|1879115_1879334_+	DUF2644 domain-containing protein	F6MIK0	Haemophilus_phage	1.7e-24	86.8
WP_025328929.1\|1879333_1879606_+	DUF2681 domain-containing protein	NA	NA	NA	NA
WP_015433140.1\|1879734_1879962_+	TraR/DksA family transcriptional regulator	NA	NA	NA	NA
WP_015433141.1\|1879961_1880288_+	DUF2730 domain-containing protein	NA	NA	NA	NA
WP_015433142.1\|1880290_1880587_+	ribonuclease R	A0A0C4UR00	Shigella_phage	4.0e-24	57.9
WP_015433143.1\|1880620_1881190_+	DUF3486 family protein	M4MCR3	Vibrio_phage	4.5e-40	45.4
WP_015433144.1\|1881189_1882761_+	Mu-like prophage FluMu protein gp28	A0A2I7S9C5	Vibrio_phage	3.9e-158	60.9
WP_025328928.1\|1882764_1884330_+	DUF935 domain-containing protein	A0A0C4UQR8	Shigella_phage	3.3e-141	51.3
WP_015433146.1\|1884316_1885636_+\|head	phage head morphogenesis protein	C9DGN7	Escherichia_phage	3.6e-88	40.7
WP_015433147.1\|1885755_1886190_+	phage virion morphogenesis protein	NA	NA	NA	NA
WP_015433148.1\|1886420_1887476_+	hypothetical protein	C9DGP0	Escherichia_phage	2.9e-72	46.7
WP_015433149.1\|1887475_1888402_+\|head	Mu-like prophage major head subunit gpT family protein	C9DGP2	Escherichia_phage	4.1e-83	51.0
WP_015433150.1\|1888480_1888867_+	hypothetical protein	NA	NA	NA	NA
WP_015433151.1\|1888866_1889286_+	DUF1320 family protein	NA	NA	NA	NA
WP_025328927.1\|1889285_1889840_+	DUF1834 family protein	NA	NA	NA	NA
WP_015433153.1\|1889848_1890040_+	DUF2635 domain-containing protein	NA	NA	NA	NA
WP_015433154.1\|1890039_1891503_+\|tail	phage tail sheath subtilisin-like domain-containing protein	A0A0C4UQS0	Shigella_phage	6.0e-121	48.6
WP_015433155.1\|1891512_1891866_+\|tail	phage tail tube protein	NA	NA	NA	NA
WP_015433156.1\|1891868_1892252_+\|tail	phage tail assembly protein	C9DGP9	Escherichia_phage	6.0e-20	50.4
WP_015433157.1\|1892341_1894249_+	tape measure protein	A0A2I7S9D9	Vibrio_phage	2.1e-41	30.2
WP_015433158.1\|1894249_1895614_+	DNA circularization protein	A0A0C4UR32	Shigella_phage	1.0e-37	28.7
WP_015433159.1\|1895613_1896402_+\|tail	tail protein	A0A0C4UQS1	Shigella_phage	2.4e-47	38.5
WP_015433160.1\|1896398_1896896_+	bacteriophage Mu P	M4M9L5	Vibrio_phage	1.1e-13	37.9
WP_015433161.1\|1896912_1897464_+\|plate	phage baseplate assembly protein V	A0A0C4UQZ3	Shigella_phage	9.8e-32	42.3
WP_015433162.1\|1897475_1897886_+	phage GP46 family protein	A0A0C4UR04	Shigella_phage	4.7e-23	42.1
WP_015433163.1\|1897885_1898953_+\|plate	baseplate J/gp47 family protein	A0A0C4UQU9	Shigella_phage	2.5e-68	43.1
WP_015433164.1\|1898943_1899510_+	DUF2313 domain-containing protein	A0A2I7S9L6	Vibrio_phage	3.5e-16	34.3
WP_025328926.1\|1899509_1901903_+	hypothetical protein	A0A0C4UQS2	Shigella_phage	1.6e-14	46.1
WP_015433166.1\|1901903_1902539_+	DUF4376 domain-containing protein	F6MIL9	Haemophilus_phage	1.8e-45	50.3
WP_025328925.1\|1902531_1902996_+	enoyl-CoA hydratase	F6MIM0	Haemophilus_phage	1.0e-53	61.0
WP_025328924.1\|1903119_1903953_+	hypothetical protein	F6MIM2	Haemophilus_phage	5.7e-124	77.4

DBSCAN-SWA_4

2075340 : 2080725

Enterobacteria_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015433339.1\|2075340_2076093_-	ABC transporter ATP-binding protein	A0A2H4PQG7	Staphylococcus_phage	2.5e-17	30.2
WP_015433340.1\|2076095_2076878_-	ABC transporter permease	NA	NA	NA	NA
WP_015433341.1\|2076889_2077429_-	dTDP-4-dehydrorhamnose 3,5-epimerase	I7HJC4	Enterobacteria_phage	6.4e-52	52.0
WP_015433342.1\|2077425_2078310_-	dTDP-4-dehydrorhamnose reductase	A0A291LA50	Escherichia_phage	1.3e-41	38.5
WP_015433343.1\|2078309_2079188_-	glucose-1-phosphate thymidylyltransferase RfbA	I7I009	Enterobacteria_phage	1.9e-109	67.0
WP_015433344.1\|2079196_2080258_-	dTDP-glucose 4,6-dehydratase	I7HTA3	Enterobacteria_phage	7.8e-102	52.7
WP_015433345.1\|2080383_2080725_+	iron-sulfur cluster insertion protein ErpA	A0A2H4N7M3	Lake_Baikal_phage	4.6e-24	48.6

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_020515

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection