CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Target MGE spacer number	Prophage number
NC_017470	Lactobacillus amylovorus GRL1118, complete sequence	3 crisprs	cas14j,cas2,cas3,DEDDh,cas8e,cse2gr11,cas7,cas5,cas6e,cas1,DinG,csa3	12	5
NC_017472	Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence	1 crisprs	NA	5	5
NC_017471	Lactobacillus amylovorus GRL1118 plasmid p1, complete sequence	0 crisprs	NA	0	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_017470_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017470_1

540951-541134

Orphan

Consensus_repeat	Method
CACGCGTGGGTTCAAATCCCACAT	PILER-CR

2 spacers

The CRISPR arrays of NC_017470_1

>merge|NC_017470|1|540951-541134|PILER-CR
CGCGCGTGGGTTCAAATCCCACATCCTCCTTTGATTGGTCCATTGGAGCAGTGGTTTATCTCGCCTCCCTGTCACGGAGGAGATCGTGGGTTCAAATCCCACATGGACCGTAATATGGCGGAATTGGTGAAGGGGTTAACACACTGGTTTGTGGATCCAGCATGCGTGGGTTCGAATCCCACAT

>NC_017470|1|1|540951-541134|PILER-CR
CGCGCGTGGGTTCAAATCCCACAT	CCTCCTTTGATTGGTCCATTGGAGCAGTGGTTTATCTCGCCTCCCTGTCACGGAGGAGAT
CGTGGGTTCAAATCCCACATGGAC	CGTAATATGGCGGAATTGGTGAAGGGGTTAACACACTGGTTTGTGGATCCAGCATG
CGTGGGTTCGAATCCCACAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_017470.1\|WP_081456847.1\|545397_545874_+\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|379228
NC_017470.1\|WP_013437363.1\|535640_535889_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_014565644.1\|541291_542791_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|129794
NC_017470.1\|WP_013437361.1\|533009_534440_+\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatB	unknown	unknown	gnl\|CDD\|235489
NC_017470.1\|WP_014565643.1\|538935_540282_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	unknown	unknown	gnl\|CDD\|225174
NC_017470.1\|WP_014565646.1\|546470_547286_-\|PTS-system-mannose/fructose/sorbose-family-transporter-subunit-IID	unknown	unknown	gnl\|CDD\|377079
NC_017470.1\|WP_013437368.1\|540291_540792_+\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|366181
NC_017470.1\|WP_014565649.1\|549339_549747_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_013641607.1\|531565_533005_+\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatA	unknown	unknown	gnl\|CDD\|234572
NC_017470.1\|WP_014565648.1\|548083_548995_-\|PTS-mannose/fructose/sorbose-transporter-subunit-IIAB	unknown	unknown	gnl\|CDD\|377139
NC_017470.1\|WP_014565647.1\|547260_548073_-\|PTS-sugar-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|377077
NC_017470.1\|WP_014565650.1\|549743_552128_+\|SLAP-domain-containing-protein	unknown	unknown	gnl\|CDD\|274008
NC_017470.1\|WP_014565642.1\|536790_537138_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_013437359.1\|531257_531566_+\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatC	unknown	unknown	gnl\|CDD\|178810
NC_017470.1\|WP_013437364.1\|535939_536650_-\|Bax-inhibitor-1/YccA-family-protein	unknown	unknown	gnl\|CDD\|198414
NC_017470.1\|WP_013437366.1\|537189_538566_-\|Na+/H+-antiporter-NhaC	unknown	unknown	gnl\|CDD\|188097
NC_017470.1\|WP_013437370.1\|543435_545208_+\|oleate-hydratase	unknown	unknown	gnl\|CDD\|237575
NC_017470.1\|WP_014565645.1\|545963_546452_+\|DUF3955-domain-containing-protein	unknown	unknown	gnl\|CDD\|379038
NC_017470.1\|WP_014565651.1\|552295_553132_+\|aldo/keto-reductase	unknown	unknown	gnl\|CDD\|381359
NC_017470.1\|WP_013437362.1\|534465_535386_+\|diacylglycerol-kinase-family-lipid-kinase	unknown	unknown	gnl\|CDD\|237282

Protein	Function_ID	Function_description	E-value
NC_017470.1\|WP_081456847.1\|545397_545874_+\|GNAT-family-N-acetyltransferase	gnl\|CDD\|379228	pfam13508, Acetyltransf_7, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	6.69814e-08
NC_017470.1\|WP_014565644.1\|541291_542791_+\|MFS-transporter	gnl\|CDD\|129794	TIGR00711, Uncharacterized_MFS-type_transporter_YhcA, drug resistance transporter, EmrB/QacA subfamily. This subfamily of drug efflux proteins, a part of the major faciliator family, is predicted to have 14 potential membrane-spanning regions. Members with known activities include EmrB (multiple drug resistance efflux pump) in E. coli, FarB (antibacterial fatty acid resistance) in Neisseria gonorrhoeae, TcmA (tetracenomycin C resistance) in Streptomyces glaucescens, etc. In most cases, the efflux pump is described as having a second component encoded in the same operon, such as EmrA of E. coli. [Cellular processes, Toxin production and resistance, Transport and binding proteins, Other].	6.2361e-44
NC_017470.1\|WP_013437361.1\|533009_534440_+\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatB	gnl\|CDD\|235489	PRK05477, gatB, Asp-tRNA(Asn)/Glu-tRNA(Gln) amidotransferase subunit GatB.	0
NC_017470.1\|WP_014565643.1\|538935_540282_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	gnl\|CDD\|225174	COG2265, TrmA, SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase [Translation, ribosomal structure and biogenesis].	8.63856e-159
NC_017470.1\|WP_014565646.1\|546470_547286_-\|PTS-system-mannose/fructose/sorbose-family-transporter-subunit-IID	gnl\|CDD\|377079	pfam03613, EIID-AGA, PTS system mannose/fructose/sorbose family IID component.	2.57604e-104
NC_017470.1\|WP_013437368.1\|540291_540792_+\|GNAT-family-N-acetyltransferase	gnl\|CDD\|366181	pfam00583, Acetyltransf_1, Acetyltransferase (GNAT) family. This family contains proteins with N-acetyltransferase functions such as Elp3-related proteins.	1.95213e-13
NC_017470.1\|WP_013641607.1\|531565_533005_+\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatA	gnl\|CDD\|234572	PRK00012, gatA, Asp-tRNA(Asn)/Glu-tRNA(Gln) amidotransferase subunit GatA.	0
NC_017470.1\|WP_014565648.1\|548083_548995_-\|PTS-mannose/fructose/sorbose-transporter-subunit-IIAB	gnl\|CDD\|377139	pfam03830, PTSIIB_sorb, PTS system sorbose subfamily IIB component.	1.05287e-58
NC_017470.1\|WP_014565647.1\|547260_548073_-\|PTS-sugar-transporter-subunit-IIC	gnl\|CDD\|377077	pfam03609, EII-Sor, PTS system sorbose-specific iic component.	1.71169e-83
NC_017470.1\|WP_014565650.1\|549743_552128_+\|SLAP-domain-containing-protein	gnl\|CDD\|274008	TIGR02168, Chromosome_partition_protein_Smc, chromosome segregation protein SMC, common bacterial type. SMC (structural maintenance of chromosomes) proteins bind DNA and act in organizing and segregating chromosomes for partition. SMC proteins are found in bacteria, archaea, and eukaryotes. This family represents the SMC protein of most bacteria. The smc gene is often associated with scpB (TIGR00281) and scpA genes, where scp stands for segregation and condensation protein. SMC was shown (in Caulobacter crescentus) to be induced early in S phase but present and bound to DNA throughout the cell cycle. [Cellular processes, Cell division, DNA metabolism, Chromosome-associated proteins].	8.09446e-14
NC_017470.1\|WP_013437359.1\|531257_531566_+\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatC	gnl\|CDD\|178810	PRK00034, gatC, Asp-tRNA(Asn)/Glu-tRNA(Gln) amidotransferase subunit GatC.	2.74239e-29
NC_017470.1\|WP_013437364.1\|535939_536650_-\|Bax-inhibitor-1/YccA-family-protein	gnl\|CDD\|198414	cd10432, BI-1-like_bacterial, Bacterial BAX inhibitor (BI)-1/YccA-like proteins. This family is comprised of bacterial relatives of the mammalian members of the BAX inhibitor (BI)-1 like family of small transmembrane proteins, which have been shown to have an antiapoptotic effect either by stimulating the antiapoptotic function of Bcl-2, a well-characterized oncogene, or by inhibiting the proapoptotic effect of Bax, another member of the Bcl-2 family. In plants, BI-1 like proteins play a role in pathogen resistance. A characterized prokaryotic member, Escherichia coli YccA, has been shown to interact with ATP-dependent protease FtsH, which degrades abnormal membrane proteins as part of a quality control mechanism to keep the integrity of biological membranes.	1.06509e-50
NC_017470.1\|WP_013437366.1\|537189_538566_-\|Na+/H+-antiporter-NhaC	gnl\|CDD\|188097	TIGR00931, Uncharacterized_Na+/H+_antiporter_HI_1107, Na+/H+ antiporter NhaC. A single member of the NhaC family, a protein from Bacillus firmus, has been functionally characterized.It is involved in pH homeostasis and sodium extrusion. Members of the NhaC family are found in both Gram-negative bacteria and Gram-positive bacteria. Intriguingly, archaeal homolog ArcD (just outside boundaries of family) has been identified as an arginine/ornithine antiporter. [Transport and binding proteins, Cations and iron carrying compounds].	5.58549e-110
NC_017470.1\|WP_013437370.1\|543435_545208_+\|oleate-hydratase	gnl\|CDD\|237575	PRK13977, PRK13977, myosin-cross-reactive antigen; Provisional.	0
NC_017470.1\|WP_014565645.1\|545963_546452_+\|DUF3955-domain-containing-protein	gnl\|CDD\|379038	pfam13127, DUF3955, Protein of unknown function (DUF3955). This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria and eukaryotes. Proteins in this family are typically between 68 and 87 amino acids in length. There are two completely conserved residues (G and E) that may be functionally important.	4.33846e-20
NC_017470.1\|WP_014565651.1\|552295_553132_+\|aldo/keto-reductase	gnl\|CDD\|381359	cd19133, AKR_AKR5F1, the AKR5F family of aldo-keto reductase (AKR). Klebsiella sp. 2,5-diketo-D-gluconic acid reductase (2,5-DKG reductase) is a founding member of aldo-keto reductase family 5 member F1 (AKR5F1). It catalyzes the reduction of 2,5-diketo-D-gluconic acid (25DKG) to 2-keto-L-gulonic acid (2KLG).	6.33038e-158
NC_017470.1\|WP_013437362.1\|534465_535386_+\|diacylglycerol-kinase-family-lipid-kinase	gnl\|CDD\|237282	PRK13055, PRK13055, putative lipid kinase; Reviewed.	0

>NC_017470.1|WP_013437368.1|540291_540792_+|GNAT-family-N-acetyltransferase
MIIKPLISEDEARQTSKLFQKCWQDVYKGILPAEFLDNIPENAWVKRFNESGRHNLIFEDDKNIVRAAVSYGRPRDTRMLGCGELMALYVEPDFQGYNVGKTLLNAAENELKKMGYGKIYLWCLDGNEKAQGFYEHFGWRNIATERFVEIVGKEYKYLLYQKNLRD
>NC_017470.1|WP_014565643.1|538935_540282_+|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD
MKKNQIVDLEITDLSYEAMGVAHYEGLTVFVTNALPGEIVSAKILKVKKNFAFAKIEKIKKESPDRVKIKLNQWVQTGLASLAHIKYDKQLEFKRNQVVNLLKKAHLDDIEVGQTLPSPEQTGYRNKAQVPVREINGQLEIGFFRRHSHDLVPLTNFFTTDPEIDRVLVAVRDILRKYRVPAYDEINHKGEVRYLDVRRSKATGEIMVILVCLHNDFPQLLGVAAEVSQIPGVTGLILNHNPKKTNVILGKKDYLVLGNDQITDQIGDLKFRISPQSFFQINSLQTPRLYDLAIKKADLKPSDVVIDAYSGIGTIGLSVAKHVKAVRGIEVVRDAIKDAKDNAKLNDIDNAKYYLGKAEEIMPRWAKQGLKTDVVFVDPPRKGLTPEFIDATAKTGPEKVVYISCNPATMVRDLQLFQEQGYEFDRIDPVDMFPQTPHVEAVTVLTKK
>NC_017470.1|WP_013437366.1|537189_538566_-|Na+/H+-antiporter-NhaC
MEKKKVSFAESIIILIVLLAILGVSVIKFGLSPEVPVLFTVLLLTFWARLRGFSWQDVQNGIKEGIGVAIIPIFIFMLIGALIGVWIKAGIIPSIMVLGFNMISGSFFVPSVFIVCSIVGVAIGSGFTTISTVGIALFGIGSSMGANPALVAGAIISGAVFGDKMSPLSDSTNLSSAVAESELFSHIKNMMWSTIPSFVVSLILFWILGNSGHMDPTKIERTSQVLQNNFTISWWALLPIVLMLICAWRKIPAIPTLFMNIAITVVMIFIQSPHESAQSLNNLIMNGFVAKTSDASVNALLTRGGISSMMATVALIISTLSLGGMLMKFNIVQSAMEPLVKHLNKPGRLITVTILSGICINLFVGEQYLSVILPGRAFKPAFDKIGLSPLALSRVLEDGGSVINYLIPWGVAGSFAASALGVPVLQFLPFVFFSLLSPVFSIFSGVTGIGLKWAKKNK
>NC_017470.1|WP_014565642.1|536790_537138_+|hypothetical-protein
MDKKYTDIEVRGERSDHPDKSYAADEVRKLFFTENAKKKYDILTGSQKTFIDRELDDLRLSRSSSVSRKDNSELQQEIVFEEQNNQVIVTDILYDDYRNSKEYKKAQVRMYDMNN
>NC_017470.1|WP_013437364.1|535939_536650_-|Bax-inhibitor-1/YccA-family-protein
MDNMNFSSPERRQVHDVSEVNGFLSKMYSYMGLAVLVSAITAFLTMTVFRAAVMQMPTALMWIILIVPLGLSMGISFRATRNPVAGFVMLMILAVIYGFEFALLAGFYTGAQISTAFLSSAAVFGAMAIFGTFTKRDLNNLGSYMGAALIGLLVAMIVNIFLRNSVASFVFSIIGVIIFTGLTAYDAQKMKSIYNNYGSQVPTNGLAVLGALQLYLDFINIFLFLLQIFGMGNDRN
>NC_017470.1|WP_013437363.1|535640_535889_+|hypothetical-protein
MQRVGTMAGNPQLKLTEKERTLMTINVQVFVHSMIGLVEVLLNYGDILLPYDMRQSIMAFLHQSPVELMSSMVPNKEEKTEQ
>NC_017470.1|WP_013437362.1|534465_535386_+|diacylglycerol-kinase-family-lipid-kinase
MTSKARLIYNPVSGHEQMPKNVADILDVLEQAGYEASAFRTTPEQNSARNEATRAAKEGFDLIVAAGGDGTINEVVNGIAFLDKRPKMAIIPAGTTNDYARALAIPRDNIPDAAKVILKNKTRKMDIGKAVFGDQTQYFVNIAASGSLTELTYGVPSEVKSALGYAAYLIKGAEMLPHLTENEMRLTYDDGVYEGKLSMFLLGMTNSIGGFEQVMPDAQLSDGLFQLIVVKPSDPVSMMKLMALALNGKHVDDPNIIYTKTRSLKAELIGKNSGRDLPVNLDGEIGGYCPVEFHNLQQRIEFYVGK
>NC_017470.1|WP_013437361.1|533009_534440_+|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatB
MNFKSTIGLEVHFELKTKSKIFSPSPVTYGAEQNTETNVIDWAMPGTLPMVNKNVYRLGIMVAIATHAHILPTTHFDRKNYFYPDNPKAYQITQFFQPLARDGYIEVEVRGKKKRIGIHEMHIEEDAGKNTHGTNGFSYVDLNRQGVPLLEVVSEPDMEDPEEAYAYLEKLRKIVQFTGASDVKMEEGSMRVDTNISIRPAGQKELGTKVEMKNLNSFDHVRRSLAYEEKRQEQVLLAGGHIQLSTRRFDEATGKTVLERVKEGDSDYRYFPEPDIAPDHISQEWIDQIAKELPKSPFDRYDDYVNKYGLKPYDANVLLQTKESSDFFDAAVAAGADPTLAANWMNTQVNGYLNDHRVGLNDIKLTPEHLAEMIQLIKDGTISSKIAKKVFAETIANGTDPKKYVEDNGMVQLSDTSVLAPMVKKVVDDNPQSVEDFKNGKDRAIGYLVGQIMKQTRGKANPKMVNKLLNQELQSR
>NC_017470.1|WP_013641607.1|531565_533005_+|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatA
MNYLNEDIDSLNKKLASGDLSADKLAKDTVANIKDTDKKLNAWITVLDDAKPAENLDYSKSKLAGIPIAIKDNIITNGIKTTAASHILYNYMPMYDATVISKLKKAGVTLVGKTNMDEFAMGSSTEHSYYGATHNPWNLDKVPGGSSGGSAAAVAGGQVVAALGSDTGGSIRQPAAFNGIFGIKPTYGRVSRWGLIAFGSSLDQIGVMTKRVKDSAEVLNVIAGADEHDSTVSTREVPDFTKFIGQDVKGLRVAVPKEYMEAVSGEMREVIQKQIDTLKDAGAIINEVSLPHTKYVVPDYYIIASSEASSNLQRYDGIRYGYRAKDTKNLLDVYVKSRSEGFGTEVKRRIMLGSFALSAGSYDRFFRQAAKVRTLICNDFDKIFAENDVIVGPTTTEPAFGIGEEVSDPIKMYNNDILTISANLAGIPAASVPAGLVDGMPVGLQIMAKRFDEGNVFKTADFIERSNKFYEKTPTGMED
>NC_017470.1|WP_013437359.1|531257_531566_+|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatC
MEITKDTIKHVATLSRLAFNEEELDKFTDQMGSIINMADQLSEVDTEGVDETVQVVDRDTVFREDKPEHWQGQTRETLMANVPEKANGYIKVPVIINKDEDE
>NC_017470.1|WP_014565644.1|541291_542791_+|MFS-transporter
MNKKQVTMVTIALMLGNVMSGLDGTIINTAIPAIVASLHGIQFMGWIVAIFLLGMSISIPIWTKVGEKITNKRAFEISLALFVIGSALQGMAPNIIFFLCSRFIMGVGAGGMGSLPYIIAGYVFKNIKTRTKVLGYLTASWNGAAILGPLIGGWLIDAFSWHWVFYINIPIGLIAFLICLIYYKPVTPKQTPVFDIPGASLLVIGLLPFLMGVQLVGLTASWIVISLIIVSLVFIVLFFIRENHAQNPIIPVSLFKNKDLDGDFLLFAFTWGAFIAVNTYLPMWAQALLGLSALLGGMTLIPNSIVEIIASQSVVAIQDHLTTFKLVFIGIFAMLISSAGMFFADLHMPIQLLAAIGAFSGIGVGFIFVALQLKVQIDAGLKNMATATSTSYLIRILAQTVMAAVYGVIMNLNLASGVSSHPGITITMMNKLSDAKSAKLLPQNLVPTMRNILHSGIKEIMLVSVILLVIALVLNFYFNFGKKTEETAIVNEKANSDWD
>NC_017470.1|WP_013437370.1|543435_545208_+|oleate-hydratase
MHYSNGNYEAFVNASKPKDVDQKSAYIVGSGLAALASAVFLIRDGHMKGERIHIFEELGLPGGSMDGIYNKQKESYIIRGGREMEPHFECLWDLFRSIPSPENKDESVLDEFYRLNRRDPSYAKTRVIVNRGEALPTDGQLLLTPKAVKEIVDLCLTPEKDLQNKKINEVFDKEFFQSNFWLYWSTMFAFEPWASAMEMRRYLMRFVQHVATLKNLSSLRFTKYNQYESLILPMVKYLKDHGVQFHYDTVVDNVFVNRSNGEKVAKQIILTENGEKKNIDLTENDLVFVTNGSITESTTYGDNLHPAPEEHELGASWQLWKNLAAQDEDFGHPEVFCKDIPKANWRMSATITFKNNDIVPFIEAVNKKDPHSGSIVTSGPTTIKDSNWLLGYSISRQPHFKAQKPNELIVWLYGLFSDTKGNYVEKTMPDCNGIELCEEWLYHMGVPEERIPEMAAAATTIPAHMPYITSYFMPRALGDRPKVVPDHSKNLAFIGNFAETPRDTVFTTEYSVRTAMEAVYTLLDIDRGVPEVFASAFDVRMLMNAMYYLNDQKKLKDLDLPMPEKLAIKGMLKKVKGTYVEELLKKYKLI
>NC_017470.1|WP_081456847.1|545397_545874_+|GNAT-family-N-acetyltransferase
MYMKAFPEWERFSMFSLLAMSLHRNVKFHAIYDDGKFCGITYYAENDNTVYLTYLAVSEKLRGQGYGSKILTMLEDNFPDKQIVIDIEPVTKKVKNYKQRVSRLKFYERNGFHRTDQKLKDPDGEFEALTTGERLDKNSFIKILRQMSFGFYQARVEK
>NC_017470.1|WP_014565645.1|545963_546452_+|DUF3955-domain-containing-protein
MEFSDQIKQLRKENNLSQVQYAKKLHVTRQAVSNWKNNRNLLDLEMLIEINRVFHISLDQLILGDDNMNKMTQKLIKDTDENRKAKYNMITTLIGGFLMIVGFVCFFIKANSVEYVDKQGFLHENFYLILVGYLFLFAGIIVLIAGGIVYLRNKHKHKKRAP
>NC_017470.1|WP_014565646.1|546470_547286_-|PTS-system-mannose/fructose/sorbose-family-transporter-subunit-IID
MTKANTKTNSGKLTKRDLFRANWRWLWGSQLSWNYERMMAPGYFYAVLPFLKRWYKDDELVEMMQMQTQFFNVNAYVGNFIIGVDLALEESQGIKSKDTVAGIKTGLMGPLAGIGDTIFSAIIPTICGSIGAYMGLRGNPLGSILWILVDLIILFLRFSFLPMGYYQGTKLIDSASGKLNAITDSAILLGVTVVGALIPTVIKAKVPYVFHTGKITLKMQTILNQIMPSLVPVLLVTLVYWLLGKKGVTSTKMIWFVLILGIILSYFHILG
>NC_017470.1|WP_014565647.1|547260_548073_-|PTS-sugar-transporter-subunit-IIC
MTIAWWQILLLTCLAFWVIIDQLTVSILNNPLAIGMVSGIIMGDITTGLAVGSTLQLMVLGVSTYGGASMPDFMTGAIVGTVYAVLSGKGIQFAIGLAVPVGLLMVQLDVLARFINTIFQHRMDKFIKENNPDAAARNALWGTFSWGLSRAIPVFILLIVGNDVVRMILHIIPTWLTNGLKVSGGILPVVGIAILLRYLPTKRFISYLAIGFIAASYMKIPMLGVALLGAALAYIHYQREVAKLEEKPATTNTNNTESEEYENDEGEYEN
>NC_017470.1|WP_014565648.1|548083_548995_-|PTS-mannose/fructose/sorbose-transporter-subunit-IIAB
MANFLLVSHGEYAKATKASVEMIAGEHKNVKAIAFKQTMNQDDLLEEITKAASEFDEAPTILVDIAGGTPANTAQRYQQKHPDVAVYSGLSMPLLLAVVMGTPIDEAIKQAIDNMAPVGLTKKKEEPKKTIKKEETPNKNVTLTPHTMQNVRIDERLIHGQVATMWTNALKLTRIMVVGDDIVKNDVLKTGLKTACPHGVHLSILTAHGAARRINSGKYVGQTVLLLVKNPGVLRQLVDFDVKLPEINVGNMSTKPHSRQVAKSVAVLDKDVEDFEYLDQKGCHIYHQMVPSEPKEDFMEMIK
>NC_017470.1|WP_014565649.1|549339_549747_+|hypothetical-protein
MGIKKVEVTSAIALALSAVALVGTQTNNKVQAASSNVENSSVVKESSNADIATIQKNYQVAQDQYKKANDAWNQIQQSENSKLNQAETNAEQAKANYDSQVKLNEQAKAENETAQNNLDQAQKVKEQAEKMLKRL
>NC_017470.1|WP_014565650.1|549743_552128_+|SLAP-domain-containing-protein
MNGGLDKANSARDAKQKEVDSAQSDLNKTQSDAKKKQEEVNKDQQDFDNKSKAVSDDTQKLNQANSELQTKTDAKNAADTAVDQANEEAKKNPDYKSASDQYESATDKLNEAQKNKDAADKALSEANEAVNTATSNQKEKQDAADGAKNGLTQAQKNKDAADKALNDANDGVKTTTATQKEKQTAVDEAQDALTQAQKGKETADKALSEANNGVKTTTATKKEKQTAVDEAQKSLTQAQKNKDVADKALSEANEAVNTATATQKEKQTAVDNAQKSLTQAQNSKDAADKALSDANEAVNTATATQKEKQTAIDEAQDALTQAQKGKETADKALSEANEAVNTATATQKEKQTAADEAQDALTQAQKAKDAADKALSAANDAVKTAIATRSAKQTAADKAKNEFDGITSQYNAAKDIFEKAQISEKNVEAALNKQKQATQELANAVKAQKQATDNLRKDTIAQQVLATAKTQQQTLDFAVKQKSDKLNNLQTELDQLKQTATALQKKVDDFTNATNALIIANQEAETAAQNAKDAQEKLQELDKINENAQSNLASVQKEYNDTIARAQSALKEAKSALDNAQAELTNAQLAEAQANKQNENNYSQTIGDENSSSSNNTNVNVANNNSDSQFVTDNNATNEHQGSILTPTTKTSNADKESKAVRVIRKAYVYTSNHKVAKKNGKKISLKKRSLIKVLDNAKVYRIKGGRFYRIGKNRFVKVGNVEKFTIQINMHATIAGRKNRKVHVSNSNGKHINKYVIAGHNYRFDRKKVIKGEVYYRIANKDQWIKENKLIFK
>NC_017470.1|WP_014565651.1|552295_553132_+|aldo/keto-reductase
MENFVTLNNGVKMPRLGFGVYQIDDLAQTQQVVEDGLEIGYRLVDTAQIYGNEQAVGDAIKRSNVPREDIFVTSKIWVNDYGYDNTLKAFDDSMKKLQLDYIDLYLIHKPYNDYYGTWRALERLYKEGRIRAIGVSSFWNERLADLITFNDVKPAVNQIETNVWNQEWKSQKYMEKEGVQPEAWAPFAEGANHIFTNPVLEEIAAKHHKTTAQVMLRWFLQRNYVVIPKSVHKKRLAENFDVFDFELDAEDMKKIKTLDQGHSILEDEMDPEIVESFR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017470_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017470_2

1001645-1002709

TypeI-E

I-B,III-A,III-B

Consensus_repeat	Method
GTGTTCTCCACGTAAGTGGAGGTGATCC	PILER-CR
GTGTTCTCCACGTAAGTGGAGGTGATCC	CRISPRCasFinder
GTGTTCTCCACGTAAGTGGAGGTGATCC	CRT

17 spacers

cas3,cas8e,cse2gr11,cas7,cas5,cas6e,cas1,DEDDh

The CRISPR arrays of NC_017470_2

>merge|NC_017470|2|1001645-1002709|PILER-CR,CRISPRCasFinder,CRT
GTGTTCTCCACGTAAGTGGAGGTGATCCCAAAAACAGCTTTAGCACCAGCACTATGGTAAGGTGTTCTCCACGTAAGTGGAGGTGATCCTACTCCCCGAGCTTTTAACCGACGTCGCTTTAAGTGTTCTCCACGTAAGTGGAGGTGATCCTCATCTATTCGTTGCTTAAAAATTTTTCGTTGTGTGTTCTCCACGTAAGTGGAGGTGATCCTATTCGGATCGTATGGTCAATTTGCGATTTATAGTGTTCTCCACGTAAGTGGAGGTGATCCTTATTCCGTCTGCGTAGTCATAGCCACCAACAAGTGTTCTCCACGTAAGTGGAGGTGATCCTAATCAGATTCTAGGAAGGAGGAAAACATGGCAGTGTTCTCCACGTAAGTGGAGGTGATCCTAATCAGATTCTAGGAAGGAGGAAAACATGGCAGTGTTCTCCACGTAAGTGGAGGTGATCCTATCAGTAACATAGTTGTCCGTGATAGCAGATTGTGTTCTCCACGTAAGTGGAGGTGATCCCGTGGAACGCTTACGGTAACACCGTCAATCGAGGTGTTCTCCACGTAAGTGGAGGTGATCCTCGGCATTGTGGGATGCCAGCGCTGGGCTTTATGTGTTCTCCACGTAAGTGGAGGTGATCCCATGGACCACTTGGTTGAAGCCAGCACTAAGCTGTGTTCTCCACGTAAGTGGAGGTGATCCCCAGTCCGACTACCACCAGCTCAAAACAGTGGGGTGTTCTCCACGTAAGTGGAGGTGATCCTGTTTGACCAAGTTTTACAGACTTTAATAATGGGTGTTCTCCACGTAAGTGGAGGTGATCCCGTGCGGCGCCACTCGTTTGGCGTGCGGTAAAAGTGTTCTCCACGTAAGTGGAGGTGATCCTATCCTGAATATTTGCCTATTAATGGGGAATGGGTGTTCTCCACGTAAGTGGAGGTGATCCCGCATTGCAACGCTTGTGGAGTGATACGGCAACGTGTTCTCCACGTAAGTGGAGGTGATTCCTATTCAATTATCAAGCATAACTAGTTGCTAAAGTGTTCTCCATAAATGTGAAGGTATTAT

>NC_017470|2|2|1001645-1002648|PILER-CR
GTGTTCTCCACGTAAGTGGAGGTGATCC	CAAAAACAGCTTTAGCACCAGCACTATGGTAAG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TACTCCCCGAGCTTTTAACCGACGTCGCTTTAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TCATCTATTCGTTGCTTAAAAATTTTTCGTTGT
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATTCGGATCGTATGGTCAATTTGCGATTTATA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TTATTCCGTCTGCGTAGTCATAGCCACCAACAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TAATCAGATTCTAGGAAGGAGGAAAACATGGCA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TAATCAGATTCTAGGAAGGAGGAAAACATGGCA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATCAGTAACATAGTTGTCCGTGATAGCAGATT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGTGGAACGCTTACGGTAACACCGTCAATCGAG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TCGGCATTGTGGGATGCCAGCGCTGGGCTTTAT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CATGGACCACTTGGTTGAAGCCAGCACTAAGCT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CCAGTCCGACTACCACCAGCTCAAAACAGTGGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TGTTTGACCAAGTTTTACAGACTTTAATAATGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGTGCGGCGCCACTCGTTTGGCGTGCGGTAAAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATCCTGAATATTTGCCTATTAATGGGGAATGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGCATTGCAACGCTTGTGGAGTGATACGGCAAC
GTGTTCTCCACGTAAGTGGAGGTGATTC

>NC_017470|2|1|1001645-1002709|CRISPRCasFinder
GTGTTCTCCACGTAAGTGGAGGTGATCC	CAAAAACAGCTTTAGCACCAGCACTATGGTAAG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TACTCCCCGAGCTTTTAACCGACGTCGCTTTAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TCATCTATTCGTTGCTTAAAAATTTTTCGTTGT
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATTCGGATCGTATGGTCAATTTGCGATTTATA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TTATTCCGTCTGCGTAGTCATAGCCACCAACAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TAATCAGATTCTAGGAAGGAGGAAAACATGGCA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TAATCAGATTCTAGGAAGGAGGAAAACATGGCA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATCAGTAACATAGTTGTCCGTGATAGCAGATT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGTGGAACGCTTACGGTAACACCGTCAATCGAG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TCGGCATTGTGGGATGCCAGCGCTGGGCTTTAT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CATGGACCACTTGGTTGAAGCCAGCACTAAGCT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CCAGTCCGACTACCACCAGCTCAAAACAGTGGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TGTTTGACCAAGTTTTACAGACTTTAATAATGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGTGCGGCGCCACTCGTTTGGCGTGCGGTAAAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATCCTGAATATTTGCCTATTAATGGGGAATGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGCATTGCAACGCTTGTGGAGTGATACGGCAAC
GTGTTCTCCACGTAAGTGGAGGTGATTC	CTATTCAATTATCAAGCATAACTAGTTGCTAAA
GTGTTCTCCATAAATGTGAAGGTATTAT

>NC_017470|2|1|1001645-1002709|CRT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CAAAAACAGCTTTAGCACCAGCACTATGGTAAG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TACTCCCCGAGCTTTTAACCGACGTCGCTTTAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TCATCTATTCGTTGCTTAAAAATTTTTCGTTGT
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATTCGGATCGTATGGTCAATTTGCGATTTATA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TTATTCCGTCTGCGTAGTCATAGCCACCAACAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TAATCAGATTCTAGGAAGGAGGAAAACATGGCA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TAATCAGATTCTAGGAAGGAGGAAAACATGGCA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATCAGTAACATAGTTGTCCGTGATAGCAGATT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGTGGAACGCTTACGGTAACACCGTCAATCGAG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TCGGCATTGTGGGATGCCAGCGCTGGGCTTTAT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CATGGACCACTTGGTTGAAGCCAGCACTAAGCT
GTGTTCTCCACGTAAGTGGAGGTGATCC	CCAGTCCGACTACCACCAGCTCAAAACAGTGGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	TGTTTGACCAAGTTTTACAGACTTTAATAATGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGTGCGGCGCCACTCGTTTGGCGTGCGGTAAAA
GTGTTCTCCACGTAAGTGGAGGTGATCC	TATCCTGAATATTTGCCTATTAATGGGGAATGG
GTGTTCTCCACGTAAGTGGAGGTGATCC	CGCATTGCAACGCTTGTGGAGTGATACGGCAAC
GTGTTCTCCACGTAAGTGGAGGTGATTC	CTATTCAATTATCAAGCATAACTAGTTGCTAAA
GTGTTCTCCATAAATGTGAAGGTATTAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_017470.1\|WP_014565808.1\|1000194_1001088_+\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|214724
NC_017470.1\|WP_193363688.1\|1007838_1008927_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	cas7	pfam09344_cas7_CAS-I-E	gnl\|CDD\|378153
NC_017470.1\|WP_014565807.1\|999015_1000128_-\|glycosyltransferase	unknown	unknown	gnl\|CDD\|340844
NC_017470.1\|WP_014565810.1\|1002744_1005477_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|182031
NC_017470.1\|WP_013437815.1\|992039_992597_+\|ECF-transporter-S-component	unknown	unknown	gnl\|CDD\|227064
NC_017470.1\|WP_014565817.1\|1011216_1012113_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	DEDDh	cd06127_DEDDh_CAS-I	gnl\|CDD\|378244
NC_017470.1\|WP_118027564.1\|995094_995319_+\|alpha-glucosidase-C-terminal-domain-containing-protein	unknown	unknown	gnl\|CDD\|274115
NC_017470.1\|WP_014565816.1\|1010268_1011213_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NC_017470.1\|WP_013641840.1\|991208_992030_+\|bifunctional-hydroxymethylpyrimidine-kinase/phosphomethylpyrimidine-kinase	unknown	unknown	gnl\|CDD\|180840
NC_017470.1\|WP_014565806.1\|997392_998940_+\|type-IV-secretory-system-conjugative-DNA-transfer-family-protein	unknown	unknown	gnl\|CDD\|238546
NC_017470.1\|WP_014565811.1\|1005473_1007237_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	cas8e	cd09729_cas8e_CAS-I-E	gnl\|CDD\|378189
NC_017470.1\|WP_014565803.1\|994119_994473_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_193363678.1\|1013601_1014570_+\|homocysteine-S-methyltransferase	unknown	unknown	gnl\|CDD\|181899
NC_017470.1\|WP_014565805.1\|995506_996952_+\|amino-acid-permease	unknown	unknown	gnl\|CDD\|237929
NC_017470.1\|WP_014565814.1\|1008907_1009603_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09756_cas5_CAS-I-E	gnl\|CDD\|187776
NC_017470.1\|WP_014565815.1\|1009615_1010266_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	pfam08798_cas6e_CAS-I-E:CAS-IV	gnl\|CDD\|378050
NC_017470.1\|WP_014565802.1\|992672_993878_+\|L,D-transpeptidase-family-protein	unknown	unknown	gnl\|CDD\|341130
NC_017470.1\|WP_014565820.1\|1014582_1015977_+\|amino-acid-permease	unknown	unknown	gnl\|CDD\|236904
NC_017470.1\|WP_014565809.1\|1001135_1001573_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_014565812.1\|1007246_1007831_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	cse2gr11	mkCas0194_cse2gr11_CAS-I-E	gnl\|CDD\|378191

Protein	Function_ID	Function_description	E-value
NC_017470.1\|WP_014565808.1\|1000194_1001088_+\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	gnl\|CDD\|214724	smart00563, PlsC, Phosphate acyltransferases. Function in phospholipid biosynthesis and have either glycerolphosphate, 1-acylglycerolphosphate, or 2-acylglycerolphosphoethanolamine acyltransferase activities. Tafazzin, the product of the gene mutated in patients with Barth syndrome, is a member of this family.	5.17702e-14
NC_017470.1\|WP_193363688.1\|1007838_1008927_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	gnl\|CDD\|378153	pfam09344, Cas_CT1975, CT1975-like protein. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum.	3.42906e-151
NC_017470.1\|WP_014565807.1\|999015_1000128_-\|glycosyltransferase	gnl\|CDD\|340844	cd03817, GT4_UGDG-like, UDP-Glc:1,2-diacylglycerol 3-a-glucosyltransferase and similar proteins. This family is most closely related to the GT1 family of glycosyltransferases. UDP-glucose-diacylglycerol glucosyltransferase (EC 2.4.1.337, UGDG; also known as 1,2-diacylglycerol 3-glucosyltransferase) catalyzes the transfer of glucose from UDP-glucose to 1,2-diacylglycerol forming 3-D-glucosyl-1,2-diacylglycerol.	4.24076e-50
NC_017470.1\|WP_014565810.1\|1002744_1005477_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	5.77872e-82
NC_017470.1\|WP_013437815.1\|992039_992597_+\|ECF-transporter-S-component	gnl\|CDD\|227064	COG4720, COG4720, Predicted membrane protein [Function unknown].	4.44457e-14
NC_017470.1\|WP_014565817.1\|1011216_1012113_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|378244	pfam09707, Cas_Cas2CT1978, CRISPR-associated protein (Cas_Cas2CT1978). This entry represents a minor branch of the Cas2 family of CRISPR-associated protein which are found in IPR003799. Cas proteins are found adjacent to a characteristic short, palindromic repeat cluster termed CRISPR, a probable mobile DNA element.	3.36022e-41
NC_017470.1\|WP_118027564.1\|995094_995319_+\|alpha-glucosidase-C-terminal-domain-containing-protein	gnl\|CDD\|274115	TIGR02403, Trehalose-6-phosphate_hydrolase, alpha,alpha-phosphotrehalase. Trehalose is a glucose disaccharide that serves in many biological systems as a compatible solute for protection against hyperosmotic and thermal stress. This family describes trehalose-6-phosphate hydrolase, product of the treC (or treA) gene, which is often found together with a trehalose uptake transporter and a trehalose operon repressor.	1.08155e-13
NC_017470.1\|WP_014565816.1\|1010268_1011213_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	1.72984e-131
NC_017470.1\|WP_013641840.1\|991208_992030_+\|bifunctional-hydroxymethylpyrimidine-kinase/phosphomethylpyrimidine-kinase	gnl\|CDD\|180840	PRK07105, PRK07105, pyridoxamine kinase; Validated.	9.93701e-75
NC_017470.1\|WP_014565806.1\|997392_998940_+\|type-IV-secretory-system-conjugative-DNA-transfer-family-protein	gnl\|CDD\|238546	cd01126, TraG_VirD4, The TraG/TraD/VirD4 family are bacterial conjugation proteins involved in type IV secretion. These proteins aid the transfer of DNA from the plasmid into the host bacterial chromosome. They contain an ATP binding domain. VirD4 is involved in DNA transfer to plant cells and is required for virulence.	1.22757e-27
NC_017470.1\|WP_014565811.1\|1005473_1007237_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	gnl\|CDD\|378189	pfam09481, CRISPR_Cse1, CRISPR-associated protein Cse1 (CRISPR_cse1). Clusters of short DNA repeats with non-homologous spacers, which are found at regular intervals in the genomes of phylogenetically distinct prokaryotic species, comprise a family with recognisable features. This family is known as CRISPR (short for Clustered, Regularly Interspaced Short Palindromic Repeats). A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This entry, represented by CT1972 from Chlorobaculum tepidum, is found in the CRISPR/Cas subtype Ecoli regions of many bacteria (most of which are mesophiles), and not in Archaea. It is designated Cse1.	1.17579e-72
NC_017470.1\|WP_193363678.1\|1013601_1014570_+\|homocysteine-S-methyltransferase	gnl\|CDD\|181899	PRK09485, mmuM, homocysteine methyltransferase; Provisional.	1.16501e-153
NC_017470.1\|WP_014565805.1\|995506_996952_+\|amino-acid-permease	gnl\|CDD\|237929	PRK15238, PRK15238, inner membrane transporter YjeM; Provisional.	3.45542e-32
NC_017470.1\|WP_014565815.1\|1009615_1010266_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|378050	pfam08798, CRISPR_assoc, CRISPR associated protein. This domain forms an anti-parallel beta strand structure with flanking alpha helical regions.	9.66514e-75
NC_017470.1\|WP_014565802.1\|992672_993878_+\|L,D-transpeptidase-family-protein	gnl\|CDD\|341130	cd16913, YkuD_like, L,D-transpeptidases/carboxypeptidases similar to Bacillus YkuD. Members of the YkuD-like family of proteins are found in a range of bacteria. The best studied member Bacillus YkuD has been shown to act as an L,D-transpeptidase that gives rise to an alternative pathway for peptidoglycan cross-linking. Another member Helicobacter pylori Csd6 functions as an L,D-carboxypeptidase and regulates helical cell shape and motility. The conserved region contains a conserved histidine and cysteine, with the cysteine thought to be an active site residue.	9.20671e-22
NC_017470.1\|WP_014565820.1\|1014582_1015977_+\|amino-acid-permease	gnl\|CDD\|236904	PRK11387, PRK11387, S-methylmethionine permease.	0
NC_017470.1\|WP_014565814.1\|1008907_1009603_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|187776	cd09645, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	1.37775e-44
NC_017470.1\|WP_014565812.1\|1007246_1007831_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	gnl\|CDD\|378191	pfam09485, CRISPR_Cse2, CRISPR-associated protein Cse2 (CRISPR_cse2). Clusters of short DNA repeats with non-homologous spacers, which are found at regular intervals in the genomes of phylogenetically distinct prokaryotic species, comprise a family with recognisable features. This family is known as CRISPR (short for Clustered, Regularly Interspaced Short Palindromic Repeats). A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family of proteins, represented by CT1973 from Chlorobaculum tepidum, is encoded by genes found in the CRISPR/Cas subtype Ecoli regions of many bacteria (most of which are mesophiles), and not in Archaea. It is designated Cse2.	7.43431e-25

>NC_017470.1|WP_014565809.1|1001135_1001573_+|hypothetical-protein
MLKDQKKFDELGEKLFMKGVLQNFEQKHGPIKGRMMVTEGKIPPEMLVKLQPELMKNPKFIVVEGSFDFSNYMIGMVIGLNPVRPLANGWLIPQLNHPGIKPTKNWQEFFMEKVMEKTDDNGKIDLPLYSWISDKSDITLSDKEK
>NC_017470.1|WP_014565808.1|1000194_1001088_+|1-acyl-sn-glycerol-3-phosphate-acyltransferase
MIFGFHRRQVINNIKKNVAKKQFDAKAELHDPVLNNKETNKIVSKYWQYTKTISYRLFNPLVRVVFNIASQILTGRCSIDGIENLPDSPTAFITGNHYNQFDVLLIGKLALKKRQRLFIVVEASNLAMPHLIGWAVRNFDSLPIDHDFHYLSRIFPKKLAQVLSKPGWILIYPEEELWFNYRKPRPLKKGAYYYAAKFNQPIISTFTEIQATSKRELFQRDFYKTKKILHILPTIYPNPDLKIRENMQRMAEIDYRQKKAAYEKYYQRKLTTDFSYEDIAGFSPKKHLLNKKIDDNQ
>NC_017470.1|WP_014565807.1|999015_1000128_-|glycosyltransferase
MRILIVIDDYFNQSNGMCISTQRFVHEYKKMGQEVRVLSTGEKADYPVPELKINIPFIHGLIAKQGFHFAKPIRKTLIKAVTWADIIQIETPFPVSWRAAKLAKKQGKPVIGTFHIYPQNVTASVPFLNNRLGNWCFMLFFREKSFKNCDALQVPTAKVAKWLKQHHFKQKLFVVSNGISDKFINNSHKDKVGHPFTILCIGRFSHEKKQETLFKAMQLTKHSSEIRLIFAGQGPLKKEYEKLANQLPQKPVMQYFPPVKLRQIMSQADLVVHCADVEIEGMACMEAFASGCVPVIADSPLSSTVSYALTPNNCFPAKNSEVLAQRIDYWFEHPQELIKMRQKYRKYSKTLSVARSAKTAIGNLEKLILR
>NC_017470.1|WP_014565806.1|997392_998940_+|type-IV-secretory-system-conjugative-DNA-transfer-family-protein
MQKIGFSNHSRSNKTESKAPWQNKYSRQATIFGKNTFLPLDLERALNDNTLVIGTSGTGKTYSFLEPNLLQTNSNYVIADAKGSILSEIGPSLKQMGYNLQVLNLVNLDHSMTFNPLANLHSDQDVVKFAEQVMTTDVAGRTNTGQKIDVFWKNAAEALFEAIIFFIRDELPEEEQTMATVNRLFKIVTLKPDRIDTAFSILNSKESDYYFDDYTPDSDDNRLIGDYLFDWVRENDPDSTSIRMWDQVRGMAGSPRTWSSVVGILGSDMAAYNLHDVENLLSGNQIQFAKLLEPKNALFVLYDDADSSKNFLSNILYAQLIKFLYHESRKYKHQALPEKVRFFLDDFKNVNIPGFEDILATARSRNISICMLLQDESQLQAKFGPATPSVIGNCSAYLLTGTTDLTMAQIASQRFDLSTTNIRRMARENFLLDVSGYTAMTKRYDYHDHPNYKGGYYDFEKELVTPQQQANNEGLEKILMYLPHEQNRVDDAENLFGNDYGSDDDLFTIIGNSDN
>NC_017470.1|WP_014565805.1|995506_996952_+|amino-acid-permease
MDSFDTTHKRKMISWPVLALMDFVTVIGFDDIIYNFKNQGLATISEWIIMLALYVVPYEMMVGQLGSTFSDTTGGLTSWIRHTSGDKMGYFMAWAGWVCALPYLVDVANSTVVSFGWLFAGNNSYEDKMNNWTFALLTAVVFIIFIFFQHRFANSLQILSVIGGGAMFIITVLYIIMTFAYLGKGGHIETQPFNWRSIFPTFDTKFFTSLGLFIFAMDGAEFVAPYVTEMKNGARDFPKAMIMLAVMTGFLTVFGSFALGVFFNAHHLPDDLKMNGSYYAFEAMGKDFGLGKFFLYLFIVTQALYMIAQLAMLVDGMSREFLSDTAKKYLPKGLTKKDKNGLPIHGYWLTALLCSFIMFSSATLPNINSIFNQLLNLNGIIDPFTTSFIFWAFIKIREDEKKYHAEYVYIKNRRMSLIMGWWCFLLTLVAAFGSIFQVDAPTGSTEYYQTIFLNVFESFVLLGLGLILPLIARWQREHDKA
>NC_017470.1|WP_118027564.1|995094_995319_+|alpha-glucosidase-C-terminal-domain-containing-protein
MVSKLFAYERYLENSDEKLLVFTNFYGKEHTVKLPEKYQGKEYQVLLNNYDAENGKLTDEITLAPYEALAIKIK
>NC_017470.1|WP_014565803.1|994119_994473_+|hypothetical-protein
MIDIYNEKLAKYADGERRIFTATFLRPDDRKGIFQNLTVNNEDNVVVKQIVLRMNKAFKELNLEKGDVVQFEAIVKQNSRGEYTVERPTGMERISSGQDEEDSGVHVVGDDWDWFEK
>NC_017470.1|WP_014565802.1|992672_993878_+|L,D-transpeptidase-family-protein
MNEDLRKRNKRNNLIILVVGIVIIIGIIAGFSIHNHRVATQTAAEKFARTHFNPNVKIDGVKVGKLTVKKATDKVNKNAKNVVALKDNKLVYSYSTTSQTIDEQETSELFKKQHTKTPSDKSYSYTTKDLATAKNKLNSLKKATINYKINGKSYKLKATELLNDVSYQNGKYKFGNTIKLTDKLNQIDKEVSTLHKSYKFTVPTGNKVKGKTITVKNKTWGWGVYVQKTRRLLLDAFAQGKTTFDGADAIYGLGYSTYAHGYGRSNHEIGNTYAVVSLKKQEVWLVRNGKLKVHLRDVVTGTMEGSKGDQTPRGVWYIHYKQRNATLRGSNDDGSSYASPVSYWMPFTLSGCGFHDASWRTDWSKTAYLKGGSHGCVNVKPSEIRSVWNNISKNEPVIIYE
>NC_017470.1|WP_013437815.1|992039_992597_+|ECF-transporter-S-component
MRKDINSLQSLIFTGLFAAIIYIGIWVLRIPVPAMVGRPFIHFGNTLTAVAILYLGYRNGMIAGIIGLGGFDLLNGYAATSWLTMLEVVVVATVLTAVYRGMNYRDSKKNIIILGIIAGVTKIFTTYCVSIVEALMVGTSLQVAYIGAFVSLPATVINSISTAICTPILYFALKDAVKAIMKKAN
>NC_017470.1|WP_013641840.1|991208_992030_+|bifunctional-hydroxymethylpyrimidine-kinase/phosphomethylpyrimidine-kinase
MINGGVLISQDLSCAGQVSSSVALPILGACGTRSTLLPTAILSTHTGFQGNTYLDLSSEMTKIVAHWQKINLNFDALYLGYLGQNALDFWLDKIEQIKRADQVVLIDPAMADHGKMYRGLDEGYVKKMRQLIPKATILTPNITEAAFLLGKDLTKVSLEKAQEFATELAKKFSIPNVVITGISITKEKIGEVGVTDGKNWSLIQKKLSGSFFGTGDMFASAFLAAVLHGNNLEKSCSIAADFIRLAIMNTKQNPLFGPNYAAGLPWLLDEIEK
>NC_017470.1|WP_014565810.1|1002744_1005477_+|CRISPR-associated-helicase/endonuclease-Cas3
MKKLSRYAKNLWGKKATQDETELWLPLIAHMIDTKNVINWLYNHWLNQGQRNLFLQNMSDIDVQKLVRFLGYIHDIGKATPAFQTKESYNHDRDLDYDLLEHLLRNGFTNLDQLHLANARRTPHALAGEAILEREGLNTSVGAIIGGHHGKPQNDDSLRNVLEIYTSNFYQTDTPPNSKNHWLNVQKELINYGLNICGYDDIQSIPKVKQPQAVLLEGLVIMADWLASSEYLNDNFDKPMFTLIPLQEDFDNLDMKQRFRNALMTWYQNDVWQPDPVSDVAKEYQDRFNFTPRVVQKTMSEAIGNISDPGIVIVEAPMGIGKTEIALTAVEQIAGLTGRNGLFFGLPTQATTNAMFSRVDNWLTNIATSENTNIGIKLMHGKAQFNDEYRELPKAENVDTSGSVVINSWFSGKKTILEKFTIGTIDQLLLMGLKQKHLFLRHLGLSGKIVVIDEVHAYDIYMDSYLLKAIEWLGAYHVPVIALSATLSARLRKNLVRAYVRGKYSDPNKYQAEVGWQDNNSYPLLTFLDGQRLNQVDKFDNEGDNKAVVKVKRLQCDDEELINHIQDNIKDGGIAGVIVNTIKRAQDLAQLIPTDIPVLILHSAFLATDRSKLEQKLQSLIGKKAKRPDKLIVIGTQVLEQSLDIDFDVLYTDIAPMDLILQRIGRLHRHQIKRPLKLACPQVFIMGINSWGDYGDANEAIYDKYLLMKTDYFLPDQITLPIDISCLVQKVYSKENDSEIGGISQVKQNYLDKRKKLRKRASVFQIKPPLINFNIHGWLDNNQPGVSKNEERAQAAVRDTKETIEILLLKKTETGVCLLNGKSIEEDQVSSKEIARQIIRLPHAVTFNIDESIDKLETITSEKYPEWQNDIWLKSALALTLDENNNVEFNGWQLHYSKKIGLTYTKEAQS
>NC_017470.1|WP_014565811.1|1005473_1007237_+|type-I-E-CRISPR-associated-protein-Cse1/CasA
MKQLSFNLITDPWIKVIDKNNNLQKVSLSTLFKNSQDYKQLAGEMKSQDLAVFRFLLAILTTVYSRFDASGKPYDGLQLDDKFQVIPEDPDDVEDEVDGADPSLGSSSFDETQALLKTWADLYHIGHFSSIVVEYLEKYKEKFDMFGDTPFYQVTAEIYDSLVPEKKKISTGSGTTAVKQINRTISESAHTPNIFAPRSDSFKNRIKIDELVRWIITYQNFTGVTDKTKVNANEKFSVSAGWLYGLNPVFAQGDNLFETLMLNLTFFDKDEDLKLVPIQRPIWEWEKFSDYISYRLKAELPDNISETYTMWSRVLHIEWNGNAPTIFSAGLPKVSSENAFIEPMTTWKTDKKELVYKPNTKWIKTVGESMWRNFGQYIRLSESNEQEKKTIHQPGIVTWLNLLENRKLLPANKFINLATVGLISDGNATSQSPAVEVWDEMKIKADVLFDSNEKVAIHWPVVIEDEIDLTKKVVNYYWSLVNNVGKLRELSDPNSFANNYSAELYNQLNNPFLNWLSSLKNTDDRNKQAFIWRTTLKQIVLNEAENFVHSASPRDIKGIIDKDKKTKNIFTEYKKFTILVLSKLKKG
>NC_017470.1|WP_014565812.1|1007246_1007831_+|type-I-E-CRISPR-associated-protein-Cse2/CasB
MVAKTLSSINKIILSLYNDGNINKSALANLRASNSINSKHMTEVWPIFFKYIAKEDLSQNYKPSYTEIAVFTAVKCFAIYQQGSTECTYGKSYGDNAKGLTFFNALANLRKDAEEKEALDRRVQALLATSNVESVINGIIHTLQILKSHNKHLVIDFAKLGQDLYHFQFDSYSARETCLKWGEEYFAADANLKK
>NC_017470.1|WP_193363688.1|1007838_1008927_+|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC
MIMNLFLDINVLQTVPSSNLNRDDTGAPKTAIYGGVMRSRVSSQSWKRAVRQAFRAESQDAQWLKSSRTLKAPLLLANEIQKMDSSVSDEEAMKKSTDIFSKASIKVDKKTNQTKALLLISDGQLKKLAKAILENEDIDKKVIKKIFKEDNSLDLALFGRMVADNPDLNVDAACQVAHAISTHEVTPEFDYFTAVDDEKEEGTAGSAMIGSLEYNSSTLYRYANINLNELIHNIGSKLSVEGIKLFIKNFILTMPTGKENTFANKTLPQYVLITLRDDTPVNLVSAFEEPVKSRDGYVKKSIERLEKEYIDTESIIDKPIYSVVLSKYDSTLSNQAENLTSMIESVSKVVDEKVEKNENHNN
>NC_017470.1|WP_014565814.1|1008907_1009603_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MKTITIRLASPLQSFGNEATFSHRTTELYPTKSLIVGMLAASLGYRRDDSRINQLNNLQIAVRIDQPGKVLTDFQTVEFKPDTRKLTYRNYLQDGVFIVAISAHDKTIDKLKYALLHPKFQLYIGRRSNPIAGVLKINEFDDDALKVLKKLDWQASEWYQKKYKSEEYFAEIIADASLSKNNSGSLVKDAVGSFNQHSRFHDYRAVVNVHVSLKNKFYQEHSTKHDIFNAI
>NC_017470.1|WP_014565815.1|1009615_1010266_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MYLSRVEIDQGNRQKLKDLTHLGAYHSWVENSFPEKFGQDRPRHLWRIDTLRHKRYLLVVSAEKPNLNLLDKYGVPGTAETKNYDPFLEKVKQNMIYNFRLTANPVHRVTQPGQKNGKLYPHITIEKQKEWLINRAKNCGFEIIKDESGIYQFDVVSRDWPLLFHKGTKRVRLSRVSFEGQLKVVDLKLFKQHLISGIGKEKAYGMGMLTIIPVRA
>NC_017470.1|WP_014565816.1|1010268_1011213_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MKKKYGAKKPELEELGRVRDRISFLYLEHAKLNREDSAIKVLDDRGIVLVPVALISVLLLGPGVDITHRAMELIGDSGTAVVWVGENGVRQYAHGRALNHSSRLLEAQAKLVSNKRTRVEVARKMYQMRFPNEDVSKLSMEQLRGKEGARVRKVYRDQSLKTGVAWERREYDPDNFEASTPINKALTEAHQALYGLSYSVIVALGASPGLGFVHTGHDLAFVYDFADLYKAKYSIPVAFETVKKFGKVDISDNTRLAMRDAFSSGKLLLQMVADLKYLLNIKDDTDENFAVMHLWDDKQGLQKFGVQYHEMDED
>NC_017470.1|WP_014565817.1|1011216_1012113_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MIVITLTKVPNSLRGDLTKWCQEIQTGVYVGSFSARIREMLWSRILKNIGTGEATLVYSTNNELGYTFRTTRRDKRVVDFDGVPLMMQMIETPPIRHGFSKAAKYHKSKKFSKKTNISNNMIKGAIKNDFIAVDLETTGLNTSRSKIISIGAIKENLKGEEEQFYRLIKINEAIPEKITELTGLTSKVLNERGVTLEQALNEFRKFVGSEMIVGYNLSFDNNFLLKAYLSIGQRALVNSMKDLMGIVKEKDIFLDNYDLETVLKEYGIKNDNRHNALSDARATFKLAKELNKKGYLQI
>NC_017470.1|WP_193363678.1|1013601_1014570_+|homocysteine-S-methyltransferase
MSAFLLLLKNEKEVGRMSLIEDAKSGIVLDGAMSDELEKQGVETDNKLWTATALVDQLNKVYNAHQDYFRAGAELVITDTYQANVQAFEESGYSKKEAEKFIRDAVKVAKKARDDYQKETGKYNYVAGTIGSYGAYLADGNEYRGDYNLSEKEYLDFHLPRLKLVLKERPDLIALETQPKITEPVAVLNWLETNYPDMPIYVSFTLKDSKHVSDGTSIEHATQEISKYKQVFAIGINCVSPKLVDQALKEFAKYTSKPLVVYPNLGATYDPKIKKWRSFKEKFDFAELTQKWYEDGAHLIGGCRTTGPKEIKEIRQSIDKLR
>NC_017470.1|WP_014565820.1|1014582_1015977_+|amino-acid-permease
MAHKTHLKRKMETRHIRMISLGGVIGTGLFLSSGYTIHEAGPLGTVIAYLVGALIVFAVMLCLGELSVAMPYTGAFHVYAKKYIGPSTGFVVAIIYWLTWTIALGSEFTAAGLIMQKWFPHVPVWIWSLACMILIFLSNFFSVKVFAESEFWFAAIKVFAIVAFIILGVLAITGILPVKGFNHAPGLVNFYKNGWFPNGFSGVFTTMLTVNFAFSGTELIGITAGEAEDPQKAIPSAIKTTLWRLVIFFIGSIVVMAALITYKVAGVTQSPFVYVLDLIHVPFAANIMNFVVLTAIISAANSGLYASTRMLWSLSNEGTIPKVFQKTGKNGVPTLALGVSMLDGIFALISSKVAASTVYLVLVSISGLAVVIVWMAIAWAELNFRKQFLKDGHHLSELKYRTPWYPVVPYFAFFASLFSCILIWFDPTQRVALYYTIPFVAICYLVQYLWRKFDKNLRLAEEGK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017470_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017470_3

1012143-1013268

TypeI-E

I-B,III-A,III-B

Consensus_repeat	Method
GTGTTCTCCACGTATGTGGAGGTGATCC	PILER-CR
GTGTTCTCCACGTATGTGGAGGTGATCC	CRISPRCasFinder
GTGTTCTCCACGTATGTGGAGGTGATCC	CRT

18 spacers

DEDDh,cas1,cas6e,cas5,cas7,cse2gr11,cas8e,cas3

The CRISPR arrays of NC_017470_3

>merge|NC_017470|3|1012143-1013268|PILER-CR,CRISPRCasFinder,CRT
GTGTTCTCCACGTATGTGGAGGTGATCCCACCGTACACCATATTAAACCGTTAAGACTTGAGTGTTCTCCACGTATGTGGAGGTGATCCCGAAGACGGCACTTATACGATTGATCTTTGGAAGTGTTCTCCACGTATGTGGAGGTGATCCCATTTTTCCGTCGCATTTACGAAAACCATGTAAGTGTTCTCCACGTATGTGGAGGTGATCCTACATCGACAATAAAGACCCCAAGGCCCGTATTGTGTTCTCCACGTATGTGGAGGTGATCCTAACTATGTAAATCAAACGTTATTAACTCGTAAGTGTTCTCCACGTATGTGGAGGTGATCCCGATTGACCGCCAGTAACACGATTTGCCATTCTGTGTTCTCCACGTATGTGGAGGTGATCCTTAAACAATACATGCGAACAAATCATTTATTTTGTGTTCTCCACGTATGTGGAGGTGATCCTCAATCTATTTAATCTATACTCATAAGCTTTACGTGTTCTCCACGTATGTGGAGGTGATCCTATAAAAAGAATGATCCAGACTACTATAGATGGGTGTTCTCCACGTATGTGGAGGTGATCCTGCTGAAGTATTTGACCAGTCTGTACCAACTTTGTGTTCTCCACGTATGTGGAGGTGATCCCATTCCAGACGGTGTCGAAGCCTTTAAACTGTCGTGTTCTCCACGTATGTGGAGGTGATCCCGCTGACCAGTACGAAACGGCGTTAAGAAGTCGGTGTTCTCCACGTATGTGGAGGTGATCCTTAGCACTAATTCGAGCCAGTAATCGAAGTTCTGTGTTCTCCACGTATGTGGAGGTGATCCACAGCGCTACGAATTAGAGCAGAAACAAGAATTGTGTTCTCCACGTATGTGGAGGTGATCCTAAGAACTGAAAAAAAGAAAAAAAGCTTTAAAAGTGTTCTCCACGTATGTGGAGGTGATCCTTGCCAAACATACATAAAAGCAAATTTTTCGCGGTGTTCTCCACGTATGTGGAGGTGATCCTGAAACATCATCAGATAACTTTGCTAATTCGTCGTGTTCTCCACGTATGTGGAGGTGATCCTAACTCCCGCATAAATCTAACCGTAATAGAGCGGTGTTCTCCACGTATGTGGAAGCAAGTT

>NC_017470|3|3|1012143-1013207|PILER-CR
GTGTTCTCCACGTATGTGGAGGTGATCC	CACCGTACACCATATTAAACCGTTAAGACTTGA
GTGTTCTCCACGTATGTGGAGGTGATCC	CGAAGACGGCACTTATACGATTGATCTTTGGAA
GTGTTCTCCACGTATGTGGAGGTGATCC	CATTTTTCCGTCGCATTTACGAAAACCATGTAA
GTGTTCTCCACGTATGTGGAGGTGATCC	TACATCGACAATAAAGACCCCAAGGCCCGTATT
GTGTTCTCCACGTATGTGGAGGTGATCC	TAACTATGTAAATCAAACGTTATTAACTCGTAA
GTGTTCTCCACGTATGTGGAGGTGATCC	CGATTGACCGCCAGTAACACGATTTGCCATTCT
GTGTTCTCCACGTATGTGGAGGTGATCC	TTAAACAATACATGCGAACAAATCATTTATTTT
GTGTTCTCCACGTATGTGGAGGTGATCC	TCAATCTATTTAATCTATACTCATAAGCTTTAC
GTGTTCTCCACGTATGTGGAGGTGATCC	TATAAAAAGAATGATCCAGACTACTATAGATGG
GTGTTCTCCACGTATGTGGAGGTGATCC	TGCTGAAGTATTTGACCAGTCTGTACCAACTTT
GTGTTCTCCACGTATGTGGAGGTGATCC	CATTCCAGACGGTGTCGAAGCCTTTAAACTGTC
GTGTTCTCCACGTATGTGGAGGTGATCC	CGCTGACCAGTACGAAACGGCGTTAAGAAGTCG
GTGTTCTCCACGTATGTGGAGGTGATCC	TTAGCACTAATTCGAGCCAGTAATCGAAGTTCT
GTGTTCTCCACGTATGTGGAGGTGATCC	ACAGCGCTACGAATTAGAGCAGAAACAAGAATT
GTGTTCTCCACGTATGTGGAGGTGATCC	TAAGAACTGAAAAAAAGAAAAAAAGCTTTAAAA
GTGTTCTCCACGTATGTGGAGGTGATCC	TTGCCAAACATACATAAAAGCAAATTTTTCGCG
GTGTTCTCCACGTATGTGGAGGTGATCC	TGAAACATCATCAGATAACTTTGCTAATTCGTC
GTGTTCTCCACGTATGTGGAGGTGATCC

>NC_017470|3|2|1012143-1013268|CRISPRCasFinder
GTGTTCTCCACGTATGTGGAGGTGATCC	CACCGTACACCATATTAAACCGTTAAGACTTGA
GTGTTCTCCACGTATGTGGAGGTGATCC	CGAAGACGGCACTTATACGATTGATCTTTGGAA
GTGTTCTCCACGTATGTGGAGGTGATCC	CATTTTTCCGTCGCATTTACGAAAACCATGTAA
GTGTTCTCCACGTATGTGGAGGTGATCC	TACATCGACAATAAAGACCCCAAGGCCCGTATT
GTGTTCTCCACGTATGTGGAGGTGATCC	TAACTATGTAAATCAAACGTTATTAACTCGTAA
GTGTTCTCCACGTATGTGGAGGTGATCC	CGATTGACCGCCAGTAACACGATTTGCCATTCT
GTGTTCTCCACGTATGTGGAGGTGATCC	TTAAACAATACATGCGAACAAATCATTTATTTT
GTGTTCTCCACGTATGTGGAGGTGATCC	TCAATCTATTTAATCTATACTCATAAGCTTTAC
GTGTTCTCCACGTATGTGGAGGTGATCC	TATAAAAAGAATGATCCAGACTACTATAGATGG
GTGTTCTCCACGTATGTGGAGGTGATCC	TGCTGAAGTATTTGACCAGTCTGTACCAACTTT
GTGTTCTCCACGTATGTGGAGGTGATCC	CATTCCAGACGGTGTCGAAGCCTTTAAACTGTC
GTGTTCTCCACGTATGTGGAGGTGATCC	CGCTGACCAGTACGAAACGGCGTTAAGAAGTCG
GTGTTCTCCACGTATGTGGAGGTGATCC	TTAGCACTAATTCGAGCCAGTAATCGAAGTTCT
GTGTTCTCCACGTATGTGGAGGTGATCC	ACAGCGCTACGAATTAGAGCAGAAACAAGAATT
GTGTTCTCCACGTATGTGGAGGTGATCC	TAAGAACTGAAAAAAAGAAAAAAAGCTTTAAAA
GTGTTCTCCACGTATGTGGAGGTGATCC	TTGCCAAACATACATAAAAGCAAATTTTTCGCG
GTGTTCTCCACGTATGTGGAGGTGATCC	TGAAACATCATCAGATAACTTTGCTAATTCGTC
GTGTTCTCCACGTATGTGGAGGTGATCC	TAACTCCCGCATAAATCTAACCGTAATAGAGCG
GTGTTCTCCACGTATGTGGAAGCAAGTT

>NC_017470|3|2|1012143-1013268|CRT
GTGTTCTCCACGTATGTGGAGGTGATCC	CACCGTACACCATATTAAACCGTTAAGACTTGA
GTGTTCTCCACGTATGTGGAGGTGATCC	CGAAGACGGCACTTATACGATTGATCTTTGGAA
GTGTTCTCCACGTATGTGGAGGTGATCC	CATTTTTCCGTCGCATTTACGAAAACCATGTAA
GTGTTCTCCACGTATGTGGAGGTGATCC	TACATCGACAATAAAGACCCCAAGGCCCGTATT
GTGTTCTCCACGTATGTGGAGGTGATCC	TAACTATGTAAATCAAACGTTATTAACTCGTAA
GTGTTCTCCACGTATGTGGAGGTGATCC	CGATTGACCGCCAGTAACACGATTTGCCATTCT
GTGTTCTCCACGTATGTGGAGGTGATCC	TTAAACAATACATGCGAACAAATCATTTATTTT
GTGTTCTCCACGTATGTGGAGGTGATCC	TCAATCTATTTAATCTATACTCATAAGCTTTAC
GTGTTCTCCACGTATGTGGAGGTGATCC	TATAAAAAGAATGATCCAGACTACTATAGATGG
GTGTTCTCCACGTATGTGGAGGTGATCC	TGCTGAAGTATTTGACCAGTCTGTACCAACTTT
GTGTTCTCCACGTATGTGGAGGTGATCC	CATTCCAGACGGTGTCGAAGCCTTTAAACTGTC
GTGTTCTCCACGTATGTGGAGGTGATCC	CGCTGACCAGTACGAAACGGCGTTAAGAAGTCG
GTGTTCTCCACGTATGTGGAGGTGATCC	TTAGCACTAATTCGAGCCAGTAATCGAAGTTCT
GTGTTCTCCACGTATGTGGAGGTGATCC	ACAGCGCTACGAATTAGAGCAGAAACAAGAATT
GTGTTCTCCACGTATGTGGAGGTGATCC	TAAGAACTGAAAAAAAGAAAAAAAGCTTTAAAA
GTGTTCTCCACGTATGTGGAGGTGATCC	TTGCCAAACATACATAAAAGCAAATTTTTCGCG
GTGTTCTCCACGTATGTGGAGGTGATCC	TGAAACATCATCAGATAACTTTGCTAATTCGTC
GTGTTCTCCACGTATGTGGAGGTGATCC	TAACTCCCGCATAAATCTAACCGTAATAGAGCG
GTGTTCTCCACGTATGTGGAAGCAAGTT

Protein	Signature genes	Signature genes Name	Protein_function
NC_017470.1\|WP_014565808.1\|1000194_1001088_+\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|214724
NC_017470.1\|WP_193363688.1\|1007838_1008927_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	cas7	pfam09344_cas7_CAS-I-E	gnl\|CDD\|378153
NC_017470.1\|WP_014565825.1\|1021715_1022360_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_014565810.1\|1002744_1005477_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|182031
NC_017470.1\|WP_014565817.1\|1011216_1012113_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	DEDDh	cd06127_DEDDh_CAS-I	gnl\|CDD\|378244
NC_017470.1\|WP_014565823.1\|1020058_1021102_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_014565816.1\|1010268_1011213_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NC_017470.1\|WP_013437830.1\|1018733_1019378_+\|nitroreductase-family-protein	unknown	unknown	gnl\|CDD\|380314
NC_017470.1\|WP_014565822.1\|1019434_1019965_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_014565824.1\|1021106_1021682_+\|ATP-binding-protein	unknown	unknown	gnl\|CDD\|379324
NC_017470.1\|WP_014565827.1\|1026145_1026751_+\|DUF1819-family-protein	unknown	unknown	gnl\|CDD\|378066
NC_017470.1\|WP_193363678.1\|1013601_1014570_+\|homocysteine-S-methyltransferase	unknown	unknown	gnl\|CDD\|181899
NC_017470.1\|WP_014565811.1\|1005473_1007237_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	cas8e	cd09729_cas8e_CAS-I-E	gnl\|CDD\|378189
NC_017470.1\|WP_014565814.1\|1008907_1009603_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09756_cas5_CAS-I-E	gnl\|CDD\|187776
NC_017470.1\|WP_014565815.1\|1009615_1010266_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	pfam08798_cas6e_CAS-I-E:CAS-IV	gnl\|CDD\|378050
NC_017470.1\|WP_014565821.1\|1017667_1018600_-\|2-dehydropantoate-2-reductase	unknown	unknown	gnl\|CDD\|235821
NC_017470.1\|WP_014565826.1\|1022328_1023813_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_014565820.1\|1014582_1015977_+\|amino-acid-permease	unknown	unknown	gnl\|CDD\|236904
NC_017470.1\|WP_014565809.1\|1001135_1001573_+\|hypothetical-protein	unknown	unknown	unknown
NC_017470.1\|WP_014565812.1\|1007246_1007831_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	cse2gr11	mkCas0194_cse2gr11_CAS-I-E	gnl\|CDD\|378191

Protein	Function_ID	Function_description	E-value
NC_017470.1\|WP_014565808.1\|1000194_1001088_+\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	gnl\|CDD\|214724	smart00563, PlsC, Phosphate acyltransferases. Function in phospholipid biosynthesis and have either glycerolphosphate, 1-acylglycerolphosphate, or 2-acylglycerolphosphoethanolamine acyltransferase activities. Tafazzin, the product of the gene mutated in patients with Barth syndrome, is a member of this family.	5.17702e-14
NC_017470.1\|WP_193363688.1\|1007838_1008927_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	gnl\|CDD\|378153	pfam09344, Cas_CT1975, CT1975-like protein. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum.	3.42906e-151
NC_017470.1\|WP_014565810.1\|1002744_1005477_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	5.77872e-82
NC_017470.1\|WP_014565817.1\|1011216_1012113_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|378244	pfam09707, Cas_Cas2CT1978, CRISPR-associated protein (Cas_Cas2CT1978). This entry represents a minor branch of the Cas2 family of CRISPR-associated protein which are found in IPR003799. Cas proteins are found adjacent to a characteristic short, palindromic repeat cluster termed CRISPR, a probable mobile DNA element.	3.36022e-41
NC_017470.1\|WP_014565816.1\|1010268_1011213_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	1.72984e-131
NC_017470.1\|WP_013437830.1\|1018733_1019378_+\|nitroreductase-family-protein	gnl\|CDD\|380314	cd02137, MhqN-like, nitroreductase family protein similar to the NAD(P)H nitroreductase MhqN. A diverse subfamily of the nitroreductase family containing uncharacterized proteins; includes nitroreductases MhqN, YodC, YdgI, DrgA. Nitroreductase catalyzes the reduction of nitroaromatic compounds such as nitrotoluenes, nitrofurans and nitroimidazoles. This process requires NAD(P)H as electron donor in an obligatory two-electron transfer and uses FMN as cofactor. The enzyme is typically a homodimer.	2.24223e-43
NC_017470.1\|WP_014565827.1\|1026145_1026751_+\|DUF1819-family-protein	gnl\|CDD\|378066	pfam08849, DUF1819, Putative inner membrane protein (DUF1819). These proteins are functionally uncharacterized. Several are annotated as putative inner membrane proteins.	8.22832e-36
NC_017470.1\|WP_014565824.1\|1021106_1021682_+\|ATP-binding-protein	gnl\|CDD\|379324	pfam13671, AAA_33, AAA domain. This family of domains contain only a P-loop motif, that is characteristic of the AAA superfamily. Many of the proteins in this family are just short fragments so there is no Walker B motif.	7.38262e-13
NC_017470.1\|WP_193363678.1\|1013601_1014570_+\|homocysteine-S-methyltransferase	gnl\|CDD\|181899	PRK09485, mmuM, homocysteine methyltransferase; Provisional.	1.16501e-153
NC_017470.1\|WP_014565811.1\|1005473_1007237_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	gnl\|CDD\|378189	pfam09481, CRISPR_Cse1, CRISPR-associated protein Cse1 (CRISPR_cse1). Clusters of short DNA repeats with non-homologous spacers, which are found at regular intervals in the genomes of phylogenetically distinct prokaryotic species, comprise a family with recognisable features. This family is known as CRISPR (short for Clustered, Regularly Interspaced Short Palindromic Repeats). A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This entry, represented by CT1972 from Chlorobaculum tepidum, is found in the CRISPR/Cas subtype Ecoli regions of many bacteria (most of which are mesophiles), and not in Archaea. It is designated Cse1.	1.17579e-72
NC_017470.1\|WP_014565815.1\|1009615_1010266_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|378050	pfam08798, CRISPR_assoc, CRISPR associated protein. This domain forms an anti-parallel beta strand structure with flanking alpha helical regions.	9.66514e-75
NC_017470.1\|WP_014565821.1\|1017667_1018600_-\|2-dehydropantoate-2-reductase	gnl\|CDD\|235821	PRK06522, PRK06522, 2-dehydropantoate 2-reductase; Reviewed.	9.47432e-105
NC_017470.1\|WP_014565820.1\|1014582_1015977_+\|amino-acid-permease	gnl\|CDD\|236904	PRK11387, PRK11387, S-methylmethionine permease.	0
NC_017470.1\|WP_014565814.1\|1008907_1009603_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|187776	cd09645, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	1.37775e-44
NC_017470.1\|WP_014565812.1\|1007246_1007831_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	gnl\|CDD\|378191	pfam09485, CRISPR_Cse2, CRISPR-associated protein Cse2 (CRISPR_cse2). Clusters of short DNA repeats with non-homologous spacers, which are found at regular intervals in the genomes of phylogenetically distinct prokaryotic species, comprise a family with recognisable features. This family is known as CRISPR (short for Clustered, Regularly Interspaced Short Palindromic Repeats). A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family of proteins, represented by CT1973 from Chlorobaculum tepidum, is encoded by genes found in the CRISPR/Cas subtype Ecoli regions of many bacteria (most of which are mesophiles), and not in Archaea. It is designated Cse2.	7.43431e-25

>NC_017470.1|WP_014565817.1|1011216_1012113_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MIVITLTKVPNSLRGDLTKWCQEIQTGVYVGSFSARIREMLWSRILKNIGTGEATLVYSTNNELGYTFRTTRRDKRVVDFDGVPLMMQMIETPPIRHGFSKAAKYHKSKKFSKKTNISNNMIKGAIKNDFIAVDLETTGLNTSRSKIISIGAIKENLKGEEEQFYRLIKINEAIPEKITELTGLTSKVLNERGVTLEQALNEFRKFVGSEMIVGYNLSFDNNFLLKAYLSIGQRALVNSMKDLMGIVKEKDIFLDNYDLETVLKEYGIKNDNRHNALSDARATFKLAKELNKKGYLQI
>NC_017470.1|WP_014565816.1|1010268_1011213_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MKKKYGAKKPELEELGRVRDRISFLYLEHAKLNREDSAIKVLDDRGIVLVPVALISVLLLGPGVDITHRAMELIGDSGTAVVWVGENGVRQYAHGRALNHSSRLLEAQAKLVSNKRTRVEVARKMYQMRFPNEDVSKLSMEQLRGKEGARVRKVYRDQSLKTGVAWERREYDPDNFEASTPINKALTEAHQALYGLSYSVIVALGASPGLGFVHTGHDLAFVYDFADLYKAKYSIPVAFETVKKFGKVDISDNTRLAMRDAFSSGKLLLQMVADLKYLLNIKDDTDENFAVMHLWDDKQGLQKFGVQYHEMDED
>NC_017470.1|WP_014565815.1|1009615_1010266_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MYLSRVEIDQGNRQKLKDLTHLGAYHSWVENSFPEKFGQDRPRHLWRIDTLRHKRYLLVVSAEKPNLNLLDKYGVPGTAETKNYDPFLEKVKQNMIYNFRLTANPVHRVTQPGQKNGKLYPHITIEKQKEWLINRAKNCGFEIIKDESGIYQFDVVSRDWPLLFHKGTKRVRLSRVSFEGQLKVVDLKLFKQHLISGIGKEKAYGMGMLTIIPVRA
>NC_017470.1|WP_014565814.1|1008907_1009603_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MKTITIRLASPLQSFGNEATFSHRTTELYPTKSLIVGMLAASLGYRRDDSRINQLNNLQIAVRIDQPGKVLTDFQTVEFKPDTRKLTYRNYLQDGVFIVAISAHDKTIDKLKYALLHPKFQLYIGRRSNPIAGVLKINEFDDDALKVLKKLDWQASEWYQKKYKSEEYFAEIIADASLSKNNSGSLVKDAVGSFNQHSRFHDYRAVVNVHVSLKNKFYQEHSTKHDIFNAI
>NC_017470.1|WP_193363688.1|1007838_1008927_+|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC
MIMNLFLDINVLQTVPSSNLNRDDTGAPKTAIYGGVMRSRVSSQSWKRAVRQAFRAESQDAQWLKSSRTLKAPLLLANEIQKMDSSVSDEEAMKKSTDIFSKASIKVDKKTNQTKALLLISDGQLKKLAKAILENEDIDKKVIKKIFKEDNSLDLALFGRMVADNPDLNVDAACQVAHAISTHEVTPEFDYFTAVDDEKEEGTAGSAMIGSLEYNSSTLYRYANINLNELIHNIGSKLSVEGIKLFIKNFILTMPTGKENTFANKTLPQYVLITLRDDTPVNLVSAFEEPVKSRDGYVKKSIERLEKEYIDTESIIDKPIYSVVLSKYDSTLSNQAENLTSMIESVSKVVDEKVEKNENHNN
>NC_017470.1|WP_014565812.1|1007246_1007831_+|type-I-E-CRISPR-associated-protein-Cse2/CasB
MVAKTLSSINKIILSLYNDGNINKSALANLRASNSINSKHMTEVWPIFFKYIAKEDLSQNYKPSYTEIAVFTAVKCFAIYQQGSTECTYGKSYGDNAKGLTFFNALANLRKDAEEKEALDRRVQALLATSNVESVINGIIHTLQILKSHNKHLVIDFAKLGQDLYHFQFDSYSARETCLKWGEEYFAADANLKK
>NC_017470.1|WP_014565811.1|1005473_1007237_+|type-I-E-CRISPR-associated-protein-Cse1/CasA
MKQLSFNLITDPWIKVIDKNNNLQKVSLSTLFKNSQDYKQLAGEMKSQDLAVFRFLLAILTTVYSRFDASGKPYDGLQLDDKFQVIPEDPDDVEDEVDGADPSLGSSSFDETQALLKTWADLYHIGHFSSIVVEYLEKYKEKFDMFGDTPFYQVTAEIYDSLVPEKKKISTGSGTTAVKQINRTISESAHTPNIFAPRSDSFKNRIKIDELVRWIITYQNFTGVTDKTKVNANEKFSVSAGWLYGLNPVFAQGDNLFETLMLNLTFFDKDEDLKLVPIQRPIWEWEKFSDYISYRLKAELPDNISETYTMWSRVLHIEWNGNAPTIFSAGLPKVSSENAFIEPMTTWKTDKKELVYKPNTKWIKTVGESMWRNFGQYIRLSESNEQEKKTIHQPGIVTWLNLLENRKLLPANKFINLATVGLISDGNATSQSPAVEVWDEMKIKADVLFDSNEKVAIHWPVVIEDEIDLTKKVVNYYWSLVNNVGKLRELSDPNSFANNYSAELYNQLNNPFLNWLSSLKNTDDRNKQAFIWRTTLKQIVLNEAENFVHSASPRDIKGIIDKDKKTKNIFTEYKKFTILVLSKLKKG
>NC_017470.1|WP_014565810.1|1002744_1005477_+|CRISPR-associated-helicase/endonuclease-Cas3
MKKLSRYAKNLWGKKATQDETELWLPLIAHMIDTKNVINWLYNHWLNQGQRNLFLQNMSDIDVQKLVRFLGYIHDIGKATPAFQTKESYNHDRDLDYDLLEHLLRNGFTNLDQLHLANARRTPHALAGEAILEREGLNTSVGAIIGGHHGKPQNDDSLRNVLEIYTSNFYQTDTPPNSKNHWLNVQKELINYGLNICGYDDIQSIPKVKQPQAVLLEGLVIMADWLASSEYLNDNFDKPMFTLIPLQEDFDNLDMKQRFRNALMTWYQNDVWQPDPVSDVAKEYQDRFNFTPRVVQKTMSEAIGNISDPGIVIVEAPMGIGKTEIALTAVEQIAGLTGRNGLFFGLPTQATTNAMFSRVDNWLTNIATSENTNIGIKLMHGKAQFNDEYRELPKAENVDTSGSVVINSWFSGKKTILEKFTIGTIDQLLLMGLKQKHLFLRHLGLSGKIVVIDEVHAYDIYMDSYLLKAIEWLGAYHVPVIALSATLSARLRKNLVRAYVRGKYSDPNKYQAEVGWQDNNSYPLLTFLDGQRLNQVDKFDNEGDNKAVVKVKRLQCDDEELINHIQDNIKDGGIAGVIVNTIKRAQDLAQLIPTDIPVLILHSAFLATDRSKLEQKLQSLIGKKAKRPDKLIVIGTQVLEQSLDIDFDVLYTDIAPMDLILQRIGRLHRHQIKRPLKLACPQVFIMGINSWGDYGDANEAIYDKYLLMKTDYFLPDQITLPIDISCLVQKVYSKENDSEIGGISQVKQNYLDKRKKLRKRASVFQIKPPLINFNIHGWLDNNQPGVSKNEERAQAAVRDTKETIEILLLKKTETGVCLLNGKSIEEDQVSSKEIARQIIRLPHAVTFNIDESIDKLETITSEKYPEWQNDIWLKSALALTLDENNNVEFNGWQLHYSKKIGLTYTKEAQS
>NC_017470.1|WP_014565809.1|1001135_1001573_+|hypothetical-protein
MLKDQKKFDELGEKLFMKGVLQNFEQKHGPIKGRMMVTEGKIPPEMLVKLQPELMKNPKFIVVEGSFDFSNYMIGMVIGLNPVRPLANGWLIPQLNHPGIKPTKNWQEFFMEKVMEKTDDNGKIDLPLYSWISDKSDITLSDKEK
>NC_017470.1|WP_014565808.1|1000194_1001088_+|1-acyl-sn-glycerol-3-phosphate-acyltransferase
MIFGFHRRQVINNIKKNVAKKQFDAKAELHDPVLNNKETNKIVSKYWQYTKTISYRLFNPLVRVVFNIASQILTGRCSIDGIENLPDSPTAFITGNHYNQFDVLLIGKLALKKRQRLFIVVEASNLAMPHLIGWAVRNFDSLPIDHDFHYLSRIFPKKLAQVLSKPGWILIYPEEELWFNYRKPRPLKKGAYYYAAKFNQPIISTFTEIQATSKRELFQRDFYKTKKILHILPTIYPNPDLKIRENMQRMAEIDYRQKKAAYEKYYQRKLTTDFSYEDIAGFSPKKHLLNKKIDDNQ
>NC_017470.1|WP_193363678.1|1013601_1014570_+|homocysteine-S-methyltransferase
MSAFLLLLKNEKEVGRMSLIEDAKSGIVLDGAMSDELEKQGVETDNKLWTATALVDQLNKVYNAHQDYFRAGAELVITDTYQANVQAFEESGYSKKEAEKFIRDAVKVAKKARDDYQKETGKYNYVAGTIGSYGAYLADGNEYRGDYNLSEKEYLDFHLPRLKLVLKERPDLIALETQPKITEPVAVLNWLETNYPDMPIYVSFTLKDSKHVSDGTSIEHATQEISKYKQVFAIGINCVSPKLVDQALKEFAKYTSKPLVVYPNLGATYDPKIKKWRSFKEKFDFAELTQKWYEDGAHLIGGCRTTGPKEIKEIRQSIDKLR
>NC_017470.1|WP_014565820.1|1014582_1015977_+|amino-acid-permease
MAHKTHLKRKMETRHIRMISLGGVIGTGLFLSSGYTIHEAGPLGTVIAYLVGALIVFAVMLCLGELSVAMPYTGAFHVYAKKYIGPSTGFVVAIIYWLTWTIALGSEFTAAGLIMQKWFPHVPVWIWSLACMILIFLSNFFSVKVFAESEFWFAAIKVFAIVAFIILGVLAITGILPVKGFNHAPGLVNFYKNGWFPNGFSGVFTTMLTVNFAFSGTELIGITAGEAEDPQKAIPSAIKTTLWRLVIFFIGSIVVMAALITYKVAGVTQSPFVYVLDLIHVPFAANIMNFVVLTAIISAANSGLYASTRMLWSLSNEGTIPKVFQKTGKNGVPTLALGVSMLDGIFALISSKVAASTVYLVLVSISGLAVVIVWMAIAWAELNFRKQFLKDGHHLSELKYRTPWYPVVPYFAFFASLFSCILIWFDPTQRVALYYTIPFVAICYLVQYLWRKFDKNLRLAEEGK
>NC_017470.1|WP_014565821.1|1017667_1018600_-|2-dehydropantoate-2-reductase
MRIAIAGAGAMGSKFGWHLKKAGNDVTLIDTWDRNIAAIRENGVVARVKDEEIAEKMPIYSPEEIDEQHESVDLLIVFTKSMQLENMLNSLKPIISKDTYVLCLLNGLGHEDVLERFVTRDHIIMGVTMWASMMTAPGHITFANDNGNVEIQCLDPKGKDETQKIVKILTDAGLNASYSENVMYSIWRKACVNGVVNALCALLDADCKQFGHTKEADELTRNIVQEFADVAQYEGVNLDRKEVIEHVESLFDTPHYPSMYQDLVQNNRPTEIDYIDGAVWRKGLKHSVPTPYCAFITRLIHAKEDILKVK
>NC_017470.1|WP_013437830.1|1018733_1019378_+|nitroreductase-family-protein
MAIINNDFHDVLTGRHSVRRFDPSVKISREEMTEMLKETITAPSACNLQAWRFVVVDTDKGREKLHKYFMKFNFPQIDKSSAIVLFFGNTLAFKKYSKLWHSMYEAKKVTKEAMDAALNTFMPLYEKAPKEMLVADSMVDTSLAAMQFMLIAREHGYDTNAMAGYDSTKAAATMGLDPKQYVPVMAIAVGKHDPKAEPEIATTRYQISDLVDFE
>NC_017470.1|WP_014565822.1|1019434_1019965_+|hypothetical-protein
MRKRYLFLMSLVAFFSIFFVGMQSQNVYADSQYGIARKYTTPKATRGTWYYRETDKFSSDKKTIYTLKITAHTANKDKLYVPSQKFFKKNVYNVSSKKRNAFIKKVMKKNIYAAYNFKKGFNVNNWVNLAGDGVYYIPVTRTVKGKKVKALKIATGADQHASAYAFKTKALAKAAK
>NC_017470.1|WP_014565823.1|1020058_1021102_+|hypothetical-protein
MNWKVEDEMKKIGKISVILLAGLALAGCSQKPKQKTSSKGSATIKVTKNKKQPTKMGHLSDQDLSPQKTVAVVVAYAGDRYSGSWNKALLDGKQNGIEVDLKNQSNYSYMNEGSGVAYMVSADAGYTLKQVNGENIYYLFSNGKKLGSVTMKQMVDYLNKRDSDSLVNSLAQNAKVNDERSDSGDDSSDSAGKKSNLPGDDGLFNVPTEFQGTWYTYNDDKMSIIKISQNKINVDNYVQELHKVKAGFLDKYTYGDMSASYHKATKNWGMAGMGSRRVHGINYMNVRGWMQEAGDGDFYGLHTENGQSVLVLAQGAGPWVSGAAWKTPQLAQQYKHKKFKDLYYQDD
>NC_017470.1|WP_014565824.1|1021106_1021682_+|ATP-binding-protein
MKRIPLILMLGPQASGKSSFIKMNDLQNYTISADEIRIRLNGINSNNGHPQINFVNQTEKIVWQIFNQILQTRLQNGLPTIVDNTNLGGHGFNPINDILKRVPDNYQVYVIDCFKPLLDANDPLSEESLIHALKILDQRNRDREYSVNMDIIQRFVDYYAHFEIPNKVKVISSADLQKVQDLIDLILNFNR
>NC_017470.1|WP_014565825.1|1021715_1022360_+|hypothetical-protein
MECYSVLAFCYNKYKKYVNKEDKMKTLTLQYTISQKGWTDLRQNGKISIDEQSYLLNAIRTQDQYFKNIYLEQYLLQKIIKDTLPEAKKPILAKKIPISCTPFPEHVTEMPDAGEILLELVVPENEVVTVDYRTWLYLASEVNKTVEKYNSMKDMNTILKLPEKKLKIDKMMRVQLLDVLNPAKTMNFIPELKLDQVKKAYQSADGQLEELEDY
>NC_017470.1|WP_014565826.1|1022328_1023813_+|hypothetical-protein
MVNLKNLRIIKQKKVKTMKRRGYLIGAVAAGALLFSLNTNVQAATVPISDNATSYVRKGNQYRFYFKAPTRLTVATKAKYKILNTSNWECIPYKGKNKDTKVFYLRSGHYNLTTKSGKNVKIETSATRITKIRNKLETFSHKTYPLETRFTSAIPIKIGQTVTGMTDMYHTEKLNTMNRYKFTLDKDQKVTMNMSVQPVYENSRSNIFNNNDIQILQDTDYGYALNPWKTKGTLKNVKYSWNLEKGTYYLEKGSARGRFSFKLTSEDTNALPSTPKLTKVSSTEDGIKVDYTKADNATGYGIYGSSLRRYRSNDPLLDAASMIGHSNFTPDGNYPDVLTQTISKNRLINGETYDIAVRAVNDEEGRSFSPVSANQKFTYYIPLKGSHEKPKTPTLKVSYYNDHGSDEPYINIEWDVNPEADSYEIQYRLKGSSKWATFFSKTRSGDIVGDPTNDFGQDFKKGQVYEVRIRALHSNLISDWSGVKTTRVDVTPNR
>NC_017470.1|WP_014565827.1|1026145_1026751_+|DUF1819-family-protein
MSRSYNGGIASYAIWLPELTKFIELYQSGYSINDIKQMSDEENIFQMPTKARAKRCSRNLAVRVKALPESVLNIFSQLDTSNQKIISLLSVMLTSRILDEFIYEVYRPKVQMREDILQDYEVEAFINQKRIESPTIAAWSLNTYKRIKGALKTYMRDGGLMEIDPQNKKQDKFLFPLLDCQLVLAMKVAKLDYELAALGGM

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_017470_3	3.6\|1012476\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012476-1012508	33	MN830256	Lactobacillus phage JNU_P7, complete genome	36784-36816	5	0.848
NC_017470_3	3.16\|1013086\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013086-1013118	33	MN856026	Myoviridae sp. isolate 276, complete genome	8930-8962	5	0.848
NC_017470_2	2.14\|1002466\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1002466-1002498	33	NZ_CP038855	Pantoea vagans strain LMG 24199 plasmid unnamed2, complete sequence	140401-140433	6	0.818
NC_017470_3	3.8\|1012598\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012598-1012630	33	NZ_CP021156	Photobacterium damselae subsp. damselae strain KC-Na-1 plasmid pPDD-Na-1-4, complete sequence	22914-22946	7	0.788
NC_017470_3	3.8\|1012598\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012598-1012630	33	NZ_CP035459	Photobacterium damselae subsp. damselae strain KC-Na-NB1 plasmid pFPPDNB1-1, complete sequence	41891-41923	7	0.788
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	KT997842	Uncultured Mediterranean phage uvDeep-CGR1-KM17-C101, complete genome	11810-11842	7	0.788
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	MN693762	Marine virus AFVG_250M302, complete genome	28116-28148	7	0.788
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	KT717083	Streptococcus phage 73, complete genome	25222-25254	7	0.788
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	MN694601	Marine virus AFVG_250M301, complete genome	28115-28147	7	0.788
NC_017470_2	2.16\|1002588\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1002588-1002620	33	MH622927	Podoviridae sp. isolate ctdc_1, complete genome	47899-47931	8	0.758
NC_017470_3	3.10\|1012720\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012720-1012752	33	NZ_CP012741	Vibrio vulnificus strain FORC_017 plasmid unnamed, complete sequence	26984-27016	8	0.758
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_CP021438	Bacillus thuringiensis strain C15 plasmid pBMB172, complete sequence	4444-4476	8	0.758
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	MN694775	Marine virus AFVG_250M170, complete genome	13332-13364	8	0.758
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	MN694117	Marine virus AFVG_250M169, complete genome	40458-40490	8	0.758
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	MN693887	Marine virus AFVG_250M171, complete genome	40462-40494	8	0.758
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	KP027447	Staphylococcus phage phiIPLA-C1C, complete genome	115840-115872	8	0.758
NC_017470_3	3.2\|1012232\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012232-1012264	33	LC168164	Tenacibaculum phage pT24 DNA, complete genome	171764-171796	9	0.727
NC_017470_3	3.8\|1012598\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012598-1012630	33	NZ_CP049733	Rhizobium leguminosarum strain A1 plasmid pRL10, complete sequence	414090-414122	9	0.727
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_CP007510	Pseudomonas stutzeri strain 19SMN4 plasmid pLIB119, complete plasmid	2961-2993	9	0.727
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_CP046903	Pseudomonas stutzeri strain PM101005 plasmid p1_PM101005, complete sequence	64327-64359	9	0.727
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_CP043833	Bacillus sp. BS98 plasmid unnamed3	1131-1163	9	0.727
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_CP032306	Salmonella enterica subsp. enterica serovar Braenderup strain FORC93 plasmid unnamed2, complete sequence	13090-13122	9	0.727
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_CP016184	Escherichia coli strain EC2 plasmid pEC2-4, complete sequence	214420-214452	9	0.727
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_CP016183	Escherichia coli strain EC2_1 plasmid pEC2_1-4, complete sequence	182669-182701	9	0.727
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_MH547560	Pseudomonas aeruginosa strain PA34 plasmid pMKPA34-1, complete sequence	74817-74849	9	0.727
NC_017470_3	3.16\|1013086\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013086-1013118	33	NZ_CP044103	Streptococcus dysgalactiae strain FDAARGOS_654 plasmid unnamed1	3474-3506	9	0.727
NC_017470_3	3.17\|1013147\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013147-1013179	33	MF417868	Uncultured Caudovirales phage clone 7AX_1, partial genome	22277-22309	9	0.727
NC_017470_3	3.4\|1012354\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012354-1012386	33	KY417925	Ochrobactrum phage POI1126, complete genome	5666-5698	10	0.697
NC_017470_3	3.8\|1012598\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012598-1012630	33	NZ_CP053207	Rhizobium leguminosarum bv. trifolii TA1 plasmid pRltTA1C, complete sequence	443189-443221	10	0.697
NC_017470_3	3.11\|1012781\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1012781-1012813	33	NZ_CP039693	Agrobacterium larrymoorei strain CFBP5473 plasmid pAlCFBP5473, complete sequence	235840-235872	10	0.697
NC_017470_3	3.15\|1013025\|33\|NC_017470\|PILER-CR,CRISPRCasFinder,CRT	1013025-1013057	33	NZ_AP017970	Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-2, complete sequence	29816-29848	10	0.697
NC_017470_2	2.17\|1002649\|33\|NC_017470\|CRISPRCasFinder,CRT	1002649-1002681	33	NZ_CP017108	Lactobacillus salivarius strain CICC23174 plasmid pLS_1 sequence	212-244	11	0.667
NC_017470_2	2.17\|1002649\|33\|NC_017470\|CRISPRCasFinder,CRT	1002649-1002681	33	NZ_CP017108	Lactobacillus salivarius strain CICC23174 plasmid pLS_1 sequence	248154-248186	11	0.667

1. spacer 3.6|1012476|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MN830256 (Lactobacillus phage JNU_P7, complete genome) position: , mismatch: 5, identity: 0.848

cgattgaccgccagtaacacgatttgccattct	CRISPR spacer
actttgaccaccagtaacacgattagccattct	Protospacer
   ******.************** ********

2. spacer 3.16|1013086|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MN856026 (Myoviridae sp. isolate 276, complete genome) position: , mismatch: 5, identity: 0.848

ttgccaaacatacataaaagcaaatttttcgcg	CRISPR spacer
ttgccaaacatacataaaagcgaatttatcatc	Protospacer
*********************.***** **..

3. spacer 2.14|1002466|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP038855 (Pantoea vagans strain LMG 24199 plasmid unnamed2, complete sequence) position: , mismatch: 6, identity: 0.818

cgtgcggcgccactcgtttggcgtgcggtaaaa	CRISPR spacer
cgtccggcgccactcgcttggcgtgacgccaaa	Protospacer
*** ************.********  *. ***

4. spacer 3.8|1012598|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP021156 (Photobacterium damselae subsp. damselae strain KC-Na-1 plasmid pPDD-Na-1-4, complete sequence) position: , mismatch: 7, identity: 0.788

tcaatctatttaatctatactcataa-gctttac	CRISPR spacer
taaatttatttaatatatactcataataatata-	Protospacer
* ***.******** *********** . * **

5. spacer 3.8|1012598|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP035459 (Photobacterium damselae subsp. damselae strain KC-Na-NB1 plasmid pFPPDNB1-1, complete sequence) position: , mismatch: 7, identity: 0.788

tcaatctatttaatctatactcataa-gctttac	CRISPR spacer
taaatttatttaatatatactcataataatata-	Protospacer
* ***.******** *********** . * **

6. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to KT997842 (Uncultured Mediterranean phage uvDeep-CGR1-KM17-C101, complete genome) position: , mismatch: 7, identity: 0.788

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
caagaactggaaaaaagaaaagaagcaattgaa	Protospacer
.********.***********.****  * .**

7. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MN693762 (Marine virus AFVG_250M302, complete genome) position: , mismatch: 7, identity: 0.788

taagaactg----aaaaaaagaaaaaaagctttaaaa	CRISPR spacer
----aactataacaaaaaaagaaataaagatttaaaa	Protospacer
    ****.    *********** **** *******

8. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to KT717083 (Streptococcus phage 73, complete genome) position: , mismatch: 7, identity: 0.788

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
taaatatataaaaaaacaaaaaaaactttaaaa	Protospacer
***. *.  ******* *******.********

9. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MN694601 (Marine virus AFVG_250M301, complete genome) position: , mismatch: 7, identity: 0.788

taagaactg----aaaaaaagaaaaaaagctttaaaa	CRISPR spacer
----aactataacaaaaaaagaaataaagatttaaaa	Protospacer
    ****.    *********** **** *******

10. spacer 2.16|1002588|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MH622927 (Podoviridae sp. isolate ctdc_1, complete genome) position: , mismatch: 8, identity: 0.758

cgcattgcaacgcttgtggagtgatacggcaac	CRISPR spacer
cggatttcaacgcttgtggagtgatcccagacg	Protospacer
** *** ****************** * . *

11. spacer 3.10|1012720|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP012741 (Vibrio vulnificus strain FORC_017 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.758

tgctgaa---gtatttgaccagtctgtaccaacttt	CRISPR spacer
---ggaacctatatttgaccagtttttaccaacttc	Protospacer
    ***   .************.* *********.

12. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP021438 (Bacillus thuringiensis strain C15 plasmid pBMB172, complete sequence) position: , mismatch: 8, identity: 0.758

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
caaaaactaaaaaaaagaaaaaaagtaatacta	Protospacer
.**.****.****************.  **  *

13. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MN694775 (Marine virus AFVG_250M170, complete genome) position: , mismatch: 8, identity: 0.758

-----taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
ttatctaa-----aaaaataagaaaaaaagctttacaa	Protospacer
     ***     .**** **************** **

14. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MN694117 (Marine virus AFVG_250M169, complete genome) position: , mismatch: 8, identity: 0.758

-----taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
ttatctaa-----aaaaataagaaaaaaagctttacaa	Protospacer
     ***     .**** **************** **

15. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MN693887 (Marine virus AFVG_250M171, complete genome) position: , mismatch: 8, identity: 0.758

-----taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
ttatctaa-----aaaaataagaaaaaaagctttacaa	Protospacer
     ***     .**** **************** **

16. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to KP027447 (Staphylococcus phage phiIPLA-C1C, complete genome) position: , mismatch: 8, identity: 0.758

---taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
ccttacaga---aaaaaaataaaaaaaactttaaaa	Protospacer
   ** ..*   ******* *******.********

17. spacer 3.2|1012232|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to LC168164 (Tenacibaculum phage pT24 DNA, complete genome) position: , mismatch: 9, identity: 0.727

cgaagacggcacttatacgattgatctttggaa	CRISPR spacer
tgaagatggcacttatatgattgattatacaga	Protospacer
.*****.**********.*******. *  ..*

18. spacer 3.8|1012598|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP049733 (Rhizobium leguminosarum strain A1 plasmid pRL10, complete sequence) position: , mismatch: 9, identity: 0.727

tcaatctatttaatctatactcataagctttac	CRISPR spacer
ttaatctatttaatctatagacataattaattg	Protospacer
*.*****************  ***** .  *

19. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP007510 (Pseudomonas stutzeri strain 19SMN4 plasmid pLIB119, complete plasmid) position: , mismatch: 9, identity: 0.727

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
acaagccataaaacaagaaaaaaagatttaaaa	Protospacer
  *.. *  **** *********** *******

20. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP046903 (Pseudomonas stutzeri strain PM101005 plasmid p1_PM101005, complete sequence) position: , mismatch: 9, identity: 0.727

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
acaagccataaaacaagaaaaaaagatttaaaa	Protospacer
  *.. *  **** *********** *******

21. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP043833 (Bacillus sp. BS98 plasmid unnamed3) position: , mismatch: 9, identity: 0.727

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
ttttgactgaaaaaaacaaataaagcttttcat	Protospacer
*   .*********** *** ********  *

22. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP032306 (Salmonella enterica subsp. enterica serovar Braenderup strain FORC93 plasmid unnamed2, complete sequence) position: , mismatch: 9, identity: 0.727

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
taagaaatgaaaaaaagaaaagaaatcagagta	Protospacer
****** **************.**...  *. *

23. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016184 (Escherichia coli strain EC2 plasmid pEC2-4, complete sequence) position: , mismatch: 9, identity: 0.727

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
caaagttagaaaaaaataaaaaaaggtttaaag	Protospacer
.**.. . ******** ******** ******.

24. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016183 (Escherichia coli strain EC2_1 plasmid pEC2_1-4, complete sequence) position: , mismatch: 9, identity: 0.727

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
caaagttagaaaaaaataaaaaaaggtttaaag	Protospacer
.**.. . ******** ******** ******.

25. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MH547560 (Pseudomonas aeruginosa strain PA34 plasmid pMKPA34-1, complete sequence) position: , mismatch: 9, identity: 0.727

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
acaagccataaaacaagaaaaaaagatttaaaa	Protospacer
  *.. *  **** *********** *******

26. spacer 3.16|1013086|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP044103 (Streptococcus dysgalactiae strain FDAARGOS_654 plasmid unnamed1) position: , mismatch: 9, identity: 0.727

ttgccaaacatacataaaagcaaatttttcgcg	CRISPR spacer
taaacgaagatacatacaagcaaatttttccat	Protospacer
* . *.** ******* *************

27. spacer 3.17|1013147|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to MF417868 (Uncultured Caudovirales phage clone 7AX_1, partial genome) position: , mismatch: 9, identity: 0.727

tgaaacatcatcagataactttgctaattcgtc	CRISPR spacer
ttttaaatcatcaaataacttttctaattctct	Protospacer
*   * *******.******** ******* ..

28. spacer 3.4|1012354|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to KY417925 (Ochrobactrum phage POI1126, complete genome) position: , mismatch: 10, identity: 0.697

tacatcgacaataaagaccccaaggcccgtatt	CRISPR spacer
gccaacgacaagaaagaccccaaggctgcgaag	Protospacer
  ** ****** **************.   *

29. spacer 3.8|1012598|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP053207 (Rhizobium leguminosarum bv. trifolii TA1 plasmid pRltTA1C, complete sequence) position: , mismatch: 10, identity: 0.697

tcaatctatttaatctatactcataagctttac	CRISPR spacer
gtaatctatttaatctatagacataattaattg	Protospacer
 .*****************  ***** .  *

30. spacer 3.11|1012781|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP039693 (Agrobacterium larrymoorei strain CFBP5473 plasmid pAlCFBP5473, complete sequence) position: , mismatch: 10, identity: 0.697

cattccagacggtgtcgaagcctttaaactgtc	CRISPR spacer
ctggtgcgacggtgtcgatgcctttgaactgga	Protospacer
*   .  *********** ******.*****

31. spacer 3.15|1013025|33|NC_017470|PILER-CR,CRISPRCasFinder,CRT matches to NZ_AP017970 (Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-2, complete sequence) position: , mismatch: 10, identity: 0.697

taagaactgaaaaaaagaaaaaaagctttaaaa	CRISPR spacer
attttatcaaagaaaagaaaaaaagcttttaaa	Protospacer
     *...**.***************** ***

32. spacer 2.17|1002649|33|NC_017470|CRISPRCasFinder,CRT matches to NZ_CP017108 (Lactobacillus salivarius strain CICC23174 plasmid pLS_1 sequence) position: , mismatch: 11, identity: 0.667

ctattcaattatcaagcataactagttgctaaa	CRISPR spacer
aagcctgcttctctagcataactagttgctaat	Protospacer
  ..... ** ** ******************

33. spacer 2.17|1002649|33|NC_017470|CRISPRCasFinder,CRT matches to NZ_CP017108 (Lactobacillus salivarius strain CICC23174 plasmid pLS_1 sequence) position: , mismatch: 11, identity: 0.667

ctattcaattatcaagcataactagttgctaaa	CRISPR spacer
aagcctgcttctctagcataactagttgctaat	Protospacer
  ..... ** ** ******************

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1236994 : 1246662

Streptococcus_phage(50.0%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014565929.1\|1236994_1237906_+	cysteine synthase A	A0A1X9I5K7	Streptococcus_phage	6.3e-92	57.2
WP_014565932.1\|1239321_1239768_-	GNAT family N-acetyltransferase	A0A1X9I687	Streptococcus_phage	1.3e-13	34.6
WP_013438124.1\|1239861_1240389_-	adenine phosphoribosyltransferase	A0A1V0SKE5	Klosneuvirus	4.2e-24	39.7
WP_014565933.1\|1240493_1242767_-	single-stranded-DNA-specific exonuclease RecJ	A7KV88	Bacillus_phage	1.1e-76	36.3
WP_014565934.1\|1242877_1243567_-	class A sortase	NA	NA	NA	NA
WP_013438127.1\|1243569_1245408_-	elongation factor 4	E4ZFJ7	Streptococcus_phage	3.1e-21	24.6
WP_013642124.1\|1245507_1246662_-	molecular chaperone DnaJ	Q8QNB4	Ectocarpus_siliculosus_virus	3.2e-24	26.7

DBSCAN-SWA_2

1286112 : 1298493

Bacillus_phage(25.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014565950.1\|1286112_1288056_-	M13 family metallopeptidase	E3T4I7	Cafeteria_roenbergensis_virus	5.9e-63	28.6
WP_014565951.1\|1288149_1289946_-	ABC transporter ATP-binding protein	W8CYL7	Bacillus_phage	2.5e-44	27.3
WP_014565952.1\|1289938_1291705_-	ATP-binding cassette domain-containing protein	W8CYL7	Bacillus_phage	5.7e-49	28.3
WP_013438154.1\|1291788_1292007_-	YneF family protein	NA	NA	NA	NA
WP_013438155.1\|1292072_1292336_-	DUF896 domain-containing protein	NA	NA	NA	NA
WP_013438156.1\|1292486_1293113_+	transcriptional repressor LexA	A0A1B2APZ1	Phage_Wrath	8.9e-13	53.7
WP_014565953.1\|1293147_1293936_-	SGNH/GDSL hydrolase family protein	W0TW81	Staphylococcus_phage	1.2e-06	25.6
WP_014565954.1\|1293935_1294583_-	uracil-DNA glycosylase	A0A218MKQ4	uncultured_virus	5.0e-11	31.5
WP_003629071.1\|1294925_1295273_-	50S ribosomal protein L19	NA	NA	NA	NA
WP_014565955.1\|1295468_1295666_+	low temperature requirement protein A	NA	NA	NA	NA
WP_082231541.1\|1295714_1295954_+	hypothetical protein	NA	NA	NA	NA
WP_082231542.1\|1295931_1296546_+	low temperature requirement protein A	NA	NA	NA	NA
WP_013641431.1\|1296597_1297062_-\|transposase	IS200/IS605 family transposase	A0A0P0IQC6	Lactobacillus_phage	4.8e-32	48.9
WP_014565958.1\|1297161_1298493_+\|transposase	transposase	A0A288TXV8	Enterococcus_phage	2.1e-64	38.7

DBSCAN-SWA_3

1425377 : 1483434

Enterococcus_phage(18.18%)

transposase,protease,tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014566029.1\|1425377_1426709_-\|transposase	transposase	A0A288TXV8	Enterococcus_phage	8.9e-63	38.5
WP_013641431.1\|1426808_1427273_+\|transposase	IS200/IS605 family transposase	A0A0P0IQC6	Lactobacillus_phage	4.8e-32	48.9
WP_193363680.1\|1427238_1427637_-	hypothetical protein	NA	NA	NA	NA
WP_014566031.1\|1427893_1428649_-	hypothetical protein	NA	NA	NA	NA
WP_014566032.1\|1428716_1429424_-	aldo/keto reductase	NA	NA	NA	NA
WP_013438340.1\|1429440_1429848_-	OsmC family protein	NA	NA	NA	NA
WP_014566033.1\|1429871_1431050_-	MFS transporter	NA	NA	NA	NA
WP_014566034.1\|1431754_1432294_-	GTP pyrophosphokinase	NA	NA	NA	NA
WP_013438344.1\|1432502_1432943_-	MerR family transcriptional regulator	NA	NA	NA	NA
WP_013438345.1\|1433103_1434576_+	multidrug efflux MFS transporter	NA	NA	NA	NA
WP_013438346.1\|1434575_1435142_+	DUF4811 domain-containing protein	NA	NA	NA	NA
WP_014566035.1\|1435185_1436223_-	serine hydrolase	NA	NA	NA	NA
WP_013642249.1\|1436447_1437653_+	MFS transporter	NA	NA	NA	NA
WP_014566036.1\|1437713_1438988_-\|transposase	ISL3 family transposase	Q6V7R1	Burkholderia_virus	1.6e-13	23.6
WP_013642252.1\|1439886_1441329_-	sucrose phosphorylase	NA	NA	NA	NA
WP_014566039.1\|1441339_1443541_-	alpha-galactosidase	NA	NA	NA	NA
WP_013642254.1\|1443553_1444666_-	sn-glycerol-3-phosphate ABC transporter ATP-binding protein UgpC	G3M9Y6	Bacillus_virus	2.0e-23	32.9
WP_013438351.1\|1444692_1445526_-	carbohydrate ABC transporter permease	NA	NA	NA	NA
WP_007126478.1\|1445540_1446416_-	sugar ABC transporter permease	NA	NA	NA	NA
WP_014566040.1\|1446428_1447682_-	extracellular solute-binding protein	NA	NA	NA	NA
WP_013642256.1\|1447931_1448765_+	AraC family transcriptional regulator	NA	NA	NA	NA
WP_013438354.1\|1448807_1449794_-	galactose mutarotase	NA	NA	NA	NA
WP_014566041.1\|1449796_1451260_-	UDP-glucose--hexose-1-phosphate uridylyltransferase	NA	NA	NA	NA
WP_013642259.1\|1451280_1452444_-	galactokinase	NA	NA	NA	NA
WP_013642261.1\|1452987_1453374_-	PTS cellbiose transporter subunit IIC	NA	NA	NA	NA
WP_013642262.1\|1453498_1454215_-	GntR family transcriptional regulator	NA	NA	NA	NA
WP_013642263.1\|1454366_1455011_-	nitroreductase family protein	NA	NA	NA	NA
WP_014566043.1\|1455536_1457543_-	beta-galactosidase	NA	NA	NA	NA
WP_014566044.1\|1457553_1459473_-	PTS sugar transporter subunit IIA	NA	NA	NA	NA
WP_014566045.1\|1459665_1460673_-	LacI family DNA-binding transcriptional regulator	NA	NA	NA	NA
WP_014566046.1\|1460897_1462778_+	beta-galactosidase	L0N6M2	Herpes_simplex_virus	1.7e-96	34.3
WP_014566047.1\|1462761_1463712_+	hypothetical protein	NA	NA	NA	NA
WP_013438365.1\|1463814_1464807_+	UDP-glucose 4-epimerase GalE	A0A2K9L5H6	Tupanvirus	1.9e-46	36.6
WP_013642269.1\|1464976_1465300_+	LacI family DNA-binding transcriptional regulator	NA	NA	NA	NA
WP_014565539.1\|1465467_1466799_-\|transposase	transposase	A0A288TXV8	Enterococcus_phage	3.4e-62	38.2
WP_014566048.1\|1466898_1467363_+\|transposase	IS200/IS605 family transposase	A0A0P0IQC6	Lactobacillus_phage	2.4e-31	48.1
WP_014566049.1\|1467605_1468166_+	substrate-binding domain-containing protein	NA	NA	NA	NA
WP_166484902.1\|1469489_1469717_+	hypothetical protein	NA	NA	NA	NA
WP_014566052.1\|1470001_1473355_-	DEAD/DEAH box helicase family protein	NA	NA	NA	NA
WP_014566053.1\|1473357_1474398_-	Eco57I restriction-modification methylase domain-containing protein	A0A1V0SF57	Hokovirus	4.4e-17	23.7
WP_014566054.1\|1474394_1475054_-	hypothetical protein	A0A1D8KUI1	Synechococcus_phage	9.4e-05	29.5
WP_014566055.1\|1475034_1475628_-	recombinase family protein	A0A1J1J8Z4	Escherichia_phage	6.2e-32	40.6
WP_014566057.1\|1476158_1477151_-	hypothetical protein	NA	NA	NA	NA
WP_014566058.1\|1477254_1478133_-	hypothetical protein	NA	NA	NA	NA
WP_013642275.1\|1478336_1479674_-	type I glutamate--ammonia ligase	NA	NA	NA	NA
WP_013642276.1\|1479815_1481063_-	aminotransferase class V-fold PLP-dependent enzyme	NA	NA	NA	NA
WP_013642277.1\|1481055_1481976_-\|tRNA	tRNA (adenosine(37)-N6)-dimethylallyltransferase MiaA	NA	NA	NA	NA
WP_014566059.1\|1482053_1482455_-	rhodanese-like domain-containing protein	NA	NA	NA	NA
WP_013438376.1\|1482513_1482744_-	YqgQ family protein	NA	NA	NA	NA
WP_013438377.1\|1482753_1483434_-\|protease	rhomboid family intramembrane serine protease	NA	NA	NA	NA

DBSCAN-SWA_4

1527181 : 1535949

Prochlorococcus_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014566079.1\|1527181_1527778_-	phosphoribosylglycinamide formyltransferase	E3SNR5	Prochlorococcus_phage	7.4e-25	34.1
WP_014566080.1\|1527787_1528825_-	phosphoribosylformylglycinamidine cyclo-ligase	Q58MH8	Prochlorococcus_phage	5.5e-60	41.2
WP_013438443.1\|1528826_1530278_-	amidophosphoribosyltransferase	A0A0M3SGR2	Mollivirus	4.1e-61	34.4
WP_013438444.1\|1530253_1532482_-	phosphoribosylformylglycinamidine synthase subunit PurL	A6N228	Microbacterium_phage	2.7e-144	39.7
WP_014566081.1\|1532478_1533150_-	phosphoribosylformylglycinamidine synthase subunit PurQ	NA	NA	NA	NA
WP_013438446.1\|1533146_1533401_-	phosphoribosylformylglycinamidine synthase subunit PurS	NA	NA	NA	NA
WP_013642318.1\|1533401_1534118_-	phosphoribosylaminoimidazolesuccinocarboxamide synthase	G8EYA2	Synechococcus_phage	1.3e-39	38.7
WP_014566082.1\|1534322_1535498_-	5-(carboxyamino)imidazole ribonucleotide synthase	NA	NA	NA	NA
WP_014566083.1\|1535463_1535949_-	5-(carboxyamino)imidazole ribonucleotide mutase	A0A2P0VNU7	Tetraselmis_virus	2.4e-21	45.1

DBSCAN-SWA_5

1699710 : 1707102

Clostridioides_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014566171.1\|1699710_1700766_-	LCP family protein	A0A1X9I5X1	Streptococcus_phage	1.9e-15	31.2
WP_014566172.1\|1700868_1701060_-	DUF1828 domain-containing protein	Q6SEA4	Lactobacillus_prophage	1.1e-09	51.6
WP_014566173.1\|1701244_1702519_+	GTPase HflX	NA	NA	NA	NA
WP_014566174.1\|1702525_1703527_+	CAP domain-containing protein	NA	NA	NA	NA
WP_014566175.1\|1703729_1704605_-	C40 family peptidase	A0A1V0DZX6	Clostridioides_phage	8.0e-20	44.7
WP_013642459.1\|1704777_1705545_-	C40 family peptidase	A0A1V0DZX6	Clostridioides_phage	2.1e-16	40.7
WP_013438629.1\|1705815_1706370_-	C40 family peptidase	M9MUG9	Rhodococcus_phage	1.2e-16	38.8
WP_014566176.1\|1706553_1707102_-	AAA family ATPase	A0A0K2FM14	Brevibacillus_phage	1.9e-11	28.9

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

2. NC_017472

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_017472_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017472_1

40785-41023

Orphan

Consensus_repeat	Method
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	CRISPRCasFinder
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	CRT
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACCTAAA	PILER-CR

3 spacers

The CRISPR arrays of NC_017472_1

>merge|NC_017472|1|40785-41023|CRISPRCasFinder,CRT,PILER-CR
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACCCTTTAATTTTATCATCATTTGGAATATACTGTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACCAAAATACTGATAAATCAATGCTTAGTTTAGGTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACCTAAGCTCATTTCTGCATCTAATACCCGATTGGTTTTCGGTGGTTGTCATTTCAAGCAGGTAGATACCTAAA

>NC_017472|1|1|40785-41019|CRISPRCasFinder
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	CTTTAATTTTATCATCATTTGGAATATACT
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	AAAATACTGATAAATCAATGCTTAGTTTAG
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	TAAGCTCATTTCTGCATCTAATACCCGATTG
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAGATACC

>NC_017472|1|1|40785-41019|CRT
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	CTTTAATTTTATCATCATTTGGAATATACT
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	AAAATACTGATAAATCAATGCTTAGTTTAG
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACC	TAAGCTCATTTCTGCATCTAATACCCGATTG
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAGATACC

>NC_017472|1|1|40851-41023|PILER-CR
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACCAAAA	TACTGATAAATCAATGCTTAGTTTAG
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAAATACCTAAG	CTCATTTCTGCATCTAATACCCGATTG
GTTTTCGGTGGTTGTCATTTCAAGCAGGTAGATACCTAAA

Protein	Signature genes	Signature genes Name	Protein_function
NC_017472.1\|WP_014566311.1\|41549_41873_+\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566300.1\|32288_32597_-\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566328.1\|59139_60090_+\|SLAP-domain-containing-protein	unknown	unknown	gnl\|CDD\|367400
NC_017472.1\|WP_166484917.1\|34766_34952_-\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566302.1\|33897_34752_-\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|223656
NC_017472.1\|WP_014566322.1\|52136_52433_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|212142
NC_017472.1\|WP_014566320.1\|50883_51609_+\|coenzyme-F420-0:L-glutamate-ligase	unknown	unknown	gnl\|CDD\|376711
NC_017472.1\|WP_014566307.1\|36562_36703_+\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566327.1\|57155_59084_+\|tetracycline-resistance-ribosomal-protection-protein-Tet(W)	unknown	unknown	gnl\|CDD\|206731
NC_017472.1\|WP_014566310.1\|39970_40651_+\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566308.1\|37165_37924_-\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566304.1\|35377_35599_-\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566309.1\|37907_39761_-\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566299.1\|30659_32258_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224055
NC_017472.1\|WP_014566315.1\|46289_46877_+\|recombinase-family-protein	unknown	unknown	gnl\|CDD\|239737
NC_017472.1\|WP_014566303.1\|35120_35264_-\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566314.1\|43268_46115_-\|methylase	unknown	unknown	gnl\|CDD\|223934
NC_017472.1\|WP_014566313.1\|42910_43153_+\|hypothetical-protein	unknown	unknown	unknown
NC_017472.1\|WP_014566323.1\|52711_54217_+\|ABC-F-type-ribosomal-protection-protein	unknown	unknown	gnl\|CDD\|223562
NC_017472.1\|WP_014566319.1\|50043_50667_+\|NUDIX-hydrolase	unknown	unknown	gnl\|CDD\|240029

Protein	Function_ID	Function_description	E-value
NC_017472.1\|WP_014566327.1\|57155_59084_+\|tetracycline-resistance-ribosomal-protection-protein-Tet(W)	gnl\|CDD\|206731	cd04168, TetM_like, Tet(M)-like family includes Tet(M), Tet(O), Tet(W), and OtrA, containing tetracycline resistant proteins. Tet(M), Tet(O), Tet(W), and OtrA are tetracycline resistance genes found in Gram-positive and Gram-negative bacteria. Tetracyclines inhibit protein synthesis by preventing aminoacyl-tRNA from binding to the ribosomal acceptor site. This subfamily contains tetracycline resistance proteins that function through ribosomal protection and are typically found on mobile genetic elements, such as transposons or plasmids, and are often conjugative. Ribosomal protection proteins are homologous to the elongation factors EF-Tu and EF-G. EF-G and Tet(M) compete for binding on the ribosomes. Tet(M) has a higher affinity than EF-G, suggesting these two proteins may have overlapping binding sites and that Tet(M) must be released before EF-G can bind. Tet(M) and Tet(O) have been shown to have ribosome-dependent GTPase activity. These proteins are part of the GTP translation factor family, which includes EF-G, EF-Tu, EF2, LepA, and SelB.	2.19739e-145
NC_017472.1\|WP_014566328.1\|59139_60090_+\|SLAP-domain-containing-protein	gnl\|CDD\|367400	pfam03217, SLAP, SLAP domain. This short domain is found in a variety of bacterial cell surface proteins. The domain is about 60 residues in length (although previously defined as 2 copies of this domain). It usually occurs in tandem pairs. It may be distantly related to the SH3 domain.	4.91189e-13
NC_017472.1\|WP_014566319.1\|50043_50667_+\|NUDIX-hydrolase	gnl\|CDD\|240029	cd04672, Nudix_Hydrolase_14, Members of the Nudix hydrolase superfamily catalyze the hydrolysis of NUcleoside DIphosphates linked to other moieties, X. Enzymes belonging to this superfamily require a divalent cation, such as Mg2+ or Mn2+, for their activity and contain a highly conserved 23-residue nudix motif (GX5EX7REUXEEXGU, where U = I, L or V), which functions as a metal binding and catalytic site. Substrates of nudix hydrolases include intact and oxidatively damaged nucleoside triphosphates, dinucleoside polyphosphates, nucleotide-sugars and dinucleotide enzymes. These substrates are metabolites or cell signaling molecules that require regulation during different stages of the cell cycle or during periods of stress. In general, the role of the nudix hydrolase is to sanitize the nucleotide pools and to maintain cell viability, thereby serving as surveillance & "house-cleaning" enzymes. Substrate specificity is used to define families within the superfamily. Differences in substrate specificity are determined by the N-terminal extension or by residues in variable loop regions. Mechanistically, substrate hydrolysis occurs by a nucleophilic substitution reaction, with variation in the numbers and roles of divalent cations required.	3.68616e-57
NC_017472.1\|WP_014566299.1\|30659_32258_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224055	COG1132, MdlB, ABC-type multidrug transport system, ATPase and permease components [Defense mechanisms].	1.68114e-44
NC_017472.1\|WP_014566315.1\|46289_46877_+\|recombinase-family-protein	gnl\|CDD\|239737	cd03768, SR_ResInv, Serine Recombinase (SR) family, Resolvase and Invertase subfamily, catalytic domain; members contain a C-terminal DNA binding domain. Serine recombinases catalyze site-specific recombination of DNA molecules by a concerted, four-strand cleavage and rejoining mechanism which involves a transient phosphoserine linkage between DNA and the enzyme. They are functionally versatile and include resolvases, invertases, integrases, and transposases. Resolvases and invertases affect resolution or inversion and comprise a major phylogenic group. Resolvases (e.g. Tn3, gamma-delta, and Tn5044) normally recombine two sites in direct repeat causing deletion of the DNA between the sites. Invertases (e.g. Gin and Hin) recombine sites in inverted repeat to invert the DNA between the sites. Cointegrate resolution with gamma-delta resolvase requires the formation of a synaptosome of three resolvase dimers bound to each of two res sites on the DNA. Also included in this subfamily are some putative integrases including a sequence from bacteriophage phi-FC1.	6.8676e-54
NC_017472.1\|WP_014566302.1\|33897_34752_-\|LysR-family-transcriptional-regulator	gnl\|CDD\|223656	COG0583, LysR, Transcriptional regulator [Transcription].	6.01432e-30
NC_017472.1\|WP_014566322.1\|52136_52433_+\|hypothetical-protein	gnl\|CDD\|212142	cd11535, NTP-PPase_SsMazG, Nucleoside Triphosphate Pyrophosphohydrolase (EC 3.6.1.8) MazG-like domain found in Sulfolobus solfataricus (Ss) and its homologs from archaea and bacteria. This family includes a MazG-like protein from Sulfolobus solfataricus (SsMazG) and its homologs from archaea and bacteria. Although its biological roles remain still unclear, SsMazG shows significant sequence similarity to the NTP-PPase MazG proteins. However, unlike typical tandem-domain MazG proteins, SsMazG contains a single MazG-like domain. It is predicted that SsMazG might participate in house-cleaning by preventing incorporation of the oxidation product 2-oxo-(d)ATP (iso-dGTP), a mutagenic derivative of ATP, into DNA.	5.41426e-29
NC_017472.1\|WP_014566320.1\|50883_51609_+\|coenzyme-F420-0:L-glutamate-ligase	gnl\|CDD\|376711	pfam01996, F420_ligase, F420-0:Gamma-glutamyl ligase. F420-0:Gamma-glutamyl ligase (EC:6.3.2.-) is an enzyme involved in F420 biosynthesis pathway. It catalyzes the GTP-dependent successive addition of multiple gamma-linked L-glutamates to the L-lactyl phosphodiester of 7,8-didemethyl-8-hydroxy-5-deazariboflavin (F420-0). This reaction produces polyglutamated F420 derivatives. GTP + F420-0 + n L-glutamate -> GDP + phosphate + F420-n.	3.24582e-57
NC_017472.1\|WP_014566323.1\|52711_54217_+\|ABC-F-type-ribosomal-protection-protein	gnl\|CDD\|223562	COG0488, Uup, ATPase components of ABC transporters with duplicated ATPase domains [General function prediction only].	2.23847e-94
NC_017472.1\|WP_014566314.1\|43268_46115_-\|methylase	gnl\|CDD\|223934	COG1002, COG1002, Type II restriction enzyme, methylase subunits [Defense mechanisms].	9.75951e-06

>NC_017472.1|WP_014566310.1|39970_40651_+|hypothetical-protein
MAKTTNNGDEPTKSRKGLDLLYRLTHYDSYHSYRVRMAIVRSLLWLAVVLYIYKLFIPNYQTDIFVNDIIIFLLGSYLIAYYSVTAKASIMFKDSAYVMRKIAFSGVISNSWNIYDGILKDPEEGEVSVEITFFKEKAFLVNVFDLMRKNGKTLLLTKDDIENLKRYIEVLDGSQALRKKFEAYATLSDEMVKTLSDAGILLTRLDNHYRTKPYRWDYARTTDIKS
>NC_017472.1|WP_014566309.1|37907_39761_-|hypothetical-protein
MINFKNNFKTISITDDQFLLIKQIANLGFVTKPQLEMIYSIIKNKPTSISNHILNKLVNKDKVLNRIQSNESQNRIKQIAYVISRYGRNLLSAYHCFYRDPRSFGINFHNLQANEVVIQALYASNFKPTALGSNNSSLRFNDEEKTVSITNSFGSTFTLPTFDVPFYDKKVPKPVVSRLNEDYFIKNADLARLPELLTEGLLVGGITDKKLRLSLDSKAQSTFSSEKGNEDDDWFVQDLSFLKNPRLLRYISFFKPFLSKKFIEEMQSYQGLTKMSGLRGVGAHVKLVKISNFYQQLLKRSNCYYFLLNLYQNLLNIDNKKQSLATVGNYWQQLATGNNNYQELVTFTNSTLKKDTLDKNLAIIKPIGLLPFRVGSDFDDRIQRASLALRGFNYHLKLTEFDTRPFNAQLGITPTKKDNTAFEADTMITFKRNNKVQSVFIELDNRTEGSATQAQKILNYIEYANQHPNDNFLLAIVSADGSLPTNKLKQYTYPDQHLGVLVDKMLRIRVGEGQQTEDGRLVKATPYLIELYERCPNLKIIFAGLSEAPMRIAEFIVNANHNIDYISSAFVLARSISKETQWDVTFDPTIEVKEAIKNTPALVDTTYNQLHYNVSGL
>NC_017472.1|WP_014566308.1|37165_37924_-|hypothetical-protein
MFPDFNYSNKQTNLHVRQPVIAGDEYDLDTPYLVTEVTQSFGKHHVLKDRDSIPPMVIFPTRERLTHANVPPAIQKMCNWSPKFIAGQIYYYQPRLGIDNNPYLLRELRNLVIRHSKDIYQYYSKGFLSRKELAQGITYSDKDKKLPFAYADHILQKTRKYNELHRLTNYMNDKAFAEQIMLNEIPLKMLKSLIARTQGRAFSIPVIADLPYSIVGDDSLIVPDHISLSDCLTTPNTRYRRSDAKIDLKYSY
>NC_017472.1|WP_014566307.1|36562_36703_+|hypothetical-protein
MYTERGRVLDLPVISSKDEAEIMKNAKDLKKPHWLPVELVSIDENK
>NC_017472.1|WP_014566304.1|35377_35599_-|hypothetical-protein
MAKVYDHDKHEFLTGYRGLTIGWSDGNTFLPVNFALMSTKKKKNMIGSQPVTTDQRSIANRRRTQAQRPMNKS
>NC_017472.1|WP_014566303.1|35120_35264_-|hypothetical-protein
MLKQTKKVYYRYRGRLYDIKELYERLAASKMHQKADYLYSSVVEAKY
>NC_017472.1|WP_166484917.1|34766_34952_-|hypothetical-protein
MCKSALGITIGPSFILEKENAFVKPVPLEYRVKLSYGTASLNSNHKIQIKDFYNFFKLNLQ
>NC_017472.1|WP_014566302.1|33897_34752_-|LysR-family-transcriptional-regulator
METKQLAIFLDVCKTQSFSETSRNMYITRSAIVQHINKLEKYLGVKLFHRNSHGVKLTDAGKVLIPFAQNMVDTNDSIIQTMHNFSHTITIGTIYLQKPNLITKMLNDRPKYAKKIQIKFQELNNIKQINSQIDIIEYYEVTKYLDQSFNFLKLEEEPIFIALPPNHKLARKDSIDLKDLEGYTVAIEKSGVSVIGDKVKEKLEKYPQINLKSYGIYNSSFFATAQYNNYLICIARGMGIDTTPYVLRPLNVSEKALYGIYYRKKPNNLVKEFIKNFSEKKTVQ
>NC_017472.1|WP_014566300.1|32288_32597_-|hypothetical-protein
MPSSKKSGSVVGKPLSSKYGTSSNSQTDSNAVKPDGLLCISFCLSACKSNCRSECASNCGKACASACKAACRAECRSMCYGAGSDAPTTLNKQVKSVEDIIL
>NC_017472.1|WP_014566299.1|30659_32258_-|ABC-transporter-ATP-binding-protein
MFLKRIWNKYKFDYILLLGMNIINTCIETSNVYLEGMLINSLVYKADRVSFIRNIIVIIVLNLIRLFLSFFISKIQILKYRKINLDFNDSIIKELYSKDTLEVIKKDPVKTADRITEDTDEILTFLFHTINQVISILFSSIIIFVYIFKTKSRFFLLIMILLPAYICLYLFLKPKIFEINLKLKQAYNEYFSGFTEWLSRYIEIKGNNRENKESKRWSKTKKSLLNITKRDFLLNLNMSSSEIIFQLIFQLILFINGGLSVISGNMTVGSFSILFQYFNQLLGEVDEIFSVLFGLESFRVAKMRINKLLSIKNEVDGKKIISRIESIYVHDFDISLHRNSPLFVKKLNCTFSSPGLYIIKGKNGIGKSTFLRTLIGLYTPIKEGEVLINNENIDLINKKKLRENNISCLFQDVPLPSCTVAEYIRDKHTNSNSDQNEAFKKVFYSSQFNIKRILDRKMDELSTGELQLVKLYSAFLKEKVDCYLLDEPLANIYPELQYDTLNLLKQMAQTKLVIIISHDLQFEKIGKTIKVG
>NC_017472.1|WP_014566311.1|41549_41873_+|hypothetical-protein
MKNEDLQEMRKEYIQDITLEVSKMIAKSSKLSLEEAKKAFINSRTYNFLAYSDDPFVEEGPEDFYEMFKNDRKYGRMVTDIQIYLEKHPELYINPNEKDNVRKGNNK
>NC_017472.1|WP_014566313.1|42910_43153_+|hypothetical-protein
MSKESELKQIEDKLLIYISSDRRNWADTFKLTKRVRDEELYSGEYADYGDFFWLCIPKELLEVAQKYVAKGWGILLVTLQ
>NC_017472.1|WP_014566314.1|43268_46115_-|methylase
MTKVNKKKLKDFIDTWQNQGSEVADKVTYWNTLLELLGVPKEQIDNKTYIEYEKPIKLHENESFHGSIDAYIPSTHVLIEQKSNGVDLTKPENRPNGNHTEKITPFSQAKRYDDHLGSKEKANFLVLSNFNQIVVYDVRESIDTKPIIINIEDLEKDLYLLNFLVKPDDSKRLEKEKRVSFAAGTLVSQIYNELADIFAKYDQTADEQIKHSINTLCVRLVFCLYAEDAGLFPTKEQFYNYLEPVKPNKMGLALKALFKTLDTKDRKAEDPFWEDENPELAQFPYVNGGLFADEDIIIPPFTEKLKDIILNKASRGFDWSDISPTIFGAVFESTLNPDTRREGGMHYTSIENIHKVIDPLFLDDLKAKLEKIKQYKNQKTIHDKAVAFQEELANLTFFDPACGSGNFLTETFLSLRRLENEAIRLELGGESVLDVGQAKDWIKVSIQQFSGIEINDFAVSVAKTALWIAEDQMMKETQDLLYAPDWDFLPLKTYTRIHEGNALEMDWNKVIPNYACHYIIGNPPFSGLSALPAKNKKLKKQQTEDMNRVFKDLPKHGKLDYVTAWYEKAADMMQGTNIKASFVSTNSITQGEQVGILWKHLIEDKNLTIIFAYRSFVWNNEAKDTAKVHCVIVGFTCGKYKGEKTLFEGEKVKKVDHINGYLIDYDDIYVKSRKVVPPYNMPLMSQGSKPIDGGGLILKSDEYNKFITEYPELKDLVKPYMGASELIKGKRRYCFWLKDVDSKRFVNNKLIRERLKIVIEARRKSPTKSVHDHAEEAPYLFSQIRQPDVDYIAVPSPSSGNRKYIPMAILSKNIIASNRLYIIPSTSLWIFSVLMSSVHMAWVNVVTGRLKSDFSYSPAVYANFPWLDFTNEQKAQLNKSAQEILDAREKYPDDSLADLYDPLGMPPELIKAHKENNKLILKMYNLPADSSEADIVAHLFKMYEKLTK
>NC_017472.1|WP_014566315.1|46289_46877_+|recombinase-family-protein
MIYGYARVSTAQQDYATQIDDLKRAGATKIYKDKYTGTTANRPEFDKLMDKLQNGDTLIVTKLDRLARNTQDALSIVKQMNDEGVILRVLNIGTIDNSPSGRLIFTVFSAFAEFERDLIVSRTQEGKAWAKANNPNFHDGMPRKYDQEQINFAWKLHTQDHMSYSEISKKLGMSKATIYRRFRELRDSPNRKSRL
>NC_017472.1|WP_014566319.1|50043_50667_+|NUDIX-hydrolase
MEDKDLLIEWAKRLQSLAQAGLTYGKDDFDLDRYQEIRDISAEMMAYKSDLPLQKVKDLFCNEIGYQTPKLGTRAAIFKDNKILLVQENDGSWSLPGGWCEVNMSVKENCIKEAKEESGLDIEVERVIGIYDQNKHSEAIYPYNVVHVFFLCKPLGGEFKKNIETTTRKYFAYDQLPENLSTDRNSLDEIEACFKAYKDPGFQVECD
>NC_017472.1|WP_014566320.1|50883_51609_+|coenzyme-F420-0:L-glutamate-ligase
MFSNTISTKLWLDFPQITKKCDLAEVIIQFCEKKRDSLKDGDILCIASKIISKSQGLFVDLNTIKPSELALKIHHQVPRKDPRIIQLIINQTKDLSGKRLQISPNFIGGWLPNGLFLTSAGVDRIGEDTAIVLPNNCDEIAKQIAEKIYEKTGKRVAIVITDSDGRIDKKGATQIAVGLYGINGLRKTQSNGKINVETICDMLAASAGLLMGQRGNMVPIVTIRGFEYEFDRDATIKDAVN
>NC_017472.1|WP_014566322.1|52136_52433_+|hypothetical-protein
MIIDTQKLQKAVIENKKNHGFNTTDVKFELLLLYGEVNELFQAWLKDDRDSINEELADVAIFLLGISEMLGSDLGEDIVKKMKINAKRKYIDGKKIEG
>NC_017472.1|WP_014566323.1|52711_54217_+|ABC-F-type-ribosomal-protection-protein
MSNIRISNLSFRYDDSSENIFNKLNLNLDSTWKLGLVGRNGRGKTTFLNLLRRKLHGLGEIQTRLSFSYYPIKVEDQKNITLYELQKQVAFEEWELERELNLMNVNPNLLWQPFNTLSGGEQTKVLLALSFTDKDSFALIDEPTNHLDEDSRKEISNYLGKHEKGYIVVSHDRDFLNQVTDHILAIENMEIHLYQGNFAAYEDTKQKRDEFNREKNQKLKGEIRTLNESRLRLKGYSSKSENQKNAKAHSNEIHAYINKGFYSHKAAKVMQRSKNVERRMNDDIQAKQGLMTNIEDIPELTMNFQPNYHSTLLEAQHLDLQIENITLFKDLNLVVKNHGIVSLEGKNGSGKSTFLKMLLNKTFSVTYQGKYELANGLSISYLPQNFTEYHGTLHNFAYEHKISYEKLLNNLKKMGFPRAGFVTPIEEMSMGQQKRVALAKSLVEPADLYLWDEPANYLDVFNQDQLIELLKKVKPAMLLIEHDEYFIEQVTDHRVRLDIAE
>NC_017472.1|WP_014566327.1|57155_59084_+|tetracycline-resistance-ribosomal-protection-protein-Tet(W)
MKIINIGILAHVDAGKTTLTESLLYASGAISEPGSVEKGTTRTDTMFLERQRGITIQAAVTSFQWHRCKVNIVDTPGHMDFLAEVYRSLAVLDGAILVISAKDGVQAQTRILFHALRKMNIPTVIFINKIDQAGVDLQSVVQSVRDKLSADIIIKQTVSLSPEIVLEENTDIEAWDAVIENNDKLLEKYIAGEPISREKLVREEQRRVQDASLFPVYYGSAKKGLGIQPLMDAVTGLFQPIGEQGSAALCGSVFKVEYTDCGQRRVYLRLYSGTLRLRDTVALAGREKLKITEMRIPSKGEIVRTDTAYPGEIVILPSDSVRLNDVLGDPTRLPRKRWREDPLPMLRTSIAPKTAAQRERLLDALTQLADTDPLLRYEVDSITHEIILSFLGRVQLEVVSALLSEKYKLETVVKEPTVIYMERPLKAASHTIHIEVPPNPFWASIGLSVTPLPLGSGVQYESRVSLGYLNQSFQNAVRDGIRYGLEQGLFGWNVTDCKICFEYGLYYSPVSTPADFRSLAPIVLEQALKESGTQLLEPYLSFTLYAPREYLSRAYHDAPKYCATIETVQVKKDEVVFTGEIPARCIQAYRTDLAFYTNGQSVCLTELKGYQAAVGKPVIQPRRPNSRLDKVRYMFQKIRKSR
>NC_017472.1|WP_014566328.1|59139_60090_+|SLAP-domain-containing-protein
MYIKAANFSSKKTATTTDLGDGYETTMLHNAYIYNSKGKRVRGKKLLKNHDITYYGKVLMIKGKKYVQIGDNQYVRSSNVLLAYDGPISSNSNVNRHATNCSSNNDTSINSNNSTNNSKNNNVVNNTANSQNGSKSSKTNQTNNQSANILRNGNQNNQTNTDVATDTDFEALSLAIQKAEATKYYDATFARAQAYHQAKEAAEVLMVNHKHPYKYQPVITAAEVHAATANVEAAAANLDGDAEYDKMPNVKIERATDGDIKYDWTPAQKQLVLDIANEIHGSTDAHYFDNDRQIGLTDGNGMAHTFNTSYFLHETY

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	NC_017472	Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence	40821-40850	0	1.0
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	NC_017472	Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence	40887-40916	0	1.0
NC_017472_1	1.3\|40953\|31\|NC_017472\|CRISPRCasFinder,CRT	40953-40983	31	NC_017472	Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence	40953-40983	0	1.0
NC_017472_1	1.4\|40891\|26\|NC_017472\|PILER-CR	40891-40916	26	NC_017472	Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence	40891-40916	0	1.0
NC_017472_1	1.5\|40957\|27\|NC_017472\|PILER-CR	40957-40983	27	NC_017472	Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence	40957-40983	0	1.0
NC_017472_1	1.4\|40891\|26\|NC_017472\|PILER-CR	40891-40916	26	MN694558	Marine virus AFVG_250M9, complete genome	10121-10146	3	0.885
NC_017472_1	1.4\|40891\|26\|NC_017472\|PILER-CR	40891-40916	26	MN694640	Marine virus AFVG_250M10, complete genome	10126-10151	3	0.885
NC_017472_1	1.4\|40891\|26\|NC_017472\|PILER-CR	40891-40916	26	MN694392	Marine virus AFVG_250M8, complete genome	29464-29489	3	0.885
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	NZ_CP017256	Clostridium taeniosporum strain 1/k plasmid pCt3, complete sequence	89603-89632	5	0.833
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	NZ_AP018564	Staphylococcus argenteus strain 58113 plasmid p2, complete sequence	15457-15486	6	0.8
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MK250021	Prevotella phage Lak-B2, complete genome	296834-296863	6	0.8
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MK250024	Prevotella phage Lak-B5, complete genome	290856-290885	6	0.8
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MK250028	Prevotella phage Lak-B9, complete genome	295746-295775	6	0.8
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MK250025	Prevotella phage Lak-B6, complete genome	294048-294077	6	0.8
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MK250022	Prevotella phage Lak-B3, complete genome	294063-294092	6	0.8
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MK250020	Prevotella phage Lak-B1, complete genome	295729-295758	6	0.8
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	AP014341	Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S37-C76, * SEQUENCING IN PROGRESS *	11025-11054	7	0.767
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MN693625	Marine virus AFVG_250M334, complete genome	9846-9875	7	0.767
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MN693057	Marine virus AFVG_25M77, complete genome	50720-50749	7	0.767
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	MN694558	Marine virus AFVG_250M9, complete genome	10121-10150	7	0.767
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	MN694392	Marine virus AFVG_250M8, complete genome	29460-29489	7	0.767
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	MN694640	Marine virus AFVG_250M10, complete genome	10126-10155	7	0.767
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	NZ_CP014152	Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence	52873-52902	7	0.767
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	NZ_CP013710	Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence	226483-226512	7	0.767
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	NC_010379	Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence	20263-20292	7	0.767
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	153081-153110	7	0.767
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	NZ_CP010582	Bacillus thuringiensis serovar morrisoni strain BGSC 4AA1 plasmid pBMB51, complete sequence	38695-38724	8	0.733
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	MT074686	Enterococcus faecium strain E1077 plasmid pE1077-217, complete sequence	88154-88183	8	0.733
NC_017472_1	1.1\|40821\|30\|NC_017472\|CRISPRCasFinder,CRT	40821-40850	30	NZ_CP045225	Clostridioides difficile strain TW11 plasmid p_TW11, complete sequence	5101-5130	9	0.7
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	NC_005354	Lactobacillus prophage Lj928, complete genome	38323-38352	9	0.7
NC_017472_1	1.2\|40887\|30\|NC_017472\|CRISPRCasFinder,CRT	40887-40916	30	AY459533	Lactobacillus johnsonii prophage Lj928, complete genome	38323-38352	9	0.7

1. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to NC_017472 (Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence) position: , mismatch: 0, identity: 1.0

ctttaattttatcatcatttggaatatact	CRISPR spacer
ctttaattttatcatcatttggaatatact	Protospacer
******************************

2. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to NC_017472 (Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence) position: , mismatch: 0, identity: 1.0

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
aaaatactgataaatcaatgcttagtttag	Protospacer
******************************

3. spacer 1.3|40953|31|NC_017472|CRISPRCasFinder,CRT matches to NC_017472 (Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence) position: , mismatch: 0, identity: 1.0

taagctcatttctgcatctaatacccgattg	CRISPR spacer
taagctcatttctgcatctaatacccgattg	Protospacer
*******************************

4. spacer 1.4|40891|26|NC_017472|PILER-CR matches to NC_017472 (Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence) position: , mismatch: 0, identity: 1.0

tactgataaatcaatgcttagtttag	CRISPR spacer
tactgataaatcaatgcttagtttag	Protospacer
**************************

5. spacer 1.5|40957|27|NC_017472|PILER-CR matches to NC_017472 (Lactobacillus amylovorus GRL1118 plasmid p2, complete sequence) position: , mismatch: 0, identity: 1.0

ctcatttctgcatctaatacccgattg	CRISPR spacer
ctcatttctgcatctaatacccgattg	Protospacer
***************************

6. spacer 1.4|40891|26|NC_017472|PILER-CR matches to MN694558 (Marine virus AFVG_250M9, complete genome) position: , mismatch: 3, identity: 0.885

tactgataaatcaatgcttagtttag	CRISPR spacer
ttctgataaatcaattctttgtttag	Protospacer
* ************* *** ******

7. spacer 1.4|40891|26|NC_017472|PILER-CR matches to MN694640 (Marine virus AFVG_250M10, complete genome) position: , mismatch: 3, identity: 0.885

tactgataaatcaatgcttagtttag	CRISPR spacer
ttctgataaatcaattctttgtttag	Protospacer
* ************* *** ******

8. spacer 1.4|40891|26|NC_017472|PILER-CR matches to MN694392 (Marine virus AFVG_250M8, complete genome) position: , mismatch: 3, identity: 0.885

tactgataaatcaatgcttagtttag	CRISPR spacer
ttctgataaatcaattctttgtttag	Protospacer
* ************* *** ******

9. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to NZ_CP017256 (Clostridium taeniosporum strain 1/k plasmid pCt3, complete sequence) position: , mismatch: 5, identity: 0.833

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
aatatactcataaatcaatgcttatatttg	Protospacer
** ***** ***************  ** *

10. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to NZ_AP018564 (Staphylococcus argenteus strain 58113 plasmid p2, complete sequence) position: , mismatch: 6, identity: 0.8

ctttaattttatcatcatttggaatatact	CRISPR spacer
cacaatttttattatcatttggaatatatt	Protospacer
* . * ******.***************.*

11. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MK250021 (Prevotella phage Lak-B2, complete genome) position: , mismatch: 6, identity: 0.8

ctttaattttatcatcatttggaatatact	CRISPR spacer
catctattttataatcatatggaatatatt	Protospacer
* *. ******* ***** *********.*

12. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MK250024 (Prevotella phage Lak-B5, complete genome) position: , mismatch: 6, identity: 0.8

ctttaattttatcatcatttggaatatact	CRISPR spacer
catctattttataatcatatggaatatatt	Protospacer
* *. ******* ***** *********.*

13. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MK250028 (Prevotella phage Lak-B9, complete genome) position: , mismatch: 6, identity: 0.8

ctttaattttatcatcatttggaatatact	CRISPR spacer
catctattttataatcatatggaatatatt	Protospacer
* *. ******* ***** *********.*

14. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MK250025 (Prevotella phage Lak-B6, complete genome) position: , mismatch: 6, identity: 0.8

ctttaattttatcatcatttggaatatact	CRISPR spacer
catctattttataatcatatggaatatatt	Protospacer
* *. ******* ***** *********.*

15. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MK250022 (Prevotella phage Lak-B3, complete genome) position: , mismatch: 6, identity: 0.8

ctttaattttatcatcatttggaatatact	CRISPR spacer
catctattttataatcatatggaatatatt	Protospacer
* *. ******* ***** *********.*

16. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MK250020 (Prevotella phage Lak-B1, complete genome) position: , mismatch: 6, identity: 0.8

ctttaattttatcatcatttggaatatact	CRISPR spacer
catctattttataatcatatggaatatatt	Protospacer
* *. ******* ***** *********.*

17. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to AP014341 (Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S37-C76, *** SEQUENCING IN PROGRESS ***) position: , mismatch: 7, identity: 0.767

ctttaattttatcatcatttggaatatact	CRISPR spacer
gttttattttatcatcatttgaaatttttg	Protospacer
 *** ****************.*** * .

18. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MN693625 (Marine virus AFVG_250M334, complete genome) position: , mismatch: 7, identity: 0.767

ctttaattttatcatcatttggaatatact	CRISPR spacer
ttataatattatcatcatttgaaatatcac	Protospacer
.* **** *************.*****  .

19. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MN693057 (Marine virus AFVG_25M77, complete genome) position: , mismatch: 7, identity: 0.767

ctttaattttatcatcatttggaatatact	CRISPR spacer
gaataattttatcaacatttggtatagatt	Protospacer
   *********** ******* *** *.*

20. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to MN694558 (Marine virus AFVG_250M9, complete genome) position: , mismatch: 7, identity: 0.767

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
ttctttctgataaatcaattctttgtttag	Protospacer
    * ************* *** ******

21. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to MN694392 (Marine virus AFVG_250M8, complete genome) position: , mismatch: 7, identity: 0.767

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
ttctttctgataaatcaattctttgtttag	Protospacer
    * ************* *** ******

22. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to MN694640 (Marine virus AFVG_250M10, complete genome) position: , mismatch: 7, identity: 0.767

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
ttctttctgataaatcaattctttgtttag	Protospacer
    * ************* *** ******

23. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 7, identity: 0.767

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
aaaatactcataaatcattgcttctgtaac	Protospacer
******** ******** *****   * *

24. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 7, identity: 0.767

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
aaaatactcataaatcattgcttctgtaac	Protospacer
******** ******** *****   * *

25. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 7, identity: 0.767

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
aaaatactcataaatcattgcttctgtaac	Protospacer
******** ******** *****   * *

26. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 7, identity: 0.767

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
aaaatactcataaatcattgcttctgtaac	Protospacer
******** ******** *****   * *

27. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to NZ_CP010582 (Bacillus thuringiensis serovar morrisoni strain BGSC 4AA1 plasmid pBMB51, complete sequence) position: , mismatch: 8, identity: 0.733

ctttaattttatcatcatttggaatatact	CRISPR spacer
agaaaattttatcatcatttggtatattag	Protospacer
    ****************** ****

28. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to MT074686 (Enterococcus faecium strain E1077 plasmid pE1077-217, complete sequence) position: , mismatch: 8, identity: 0.733

ctttaattttatcatcatttggaatatact	CRISPR spacer
tgattatattatcatcacttggaatatagc	Protospacer
.  * ** *********.********** .

29. spacer 1.1|40821|30|NC_017472|CRISPRCasFinder,CRT matches to NZ_CP045225 (Clostridioides difficile strain TW11 plasmid p_TW11, complete sequence) position: , mismatch: 9, identity: 0.7

ctttaattttatcatcatttggaatatact	CRISPR spacer
aagacattttatcatcatttgcaataatat	Protospacer
     **************** ****   *

30. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to NC_005354 (Lactobacillus prophage Lj928, complete genome) position: , mismatch: 9, identity: 0.7

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
tgaatactgataaatcaatgtttcaagtgt	Protospacer
 .******************.** .  *.

31. spacer 1.2|40887|30|NC_017472|CRISPRCasFinder,CRT matches to AY459533 (Lactobacillus johnsonii prophage Lj928, complete genome) position: , mismatch: 9, identity: 0.7

aaaatactgataaatcaatgcttagtttag	CRISPR spacer
tgaatactgataaatcaatgtttcaagtgt	Protospacer
 .******************.** .  *.

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

0 : 10035

Liberibacter_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014566279.1\|1509_2697_-	SLAP domain-containing protein	NA	NA	NA	NA
WP_014566280.1\|2852_3659_-	hypothetical protein	NA	NA	NA	NA
WP_014566281.1\|3800_3947_-	hypothetical protein	NA	NA	NA	NA
WP_014566282.1\|5459_5990_+	hypothetical protein	NA	NA	NA	NA
WP_014566283.1\|6116_7946_+	N-6 DNA methylase	NA	NA	NA	NA
WP_014566284.1\|7947_10035_+	type I restriction-modification system subunit M	A0A220A2U4	Liberibacter_phage	6.1e-26	26.4

DBSCAN-SWA_2

15085 : 19607

Staphylococcus_prophage(33.33%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_013437050.1\|15085_16120_-\|transposase	IS30 family transposase	Q9MBM9	Staphylococcus_prophage	1.5e-33	31.8
WP_014566288.1\|16286_16589_-	hypothetical protein	NA	NA	NA	NA
WP_014566289.1\|16671_17550_-	ParA family protein	A0A1V0DZZ0	Clostridioides_phage	6.2e-12	27.9
WP_014566290.1\|17777_19607_+	AAA family ATPase	A0A2I7R7D8	Vibrio_phage	1.3e-56	36.2

DBSCAN-SWA_3

43268 : 46877

Leptospira_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014566314.1\|43268_46115_-	methylase	Q6NE04	Leptospira_phage	1.9e-131	33.5
WP_014566315.1\|46289_46877_+	recombinase family protein	A0A0A8WIK3	Clostridium_phage	8.0e-32	39.1

DBSCAN-SWA_4

52711 : 66271

Streptococcus_phage(75.0%)

integrase

attL 48323:48338|attR 75906:75921

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
48323:48338	attL	NA	NA	NA	NA
WP_014566323.1\|52711_54217_+	ABC-F type ribosomal protection protein	A0A1B0RXA0	Streptococcus_phage	4.3e-21	23.9
WP_014566327.1\|57155_59084_+	tetracycline resistance ribosomal protection protein Tet(W)	E4ZFJ7	Streptococcus_phage	0.0e+00	99.8
WP_014566328.1\|59139_60090_+	SLAP domain-containing protein	NA	NA	NA	NA
WP_014566329.1\|60335_61316_-\|integrase	tyrosine-type recombinase/integrase	A0A142F1N9	Bacillus_phage	4.8e-13	25.1
WP_118027589.1\|62888_63188_+	hypothetical protein	NA	NA	NA	NA
WP_014566333.1\|63552_63984_+	CopY/TcrY family copper transport repressor	NA	NA	NA	NA
WP_014566334.1\|64117_66271_+	copper-translocating P-type ATPase	E4ZFI9	Streptococcus_phage	2.7e-61	30.4
75906:75921	attR	NA	NA	NA	NA

DBSCAN-SWA_5

69753 : 70095

Streptococcus_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014566338.1\|69753_70095_+	type II toxin-antitoxin system PemK/MazF family toxin	A0A1S5SEX8	Streptococcus_phage	1.2e-11	43.7

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_017470

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. NC_017472

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection