CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_009446	Dichelobacter nodosus VCS1703A, complete sequence	3 crisprs	cas3f,cas8f,cas5f,cas7f,cas6f,DEDDh,cas14j,DinG,cas3,c2c9_V-U4	5	10	9	1

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_009446_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009446_1

179009-179456

TypeI-F

I-F

Consensus_repeat	Method
GTTCACCGCCGCACAGGCGGCTTAGAAA	PILER-CR
GTTCACCGCCGCACAGGCGGCTTAGAAA	CRISPRCasFinder
GTTCACCGCCGCACAGGCGGCTTAGAAA	CRT

7 spacers

cas6f,cas7f,cas5f,cas8f

The CRISPR arrays of NC_009446_1

>merge|NC_009446|1|179009-179456|PILER-CR,CRISPRCasFinder,CRT
GTTCACCGCCGCACAGGCGGCTTAGAAATATCAAAGAACCAGTCAAGGAACCATGAGTCGGTTCACCGCCGCACAGGCGGCTTAGAAAATTCGCAAACAAAACAGCGAAATTTGGGCGAGGTTCACCGCCGCACAGGCGGCTTAGAAATGTCGAACTAAACGATGACCAGATTTGGTTAAGTTCACCGCCGCACAGGCGGCTTAGAAATATCGCAGCCACAGCGTCGCGCAAGTATTAGCGTTCACCGCCGCACAGGCGGCTTAGAAAGCCGCAACATTTCTGGCTCATTTAAATATAAGGTTCACCGCCGCACAGGCGGCTTAGAAAGTAAACCATCAAAATAACGTCAAATTGGGTTAGTTCACCGCCGCACAGGCGGCTTAGAAAGCTATAGTTATCGAGTCCAGAAAAAATAAAGTGTTCACCGCCGCACAGGCGGCTTAGAAA

>NC_009446|1|1|179009-179456|PILER-CR
GTTCACCGCCGCACAGGCGGCTTAGAAA	TATCAAAGAACCAGTCAAGGAACCATGAGTCG
GTTCACCGCCGCACAGGCGGCTTAGAAA	ATTCGCAAACAAAACAGCGAAATTTGGGCGAG
GTTCACCGCCGCACAGGCGGCTTAGAAA	TGTCGAACTAAACGATGACCAGATTTGGTTAA
GTTCACCGCCGCACAGGCGGCTTAGAAA	TATCGCAGCCACAGCGTCGCGCAAGTATTAGC
GTTCACCGCCGCACAGGCGGCTTAGAAA	GCCGCAACATTTCTGGCTCATTTAAATATAAG
GTTCACCGCCGCACAGGCGGCTTAGAAA	GTAAACCATCAAAATAACGTCAAATTGGGTTA
GTTCACCGCCGCACAGGCGGCTTAGAAA	GCTATAGTTATCGAGTCCAGAAAAAATAAAGT
GTTCACCGCCGCACAGGCGGCTTAGAAA

>NC_009446|1|1|179009-179456|CRISPRCasFinder
GTTCACCGCCGCACAGGCGGCTTAGAAA	TATCAAAGAACCAGTCAAGGAACCATGAGTCG
GTTCACCGCCGCACAGGCGGCTTAGAAA	ATTCGCAAACAAAACAGCGAAATTTGGGCGAG
GTTCACCGCCGCACAGGCGGCTTAGAAA	TGTCGAACTAAACGATGACCAGATTTGGTTAA
GTTCACCGCCGCACAGGCGGCTTAGAAA	TATCGCAGCCACAGCGTCGCGCAAGTATTAGC
GTTCACCGCCGCACAGGCGGCTTAGAAA	GCCGCAACATTTCTGGCTCATTTAAATATAAG
GTTCACCGCCGCACAGGCGGCTTAGAAA	GTAAACCATCAAAATAACGTCAAATTGGGTTA
GTTCACCGCCGCACAGGCGGCTTAGAAA	GCTATAGTTATCGAGTCCAGAAAAAATAAAGT
GTTCACCGCCGCACAGGCGGCTTAGAAA

>NC_009446|1|1|179009-179456|CRT
GTTCACCGCCGCACAGGCGGCTTAGAAA	TATCAAAGAACCAGTCAAGGAACCATGAGTCG
GTTCACCGCCGCACAGGCGGCTTAGAAA	ATTCGCAAACAAAACAGCGAAATTTGGGCGAG
GTTCACCGCCGCACAGGCGGCTTAGAAA	TGTCGAACTAAACGATGACCAGATTTGGTTAA
GTTCACCGCCGCACAGGCGGCTTAGAAA	TATCGCAGCCACAGCGTCGCGCAAGTATTAGC
GTTCACCGCCGCACAGGCGGCTTAGAAA	GCCGCAACATTTCTGGCTCATTTAAATATAAG
GTTCACCGCCGCACAGGCGGCTTAGAAA	GTAAACCATCAAAATAACGTCAAATTGGGTTA
GTTCACCGCCGCACAGGCGGCTTAGAAA	GCTATAGTTATCGAGTCCAGAAAAAATAAAGT
GTTCACCGCCGCACAGGCGGCTTAGAAA

Protein	Signature genes	Signature genes Name	Protein_function
NC_009446.1\|WP_011927916.1\|173632_174712_-\|class-II-fructose-bisphosphate-aldolase	unknown	unknown	gnl\|CDD\|236406
NC_009446.1\|WP_011927919.1\|177208_178219_+\|type-I-F-CRISPR-associated-protein-Csy3	cas7f	cd09677_cas7f_CAS-I-F	gnl\|CDD\|378222
NC_009446.1\|WP_011927922.1\|179836_181435_+\|DUF935-family-protein	unknown	unknown	gnl\|CDD\|368731
NC_009446.1\|WP_011927926.1\|186555_188556_-\|BREX-3-system-phosphatase-PglZ	unknown	unknown	gnl\|CDD\|380291
NC_009446.1\|WP_011927917.1\|174950_176246_+\|type-I-F-CRISPR-associated-protein-Csy1	cas8f	cd09675_cas8f_CAS-I-F	gnl\|CDD\|187806
NC_009446.1\|WP_011927932.1\|199647_200163_-\|BREX-3-system-P-loop-containing-protein-BrxF	unknown	unknown	gnl\|CDD\|380295
NC_009446.1\|WP_011927925.1\|185800_186556_-\|hypothetical-protein	unknown	unknown	unknown
NC_009446.1\|WP_011927931.1\|195919_199651_-\|hypothetical-protein	unknown	unknown	unknown
NC_009446.1\|WP_011927912.1\|167232_168591_+\|sigma-54-dependent-Fis-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225114
NC_009446.1\|WP_011927913.1\|168675_169308_+\|cold-shock-and-DUF1294-domain-containing-protein	unknown	unknown	gnl\|CDD\|377743
NC_009446.1\|WP_011927918.1\|176242_177193_+\|type-I-F-CRISPR-associated-protein-Csy2	cas5f	cd09676_cas5f_CAS-I-F	gnl\|CDD\|187807
NC_009446.1\|WP_135325948.1\|169321_170902_+\|glucose-6-phosphate-isomerase	unknown	unknown	gnl\|CDD\|234679
NC_009446.1\|WP_011927915.1\|171192_173331_-\|UvrD-helicase-domain-containing-protein	unknown	unknown	gnl\|CDD\|236976
NC_009446.1\|WP_081423575.1\|193038_195834_-\|DNA-methylase	unknown	unknown	gnl\|CDD\|334588
NC_009446.1\|WP_041729373.1\|165033_167172_+\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|227333
NC_009446.1\|WP_011927920.1\|178246_178855_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	cas6f	cd09674_cas6f_CAS-I-F	gnl\|CDD\|187805
NC_009446.1\|WP_011927927.1\|188552_191450_-\|DEAD/DEAH-box-helicase	unknown	unknown	gnl\|CDD\|350769
NC_009446.1\|WP_011927924.1\|184933_185782_-\|DUF1837-domain-containing-protein	unknown	unknown	gnl\|CDD\|378078
NC_009446.1\|WP_011927929.1\|191548_193036_-\|hypothetical-protein	unknown	unknown	unknown
NC_009446.1\|WP_011927921.1\|179552_179840_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|375107

Protein	Function_ID	Function_description	E-value
NC_009446.1\|WP_011927916.1\|173632_174712_-\|class-II-fructose-bisphosphate-aldolase	gnl\|CDD\|236406	PRK09197, PRK09197, fructose-bisphosphate aldolase; Provisional.	0
NC_009446.1\|WP_011927919.1\|177208_178219_+\|type-I-F-CRISPR-associated-protein-Csy3	gnl\|CDD\|378222	pfam09615, Cas_Csy3, CRISPR-associated protein (Cas_Csy3). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2463 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy3, for CRISPR/Cas Subtype Ypest protein 3.	0
NC_009446.1\|WP_011927922.1\|179836_181435_+\|DUF935-family-protein	gnl\|CDD\|368731	pfam06074, DUF935, Protein of unknown function (DUF935). This family consists of several bacterial proteins of unknown function as well as the Bacteriophage Mu gp29 protein.	4.58691e-28
NC_009446.1\|WP_011927926.1\|186555_188556_-\|BREX-3-system-phosphatase-PglZ	gnl\|CDD\|380291	NF033449, BREX_PglZ_3, BREX-3 system phosphatase PglZ. BREX is a phage defense system (BacteRiophage EXclusion), with a number of described subtypes. The first described, PGL (phage growth limitation), is not called BREX-2. This model describes one of the two core proteins universal across the first six defined BREX subtypes, the phosphatase-like PglZ domain protein, as found in BREX-3 systems.	0
NC_009446.1\|WP_011927917.1\|174950_176246_+\|type-I-F-CRISPR-associated-protein-Csy1	gnl\|CDD\|187806	cd09675, Csy1_I-F, CRISPR/Cas system-associated protein Csy1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Large proteins; Predicted subunit of the Cascade complex; signature gene for I-F subtype; also known as Csy1 family.	0
NC_009446.1\|WP_011927932.1\|199647_200163_-\|BREX-3-system-P-loop-containing-protein-BrxF	gnl\|CDD\|380295	NF033453, BREX_3_BrxF, BREX-3 system P-loop-containing protein BrxF. This family of proteins that are about 150 amino acids in length includes BrxF from type 3 BREX (bacteriophage exclusion) systems. Most members have the P-loop motif GxxGxGKT, but the region is surprisingly poorly conserved in a sizable fraction of otherwise strongly similar proteins.	7.34761e-79
NC_009446.1\|WP_011927927.1\|188552_191450_-\|DEAD/DEAH-box-helicase	gnl\|CDD\|350769	cd18011, DEXDc_RapA, DEXH-box helicase domain of RapA. In bacteria, RapA is an RNA polymerase (RNAP)-associated SWI2/SNF2 (switch/sucrose non-fermentable) protein that mediates RNAP recycling during transcription. The ATPase activity of RapA is stimulated by its interaction with RNAP and inhibited by its N-terminal domain. The conformational changes of RapA and its interaction with RNAP are essential for RNAP recycling. RapA is part of the DEAD-like helicase superfamily, a diverse family of proteins involved in ATP-dependent RNA or DNA unwinding. This domain contains the ATP-binding region.	2.80429e-66
NC_009446.1\|WP_011927912.1\|167232_168591_+\|sigma-54-dependent-Fis-family-transcriptional-regulator	gnl\|CDD\|225114	COG2204, AtoC, Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains [Signal transduction mechanisms].	2.1424e-127
NC_009446.1\|WP_011927913.1\|168675_169308_+\|cold-shock-and-DUF1294-domain-containing-protein	gnl\|CDD\|377743	pfam06961, DUF1294, Protein of unknown function (DUF1294). This family includes a number of hypothetical bacterial and archaeal proteins of unknown function.	3.64724e-21
NC_009446.1\|WP_011927918.1\|176242_177193_+\|type-I-F-CRISPR-associated-protein-Csy2	gnl\|CDD\|187807	cd09676, Csy2_I-F, CRISPR/Cas system-associated RAMP superfamily protein Csy2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; predicted Cas5 ortholog.	9.8295e-156
NC_009446.1\|WP_135325948.1\|169321_170902_+\|glucose-6-phosphate-isomerase	gnl\|CDD\|234679	PRK00179, pgi, glucose-6-phosphate isomerase; Reviewed.	0
NC_009446.1\|WP_011927915.1\|171192_173331_-\|UvrD-helicase-domain-containing-protein	gnl\|CDD\|236976	PRK11773, uvrD, DNA-dependent helicase II; Provisional.	0
NC_009446.1\|WP_081423575.1\|193038_195834_-\|DNA-methylase	gnl\|CDD\|334588	pfam01555, N6_N4_Mtase, DNA methylase. Members of this family are DNA methylases. The family contains both N-4 cytosine-specific DNA methylases and N-6 Adenine-specific DNA methylases.	6.57991e-07
NC_009446.1\|WP_041729373.1\|165033_167172_+\|HAMP-domain-containing-protein	gnl\|CDD\|227333	COG5000, NtrY, Signal transduction histidine kinase involved in nitrogen fixation and metabolism regulation [Signal transduction mechanisms].	1.48577e-109
NC_009446.1\|WP_011927920.1\|178246_178855_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	gnl\|CDD\|187805	cd09674, Cas6_I-F, CRISPR/Cas system-associated RAMP superfamily protein Cas6f. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas6f is an endoribonuclease that generates crRNA; This family is specific for CRISPR/Cas system I-F subtype; Possesses RRM fold; also known as Csy4 family.	1.24652e-85
NC_009446.1\|WP_011927924.1\|184933_185782_-\|DUF1837-domain-containing-protein	gnl\|CDD\|378078	pfam08878, DUF1837, Domain of unknown function (DUF1837). This family of proteins are functionally uncharacterized.	6.8122e-06
NC_009446.1\|WP_011927921.1\|179552_179840_+\|hypothetical-protein	gnl\|CDD\|375107	pfam17288, Terminase_3C, Terminase RNAseH like domain.	1.60884e-07

>NC_009446.1|WP_011927920.1|178246_178855_+|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4
MNFYQEITLLPDAEVSLYFLWSKVYGQLHIALADVRNRYGIDTIGVNFPHYVYEEQNHKVVAARLGDQLRIFALAENDLEKLQINQWLERLSDYVHIKRISKIEPNKVTGYVVVKRYRYPSLDKVALRFAQFRKINFEEARKHCTKYKHQAKNYPFIMLKSQSNQEYYKLSIRQENAQESVSGRFNVYGINSATGIVTVPNW
>NC_009446.1|WP_011927919.1|177208_178219_+|type-I-F-CRISPR-associated-protein-Csy3
MSNKRESSEQKLKTPSLLSFARSIDISDAFFWQTNSKDAKHNRSIVTVQEKSVRGTISNRLKNTSTSDIAKIDAKIEEANLQRVDASSLDEDKDILLVHFTCKILPFTAEPCVCNDQAYQEKLQTVMSKYIEEQGFKELARRYAINIANARWLWRNRVGAESILVTVTLNEKESLTFDACSFELRHFNCHNKQLDQLAQWIESGFKGEFILLSVEARVKIGYGQEVYPSQELILDGKSKKSKVLYLVGDGSDNHAGMHSQKISNAIRTIDDWYPEAEFPIAVEPYGAVTTLGKAFRHPKDKKDFYNLFDNWILKDQVPEVNDQHYVAAVLIRGGVF
>NC_009446.1|WP_011927918.1|176242_177193_+|type-I-F-CRISPR-associated-protein-Csy2
MSSIESFIYPDLKRVGFLLIKRLEVINANALSSPLTYGFPAITAFTGAVHALSRKINRSEALADIFLDGVLIAAHSCQPQTYREYFNKPFTFIQSRHPVEKTGDTAPIIQEGYCHLTVSLLIGVYAKDGYLSEEQIEALKKQLFIAIQQQPLAGGNVIGLDAQEPIQFYKDDVDQCVSELLPAFVLIDAHKELTAITQELQKDNPAATALDALIETASLHHIPSDEQENNWEIYSVKKGRGWLVPIPIGYQGISPQYDAGVMKNARNPHYPSQYVEALYSLGKWVFPYSIDLIDNAMWYQKYDAEKDLYLVTHLME
>NC_009446.1|WP_011927917.1|174950_176246_+|type-I-F-CRISPR-associated-protein-Csy1
MKSISEITTEELKNAIRAFLSAECEKKTKDSSDIEKMKKYRPDIWLQDAQKKAERFKVGTHISKGIHSQSQGDNVYFSQKVDHDYVNTKTVTNNYLDGGGAASDFPLASFFEWEVITGSGIKMRDVIWENGAAVQRCFADDPELSQTYQQTFLTCLQAQPQNPQTDALNKQLLWALPQTDDNRDNYLVLVPLHPSVLTHEFYHKIEAINNNRFDVKSKSVPQKRYADLLDLAQIKLGGSKPQNISVLTSKQRGINYLLPSLPPVFRARQDIHFSPKLESIFFSKSLYYRVEDDLKILFGVIYCKENNYEIRNMRKAAVHRIAHQILSIGETICALRPAGWSKDYDLSSAQKYWLDPKRADLAGEEKFKAERDAADWDKAIEKDFANWLQKVLEERFKKHRHEFTDIEHYEWQREMKAVIKESFRLNKRGLL
>NC_009446.1|WP_011927916.1|173632_174712_-|class-II-fructose-bisphosphate-aldolase
MTKILDSIKAGVVTGDDVQKIFSIAKQNNFALPAMNCVGTNSVNAALETAARVRAPLIIQFSNGGAAFFAGKGLKPVDGQRPDVLGAIAAAQHIHTLAAAYGVPVILHTDHCAKKLLPWLDGLLDAGEAFYQQHGKPLFSSHMLDLSEEPLKENIEICQRYLERMAKIDMTLEIELGCTGGEEDGVDNTGVDNAMLYTQPEDVAFAYQELRKISPRFTIAAAFGNVHGVYKPGNVKLTPKILDNSQKYVSQKFGLPEKSLDFVFHGGSGSSLSDIREAISYGVVKMNIDTDTQWAAWEGVLEFYRKNEAYLQGQLGNPEGEDKPNKKFYDPRAWLRQSENFISQRLEQAFDDLNCRDVL
>NC_009446.1|WP_011927915.1|171192_173331_-|UvrD-helicase-domain-containing-protein
MNIDTILSGLNAAQRDAVTTKERIVRVIAGAGSGKTRVLVQRMQWLMTVAGCMPYQLLALTFTNKAAQEMRQRLEQSAACSLNQLWMGTFHSICLRILRQYAELVGWEKSFIVIDSDDQLRLIKRLLQKNNWNEEILSAKAVQAQINAYKENGLRAADLPTSAPPLEIAVHHFYQEYEHITRQQGTMDFAELLLLTTELLAQHETVQQRFHQRFQAILIDEFQDTNTLQFKLVTQLCAPETQLFVVGDDDQSIYGWRGAQIDHIVHLERYYPTVHTIRLEQNYRSTKTILAAANAVIAHNQTRLGKTLWSDGKHGEAIALYAAVNEYDEARYLVENIAQFHQHGGAYDQCAILYRSNALSRIYEEALIQKNIPYRIYGGLRFFERAEIKDALAYLRLLHYPDDDAALERIINQPPRGIGAKTMEDVRLLAQRVQCSLWRVITDDALLEQKCSARAQNALRQFRALIIKMTAFAERSDSLRDILKMVVDESGLYAALTNNNQEETENRRENLHELIAAGDYQSDQNDADHDKIADFLAMASLDAGDKETNAHGVQLMTLHSAKGLEFNRVYMVALEEGLFPNARSLENSAQLEEERRLAYVGITRAREQLTMSFAERRRYYGQDNYARPSRFLNEIPPELLNMVRPVLFNRTQPNDIQEDNPWKTGVCVQHAQFGTGVIQAVEGSGEHQRALVKFTTVGEKWLVLAYAKLKIL
>NC_009446.1|WP_135325948.1|169321_170902_+|glucose-6-phosphate-isomerase
MMNNIFSQLSHHAEQLKRQTLNQLFVEDPKRVEKWQWQVAGIRVDLSKNHIDDAGRILWFSWLKQQQTSAHIKAMLSGEKVNYSEHRPALHHALRARAEGSFIVDCTDIYAEIRKTRAQIRDLTAAIRQGTLRGFSGKAIEDVVHIGIGGSELGPRLLCESFVHRSDRVRIHFLASPDPIHIQSLQQRLNPETTLLIIASKTFTTEETLANAHLMRHWLHAAGGQKADEQMIALTAAIDKAHEFGISSAHILPFWDWVGGRFSLWSAIALPFALQNGYDAYEQLLSGAREMDQHFQSTPEEHNLPMHLALIDAWYNHYFAIDNRAIVTYAQPLNSFVPYLQQLEMESLGKRANQQGAALIKPSGMIIWGGSGTESQHAFFQLIHQGQRRIPLDFITVKSVPNGYEAAGTIVHGNCLAQAEALMCGRTLEDLKDLPLEERYQRTCAGNHPSNMVILDELTPFHLGALIALYEHKTTVLGTLYDVNAFDQWGVELGKVLAKKTEASLRGECTVDNPSTRALIDYLRQK
>NC_009446.1|WP_011927913.1|168675_169308_+|cold-shock-and-DUF1294-domain-containing-protein
MSVRPKHNEICTGTVVYWNDDKGFGFIDTNEKQANVFFHISHFAYENRRPQRGDKVSFLRSPEQTSGKPSAKRVVIQGHEKTLLSRNVHEQQIQHPHFVEGCIYVLNDILFFLVLATISPIIAITSAIISVMTVSLYSYDKYAAIHDHQRVPEASLHIAALLGGWPGALIARAFLRHKTKKIRFVLFFWMSIFVNIAMIYGLVWVLYFSN
>NC_009446.1|WP_011927912.1|167232_168591_+|sigma-54-dependent-Fis-family-transcriptional-regulator
MNKNTASTILIVDDETMICETLVDILTDEGYQTYTAGSAAQARTAKQMYHPDLILLDIWMPDSDGITLLREWTSQQLNASVIMMSGHGTIETAVEATKLGAYDFLEKPLSTAKLLITIKRALQTQALIAQNAALKAQLDPNIEIIGRSQAMNEVRELASNLAKQNVPVLISGNAGSGKQHVAHFIHQNSAFCDATFITANIAAMETHDITAALIGSKHHTGLLAAADGGTLFIDEISQLPKDGQRLLLGLIEEQAYLPANQHIRCTTHIRVIAATRLPPLLLKEHLDPALFDLLMVATIILPDLQDHSSDVPELLEYFSKYFADFEQMPYRHFSLAAQNTLRQHCWTGNVRELKNLVQRLLIQNDAAEISAEEAEQALTPTEISPQDGLWSQIIPKDLSLREARELFEHQYLLEQFRHCDGNIARLANRIGMERSNLYRKLRNLGIDPTDKP
>NC_009446.1|WP_041729373.1|165033_167172_+|HAMP-domain-containing-protein
MKLNIRHMIRTMALGVLTIIASLIAIYQLTQAATRPEDANPYYIHFLIITLIGLALIFSLALWRIYALIRHLRRQHSGARLSLSFALRMLLAALFPLGIIGAFSWSFLSSDLGMIFNRRVTIALEDALQLTRSAISWRANQAIMQTRQLAHFMTTMRYIDLVSEIELLRRANHAIELAQFDHQGNLVAFAHQDLTVMTVAPPDAATLSRVNEEQEFFEFSAESDDTYSIRVLSKMIKPDSEVFYLRAIYAMPTEFNTLANSVRENYQQHLSYSYLQPHITTSLLLVFGLIIALTVLSALWLSTLFGETMARPVRQLIEATRKVAGGDFSTPVTVIHNNDLGVLSNHFNMMMSALRAAEETNSLIQSQLSEQNTFLSTLLDNITAGVMTLDHLGQLQVYNHAAPQLLDCDLLPYLGKVPPAEECAVDSYGEFMAAIARCSDKEEWHQEVVLAKFSQRKIVISHGRRLPAPQQNGHGYIIVFEDVTEFQQNQRNAAWEEVARRLAHEIKNPLTPIRLQTERLQRKLTDKLTDEYDRHILQRATETIINQVDAMLQLVSDFSQYAKPIELRRQRLDINALLQDIANLYHHYDLELQLAPDVPPLLADPIQLRQVMINLTNNALEASKNGEKTMICWTTSYENGLIKVSVEDNGSGFADLSKDPFEPYVTTKPKGTGLGLAIVKKIITEHQGSIQAGPSKQLNGAKITFILPLSSE
>NC_009446.1|WP_011927921.1|179552_179840_+|hypothetical-protein
MRAAGKWQGSIEDGVSFLRGLDDIVIAPRCAHTLEEAQLWRYKTDRLTGDPLPELDDAHDHCWDAIRYALSDVIRGGYQGNSIIAGAARAFRRGR
>NC_009446.1|WP_011927922.1|179836_181435_+|DUF935-family-protein
MNDKVDKQASAATSAQALYTDPVFTLTNEDADKVLKNAGLSRSDLGKLLYDDEIFACCDRREKAVVGTRWRIEGDNTDWLHAEISRWHETLVRRTMDAQWIGSSISELIWRRPEEDHNGIRLAAVEPRKIERFINQDGVLRYQTQSGSYIDVEPLKVLEVRMNASAANPYGDALLSRVYWAWFNKNYGEQFWSKYAERHASPLTVGKFNPRTNNQAEAQRHLNDLAITLAQAISDGVIVITQDDEISFVNATSDGSAHQLFTRHHIQRIQKTIIGRVLTSELAGGSRAAQETDDNFSQILFDYDLTLCERVINEFIAKVLRLNGTARGDILFAYDRTESIDKERWERDTALMDRGMRFTEQYFIDQYHLEPIYFSLEQIERAARSERAANAAQKAGLSLSKKQELTPAAQALEDRVQAGMAEAPEPITREMIEDVVKNAPNDYQLLEDLVKLYGDRDPEGFNDWFGEALEIACAHGYHDADLPQNSLKARSPRNFLIINEEVISHNHFPQTRPEKRFSPLISRHRTRVTGLQ
>NC_009446.1|WP_011927924.1|184933_185782_-|DUF1837-domain-containing-protein
MPWTSEHTKWLIDTGERLKTADGKEVEVWEFRHEKDEAVLSAWAKHFRNHYCLDAEIDFLRGKRPRPDYLDNIKFPCKTSKLGPGIRAGDFGEILVSDYLQWLLGYWVPRVRWSSKVVRDESPKGSDVIGFRFHKKDGDASTKDVLFVFESKTKFSASKINRLQDAINDSAKDHIRIDESLNFIKQKLFEKKEIEQAQRIERFQSPVDMPYKETYGAAAIISDECFDADELASADCQKIPKSAKSKEVFPHPNGDSLVLLVIKGPGMMDLVHELYRRAADEA
>NC_009446.1|WP_011927925.1|185800_186556_-|hypothetical-protein
MGKRHEAIGIKQAIRFEWMQKAANLLLAGLDAKTIRQELHEFLADRKGNGSEGERSDQTRTFVVNNLMKIWVSPDPELIPFRDASLAFLRENPSMALAVHWGMISAVYPFWFNVARQTGRLLALQDQVTQTQIINRLKEQYGDRQTVSRYARFVIRSFVAWGALKDSEAKGCYEKAAPVSIAEPNLAILMFESALLATPEAKGALGLLLNNPAFFPFQLPVMTGDFVSQRSDRIDVVRYGLDDELLKLKGN
>NC_009446.1|WP_011927926.1|186555_188556_-|BREX-3-system-phosphatase-PglZ
MSSWRDAILNDFVPNVSKLTLVADPDCLLTEEKLALELRGRGFDLIEFSDPVEFRYAYESKYLSIWDRGEHTDLVVVLRLQDAELESLPYDLLQAGRKLSFNLGDLFPNLSYPVIEKLDRSLLDSLFEAQRKSPSDRMGDNATKDFILRHVFGIAAELIGGEVELLRALLRLHYGKLQIPQMLAEQLIQVLKGHDGLKAWPLSEIVPDDEAFFAFLQERWPLFLSRLGSAHQVREDSPEYGLKYPGPDRLPFDHQDIKVYIDNLFLEGKLTPVEAKGIEVDAGSWVRSGITTSGVDDDELRISRLFGLIEKELPTAEARYSNSNWTAFALKWAELSSLVHCGNSTEYQTRLREIGDALNTIFAAWLADHYSSLINLPPTNPAMLHHVPRRLARDIEDSGSSRAALIVVDGLALDQWVTIRQLLQKQDANLVMRESATFAWIPTLTSVSRQSIFSGKPPLYFPSSINSTNSEEKLWKQFWEGHGLSRLDVAYQRGLGDGDAAGVLDSAIHPGKTKVVGLVVDKVDKIMHGMQLGSAGMHNQIKQWCHAGFLSAMVGQLLDYGYEVWLTADHGNIQCEGKGRPSEGVIAETRGERVRVYPTPELRAQVAGAFPFAHEWQPVGLPADYFPLVAGGRDAFVNPGDSIVGHGGVAIEEVIVPLVKFERRTR
>NC_009446.1|WP_011927927.1|188552_191450_-|DEAD/DEAH-box-helicase
MESLWQYSTVHNSACKVIEEQTLWGQTVCRVWLPNQDAVVRVPRSALRPLNADLQPEIEAGRIAYVAAAAKVAEVLEGSTSATEGYVLLAPMESNVIPLPHQIHALSRAISGDRVRYLLADEVGLGKTIEAGLVMRELKLRGLVRRTLVVSPKGIATQWVAEMQTHFNEQFQLVLGDDIGTLQRLAPGADHRSSAWSMFDQVIVSLDSVKPMDKRRGWTAERVAEYNRSRFEDLITAGWDLVIVDEAHRLGGSTDQVARYKLGKGLAEAAPYVLLLSATPHQGKTDAFHRLMNLLDDDAFPDMDSVSRERVASYVIRTEKRKAIDADGKPLFKPRRTQMAPVAWESRHQLQQLLYEAVTDYVREGYNQALREKKRHIGFLMILMQRLVVSSTRAIRTTLERRLAALKDGEQQASLRLAELENGADGLESPDDEIAELYDMDGQELLDELLKSHVSALQSEGSHVETLLDAAVRCEQAGPDAKAEALIEWIYKLQAEENEPDLKVLIFTEFVPTQQMLKEFLEARGISVVTLNGSMAMEERGAAQDAFRKSHRVLVSTDAGGEGLNLQFAHVIINYDIPWNPMRLEQRIGRVDRIGQPKTVQAINFVFEDSVEFRVREVLEQKLSVIFDEFGIDKTGDVLDSAQAGELFEDVFASAILNPDGIETSVDHTVARIRDEIQQVRESSAIYGISEEPDVQTAERLRSHPLPHWVERMTVGYLNSHGGAASRKRSWWDLNWPDGQEHRKAVFSAREADRLTDATLLNLENSRIRGLALNLPQVAAGQPLPCVTVSGLPASISGLWGLFEIRLQAGMHQKTQLLRIPMVRRGYVSVFLSEEGKLFLPTARHIWDALQTAEAEVQATLGQDDSITAHERLQIAAEQAGQELFDALQQAHLASVNREEERGMVAFTSRRKAIERVGLPEVRQYRLARCAAEENEWRHELQSARQIVPEIRSLLMLRIIKGGAQ
>NC_009446.1|WP_011927929.1|191548_193036_-|hypothetical-protein
MTAPVDLSHYADNILAAEDRPLFDDAVEAGKAGALRAAYVMIWLACAESLKRRFREAQKRDGAAGKIVGEIETKEKEHKAVDKFVLMKAHEYGFVSDSGHTVLNHIYEMRCLYGHPYEEAPSQEQVSHAAAVVVEHVLSKPVKLRHGFGKQLLKSLLEEPNFLDDQQTAVVAFTKDILPRLDESIHGWLLDNYWEELEKFSDDSSMAIFFRRGTWFSRTMLTEVGIDVFSHDDWHDRSSRFPKILMRVCSIADIFKEIGKRAQDSLVGLIIAESATRASVLTHLERLSINGALTMRQQERFVEHVSEMPSSAIRSAGLSTKTCYGKLIDAMKFHDWYVQNPAIDLIVSNGPDQAAELDENQQVNLGRNLLQAGEGTAGSANEFLEKLSQDGTSWPFHVVRGIAMESFTNEDNLIRFKDRHLGRVLSAIDHLQQELQDQLIAEISASVDAGIPKDRVDRDDFENTVDSLKVYPWAAPLVTSLEAKVASLSAEEEDA
>NC_009446.1|WP_081423575.1|193038_195834_-|DNA-methylase
MKMKETSLFDSLLEEPQKPSGPVTCLGMTFENDEARRAHFIEELRKKLQDPEFRKIEGFPIGSDEDILNLSDPPYYTACPNPWIADFIAEWDEQKPKQPEGHHYHREPFAADVSEGKNDPIYNAHSYHTKVPHKAIMRYILHYTQPGDIVFDGFCGTGMTGVAAQMCGDREVVMSLGYQVKSDGTILQEEIDENGKKVWKQFSKLGSRRAVLNDLSPAATFIAYNYNTPVDVAAFEKEAKHILKEVEKECGWMYETLHTDGKTKGKINYTVWSDVFLCPECTKEVVFWDVAVEKGKGIVHDKFPCPHCGSLLLKRSLKRAWETVFDEAFGDTIRQAKQTPVLINYTAGGKRAEKIPDPSDIALIEKINNSHIPYWFPVAELQDGFNTRQPKGSHGITHTHHFYTRRNLWILASLWSKASPKMRFGLTNFLSRNLTKMNRFVVNRHNPNGRINGPMTGTLYIPSEQVEQTATLLFKDKWIKHGWNTCGNLITTQSFSSIEASVTNSLDYIFIDPPFGANINYSELNSLWESWLSVKTDQKPEAVENDVQNKSLNDYRDLMLGCFRKAYELLKPGRWMTVEFSNTRAAVWNNIQTSIADAGFIVANVSVLDKKHGGIKAMAYSTAVKQDLVISAYKPNGGFEERFQKEAQTEEGIWDFVRTHLKYLPVTKQQGALLQFVPERDPRILFDQMVAYFVRKGYPVPISSQEFQIGLAQRFIERDGMFFLPDQVAEYDRKKMTSGELKQMSMFVSDEASAIQWLRQLIKEKPQTFSDINPQFMQQLGGWSKNEAQLDLRELLNQNFLSYDGKGPVPEQIHAYLSTNWKELRNLPKDDPTLVAKARDRWYVPDPNKAGDLEKLREKALLKEFEEYKAAKKKLKVFRQEAVRAGFKKAWQERDYTVIVAVADKIPNNVLEEDPKLLMWYDQAVTRMGGE
>NC_009446.1|WP_011927931.1|195919_199651_-|hypothetical-protein
MKYGDLIQFDPIESVVQLRDADKSSAAHTLVNTYVISEEMAERLIQLVIPQMQFDQPVDNKGLLVVGNYGTGKSHLMSVVSSLAADASLLEGLKGEGVRDAASQIAGRFKVIRTEIGATTMSLRDILVAELEEHLEKLGVEYVFPEAGTISSHKRAFEDMMAKFGEVFPEHGLLLVVDELLDYLRTRKDQELILDLNFLREVGEVCKDLRFRFMAGVQEAIFDSPRFAFVADSIRRVKDRFEQILIARSDVKFVVAERLLKKTTEQQAKIHDYLMPFAKYYGGLNERMDEFVRLFPVHPDYIDTFERVTVVEKREVLKTLSMGMKSILGKDVPQDEPGLIAFDSYWGTLKQNASFRAIPEIRAVIDCSQVLESRIENAITRKQYKPMALRLIHALSVHRLTTGDIYAPMGASAEELRDRLCLFDPLIAELGSDEPDKDLQTHVETVLREIHKTVSGQFISFNADNRQFYLDLKKTDDFDALIDKRAESLGQAQLDRFYYEALKRVMECQDATYVTGYKIWQHELVWQEHKAARTGYLFFGAPNERSTAVPQRDFYLYFVQPNDPPRFKDDRVNDEVFFRLKGTDEEFQTALKSYAAALDLAATSSGHAKATYESKANGFLKKLVQWLQKHMSGAFEVTYQGRTKTMTEWAKGKSIRDLSGISPHETINFRDLVNTIAGVCLAPNFENQAPDYPFFSILITSNNRAQAAQDALRAIAGQNRTKQATAVLDALELLDGEKIDPYKSKYTKFILDTVKAKGHGQVVNRSEIIQDDHGLEYMNPCGSRLEPEWVAVILASLVYSGDIVLAIPGKKFDATGLQQLAATGMDELVRFKHLEQPKEWNLPALKALFELLGMTPGMAQLVTQGKDEPVQNLQQAVGKIVKRIVMTQQTLREGLSFWGLDLLAGTDLASQASGLDEAKGFFESLQAYSSPGKLKNFRYSAPEVLAHEKAVKALDELDALREFIMDHSPTASWLSTAEAVLPAEHDWVDRMKTTRQDVLDALKQADLTELASQSQSIGAKLQKLKKDYTVAYIGLHTKARLGVNDDKRKAGLLNDQRLQTLLKLAGIDLMPRQQLTDYQNRLAGLKSCFALTEQNLDASPICPHCGFRPSVETGTAAGSQMIDQMDAQLDAMVTAWTSTILSNLEDPITQANMDLLKIDDREPLEAFIKSKELPVPLDSNFVHALKEVLSGLVKVTVKAQELQQALQVTDGPATPAEMKKRFEEYIDQLTKGKDPAKVRIVME
>NC_009446.1|WP_011927932.1|199647_200163_-|BREX-3-system-P-loop-containing-protein-BrxF
MAEPIHDKIKRSLQAAEGLYHRLVLLVGETGSGKTGVLRDIAEEFGSSVVNVNLALSGELLELTAKQRSLRLPGILDQIADQAQAPVVMDNLEILFDKDLQQDPLRLLQSISRNRAVVASWNGIMNSGRLLYAETGHPEYRSYDSVDALIVGMDGTATVDSAKNNREAGQA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009446_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009446_2

315538-315799

Orphan

Consensus_repeat	Method
TTTTCTTCATTGCAATCACAGG	PILER-CR

5 spacers

DEDDh

The CRISPR arrays of NC_009446_2

>merge|NC_009446|2|315538-315799|PILER-CR
TTTTCTTCATCGCAATCGCAGGAATCTCCACAACTACAATCTTTATCTTTTTCTTCATTGCAATCACAAGCATGTTCGCCGATGCAACCGCAGTTATTTTCTTCATCGCAATCGCAGGAATCTCCACAACTACAATCTTTATCTTTTTCTTCATTGCAATCACAAGCATGTTCGCCGACGCAACCACAGTTGTTTTCTTCATTGCAATCGCAGGAATCTCCACAACTACAATCTTTATCTTTTTCTTCATTGCAATCACAGG

>NC_009446|2|2|315538-315799|PILER-CR
TTTTCTTCATCGCAATCGCAGG	AATCTCCACAACTACAATCTTTATCT
TTTTCTTCATTGCAATCACAAG	CATGTTCGCCGATGCAACCGCAGTTA
TTTTCTTCATCGCAATCGCAGG	AATCTCCACAACTACAATCTTTATCT
TTTTCTTCATTGCAATCACAAG	CATGTTCGCCGACGCAACCACAGTTG
TTTTCTTCATTGCAATCGCAGG	AATCTCCACAACTACAATCTTTATCT
TTTTCTTCATTGCAATCACAGG

Protein	Signature genes	Signature genes Name	Protein_function
NC_009446.1\|WP_012030647.1\|323152_323347_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|225391
NC_009446.1\|WP_012030642.1\|316078_316834_-\|uroporphyrinogen-III-synthase	unknown	unknown	gnl\|CDD\|119440
NC_009446.1\|WP_012030643.1\|316817_317735_-\|hydroxymethylbilane-synthase	unknown	unknown	gnl\|CDD\|234612
NC_009446.1\|WP_081423580.1\|311197_311815_+\|bifunctional-tRNA-pseudouridine(32)-synthase/ribosomal-large-subunit-pseudouridine-synthase-RluA	unknown	unknown	gnl\|CDD\|223638
NC_009446.1\|WP_012030637.1\|310193_311189_+\|NAD(P)-dependent-glycerol-3-phosphate-dehydrogenase	unknown	unknown	gnl\|CDD\|234629
NC_009446.1\|WP_012030635.1\|308838_309642_+\|undecaprenyl-diphosphate-phosphatase	unknown	unknown	gnl\|CDD\|234712
NC_009446.1\|WP_012030649.1\|324063_325887_+\|excinuclease-ABC-subunit-UvrC	unknown	unknown	gnl\|CDD\|234792
NC_009446.1\|WP_012030648.1\|323336_324071_+\|3-deoxy-manno-octulosonate-cytidylyltransferase	unknown	unknown	gnl\|CDD\|235473
NC_009446.1\|WP_012030632.1\|306279_307332_-\|recombinase-RecA	unknown	unknown	gnl\|CDD\|236476
NC_009446.1\|WP_012030650.1\|325888_326446_+\|CDP-diacylglycerol--glycerol-3-phosphate-3-phosphatidyltransferase	unknown	unknown	gnl\|CDD\|182763
NC_009446.1\|WP_012030646.1\|319458_323160_+\|transaldolase	unknown	unknown	gnl\|CDD\|236766
NC_009446.1\|WP_012030639.1\|311825_312887_-\|AI-2E-family-transporter	unknown	unknown	gnl\|CDD\|223701
NC_009446.1\|WP_012030634.1\|308125_308689_-\|D-sedoheptulose-7-phosphate-isomerase	unknown	unknown	gnl\|CDD\|184408
NC_009446.1\|WP_012030651.1\|326455_327076_+\|ribonuclease-T	DEDDh	cd06127_DEDDh_CAS-I	gnl\|CDD\|179951
NC_009446.1\|WP_148188629.1\|307391_307976_-\|tetratricopeptide-repeat-protein	unknown	unknown	gnl\|CDD\|274350
NC_009446.1\|WP_012030640.1\|312987_314325_-\|HemY-protein	unknown	unknown	gnl\|CDD\|273126
NC_009446.1\|WP_012030644.1\|317879_318254_+\|lipoprotein	unknown	unknown	gnl\|CDD\|182532
NC_009446.1\|WP_012030645.1\|318305_319091_-\|cell-division-protein-ZapD	unknown	unknown	gnl\|CDD\|377767
NC_009446.1\|WP_012030636.1\|309720_310194_+\|protein-export-chaperone-SecB	unknown	unknown	gnl\|CDD\|376817
NC_009446.1\|WP_041729409.1\|305816_306293_-\|regulatory-protein-RecX	unknown	unknown	gnl\|CDD\|234646

Protein	Function_ID	Function_description	E-value
NC_009446.1\|WP_012030647.1\|323152_323347_+\|hypothetical-protein	gnl\|CDD\|225391	COG2835, COG2835, Uncharacterized conserved protein [Function unknown].	1.13715e-05
NC_009446.1\|WP_012030642.1\|316078_316834_-\|uroporphyrinogen-III-synthase	gnl\|CDD\|119440	cd06578, HemD, Uroporphyrinogen-III synthase (HemD) catalyzes the asymmetrical cyclization of tetrapyrrole (linear) to uroporphyrinogen-III, the fourth step in the biosynthesis of heme. This ubiquitous enzyme is present in eukaryotes, bacteria and archaea. Mutations in the human uroporphyrinogen-III synthase gene cause congenital erythropoietic porphyria, a recessive inborn error of metabolism also known as Gunther disease.	4.97742e-34
NC_009446.1\|WP_012030643.1\|316817_317735_-\|hydroxymethylbilane-synthase	gnl\|CDD\|234612	PRK00072, hemC, porphobilinogen deaminase; Reviewed.	1.76237e-154
NC_009446.1\|WP_081423580.1\|311197_311815_+\|bifunctional-tRNA-pseudouridine(32)-synthase/ribosomal-large-subunit-pseudouridine-synthase-RluA	gnl\|CDD\|223638	COG0564, RluA, Pseudouridylate synthases, 23S RNA-specific [Translation, ribosomal structure and biogenesis].	1.9943e-67
NC_009446.1\|WP_012030637.1\|310193_311189_+\|NAD(P)-dependent-glycerol-3-phosphate-dehydrogenase	gnl\|CDD\|234629	PRK00094, gpsA, NAD(P)H-dependent glycerol-3-phosphate dehydrogenase.	7.27734e-155
NC_009446.1\|WP_012030635.1\|308838_309642_+\|undecaprenyl-diphosphate-phosphatase	gnl\|CDD\|234712	PRK00281, PRK00281, undecaprenyl-diphosphate phosphatase.	1.19767e-84
NC_009446.1\|WP_012030649.1\|324063_325887_+\|excinuclease-ABC-subunit-UvrC	gnl\|CDD\|234792	PRK00558, uvrC, excinuclease ABC subunit UvrC.	0
NC_009446.1\|WP_012030648.1\|323336_324071_+\|3-deoxy-manno-octulosonate-cytidylyltransferase	gnl\|CDD\|235473	PRK05450, PRK05450, 3-deoxy-manno-octulosonate cytidylyltransferase; Provisional.	1.53815e-117
NC_009446.1\|WP_012030632.1\|306279_307332_-\|recombinase-RecA	gnl\|CDD\|236476	PRK09354, recA, recombinase A; Provisional.	0
NC_009446.1\|WP_012030650.1\|325888_326446_+\|CDP-diacylglycerol--glycerol-3-phosphate-3-phosphatidyltransferase	gnl\|CDD\|182763	PRK10832, PRK10832, CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase.	9.80478e-41
NC_009446.1\|WP_012030646.1\|319458_323160_+\|transaldolase	gnl\|CDD\|236766	PRK10811, rne, ribonuclease E; Reviewed.	0
NC_009446.1\|WP_012030639.1\|311825_312887_-\|AI-2E-family-transporter	gnl\|CDD\|223701	COG0628, yhhT, Predicted permease, member of the PurR regulon [General function prediction only].	1.31588e-47
NC_009446.1\|WP_012030634.1\|308125_308689_-\|D-sedoheptulose-7-phosphate-isomerase	gnl\|CDD\|184408	PRK13937, PRK13937, phosphoheptose isomerase; Provisional.	2.03001e-90
NC_009446.1\|WP_012030651.1\|326455_327076_+\|ribonuclease-T	gnl\|CDD\|179951	PRK05168, PRK05168, ribonuclease T; Provisional.	2.58771e-124
NC_009446.1\|WP_148188629.1\|307391_307976_-\|tetratricopeptide-repeat-protein	gnl\|CDD\|274350	TIGR02917, TPR_domain_protein, putative PEP-CTERM system TPR-repeat lipoprotein. This protein family occurs in strictly within a subset of Gram-negative bacterial species with the proposed PEP-CTERM/exosortase system, analogous to the LPXTG/sortase system common in Gram-positive bacteria. This protein occurs in a species if and only if a transmembrane histidine kinase (TIGR02916) and a DNA-binding response regulator (TIGR02915) also occur. The present of tetratricopeptide repeats (TPR) suggests protein-protein interaction, possibly for the regulation of PEP-CTERM protein expression, since many PEP-CTERM proteins in these genomes are preceded by a proposed DNA binding site for the response regulator.	3.30319e-09
NC_009446.1\|WP_012030640.1\|312987_314325_-\|HemY-protein	gnl\|CDD\|273126	TIGR00540, TPR_hemY_coli, heme biosynthesis-associated TPR protein. Members of this protein family are uncharacterized tetratricopeptide repeat (TPR) proteins invariably found in heme biosynthesis gene clusters. The absence of any invariant residues other than Ala argues against this protein serving as an enzyme per se. The gene symbol hemY assigned in E. coli is unfortunate in that an unrelated protein, protoporphyrinogen oxidase (HemG in E. coli) is designated HemY in Bacillus subtilis. [Unknown function, General].	1.14573e-37
NC_009446.1\|WP_012030644.1\|317879_318254_+\|lipoprotein	gnl\|CDD\|182532	PRK10540, PRK10540, osmotically-inducible lipoprotein OsmB.	0.00146893
NC_009446.1\|WP_012030645.1\|318305_319091_-\|cell-division-protein-ZapD	gnl\|CDD\|377767	pfam07072, ZapD, Cell division protein. Cell division protein ZapD enhances FtsZ-ring assembly. It directly interacts with FtsZ and promotes bundling of FtsZ protofilaments, with a reduction in FtsZ GTPase activity.	9.26556e-66
NC_009446.1\|WP_012030636.1\|309720_310194_+\|protein-export-chaperone-SecB	gnl\|CDD\|376817	pfam02556, SecB, Preprotein translocase subunit SecB. This family consists of preprotein translocase subunit SecB. SecB is required for the normal export of envelope proteins out of the cell cytoplasm.	1.40216e-59
NC_009446.1\|WP_041729409.1\|305816_306293_-\|regulatory-protein-RecX	gnl\|CDD\|234646	PRK00117, recX, recombination regulator RecX; Reviewed.	1.48412e-31

>NC_009446.1|WP_012030640.1|312987_314325_-|HemY-protein
MLRFIIVLILLCLGLLTGYAFNIESPVMINIFGRYQIETHFINLVLASILFGFLFITLFRILFFIWNTPTIFSRNLKVRKKNKADRLLRGGLNDLGVGNYKCAEKKLANGGDLAEQLGISPVIYFENAAIAADRQQAFDRRDQYFIRARETVQAHDAVSRKVMRLTEAHSYILNHQFTQAESILNQLYQEDAKNSKVIAMLDEVYVGKKDWERAWLHLSTLRNQLSAEVFNERKLKYAQEMVQAALHDEEALSRVWQHLPAELHAEKSLLLPYASALHEKGHAEEIEKLLAQQIKYNGDLDLIQVYSQLRGINFNRALKNMNDWASMHAENSIFLYCHAQIAYRAKDYETAARCIEASIKLHPTPQAFALWGQILEATDKPGAAFVAYRQSIVDPKADSLNGELLLAQAGEKLALEKLAAEQTDGDAVAEVSENEAEKTESSTDE
>NC_009446.1|WP_012030639.1|311825_312887_-|AI-2E-family-transporter
MNPLIKWCSRVFNNPSLMALLLFGCTLSLAFFSIGQWLIPVIISAVIAYLLEGLIKKCEKNGVRRIFAVSVVFLLFSFLIIYIFIGVLPILINQAKGLITNLPVYLSYAQEKMHILPKRFPEIISQQDIDLMLGSMNAAVAEYTKILLSKKIFESLFAVFTVLVYIILIPILIFFFLKDKVKILSWLGQFLPDNHQIIQDIWTEVDIQIGNYIRGKFVEVMIIWIMCFIPFNILGLQYSLLLSLMVGLSVLIPYIGATIVTFPVLIVAYMQFGLNSGFWWSTGFYFVVQILDGNVIVPVIFSEAVSIHPIAIIMAVLVFGGLWGFWGIFFAIPLATLVKAIVEAWRRYQNRGQ
>NC_009446.1|WP_081423580.1|311197_311815_+|bifunctional-tRNA-pseudouridine(32)-synthase/ribosomal-large-subunit-pseudouridine-synthase-RluA
MDLPVVYQDEDMIAVDKPAGLLSVPGRGAEKRDSVEWRIKQEYCGAAAVHRLDMSTSGIMLIAKHKDAERYYKTAFEQRRVKKGYVAICHGLIAEDEGEMNAPLIGDWVNRPKQKVCYETGKAALTRFCVLSRQRDQTRVALFPHTGRSHQLRVHLADKGHPIVGDNLYGDAADCLLPRLLLHAEWLLFTRRDGAPIKLSTKIPF
>NC_009446.1|WP_012030637.1|310193_311189_+|NAD(P)-dependent-glycerol-3-phosphate-dehydrogenase
MHTIAVLGAGSWGTALALQLARNQHRVFLWGHRAAHIEQLIADGANHKYLPDVFFPKNLIPTADLAAAVASAEMVLAVVPSVGFAGLLSDLKPLLGKKPFMWAIKGFEQGSGRLLSDVFTEHFGKHHAHAILAGPSFAREVAAGKPTAVTIAAAHKNDAPAFAEPFHSSNFLCYTSDDLIGAQIGGAVKNVIAIAVGIADGLRCGANTRAALITRGLQEMTRLATALGAQAQTLSGLTGLGDLVLTATDDQSRNRRFGLALGQGKTALEAKALIGQVIEGEGAAHDTWALACRYQVRMPITQYMHQFLNGEIDIQTAVMHLSNRDLKAESA
>NC_009446.1|WP_012030636.1|309720_310194_+|protein-export-chaperone-SecB
MAEEQQPRILLEVRKLYVGDLSVEVPNAPEVFQQSLNPEISLGINHENKKLKEENYYSVHLRLTVTAKDSTSSSVIYLVEATQTGIFEIVGLDESQLQHALNVYCTTVLYPYAREVISSAITHAGFPSLYLQPINFDALYQQQLQQEQNTTAQGGEA
>NC_009446.1|WP_012030635.1|308838_309642_+|undecaprenyl-diphosphate-phosphatase
MTLWQAFILSLIQGITEFLPISSSGHLVITRELLHWQDAGVAFDAFTGLGTLTAVLFYYRKDVCSILYHWFRQFRHCDAPPAPEAKLGNQLIVATLPALLIGFMVKDHIDALTHRPLLIASTTMIFAIFLAAADFWGRKKLSLPETNYRQAFYYGLAQTLALVPGVSRSGITLTAGLAMHFSRESAARFSFLQSIPISAAAGGYGLWKLATNPSDFSWQLIALSYVTATLAAYVCIALFIRFLNTVGMMPHVIYRLLLGAYLFFVFM
>NC_009446.1|WP_012030634.1|308125_308689_-|D-sedoheptulose-7-phosphate-isomerase
MNWQDTITAHQKVFDALREHEDVVVRIGRGLLAAIERGNTIFVAGNGGSAADAQHFAAELTGRFVRERKPLPGIALTTDTSALTAIANDYGYAQVFARQLDGLAQPGDVFVGISTSGNSPNVLTAVELARESGLVTYGLSGNDGGKLSTACDDCVVVPSSITAQIQEAHIFILHAWCILIDEHADLF
>NC_009446.1|WP_148188629.1|307391_307976_-|tetratricopeptide-repeat-protein
MNARFFLMILLLWNHAWAEPAPPVALLSPTGKTNTLTESSTATPSNEAPATFNYEHVELEAINGNPESALEQLNKHLSAHPDDARAAYSKGLILMQLKRVDEAERWFKMMQSNFPNVTHSYNALAVIYSGRGDLLSAQSVLEALLRLQPQQQTARLNLAKIYLRLAQENYSKALKADPKNDKIARTLTALKALQ
>NC_009446.1|WP_012030632.1|306279_307332_-|recombinase-RecA
MNEEQKKALTAVLTQLDKQFGKGTVMRLGEQVAAHDIQAISTGSLTLDIALGIGGLPKGRIVEIYGPESSGKTTMMLHVIAEAQKNGGTAAFIDAEHALDPIYARKLGVNTDDLYVTQPDTGEQALEICDALVRSGAFDVIVVDSVAALTPKAEIEGEMGDSHVGLQARLMSQALRKLTGNIKRANTLVVFINQIRMKIGVMFGSPETTTGGNALKFYASVRMDIRRIGSIKEGDEVLGNETRVKVVKNKVAPPFKQAEFDILYGQGVSREGEIIQLAVNADIMQKSGAWYSYRDEKIGQGKEKVRLYLKEHPDVAQEIETKIREKFIGGELHLPDAAGDEIDTSINDEE
>NC_009446.1|WP_041729409.1|305816_306293_-|regulatory-protein-RecX
MMKNDELARDFERRCLALLAQREYSRAELAAKAADIAPEIVSAVLDKLAADGWQSDQRFCAVWVRSKAERGDGAQKIRQALKQRGIADALIAEQCAQFDWFALAERLYRKKYTKPAHDLKEQAKRQRFLAQRGFSFAEIRHAQSVFESEHHDAHAEHR
>NC_009446.1|WP_012030642.1|316078_316834_-|uroporphyrinogen-III-synthase
MNTENKYPLQGCRILYTRSKQHWLQAEPLLRQLGAQPYHLPLLDTKMQPLSAKALEQCRKADDLVFVSAQAVQHFLAQYQPVFQQNLIAIGMKTADALTAHAQTRFLVAPPPYNSEALLRIWQPQRHKIALIAAEGGRDLLYTTLSEDNEVYRIDTYQRFNPTHAWNFEMPLPHCILLASVQTLAHFLAITPQNMLKLLQCRAVIVALSPRIMQAAVHAGFLHCISAQYADERHLISCLEQWWLSTQGDSS
>NC_009446.1|WP_012030643.1|316817_317735_-|hydroxymethylbilane-synthase
MSTLRIATRKSPLALWQAEHVAQQLKQHYPELTVELVPIVTQGDILAHTPLSKIGGKNLFIKELEIAMQQNAADIAVHSMKDVGVTLPEGFVLAAILPRENPFDALVSNHYAHLNELPNGARVGTCSLRRKMQLAHYRPDLKLIDIRGNVHTRLQKLDSGAFDALILACAGLIRLQQNARIRQILPAEISLPAIGQGAIGVECRADSPFLAHIQTLNHFETAVCVQTERVVNQRLQGDCQVPIAVFATLSGKTMTLQSRIGTIDGQRMLAHQEICALEDAEKAGARCAEALIQQGAQDILHEYRK
>NC_009446.1|WP_012030644.1|317879_318254_+|lipoprotein
MKYAQLSLLSAALLMSACMDASQQQMVQQGAIGAAVGAGAGALLGKDDAAGKRNKKIATGAVVGGILGSQINRANQAPQYNQYPQNGYQQNYPQQNYNQYPQQNGYNQYPQNGYQQNYGGGYGY
>NC_009446.1|WP_012030645.1|318305_319091_-|cell-division-protein-ZapD
MMHNTAFQGESSSLHIYEQPLAERMRLFMRLESMFEQLHLFHQANEYYSIRLFLDALFDILDFLHRYEIRAEVFKELQRISLALEREYLGADKTFLEEKVSAALAKIHQLDFNPINRLRENELLNSLRQRNVNKSGNCLFEVPAYQFWLANNIGRENEFLNYCYQLFIPLSEAIAVSLSIIRSSATLTEEYTDNGIFLKTLDKDRKNQILRIHLPTSHCVFPRISGDNHRFAIRFMEQNNPQTRSVQTKEPVVFSLQICAM
>NC_009446.1|WP_012030646.1|319458_323160_+|transaldolase
MKRMLINATQQEELRVALVDGQQLYDLDIETLYSAQKKANIYTGTITRIEPSLEAVFVDYGSTRHGFLPFKEIAKEYLAEPHDGADKSNIKDLLSVGQKVLVQIEKEERGNKGAALTTYVSLAGRFLVLMPNNPHAGGVSRRIQGDERKELKDYLEQLGVPEEMGVIIRTAGVGRSIEELQWDLDFLRQVWDAITAAYHNTASQKLIYQESNIIVRALRDYLRPDVGQILIDDEQVYQQAMDFMNLVMPSSINKLKLYQDPTPLFTRYQIEGQIETAYQRNVKLPSGGELVIDYTEALVSIDINSSKSTKGCDIEETAYQTNLEAADEIARQMRLRDFGGLIVIDFIDMDVSRNRKDVEQRLIDATKIDRARIQIGRISRFGLLEMSRQRLRASIDEASHQVCPRCKGQGSIRGIQSQALSLLRLIEEEAMKDRTRRITGELPVDIATFLLNEKRSVIQSIEKRNHVDIVLTINPHLHSPDYFIERFRDDEMNEEMSAVPSYRLVNHQHNSEEMPILRPKDDRVEAPVVSSIMPQTPVPQAKGGAAVVKSGLSALFSKVVALFKEGHNGHTVDAVLHKKEEKQTINESVTPTSKNVHHEETAQPVREKPIVTPAPEASTVQTHESTPANGANVKRKEKSDDHDKHHAKPTPKAAKMENDDEVNPSLEELLHPVESKNGREVRKGRPRDVHAVRGQGKAPETMPDFEQSSDELKRTETVAHHDVKNERISDNKSPEVNAETVLTENNATLVPPKVHQAPGLVAFLETENAPISADEDDIDEPQSMQEHDDASSEQAEILETALSEKEQETIGEPLPVPVKKEQESVAEIAPAEKEQESVAETAPAEKEQKTVAETASEKVSHIHAVTKLGQSIWYDNIDRALLQSGTLQRLIEEDDLRGITSNPAIFQKAFSRTRDYDAALSAWLEHHEGDAQAAFYALAIEDIQQACDLMQPVFEKTNGTDGMVSLEVSPHLAHDAPATVAEALSLQQRVARQNLMIKIPATDAGCAALTELTAQGINVNMTLLFSLAQYQRVLEAYIDGLKRRVENGQTIDSIRSVASFFVSRVDTAIDALLDDAHAHLRGRTAVANAQAAYLYYLERISHDDWIELQQKGAAVQRLLWASTSTKNPNYADTRYIDMLIGADTVNTVPPETYAAFKDHGRVSATLLKNIEQAQQTLRNIEDAGIDLDAVTRQLTLDGIAQFERAFTELLQTLTDKIQTLKPHANDITGENHV
>NC_009446.1|WP_012030647.1|323152_323347_+|hypothetical-protein
MFDEATVSLLRCPVTGQALRFERAENCLYTLDHSRRYPIVDGIALLLPEHSEAIALLTAEKNDA
>NC_009446.1|WP_012030648.1|323336_324071_+|3-deoxy-manno-octulosonate-cytidylyltransferase
MTPDIRVVIPARYASTRLPAKPLALIGGVPMIVRTAQQVAQAGFPYCVAYDDERIGDVLAAHHIPAIKTRFTHENGTQRLSEVVIARAWTDETIVVNVQGDEPLLPPDLITTVARTLIEHTQASVATLATVCDAPESPNTVKVVCDCAGYALYFSRSVMPYVRDAAAPPVSYLRHIGIYAYRVQLLKRYPQLAPTPLEQAEKLEQLRFLEHGFKIAVAQIDEAPPAGVDSPEDLARVQALFVHE
>NC_009446.1|WP_012030649.1|324063_325887_+|excinuclease-ABC-subunit-UvrC
MNNSGFAFDPDVFLSHVSTLSGVYQMRDQNGTVLYVGKAKNLRQRLSHYFQKTGLSVKTRALMRAVYDIQTTSTPTEAEALLLENNLIKQYQPKFNILLRDDKSYPYICLSQHDFPRLFLYRGARKNGDFFGPYPNVQSAHHALAILQKVFRLRPCLDSFFKNRSRPCLQYQIKRCYAPCVGKISAEMYAQTVQHARDFLTGNSEHLLQTLTEHMLQASAAQQYERAAIVRDQISELRTIQQKQSMVVYAANVDVLAVATAYGKACVQVLFFRDGHSVTSQAFFPKLPELLPAGAILQAFIGQFYHQRPVPSQIVLSEALPDMDAVSEFLSQMSAHTVTLTTQPRAIRKKWLRMTQENARLNLRLHLAQKLSMHERFKALAQAFDWQKMPQRLECVDISHMQGEYTVASCVVFDRRGAVKSDYRRYKINGITGGDDYAAMKQVIKRRFARLKKGEGVMPDVFFVDGGRGQLQQAIAVFEEMQIEGVQLIGVAKGEGRKAGLEQFWFPHENRPRTLPADSQAMQLIIHIRDEAHRFAISAHRRGRDKKVRVSLLEEIPNIGRKRRQALLQHFGNLAGLMQASPEDITRVPGISVKLAAQIYAALHQGE
>NC_009446.1|WP_012030650.1|325888_326446_+|CDP-diacylglycerol--glycerol-3-phosphate-3-phosphatidyltransferase
MRSVATFLTVLRIILVPFFIILYYYQFDFWGRWPALIVYAVAGISDYLDGYLARKLKETSAFGAFLDPVADKLMVAAVLIVVLQQNPHIWLMVCTLIIIGREIWISALREWMASMQMRDVVAVAKIGKWKTTLQMLALGFLIYREPFIGLPIWSIGQILMIGAALLTLYSMWSYNLSAWKAIKEK
>NC_009446.1|WP_012030651.1|326455_327076_+|ribonuclease-T
MNHLISKRFRGFLPVVVDVETGGFDHEKDALLEVAAVLVNFNEAGNLAPVETFHYHVKPFEGAHLNPDSLKINGIDPFHPLRPALDEVTVAKQLFGAIREYQKAQSCTRSILVGHNAHFDLGFINALAARCNYQHNPFHPFSSLDTVSLGALAYGQTVLARIAKAAGFEYDSERAHGAKYDTELTAQIFCHIINTWSEKIGIPEQS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009446_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009446_3

318123-318232

Orphan

Consensus_repeat	Method
CAATATCCGCAAAATGGTTATCAACAAAATTA	CRISPRCasFinder

1 spacers

DEDDh

The CRISPR arrays of NC_009446_3

>merge|NC_009446|3|318123-318232|CRISPRCasFinder
CAATATCCGCAAAATGGTTATCAACAAAATTATCCGCAACAAAATTACAATCAATATCCCCAACAAAATGGTTATAACCAATATCCGCAAAACGGTTATCAACAAAATTA

>NC_009446|3|2|318123-318232|CRISPRCasFinder
CAATATCCGCAAAATGGTTATCAACAAAATTA	TCCGCAACAAAATTACAATCAATATCCCCAACAAAATGGTTATAAC
CAATATCCGCAAAACGGTTATCAACAAAATTA

Protein	Signature genes	Signature genes Name	Protein_function
NC_009446.1\|WP_012030647.1\|323152_323347_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|225391
NC_009446.1\|WP_012030641.1\|314327_316082_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|380149
NC_009446.1\|WP_012030642.1\|316078_316834_-\|uroporphyrinogen-III-synthase	unknown	unknown	gnl\|CDD\|119440
NC_009446.1\|WP_012030643.1\|316817_317735_-\|hydroxymethylbilane-synthase	unknown	unknown	gnl\|CDD\|234612
NC_009446.1\|WP_081423580.1\|311197_311815_+\|bifunctional-tRNA-pseudouridine(32)-synthase/ribosomal-large-subunit-pseudouridine-synthase-RluA	unknown	unknown	gnl\|CDD\|223638
NC_009446.1\|WP_012030637.1\|310193_311189_+\|NAD(P)-dependent-glycerol-3-phosphate-dehydrogenase	unknown	unknown	gnl\|CDD\|234629
NC_009446.1\|WP_012030648.1\|323336_324071_+\|3-deoxy-manno-octulosonate-cytidylyltransferase	unknown	unknown	gnl\|CDD\|235473
NC_009446.1\|WP_012030649.1\|324063_325887_+\|excinuclease-ABC-subunit-UvrC	unknown	unknown	gnl\|CDD\|234792
NC_009446.1\|WP_012030650.1\|325888_326446_+\|CDP-diacylglycerol--glycerol-3-phosphate-3-phosphatidyltransferase	unknown	unknown	gnl\|CDD\|182763
NC_009446.1\|WP_041729782.1\|329463_329757_+\|YfcZ/YiiS-family-protein	unknown	unknown	gnl\|CDD\|367851
NC_009446.1\|WP_012030646.1\|319458_323160_+\|transaldolase	unknown	unknown	gnl\|CDD\|236766
NC_009446.1\|WP_012030639.1\|311825_312887_-\|AI-2E-family-transporter	unknown	unknown	gnl\|CDD\|223701
NC_009446.1\|WP_012030634.1\|308125_308689_-\|D-sedoheptulose-7-phosphate-isomerase	unknown	unknown	gnl\|CDD\|184408
NC_009446.1\|WP_012030651.1\|326455_327076_+\|ribonuclease-T	DEDDh	cd06127_DEDDh_CAS-I	gnl\|CDD\|179951
NC_009446.1\|WP_012030635.1\|308838_309642_+\|undecaprenyl-diphosphate-phosphatase	unknown	unknown	gnl\|CDD\|234712
NC_009446.1\|WP_012030640.1\|312987_314325_-\|HemY-protein	unknown	unknown	gnl\|CDD\|273126
NC_009446.1\|WP_012030645.1\|318305_319091_-\|cell-division-protein-ZapD	unknown	unknown	gnl\|CDD\|377767
NC_009446.1\|WP_012030636.1\|309720_310194_+\|protein-export-chaperone-SecB	unknown	unknown	gnl\|CDD\|376817
NC_009446.1\|WP_012030652.1\|327072_327651_+\|DUF2167-domain-containing-protein	unknown	unknown	gnl\|CDD\|378316
NC_009446.1\|WP_041729417.1\|327904_329047_-\|N-acetylglucosamine-6-phosphate-deacetylase	unknown	unknown	gnl\|CDD\|224733

Protein	Function_ID	Function_description	E-value
NC_009446.1\|WP_012030647.1\|323152_323347_+\|hypothetical-protein	gnl\|CDD\|225391	COG2835, COG2835, Uncharacterized conserved protein [Function unknown].	1.13715e-05
NC_009446.1\|WP_012030641.1\|314327_316082_-\|hypothetical-protein	gnl\|CDD\|380149	NF012181, MSCRAMM_SdrD, MSCRAMM family adhesin SdrD. Features of this protein family include a YSIRK-type signal peptide at the N-terminus and a variable-length C-terminal region of Ser-Asp (SD) repeats followed by an LPXTG motif for surface immobilization by sortase.	0.000476406
NC_009446.1\|WP_012030642.1\|316078_316834_-\|uroporphyrinogen-III-synthase	gnl\|CDD\|119440	cd06578, HemD, Uroporphyrinogen-III synthase (HemD) catalyzes the asymmetrical cyclization of tetrapyrrole (linear) to uroporphyrinogen-III, the fourth step in the biosynthesis of heme. This ubiquitous enzyme is present in eukaryotes, bacteria and archaea. Mutations in the human uroporphyrinogen-III synthase gene cause congenital erythropoietic porphyria, a recessive inborn error of metabolism also known as Gunther disease.	4.97742e-34
NC_009446.1\|WP_012030643.1\|316817_317735_-\|hydroxymethylbilane-synthase	gnl\|CDD\|234612	PRK00072, hemC, porphobilinogen deaminase; Reviewed.	1.76237e-154
NC_009446.1\|WP_081423580.1\|311197_311815_+\|bifunctional-tRNA-pseudouridine(32)-synthase/ribosomal-large-subunit-pseudouridine-synthase-RluA	gnl\|CDD\|223638	COG0564, RluA, Pseudouridylate synthases, 23S RNA-specific [Translation, ribosomal structure and biogenesis].	1.9943e-67
NC_009446.1\|WP_012030637.1\|310193_311189_+\|NAD(P)-dependent-glycerol-3-phosphate-dehydrogenase	gnl\|CDD\|234629	PRK00094, gpsA, NAD(P)H-dependent glycerol-3-phosphate dehydrogenase.	7.27734e-155
NC_009446.1\|WP_012030648.1\|323336_324071_+\|3-deoxy-manno-octulosonate-cytidylyltransferase	gnl\|CDD\|235473	PRK05450, PRK05450, 3-deoxy-manno-octulosonate cytidylyltransferase; Provisional.	1.53815e-117
NC_009446.1\|WP_012030649.1\|324063_325887_+\|excinuclease-ABC-subunit-UvrC	gnl\|CDD\|234792	PRK00558, uvrC, excinuclease ABC subunit UvrC.	0
NC_009446.1\|WP_012030650.1\|325888_326446_+\|CDP-diacylglycerol--glycerol-3-phosphate-3-phosphatidyltransferase	gnl\|CDD\|182763	PRK10832, PRK10832, CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase.	9.80478e-41
NC_009446.1\|WP_041729782.1\|329463_329757_+\|YfcZ/YiiS-family-protein	gnl\|CDD\|367851	pfam04175, DUF406, Protein of unknown function (DUF406). Members of this family appear to be found only in gamma proteobacteria. The function of this protein family is undetermined. Solution of the structures of the two members of this family investigated bear some resemblance to that of the single domain enzyme pterin-4a-carbinolamine dehydratase, PDC. Although the residues of PCDs involved in binding of metabolite are not conserved in the two structures under study, they do correspond to a surface-region structurally aligned with residues that are highly conserved, eg Glu 89, suggesting that this region is also involved in binding of a ligand, thereby possibly constituting a catalytic site of a yet uncharacterized enzyme specific for gamma proteobacteria.	6.89868e-39
NC_009446.1\|WP_012030646.1\|319458_323160_+\|transaldolase	gnl\|CDD\|236766	PRK10811, rne, ribonuclease E; Reviewed.	0
NC_009446.1\|WP_012030639.1\|311825_312887_-\|AI-2E-family-transporter	gnl\|CDD\|223701	COG0628, yhhT, Predicted permease, member of the PurR regulon [General function prediction only].	1.31588e-47
NC_009446.1\|WP_012030634.1\|308125_308689_-\|D-sedoheptulose-7-phosphate-isomerase	gnl\|CDD\|184408	PRK13937, PRK13937, phosphoheptose isomerase; Provisional.	2.03001e-90
NC_009446.1\|WP_012030651.1\|326455_327076_+\|ribonuclease-T	gnl\|CDD\|179951	PRK05168, PRK05168, ribonuclease T; Provisional.	2.58771e-124
NC_009446.1\|WP_012030635.1\|308838_309642_+\|undecaprenyl-diphosphate-phosphatase	gnl\|CDD\|234712	PRK00281, PRK00281, undecaprenyl-diphosphate phosphatase.	1.19767e-84
NC_009446.1\|WP_012030640.1\|312987_314325_-\|HemY-protein	gnl\|CDD\|273126	TIGR00540, TPR_hemY_coli, heme biosynthesis-associated TPR protein. Members of this protein family are uncharacterized tetratricopeptide repeat (TPR) proteins invariably found in heme biosynthesis gene clusters. The absence of any invariant residues other than Ala argues against this protein serving as an enzyme per se. The gene symbol hemY assigned in E. coli is unfortunate in that an unrelated protein, protoporphyrinogen oxidase (HemG in E. coli) is designated HemY in Bacillus subtilis. [Unknown function, General].	1.14573e-37
NC_009446.1\|WP_012030645.1\|318305_319091_-\|cell-division-protein-ZapD	gnl\|CDD\|377767	pfam07072, ZapD, Cell division protein. Cell division protein ZapD enhances FtsZ-ring assembly. It directly interacts with FtsZ and promotes bundling of FtsZ protofilaments, with a reduction in FtsZ GTPase activity.	9.26556e-66
NC_009446.1\|WP_012030636.1\|309720_310194_+\|protein-export-chaperone-SecB	gnl\|CDD\|376817	pfam02556, SecB, Preprotein translocase subunit SecB. This family consists of preprotein translocase subunit SecB. SecB is required for the normal export of envelope proteins out of the cell cytoplasm.	1.40216e-59
NC_009446.1\|WP_012030652.1\|327072_327651_+\|DUF2167-domain-containing-protein	gnl\|CDD\|378316	pfam09935, DUF2167, Protein of unknown function (DUF2167). This domain, found in various hypothetical membrane-anchored prokaryotic proteins, has no known function.	7.33203e-08
NC_009446.1\|WP_041729417.1\|327904_329047_-\|N-acetylglucosamine-6-phosphate-deacetylase	gnl\|CDD\|224733	COG1820, NagA, N-acetylglucosamine-6-phosphate deacetylase [Carbohydrate transport and metabolism].	4.86764e-95

>NC_009446.1|WP_012030643.1|316817_317735_-|hydroxymethylbilane-synthase
MSTLRIATRKSPLALWQAEHVAQQLKQHYPELTVELVPIVTQGDILAHTPLSKIGGKNLFIKELEIAMQQNAADIAVHSMKDVGVTLPEGFVLAAILPRENPFDALVSNHYAHLNELPNGARVGTCSLRRKMQLAHYRPDLKLIDIRGNVHTRLQKLDSGAFDALILACAGLIRLQQNARIRQILPAEISLPAIGQGAIGVECRADSPFLAHIQTLNHFETAVCVQTERVVNQRLQGDCQVPIAVFATLSGKTMTLQSRIGTIDGQRMLAHQEICALEDAEKAGARCAEALIQQGAQDILHEYRK
>NC_009446.1|WP_012030642.1|316078_316834_-|uroporphyrinogen-III-synthase
MNTENKYPLQGCRILYTRSKQHWLQAEPLLRQLGAQPYHLPLLDTKMQPLSAKALEQCRKADDLVFVSAQAVQHFLAQYQPVFQQNLIAIGMKTADALTAHAQTRFLVAPPPYNSEALLRIWQPQRHKIALIAAEGGRDLLYTTLSEDNEVYRIDTYQRFNPTHAWNFEMPLPHCILLASVQTLAHFLAITPQNMLKLLQCRAVIVALSPRIMQAAVHAGFLHCISAQYADERHLISCLEQWWLSTQGDSS
>NC_009446.1|WP_012030641.1|314327_316082_-|hypothetical-protein
MNDPNKPSAEHLNENILSTDNALQSTENNPQPHDKKEKDCDCHGEHACDCDEEKDCGCHSEHACDCNEEKDKDCNCGDSCDCDEENNCGCIDKHACDCNEEKDKDCSCGDSCDCNEENNCGCVGEHACDCNEEKDKDCSCGDSCDCDEENNCGCIGEHACDCNEEKDKDCSCGDSCDCDEENNCGCIGESSKKKGPCAFLTFLLAFLALAAAGYHEYQWQQMRANQQTFQSDSEKNIDALKNTVAQFDQGLDKAQVSHLIAEAIKALPLPPSEQEIGVFVEQKMKEQAEHTIKQAHSVAQESVAEFARTHDLNDIRATQASTEAKVQEAVDAFQHTATTAKESFTALADQATKQFTNLTQQAHPQPLIDALALADAAYQHNDYFAAAQFLNQALYRFEALNLMQTPFAAFKEPITAAQTQLASLIKADQERAQQLIALTESVDSWSFKSFEPVQVTMEDEASDETNLMSQAEQWGKQLLSKAVVIHKNDLSAAERVPANKAQRAIIRETIRLDVAYLRNAAMLHDRVGAKMAADDLTALITRYFAANDEAVQSALSVLSQFGADEPQPLEITTIIKAVKEAAGE
>NC_009446.1|WP_012030640.1|312987_314325_-|HemY-protein
MLRFIIVLILLCLGLLTGYAFNIESPVMINIFGRYQIETHFINLVLASILFGFLFITLFRILFFIWNTPTIFSRNLKVRKKNKADRLLRGGLNDLGVGNYKCAEKKLANGGDLAEQLGISPVIYFENAAIAADRQQAFDRRDQYFIRARETVQAHDAVSRKVMRLTEAHSYILNHQFTQAESILNQLYQEDAKNSKVIAMLDEVYVGKKDWERAWLHLSTLRNQLSAEVFNERKLKYAQEMVQAALHDEEALSRVWQHLPAELHAEKSLLLPYASALHEKGHAEEIEKLLAQQIKYNGDLDLIQVYSQLRGINFNRALKNMNDWASMHAENSIFLYCHAQIAYRAKDYETAARCIEASIKLHPTPQAFALWGQILEATDKPGAAFVAYRQSIVDPKADSLNGELLLAQAGEKLALEKLAAEQTDGDAVAEVSENEAEKTESSTDE
>NC_009446.1|WP_012030639.1|311825_312887_-|AI-2E-family-transporter
MNPLIKWCSRVFNNPSLMALLLFGCTLSLAFFSIGQWLIPVIISAVIAYLLEGLIKKCEKNGVRRIFAVSVVFLLFSFLIIYIFIGVLPILINQAKGLITNLPVYLSYAQEKMHILPKRFPEIISQQDIDLMLGSMNAAVAEYTKILLSKKIFESLFAVFTVLVYIILIPILIFFFLKDKVKILSWLGQFLPDNHQIIQDIWTEVDIQIGNYIRGKFVEVMIIWIMCFIPFNILGLQYSLLLSLMVGLSVLIPYIGATIVTFPVLIVAYMQFGLNSGFWWSTGFYFVVQILDGNVIVPVIFSEAVSIHPIAIIMAVLVFGGLWGFWGIFFAIPLATLVKAIVEAWRRYQNRGQ
>NC_009446.1|WP_081423580.1|311197_311815_+|bifunctional-tRNA-pseudouridine(32)-synthase/ribosomal-large-subunit-pseudouridine-synthase-RluA
MDLPVVYQDEDMIAVDKPAGLLSVPGRGAEKRDSVEWRIKQEYCGAAAVHRLDMSTSGIMLIAKHKDAERYYKTAFEQRRVKKGYVAICHGLIAEDEGEMNAPLIGDWVNRPKQKVCYETGKAALTRFCVLSRQRDQTRVALFPHTGRSHQLRVHLADKGHPIVGDNLYGDAADCLLPRLLLHAEWLLFTRRDGAPIKLSTKIPF
>NC_009446.1|WP_012030637.1|310193_311189_+|NAD(P)-dependent-glycerol-3-phosphate-dehydrogenase
MHTIAVLGAGSWGTALALQLARNQHRVFLWGHRAAHIEQLIADGANHKYLPDVFFPKNLIPTADLAAAVASAEMVLAVVPSVGFAGLLSDLKPLLGKKPFMWAIKGFEQGSGRLLSDVFTEHFGKHHAHAILAGPSFAREVAAGKPTAVTIAAAHKNDAPAFAEPFHSSNFLCYTSDDLIGAQIGGAVKNVIAIAVGIADGLRCGANTRAALITRGLQEMTRLATALGAQAQTLSGLTGLGDLVLTATDDQSRNRRFGLALGQGKTALEAKALIGQVIEGEGAAHDTWALACRYQVRMPITQYMHQFLNGEIDIQTAVMHLSNRDLKAESA
>NC_009446.1|WP_012030636.1|309720_310194_+|protein-export-chaperone-SecB
MAEEQQPRILLEVRKLYVGDLSVEVPNAPEVFQQSLNPEISLGINHENKKLKEENYYSVHLRLTVTAKDSTSSSVIYLVEATQTGIFEIVGLDESQLQHALNVYCTTVLYPYAREVISSAITHAGFPSLYLQPINFDALYQQQLQQEQNTTAQGGEA
>NC_009446.1|WP_012030635.1|308838_309642_+|undecaprenyl-diphosphate-phosphatase
MTLWQAFILSLIQGITEFLPISSSGHLVITRELLHWQDAGVAFDAFTGLGTLTAVLFYYRKDVCSILYHWFRQFRHCDAPPAPEAKLGNQLIVATLPALLIGFMVKDHIDALTHRPLLIASTTMIFAIFLAAADFWGRKKLSLPETNYRQAFYYGLAQTLALVPGVSRSGITLTAGLAMHFSRESAARFSFLQSIPISAAAGGYGLWKLATNPSDFSWQLIALSYVTATLAAYVCIALFIRFLNTVGMMPHVIYRLLLGAYLFFVFM
>NC_009446.1|WP_012030634.1|308125_308689_-|D-sedoheptulose-7-phosphate-isomerase
MNWQDTITAHQKVFDALREHEDVVVRIGRGLLAAIERGNTIFVAGNGGSAADAQHFAAELTGRFVRERKPLPGIALTTDTSALTAIANDYGYAQVFARQLDGLAQPGDVFVGISTSGNSPNVLTAVELARESGLVTYGLSGNDGGKLSTACDDCVVVPSSITAQIQEAHIFILHAWCILIDEHADLF
>NC_009446.1|WP_012030645.1|318305_319091_-|cell-division-protein-ZapD
MMHNTAFQGESSSLHIYEQPLAERMRLFMRLESMFEQLHLFHQANEYYSIRLFLDALFDILDFLHRYEIRAEVFKELQRISLALEREYLGADKTFLEEKVSAALAKIHQLDFNPINRLRENELLNSLRQRNVNKSGNCLFEVPAYQFWLANNIGRENEFLNYCYQLFIPLSEAIAVSLSIIRSSATLTEEYTDNGIFLKTLDKDRKNQILRIHLPTSHCVFPRISGDNHRFAIRFMEQNNPQTRSVQTKEPVVFSLQICAM
>NC_009446.1|WP_012030646.1|319458_323160_+|transaldolase
MKRMLINATQQEELRVALVDGQQLYDLDIETLYSAQKKANIYTGTITRIEPSLEAVFVDYGSTRHGFLPFKEIAKEYLAEPHDGADKSNIKDLLSVGQKVLVQIEKEERGNKGAALTTYVSLAGRFLVLMPNNPHAGGVSRRIQGDERKELKDYLEQLGVPEEMGVIIRTAGVGRSIEELQWDLDFLRQVWDAITAAYHNTASQKLIYQESNIIVRALRDYLRPDVGQILIDDEQVYQQAMDFMNLVMPSSINKLKLYQDPTPLFTRYQIEGQIETAYQRNVKLPSGGELVIDYTEALVSIDINSSKSTKGCDIEETAYQTNLEAADEIARQMRLRDFGGLIVIDFIDMDVSRNRKDVEQRLIDATKIDRARIQIGRISRFGLLEMSRQRLRASIDEASHQVCPRCKGQGSIRGIQSQALSLLRLIEEEAMKDRTRRITGELPVDIATFLLNEKRSVIQSIEKRNHVDIVLTINPHLHSPDYFIERFRDDEMNEEMSAVPSYRLVNHQHNSEEMPILRPKDDRVEAPVVSSIMPQTPVPQAKGGAAVVKSGLSALFSKVVALFKEGHNGHTVDAVLHKKEEKQTINESVTPTSKNVHHEETAQPVREKPIVTPAPEASTVQTHESTPANGANVKRKEKSDDHDKHHAKPTPKAAKMENDDEVNPSLEELLHPVESKNGREVRKGRPRDVHAVRGQGKAPETMPDFEQSSDELKRTETVAHHDVKNERISDNKSPEVNAETVLTENNATLVPPKVHQAPGLVAFLETENAPISADEDDIDEPQSMQEHDDASSEQAEILETALSEKEQETIGEPLPVPVKKEQESVAEIAPAEKEQESVAETAPAEKEQKTVAETASEKVSHIHAVTKLGQSIWYDNIDRALLQSGTLQRLIEEDDLRGITSNPAIFQKAFSRTRDYDAALSAWLEHHEGDAQAAFYALAIEDIQQACDLMQPVFEKTNGTDGMVSLEVSPHLAHDAPATVAEALSLQQRVARQNLMIKIPATDAGCAALTELTAQGINVNMTLLFSLAQYQRVLEAYIDGLKRRVENGQTIDSIRSVASFFVSRVDTAIDALLDDAHAHLRGRTAVANAQAAYLYYLERISHDDWIELQQKGAAVQRLLWASTSTKNPNYADTRYIDMLIGADTVNTVPPETYAAFKDHGRVSATLLKNIEQAQQTLRNIEDAGIDLDAVTRQLTLDGIAQFERAFTELLQTLTDKIQTLKPHANDITGENHV
>NC_009446.1|WP_012030647.1|323152_323347_+|hypothetical-protein
MFDEATVSLLRCPVTGQALRFERAENCLYTLDHSRRYPIVDGIALLLPEHSEAIALLTAEKNDA
>NC_009446.1|WP_012030648.1|323336_324071_+|3-deoxy-manno-octulosonate-cytidylyltransferase
MTPDIRVVIPARYASTRLPAKPLALIGGVPMIVRTAQQVAQAGFPYCVAYDDERIGDVLAAHHIPAIKTRFTHENGTQRLSEVVIARAWTDETIVVNVQGDEPLLPPDLITTVARTLIEHTQASVATLATVCDAPESPNTVKVVCDCAGYALYFSRSVMPYVRDAAAPPVSYLRHIGIYAYRVQLLKRYPQLAPTPLEQAEKLEQLRFLEHGFKIAVAQIDEAPPAGVDSPEDLARVQALFVHE
>NC_009446.1|WP_012030649.1|324063_325887_+|excinuclease-ABC-subunit-UvrC
MNNSGFAFDPDVFLSHVSTLSGVYQMRDQNGTVLYVGKAKNLRQRLSHYFQKTGLSVKTRALMRAVYDIQTTSTPTEAEALLLENNLIKQYQPKFNILLRDDKSYPYICLSQHDFPRLFLYRGARKNGDFFGPYPNVQSAHHALAILQKVFRLRPCLDSFFKNRSRPCLQYQIKRCYAPCVGKISAEMYAQTVQHARDFLTGNSEHLLQTLTEHMLQASAAQQYERAAIVRDQISELRTIQQKQSMVVYAANVDVLAVATAYGKACVQVLFFRDGHSVTSQAFFPKLPELLPAGAILQAFIGQFYHQRPVPSQIVLSEALPDMDAVSEFLSQMSAHTVTLTTQPRAIRKKWLRMTQENARLNLRLHLAQKLSMHERFKALAQAFDWQKMPQRLECVDISHMQGEYTVASCVVFDRRGAVKSDYRRYKINGITGGDDYAAMKQVIKRRFARLKKGEGVMPDVFFVDGGRGQLQQAIAVFEEMQIEGVQLIGVAKGEGRKAGLEQFWFPHENRPRTLPADSQAMQLIIHIRDEAHRFAISAHRRGRDKKVRVSLLEEIPNIGRKRRQALLQHFGNLAGLMQASPEDITRVPGISVKLAAQIYAALHQGE
>NC_009446.1|WP_012030650.1|325888_326446_+|CDP-diacylglycerol--glycerol-3-phosphate-3-phosphatidyltransferase
MRSVATFLTVLRIILVPFFIILYYYQFDFWGRWPALIVYAVAGISDYLDGYLARKLKETSAFGAFLDPVADKLMVAAVLIVVLQQNPHIWLMVCTLIIIGREIWISALREWMASMQMRDVVAVAKIGKWKTTLQMLALGFLIYREPFIGLPIWSIGQILMIGAALLTLYSMWSYNLSAWKAIKEK
>NC_009446.1|WP_012030651.1|326455_327076_+|ribonuclease-T
MNHLISKRFRGFLPVVVDVETGGFDHEKDALLEVAAVLVNFNEAGNLAPVETFHYHVKPFEGAHLNPDSLKINGIDPFHPLRPALDEVTVAKQLFGAIREYQKAQSCTRSILVGHNAHFDLGFINALAARCNYQHNPFHPFSSLDTVSLGALAYGQTVLARIAKAAGFEYDSERAHGAKYDTELTAQIFCHIINTWSEKIGIPEQS
>NC_009446.1|WP_012030652.1|327072_327651_+|DUF2167-domain-containing-protein
MTMATLRMPESWVLLKNEQRARFLREIEIEDEPALLAVAQSKEHDHAFALLRHQKSGYVVRPEETPIHPQLIRKQTEADLAILNSESALSEAERVRWQKFYLEPVYQAQTRTVEYGITLLFGNEAAVNLYRMLLVRDGALVLTLVGKPSDHLSLADWAIEPKDEMRYERFDPAHDKKSEGTLDNLILMNRFI
>NC_009446.1|WP_041729417.1|327904_329047_-|N-acetylglucosamine-6-phosphate-deacetylase
MSTYYVGARIFDRGQLVRNLALSVDKNHTQRILPETEIPENAPVVHLNGGILSGGFIDTQANGGGEVLVNDDFSADGLETVIQAHYQFGTVAMLPTFITDNQQKYHRAIAAIADGVKNGLNGLLGGHFEGPFIHPAKKGTHQARFIRQPDARDFACYQKHADYLQHSILSLAPEQVRAGTIAQIKPAIPQIQLAHSMATHQEILAAWCEGLTGITHLYNAMRAFSGRDVGAIGSAAELGLHCGIIADGIHSHPYALAMAYRNLGAEKLMLVTDAMSPLGAKNMQSFDLMGIKVFVQADRLINEDGALAGAQVTMLQCVQNAMKYMPIDCQSVLQMAVSTPAYYLGRPDLARIYPRPISEIIYLDEQLQTVTALPQLCGSM
>NC_009446.1|WP_041729782.1|329463_329757_+|YfcZ/YiiS-family-protein
MSDSLKCKADEVQACCCVEIGTIIDGKDCTVDVDYHYDNKGLAQKALDYFTEKARAAESEPCRIKSEIIESAHGAQLKAQFTFSCQAEAMIFQLSTR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	NC_009446.1	822923-822954	0	1.0
NC_009446_1	1.2\|179097\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179097-179128	32	NC_009446.1	791357-791388	0	1.0
NC_009446_1	1.3\|179157\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179157-179188	32	NC_009446.1	824416-824447	0	1.0
NC_009446_1	1.4\|179217\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179217-179248	32	NC_009446.1	791606-791637	1	0.969
NC_009446_1	1.6\|179337\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179337-179368	32	NC_009446.1	788658-788689	1	0.969

1. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to position: 822923-822954, mismatch: 0, identity: 1.0

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
tatcaaagaaccagtcaaggaaccatgagtcg	Protospacer
********************************

2. spacer 1.2|179097|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to position: 791357-791388, mismatch: 0, identity: 1.0

attcgcaaacaaaacagcgaaatttgggcgag	CRISPR spacer
attcgcaaacaaaacagcgaaatttgggcgag	Protospacer
********************************

3. spacer 1.3|179157|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to position: 824416-824447, mismatch: 0, identity: 1.0

tgtcgaactaaacgatgaccagatttggttaa	CRISPR spacer
tgtcgaactaaacgatgaccagatttggttaa	Protospacer
********************************

4. spacer 1.4|179217|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to position: 791606-791637, mismatch: 1, identity: 0.969

tatcgcagccacagcgtcgcgcaagtattagc	CRISPR spacer
tatcgcagccacagcgccgcgcaagtattagc	Protospacer
****************.***************

5. spacer 1.6|179337|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to position: 788658-788689, mismatch: 1, identity: 0.969

gtaaaccatcaaaataacgtcaaattgggtta	CRISPR spacer
gtaaaccatcagaataacgtcaaattgggtta	Protospacer
***********.********************

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_009446_2	2.1\|315560\|26\|NC_009446\|PILER-CR	315560-315585	26	NZ_MF547664	Clostridioides difficile strain LIBA-6289 plasmid LIBA6289, complete sequence	7434-7459	4	0.846
NC_009446_2	2.3\|315656\|26\|NC_009446\|PILER-CR	315656-315681	26	NZ_MF547664	Clostridioides difficile strain LIBA-6289 plasmid LIBA6289, complete sequence	7434-7459	4	0.846
NC_009446_2	2.5\|315752\|26\|NC_009446\|PILER-CR	315752-315777	26	NZ_MF547664	Clostridioides difficile strain LIBA-6289 plasmid LIBA6289, complete sequence	7434-7459	4	0.846
NC_009446_2	2.2\|315608\|26\|NC_009446\|PILER-CR	315608-315633	26	NZ_CP015734	Arthrobacter sp. U41 plasmid unnamed2, complete sequence	162075-162100	5	0.808
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	NZ_CP019281	Escherichia coli strain 13P484A plasmid p13P484A-1, complete sequence	30528-30559	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	AP012536	Stx2-converting phage Stx2a_1447 proviral DNA, complete genome	9299-9330	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	JQ182728	Enterobacteria phage mEp460, complete genome	34861-34892	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	KF030445	Escherichia phage 1720a-02, complete genome	36616-36647	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	NC_003444	Enterobacteria phage SfV, complete genome	28700-28731	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	NC_049941	Stx2-converting phage Stx2a_WGPS2 proviral DNA, complete genome	9299-9330	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	U82619	Shigella flexneri bacteriophage V, complete genome	28700-28731	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	NC_009514	Phage cdtI DNA, complete genome	37944-37975	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	LR595862	Escherichia virus Lambda_2H10 genome assembly, chromosome: 1	36240-36271	7	0.781
NC_009446_1	1.3\|179157\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179157-179188	32	NC_049832	Escherichia phage vB_EcoS-DELF2 DNA, complete genome	16338-16369	7	0.781
NC_009446_1	1.7\|179397\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179397-179428	32	MT774401	CrAssphage cr6_1, complete genome	16098-16129	7	0.781
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	MF807953	Escherichia phage Ayreon, complete genome	35979-36010	8	0.75
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	MT225100	Escherichia phage Lys8385Vzw, complete genome	36000-36031	8	0.75
NC_009446_1	1.3\|179157\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179157-179188	32	MT682715	Escherichia phage vB_EcoS_Chapo, complete genome	698-729	8	0.75
NC_009446_1	1.4\|179217\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179217-179248	32	NZ_CP040760	Paracoccus sp. 2251 plasmid unnamed6, complete sequence	58645-58676	8	0.75
NC_009446_1	1.5\|179277\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179277-179308	32	NC_011246	Borrelia recurrentis A1 plasmid pl124, complete sequence	62158-62189	8	0.75
NC_009446_1	1.5\|179277\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179277-179308	32	NC_011247	Borrelia duttonii Ly plasmid pl165, complete sequence	100482-100513	8	0.75
NC_009446_1	1.6\|179337\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179337-179368	32	NC_009517	Psychrobacter sp. PRwf-1 plasmid pRWF102, complete sequence	979-1010	8	0.75
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	NC_004313	Salmonella phage ST64B, complete genome	31420-31451	9	0.719
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	KU927493	Salmonella phage 118970_sal3, complete genome	69032-69063	9	0.719
NC_009446_1	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	AY055382	Salmonella typhimurium phage ST64B complete sequence	31420-31451	9	0.719

1. spacer 2.1|315560|26|NC_009446|PILER-CR matches to NZ_MF547664 (Clostridioides difficile strain LIBA-6289 plasmid LIBA6289, complete sequence) position: , mismatch: 4, identity: 0.846

aatctccacaactacaatctttatct	CRISPR spacer
tatctctacaactacaatctgtatca	Protospacer
 *****.************* ****

2. spacer 2.3|315656|26|NC_009446|PILER-CR matches to NZ_MF547664 (Clostridioides difficile strain LIBA-6289 plasmid LIBA6289, complete sequence) position: , mismatch: 4, identity: 0.846

aatctccacaactacaatctttatct	CRISPR spacer
tatctctacaactacaatctgtatca	Protospacer
 *****.************* ****

3. spacer 2.5|315752|26|NC_009446|PILER-CR matches to NZ_MF547664 (Clostridioides difficile strain LIBA-6289 plasmid LIBA6289, complete sequence) position: , mismatch: 4, identity: 0.846

aatctccacaactacaatctttatct	CRISPR spacer
tatctctacaactacaatctgtatca	Protospacer
 *****.************* ****

4. spacer 2.2|315608|26|NC_009446|PILER-CR matches to NZ_CP015734 (Arthrobacter sp. U41 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.808

catgttcgccgatgcaaccgcagtta	CRISPR spacer
cgagttcgcggatgcaaccgcagtgc	Protospacer
*. ****** **************

5. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP019281 (Escherichia coli strain 13P484A plasmid p13P484A-1, complete sequence) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

6. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to AP012536 (Stx2-converting phage Stx2a_1447 proviral DNA, complete genome) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

7. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to JQ182728 (Enterobacteria phage mEp460, complete genome) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

8. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to KF030445 (Escherichia phage 1720a-02, complete genome) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

9. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_003444 (Enterobacteria phage SfV, complete genome) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

10. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_049941 (Stx2-converting phage Stx2a_WGPS2 proviral DNA, complete genome) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

11. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to U82619 (Shigella flexneri bacteriophage V, complete genome) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

12. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_009514 (Phage cdtI DNA, complete genome) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

13. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to LR595862 (Escherichia virus Lambda_2H10 genome assembly, chromosome: 1) position: , mismatch: 7, identity: 0.781

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaaccaatagctg	Protospacer
 .**************** ******  **..*

14. spacer 1.3|179157|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_049832 (Escherichia phage vB_EcoS-DELF2 DNA, complete genome) position: , mismatch: 7, identity: 0.781

tgtcgaactaaacgatgaccagatttggttaa-	CRISPR spacer
cgtggaacttaacgatgaccaga-ttgatgagg	Protospacer
.** ***** ************* ***.* *.

15. spacer 1.7|179397|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to MT774401 (CrAssphage cr6_1, complete genome) position: , mismatch: 7, identity: 0.781

---gctatagttatcgagtccagaaaaaataaagt	CRISPR spacer
caggcta---acatagagtctagaaaaaataaagt	Protospacer
   ****    .** *****.**************

16. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to MF807953 (Escherichia phage Ayreon, complete genome) position: , mismatch: 8, identity: 0.75

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaatcagtcaatgaaccaatagctg	Protospacer
 .********.******* ******  **..*

17. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to MT225100 (Escherichia phage Lys8385Vzw, complete genome) position: , mismatch: 8, identity: 0.75

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaatcagtcaatgaaccaatagctg	Protospacer
 .********.******* ******  **..*

18. spacer 1.3|179157|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to MT682715 (Escherichia phage vB_EcoS_Chapo, complete genome) position: , mismatch: 8, identity: 0.75

tgtcgaactaaacgatgaccagatttggttaa-	CRISPR spacer
cgtggaacttaacgatgaccaga-tcgatgagg	Protospacer
.** ***** ************* *.*.* *.

19. spacer 1.4|179217|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP040760 (Paracoccus sp. 2251 plasmid unnamed6, complete sequence) position: , mismatch: 8, identity: 0.75

tatcgcagccacagcgtcgcgcaagtattagc	CRISPR spacer
gtcggcagccacagcgtcgcgcaggcattggg	Protospacer
  . *******************.*.***.*

20. spacer 1.5|179277|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_011246 (Borrelia recurrentis A1 plasmid pl124, complete sequence) position: , mismatch: 8, identity: 0.75

-gccgcaacatttctggctcatttaaatataag	CRISPR spacer
aaccatta-atttctagatcatttaaatataaa	Protospacer
 .**.. * ******.* **************.

21. spacer 1.5|179277|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_011247 (Borrelia duttonii Ly plasmid pl165, complete sequence) position: , mismatch: 8, identity: 0.75

-gccgcaacatttctggctcatttaaatataag	CRISPR spacer
aaccatta-atttctagatcatttaaatataaa	Protospacer
 .**.. * ******.* **************.

22. spacer 1.6|179337|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_009517 (Psychrobacter sp. PRwf-1 plasmid pRWF102, complete sequence) position: , mismatch: 8, identity: 0.75

gtaaaccatcaaaataacgtcaaattgggtta	CRISPR spacer
tttaaccatcaaaataacgtgaaaatgtgggt	Protospacer
 * ***************** *** ** *

23. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_004313 (Salmonella phage ST64B, complete genome) position: , mismatch: 9, identity: 0.719

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaatcaaaaacca	Protospacer
 .**************** ***.** .*..*.

24. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to KU927493 (Salmonella phage 118970_sal3, complete genome) position: , mismatch: 9, identity: 0.719

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaatcaaaaacca	Protospacer
 .**************** ***.** .*..*.

25. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to AY055382 (Salmonella typhimurium phage ST64B complete sequence) position: , mismatch: 9, identity: 0.719

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
agtcaaagaaccagtcaatgaatcaaaaacca	Protospacer
 .**************** ***.** .*..*.

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

396937 : 407337

Bacillus_phage(33.33%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012030703.1\|396937_398572_+	CTP synthase	A0A1J0FA14	Only_Syngen_Nebraska_virus	7.7e-149	51.4
WP_012030704.1\|398568_399402_+	3-deoxy-8-phosphooctulonate synthase	E3T537	Cafeteria_roenbergensis_virus	5.4e-50	44.2
WP_012030705.1\|399398_400691_+	phosphopyruvate hydratase	W6LP63	Streptococcus_phage	2.7e-125	56.1
WP_012030706.1\|400748_401231_+	septum formation initiator family protein	NA	NA	NA	NA
WP_012030707.1\|401330_403190_+	ABC transporter ATP-binding protein	W8CYL7	Bacillus_phage	1.6e-22	26.0
WP_012030708.1\|403190_404381_+	exonuclease SbcCD subunit D C-terminal domain-containing protein	A0A217ER54	Bacillus_phage	6.9e-06	23.7
WP_012030709.1\|404370_407337_+	AAA family ATPase	A0A1D8KPW1	Synechococcus_phage	2.0e-09	26.1

DBSCAN-SWA_2

507668 : 513752

Staphylococcus_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012030808.1\|507668_508775_-	bifunctional 3,4-dihydroxy-2-butanone-4-phosphate synthase/GTP cyclohydrolase II	A0A2H4PQS2	Staphylococcus_phage	4.4e-55	36.2
WP_012030809.1\|508787_509432_-	riboflavin synthase	A0A2H4PQS5	Staphylococcus_phage	3.3e-31	34.6
WP_041729443.1\|509446_510508_-	bifunctional diaminohydroxyphosphoribosylaminopyrimidine deaminase/5-amino-6-(5-phosphoribosylamino)uracil reductase RibD	A0A1V0SE20	Indivirus	5.5e-47	31.8
WP_012030811.1\|510524_510992_-	transcriptional regulator NrdR	NA	NA	NA	NA
WP_012030812.1\|511007_512261_-	serine hydroxymethyltransferase	A0A240F2Y9	Aeromonas_phage	6.4e-103	53.9
WP_012030813.1\|512439_513213_+	segregation/condensation protein A	A0A1B1IVW1	uncultured_Mediterranean_phage	8.1e-08	33.3
WP_012030814.1\|513209_513752_+	SMC-Scp complex subunit ScpB	A0A1B1IVT7	uncultured_Mediterranean_phage	9.4e-19	35.4

DBSCAN-SWA_3

674078 : 683705

Hokovirus(16.67%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012030963.1\|674078_676463_+	phosphoenolpyruvate synthase	A0A1V0SGR7	Hokovirus	1.4e-167	35.4
WP_041729866.1\|676519_677206_-	uracil-DNA glycosylase	A0A0B4Q626	Equid_gammaherpesvirus	9.6e-53	47.6
WP_012030965.1\|677211_677610_-	MliC family protein	NA	NA	NA	NA
WP_012030966.1\|677579_679445_-	transglycosylase SLT domain-containing protein	K4NWI2	Pseudomonas_phage	1.5e-15	41.0
WP_123962257.1\|679460_680153_-	lytic transglycosylase domain-containing protein	A0A1P8CWQ1	Bacillus_phage	2.5e-24	48.5
WP_081423615.1\|680155_681106_-	lytic transglycosylase domain-containing protein	A0A0H3V0Q1	Geobacillus_virus	1.8e-28	51.0
WP_012030969.1\|681705_682596_-	DUF4339 domain-containing protein	NA	NA	NA	NA
WP_012030970.1\|682607_683705_-	toxic anion resistance protein	A0A2K9VCT6	Lactobacillus_phage	4.2e-18	21.9

DBSCAN-SWA_4

790933 : 839041

Vibrio_phage(12.0%)

integrase,terminase,protease,capsid,tail

attL 782235:782251|attR 838181:838197

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
782235:782251	attL	NA	NA	NA	NA
WP_012031072.1\|790933_792208_+\|terminase	PBSX family phage terminase large subunit	M5AAD7	Nitratiruptor_phage	2.9e-71	38.8
WP_041729522.1\|792204_793098_+	DUF935 family protein	NA	NA	NA	NA
WP_041729524.1\|793134_793662_+	hypothetical protein	NA	NA	NA	NA
WP_012031073.1\|793658_795158_+\|capsid	minor capsid protein	A0A0M3LSH7	Mannheimia_phage	2.1e-20	31.1
WP_041729526.1\|795154_795577_+	hypothetical protein	NA	NA	NA	NA
WP_012031074.1\|795668_796067_+	DUF2190 family protein	NA	NA	NA	NA
WP_012031075.1\|796077_796899_+	hypothetical protein	NA	NA	NA	NA
WP_012031076.1\|796901_797888_+\|capsid	major capsid protein	S5MC94	Escherichia_phage	1.1e-14	24.0
WP_012031077.1\|797909_798377_+	DUF1320 domain-containing protein	A0A2P9JZJ4	Alteromonadaceae_phage	4.0e-10	40.0
WP_012031078.1\|798373_798799_+	phage virion morphogenesis protein	U5PS82	Bacillus_virus	7.9e-05	33.3
WP_012031079.1\|798779_799247_+	hypothetical protein	NA	NA	NA	NA
WP_012031080.1\|799243_800011_+	hypothetical protein	NA	NA	NA	NA
WP_012031081.1\|800013_800241_+	hypothetical protein	NA	NA	NA	NA
WP_012031082.1\|800248_800458_+	hypothetical protein	F6MIM2	Haemophilus_phage	8.6e-05	63.6
WP_012031083.1\|800494_804466_+\|tail	phage tail tape measure protein	A0A1B2LRQ0	Wolbachia_phage	2.4e-47	33.1
WP_012031084.1\|804462_804867_+	hypothetical protein	A0A076G8B9	Pseudoalteromonas_phage	7.2e-08	33.0
WP_012031085.1\|804875_808505_+	hypothetical protein	A0A0M4U447	Ralstonia_phage	8.6e-185	34.0
WP_012031086.1\|808506_809373_+	hypothetical protein	V5Q9G7	Xylella_phage	2.2e-06	36.8
WP_148188635.1\|809344_809710_+	hypothetical protein	NA	NA	NA	NA
WP_041729892.1\|810267_811383_+	hypothetical protein	NA	NA	NA	NA
WP_012031089.1\|811391_811619_+	hypothetical protein	NA	NA	NA	NA
WP_049752493.1\|811633_812068_-	hypothetical protein	NA	NA	NA	NA
WP_041729532.1\|812054_812669_-	hypothetical protein	NA	NA	NA	NA
WP_012031091.1\|812665_814279_-	DEAD/DEAH box helicase family protein	Q6VSX2	Vibrio_phage	7.3e-43	28.9
WP_012031092.1\|814327_815422_-	hypothetical protein	NA	NA	NA	NA
WP_012031093.1\|815573_816242_-	hypothetical protein	NA	NA	NA	NA
WP_012031094.1\|816362_816617_-	hypothetical protein	NA	NA	NA	NA
WP_187145766.1\|816634_817093_-	single-stranded DNA-binding protein	A0A2I7RK19	Vibrio_phage	1.4e-36	56.9
WP_012031096.1\|817102_817960_-	YqaJ viral recombinase family protein	A0A2I7RHL2	Vibrio_phage	1.1e-24	34.7
WP_012031097.1\|817956_818562_-	ERF family protein	O48415	Enterobacteria_phage	7.5e-25	40.8
WP_012031098.1\|818587_818920_-	hypothetical protein	NA	NA	NA	NA
WP_148188636.1\|818919_819177_-	hypothetical protein	NA	NA	NA	NA
WP_012031100.1\|819314_820748_-	DUF4041 domain-containing protein	A0A1B0Y697	Lactobacillus_phage	7.7e-44	46.4
WP_148188642.1\|820876_821626_-	helix-turn-helix domain-containing protein	Q7Y5W5	Haemophilus_phage	1.3e-39	38.4
WP_081423590.1\|821940_822114_+	helix-turn-helix domain-containing protein	A0A0R6PED6	Moraxella_phage	7.6e-07	58.0
WP_012031102.1\|822195_822459_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_012031103.1\|822459_823347_+	helix-turn-helix domain-containing protein	D0UIL5	Aggregatibacter_phage	1.3e-25	39.4
WP_012031104.1\|823351_824116_+	ATP-binding protein	A0A1Y0T033	Pseudomonas_phage	1.4e-31	41.2
WP_041729540.1\|824362_824878_+	hypothetical protein	A0A0P0J0J7	Acinetobacter_phage	7.5e-10	50.7
WP_049752494.1\|824870_825815_+	KilA-N domain-containing protein	I6R977	Salmonella_phage	4.0e-17	35.1
WP_041729542.1\|825811_826231_+	hypothetical protein	NA	NA	NA	NA
WP_012031105.1\|826233_826611_+	RusA family crossover junction endodeoxyribonuclease	A0A1J0GV15	Halomonas_phage	7.7e-12	39.0
WP_012031106.1\|826604_826961_+	hypothetical protein	NA	NA	NA	NA
WP_012031108.1\|827195_827603_+	hypothetical protein	NA	NA	NA	NA
WP_012031109.1\|828100_829300_-\|integrase	site-specific integrase	A7X7X0	Dichelobacter_phage	2.0e-231	100.0
WP_081423591.1\|829441_830461_+	MBL fold metallo-hydrolase	NA	NA	NA	NA
WP_012031111.1\|830501_830921_+	OsmC family protein	NA	NA	NA	NA
WP_012031112.1\|831000_832341_+	MATE family efflux transporter	NA	NA	NA	NA
WP_012031113.1\|832327_832822_+	dihydrofolate reductase	A0A0N9S8H6	Staphylococcus_phage	4.5e-28	40.9
WP_012031114.1\|832818_833265_-	winged helix DNA-binding protein	NA	NA	NA	NA
WP_161802473.1\|833330_833501_-	hypothetical protein	NA	NA	NA	NA
WP_012031116.1\|833825_835031_-	O-antigen ligase family protein	NA	NA	NA	NA
WP_012031117.1\|835027_835948_-	peptide-methionine (R)-S-oxide reductase MsrB	NA	NA	NA	NA
WP_012031118.1\|836560_837130_+	LemA family protein	A0A0C5K8T5	Enterococcus_phage	3.0e-07	25.1
WP_012031119.1\|837136_839041_+\|protease	M48 family metalloprotease	NA	NA	NA	NA
838181:838197	attR	NA	NA	NA	NA

DBSCAN-SWA_5

856223 : 870326

Hokovirus(18.18%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_041729907.1\|856223_857576_-	phosphoglucosamine mutase	A0A127AWJ1	Bacillus_phage	3.2e-15	25.6
WP_012031139.1\|857584_858979_-	Na+/H+ antiporter NhaA	A0A2H4J5W3	uncultured_Caudovirales_phage	6.1e-62	39.1
WP_012031140.1\|859099_859915_+	2,3,4,5-tetrahydropyridine-2,6-dicarboxylate N-succinyltransferase	NA	NA	NA	NA
WP_012031141.1\|860059_860533_+	NADPH-dependent 7-cyano-7-deazaguanine reductase QueF	E7DN65	Pneumococcus_phage	1.9e-47	59.3
WP_012031142.1\|860548_861223_+	7-cyano-7-deazaguanine/7-aminomethyl-7- deazaguanine transporter	A0A2I7SAW6	Vibrio_phage	4.2e-53	52.0
WP_012031143.1\|861219_862455_-	phosphate regulon sensor histidine kinase PhoR	A0A1V0SGX0	Hokovirus	6.2e-18	27.2
WP_012031144.1\|862469_863309_-	response regulator	A0A1V0SGR9	Hokovirus	2.2e-06	31.4
WP_081423617.1\|863326_864085_-	DNA repair protein RadC	A0A1B2LRS6	Wolbachia_phage	1.6e-08	24.7
WP_012031146.1\|864761_865958_+	bifunctional phosphopantothenoylcysteine decarboxylase/phosphopantothenate--cysteine ligase CoaBC	Q9HH70	Methanothermobacter_phage	1.1e-43	33.6
WP_012031147.1\|865938_866403_+	dUTP diphosphatase	G0YQD9	Erwinia_phage	2.4e-39	57.0
WP_012031148.1\|866547_867111_+	nucleotide exchange factor GrpE	NA	NA	NA	NA
WP_012031149.1\|867219_869148_+	molecular chaperone DnaK	A0A0N9QXN8	Chrysochromulina_ericina_virus	3.7e-150	51.2
WP_012031150.1\|869201_870326_+	molecular chaperone DnaJ	E3T4P7	Cafeteria_roenbergensis_virus	2.5e-26	34.7

DBSCAN-SWA_6

939847 : 953204

Bacillus_phage(20.0%)

protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012031215.1\|939847_940975_-	D-alanyl-D-alanine carboxypeptidase	B6DZZ7	Stx2-converting_phage	3.9e-59	39.8
WP_049752499.1\|941014_942490_-	HAMP domain-containing protein	Q8QNA2	Ectocarpus_siliculosus_virus	1.9e-05	25.9
WP_012031217.1\|942467_943157_-	response regulator transcription factor	W8CYM9	Bacillus_phage	2.8e-28	34.1
WP_119185628.1\|943230_944667_+\|protease	DegQ family serine endoprotease	A0A1B1IT49	uncultured_Mediterranean_phage	9.4e-26	29.7
WP_012031219.1\|944722_945412_-	response regulator	W8CYM9	Bacillus_phage	2.6e-26	33.6
WP_012031220.1\|945460_946003_-	oligoribonuclease	Q8B5Y0	Diachasmimorpha_longicaudata_entomopoxvirus	1.0e-25	37.7
WP_012031221.1\|946051_946711_-	4'-phosphopantetheinyl transferase superfamily protein	NA	NA	NA	NA
WP_012031222.1\|946732_947434_-	DNA polymerase III subunit epsilon	A0A1X9SH08	Bradyrhizobium_phage	6.8e-38	45.8
WP_012031223.1\|947435_949052_-	phospho-sugar mutase	A0A1X9I671	Streptococcus_phage	1.3e-68	35.2
WP_012031224.1\|949076_950411_-	thymidine phosphorylase	A0A0H3UZD4	Geobacillus_virus	6.2e-72	38.1
WP_012031225.1\|950425_951169_-	deoxyribose-phosphate aldolase	NA	NA	NA	NA
WP_012031226.1\|951371_953204_-	anaerobic ribonucleoside-triphosphate reductase	A0A060AN10	Cronobacter_phage	1.1e-201	57.2

DBSCAN-SWA_7

993315 : 1000410

Bacteriophage(16.67%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012031268.1\|993315_995313_-	DNA polymerase III subunit gamma/tau	A0A1L2BWV7	Bacteriophage	2.4e-43	34.5
WP_012031269.1\|995519_996956_-	peptidoglycan-binding protein	NA	NA	NA	NA
WP_012031270.1\|996964_997558_-	NUDIX domain-containing protein	A0A1S6L1P8	Vibrio_phage	1.2e-14	29.8
WP_012031271.1\|997559_998261_-	peptidoglycan DD-metalloendopeptidase family protein	G3MBP9	Bacillus_virus	6.9e-06	38.9
WP_012031272.1\|998257_999010_-	5'/3'-nucleotidase SurE	A0A1B1ITZ2	uncultured_Mediterranean_phage	1.0e-55	45.9
WP_012031273.1\|999153_999804_+	NERD domain-containing protein	A0A2R2ZH57	Clostridioides_phage	3.0e-19	34.4
WP_012031274.1\|999807_1000410_-	septal ring lytic transglycosylase RlpA family protein	F5B3X9	Synechococcus_phage	2.3e-26	65.4

DBSCAN-SWA_8

1117909 : 1125753

Vibrio_phage(16.67%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012031385.1\|1117909_1119781_-	RNA polymerase sigma factor RpoD	A0A2I7SAT0	Vibrio_phage	4.5e-36	33.1
WP_012031386.1\|1119881_1121537_-	DNA primase	A0A1S5RFR1	Helicobacter_phage	5.2e-44	35.1
WP_012031387.1\|1121548_1122001_-	GatB/YqeY domain-containing protein	A0A292GL36	Xanthomonas_phage	6.4e-13	38.9
WP_012031388.1\|1122003_1122219_-	30S ribosomal protein S21	NA	NA	NA	NA
WP_012031389.1\|1122396_1122960_-	TIGR00730 family Rossman fold protein	A0A2I2L3F0	Orpheovirus	4.1e-17	29.9
WP_012031390.1\|1123004_1124279_-	TRAM domain-containing protein	A0A2K5B251	Erysipelothrix_phage	6.4e-34	27.5
WP_041729592.1\|1124345_1124471_-	50S ribosomal protein L36	NA	NA	NA	NA
WP_012031391.1\|1124643_1125753_-	3-dehydroquinate synthase	C7U071	Ostreococcus_tauri_virus	1.3e-27	34.3

DBSCAN-SWA_9

1130701 : 1145709

Bacillus_phage(28.57%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012031397.1\|1130701_1138366_-	Hpt domain-containing protein	W8CYM9	Bacillus_phage	1.9e-11	30.8
WP_012031398.1\|1138425_1139736_-	methyl-accepting chemotaxis protein	A0A2H4J162	uncultured_Caudovirales_phage	1.7e-18	33.0
WP_012031399.1\|1139750_1140272_-	chemotaxis protein CheW	NA	NA	NA	NA
WP_012031400.1\|1140268_1140631_-	response regulator	A0A220YL79	Alteromonas_virus	2.4e-10	29.5
WP_012031401.1\|1140667_1141051_-	response regulator	W8CYM9	Bacillus_phage	5.8e-15	38.6
WP_012031402.1\|1141152_1141542_-	Holliday junction resolvase RuvX	NA	NA	NA	NA
WP_012031403.1\|1141635_1142583_+	thioredoxin-disulfide reductase	A0A2I2L5E1	Orpheovirus	1.0e-60	45.6
WP_012031404.1\|1142609_1144358_+	dihydrolipoyl dehydrogenase	A0A2K5B2C5	Erysipelothrix_phage	5.7e-41	27.7
WP_012031405.1\|1144442_1145276_+	phosphatidylserine decarboxylase	NA	NA	NA	NA
WP_012031406.1\|1145256_1145709_+	ribonuclease HI	J9Q745	Salmonella_phage	4.3e-33	45.7

Anti-CRISPR protein detection

Acr_ID: NC_009446.1|WP_012031102.1|822195_822459_+|helix-turn-helix-domain-containing-protein

Click the colored protein region to show detailed information

Acr ID

Acr position

Acr size

Homology with known anti

Neighbor HTH/AcRanker

Neighbor Aca

In prophage

Protospacer in prophage

NC_009446.1|WP_012031102.1|822195_822459_+|helix-turn-helix-domain-containing-protein

822195_822459_+

87 aa aa

HTH_36,HTH_3

Identity	Hit_domain_coverage
NA	NA

790933-839041

yes

CRISPR ID	CRISPR type	Spacer info	Spacer location	Spacer length	Protospacer location	Mismatch
NC_009446_1	TypeI-F	1.1\|179037\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179037-179068	32	822923-822954	0
NC_009446_1	TypeI-F	1.2\|179097\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179097-179128	32	791357-791388	0
NC_009446_1	TypeI-F	1.3\|179157\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179157-179188	32	824416-824447	0
NC_009446_1	TypeI-F	1.4\|179217\|32\|NC_009446\|PILER-CR,CRISPRCasFinder,CRT	179217-179248	32	791606-791637	1

1. spacer 1.1|179037|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_009446 position: 822923-822954, mismatch: 0

tatcaaagaaccagtcaaggaaccatgagtcg	CRISPR spacer
tatcaaagaaccagtcaaggaaccatgagtcg	Protospacer
********************************

2. spacer 1.2|179097|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_009446 position: 791357-791388, mismatch: 0

attcgcaaacaaaacagcgaaatttgggcgag	CRISPR spacer
attcgcaaacaaaacagcgaaatttgggcgag	Protospacer
********************************

3. spacer 1.3|179157|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_009446 position: 824416-824447, mismatch: 0

tgtcgaactaaacgatgaccagatttggttaa	CRISPR spacer
tgtcgaactaaacgatgaccagatttggttaa	Protospacer
********************************

4. spacer 1.4|179217|32|NC_009446|PILER-CR,CRISPRCasFinder,CRT matches to NC_009446 position: 791606-791637, mismatch: 1

tatcgcagccacagcgtcgcgcaagtattagc	CRISPR spacer
tatcgcagccacagcgccgcgcaagtattagc	Protospacer
****************.***************

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_009446

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

Click the colored protein region to show detailed information