CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP016043	Edwardsiella hoshinae strain ATCC 35051 chromosome, complete genome	4 crisprs	DEDDh,cas3,cas8e,cse2gr11,cas6e,cas7,cas5,cas1,cas2,csa3,DinG	0	9	3	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP016043_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016043_1

873489-874065

TypeI-E

Consensus_repeat	Method
GCTTTCCCCACGACCGTGGGGGTGTTTC	PILER-CR
GCTTTCCCCACGACCGTGGGGGTGTTTC	CRISPRCasFinder
GCTTTCCCCACGACCGTGGGGGTGTTTC	CRT

9 spacers

cas2,cas1,cas5,cas7,cas6e,cse2gr11,cas8e,cas3

The CRISPR arrays of NZ_CP016043_1

>merge|NZ_CP016043|1|873489-874065|PILER-CR,CRISPRCasFinder,CRT
GCTTTCCCCACGACCGTGGGGGTGTTTCTGACCCGTTTCTCCTTGGCGCGCTCAATAACCGGCTTTCCCCACGACCGTGGGGGTGTTTCTGGCATCCTGCCCATAGCGCCCTCGGGTATCCGGCTTTCCCCACGACCGTGGGGGTGTTTCCATGAAAGTCCCCTCCGGAACTAAGACTGAGGAGCTTTCCCCACGACCGTGGGGGTGTTTCTGTGGCCCCCTCCAGCGACTCATACTCCTGACCGCTTTCCCCACGACCGTGGGGGTGTTTCTAAACTAGGGACTGATTATTATTTTTATATACGGCTTTCCCCACGACCGTGGGGGTGTTTCTGGCGCTCCGCCTGCTACCGATGCAGATGACCGGCTTTCCCCACGACCGTGGGGGTGTTTCCGGGCCCGGCAAGCACTGGGCCTAACTCAATCGGCTTTCCCCACGACCGTGGGGGTGTTTCTGCCGTTATCAGGCGCATGGTGGCGGAGTATCCGCTTTCCCCACGACCGTGGGGGTGTTTCCTGATCCAGATCGCTCTGGCCATTTACCGCCTGGCTTTCCCCACGACCGTGGGTGGACGTA

>NZ_CP016043|1|1|873489-874004|PILER-CR
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGACCCGTTTCTCCTTGGCGCGCTCAATAACCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGGCATCCTGCCCATAGCGCCCTCGGGTATCCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	CATGAAAGTCCCCTCCGGAACTAAGACTGAGGA
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGTGGCCCCCTCCAGCGACTCATACTCCTGACC
GCTTTCCCCACGACCGTGGGGGTGTTTC	TAAACTAGGGACTGATTATTATTTTTATATACG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGGCGCTCCGCCTGCTACCGATGCAGATGACCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	CGGGCCCGGCAAGCACTGGGCCTAACTCAATCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGCCGTTATCAGGCGCATGGTGGCGGAGTATCC
GCTTTCCCCACGACCGTGGGGGTGTTTC

>NZ_CP016043|1|1|873489-874065|CRISPRCasFinder
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGACCCGTTTCTCCTTGGCGCGCTCAATAACCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGGCATCCTGCCCATAGCGCCCTCGGGTATCCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	CATGAAAGTCCCCTCCGGAACTAAGACTGAGGA
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGTGGCCCCCTCCAGCGACTCATACTCCTGACC
GCTTTCCCCACGACCGTGGGGGTGTTTC	TAAACTAGGGACTGATTATTATTTTTATATACG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGGCGCTCCGCCTGCTACCGATGCAGATGACCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	CGGGCCCGGCAAGCACTGGGCCTAACTCAATCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGCCGTTATCAGGCGCATGGTGGCGGAGTATCC
GCTTTCCCCACGACCGTGGGGGTGTTTC	CTGATCCAGATCGCTCTGGCCATTTACCGCCTG
GCTTTCCCCACGACCGTGGGTGGACGTA

>NZ_CP016043|1|1|873489-874065|CRT
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGACCCGTTTCTCCTTGGCGCGCTCAATAACCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGGCATCCTGCCCATAGCGCCCTCGGGTATCCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	CATGAAAGTCCCCTCCGGAACTAAGACTGAGGA
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGTGGCCCCCTCCAGCGACTCATACTCCTGACC
GCTTTCCCCACGACCGTGGGGGTGTTTC	TAAACTAGGGACTGATTATTATTTTTATATACG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGGCGCTCCGCCTGCTACCGATGCAGATGACCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	CGGGCCCGGCAAGCACTGGGCCTAACTCAATCG
GCTTTCCCCACGACCGTGGGGGTGTTTC	TGCCGTTATCAGGCGCATGGTGGCGGAGTATCC
GCTTTCCCCACGACCGTGGGGGTGTTTC	CTGATCCAGATCGCTCTGGCCATTTACCGCCTG
GCTTTCCCCACGACCGTGGGTGGACGTA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016043.1\|WP_070244596.1\|887024_887363_+\|STAS-domain-containing-protein	unknown	unknown	gnl\|CDD\|132914
NZ_CP016043.1\|WP_024523133.1\|881010_881247_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_083274988.1\|873149_873455_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	cd09648_cas2_CAS-I-E	gnl\|CDD\|187779
NZ_CP016043.1\|WP_070244583.1\|867872_869357_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	cas8e	pfam09481_cas8e_CAS-I-E	gnl\|CDD\|187860
NZ_CP016043.1\|WP_070244389.1\|864083_864638_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_070244582.1\|865223_867869_+\|CRISPR-associated-helicase-Cas3'	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|182031
NZ_CP016043.1\|WP_070244581.1\|861467_862325_-\|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD	unknown	unknown	gnl\|CDD\|236760
NZ_CP016043.1\|WP_070244587.1\|871570_872284_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09756_cas5_CAS-I-E	gnl\|CDD\|273842
NZ_CP016043.1\|WP_156774553.1\|880313_880478_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_156774603.1\|885079_885628_+\|lipid-IV(A)-palmitoyltransferase-PagP	unknown	unknown	gnl\|CDD\|236829
NZ_CP016043.1\|WP_070244593.1\|882739_884617_-\|bifunctional-glutathionylspermidine-amidase/synthase	unknown	unknown	gnl\|CDD\|182504
NZ_CP016043.1\|WP_070244585.1\|869874_870531_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	pfam08798_cas6e_CAS-I-E:CAS-IV	gnl\|CDD\|273869
NZ_CP016043.1\|WP_024523134.1\|882302_882635_+\|acid-resistance-protein	unknown	unknown	gnl\|CDD\|183204
NZ_CP016043.1\|WP_081702253.1\|877610_878099_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377158
NZ_CP016043.1\|WP_070244584.1\|869353_869878_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	cse2gr11	cd09731_cse2gr11_CAS-I-E	gnl\|CDD\|187862
NZ_CP016043.1\|WP_070244590.1\|876180_876384_+\|type-II-toxin-antitoxin-system-prevent-host-death-family-antitoxin	unknown	unknown	gnl\|CDD\|273688
NZ_CP016043.1\|WP_083275060.1\|885765_887001_+\|SpoIIE-family-protein-phosphatase	unknown	unknown	gnl\|CDD\|225118
NZ_CP016043.1\|WP_070244588.1\|872287_873169_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NZ_CP016043.1\|WP_024523759.1\|876905_877451_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|365939
NZ_CP016043.1\|WP_070244586.1\|870523_871567_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	cas7	pfam09344_cas7_CAS-I-E	gnl\|CDD\|378153

Protein	Function_ID	Function_description	E-value
NZ_CP016043.1\|WP_070244596.1\|887024_887363_+\|STAS-domain-containing-protein	gnl\|CDD\|132914	cd07043, STAS_anti-anti-sigma_factors, Sulphate Transporter and Anti-Sigma factor antagonist) domain of anti-anti-sigma factors, key regulators of anti-sigma factors by phosphorylation. Anti-anti-sigma factors play an important role in the regulation of several sigma factors and their corresponding anti-sigma factors. Upon dephosphorylation they bind the anti-sigma factor and induce the release of the sigma factor from the anti-sigma factor. In a feedback mechanism the anti-anti-sigma factor can be inactivated via phosphorylation by the anti-sigma factor. Well studied examples from Bacillus subtilis are SpoIIAA (regulating sigmaF and sigmaC which play an important role in sporulation) and RsbV (regulating sigmaB involved in the general stress response). The STAS domain is also found in the C- terminal region of sulphate transporters and stressosomes.	2.7525e-24
NZ_CP016043.1\|WP_083274988.1\|873149_873455_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|187779	cd09648, Cas2_I-E, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	3.43455e-30
NZ_CP016043.1\|WP_070244588.1\|872287_873169_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	5.36424e-119
NZ_CP016043.1\|WP_070244582.1\|865223_867869_+\|CRISPR-associated-helicase-Cas3'	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	1.27418e-92
NZ_CP016043.1\|WP_081702253.1\|877610_878099_-\|hypothetical-protein	gnl\|CDD\|377158	pfam03895, YadA_anchor, YadA-like membrane anchor domain. This region represents the C-terminal 120 amino acids of a family of surface-exposed bacterial proteins. YadA, an adhesin from Yersinia, was the first member of this family to be characterized. UspA2 from Moraxella was second. The Eib immunoglobulin-binding proteins from E. coli were third, followed by the DsrA proteins of Haemophilus ducreyi and others. These proteins are homologous at their C-terminal and have predicted signal sequences, but they diverge elsewhere. The C-terminal 9 amino acids, consisting of alternating hydrophobic amino acids ending in F or W, comprise a targeting motif for the outer membrane of the Gram negative cell envelope. This region is important for oligomerization.	9.85335e-06
NZ_CP016043.1\|WP_070244581.1\|861467_862325_-\|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD	gnl\|CDD\|236760	PRK10792, PRK10792, bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD.	0
NZ_CP016043.1\|WP_070244587.1\|871570_872284_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|273842	TIGR01868, hypothetical_protein, CRISPR-associated protein Cas5/CasD, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is part of the ECOLI subtype CRISPR/Cas locus, and now characterized as part of the CASCADE complex of that system. It shares a small N-terminal homology region with members of several other CRISPR/Cas subtypes, and we view the families that share this region as being Cas5.	4.99473e-55
NZ_CP016043.1\|WP_156774603.1\|885079_885628_+\|lipid-IV(A)-palmitoyltransferase-PagP	gnl\|CDD\|236829	PRK11045, pagP, lipid IV(A) palmitoyltransferase PagP.	8.72214e-103
NZ_CP016043.1\|WP_070244593.1\|882739_884617_-\|bifunctional-glutathionylspermidine-amidase/synthase	gnl\|CDD\|182504	PRK10507, PRK10507, bifunctional glutathionylspermidine amidase/glutathionylspermidine synthetase; Provisional.	0
NZ_CP016043.1\|WP_070244585.1\|869874_870531_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|273869	TIGR01907, CRISPR_system_Cascade_subunit_CasE, CRISPR-associated protein Cas6/Cse3/CasE, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model family, represented by CT1974 from Chlorobium tepidum, is found in the Ecoli subtype of CRISPR/Cas regions and is designated Cse3 (CRISPR/Cas Subtype Ecoli protein 3). The representative of this family from Thermus thermophilus HB8 (TTHB192) has been crystallized and found to have a structure consisting of two domains with opposing parallel beta-sheets known as a beta-sheet platform. This structure is similar to those found in the Sex-lethal protein and poly(A)-binding protein. This structure is consistent with an RNA-binding function.	3.61155e-45
NZ_CP016043.1\|WP_024523134.1\|882302_882635_+\|acid-resistance-protein	gnl\|CDD\|183204	PRK11566, hdeB, acid-activated periplasmic chaperone HdeB.	1.4058e-31
NZ_CP016043.1\|WP_070244583.1\|867872_869357_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	gnl\|CDD\|187860	cd09729, Cse1_I-E, CRISPR/Cas system-associated protein Cse1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Large proteins, some contain Zn-finger domain; subunit of the Cascade complex; signature gene for I-E subtype; also known as Cse1/CasA/YgcL family.	2.77191e-72
NZ_CP016043.1\|WP_070244584.1\|869353_869878_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	gnl\|CDD\|187862	cd09731, Cse2_I-E, CRISPR/Cas system-associated protein Cse2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; also known as Cse2/CasB/YgcK family; specific gene for I-E subtype;.	2.33168e-22
NZ_CP016043.1\|WP_070244590.1\|876180_876384_+\|type-II-toxin-antitoxin-system-prevent-host-death-family-antitoxin	gnl\|CDD\|273688	TIGR01552, Hypothetical_protein_Rv3357/MT3465/Mb3392., prevent-host-death family protein. This model recognizes a region of about 55 amino acids toward the N-terminal end of bacterial proteins of about 85 amino acids in length. The best-characterized member is prevent-host-death (phd) of bacteriophage P1, the antidote partner of death-on-curing (doc) (TIGR01550) in an addiction module. Addiction modules prevent plasmid curing by killing the host cell as the longer-lived killing protein persists while the gene for the shorter-lived antidote is lost. Note, however, that relatively few members of this family appear to be plasmid or phage-encoded. Also, there is little overlap, except for phage P1 itself, of species with this family and with the doc family. [Cellular processes, Toxin production and resistance, Mobile and extrachromosomal element functions, Other].	9.8058e-08
NZ_CP016043.1\|WP_083275060.1\|885765_887001_+\|SpoIIE-family-protein-phosphatase	gnl\|CDD\|225118	COG2208, RsbU, Serine phosphatase RsbU, regulator of sigma subunit [Signal transduction mechanisms / Transcription].	2.05102e-41
NZ_CP016043.1\|WP_024523759.1\|876905_877451_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|365939	pfam00196, GerE, Bacterial regulatory proteins, luxR family.	2.79698e-10
NZ_CP016043.1\|WP_070244586.1\|870523_871567_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	gnl\|CDD\|378153	pfam09344, Cas_CT1975, CT1975-like protein. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum.	9.63055e-111

>NZ_CP016043.1|WP_083274988.1|873149_873455_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MLIVLANDLPPAVRGRMKLWFIEPRPNTFVSGIKDSVADTVIEYLYQHCSPAAGVVIFKSVARTPGYQIHTIGSPTKTLCEITGLQLVVEKRLEQQVNYNM
>NZ_CP016043.1|WP_070244588.1|872287_873169_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MSGGGQRLFVKITRESLPQVKDKYPFIYLERGRLEIDDSSLKWLDAEGQVVRLPVATLNAILLGPGTSLTHEAVKTAAAANCAICWVGEDSLLFYAAGFLPTANTRNLNHQMRLACNKKSSLEVARRMFAYRFPDADLAGKGLKEMMGMEGSRVRALYQQKAQQYGVGWRGRQYIPGKMEISDTTNRVLTSVNAALYGILCSALHAMGYSPHMGFIHSGSPLPFVYDLADLYKENLCIDLAFSLTREMAGRYEKALVSSRFRERVIELNLLASVARDIPQLLGGVNIDADSAS
>NZ_CP016043.1|WP_070244587.1|871570_872284_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MNQPYLLLWLEGPLQSWGHDSRFGRRETLHFPTKSGVLGLVCAALGAGGPQISLLAQFADLDMQVHSFARRHKNGELAPREPLLRDFHMVGSGYDDKDPWQSLLIPKTSEGKKAVGGGTKMTYRYYLQDQAFAVLLQIPNALLTEVAQALQNPVWDLSLGRKTCVPSEFIFQGQFANRDDALTAAFNLAEQKQRTQDFMVIQGAVEGGELLILNDVPLQFGQHKRYRDRQVTLINEG
>NZ_CP016043.1|WP_070244586.1|870523_871567_+|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC
MNNALKNTRIEFHILQSFPVTCLNRDDVGAPKTAVVGGVTRARVSSQCWKRQVRLAMQAFGVKLGIRTKKVADLVTEHCIKLGAAQEPAQACASKIAELLADDTLLFISDSEAEALADYAREQGFDSNKIKDKELAKRAKKNRNPALDALDIALFGRMVAKAADMNVEAAASFSHAISTHKVANEVEFFTALDDRQEESGSAHMGSLEFNSATYYRYISLDLGQLADTMSGDELNKEQLKQAIAVFTKALFVAVPAARQTTQSGASPWEFAKVLVRKGQRLQVPFEEPVKAAGHGFLVPSVAALKGYISKKEALTGSLFGKLGDYEWGEDETFSLDHLIAKLQNHVE
>NZ_CP016043.1|WP_070244585.1|869874_870531_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MTLYASVLRLDRAAVKALRVTDLYSLHRVVYALFEDVRSEAQKQASVPSGIQWVDKGGDHRCRQILLLSDRLPQAGEYGEVESRPLPDDFLSHRHYRFAVTVSPTRRDNQSRQLKPVKGREAIADWFIERAATNWGFYIAPERIQVDDVRVAQFKGKAERAITLQQATLNGYLTVTDPERFALSVASGVGRGRAFGCGLLQVVPLIDPPLFLTRNHHE
>NZ_CP016043.1|WP_070244584.1|869353_869878_+|type-I-E-CRISPR-associated-protein-Cse2/CasB
MNMQPQASQRREVDFVAYICQRCQKDKGFAARLCRADNPATEYQSWDTLAAFGINLEWAEERQPFALIAAAVARSDQACNGTLPLGQAIALAFSEGRESDQAKARLRRLLACDDTEEVCRILRPLLMLIRSRVNQPLDYAALLVDLRWFHRSADRAKARWAQQFYGRQEKEITA
>NZ_CP016043.1|WP_070244583.1|867872_869357_+|type-I-E-CRISPR-associated-protein-Cse1/CasA
MEHCFNLIDEPWIPVTDNGRVGLKDIFTHPEYRALGGNPVQKAAILKLLQAIAQAASTPQDLKAWQQLGWQGMAERVCCYLAQWRDRFYLYGPIPFLQMPAIAKAAIKSFGTVQPDVATGNTTVLTQSQAEQPLDDGERALLLITQMGFALGGKKTDNSVVLTPGYSGKSNDKGKPSTGKPGPSVAYMGLLHNYCLGSSLLESIWLNLFTEAEIVDLTLYPSGLGIAPWEKMPEGEDCHVAKQLKGSLMGRLVPLCRFCLLADEGLHYSEGIAHGNYKEGVFDPSVAIDISGKEPKVRWADPERRPWRELTSLLGFIDQGGKSLDCYQIKLALRKAKKQVARFAIWSGGLRVSSNAGEQYVSGSDDMVESLCWLSPSHVNELWFNRFQTEIGQLDGLAKTLYGCVMSYYKAQMMDGESLAKQASNLFWQLCERQSQALIDGCDEVKARQQLRRQFARYTTQVFDQFCPHQTARQMDAWAKTKPNLSVYLQQEQS
>NZ_CP016043.1|WP_070244582.1|865223_867869_+|CRISPR-associated-helicase-Cas3'
MINRRRKSTDTESAIAAVPFELCPAKTYKDRQGVPHLGRSVFNHCQIVGQTAKALLERIPATIRYPLFPRGSALQAALHDIGKISPTFFLKLQCAVEGEDSPWLQRMSQFRGIQEREWGGHAGVSELALAAITNNPFVPSVAGQHHGFNPPEVMLTADAPPLGGAPWQTERCKLVEALQRAMGEALPVITTPAQARILAGLTSVADWIGSGPHFEDPAIPWQPRIEQALDDAGFILPKVRNGLTFGDIFASEDGVPYQPNEPQQLLHQYTQGVGVYVLEAPMGLGKTEAALYAAYKMLEEGRATGIYFALPTQLTSNKLLDRFNGYLKQILTEESPHRHSLLLHGNAWLANHALGEEGKPGRSWFNCAKRGLLAPFAVGTLDQALMAAMNVKHGFVRAFGLVGKVVILDEVHSYDAYTGVILDELIRLLRTLHCTVIILSATLSQARRSELLGQPAQQDAYPLISVSPGITPSPLQELSVTPEEPRTVYLQCKAMADQTVLEEVLKRASQGQQVLWIENTVAEAQERYLDLATRAQELGVACGLLHSRFTALHRQKNEAHWVGCYGKVGRAARREQGRILIGTQVLEQSLDIDADFLVSRMAPSDMLFQRLGRLWRHEQTPRPPEAIREAWILAPDLDAARQDPYQAFGATAHVYSPYLLCRSLEVWLVQVKVGMVSLPEHIRTLVESTYRERSEDDAMARWKRELFEGSHRRKGVNTLRQLARLTLSKGGKTLPEAKAQTRYSEQESGDLLLLSGLSLNNHDQATTLTFLDGEQIVIPWHGHRLTPAEWRNRAARVTQHLVSCCLSQLPRPAERLWCQKTGLGHVLYLGNPDQDDAAISIALVATDHQLHAVDGRSAPLSDRLSYRYRDDIGLIITQYKE
>NZ_CP016043.1|WP_070244389.1|864083_864638_+|hypothetical-protein
MERFILSGTCFYELNGLRYLLQEAGYPVFDEVAVKTFGPDDVFVLALSAEPLLGWGRHVRYIRHCRRRLPCRMVVLVPPSLGTLRVFDGTCPVISGHLPRAELISQLLTLCRDALALPREPQSPFRLLNVKQGGSRRQLLQQYRENTPLRRMAKSDYYHRGRLLDVLGIEKMQTLSIVGQELLS
>NZ_CP016043.1|WP_070244581.1|861467_862325_-|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD
MTAKIIDGKTIAQQVRSEVAAQVQQRLAEGKRAPGLAVIMVGDDPASRIYVGSKKRACEEVGFLSRAYALPENTHQAELLALIDTLNADAAIDGILVQLPLPAGIDNSKVLERIRPDKDVDGFHPYNLGRLCQRTPKLRPCTPRGIITLLERCGIETQGMDAVMVGASNIVGRPMALELLLAGCTTTITHSRTRDLQQHVERADLIVAAVGKPNFIPGAWVKPGAVVIDVGINRLESGKVVGDVDFAGAAQRASWITPVPGGVGPMTVATLMQNTLQACEAFHDC
>NZ_CP016043.1|WP_070244590.1|876180_876384_+|type-II-toxin-antitoxin-system-prevent-host-death-family-antitoxin
MLIYTSTQARAKISAVLDAVSRGEVVEITRRNGAVAVVISKAEFEVYQKVKLDNECDSQIIAFQLSR
>NZ_CP016043.1|WP_024523759.1|876905_877451_-|helix-turn-helix-transcriptional-regulator
MTQVTVYTDNNLLANFICDLILNIEENASILEYQPLKLLRCENEIIVFNLIRSSHNIVATINFLNKYKIRLSRMIVSMIVPSKLIDLCLELSLFKISYLLTEKSTPNDYARLLHGNIPSAAPRKNILSCRERTILQLLLQEYSPQGVANELHISYKTVCAHKLNIMKKLQLKNLSGIFMYC
>NZ_CP016043.1|WP_081702253.1|877610_878099_-|hypothetical-protein
MHDKVKAYSDQLNQAESAARLEADKTELSARLAGDKQEQATRLESDQKEQSARAQADYAESIARANGDKQTLASANHYTDEKVNRTEKRLNAGLAGIAAISSIPYVNGNTFSYGVGVGNYRNGNAAAMGMQYKISHNINARLNASWDSSHNTAVGFGLAAGW
>NZ_CP016043.1|WP_156774553.1|880313_880478_+|hypothetical-protein
MLIAHIPALPLRYRGKRGSVGLVLEATDGLCQLYALRLQRGGGFANGGGWLLGT
>NZ_CP016043.1|WP_024523133.1|881010_881247_-|hypothetical-protein
MSQKNRQVRFILLFIIFFIVLIAVGNIIVKRRISPQLVETEVRNIKLTAEAQSIIKAQITREPAQQRAISESVRSLPQ
>NZ_CP016043.1|WP_024523134.1|882302_882635_+|acid-resistance-protein
MKVNTTFLGASALALTLALAGSACAQEPTMTTVTTPETMTCHEFTQMNPKAMTPVMVWVVNQDRQYKGGDYVDWQKIQTVMVPKVMKICKEQPGKKVIEFRNQVQDLISD
>NZ_CP016043.1|WP_070244593.1|882739_884617_-|bifunctional-glutathionylspermidine-amidase/synthase
MSVETHHNDAPFGTLLGYAPGGVAIYSSDYSTLDPRVYPDEASLRSYIDDEYMGHKWQCVEFARRFLFINYGVVFTDVGMAYEIFSLRFLRQVVNDNLLPLYAFANGSPRPPVAGALLIWQKGGEFKGTGHVAVITQLRGDKVRIAEQNVIHAPLPPGQQWTRELTLQRENGRYTIQDTFDDTEILGWMIHTEDARDSLAQPTLAPQAMAIHAARRPDRALFEGRWLNEDDPVELSYVQANQGHVINHDPSQYFTISESAEQELIKATNELHLMYLHATDKVLRDDSLLALFDIPKILWPRLRLSWQQRRHCMITGRLDFCMDERGLKVYEYNADSASCHTEAGLILQHWAERGDGVNGYNPGEDLLNELAGAWRHSHAHPFVHIMQDEDEEESYHALFMQRALSQAGFDSKIVKGLAPLRWDATGQLIDDEGRLVTCVWKTWAWETAIEQVREVSDAEYAAVPIRTGKPEKQVRLIDVLLRPEIMVFEPLWTVIPGNKAILPILWSLFPNHRYLLNTDFVPNTALARSGYAVKPIGGRCGSNIDLVSRHEEVLDTTSGKFHDQKNIYQQLWCLPQVADKHIQVCTFTVGGSYGGACLRSDRSLVIKKESDIEPLVVLKDSAFLR
>NZ_CP016043.1|WP_156774603.1|885079_885628_+|lipid-IV(A)-palmitoyltransferase-PagP
MHHYISALASLCAFFTWGASASTPSLVETLRANVVQTWQQPQHHDFYLPAITWHARFAYSREKIESYNERPWGAGFGQSRWDEKGNWHGLYLMAFKDSFNKWEPIGGYGWEATWRPIADSDFHWGAGYTLGVTMRDNWKYIPIPVVLPMASLGYGPLTMQMTYIPGTYNNGNVYFAWLRFQF
>NZ_CP016043.1|WP_083275060.1|885765_887001_+|SpoIIE-family-protein-phosphatase
MVAENSLLADTVLIVDDSPGYRRLLATILARWQYRVIEAEDGEQALACLARHQVHIVISDWEMPLMDGATLCRAIRAQDYGHYVYLILLTIRQSSEDLVAGMEAGADDFLTKPLNQGQLRSRLHAAQRIIQLESTLAARNATLAHAYQQIESDLQAAAAMQRSLLPSHDQTINGYHADWLFLPSTYVSGDLLNYFMLDAHHLGFYCVDVAGHGVSAAMLAQSVAREFTSALLTHSLLFRSPDTSPAAPQAVVSELNRRFCLEPQDDGIVRYFTLIYGVLDTRDGRLRLCQAGHPTPLWFQADGGLRRVGDGGLPIGLFDWATYEDHALLLAPGDRLCLYSDGISECYSPQGEQFGEARLCQVLQAPRPTSVPATLARLAEALAQWHSPAAVTPRQPFADDISLLMITRCAD
>NZ_CP016043.1|WP_070244596.1|887024_887363_+|STAS-domain-containing-protein
MNIAVEEWEGVTVVSPLIRRLDASVAGIFRQEVVTLIEQGHHQLLLDFSQVDFIDSSCLGALVSLLKLLNNRGDLRLCGLNDNILGMFRITRMDRVFHIGVDRQQALARQFG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP016043_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016043_2

991737-991821

Orphan

Consensus_repeat	Method
CCGTTATATCCGCAGGCGGGGAGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP016043_2

>merge|NZ_CP016043|2|991737-991821|CRISPRCasFinder
CCGTTATATCCGCAGGCGGGGAGGCGTCGCCGTGGCCGCTCGCCAGGCCTTCATAGTCGATCCGTTATATCCGCAGGCGGGGGAG

>NZ_CP016043|2|2|991737-991821|CRISPRCasFinder
CCGTTATATCCGCAGGCGGGGAGG	CGTCGCCGTGGCCGCTCGCCAGGCCTTCATAGTCGAT
CCGTTATATCCGCAGGCGGGGGAG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016043.1\|WP_024523235.1\|1000222_1001443_+\|2-oxoglutarate-dehydrogenase-complex-dihydrolipoyllysine-residue-succinyltransferase	unknown	unknown	gnl\|CDD\|235571
NZ_CP016043.1\|WP_070244634.1\|997355_1000163_+\|2-oxoglutarate-dehydrogenase-E1-component	unknown	unknown	gnl\|CDD\|236499
NZ_CP016043.1\|WP_024523236.1\|1001522_1002689_+\|ADP-forming-succinate--CoA-ligase-subunit-beta	unknown	unknown	gnl\|CDD\|234813
NZ_CP016043.1\|WP_070244632.1\|986967_987711_+\|type-2-GTP-cyclohydrolase-I	unknown	unknown	gnl\|CDD\|182741
NZ_CP016043.1\|WP_024523230.1\|993780_994170_+\|succinate-dehydrogenase-cytochrome-b556-subunit	unknown	unknown	gnl\|CDD\|181900
NZ_CP016043.1\|WP_024523219.1\|982519_983020_+\|lactoylglutathione-lyase-family-protein	unknown	unknown	gnl\|CDD\|132684
NZ_CP016043.1\|WP_070244633.1\|988956_989676_-\|LuxR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|377050
NZ_CP016043.1\|WP_024523229.1\|991857_993141_-\|citrate-synthase	unknown	unknown	gnl\|CDD\|180164
NZ_CP016043.1\|WP_024523221.1\|983469_984423_+\|DUF523-and-DUF1722-domain-containing-protein	unknown	unknown	gnl\|CDD\|225811
NZ_CP016043.1\|WP_024523220.1\|983172_983376_+\|YbfA-family-protein	unknown	unknown	gnl\|CDD\|371211
NZ_CP016043.1\|WP_024523227.1\|990476_990815_-\|phnA-family-protein	unknown	unknown	gnl\|CDD\|182315
NZ_CP016043.1\|WP_024523231.1\|994163_994511_+\|succinate-dehydrogenase-membrane-anchor-subunit	unknown	unknown	gnl\|CDD\|181901
NZ_CP016043.1\|WP_024523225.1\|988307_988976_+\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|366292
NZ_CP016043.1\|WP_024523233.1\|996296_997013_+\|succinate-dehydrogenase-iron-sulfur-subunit	unknown	unknown	gnl\|CDD\|235652
NZ_CP016043.1\|WP_083274991.1\|985849_986911_+\|3',5'-cyclic-nucleotide-phosphodiesterase	unknown	unknown	gnl\|CDD\|293821
NZ_CP016043.1\|WP_024523228.1\|991109_991646_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|182270
NZ_CP016043.1\|WP_070244631.1\|984432_985863_+\|deoxyribodipyrimidine-photo-lyase	unknown	unknown	gnl\|CDD\|236734
NZ_CP016043.1\|WP_024523238.1\|1004256_1005819_+\|cytochrome-ubiquinol-oxidase-subunit-I	unknown	unknown	gnl\|CDD\|185052
NZ_CP016043.1\|WP_024523237.1\|1002688_1003567_+\|succinate--CoA-ligase-subunit-alpha	unknown	unknown	gnl\|CDD\|180194
NZ_CP016043.1\|WP_024523232.1\|994511_996278_+\|succinate-dehydrogenase-flavoprotein-subunit	unknown	unknown	gnl\|CDD\|181594

Protein	Function_ID	Function_description	E-value
NZ_CP016043.1\|WP_024523235.1\|1000222_1001443_+\|2-oxoglutarate-dehydrogenase-complex-dihydrolipoyllysine-residue-succinyltransferase	gnl\|CDD\|235571	PRK05704, PRK05704, 2-oxoglutarate dehydrogenase complex dihydrolipoyllysine-residue succinyltransferase.	0
NZ_CP016043.1\|WP_070244634.1\|997355_1000163_+\|2-oxoglutarate-dehydrogenase-E1-component	gnl\|CDD\|236499	PRK09404, sucA, 2-oxoglutarate dehydrogenase E1 component; Reviewed.	0
NZ_CP016043.1\|WP_024523236.1\|1001522_1002689_+\|ADP-forming-succinate--CoA-ligase-subunit-beta	gnl\|CDD\|234813	PRK00696, sucC, ADP-forming succinate--CoA ligase subunit beta.	0
NZ_CP016043.1\|WP_070244632.1\|986967_987711_+\|type-2-GTP-cyclohydrolase-I	gnl\|CDD\|182741	PRK10799, PRK10799, type 2 GTP cyclohydrolase I.	5.14382e-158
NZ_CP016043.1\|WP_024523230.1\|993780_994170_+\|succinate-dehydrogenase-cytochrome-b556-subunit	gnl\|CDD\|181900	PRK09487, sdhC, succinate dehydrogenase cytochrome b556 subunit.	1.06124e-69
NZ_CP016043.1\|WP_024523219.1\|982519_983020_+\|lactoylglutathione-lyase-family-protein	gnl\|CDD\|132684	TIGR03645, glyox_marine, lactoylglutathione lyase family protein. Members of this protein family share homology with lactoylglutathione lyase (glyoxalase I) and are found mainly in marine members of the gammaproteobacteria, including CPS_0532 from Colwellia psychrerythraea 34H. This family excludes a well-separated, more narrowly distributed paralogous family, exemplified by CPS_3492 from C. psychrerythraea. The function is of this protein family is unknown.	2.54965e-113
NZ_CP016043.1\|WP_070244633.1\|988956_989676_-\|LuxR-family-transcriptional-regulator	gnl\|CDD\|377050	pfam03472, Autoind_bind, Autoinducer binding domain. This domain is found a a large family of transcriptional regulators. This domain specifically binds to autoinducer molecules.	1.61416e-35
NZ_CP016043.1\|WP_024523229.1\|991857_993141_-\|citrate-synthase	gnl\|CDD\|180164	PRK05614, gltA, citrate synthase.	0
NZ_CP016043.1\|WP_024523221.1\|983469_984423_+\|DUF523-and-DUF1722-domain-containing-protein	gnl\|CDD\|225811	COG3272, COG3272, Uncharacterized conserved protein [Function unknown].	7.14228e-73
NZ_CP016043.1\|WP_024523220.1\|983172_983376_+\|YbfA-family-protein	gnl\|CDD\|371211	pfam10725, DUF2517, Protein of unknown function (DUF2517). This family is conserved in Proteobacteria. Several members are annotated as being protein YbfA. The function is not known.	2.50278e-31
NZ_CP016043.1\|WP_024523227.1\|990476_990815_-\|phnA-family-protein	gnl\|CDD\|182315	PRK10220, PRK10220, phnA family protein.	2.40871e-69
NZ_CP016043.1\|WP_024523231.1\|994163_994511_+\|succinate-dehydrogenase-membrane-anchor-subunit	gnl\|CDD\|181901	PRK09488, sdhD, succinate dehydrogenase membrane anchor subunit.	7.22518e-50
NZ_CP016043.1\|WP_024523225.1\|988307_988976_+\|GNAT-family-N-acetyltransferase	gnl\|CDD\|366292	pfam00765, Autoind_synth, Autoinducer synthase.	1.00115e-77
NZ_CP016043.1\|WP_024523233.1\|996296_997013_+\|succinate-dehydrogenase-iron-sulfur-subunit	gnl\|CDD\|235652	PRK05950, sdhB, succinate dehydrogenase iron-sulfur subunit; Reviewed.	4.26723e-168
NZ_CP016043.1\|WP_083274991.1\|985849_986911_+\|3',5'-cyclic-nucleotide-phosphodiesterase	gnl\|CDD\|293821	cd07735, class_II_PDE_MBL-fold, class II cyclic nucleotide phosphodiesterases Saccharomyces cerevisiae PDE1, Dictyostelium discoideum PDE1 and PDE7, and related proteins; MBL-fold metallo-hydrolase domain. Cyclic nucleotide phosphodiesterases (PDEs) decompose the second messengers cyclic adenosine and guanosine 3',5'-monophosphate (cAMP and cGMP, respectively). Saccharomyces cerevisiae PDE1 and Dictyostelium discoideum PDE1 and PDE7, have dual cAMP/cGMP specificity. Members of this subgroup belong to the MBL-fold metallo-hydrolase superfamily which is comprised mainly of hydrolytic enzymes which carry out a variety of biological functions.	2.14658e-90
NZ_CP016043.1\|WP_024523228.1\|991109_991646_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|182270	PRK10151, PRK10151, 50S ribosomal protein L7/L12-serine acetyltransferase.	1.87909e-45
NZ_CP016043.1\|WP_070244631.1\|984432_985863_+\|deoxyribodipyrimidine-photo-lyase	gnl\|CDD\|236734	PRK10674, PRK10674, deoxyribodipyrimidine photolyase; Provisional.	0
NZ_CP016043.1\|WP_024523238.1\|1004256_1005819_+\|cytochrome-ubiquinol-oxidase-subunit-I	gnl\|CDD\|185052	PRK15097, PRK15097, cytochrome bd-I ubiquinol oxidase subunit CydA.	0
NZ_CP016043.1\|WP_024523237.1\|1002688_1003567_+\|succinate--CoA-ligase-subunit-alpha	gnl\|CDD\|180194	PRK05678, PRK05678, succinyl-CoA synthetase subunit alpha; Validated.	0
NZ_CP016043.1\|WP_024523232.1\|994511_996278_+\|succinate-dehydrogenase-flavoprotein-subunit	gnl\|CDD\|181594	PRK08958, sdhA, succinate dehydrogenase flavoprotein subunit; Reviewed.	0

>NZ_CP016043.1|WP_024523228.1|991109_991646_-|GNAT-family-N-acetyltransferase
MQHTILQAGPELQLIPAHPRFAQALFTLVEQNREYLCRFLSWPHSMVHVDNLSQSLHAQAEAHHAGSARHYIIHYQQHCIGVIALNSIDHQRRCAPIGYWLAQSYQGKGLISASLQALMQHYVARREVTRFVIQCISDNLRSNAVARRNGFTLVETRHQACELEGIRYDQNTYLRRFD
>NZ_CP016043.1|WP_024523227.1|990476_990815_-|phnA-family-protein
MQLPHCPKCHSEYTYQDNDMYICPECAYEWNDATDAAPEEESLIVKDANGNLLADGDSVTVIKDLKVKGSSSMLKIGTKVKNIRLVEGDHNIDCKIDGFGPMKLKSEFVKKN
>NZ_CP016043.1|WP_070244633.1|988956_989676_-|LuxR-family-transcriptional-regulator
MIADNESLAQDIKLFIDQSLSYYGQLQFAYLLLNKKNPTEITIISNYPDEWVKLYQEHHYQQIDPVVICALRRTSPFLWDEKITVNAKLNLSKIFSLAKKYQVNKGYTFVLHDAENQLAMLSMMVDEHSLNIVEQNQGALQMLLINAHERFMAGQRQIQAQQHNIKNNNMENIFSARENEILYWASMGKTYQEIALILGIKSGTVKFHIGNVVKKLGVLNAKHAIRLGVELQLIKPVER
>NZ_CP016043.1|WP_024523225.1|988307_988976_+|GNAT-family-N-acetyltransferase
MFEIFAVDYQSLSRTTSSELFSLRKDTFKDRLNWAVNCSDGMEFDEYDSEHTTYLLGVKDNDVVCSVRLIETRYHNMIVGTFFQYFAKAEIPASSQFFESSRFFVDKYRARTLLANQYPLCHLLFLAMINYTLASGHQGIYTIVSQPMLRILNRSGWNVSVVEQGISEKDQAIYLVYLPADAENQRSLIERINQELQHPWQEALLQAWPLVLEEETISAQPV
>NZ_CP016043.1|WP_070244632.1|986967_987711_+|type-2-GTP-cyclohydrolase-I
MDNWLLEQQINQLLNVAEIQDYAPNGLQVEGRREVRRVITGVTACQALLDAALQAEADAVLVHHGYFWKNETPTIRGMRRQRLKTLLANDINLYAYHLPLDAHPQLGNNAQLAQLLKITPQGLIAPLLPYGDLAEPCSAGEMIGRLERKLHHSVLHSGDNAPALIRRVAWCTGGGQGFIEQAASFGVDAFITGEVSEQTIHTAREMGLHFFAAGHHATERGGVRALGAWLAQEYGLEVTFIDIANPA
>NZ_CP016043.1|WP_083274991.1|985849_986911_+|3',5'-cyclic-nucleotide-phosphodiesterase
MTGDESIWDDRESKQMLTKRILWCGVVGAWLLYGLLALPALAGFQVVALGSGGGLSGDNLPAYLIRHERDTGYVALDAGSTLPGIAKALAQGAFPEASAERAAPWTPQGYVLRELITAYFISHPHLDHVAGLLLAAPEDSRKPIYTLASSAETLRTHYFNWKSWPNFSDAGQGQRLGTYRIHSVRPAQRFSLGNSGMSAQVYPLSHAGVTSAMILLERAGEYFAYFGDTGADSVEQSNHLDRIWRRLGPLLASGALKGMIIETSFSDAVPPSHLFGHLTPRLLNQELVQLARYSGDSAALQGFPVVIAHIKPSLRAGETAEQTIMAQLAAGNRSGVRFHHLRQGEHALFSGRE
>NZ_CP016043.1|WP_070244631.1|984432_985863_+|deoxyribodipyrimidine-photo-lyase
MTTHVVWLRNDLRMNDNRALHAACAAPHARVLALYVATPRQWQMQDMAPRQAQFIWQNLRLLQAELAARHIALHCLSVADYDAQRQAVAQFCDQHQATALFFNRQYELNERRRDAALCATLPIPCHRFDDALLLPPGTVLTGSGQMFKVFTPFKRAFLSLLSQHDIAPLPAPAPRAPQPAAPLLTTPFDYPAAAIDATLFPAGECAALARLAHFCHNDLATYALRRDFPAQAGTSLLSPYLTLGILSPRQCVAAMRERLSCAPNAASGSEAWLNELIWREFYRHLLVAWPDLCRHRPFIAWTARIRWRDDAQGLQHWQQGMTGFPLIDAAMRQLNHCGWMHNRLRMLTASFLVKDLLIDWRLGERYFLSQLLDGDLAANNGGWQWAASTGSDAAPYFRIFNPTTQGQRYDALGLFIRRWLPALRDVPDSEIHHPQRWALRQRRVLDYPDPLVDHARARRDTLLAFQRARAADDDGG
>NZ_CP016043.1|WP_024523221.1|983469_984423_+|DUF523-and-DUF1722-domain-containing-protein
MSSAIPVGISACLLGQTVRFDGGHKRLALACETLAPFFHFLPVCPEMGIGLPSPRPALRLMRREASSEIALVDSRDPSLDYTAAMQAFSARQLPQLHALCGFILCARSPSCGMERVKLYSGQEARKSGVGLFAAALMAAMPWLPVEEDGRLSDALLRENFIARVYALHEFNQLWRQGLTRGALVAFHSRYKLLLLAHSQSDYRALGRLVAAIAQYDSLAQFAADYRVRLMALMRQPATRRNHTNVLQHVQGYFSPRLSAAQRAELSELILQYRQGTQPLLAPLTLLKHYLREYPDDYLASQRYFSPYPDVLRLRYGH
>NZ_CP016043.1|WP_024523220.1|983172_983376_+|YbfA-family-protein
MPYPPYSWSRILLRRCCVILVGALALPVMLWRKDRARFYSYLHRVWCKTSDKPVWLSESEKVKPDFF
>NZ_CP016043.1|WP_024523219.1|982519_983020_+|lactoylglutathione-lyase-family-protein
MAYPRSFSHIGISVTDLARAVDFYTSVMGWYLVMPPTEIREDDSAIGVMCNDVFGPGWGSFRIAHLATGDKIGIELFQFPNSEARVNNFEFWKNGVFHFSVQDPDVEGLAARIVAAGGKQRMPVREYYPGEKPYRMVYMEDPFGNIIEIYSHSYELTYSAGAYQNV
>NZ_CP016043.1|WP_024523229.1|991857_993141_-|citrate-synthase
MADNKATLTVGSERIELDVLSGTLGYDEIDIRKLGSHGYFTFDPGFTSTASCESQITYIDGDEGILLHRGYPIDQLAKHSSFLEVCYILLYGEPPTQAEYDTFKTTVTRHTMIHEQITRLLQGFRRDSHPMAVMCGVTGALAAFYHDSLDISNERHREIAAFRLLSKMPTVAAMCYKYSLGQPFIYPQNDLSYAGNFLRMMFATPCEEYQVNPVLERAMDRILILHADHEQNASTSTVRTAGSSGANPFACIAAGIASLWGPAHGGANEACLKMLEEINHVDHIPAFIKRAKDKNDSFRLMGFGHRVYKNYDPRATVMRETCHEVLKELGMNDNLLEVALELEHIALNDPYFIEKKLYPNVDFYSGIILKAMGIPSTMFTVIFAIARTVGWIAHWNEMHEDGLKIARPRQLYTGYARRDFSSQLERR
>NZ_CP016043.1|WP_024523230.1|993780_994170_+|succinate-dehydrogenase-cytochrome-b556-subunit
MGNTVKKQRPVNLDLPTIRFPITAIASILHRVSGVIVFVSIAILLWLLGLSLSSAEGFAQASALVDGLLVKLVLWGILTALAYHICGGLRHLLMDFGYLEETFSVGCRSAQVAFAVTVLLSICAGVWLW
>NZ_CP016043.1|WP_024523231.1|994163_994511_+|succinate-dehydrogenase-membrane-anchor-subunit
MVSNASALGRNGVQDWLLLRASAIIMTLYVIYLLAFIAVAGPLNYGLWLDFFSSRLTQVFTLLTLLCVLVHAWIGMWQVLTDYVKPLALRLLLQLAIVVVLVVYLGYGTLVVWGI
>NZ_CP016043.1|WP_024523232.1|994511_996278_+|succinate-dehydrogenase-flavoprotein-subunit
MKLPVREFDAVVIGAGGAGMRAALQISQQGFRCALLSKVFPTRSHTVSAQGGITVALGNTHEDNWEWHMYDTVKGSDYIGDQDAIEYMCKTGPDAILELEHMGLPFSRLDDGRIYQRPFGGQSKNFGGEQAARTAAAADRTGHALLHTLYQQNLKNHTTIFSEWYALDLVKNADGAIVGCTALCIETGEVVYFKSRATILATGGAGRIYQSTTNAHINTGDGIGMALRAGVPLQDMEMWQFHPTGIAGAGVLVTEGCRGEGGYLLNKHGERFMERYAPNAKDLAGRDVVARSIMIEIREGRGCDGPWGPHAKLKLDHLGKEVLESRLPGILELSRTFAHVDPVKEPIPVIPTCHYMMGGIPTRISGQALTQDTNGADQVIPGLFAVGEIACVSVHGANRLGGNSLLDLVVFGRSAGLHLAQSLQEQGPLRQASESDIEASLARLHRWNGTRKGEDPAQIRKDLQSCMQHNFSVFREGEAMAQGLAELKTIRERLASARLDDTSSEFNTQRIECLELDNLMATAFATAMAANYRTESRGAHSRFDFPQRDDANWLCHTLYLPESERMVQRHVNMQPKLRAAFPPKVRTY
>NZ_CP016043.1|WP_024523233.1|996296_997013_+|succinate-dehydrogenase-iron-sulfur-subunit
MKLEFSIYRYNPDVDRAPHMQDYTLEAEEGRDMMLLDALIRLKEQDPTLAFRRSCREGVCGSDGVNMNGKNGLACITPISALRRGGRKIVIRPLPGLPVVRDLVVDMGQFYAQYEKIKPYLINDGRTPPAREHLQSPEERAKLDGLYECILCACCSTACPSFWWNPDKFVGPSGLLAAYRFLIDSRDTASAQRLEGLDDAFSVFRCHGIMNCVSVCPKGLNPTRAIGHIKSMLLHREA
>NZ_CP016043.1|WP_070244634.1|997355_1000163_+|2-oxoglutarate-dehydrogenase-E1-component
MQNGTMKAWLDSSYLAGANQSYIEQLYEDYLTDPDSVEHSWKLLFQQLPANGLPPDQFHSQTRDYFRRLAKDPARFGQRFNDPQTDAKQVKVLQLINAFRFRGHQQANLDPLGLWKQEPVPDLDPAFHHLSAEDFDETFNVGSFAVGSETMRLADIYRALQQTYCGTIGAEYMHLTNTDEKRWLQQRLESVMGQPSFNPQEKRRFLRELTAAEGLERYLGAKFPGAKRFSLEGGDALIPMLKELIRHAGLHGTREVVLGMAHRGRLNVLINVLGKHADELFDEFAGKHKDHLGTGDVKYHMGFSSDMATEGGPVHLALAFNPSHLEIVSPVVMGSVRARRDRLDRTRSDIVLPITIHGDAAITGQGIVQETLNMSQARGYEVGGTVRIVINNQIGFTTSNPLDARSSQYCTDIGKMVQAPIFHVNADDPEAVAFVTRLALDFRNTFKRDVFIDLVCYRRHGHNEADEPSATQPVMYQKIKKHPTPRKLYADRLMAQGIVSLEEATEMVNLYRDALDSGGCVVEEWRPMTMHSVTWEPYLHHEWDEPYPHAVETQRLQDLARRISRVPEEVEMQPRVAKIYADRAAMAEGSQPFDWGGAETLAYATLVDEGIPVRLSGEDCGRGTFFHRHAVIHSQKDGALYVPLENVHHAQGDFKVWDSVLSEAAVLAFEYGYASAEPRTLTIWEAQFGDFANGAQVVIDQFISSGEQKWGRLCGLVMLLPHGYEGQGPEHSSARLERYLQLCAQQNIQVCVPSTPAQVYHMLRRQALRGMRRPLVVMSPKSLLRHPLAVSSLEALAQGSFQPAIGEIDALDPQQVKRVVMCSGKVYYDLLEQRRKNGQENVAIVRIEQLYPFPHQAVQAVLAAYTQARDFVWCQEEPLNQGAWYCSQHNLREVIPFGAVLRYAGRPASASPAVGYLSVHREQQQALVDDALHVE
>NZ_CP016043.1|WP_024523235.1|1000222_1001443_+|2-oxoglutarate-dehydrogenase-complex-dihydrolipoyllysine-residue-succinyltransferase
MSSVEILVPDLPESVADATVATWHKQVGESVARDEVLVEIETDKVVLEVPALDAGVLEAILEPEGATVGARQLLGRLRPADVSGVAIGSGPQVAQATPAERHTAALDGGNNDALSPAVRRLVAEHDLDPAALQGSGVGGRLTREDVEKHLSAQPVTPPSAELPRAAASAAPLTAEREKRVPMTRLRKRVAERLLEAKNSTAMLTTFNEVNMQPIMALRSQYGEAFEKRHGVRLGFMSFYVKAVLEALKRYPEVNAALDGEEVVYHNYFDISIAVSTPRGLVTPVLRDVDTLSMAEIEKRIKTLAVKGRDGKLTVEELTGGNFTITNGGVFGSLMSTPIINPPQSAILGMHAIKDRPMAVNGQVVILPMMYLALSYDHRQIDGRESVGFLVTVKEMLEDPTRLLLDI
>NZ_CP016043.1|WP_024523236.1|1001522_1002689_+|ADP-forming-succinate--CoA-ligase-subunit-beta
MNLHEYQAKQLFARYGLPTPVGYACSTPRQAEEAASKIGSGPWVVKCQVHAGGRGKAGGVKCVARKDEIRAFAEQWLGKRLVTYQTDAQGQPVRQILVEGATEIAHELYLGAVIDRSSRRVVFMASTEGGVEIEQVAQQTPHLIHRVALDPLTGPQPYQGRELAFKLGLSGKQAQQFGQIFLGLATLFLQCDLTMAEINPLVITPQGDLLCLDGKLDVDSNALFRQPALREMEDPEQNDAREAHAAQWELNYVALEGNIGCMVNGAGLAMGTMDIVKLHGGAPANFLDVGGGATKERVTEAFKIILSDEHVKAVLVNIFGGIVRCDLIADGIIGAVAEVGVHVPVVVRLEGNNAELGTQILADSGLNIIAATSLTDAARQVVAAVEGK
>NZ_CP016043.1|WP_024523237.1|1002688_1003567_+|succinate--CoA-ligase-subunit-alpha
MSILINRETRVICQGFTGSQGTFHSEQALAYGTRLVGGVTPGKGGGEHLGLPVFNTVREAVQATAASASVIYVPAPFCKDSILEAIDAGITLIICITEGIPTQDMLLVKAKLDQCPGVRMIGPNCPGVITPGECKIGIMPGHIHQPGRIGIVSRSGTLTYEAVKQTSDVGLGQSTCVGIGGDPIPGSSFIDILALFQADPQTDAIVMIGEIGGNAEEEAAAYIKQHVSKPVVAYIAGVTAPKGKRMGHAGAIIAGGKGTADEKFAALEAAGVTTVRSLAEIGQTLLRVLERA
>NZ_CP016043.1|WP_024523238.1|1004256_1005819_+|cytochrome-ubiquinol-oxidase-subunit-I
MFDIVELSRLQFALTAMYHFLFVPLTLGMAFLLAIMETVYVLTGKQIYKDMTKFWGKLFGINFALGVATGLTMEFQFGTNWSYYSHYVGDIFGAPLAIEGLMAFFLESTFVGLFFFGWDRLGKVQHMLTTWLVALGSNLSALWILVANGWMQNPIASDFNFETMRMEMVSFSELVLNPVAQVKFVHTVSAGYVTGAMFILGISAYYLLKGRDLAFAKRSFAIAAAFGMASVIAVILLGDESGYEMGDVQKTKLAAIEAEWETQPAPASFNLIALPDQQTESNHYAVQVPYLLGLIATRSLDTPVIGLKDLMKEHEVRIRNGMKAYQLLQELRTGNTDPAVRDAFNHAKQDLGYGLLLKRYTDNPAQASEEQIAKATKDSIPEVAPLYFAFRIMVGCGILMLLVIFASFYSVVRGRVGEKRWLLRAALLGIPLPWIACEAGWFVAEYGRQPWAIGEVLPTAVANSSLTAGDLWFSIILICGLYTLFLVAELYLMFKFARLGPSSLKTGRYHFEQTHAVDAQ

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP016043_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016043_3

1740587-1740980

Orphan

I-B,III-A,III-B

Consensus_repeat	Method
GAAACACCCCCACAGGCGTGGGGAAGAC	CRISPRCasFinder
CACCCCCACAGGCGTGGGGAAGAC	CRT
GTCTTCCCCACGCCTGTGGGGGTGTTTC	PILER-CR

6 spacers

The CRISPR arrays of NZ_CP016043_3

>merge|NZ_CP016043|3|1740587-1740980|CRISPRCasFinder,CRT,PILER-CR
GAAGCACCCTCACGGGCGTGGGGAAGACCGCTTCACAGAGTAGCTGGCCGACTTCGGTCTAGAACCCCCCCCACAGACGTGGGGAAGACTCATGTCATGAACGTTCATGCGGCTTTTCCTTGGAAACACCCCCACAGGCGTGGGGAAGACTTTTACCTCCTTCGCAAATTTGTGTCCCCAGCGGAAACACCCCCACAGGCGTGGGGAAGACACTGCCTGCACTGGCAAGAGCTACGTGTACTGAGAAACACCCCCACAGGCGTGGGGAAGACGCATCGTCCAGGCGACGACCACGCGCAAAGGGAGAAACACCCCCACAGGCGTGGGGAAGACGCTGTGGTGCTGCTGGCAATGGCATCCAGTGAGGAAACACCCCCACAGGCGTGGGGAAGAC

>NZ_CP016043|3|3|1740587-1740980|CRISPRCasFinder
GAAGCACCCTCACGGGCGTGGGGAAGAC	CGCTTCACAGAGTAGCTGGCCGACTTCGGTCTA
GAACCCCCCCCACAGACGTGGGGAAGAC	TCATGTCATGAACGTTCATGCGGCTTTTCCTTG
GAAACACCCCCACAGGCGTGGGGAAGAC	TTTTACCTCCTTCGCAAATTTGTGTCCCCAGCG
GAAACACCCCCACAGGCGTGGGGAAGAC	ACTGCCTGCACTGGCAAGAGCTACGTGTACTGA
GAAACACCCCCACAGGCGTGGGGAAGAC	GCATCGTCCAGGCGACGACCACGCGCAAAGGGA
GAAACACCCCCACAGGCGTGGGGAAGAC	GCTGTGGTGCTGCTGGCAATGGCATCCAGTGAG
GAAACACCCCCACAGGCGTGGGGAAGAC

>NZ_CP016043|3|2|1740591-1740980|CRT
CACCCTCACGGGCGTGGGGAAGAC	CGCTTCACAGAGTAGCTGGCCGACTTCGGTCTAGAAC
CCCCCCCACAGACGTGGGGAAGAC	TCATGTCATGAACGTTCATGCGGCTTTTCCTTGGAAA
CACCCCCACAGGCGTGGGGAAGAC	TTTTACCTCCTTCGCAAATTTGTGTCCCCAGCGGAAA
CACCCCCACAGGCGTGGGGAAGAC	ACTGCCTGCACTGGCAAGAGCTACGTGTACTGAGAAA
CACCCCCACAGGCGTGGGGAAGAC	GCATCGTCCAGGCGACGACCACGCGCAAAGGGAGAAA
CACCCCCACAGGCGTGGGGAAGAC	GCTGTGGTGCTGCTGGCAATGGCATCCAGTGAGGAAA
CACCCCCACAGGCGTGGGGAAGAC

>NZ_CP016043|3|2|1740648-1740980|PILER-CR
GAACCCCCCCCACAGACGTGGGGAAGAC	TCATGTCATGAACGTTCATGCGGCTTTTCCTTG
GAAACACCCCCACAGGCGTGGGGAAGAC	TTTTACCTCCTTCGCAAATTTGTGTCCCCAGCG
GAAACACCCCCACAGGCGTGGGGAAGAC	ACTGCCTGCACTGGCAAGAGCTACGTGTACTGA
GAAACACCCCCACAGGCGTGGGGAAGAC	GCATCGTCCAGGCGACGACCACGCGCAAAGGGA
GAAACACCCCCACAGGCGTGGGGAAGAC	GCTGTGGTGCTGCTGGCAATGGCATCCAGTGAG
GAAACACCCCCACAGGCGTGGGGAAGAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016043.1\|WP_070244872.1\|1734771_1735650_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377369
NZ_CP016043.1\|WP_156774563.1\|1732044_1734210_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_156774565.1\|1746957_1748108_-\|IS3-family-transposase	unknown	unknown	gnl\|CDD\|222853
NZ_CP016043.1\|WP_070244875.1\|1738461_1739565_+\|replication-protein-O	unknown	unknown	unknown
NZ_CP016043.1\|WP_083275066.1\|1740983_1741880_+\|transcriptional-regulator	unknown	unknown	gnl\|CDD\|378235
NZ_CP016043.1\|WP_083275006.1\|1741809_1742289_+\|DUF968-domain-containing-protein	unknown	unknown	gnl\|CDD\|310615
NZ_CP016043.1\|WP_070244880.1\|1743932_1744484_+\|glycoside-hydrolase-family-108-protein	unknown	unknown	gnl\|CDD\|226439
NZ_CP016043.1\|WP_156774566.1\|1749440_1750736_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_070244885.1\|1750857_1751676_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|274243
NZ_CP016043.1\|WP_070244878.1\|1742567_1743122_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_070244877.1\|1740285_1740561_+\|PerC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|310570
NZ_CP016043.1\|WP_070245634.1\|1737285_1737471_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|373126
NZ_CP016043.1\|WP_070244876.1\|1739561_1740296_+\|DNA-replication-protein	unknown	unknown	gnl\|CDD\|369163
NZ_CP016043.1\|WP_070244881.1\|1745013_1745556_+\|DUF2514-family-protein	unknown	unknown	gnl\|CDD\|287666
NZ_CP016043.1\|WP_156774564.1\|1738127_1738292_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_167352257.1\|1743299_1743470_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_167352271.1\|1736556_1737189_-\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|224885
NZ_CP016043.1\|WP_070244879.1\|1743591_1743930_+\|phage-holin,-lambda-family	unknown	unknown	gnl\|CDD\|368287
NZ_CP016043.1\|WP_070244874.1\|1737647_1738097_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_083275005.1\|1738291_1738465_+\|DUF4222-domain-containing-protein	unknown	unknown	gnl\|CDD\|372855

Protein	Function_ID	Function_description	E-value
NZ_CP016043.1\|WP_070244872.1\|1734771_1735650_-\|hypothetical-protein	gnl\|CDD\|377369	pfam04471, Mrr_cat, Restriction endonuclease. Prokaryotic family found in type II restriction enzymes containing the hallmark (D/E)-(D/E)XK active site. Presence of catalytic residues implicates this region in the enzymatic cleavage of DNA.	0.000890957
NZ_CP016043.1\|WP_156774565.1\|1746957_1748108_-\|IS3-family-transposase	gnl\|CDD\|222853	PHA02517, PHA02517, putative transposase OrfB; Reviewed.	1.62409e-58
NZ_CP016043.1\|WP_070244880.1\|1743932_1744484_+\|glycoside-hydrolase-family-108-protein	gnl\|CDD\|226439	COG3926, zliS, Lysozyme family protein [General function prediction only].	6.31019e-49
NZ_CP016043.1\|WP_070244885.1\|1750857_1751676_+\|hypothetical-protein	gnl\|CDD\|274243	TIGR02642, hypothetical_protein_YPTB1803, uncharacterized phage protein. This uncharacterized protein is found in prophage regions of Shewanella oneidensis MR-1, Vibrio vulnificus YJ016, Yersinia pseudotuberculosis IP 32953, and Aeromonas hydrophila ATCC7966. It appears to have regions of sequence similarity to phage lambda antitermination protein Q. [Mobile and extrachromosomal element functions, Prophage functions].	5.54664e-18
NZ_CP016043.1\|WP_070244877.1\|1740285_1740561_+\|PerC-family-transcriptional-regulator	gnl\|CDD\|310570	pfam06069, PerC, PerC transcriptional activator. PerC is a transcriptional activator of EaeA/BfpA expression in enteropathogenic bacteria.	8.96118e-05
NZ_CP016043.1\|WP_070245634.1\|1737285_1737471_+\|hypothetical-protein	gnl\|CDD\|373126	pfam14549, P22_Cro, DNA-binding transcriptional regulator Cro. Bacteriophage P22 Cro protein represses genes normally expressed in early phage development and is necessary for the late stage of lytic growth. It does this by binding to the OL and OR operator-regions normally used by the repressor protein for lysogenic maintenance.	1.96635e-16
NZ_CP016043.1\|WP_070244876.1\|1739561_1740296_+\|DNA-replication-protein	gnl\|CDD\|369163	pfam06992, Phage_lambda_P, Replication protein P. This family consists of several Bacteriophage lambda replication protein P like proteins. The bacteriophage lambda P protein promoters replication of the phage chromosome by recruiting a key component of the cellular replication machinery to the viral origin. Specifically, P protein delivers one or more molecules of Escherichia coli DnaB helicase to a nucleoprotein structure formed by the lambda O initiator at the lambda replication origin.	4.9901e-74
NZ_CP016043.1\|WP_167352271.1\|1736556_1737189_-\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|224885	COG1974, LexA, SOS-response transcriptional repressors (RecA-mediated autopeptidases) [Transcription / Signal transduction mechanisms].	8.15485e-24
NZ_CP016043.1\|WP_083275006.1\|1741809_1742289_+\|DUF968-domain-containing-protein	gnl\|CDD\|310615	pfam06147, DUF968, Protein of unknown function (DUF968). Family of uncharacterized prophage proteins found in Gammaproteobacteria. These may be HNH-nucleases, as there are several conserved cysteines and histidines.	3.21921e-50
NZ_CP016043.1\|WP_083275066.1\|1740983_1741880_+\|transcriptional-regulator	gnl\|CDD\|378235	pfam09669, Phage_pRha, Phage regulatory protein Rha (Phage_pRha). Members of this protein family are found in temperate phage and bacterial prophage regions. Members include the product of the rha gene of the lambdoid phage phi-80, a late operon gene. The presence of this gene interferes with infection of bacterial strains that lack integration host factor (IHF), which regulates the rha gene. It is suggested that Rha is a phage regulatory protein.	2.19828e-25
NZ_CP016043.1\|WP_070244879.1\|1743591_1743930_+\|phage-holin,-lambda-family	gnl\|CDD\|368287	pfam05106, Phage_holin_3_1, Phage holin family (Lysis protein S). This family represents one of a large number of mutually dissimilar families of phage holins. Holins act against the host cell membrane to allow lytic enzymes of the phage to reach the bacterial cell wall. This family includes the product of the S gene of phage lambda.	2.18976e-32
NZ_CP016043.1\|WP_070244881.1\|1745013_1745556_+\|DUF2514-family-protein	gnl\|CDD\|287666	pfam10721, DUF2514, Protein of unknown function (DUF2514). This family is conserved in bacteria and some viruses. The function is not known.	1.45852e-17
NZ_CP016043.1\|WP_083275005.1\|1738291_1738465_+\|DUF4222-domain-containing-protein	gnl\|CDD\|372855	pfam13973, DUF4222, Domain of unknown function (DUF4222). This short protein is likely to be of phage origin. For example it is found in the Enterobacteria phage YYZ-2008. It is largely found in enteric bacteria. The molecular function of this protein is unknown.	5.66828e-12

>NZ_CP016043.1|WP_070244877.1|1740285_1740561_+|PerC-family-transcriptional-regulator
MRGKPIVWRHHNLRQIQEHMLNAERCEQRGLWRRAGHEWMQVIEHCTDDVLVEYAVQQRNYCAQMGVFGSASIDPRMVAANQCDEPLQDEG
>NZ_CP016043.1|WP_070244876.1|1739561_1740296_+|DNA-replication-protein
MKNLVSAVQRRDAAALSRMAGQPLQERVVNGNAEKLVDVLFENLLLLFPASRNTVFAAPDEVAAMKRQWITAFAEGGITTLEQVKAGVSMARQHGGDFWPSCGRFMEWCREGVRSAGGLPSDDEVLAEFHRYARDKARFASPEAFDWAHPVMYWVVLDVRQRMYRYNYTEAEVLRAIKAQMQRWERNIRAGQRIPTPVKQLVHVQRPPAIADQLDPTGGAGFYQVGVAFLEQIRQRLRGGEHEG
>NZ_CP016043.1|WP_070244875.1|1738461_1739565_+|replication-protein-O
MSSLIQILDRPIAYNPALAKLRAGKVKAGPVAAVFLSQMIYWHNRMGGEWMYKTQADITTETALTRDEQETARKRLVALGVLDEARRGVPATLHYRINVARLEALLLEAATPVATPAPTAKTRTRDIQNSEPSQPGPAHSDQSRMVQSQNVETPQSGLVQPRKLDCGDAANKNVETPQTSMGEPTEQVCGDPANFHTGDYTENTQENKKPSCPDAAQPDEPDSDHDFLSRHPEAVVFSAKKRLWGRQEDLTCAEWIWGRIVRLYELAAEDDGEVVRPKAPNWTVWANEVRLMCHQDGRTHRQICELFGRVNRDPFWCRNVLSPAKLREKWDELVIRLGAPGAGAQDRSLKTLLGADWNTEQGWESVL
>NZ_CP016043.1|WP_083275005.1|1738291_1738465_+|DUF4222-domain-containing-protein
MRIPKQGSYYQDRNGVVVRITGYERESQRVLYRRPGYEWGCASPLVVFNAKFRRYQG
>NZ_CP016043.1|WP_156774564.1|1738127_1738292_+|hypothetical-protein
MHTPTAGLLRLRCRVLPEREDYRYEVNVLGRWWPCNYTLARWTVEYCRQGWGGM
>NZ_CP016043.1|WP_070244874.1|1737647_1738097_+|hypothetical-protein
MGDIKDAVKAMCESMPGGRAAMAGALGMSPTSFNNRLYEKNGCKFFDRHDLEAMEDLSNTHHLADYFAARRGRITVRVQSRDELDPVELFTLATLTAAHKGQVDLAIQHSISDGIINSSEERDILALHSQYVAARDAYVRAIIALHKAQ
>NZ_CP016043.1|WP_070245634.1|1737285_1737471_+|hypothetical-protein
MLKQTVVKHFGSQRAVAQALQVSDSAVSQWKTLIPERAALKLHRITAGKLKYSPCFYQKSS
>NZ_CP016043.1|WP_167352271.1|1736556_1737189_-|helix-turn-helix-domain-containing-protein
MGSRILKRRKELKLSQVTLSKAVGVSNVAISQWERDETAPRGDALLALARELLCPAEYLVNGTPADTPLAIPVALHPKGKYPLLSWTLVNHGSLAIRSYTREKAEHWYSTTVDCSAASFWLTVEGDSMTATAGLSIPEGTAILVDPDRNPTNGKLVVAASLSDDEAIFKRYILDVGKKYLKPLNTMYSMVEINDNYEIIGVVVEARIAIP
>NZ_CP016043.1|WP_070244872.1|1734771_1735650_-|hypothetical-protein
MIKTPTDLESYMQYVYSCLLNLQNEGVVVSRRAILKGKSTNHEIDVFYQFERAGVIHKVAIECKYLSRPVEKKDVMVFRGRLEDIGNIQGIMVSKFGYQKGAYEYAKHYDIDLKTIDDVPSLNIITAEQVKSGGLPSKNNIGQPFWILMEKYLDNVDAIYYGVNDDCDGKFTIPLFLSKRDAIHFLKKKKLQKKFAIRGLTQRNLEVLIGFGKVGGCKFYLMPSPYNSENNGGIIISPDALKFNYLISEITEDEYSEDYFVKPKRKHLSLARIVEELMDSRSLELLKNIKRK
>NZ_CP016043.1|WP_156774563.1|1732044_1734210_+|hypothetical-protein
MSNLIELLTILSKTDWSYGITMNRPIAFADLFQQIRESEGTGFLDRAHQRSFSLNIFKMNALELLWLSQRVRDPKQCIALMAEKNREAGIQAHRELNRHIHNFVSSSLTLVEHTRVFMRTHYAGTEILTIYENKARDTFANSPVAQFVQGLRNYMLHRGLPNSSMFMKFEAAPSEMGGVGTMETGVSYDTSSLLDWKDWKSVARTYIEQAGEHLDIHEVTQEYLALVSRFHDWLDSTLEKYHHSDLQEVSQLKIKLNKISPDNEPTLQTNPSDSLPIEPFMFTSAHAAELELISFDIFGKVKEIRIPHEVDDFATERPITLITGQDIIGDVISWVQDVNGTMSIIFFKYNEKTYGLVESDYKFLNELIDVVMKAAWARTKISRKFVETTFFNWVRQQFPSVQIPFSEALSDAVQKSVMNIEVLAPIANMEVEQGFDFGPVRIDSITANTIENLRSGAPLPSPEQEPDVRQFFEKLKNDIQGYAAVIVSVEAEKKFAAERAFQIAQDAVGLLSFFSPAASCSYIFNSVALAGTEYLPRSKLIVKYEGGFSHTECILPKNIGYWRLSKRKFAEINSELLKAAASLVVSEGLSEFALAVRASILTYSKGTTLIVLQDRLRYCLFALESILLKHDMEPRAYSVINRMCSILVSGGAVGEDVKAVIQQIYWLLDQPQLTELGDRENSLIATFISYTYYILQVVLGNVEHFSYKIQFLDEVDRVDKC
>NZ_CP016043.1|WP_083275066.1|1740983_1741880_+|transcriptional-regulator
MILLKNILNQLQSKQHKNVIQKIERLDCSPEFASAEFSAHVKNIQAGAVNRDSKYYEMTKDGFVFLVMGFTGKKAAAFKEAYIAEFNRMEAMLRQPHSLPTVHLTIEQQGTLKALVKSRVDALPQNKRAKAAISLWSALKSHFGVSYKAIAADQFTDALSLVARLTLDGEALVPLTNRSRYHFPLECADPHDRGLANAWMTPRVILDIRNRAPELELLEALEQDGHDITGAKIRIHAMYDITGQFVAMQKELATVRSYLSTLNDMLKGRSEERGLNVCFAEPNKGRLFGGFRERGFTR
>NZ_CP016043.1|WP_083275006.1|1741809_1742289_+|DUF968-domain-containing-protein
MSALPSQIRAVCLVAFGNEALRDSDKVWAWESPHLQFIEVNMVEGIIMLVGDEAPLAGCMLRPKLLRWESSKYTRWVKTQPCCGCGNPADDPHHIINSGLGLGGIGTKTHDLFVIPLCRRCHDELHHDVGGWEQRNGSQLVLLVQFLNRALGIGAIIKA
>NZ_CP016043.1|WP_070244878.1|1742567_1743122_+|hypothetical-protein
MANGSYGLNLEEIGQSVRNNLQLIIESQGLPLAVGPLTDEDFRILSGGFGELEWDYALTKYGNDPNKFEFCIKLVKQVTETVPSGVALCVYGIDDRVFRIHMIERFCRDDESHPLKGRMVALAIMAAFIFCKAVDAIDVFIMEPVAELVDYYHSFGFVEHESCSYVLRASVNELVSAFEMFAQK
>NZ_CP016043.1|WP_167352257.1|1743299_1743470_+|hypothetical-protein
MKKQVAKSEVRFDTQKAFAGMGAAVELLMRAAPNVLEHKVSGPEKQGKARMRKAAA
>NZ_CP016043.1|WP_070244879.1|1743591_1743930_+|phage-holin,-lambda-family
MHHNPGSWLEWKELLWGWWQGETPVGGVLLAILTAAVRVTYLGGGWKQTALEGALCGALTLTVVATLDYFNLPKSLTPAIGGAIGFIGVQQVQHFALYILHRKLGLPTDKER
>NZ_CP016043.1|WP_070244880.1|1743932_1744484_+|glycoside-hydrolase-family-108-protein
MALTKDQIFDALLGREGGYVDHPHDKGGPTKWGITEKVARAHGYTGDMRNLTRAQALKIYESDYWSGPRFDQVAELSARVAAELCDTGVNMGTSVPSKWLQRWLTAFNDGERLYPDISADGVIGPRTLSALRAYLDARGEEGEQVLLRALNCSQGDRYLALAEQRVQNESFLYGWVRERVTLS
>NZ_CP016043.1|WP_070244881.1|1745013_1745556_+|DUF2514-family-protein
MFNNLWKPLALIALVALLLWGVSTWRYASGYAAGKRLAEQAWQLKWETRNRDEETARANRERGERAEEQRRWQAMIKVKQNADQQLEQIKADAARSTADVERLRRTLSQLRQQLADRSPCRVSTAGGASSASAAAGFLFADVLGESLQRNAALAAYADRARAAGLACERLYDAVTQSRAQ
>NZ_CP016043.1|WP_156774565.1|1746957_1748108_-|IS3-family-transposase
MTKSVSTSKKPRKQHAPEFRNEALKLAERIGVAAAARELSLYESQLYNWRTQQQQQLSSSDRENELAAENARLKRQLAERDEELVIPPKGSDILCEAPEMKYVFIEKHQAEFSVKIMCRVLRVARSGWYAWRLRRHQLNRRQQFRLVCDAAVRQAFSDAKQRYGTPLLADELPRYNIKTSATSLHRQGLRAKAARKFSPVSYREHGLPVSGNLLKQDFTASGPNQKWAGDITYLRTDGGWLYLAVVIDLWSLAVIGWSMSSRMTAQLACDALQMALWRRKRPENVIVHTDRGGQYCSADYQSLLKRHNLHGSMSAKGCCYDNACVESFFHSLKVECIHGERFIRREIMRTTVFNYIECDYNRWRRHSAGGGLSPEQFENENLA
>NZ_CP016043.1|WP_156774566.1|1749440_1750736_+|hypothetical-protein
MMGLYLDLDKNDVAELGRCNDFFVRDVKPIAERVENIRLYKKENIEINEYDLLSYHCYVYWVRFYALYVDRVDELDRGTRYNQSVLGEKLIFSREQYKNDALGFLSNLCRVLYEYNFITGGLESNNNRTIGRSDLDNLADKYHHRSAESQQFAWIRDVMPILIAQYIVTQPNFIDAIKMADDVKKQVDEIEVRITTKLNRSFFTIENEKKEIKIHVDSAKKEINDHLDSKMAAVREIEGKILAAREHIESDNKNIDRLKEIISNYRSEFNFVGLSQAFEKIRKIKRRGFIYATLCYIVLGVAMLAAPVGAFWLHLTTPSFFSQGLSGLLSLLPLATIELIFFYFFRLSYIEVKSLKIQILQIDVRLSLCAFIHSYMDFRKMNGGDISELLKCFDTMIFSPIQANEGNIPSMFDGSEAIANFLSKVVTGKGQ
>NZ_CP016043.1|WP_070244885.1|1750857_1751676_+|hypothetical-protein
MPIAIEQLIKMFDPRSVSAECLHLIRAVPGITREQILGAFAAVAQRHPLGFDLLLARYREDRQAEQRARRAAADRVCRSPHPPYGTAVCQLAVTVALGRALPAQQVVLAALLRKHGPRATLAAKQLADIQRQQKGLEKARVTLSEDDWRYRRNLAQYDALAGRSVALRRALADWADAEAARSPHCPRCRGSGQLLRPQPHCCDTCGGRGKISVTAEHFRRSLVGEGMVITPERWRAEYQPWVNDTLNGLYQEMQLAGDALSIRLALEGQAVA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP016043_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016043_4

1746286-1746863

Orphan

I-B,III-A,III-B

Consensus_repeat	Method
AGAAACACCCCCACAGACGTGGGGAAGAC	CRISPRCasFinder
AGAAACACCCCCACAGACGTGGGGAAGAC	CRT
GTCTTCCCCACGTCTGTGGGGGTGTTTC	PILER-CR

9 spacers

The CRISPR arrays of NZ_CP016043_4

>merge|NZ_CP016043|4|1746286-1746863|CRISPRCasFinder,CRT,PILER-CR
GGAAACACCCCCACAGACGTGGGGAAGACCAAAGGCCTGCCCCATCCAAGGGATAAACTCCAGAAACACCCCCACAGACGTGGGGAAGACCGGCATAGGTGTTTTTTGCCTCGCTCTCTTTGAGAAACACCCCCACAGACGTGGGGAAGACGCATCATGAATGTCATAGCAGACTCTGACATAAGAAACACCCCCACAGACGTGGGGAAGACGCAGCGCCCGCGCTGCTCTATCAGCCTAATCGAGAAACACCCCCACAGACGTGGGGAAGACGCCAGCTTTAGGATGTTGCGTGAGGTGTCGGCAGAAACACCCCCACAGACGTGGGGAAGACGAATCCAGATCTAACAACTTTGGCCACAACATAGAAACACCCCCACAGACGTGGGGAAGACGGTGGTATCACCATGAATCACAACGGATCTACAGAAACACCCCCACAGACGTGGGGAAGACTATACAAACACTTACCAACGGTCTATTTTTGTGGAAACACCCCCACAGACGTGGGGAAGACTGCTTCATAGGTCGCCAAATCATGCAATGGCAAGAAACACCCCCACAGACGTGGGGAAGAC

>NZ_CP016043|4|4|1746286-1746863|CRISPRCasFinder
GGAAACACCCCCACAGACGTGGGGAAGAC	CAAAGGCCTGCCCCATCCAAGGGATAAACTCC
AGAAACACCCCCACAGACGTGGGGAAGAC	CGGCATAGGTGTTTTTTGCCTCGCTCTCTTTG
AGAAACACCCCCACAGACGTGGGGAAGAC	GCATCATGAATGTCATAGCAGACTCTGACATA
AGAAACACCCCCACAGACGTGGGGAAGAC	GCAGCGCCCGCGCTGCTCTATCAGCCTAATCG
AGAAACACCCCCACAGACGTGGGGAAGAC	GCCAGCTTTAGGATGTTGCGTGAGGTGTCGGC
AGAAACACCCCCACAGACGTGGGGAAGAC	GAATCCAGATCTAACAACTTTGGCCACAACAT
AGAAACACCCCCACAGACGTGGGGAAGAC	GGTGGTATCACCATGAATCACAACGGATCTAC
AGAAACACCCCCACAGACGTGGGGAAGAC	TATACAAACACTTACCAACGGTCTATTTTTGT
GGAAACACCCCCACAGACGTGGGGAAGAC	TGCTTCATAGGTCGCCAAATCATGCAATGGCA
AGAAACACCCCCACAGACGTGGGGAAGAC

>NZ_CP016043|4|3|1746286-1746863|CRT
GGAAACACCCCCACAGACGTGGGGAAGAC	CAAAGGCCTGCCCCATCCAAGGGATAAACTCC
AGAAACACCCCCACAGACGTGGGGAAGAC	CGGCATAGGTGTTTTTTGCCTCGCTCTCTTTG
AGAAACACCCCCACAGACGTGGGGAAGAC	GCATCATGAATGTCATAGCAGACTCTGACATA
AGAAACACCCCCACAGACGTGGGGAAGAC	GCAGCGCCCGCGCTGCTCTATCAGCCTAATCG
AGAAACACCCCCACAGACGTGGGGAAGAC	GCCAGCTTTAGGATGTTGCGTGAGGTGTCGGC
AGAAACACCCCCACAGACGTGGGGAAGAC	GAATCCAGATCTAACAACTTTGGCCACAACAT
AGAAACACCCCCACAGACGTGGGGAAGAC	GGTGGTATCACCATGAATCACAACGGATCTAC
AGAAACACCCCCACAGACGTGGGGAAGAC	TATACAAACACTTACCAACGGTCTATTTTTGT
GGAAACACCCCCACAGACGTGGGGAAGAC	TGCTTCATAGGTCGCCAAATCATGCAATGGCA
AGAAACACCCCCACAGACGTGGGGAAGAC

>NZ_CP016043|4|3|1746287-1746863|PILER-CR
GAAACACCCCCACAGACGTGGGGAAGAC	CAAAGGCCTGCCCCATCCAAGGGATAAACTCCA
GAAACACCCCCACAGACGTGGGGAAGAC	CGGCATAGGTGTTTTTTGCCTCGCTCTCTTTGA
GAAACACCCCCACAGACGTGGGGAAGAC	GCATCATGAATGTCATAGCAGACTCTGACATAA
GAAACACCCCCACAGACGTGGGGAAGAC	GCAGCGCCCGCGCTGCTCTATCAGCCTAATCGA
GAAACACCCCCACAGACGTGGGGAAGAC	GCCAGCTTTAGGATGTTGCGTGAGGTGTCGGCA
GAAACACCCCCACAGACGTGGGGAAGAC	GAATCCAGATCTAACAACTTTGGCCACAACATA
GAAACACCCCCACAGACGTGGGGAAGAC	GGTGGTATCACCATGAATCACAACGGATCTACA
GAAACACCCCCACAGACGTGGGGAAGAC	TATACAAACACTTACCAACGGTCTATTTTTGTG
GAAACACCCCCACAGACGTGGGGAAGAC	TGCTTCATAGGTCGCCAAATCATGCAATGGCAA
GAAACACCCCCACAGACGTGGGGAAGAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016043.1\|WP_024522079.1\|1764430_1764709_-\|DUF134-domain-containing-protein	unknown	unknown	gnl\|CDD\|224261
NZ_CP016043.1\|WP_156774565.1\|1746957_1748108_-\|IS3-family-transposase	unknown	unknown	gnl\|CDD\|222853
NZ_CP016043.1\|WP_070244888.1\|1763046_1763772_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_070244875.1\|1738461_1739565_+\|replication-protein-O	unknown	unknown	unknown
NZ_CP016043.1\|WP_024522083.1\|1760943_1762458_+\|cyclic-diguanylate-phosphodiesterase	unknown	unknown	gnl\|CDD\|238923
NZ_CP016043.1\|WP_024522080.1\|1763953_1764418_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376832
NZ_CP016043.1\|WP_070244880.1\|1743932_1744484_+\|glycoside-hydrolase-family-108-protein	unknown	unknown	gnl\|CDD\|226439
NZ_CP016043.1\|WP_070244886.1\|1751760_1752042_-\|type-II-toxin-antitoxin-system-RelE/ParE-family-toxin	unknown	unknown	gnl\|CDD\|224937
NZ_CP016043.1\|WP_156774566.1\|1749440_1750736_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_070244885.1\|1750857_1751676_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|274243
NZ_CP016043.1\|WP_070244878.1\|1742567_1743122_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_070244877.1\|1740285_1740561_+\|PerC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|310570
NZ_CP016043.1\|WP_167352257.1\|1743299_1743470_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016043.1\|WP_083275066.1\|1740983_1741880_+\|transcriptional-regulator	unknown	unknown	gnl\|CDD\|378235
NZ_CP016043.1\|WP_083275006.1\|1741809_1742289_+\|DUF968-domain-containing-protein	unknown	unknown	gnl\|CDD\|310615
NZ_CP016043.1\|WP_070244876.1\|1739561_1740296_+\|DNA-replication-protein	unknown	unknown	gnl\|CDD\|369163
NZ_CP016043.1\|WP_070244887.1\|1752031_1752283_-\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	unknown	unknown	gnl\|CDD\|225072
NZ_CP016043.1\|WP_070244879.1\|1743591_1743930_+\|phage-holin,-lambda-family	unknown	unknown	gnl\|CDD\|368287
NZ_CP016043.1\|WP_070244881.1\|1745013_1745556_+\|DUF2514-family-protein	unknown	unknown	gnl\|CDD\|287666
NZ_CP016043.1\|WP_083275068.1\|1762505_1762949_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|368549

Protein	Function_ID	Function_description	E-value
NZ_CP016043.1\|WP_024522079.1\|1764430_1764709_-\|DUF134-domain-containing-protein	gnl\|CDD\|224261	COG1342, COG1342, Predicted DNA-binding proteins [General function prediction only].	6.03797e-37
NZ_CP016043.1\|WP_156774565.1\|1746957_1748108_-\|IS3-family-transposase	gnl\|CDD\|222853	PHA02517, PHA02517, putative transposase OrfB; Reviewed.	1.62409e-58
NZ_CP016043.1\|WP_024522083.1\|1760943_1762458_+\|cyclic-diguanylate-phosphodiesterase	gnl\|CDD\|238923	cd01948, EAL, EAL domain. This domain is found in diverse bacterial signaling proteins. It is called EAL after its conserved residues and is also known as domain of unknown function 2 (DUF2). The EAL domain has been shown to stimulate degradation of a second messenger, cyclic di-GMP, and is a good candidate for a diguanylate phosphodiesterase function. Together with the GGDEF domain, EAL might be involved in regulating cell surface adhesiveness in bacteria.	4.51782e-81
NZ_CP016043.1\|WP_024522080.1\|1763953_1764418_-\|hypothetical-protein	gnl\|CDD\|376832	pfam02579, Nitro_FeMo-Co, Dinitrogenase iron-molybdenum cofactor. This family contains several NIF (B, Y and X) proteins which are iron-molybdenum cofactors (FeMo-co) in the dinitrogenase enzyme which catalyzes the reduction of dinitrogen to ammonium. Dinitrogenase is a hetero-tetrameric (alpha(2)beta(2)) enzyme which contains the iron-molybdenum cofactor (FeMo-co) at its active site.	5.51182e-09
NZ_CP016043.1\|WP_070244880.1\|1743932_1744484_+\|glycoside-hydrolase-family-108-protein	gnl\|CDD\|226439	COG3926, zliS, Lysozyme family protein [General function prediction only].	6.31019e-49
NZ_CP016043.1\|WP_070244886.1\|1751760_1752042_-\|type-II-toxin-antitoxin-system-RelE/ParE-family-toxin	gnl\|CDD\|224937	COG2026, RelE, Cytotoxic translational repressor of toxin-antitoxin stability system [Translation, ribosomal structure and biogenesis / Cell division and chromosome partitioning].	1.58692e-20
NZ_CP016043.1\|WP_070244885.1\|1750857_1751676_+\|hypothetical-protein	gnl\|CDD\|274243	TIGR02642, hypothetical_protein_YPTB1803, uncharacterized phage protein. This uncharacterized protein is found in prophage regions of Shewanella oneidensis MR-1, Vibrio vulnificus YJ016, Yersinia pseudotuberculosis IP 32953, and Aeromonas hydrophila ATCC7966. It appears to have regions of sequence similarity to phage lambda antitermination protein Q. [Mobile and extrachromosomal element functions, Prophage functions].	5.54664e-18
NZ_CP016043.1\|WP_070244877.1\|1740285_1740561_+\|PerC-family-transcriptional-regulator	gnl\|CDD\|310570	pfam06069, PerC, PerC transcriptional activator. PerC is a transcriptional activator of EaeA/BfpA expression in enteropathogenic bacteria.	8.96118e-05
NZ_CP016043.1\|WP_070244876.1\|1739561_1740296_+\|DNA-replication-protein	gnl\|CDD\|369163	pfam06992, Phage_lambda_P, Replication protein P. This family consists of several Bacteriophage lambda replication protein P like proteins. The bacteriophage lambda P protein promoters replication of the phage chromosome by recruiting a key component of the cellular replication machinery to the viral origin. Specifically, P protein delivers one or more molecules of Escherichia coli DnaB helicase to a nucleoprotein structure formed by the lambda O initiator at the lambda replication origin.	4.9901e-74
NZ_CP016043.1\|WP_083275006.1\|1741809_1742289_+\|DUF968-domain-containing-protein	gnl\|CDD\|310615	pfam06147, DUF968, Protein of unknown function (DUF968). Family of uncharacterized prophage proteins found in Gammaproteobacteria. These may be HNH-nucleases, as there are several conserved cysteines and histidines.	3.21921e-50
NZ_CP016043.1\|WP_083275066.1\|1740983_1741880_+\|transcriptional-regulator	gnl\|CDD\|378235	pfam09669, Phage_pRha, Phage regulatory protein Rha (Phage_pRha). Members of this protein family are found in temperate phage and bacterial prophage regions. Members include the product of the rha gene of the lambdoid phage phi-80, a late operon gene. The presence of this gene interferes with infection of bacterial strains that lack integration host factor (IHF), which regulates the rha gene. It is suggested that Rha is a phage regulatory protein.	2.19828e-25
NZ_CP016043.1\|WP_070244887.1\|1752031_1752283_-\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	gnl\|CDD\|225072	COG2161, StbD, Antitoxin of toxin-antitoxin stability system [Cell division and chromosome partitioning].	5.54581e-10
NZ_CP016043.1\|WP_070244879.1\|1743591_1743930_+\|phage-holin,-lambda-family	gnl\|CDD\|368287	pfam05106, Phage_holin_3_1, Phage holin family (Lysis protein S). This family represents one of a large number of mutually dissimilar families of phage holins. Holins act against the host cell membrane to allow lytic enzymes of the phage to reach the bacterial cell wall. This family includes the product of the S gene of phage lambda.	2.18976e-32
NZ_CP016043.1\|WP_070244881.1\|1745013_1745556_+\|DUF2514-family-protein	gnl\|CDD\|287666	pfam10721, DUF2514, Protein of unknown function (DUF2514). This family is conserved in bacteria and some viruses. The function is not known.	1.45852e-17
NZ_CP016043.1\|WP_083275068.1\|1762505_1762949_+\|hypothetical-protein	gnl\|CDD\|368549	pfam05666, Fels1, Fels-1 Prophage Protein-like.	4.48181e-10

>NZ_CP016043.1|WP_070244881.1|1745013_1745556_+|DUF2514-family-protein
MFNNLWKPLALIALVALLLWGVSTWRYASGYAAGKRLAEQAWQLKWETRNRDEETARANRERGERAEEQRRWQAMIKVKQNADQQLEQIKADAARSTADVERLRRTLSQLRQQLADRSPCRVSTAGGASSASAAAGFLFADVLGESLQRNAALAAYADRARAAGLACERLYDAVTQSRAQ
>NZ_CP016043.1|WP_070244880.1|1743932_1744484_+|glycoside-hydrolase-family-108-protein
MALTKDQIFDALLGREGGYVDHPHDKGGPTKWGITEKVARAHGYTGDMRNLTRAQALKIYESDYWSGPRFDQVAELSARVAAELCDTGVNMGTSVPSKWLQRWLTAFNDGERLYPDISADGVIGPRTLSALRAYLDARGEEGEQVLLRALNCSQGDRYLALAEQRVQNESFLYGWVRERVTLS
>NZ_CP016043.1|WP_070244879.1|1743591_1743930_+|phage-holin,-lambda-family
MHHNPGSWLEWKELLWGWWQGETPVGGVLLAILTAAVRVTYLGGGWKQTALEGALCGALTLTVVATLDYFNLPKSLTPAIGGAIGFIGVQQVQHFALYILHRKLGLPTDKER
>NZ_CP016043.1|WP_167352257.1|1743299_1743470_+|hypothetical-protein
MKKQVAKSEVRFDTQKAFAGMGAAVELLMRAAPNVLEHKVSGPEKQGKARMRKAAA
>NZ_CP016043.1|WP_070244878.1|1742567_1743122_+|hypothetical-protein
MANGSYGLNLEEIGQSVRNNLQLIIESQGLPLAVGPLTDEDFRILSGGFGELEWDYALTKYGNDPNKFEFCIKLVKQVTETVPSGVALCVYGIDDRVFRIHMIERFCRDDESHPLKGRMVALAIMAAFIFCKAVDAIDVFIMEPVAELVDYYHSFGFVEHESCSYVLRASVNELVSAFEMFAQK
>NZ_CP016043.1|WP_083275006.1|1741809_1742289_+|DUF968-domain-containing-protein
MSALPSQIRAVCLVAFGNEALRDSDKVWAWESPHLQFIEVNMVEGIIMLVGDEAPLAGCMLRPKLLRWESSKYTRWVKTQPCCGCGNPADDPHHIINSGLGLGGIGTKTHDLFVIPLCRRCHDELHHDVGGWEQRNGSQLVLLVQFLNRALGIGAIIKA
>NZ_CP016043.1|WP_083275066.1|1740983_1741880_+|transcriptional-regulator
MILLKNILNQLQSKQHKNVIQKIERLDCSPEFASAEFSAHVKNIQAGAVNRDSKYYEMTKDGFVFLVMGFTGKKAAAFKEAYIAEFNRMEAMLRQPHSLPTVHLTIEQQGTLKALVKSRVDALPQNKRAKAAISLWSALKSHFGVSYKAIAADQFTDALSLVARLTLDGEALVPLTNRSRYHFPLECADPHDRGLANAWMTPRVILDIRNRAPELELLEALEQDGHDITGAKIRIHAMYDITGQFVAMQKELATVRSYLSTLNDMLKGRSEERGLNVCFAEPNKGRLFGGFRERGFTR
>NZ_CP016043.1|WP_070244877.1|1740285_1740561_+|PerC-family-transcriptional-regulator
MRGKPIVWRHHNLRQIQEHMLNAERCEQRGLWRRAGHEWMQVIEHCTDDVLVEYAVQQRNYCAQMGVFGSASIDPRMVAANQCDEPLQDEG
>NZ_CP016043.1|WP_070244876.1|1739561_1740296_+|DNA-replication-protein
MKNLVSAVQRRDAAALSRMAGQPLQERVVNGNAEKLVDVLFENLLLLFPASRNTVFAAPDEVAAMKRQWITAFAEGGITTLEQVKAGVSMARQHGGDFWPSCGRFMEWCREGVRSAGGLPSDDEVLAEFHRYARDKARFASPEAFDWAHPVMYWVVLDVRQRMYRYNYTEAEVLRAIKAQMQRWERNIRAGQRIPTPVKQLVHVQRPPAIADQLDPTGGAGFYQVGVAFLEQIRQRLRGGEHEG
>NZ_CP016043.1|WP_070244875.1|1738461_1739565_+|replication-protein-O
MSSLIQILDRPIAYNPALAKLRAGKVKAGPVAAVFLSQMIYWHNRMGGEWMYKTQADITTETALTRDEQETARKRLVALGVLDEARRGVPATLHYRINVARLEALLLEAATPVATPAPTAKTRTRDIQNSEPSQPGPAHSDQSRMVQSQNVETPQSGLVQPRKLDCGDAANKNVETPQTSMGEPTEQVCGDPANFHTGDYTENTQENKKPSCPDAAQPDEPDSDHDFLSRHPEAVVFSAKKRLWGRQEDLTCAEWIWGRIVRLYELAAEDDGEVVRPKAPNWTVWANEVRLMCHQDGRTHRQICELFGRVNRDPFWCRNVLSPAKLREKWDELVIRLGAPGAGAQDRSLKTLLGADWNTEQGWESVL
>NZ_CP016043.1|WP_156774565.1|1746957_1748108_-|IS3-family-transposase
MTKSVSTSKKPRKQHAPEFRNEALKLAERIGVAAAARELSLYESQLYNWRTQQQQQLSSSDRENELAAENARLKRQLAERDEELVIPPKGSDILCEAPEMKYVFIEKHQAEFSVKIMCRVLRVARSGWYAWRLRRHQLNRRQQFRLVCDAAVRQAFSDAKQRYGTPLLADELPRYNIKTSATSLHRQGLRAKAARKFSPVSYREHGLPVSGNLLKQDFTASGPNQKWAGDITYLRTDGGWLYLAVVIDLWSLAVIGWSMSSRMTAQLACDALQMALWRRKRPENVIVHTDRGGQYCSADYQSLLKRHNLHGSMSAKGCCYDNACVESFFHSLKVECIHGERFIRREIMRTTVFNYIECDYNRWRRHSAGGGLSPEQFENENLA
>NZ_CP016043.1|WP_156774566.1|1749440_1750736_+|hypothetical-protein
MMGLYLDLDKNDVAELGRCNDFFVRDVKPIAERVENIRLYKKENIEINEYDLLSYHCYVYWVRFYALYVDRVDELDRGTRYNQSVLGEKLIFSREQYKNDALGFLSNLCRVLYEYNFITGGLESNNNRTIGRSDLDNLADKYHHRSAESQQFAWIRDVMPILIAQYIVTQPNFIDAIKMADDVKKQVDEIEVRITTKLNRSFFTIENEKKEIKIHVDSAKKEINDHLDSKMAAVREIEGKILAAREHIESDNKNIDRLKEIISNYRSEFNFVGLSQAFEKIRKIKRRGFIYATLCYIVLGVAMLAAPVGAFWLHLTTPSFFSQGLSGLLSLLPLATIELIFFYFFRLSYIEVKSLKIQILQIDVRLSLCAFIHSYMDFRKMNGGDISELLKCFDTMIFSPIQANEGNIPSMFDGSEAIANFLSKVVTGKGQ
>NZ_CP016043.1|WP_070244885.1|1750857_1751676_+|hypothetical-protein
MPIAIEQLIKMFDPRSVSAECLHLIRAVPGITREQILGAFAAVAQRHPLGFDLLLARYREDRQAEQRARRAAADRVCRSPHPPYGTAVCQLAVTVALGRALPAQQVVLAALLRKHGPRATLAAKQLADIQRQQKGLEKARVTLSEDDWRYRRNLAQYDALAGRSVALRRALADWADAEAARSPHCPRCRGSGQLLRPQPHCCDTCGGRGKISVTAEHFRRSLVGEGMVITPERWRAEYQPWVNDTLNGLYQEMQLAGDALSIRLALEGQAVA
>NZ_CP016043.1|WP_070244886.1|1751760_1752042_-|type-II-toxin-antitoxin-system-RelE/ParE-family-toxin
MTYKLSFEKRALKEWKKLAPPIQSQLKKKLIERLENPHVPAARLSGRANRYKIKLRASGYRLVYEVNDSEIILLVIAIGKRADNEVYQTADSR
>NZ_CP016043.1|WP_070244887.1|1752031_1752283_-|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin
MAYQILTTTAASITDLKRNPMGTVAEGDGNAVAILNRNEPAFYCVPPELYAYYLELAEDAALNRIADERLEDAEFVSVSIDDL
>NZ_CP016043.1|WP_024522083.1|1760943_1762458_+|cyclic-diguanylate-phosphodiesterase
MSQEGIKKIITKKLLVAFASGVSVLVILTLCLLIFSIKSLYKDTTLKVNFARQHIDGILDHAKNAAQSTSHLLGHACSERAINALIHQVTLTPNVRSIELFSKNGGYCTSLYKEVSGIDREKIEKVSGLYLLAGDEATPSLPVLFYNDKLAQGAVLVGVDGYFIANTLRVINTFPSVYFAVGGEILSADGRVTPRFQRIPEGYHAITSDYGYTIIYILTKHTILANLTENYMLGIYLSLLLAVVAMLGVFLRLNRPLSITELIRNGLRNNEFVPYIQPIIDLQTNSVTGGEILIRWNRPGIGIIPPNQFIPSAEDSGLIVPMTRQLILDTREALRGRLSQPVHIGFNISQKYLQHRSIVADCEQFLEAFAGHQLELTLELVERDEIAAKREVKANFERLKGLGVTFALDDFGTGYSTYSYLQKFHVDYIKIDKSFIQMIGLDEISSHIVNNVIELAGSLHLKIIAEGVETAQQEAYLKAHDVLYLQGYRYSRPIPLETFIQRYL
>NZ_CP016043.1|WP_083275068.1|1762505_1762949_+|hypothetical-protein
MKIKVNDIAFPLRRMLLLGVSWSLAALTQAQGDANAALRSPQAGVLCDRYFCADAQGVSRSLTVRYLGLRAAQRVFSPGAFDHTAFTFANGIFCDTRARLCWEDRYYGSDGKHSAAISARYTALLFPPTPSRAKVATGEVSPDKSGH
>NZ_CP016043.1|WP_070244888.1|1763046_1763772_-|hypothetical-protein
MQRYSFIALALLSCASLSPVYATADNSITRHALQFAKGQSATSVHGSIKGSEVIDYTLIAAQGQQMDVTLKGGNATYFNLLAPGSHAEALFNGAIAGDRFQGALPAKGQYTVRLYQMGAAKDTTTAHPFTLVISIKGDAARDATPPHSASGTLPCAQHSGQPMGQCPFRVMRQANGDATLTLTLPDQRQRTLFFSHGKPLSADLSQADGDMRFTWQQQDDLLLIRCGQERYEIPSAAITGG
>NZ_CP016043.1|WP_024522080.1|1763953_1764418_-|hypothetical-protein
MLTAIPMHGARIAGHLARAPQLAFFNTNGEEVARYANPAASEQCSGKKQLLALLRQGQIRRLVVRNVGQHMAQRLLALGIEIRLAHGGEWQAAYCQEECDLARLSDASQARPPRKPHHTAHSCGCGGTAQVTTAATRLSPRQGGVPHIIRCRQG
>NZ_CP016043.1|WP_024522079.1|1764430_1764709_-|DUF134-domain-containing-protein
MPRPKIPRRICSHPQHRCFKPNGIPLPQLEQVLLARDEFEALRLVDREGLQQQQAAAEMGVSRQTLANILKRARFKLLDCLSNGKALMIDES

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP016043_3	3.1\|1740615\|33\|NZ_CP016043\|CRISPRCasFinder	1740615-1740647	33	NC_026611	Edwardsiella phage GF-2 DNA, complete sequence	41783-41815	0	1.0
NZ_CP016043_3	3.1\|1740615\|33\|NZ_CP016043\|CRISPRCasFinder	1740615-1740647	33	MH898687	Edwardsiella phage Edno5, complete genome	39330-39362	0	1.0
NZ_CP016043_3	3.2\|1740676\|33\|NZ_CP016043\|CRISPRCasFinder,PILER-CR	1740676-1740708	33	NC_026611	Edwardsiella phage GF-2 DNA, complete sequence	39212-39244	2	0.939
NZ_CP016043_3	3.7\|1740615\|37\|NZ_CP016043\|CRT	1740615-1740651	37	NC_026611	Edwardsiella phage GF-2 DNA, complete sequence	41779-41815	3	0.919
NZ_CP016043_3	3.7\|1740615\|37\|NZ_CP016043\|CRT	1740615-1740651	37	MH898687	Edwardsiella phage Edno5, complete genome	39326-39362	3	0.919
NZ_CP016043_3	3.6\|1740920\|33\|NZ_CP016043\|CRISPRCasFinder,PILER-CR	1740920-1740952	33	KC139516	Salmonella phage FSL SP-016, partial genome	43535-43567	5	0.848
NZ_CP016043_3	3.8\|1740676\|37\|NZ_CP016043\|CRT	1740676-1740712	37	NC_026611	Edwardsiella phage GF-2 DNA, complete sequence	39208-39244	6	0.838
NZ_CP016043_3	3.4\|1740798\|33\|NZ_CP016043\|CRISPRCasFinder,PILER-CR	1740798-1740830	33	NC_011880	Cyanothece sp. PCC 7425 plasmid pP742501, complete sequence	145824-145856	8	0.758
NZ_CP016043_1	1.2\|873578\|33\|NZ_CP016043\|PILER-CR,CRISPRCasFinder,CRT	873578-873610	33	NZ_CP022081	Burkholderia cepacia strain FDAARGOS_345 plasmid unnamed1, complete sequence	11227-11259	9	0.727
NZ_CP016043_1	1.2\|873578\|33\|NZ_CP016043\|PILER-CR,CRISPRCasFinder,CRT	873578-873610	33	NZ_CP023519	Burkholderia cepacia strain FDAARGOS_388 plasmid unnamed1, complete sequence	109783-109815	9	0.727
NZ_CP016043_1	1.2\|873578\|33\|NZ_CP016043\|PILER-CR,CRISPRCasFinder,CRT	873578-873610	33	NZ_CP012984	Burkholderia cepacia ATCC 25416 strain UCB 717 plasmid pBC25416	162232-162264	9	0.727
NZ_CP016043_1	1.2\|873578\|33\|NZ_CP016043\|PILER-CR,CRISPRCasFinder,CRT	873578-873610	33	NC_008545	Burkholderia cenocepacia HI2424 plasmid unnamed1, complete sequence	62979-63011	9	0.727
NZ_CP016043_1	1.2\|873578\|33\|NZ_CP016043\|PILER-CR,CRISPRCasFinder,CRT	873578-873610	33	NZ_CP034556	Burkholderia cepacia ATCC 25416 plasmid unnamed1, complete sequence	61242-61274	9	0.727
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_CP041049	Citrobacter sp. CF971 plasmid pBM527-3, complete sequence	12881-12912	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_KX863568	Citrobacter freundii strain AtetA plasmid pLNU-11, complete sequence	4297-4328	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_KJ541068	Serratia marcescens strain A4Y426 plasmid pG5A4Y426, complete sequence	4340-4371	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_KJ541070	Escherichia coli strain A4Y413 plasmid pG5A4Y413, complete sequence	4277-4308	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_KJ541071	Escherichia coli strain A4Y217 plasmid pG5A4Y217, complete sequence	4277-4308	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_KJ541069	Serratia marcescens strain A4Y201 plasmid pG5A4Y201, complete sequence	4340-4371	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_LN832561	Paracoccus aminovorans isolate JCM7685 plasmid III, complete sequence	2714-2745	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_LR130553	Escherichia coli strain MS14386 isolate MS14386 plasmid 2	24449-24480	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_CP016184	Escherichia coli strain EC2 plasmid pEC2-4, complete sequence	23639-23670	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_CP016183	Escherichia coli strain EC2_1 plasmid pEC2_1-4, complete sequence	138969-139000	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_CP047573	Escherichia coli strain 2EC1 plasmid p2EC1-2, complete sequence	36066-36097	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	LC542613	Klebsiella quasipneumoniae subsp. similipneumoniae MS2H7 plasmid pMS2H7VEB-1 DNA, complete sequence	1367-1398	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	LC542924	Klebsiella pneumoniae MS2H5 plasmid pMS2H5VEB-1 DNA, complete sequence	1367-1398	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	NZ_MK731977	Escherichia coli strain ENV103 plasmid pSGMCR103, complete sequence	2787-2818	9	0.719
NZ_CP016043_4	4.4\|1746498\|32\|NZ_CP016043\|CRISPRCasFinder,CRT	1746498-1746529	32	MN945901	Mycobacterium phage Ximenita, complete genome	36904-36935	9	0.719
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_CP041049	Citrobacter sp. CF971 plasmid pBM527-3, complete sequence	12881-12913	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_KX863568	Citrobacter freundii strain AtetA plasmid pLNU-11, complete sequence	4296-4328	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_KJ541068	Serratia marcescens strain A4Y426 plasmid pG5A4Y426, complete sequence	4339-4371	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_KJ541070	Escherichia coli strain A4Y413 plasmid pG5A4Y413, complete sequence	4276-4308	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_KJ541071	Escherichia coli strain A4Y217 plasmid pG5A4Y217, complete sequence	4276-4308	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_KJ541069	Serratia marcescens strain A4Y201 plasmid pG5A4Y201, complete sequence	4339-4371	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_LN832561	Paracoccus aminovorans isolate JCM7685 plasmid III, complete sequence	2714-2746	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_LR130553	Escherichia coli strain MS14386 isolate MS14386 plasmid 2	24448-24480	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_CP016184	Escherichia coli strain EC2 plasmid pEC2-4, complete sequence	23639-23671	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_CP016183	Escherichia coli strain EC2_1 plasmid pEC2_1-4, complete sequence	138968-139000	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_CP047573	Escherichia coli strain 2EC1 plasmid p2EC1-2, complete sequence	36065-36097	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	LC542613	Klebsiella quasipneumoniae subsp. similipneumoniae MS2H7 plasmid pMS2H7VEB-1 DNA, complete sequence	1367-1399	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	LC542924	Klebsiella pneumoniae MS2H5 plasmid pMS2H5VEB-1 DNA, complete sequence	1367-1399	10	0.697
NZ_CP016043_4	4.13\|1746498\|33\|NZ_CP016043\|PILER-CR	1746498-1746530	33	NZ_MK731977	Escherichia coli strain ENV103 plasmid pSGMCR103, complete sequence	2786-2818	10	0.697

1. spacer 3.1|1740615|33|NZ_CP016043|CRISPRCasFinder matches to NC_026611 (Edwardsiella phage GF-2 DNA, complete sequence) position: , mismatch: 0, identity: 1.0

cgcttcacagagtagctggccgacttcggtcta	CRISPR spacer
cgcttcacagagtagctggccgacttcggtcta	Protospacer
*********************************

2. spacer 3.1|1740615|33|NZ_CP016043|CRISPRCasFinder matches to MH898687 (Edwardsiella phage Edno5, complete genome) position: , mismatch: 0, identity: 1.0

cgcttcacagagtagctggccgacttcggtcta	CRISPR spacer
cgcttcacagagtagctggccgacttcggtcta	Protospacer
*********************************

3. spacer 3.2|1740676|33|NZ_CP016043|CRISPRCasFinder,PILER-CR matches to NC_026611 (Edwardsiella phage GF-2 DNA, complete sequence) position: , mismatch: 2, identity: 0.939

tcatgtcatgaacgttcatgcggcttttccttg	CRISPR spacer
tcatgtcatgcacgttcatgcggcttttcctta	Protospacer
********** *********************.

4. spacer 3.7|1740615|37|NZ_CP016043|CRT matches to NC_026611 (Edwardsiella phage GF-2 DNA, complete sequence) position: , mismatch: 3, identity: 0.919

cgcttcacagagtagctggccgacttcggtctagaac	CRISPR spacer
cgcttcacagagtagctggccgacttcggtctattcc	Protospacer
*********************************   *

5. spacer 3.7|1740615|37|NZ_CP016043|CRT matches to MH898687 (Edwardsiella phage Edno5, complete genome) position: , mismatch: 3, identity: 0.919

cgcttcacagagtagctggccgacttcggtctagaac	CRISPR spacer
cgcttcacagagtagctggccgacttcggtctattcc	Protospacer
*********************************   *

6. spacer 3.6|1740920|33|NZ_CP016043|CRISPRCasFinder,PILER-CR matches to KC139516 (Salmonella phage FSL SP-016, partial genome) position: , mismatch: 5, identity: 0.848

gctgtggtgctgctggcaatggcatccagtgag	CRISPR spacer
gttctggtgctgctggcagcggcatccagtgcg	Protospacer
*.* **************..*********** *

7. spacer 3.8|1740676|37|NZ_CP016043|CRT matches to NC_026611 (Edwardsiella phage GF-2 DNA, complete sequence) position: , mismatch: 6, identity: 0.838

tcatgtcatgaacgttcatgcggcttttccttggaaa	CRISPR spacer
tcatgtcatgcacgttcatgcggcttttccttattgg	Protospacer
********** *********************.  ..

8. spacer 3.4|1740798|33|NZ_CP016043|CRISPRCasFinder,PILER-CR matches to NC_011880 (Cyanothece sp. PCC 7425 plasmid pP742501, complete sequence) position: , mismatch: 8, identity: 0.758

actgcctgcactggcaagagctacgtgtactga	CRISPR spacer
actgcctgcactggcaaaacctacggttggcaa	Protospacer
*****************.* *****  *. ..*

9. spacer 1.2|873578|33|NZ_CP016043|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP022081 (Burkholderia cepacia strain FDAARGOS_345 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.727

tggcatcctgcccatagcgccctcgggtatccg	CRISPR spacer
tggcatcgtgcccatagcgccatcggcggcgtt	Protospacer
******* ************* ****  .. .

10. spacer 1.2|873578|33|NZ_CP016043|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP023519 (Burkholderia cepacia strain FDAARGOS_388 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.727

tggcatcctgcccatagcgccctcgggtatccg	CRISPR spacer
tggcatcgtgcccatagcgccatcggcggcgtt	Protospacer
******* ************* ****  .. .

11. spacer 1.2|873578|33|NZ_CP016043|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP012984 (Burkholderia cepacia ATCC 25416 strain UCB 717 plasmid pBC25416) position: , mismatch: 9, identity: 0.727

tggcatcctgcccatagcgccctcgggtatccg	CRISPR spacer
tggcatcgtgcccatagcgccatcggcggcgtt	Protospacer
******* ************* ****  .. .

12. spacer 1.2|873578|33|NZ_CP016043|PILER-CR,CRISPRCasFinder,CRT matches to NC_008545 (Burkholderia cenocepacia HI2424 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.727

tggcatcctgcccatagcgccctcgggtatccg	CRISPR spacer
tggcatcgtgcccatagcgccatcggcggcgtt	Protospacer
******* ************* ****  .. .

13. spacer 1.2|873578|33|NZ_CP016043|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034556 (Burkholderia cepacia ATCC 25416 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.727

tggcatcctgcccatagcgccctcgggtatccg	CRISPR spacer
tggcatcgtgcccatagcgccatcggcggcgtt	Protospacer
******* ************* ****  .. .

14. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_CP041049 (Citrobacter sp. CF971 plasmid pBM527-3, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

15. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_KX863568 (Citrobacter freundii strain AtetA plasmid pLNU-11, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

16. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_KJ541068 (Serratia marcescens strain A4Y426 plasmid pG5A4Y426, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

17. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_KJ541070 (Escherichia coli strain A4Y413 plasmid pG5A4Y413, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

18. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_KJ541071 (Escherichia coli strain A4Y217 plasmid pG5A4Y217, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

19. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_KJ541069 (Serratia marcescens strain A4Y201 plasmid pG5A4Y201, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

20. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_LN832561 (Paracoccus aminovorans isolate JCM7685 plasmid III, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

21. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_LR130553 (Escherichia coli strain MS14386 isolate MS14386 plasmid 2) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

22. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_CP016184 (Escherichia coli strain EC2 plasmid pEC2-4, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

23. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_CP016183 (Escherichia coli strain EC2_1 plasmid pEC2_1-4, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

24. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_CP047573 (Escherichia coli strain 2EC1 plasmid p2EC1-2, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

25. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to LC542613 (Klebsiella quasipneumoniae subsp. similipneumoniae MS2H7 plasmid pMS2H7VEB-1 DNA, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

26. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to LC542924 (Klebsiella pneumoniae MS2H5 plasmid pMS2H5VEB-1 DNA, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

27. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to NZ_MK731977 (Escherichia coli strain ENV103 plasmid pSGMCR103, complete sequence) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcgg	Protospacer
 ************ ***** *****..... *

28. spacer 4.4|1746498|32|NZ_CP016043|CRISPRCasFinder,CRT matches to MN945901 (Mycobacterium phage Ximenita, complete genome) position: , mismatch: 9, identity: 0.719

gcagcgcccgcgctgctctatcagcctaatcg	CRISPR spacer
ccggcgcccgcgctgcgcgatcagcccgacat	Protospacer
 *.************* * *******..*.

29. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_CP041049 (Citrobacter sp. CF971 plasmid pBM527-3, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

30. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_KX863568 (Citrobacter freundii strain AtetA plasmid pLNU-11, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

31. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_KJ541068 (Serratia marcescens strain A4Y426 plasmid pG5A4Y426, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

32. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_KJ541070 (Escherichia coli strain A4Y413 plasmid pG5A4Y413, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

33. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_KJ541071 (Escherichia coli strain A4Y217 plasmid pG5A4Y217, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

34. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_KJ541069 (Serratia marcescens strain A4Y201 plasmid pG5A4Y201, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

35. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_LN832561 (Paracoccus aminovorans isolate JCM7685 plasmid III, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

36. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_LR130553 (Escherichia coli strain MS14386 isolate MS14386 plasmid 2) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

37. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_CP016184 (Escherichia coli strain EC2 plasmid pEC2-4, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

38. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_CP016183 (Escherichia coli strain EC2_1 plasmid pEC2_1-4, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

39. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_CP047573 (Escherichia coli strain 2EC1 plasmid p2EC1-2, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

40. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to LC542613 (Klebsiella quasipneumoniae subsp. similipneumoniae MS2H7 plasmid pMS2H7VEB-1 DNA, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

41. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to LC542924 (Klebsiella pneumoniae MS2H5 plasmid pMS2H5VEB-1 DNA, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

42. spacer 4.13|1746498|33|NZ_CP016043|PILER-CR matches to NZ_MK731977 (Escherichia coli strain ENV103 plasmid pSGMCR103, complete sequence) position: , mismatch: 10, identity: 0.697

gcagcgcccgcgctgctctatcagcctaatcga	CRISPR spacer
ccagcgcccgcgcagctctttcagctcggcggc	Protospacer
 ************ ***** *****..... *

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1736556 : 1748108

Enterobacteria_phage(23.08%)

holin,transposase

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_167352271.1\|1736556_1737189_-	helix-turn-helix domain-containing protein	A8CGC0	Salmonella_phage	3.7e-59	55.3
WP_070245634.1\|1737285_1737471_+	hypothetical protein	A5VW97	Enterobacteria_phage	1.4e-11	55.7
WP_070244874.1\|1737647_1738097_+	hypothetical protein	K7PJS5	Enterobacterial_phage	4.4e-38	57.0
WP_156774564.1\|1738127_1738292_+	hypothetical protein	NA	NA	NA	NA
WP_083275005.1\|1738291_1738465_+	DUF4222 domain-containing protein	NA	NA	NA	NA
WP_070244875.1\|1738461_1739565_+	replication protein O	A0A1C9IHW0	Salmonella_phage	9.4e-58	72.9
WP_070244876.1\|1739561_1740296_+	DNA replication protein	A0A1P8DTF3	Proteus_phage	3.9e-36	39.5
WP_070244877.1\|1740285_1740561_+	PerC family transcriptional regulator	NA	NA	NA	NA
WP_083275066.1\|1740983_1741880_+	transcriptional regulator	A0A1U9GXD3	Vibrio_phage	1.4e-32	42.4
WP_083275006.1\|1741809_1742289_+	DUF968 domain-containing protein	K7PJS6	Enterobacterial_phage	2.2e-32	52.9
WP_070244878.1\|1742567_1743122_+	hypothetical protein	K7PKJ4	Enterobacteria_phage	2.0e-61	65.0
WP_167352257.1\|1743299_1743470_+	hypothetical protein	K7PJQ2	Enterobacteria_phage	5.5e-10	68.4
WP_070244879.1\|1743591_1743930_+\|holin	phage holin, lambda family	Q8SBE1	Shigella_phage	1.6e-24	47.7
WP_070244880.1\|1743932_1744484_+	glycoside hydrolase family 108 protein	A0A286N2Q6	Klebsiella_phage	9.7e-72	71.3
WP_070244881.1\|1745013_1745556_+	DUF2514 family protein	A0A291AXG6	Shigella_phage	3.8e-12	36.0
WP_156774565.1\|1746957_1748108_-\|transposase	IS3 family transposase	A0A0P0I4A4	Acinetobacter_phage	1.5e-45	37.1

DBSCAN-SWA_2

1940538 : 1949855

Brazilian_cedratvirus(16.67%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_024523388.1\|1940538_1941303_-	vitamin B12 ABC transporter ATP-binding protein BtuD	A0A2R8FG22	Brazilian_cedratvirus	2.9e-05	27.5
WP_070245635.1\|1941295_1942321_-	vitamin B12 ABC transporter permease BtuC	NA	NA	NA	NA
WP_024523386.1\|1942307_1942511_-	protein DsrB	NA	NA	NA	NA
WP_005285818.1\|1942600_1942897_-	integration host factor subunit alpha	A0A0H3UZA0	Geobacillus_virus	2.4e-13	41.1
WP_024523385.1\|1942901_1945289_-\|tRNA	phenylalanine--tRNA ligase subunit beta	A0A1L3IZU3	BeAn_58058_virus	9.5e-07	25.8
WP_024523384.1\|1945303_1946287_-\|tRNA	phenylalanine--tRNA ligase subunit alpha	A0A2H4UW22	Bodo_saltans_virus	6.4e-34	42.6
WP_106120997.1\|1946474_1946519_-	pheST operon leader peptide PheM	NA	NA	NA	NA
WP_024523383.1\|1946687_1947044_-	50S ribosomal protein L20	NA	NA	NA	NA
WP_005293643.1\|1947086_1947284_-	50S ribosomal protein L35	NA	NA	NA	NA
WP_070244941.1\|1947380_1947923_-	translation initiation factor IF-3	A0A2L0UZ54	Agrobacterium_phage	5.7e-16	34.8
WP_024523381.1\|1947926_1949855_-\|tRNA	threonine--tRNA ligase	A0A2K9L297	Tupanvirus	3.3e-127	37.4

DBSCAN-SWA_3

3205796 : 3249648

Erwinia_phage(27.5%)

terminase,head,capsid,tail,lysis,holin,plate,portal,integrase,tRNA

attL 3212016:3212074|attR 3245815:3245873

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_070245282.1\|3205796_3206822_-\|tRNA	tRNA (adenosine(37)-N6)-threonylcarbamoyltransferase complex transferase subunit TsaD	A0A0R6PI74	Moraxella_phage	1.3e-106	58.4
WP_005295814.1\|3207035_3207251_+	30S ribosomal protein S21	NA	NA	NA	NA
WP_024523602.1\|3207439_3209188_+	DNA primase	A0A0K1LMQ9	Caulobacter_phage	3.9e-74	36.4
WP_024523601.1\|3209423_3211265_+	RNA polymerase sigma factor RpoD	A0A2I7SAT0	Vibrio_phage	8.3e-35	33.7
WP_024523600.1\|3211355_3211850_-	G/U mismatch-specific DNA glycosylase	NA	NA	NA	NA
3212016:3212074	attL	NA	NA	NA	NA
WP_005281637.1\|3212202_3212421_-	DNA-binding transcriptional regulator	A0A2I8TV89	Erwinia_phage	4.6e-25	69.4
WP_070245283.1\|3212495_3213650_-	phage late control D family protein	A0A218M4J7	Erwinia_phage	5.6e-146	70.7
WP_070245284.1\|3213649_3214132_-\|tail	phage tail protein	A0A0F7LDE8	Escherichia_phage	5.3e-50	62.3
WP_070245285.1\|3214143_3216588_-\|tail	phage tail tape measure protein	U5N0T4	Enterobacteria_phage	6.1e-267	66.6
WP_070245286.1\|3216580_3216721_-\|tail	GpE family phage tail protein	A0A0F7LCR6	Escherichia_phage	4.0e-14	80.0
WP_005295823.1\|3216750_3217044_-\|tail	phage tail assembly protein	Q37846	Escherichia_phage	9.8e-23	67.9
WP_070245287.1\|3217104_3217623_-\|tail	phage major tail tube protein	S4TNZ0	Salmonella_phage	9.1e-80	83.1
WP_070245288.1\|3217635_3218823_-\|tail	phage tail sheath protein	S4TRX2	Salmonella_phage	1.3e-190	83.5
WP_083275038.1\|3219073_3219424_-	hypothetical protein	A0A0M4S6V4	Salmonella_phage	3.0e-18	37.9
WP_070245290.1\|3221069_3221681_-\|tail	phage tail protein I	A0A218M4J3	Erwinia_phage	2.3e-90	78.1
WP_070245291.1\|3221673_3222582_-\|plate	baseplate assembly protein	A0A218M4K5	Erwinia_phage	2.6e-130	79.8
WP_047059219.1\|3222586_3222937_-\|plate	baseplate assembly protein	A0A0M4RE59	Salmonella_phage	7.8e-35	63.8
WP_070245292.1\|3222933_3223575_-\|plate	phage baseplate assembly protein V	Q6K1H6	Salmonella_virus	4.9e-83	71.8
WP_070245293.1\|3223644_3224094_-	phage virion morphogenesis protein	O80313	Escherichia_phage	7.2e-41	57.8
WP_070245294.1\|3224086_3224548_-\|tail	phage tail protein	A0A0F7LA33	Escherichia_phage	6.7e-50	63.9
WP_070245295.1\|3224628_3225081_-\|lysis	LysB family phage lysis regulatory protein	A0A218M4K2	Erwinia_phage	9.5e-17	41.2
WP_070245296.1\|3225077_3225575_-	glycoside hydrolase family 104 protein	S4TUB1	Salmonella_phage	3.5e-73	77.6
WP_005281588.1\|3225561_3225870_-\|holin	holin	O80308	Escherichia_phage	2.1e-31	73.5
WP_024523586.1\|3225873_3226077_-\|tail	tail protein X	U5N3E7	Enterobacteria_phage	5.2e-23	70.1
WP_005281582.1\|3226073_3226577_-\|head	head completion/stabilization protein	A0A0F7LDJ1	Escherichia_phage	3.2e-53	60.4
WP_024523584.1\|3226670_3227432_-\|terminase	terminase	Q6K1I5	Salmonella_virus	5.3e-68	60.2
WP_070245297.1\|3227435_3228539_-\|capsid	phage major capsid protein, P2 family	A0A0M4R4W2	Salmonella_phage	3.1e-138	68.8
WP_070245298.1\|3228604_3229447_-\|capsid	GPO family capsid scaffolding protein	A0A218M4L9	Erwinia_phage	1.7e-96	64.9
WP_070245299.1\|3229608_3231375_+\|terminase	terminase ATPase subunit family protein	A0A0M4RE51	Salmonella_phage	6.5e-303	86.6
WP_070245300.1\|3231374_3232409_+\|portal	phage portal protein	Q6K1J0	Salmonella_virus	1.7e-162	79.6
WP_070245301.1\|3232804_3234229_+	ATP-binding protein	NA	NA	NA	NA
WP_064169842.1\|3234225_3235218_+	hypothetical protein	NA	NA	NA	NA
WP_020316745.1\|3235168_3236320_-	DNA cytosine methyltransferase	M1PSQ0	Streptococcus_phage	6.6e-30	29.3
WP_070245302.1\|3236706_3236919_-	Tum protein	A0A218M4I0	Erwinia_phage	4.0e-18	77.0
WP_167352273.1\|3237033_3239079_-	replication endonuclease	Q6K1F3	Salmonella_virus	8.3e-294	73.7
WP_070245673.1\|3239249_3240254_-	phosphoadenosine phosphosulfate reductase family protein	B7SYG0	Stenotrophomonas_phage	1.1e-68	43.7
WP_070245304.1\|3240270_3240492_-	TraR/DksA family transcriptional regulator	A0A0M4S5Q7	Salmonella_phage	5.1e-16	54.8
WP_070245305.1\|3240491_3240719_-	DUF2732 family protein	NA	NA	NA	NA
WP_070245306.1\|3240785_3241127_-	DUF5347 domain-containing protein	A0A218M4I7	Erwinia_phage	7.2e-25	55.8
WP_083275039.1\|3241090_3241291_-	DUF2724 domain-containing protein	Q6K1F7	Salmonella_virus	1.5e-19	69.7
WP_070245307.1\|3241292_3241799_-	phage regulatory CII family protein	A0A0M4QWN1	Salmonella_phage	1.0e-59	67.5
WP_070245308.1\|3241829_3242093_-	hypothetical protein	A0A218M4I5	Erwinia_phage	6.9e-44	98.9
WP_070245309.1\|3242222_3242801_+	phage repressor protein CI	A0A218M4J1	Erwinia_phage	2.8e-61	58.1
WP_167352265.1\|3242830_3243373_+	hypothetical protein	NA	NA	NA	NA
WP_070245311.1\|3243382_3244387_+\|integrase	tyrosine-type recombinase/integrase	A0A218M4I3	Erwinia_phage	1.2e-189	96.7
WP_083275040.1\|3244408_3245653_+	hypothetical protein	NA	NA	NA	NA
WP_070245674.1\|3246311_3247211_+	glycyl-radical enzyme activating protein	NA	NA	NA	NA
3245815:3245873	attR	NA	NA	NA	NA
WP_024523565.1\|3247215_3249648_+	formate C-acetyltransferase/glycerol dehydratase family glycyl radical enzyme	A0A2H4YEI2	Aeromonas_phage	1.7e-06	41.9

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP016043

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection