CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_017299	Clostridium botulinum H04402 065, complete genome	9 crisprs	DEDDh,csa3,WYL,cas14j,RT,cmr6gr7,cmr5gr11,cmr4gr7,csx1,cmr3gr5,cas10,cmr1gr7,cas6,casR,cas3	1	12	8	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_017299_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_1

848632-848720

Orphan

III-B

Consensus_repeat	Method
GTTGAACATTAACATGAGATGTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_017299_1

>merge|NC_017299|1|848632-848720|CRISPRCasFinder
GTTGAACATTAACATGAGATGTATTTAAATTTTGAATTAAATTCTGCTGTAATTTTCATAATTTTTGTTGAACATTAACATAAGATGTA

>NC_017299|1|1|848632-848720|CRISPRCasFinder
GTTGAACATTAACATGAGATGTA	TTTAAATTTTGAATTAAATTCTGCTGTAATTTTCATAATTTTT
GTTGAACATTAACATAAGATGTA

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_014519937.1\|844610_845363_+\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014519943.1\|853378_853639_+\|TfoX/Sxy-family-protein	unknown	unknown	gnl\|CDD\|377439
NC_017299.1\|WP_014519932.1\|837557_838544_+\|MBL-fold-metallo-hydrolase	unknown	unknown	gnl\|CDD\|293811
NC_017299.1\|WP_014519944.1\|853736_854192_+\|GyrI-like-domain-containing-protein	unknown	unknown	gnl\|CDD\|225980
NC_017299.1\|WP_041926536.1\|840527_841499_+\|ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|380548
NC_017299.1\|WP_014519936.1\|843984_844449_+\|transcription-elongation-factor-GreA	unknown	unknown	gnl\|CDD\|273638
NC_017299.1\|WP_014519942.1\|849939_853287_+\|DEAD/DEAH-box-helicase-family-protein	unknown	unknown	gnl\|CDD\|226581
NC_017299.1\|WP_014519939.1\|847185_848343_+\|restriction-endonuclease-subunit-S	unknown	unknown	gnl\|CDD\|341182
NC_017299.1\|WP_014519938.1\|845634_847092_+\|SAM-dependent-DNA-methyltransferase	unknown	unknown	gnl\|CDD\|223363
NC_017299.1\|WP_014519930.1\|835472_835940_+\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014519950.1\|858868_859690_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
NC_017299.1\|WP_014519945.1\|854788_855715_+\|CBP-family-penicillin-hydrolyzing-class-A-beta-lactamase	unknown	unknown	gnl\|CDD\|185339
NC_017299.1\|WP_014519933.1\|839741_840497_+\|ATP-binding-cassette-domain-containing-protein	unknown	unknown	gnl\|CDD\|224026
NC_017299.1\|WP_014519952.1\|861325_862366_+\|iron-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|376439
NC_017299.1\|WP_014519946.1\|855920_856295_+\|BlaI/MecI/CopY-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|367747
NC_017299.1\|WP_014519953.1\|862365_863406_+\|iron-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|376439
NC_017299.1\|WP_014519951.1\|860240_861230_+\|ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|223687
NC_017299.1\|WP_012704485.1\|838885_839779_+\|ABC-transporter	unknown	unknown	gnl\|CDD\|226605
NC_017299.1\|WP_014519954.1\|863681_864467_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224045
NC_017299.1\|WP_014519931.1\|835946_837290_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_014519943.1\|853378_853639_+\|TfoX/Sxy-family-protein	gnl\|CDD\|377439	pfam04994, TfoX_C, TfoX C-terminal domain. TfoX may play a key role in the development of genetic competence by regulating the expression of late competence-specific genes. This family corresponds to the C-terminal presumed domain of TfoX. The domain is found associated with pfam00383 in Neisseria meningitidis TadA. It is also found as an isolated domain in some proteins suggesting this is an autonomous domain.	4.3586e-27
NC_017299.1\|WP_014519932.1\|837557_838544_+\|MBL-fold-metallo-hydrolase	gnl\|CDD\|293811	cd07725, TTHA1429-like_MBL-fold, uncharacterized Thermus thermophilus TTHA1429 and related proteins; MBL-fold metallo hydrolase domain. Includes the MBL-fold metallo hydrolase domain of uncharacterized Thermus thermophilus TTHA1429 and related proteins. Members of this subgroup belong to the MBL-fold metallo-hydrolase superfamily which is comprised mainly of hydrolytic enzymes which carry out a variety of biological functions.	6.55823e-42
NC_017299.1\|WP_041926536.1\|840527_841499_+\|ABC-transporter-substrate-binding-protein	gnl\|CDD\|380548	cd06325, PBP1_ABC_unchar_transporter, type 1 periplasmic ligand-binding domain of uncharacterized ABC-type transport systems predicted to be involved in uptake of amino acids, peptides, or inorganic ions. This group includes the type 1 periplasmic ligand-binding domain of uncharacterized ABC (ATPase Binding Cassette)-type transport systems that are predicted to be involved in the uptake of amino acids, peptides, or inorganic ions. This subgroup has high sequence similarity to members of the family of hydrophobic amino acid transporters (HAAT), such as leucine-isoleucine-valine binding protein (LIVBP); its ligand specificity has not been determined experimentally.	5.35477e-111
NC_017299.1\|WP_014519936.1\|843984_844449_+\|transcription-elongation-factor-GreA	gnl\|CDD\|273638	TIGR01462, Transcription_elongation_factor_GreA, transcription elongation factor GreA. The GreA and GreB transcription elongation factors enable to continuation of RNA transcription past template-encoded arresting sites. Among the Proteobacteria, distinct clades of GreA and GreB are found. GreA differs functionally in that it releases smaller oligonucleotides. Because members of the family outside the Proteobacteria resemble GreA more closely than GreB, the GreB clade (TIGR01461) forms a plausible outgroup and the remainder of the GreA/B family, included in this model, is designated GreA. In the Chlamydias and some spirochetes, the region described by this model is found as the C-terminal region of a much larger protein. [Transcription, Transcription factors].	5.12243e-41
NC_017299.1\|WP_014519942.1\|849939_853287_+\|DEAD/DEAH-box-helicase-family-protein	gnl\|CDD\|226581	COG4096, HsdR, Type I site-specific restriction-modification system, R (restriction) subunit and related helicases [Defense mechanisms].	0
NC_017299.1\|WP_014519939.1\|847185_848343_+\|restriction-endonuclease-subunit-S	gnl\|CDD\|341182	cd17293, RMtype1_S_Ppo21ORF8840P_TRD1-CR1_like, Type I restriction-modification system specificity (S) subunit TRD-CR, similar to Paenibacillus polymyxa SQR-21 SQR21 S subunit (S.Ppo21ORF8840P) TRD1-CR1, Nitrosococcus halophilus Nc4 S subunit (S.NhaNc4ORF3964P) TRD1-CR1. The recognition sequences of Paenibacillus polymyxa SQR-21 SQR21 S subunit (S.Ppo21ORF8840P) and Nitrosococcus halophilus Nc4 S subunit (S.NhaNc4ORF3964P) are undetermined. The restriction-modification (RM) system S subunit consists of two variable target recognition domains (TRD1 and 2) and two conserved regions (CR1 and CR2) which separate the TRDs. The TRDs each bind to different specific sequences in the DNA. RM systems protect a bacterial cell against invasion of foreign DNA by endonucleolytic cleavage of DNA that lacks a site specific modification. The host genome is protected from cleavage by methylation of specific nucleotides in the target sites. In type I systems, both restriction and modification activities are present in one heteromeric enzyme complex composed of one DNA specificity (S) subunit (this family), two modification (M) subunits and two restriction (R) subunits. This superfamily contains both TRD1-CR1 and TRD2-CR2. It may also include TRD-CR-like sequence-recognition domains of various type II restriction enzymes and methyltransferases and type I DNA methyltransferases.	3.46392e-70
NC_017299.1\|WP_014519944.1\|853736_854192_+\|GyrI-like-domain-containing-protein	gnl\|CDD\|225980	COG3449, COG3449, DNA gyrase inhibitor [DNA replication, recombination, and repair].	7.75396e-62
NC_017299.1\|WP_014519950.1\|858868_859690_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	1.76708e-25
NC_017299.1\|WP_014519954.1\|863681_864467_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224045	COG1120, FepC, ABC-type cobalamin/Fe3+-siderophores transport systems, ATPase components [Inorganic ion transport and metabolism / Coenzyme metabolism].	1.87398e-122
NC_017299.1\|WP_014519953.1\|862365_863406_+\|iron-ABC-transporter-permease	gnl\|CDD\|376439	pfam01032, FecCD, FecCD transport family. This is a sub-family of bacterial binding protein-dependent transport systems family. This Pfam entry contains the inner components of this multicomponent transport system.	2.83886e-94
NC_017299.1\|WP_014519933.1\|839741_840497_+\|ATP-binding-cassette-domain-containing-protein	gnl\|CDD\|224026	COG1101, PhnK, ABC-type uncharacterized transport system, ATPase component [General function prediction only].	3.70658e-104
NC_017299.1\|WP_014519952.1\|861325_862366_+\|iron-ABC-transporter-permease	gnl\|CDD\|376439	pfam01032, FecCD, FecCD transport family. This is a sub-family of bacterial binding protein-dependent transport systems family. This Pfam entry contains the inner components of this multicomponent transport system.	2.39761e-82
NC_017299.1\|WP_014519946.1\|855920_856295_+\|BlaI/MecI/CopY-family-transcriptional-regulator	gnl\|CDD\|367747	pfam03965, Penicillinase_R, Penicillinase repressor. The penicillinase repressor negatively regulates expression of the penicillinase gene. The N-terminal region of this protein is involved in operator recognition, while the C-terminal is responsible for dimerization of the protein.	7.83199e-43
NC_017299.1\|WP_014519938.1\|845634_847092_+\|SAM-dependent-DNA-methyltransferase	gnl\|CDD\|223363	COG0286, HsdM, Type I restriction-modification system methyltransferase subunit [Defense mechanisms].	1.59421e-67
NC_017299.1\|WP_014519951.1\|860240_861230_+\|ABC-transporter-substrate-binding-protein	gnl\|CDD\|223687	COG0614, FepB, ABC-type Fe3+-hydroxamate transport system, periplasmic component [Inorganic ion transport and metabolism].	6.16723e-44
NC_017299.1\|WP_012704485.1\|838885_839779_+\|ABC-transporter	gnl\|CDD\|226605	COG4120, COG4120, ABC-type uncharacterized transport system, permease component [General function prediction only].	2.22803e-79
NC_017299.1\|WP_014519945.1\|854788_855715_+\|CBP-family-penicillin-hydrolyzing-class-A-beta-lactamase	gnl\|CDD\|185339	PRK15442, PRK15442, beta-lactamase TEM; Provisional.	8.21376e-63

>NC_017299.1|WP_014519939.1|847185_848343_+|restriction-endonuclease-subunit-S
MLVKYKLWELGEILTGNTPSKKNGEFYDAKDIMFIKPDDINNNITEIECSKEYISNKAEKKARIIPKDSLLITCIGSIGKIAINKEKSAFNQQINSIVHNEKIISSKYLAYVIMINKQRLESISNAPVVPIINKTQFSEFEVYIHEKKEIQEKIANVLDKAQSLIDKRKAQIEALDELVKSRFIEMFGDLKSNSKNWDVSEFNEFATIDTNMTKDFRKYKDYPHIGIECIEKNTGRILEYKLVKNSDLKSGKYIFDNRHIIYSKIRPNLNKVALPSFAGVCSADSYPLLCNEKITTRSYLGYVLRSEFFLSYILAFSGRTNIPKVNKEQLRGFKMPTPPINLQNQFADFVKQVDKLKFEMEKSLKELEDNFNSLMQRAFKGELFN
>NC_017299.1|WP_014519938.1|845634_847092_+|SAM-dependent-DNA-methyltransferase
MITGELKSKIDRIWETFWTGGITNPLEVIEQFTYFLFIKDLDDNEILAESDAELLGIPFEGMFPSDKQYLRWSKFKNEEAGEMYRIVSQEVFPFIKDIHGDKQSAYSKYMSDAMFKIPTPLMLSKIVDAIDNLEIEDKDTKGDLYEHLLSNISAAGMNGQFRTPRHIIKMMVELMKPTPEDIIVDPAMGTAGFLVKLEEYLREKHSELFLVQGLKEHFNNKMFNGFDMDRTMLRIGAMNMMLHGVDNPNIEYKDSLSETNKDSEKYTLVLANPPFKGSLDYEAVSADLLKVSKTKKTELLFLALFLRILKTGGRCASIVPDGVLFGSTKGHKDIRREIADNNKLEAIISMPSGVFKPYAGVSTAIMIFTKTGTGGTDKVWFYDMKSDGYSLDDKRNPIEDNDIPDIIERFNNLDKEENRKRTEQSFFVPVEEIRENNYDLSINKYKEIEYEEVVYDEPKVILERVKKLEKEITEGIDELEKMIEG
>NC_017299.1|WP_014519937.1|844610_845363_+|hypothetical-protein
MFYCPYYFFRKNVGNNKVYIIDRKKGDVNGDKVEDTILLIGNKPSGTDSPFVSNIRLVIKDGKTGKSITVPLKENSGYNPTIFLGDFTGDKIKDILVSIDSGGSGGFGFYYIYSFANNQLKLIFDFEKFGEEYTYEVNYKDNYKVEVISENLKIKYIIDITYKGKEYLNEIYDLNGKLKEPISGFVIPLSNLYAIDFERDGTYELYVFQRIAGRYNADGLGYVQTALKWEKDKFTTFFQNVGIQGKYIGG
>NC_017299.1|WP_014519936.1|843984_844449_+|transcription-elongation-factor-GreA
MKNILTEENMNKLKEELEYRMTKKRAEIAKEKLEAAAHGDRSENAEYKEACANYRENDNRIQYLLTMISTASVIDEKNQDKSVLGVNSKCKIKFVEDEFETNVSLVTTMDAEPEKMLISVESDLGKALMGKKVGDVAEVDAPGEKYTVEVLEII
>NC_017299.1|WP_041926536.1|840527_841499_+|ABC-transporter-substrate-binding-protein
MKKLVTGILLTISILTLAACGKTTKKDKVLNIGINQIVEYVALDDNRKGFIKALEESGYKDGDNIKIDYKNAQGDIGVSQTIAKKFASDKKDLIFAVGTPAAQSVFNATKQTPIIISAVTDPIKAGLVNSLEEPGKNVSGTIDYLPVENQLKLLKNLVPKAKKIGFIYNTSEINSGVQLNELKKAAKGYEIIETGVTSTNEINNAIANLVNKIDVLYVPTDQLVVSSMPIIAKHTLDAKIPIIAAEKGSVEAGALATVGIDYYQLGYETGKMAVSVLKGEDISKMPIKMTSKTEIYVNKNSLEKLGIDKGNLGNLGNVKYVEK
>NC_017299.1|WP_014519933.1|839741_840497_+|ATP-binding-cassette-domain-containing-protein
MLEIQNLSKSFHNSYMGENKLFHNLNLTINEGDFVSIIGSNGTGKSTLLNILSGVVKETSGNIILKGVDITKLPEHKRTKIISRVFQNPELGTCPSMTVRENLSLALNKGKLTNIKYCLRYKDDYLQSLLNDISLDFKKMLDIEVKYLSGGQRQVLSLIMASVNNPKVLLLDEHTAALDPKTSGEVMAITEKIVTQKNITSLMVTHNLRDAINYGNRLIMLHKGKIILDLNEKEKRNLTVEDILKKFEYAV
>NC_017299.1|WP_012704485.1|838885_839779_+|ABC-transporter
MEVVSSILMQSLILSIMVMGVYISYKILDFPDMSADGSFTLGAAIVAVLLTKGVSPITASIVALIGGLVAGLLTGILNVKIKISNLLSGILVMGILYSFNLRIMGKANIPIFSEKNIFYDFNPLMIMLFIVILIKILIDLFLKTGLGYLLKGVGDNSQMIKSLGIEVGKIKILGLMLSNGLIAFSGGIMAQYQGFSDASMGIGTLILGIASIIIGTSIIKRKSFIKETSMVIMGTIIYQGTIYLAMTLGLTTVDLKMITSLIIIVFLALREIDNKYEEKSWRWIKNVRNSKFIKKLS
>NC_017299.1|WP_014519932.1|837557_838544_+|MBL-fold-metallo-hydrolase
MRETYENIYLEELPLPNNPLKYLNFYIIKGKDKSMIIDTGFNREDTKERMMEIFKELDLKPENTILFLTHLHSDHTGLATYFQDMGLTIYISKTDGDLLNGSVEKSDPMWSGTIQRAVWQGLEEEQLDIEDNPGFKFRPISHINFVPAIPGEYIEIGDYNFEIIDLKGHTPGMVGLYEKKHKILFCGDHILGKITPNITFWGFEYGDMLGTYFKSLDFVYNMDIDHLFSSHRFLIEDHRRRINELYLHHEKRLDEIRQVLRKFGACTVKQVTKELHWDIKSKNWDEFPKSQKWFAAGEAHAHLEHLRALGEVTMEEKNRILYYKMRLT
>NC_017299.1|WP_014519931.1|835946_837290_+|hypothetical-protein
MRNTIQRYDYSVENKFSEESFLKDVLVTCYKKKLLDENTLARIYYERMELLRVKLKYYTKDESSSVMTEVAESILKCIDYTIGIYLKNFENIELITEELKHTSLDDMLKMGQDLIKNKKLECKKLFKEIKANKLKVDNYSYNDTVDDGLSPFFKEYDDFFASHETPGCSIDYQLYIDTMNFIGIEYVYNYLYDLSLENEFCNKFDIGEINKLLKGYDKKCELLLINIFELVLINSLGLIICNKDLSSLNINNLDRKIIKNRLEKLSIDELNAELIKDAKICLEILEIKNTELMTYIKKGILNIALLINERIKLNKLETVFISFNEEECNEIVEYIDGIRMANSKFKKLTEEIRECSLVEDKILLIKNNIKSLEDLVDMLNADCLFGDEYIAFFKSLSKMEIVLLSKYISDLSFEYEKDLYVEFNKYILSLRKEEQREISELKEKINL
>NC_017299.1|WP_014519930.1|835472_835940_+|hypothetical-protein
MKNSIDLFESNLLDKKVFNDIIQCNEITREYGLKLSEKDVKEIIDTRNIELQKSGRIEFNGQIINKIVTAFCDSPYISQYNYSETINELVEIFYNYKNETLDYISDDELIEIMKENFDNYCQGSLEILEGKALYRIANNIKSGFKDYTNLDNEKD
>NC_017299.1|WP_014519942.1|849939_853287_+|DEAD/DEAH-box-helicase-family-protein
MCTNFEFLKFKKEFNAFSDACIEAEKSILVSPSTTAILSRRALELAVKWVYSFDEDLGIPYRDNISSLIHSGSFLELIDSEMLPLLKFVISLGNVAVHTNKGITREEAILSLHNLYQFINWIDYCYGDDYKEKKFDENSLLQGEEKRVRPEELKDLYDKLSSKDKKLEEIIKENEELRKEITQKRKDNTENYDFDIDEISEFDTRKIYIDVELKLAGWDFNKDIGEEIELFGMPNNAEKGYADYVLYGDNGKPLAVVEAKKTSKDPKIGREQAKLYADCLEKQYDVRPVIFYTNGLETYIWDDYNGYSERRIYGFFKKDELQLMIDRRTQKKTLRNINIKDEISNRYYQKEAITACCEELERRKRKLLLVMATGTGKTRTAISLVDVLTRHNWVKNILFLADRTALVKQAKKNFSNLLPDLSLCNLLDSKDNPEESRMIFSTYPTMMNAIDDTKAKDGKRLFTCGHFDLIIVDESHRSIYKKYKAIFDYFDAYLIGLTATPKDEVDKNTYGVFDMENGVPTYAYEFDKAVEDEFLVEYETIEVKSKIMEDGIKYDELSDEDKEEYEDKFDKDENIGEEIYSSAINQWLFNANTIDLVLNKLMEKGLRIEGNEKLGKTIIFAKSHKHAEAIKERFDILYSKLGSNYAKVIDNQINYVESVIDDFSDKDKLPQIAISVDMLDTGIDIPEILNLVFFKKIRSKTKFWQMIGRGTRLCEDLLGIGQDKDKFLIFDFCNNFEFFRMNPKGFKGNLGQTLSERIFNLKLDLVKELQDLRYSDEEYVSHRNELLKYLIEDVNNLNEDNFMVKMNLKYVQKYKNKNEWQSLGAISTQDIKEHISPLISKLKDDEFAKRFDILMYTIELVNLQGNNATRPIKSVIETAKSLSKLGTIPEIQEQKYIIDKVRETEFWEDVDLFELDEVRSALRELLKYLEKITQKTYYTHFEDMIINEESHGAMYNANDLKNYRKKVEYYLKEHENEIAIYKLKNNKQLTKQDLETLESIMWQELGTKADYEKEFGDMPVNKLVRKMVGLDRNIANELFSEFLNNENLNTKQIHFVKLIIDYVVKNGFIDDNKILKEDPFRAVGNLSALFKDNRNEAISIMGKVAKIKTNAEIII
>NC_017299.1|WP_014519943.1|853378_853639_+|TfoX/Sxy-family-protein
MGELSKLPNIGKEVERQLNKIGIFTYDELKDIGTEQAWLKIQEIDASACIHRLLALEGAIQGVKKTALPQERKADLKDFYNWHKCK
>NC_017299.1|WP_014519944.1|853736_854192_+|GyrI-like-domain-containing-protein
MDINIEMIPSYKIAYIRRTGPYGSENVQIMEKLKSWAREKNLFNENSIILGITQDNPQFTEAKDCRYDTCLVVSDEFKVDNKYINFGKTIGGKYCVFKISHTVDAMQKAWMEIFSELSKRNYEFNDRRPILERYAMQMINKHYCEICVPIL
>NC_017299.1|WP_014519945.1|854788_855715_+|CBP-family-penicillin-hydrolyzing-class-A-beta-lactamase
MKKIVNSKLKLNKFKMCIFISILIFSLTGCGNVENKTSENTKPEIQYNSAFSKIESDYGVKLGVYAFNTETNKEVTYNADKRFAYCSTFKSLISGAILQKYSSDQLKQVIKYSPKDVLSYAPVTKNHVDKGMTIEELCDAAVRFSDNTAANLLINLIGGPNGFKSALNQLGDTVTEPARIEPELNVATPGDNRDTSTPRQLSIDLKEYTTGNILSDDKKKILIDWMSGNATGDKLIRAGAPKDWMVSDKSGTGSYGTRNDIAIVIPPNKKPIFVAILSSKNAKDAKYDDKTISEASKIVFDYFINTRK
>NC_017299.1|WP_014519946.1|855920_856295_+|BlaI/MecI/CopY-family-transcriptional-regulator
MGDIPKISETEWKVMKIIWSNPYITANEVIDILDDYVEWKPKTVKTLLNRLLNKGAIHFEKEGREYKYYPLVSEDECIKEENKSFLDRVYNGAFKTMIANFIEEQNLTKEDIDDLKKLLEKNNK
>NC_017299.1|WP_014519950.1|858868_859690_+|helix-turn-helix-transcriptional-regulator
MEINLIDLVEHFAHTAFQVEGVYNYSIEPGSAGIMKTSPFPGFIFPLAGEANFIFDGTSYTAGLGNVIHGGANMRLSKKVIGKKKWNYILVLYSIRKPQPEGFSLEDSHFELVLGQSPRLVDLLQRLWRVSNQPGAIATFQKETIFRCVLDEIFICTRNQSSGDDRILFRQVSDYIHEYYMDTLTIRSLAELHGVNENRLFYVFSKYAGMGAGDYLMIHRLNRAKELLVTGNAPVVAVAKSVGYHDPYHFSKRFKKQFGISPSKFRDKFRYKG
>NC_017299.1|WP_014519951.1|860240_861230_+|ABC-transporter-substrate-binding-protein
MKKFMGLFVSLILIIGVLSGCSGSNNKDSQSKSDNTSAEQTKDNENSQWPRTIKDATGKEIKFDKKPERVVILHAAFLDYFFALETPPAASAGATVGNAMKALDEFETLKPYKGTANVMDLGSARDLNLEAVLKSKPDVIVTFKGHADKIYDKLAKIAPVVQIDFKDSWQNKTMQCAKIVGKEDLANKIINETEKEIKNTKKLLENHKDKTVALLRVDGKGNFVALGSKDTLYYNKEDGFNLSIPKGYPENSKVISLEGLSKMNPDYIIFRHFPEIVNSAVEKQKTSPVWQSLNAVKKDQILFFDDSLNSESPLALQISAKNLTKAISK
>NC_017299.1|WP_014519952.1|861325_862366_+|iron-ABC-transporter-permease
MKKPMEKVNININKKDHIRKMWFIVLGGLGLLVFIMMFSTTKGAENIPLASLWDALFHFNGKEMNHLVILNLRIPRVIASALVGAALAVSGAIMQGTTGNPLADSGLLGLNAGAAFALSICFAFFPGMKYIHIILFSFLGAALGAVLVNGIASMKRGGQTPIRLVLAGAAVSTLLVAMSQGIALYFNVAQSIMFWTVGGVAGSNWEQVRIMIPWIIGGLIGSVILSPYISILSLGQDVAKGLGINIRVVNVLSSIIVLILVGASVSVVGSVGFVGLIVPHIARFFVGMDYKLIIPSTAVMGALLVVLADLGARTLNPPFETPIGAIISLIGVPLFLNLARRQRSAI
>NC_017299.1|WP_014519953.1|862365_863406_+|iron-ABC-transporter-permease
MKEQQQIIEAYKRKVAIRNTLIVIGCVLLLGVSLIVSMDTGYIKMSPFDVLRTLFGKGTEKEKLILFDFRLPRIVISMLVGAGLALSGCIIQSVSKNPLADPGILGINAGASLMVILYVLIFSAESFLSVFTLPFLALIGAGITAVIVYIFSYKRDEGISTMRLVLTGVAVQAGISALTTLLVVKLDDTQYNFVVAWQAGSIWGSNWKFVMTLLPWLLILIPYILTKSSVMDILTLSDDIAYGLGASVEKERRKLLAAAVALAASCVAVSGSISFVGLIAPHLSRRLVGPRHRVLLSTSILIGAVLVSLADTIGRVIIQPSEIPTGIVVAIIGAPYFLYLLSNSKS
>NC_017299.1|WP_014519954.1|863681_864467_+|ABC-transporter-ATP-binding-protein
MNSITTTNLAIAYEDKLIVDGLNMNIPKGKITTIIGPNGCGKSTVLKTIGRILEPKEGLVYLNGDDIRKFSTKEVAQKMAILPQSPQAQGGLTVGELVSYGRFPHKKGFGKLSPEDKKVIQWALDITKLTELEVTMVDNLSGGQRQRVWIAMALAQQTDLILLDEPTTYLDMAYQLEVLELLYNLNREESCTIVMVLHDLNLAARFADYMIAIRSGNIVRCGTPKEIMTNKVLKDTFNIDAEIVWGSKTDRPTCISYELIK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_2

2310240-2310337

TypeIII-C

III-B

Consensus_repeat	Method
TTTAAATACATCCTATGTTACTGTTCAACCA	CRISPRCasFinder

1 spacers

cmr6gr7

The CRISPR arrays of NC_017299_2

>merge|NC_017299|2|2310240-2310337|CRISPRCasFinder
CTTAAATACATCTCATGTTATTATTCAACTAGATGTTTCTTCATATAAACAACAGGTTAACTATCATTTAAATACATCTCATGCTAATGTTCAATTTT

>NC_017299|2|2|2310240-2310337|CRISPRCasFinder
CTTAAATACATCTCATGTTATTATTCAACTA	GATGTTTCTTCATATAAACAACAGGTTAACTATCA
TTTAAATACATCTCATGCTAATGTTCAATTTT

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_017299.1\|WP_014521019.1\|2299554_2301546_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|376899
NC_017299.1\|WP_003358211.1\|2306073_2307438_-\|PTS-ascorbate-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|236502
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|379112
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187564
NC_017299.1\|WP_014521021.1\|2301535_2302303_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224059
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	unknown	unknown	gnl\|CDD\|236545
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|214874
NC_017299.1\|WP_041926685.1\|2323789_2324098_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|213662
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	unknown	unknown	gnl\|CDD\|183481
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	unknown	unknown	gnl\|CDD\|238129
NC_017299.1\|WP_014521022.1\|2303768_2305862_-\|transcription-antiterminator	unknown	unknown	gnl\|CDD\|226234
NC_017299.1\|WP_014521018.1\|2297849_2298989_-\|DOIS-domain-containing-protein	unknown	unknown	gnl\|CDD\|341476
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_017299.1\|WP_003358205.1\|2303089_2303443_-\|zinc-ribbon-domain-containing-protein	unknown	unknown	gnl\|CDD\|379915
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	unknown	unknown	gnl\|CDD\|99905

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	8.44942e-25
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	9.02096e-120
NC_017299.1\|WP_014521019.1\|2299554_2301546_-\|ABC-transporter-permease	gnl\|CDD\|376899	pfam02687, FtsX, FtsX-like permease family. This is a family of predicted permeases and hypothetical transmembrane proteins. Buchnera aphidicola LolC has been shown to transport lipids targeted to the outer membrane across the inner membrane. Both LolC and Streptococcus cristatus TptD have been shown to require ATP. This region contains three transmembrane helices.	0.000742437
NC_017299.1\|WP_003358211.1\|2306073_2307438_-\|PTS-ascorbate-transporter-subunit-IIC	gnl\|CDD\|236502	PRK09410, ulaA, PTS system ascorbate-specific transporter subunit IIC; Reviewed.	0
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|379112	pfam13302, Acetyltransf_3, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	3.84974e-18
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187564	cd05254, dTDP_HR_like_SDR_e, dTDP-6-deoxy-L-lyxo-4-hexulose reductase and related proteins, extended (e) SDRs. dTDP-6-deoxy-L-lyxo-4-hexulose reductase, an extended SDR, synthesizes dTDP-L-rhamnose from alpha-D-glucose-1-phosphate, providing the precursor of L-rhamnose, an essential cell wall component of many pathogenic bacteria. This subgroup has the characteristic active site tetrad and NADP-binding motif. This subgroup also contains human MAT2B, the regulatory subunit of methionine adenosyltransferase (MAT); MAT catalyzes S-adenosylmethionine synthesis. The human gene encoding MAT2B encodes two major splicing variants which are induced in human cell liver cancer and regulate HuR, an mRNA-binding protein which stabilizes the mRNA of several cyclins, to affect cell proliferation. Both MAT2B variants include this extended SDR domain. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.29392e-17
NC_017299.1\|WP_014521021.1\|2301535_2302303_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224059	COG1136, SalX, ABC-type antimicrobial peptide transport system, ATPase component [Defense mechanisms].	2.77881e-103
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	gnl\|CDD\|236545	PRK09510, tolA, cell envelope integrity inner membrane protein TolA; Provisional.	1.09003e-10
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|214874	smart00871, AraC_E_bind, Bacterial transcription activator, effector binding domain. This domain is found in the probable effector binding domain of a number of different bacterial transcription activators.and is also present in some DNA gyrase inhibitors. The absence of a HTH motif in the DNA gyrase inhibitors is thought to indicate the fact that these do not bind DNA.	1.18623e-26
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|213662	TIGR01898, repair_system, CRISPR type III-B/RAMP module RAMP protein Cmr6. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This family, represented by TM1791 of Thermotoga maritima, is designated Cmr6 [sic], for CRISPR/Cas Ramp Module protein 6. This family is both closely related to and frequently encoded next to the TM1792 family of Cas proteins described by TIGR01867. The two proteins are fused in an example from Methanopyrus kandleri.	4.38545e-34
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	3.96471e-12
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	gnl\|CDD\|183481	PRK12376, PRK12376, putative translaldolase; Provisional.	1.30653e-155
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	gnl\|CDD\|238129	cd00211, PTS_IIA_fru, PTS_IIA, PTS system, fructose/mannitol specific IIA subunit. The bacterial phosphoenolpyruvate: sugar phosphotransferase system (PTS) is a multi-protein system involved in the regulation of a variety of metabolic and transcriptional processes. This family is one of four structurally and functionally distinct group IIA PTS system cytoplasmic enzymes, necessary for the uptake of carbohydrates across the cytoplasmic membrane and their phosphorylation.	4.79769e-38
NC_017299.1\|WP_014521022.1\|2303768_2305862_-\|transcription-antiterminator	gnl\|CDD\|226234	COG3711, BglG, Transcriptional antiterminator [Transcription].	1.54549e-57
NC_017299.1\|WP_014521018.1\|2297849_2298989_-\|DOIS-domain-containing-protein	gnl\|CDD\|341476	cd08197, DOIS, 2-deoxy-scyllo-inosose synthase (DOIS) catalyzes carbocycle formation from D-glucose-6-phosphate to 2-deoxy-scyllo-inosose. 2-deoxy-scyllo-inosose synthase (DOIS) catalyzes carbocycle formation from D-glucose-6-phosphate to 2-deoxy-scyllo-inosose through a multistep reaction in the biosynthesis of aminoglycoside antibiotics. 2-deoxystreptamine (DOS)-containing aminoglycoside antibiotics includes neomycin, kanamycin, gentamicin, and ribostamycin. They are important antibacterial agents. DOIS is a homolog of the dehydroquinate synthase which catalyzes the cyclization of 3-deoxy-D-arabino-heputulosonate-7-phosphate to dehydroquinate (DHQ) in the shikimate pathway.	2.68903e-154
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	5.14673e-15
NC_017299.1\|WP_003358205.1\|2303089_2303443_-\|zinc-ribbon-domain-containing-protein	gnl\|CDD\|379915	pfam17032, zinc_ribbon_15, zinc-ribbon family. This zinc-ribbon region is found on a set of largely microsporidia-specific proteins.	0.000168002
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	gnl\|CDD\|99905	cd05563, PTS_IIB_ascorbate, PTS_IIB_ascorbate: subunit IIB of enzyme II (EII) of the L-ascorbate-specific phosphoenolpyruvate:carbohydrate phosphotransferase system (PTS). In this system, EII is an L-ascorbate-specific permease with two cytoplasmic subunits (IIA and IIB) and a transmembrane channel IIC subunit. Subunits IIA, IIB, and IIC are encoded by the sgaA, sgaB, and sgaT genes of the E. coli sgaTBA operon. In some bacteria, the IIB (SgaB) domain is fused C-terminal to the IIA (SgaT) domain. The IIB domain fold includes a central four-stranded parallel open twisted beta-sheet flanked by alpha-helices on both sides. The seven major PTS systems with this IIB fold include ascorbate, chitobiose/lichenan, lactose, galactitol, mannitol, fructose, and a sensory system with similarity to the bacterial bgl system.	2.52704e-28

>NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase
MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP
>NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase
MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL
>NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA
MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK
>NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB
MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK
>NC_017299.1|WP_003358211.1|2306073_2307438_-|PTS-ascorbate-transporter-subunit-IIC
MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE
>NC_017299.1|WP_014521022.1|2303768_2305862_-|transcription-antiterminator
MLNKRCSNILQIIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFATINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKVLKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNSSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTPTEDHKPSLKELLKPDFIKLNEEAKDWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISNVKNIKASSEIDSILYS
>NC_017299.1|WP_003358205.1|2303089_2303443_-|zinc-ribbon-domain-containing-protein
MIIWGWGKVTKKIIGAVFERTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK
>NC_017299.1|WP_014521021.1|2301535_2302303_-|ABC-transporter-ATP-binding-protein
MQNILSVEKIEKYYGNKDNVTKAIDNISFKVDEGEFVGIMGPSGSGKTTLLNCISTIDNVTTGKIMINNNDITRLKSKLLDKFRQNELGFIFQDFNLLDTLTAYENIALALTIQGEKTSKIDGKVKSVAKYLEIEKVLEKYPYQMSGGQKQRVASARAIVTNPSLILADEPTGALDSKSARLLLERFEKLNKELKATILMVTHDAFAASYAHRILFIKDGKIFNELVRGNDTRKEFFNKIIEVTSLLGGDDNNVF
>NC_017299.1|WP_014521019.1|2299554_2301546_-|ABC-transporter-permease
MYSKIALKNIKKSYKDYTIYFLTLILAVCIFYSFNSIDSQKALTDIKSSGGSYVSRLMEFMSAISVFVSIILGSLILYANNFLIKKRKKELGMYMILGMGKRKISKILVTETSIVGVISLIAGLIIGIGVSQGLSVFALKLFEVSINEYRFAVSTRAIGKTILYFGIMFLLVMIFNVFVISKYKIIDLLTSGRKNENIKFKNTFIYLLSFLLCAALLGFAYKSILKIGLKLREPMFKPSIAFVIVGTVLFFFSLAGVILYVVNKNKKIYFKGLNMFVVKQINSKVNTNFLSMSLICLMLFITILILSTGISFKNGFEEGVKIRAPFDASIIISNNSKKNNLEDVLDKINFKRSKDEKYATFNEYFSGVKLESLLSITDKNYKDGEVSFVKISDYNKILKLKGKKEINLNKDEILVMSTNNAVVKQANEKLKNSKKFNIKGKEYLVKNDTIIEENLATYLLADNVFTIVISDEFLYDYNKIVYSILNVMYSDKNREQNNKKYSEINKNYLDGKYKSLNISYMGAFSKDDIYSGSKGGTTSILFVGIYLGLVFLITSMAVLALQQLSEASDSIERYKVLKRIGANSKMIEKTIFLQTLIYFALPMILALIHSVIGIKVISDYIEVFTKIDISFSALITALIFSVVYAGYFYTTYIGYKNIVESNI
>NC_017299.1|WP_014521018.1|2297849_2298989_-|DOIS-domain-containing-protein
MYMNLAQKINDDYYHPEVKLETNLLESSPIYLGCNIWRESLLEKMMDLNTDKFFLITDDVVYNLFGKELLEYMNRKVSVKLIKLPSGEKHKNIKVFNDLMEDLFDNNVTKSSILISLGGGVVGNITGLAAALAFRGIRFFHIPTTFMSQTDSILSRKQGINSFYGKNMIGSYYTPLFNFIDTSFLTFDSERFIRGSFVETVKNGFIYNADFLNKLKSVIKNDFNVNQEGIFNLVKMSIESKLPIMKADPTEKGLAMILEYGHTVGHAIEKLSYGKLSHGESVSIGMMVAARVSEKLGYLSKQDVKEHLDILSALKTPTKIPSNIKISDIINRIKLDNKKDMNGIRFVVLENIGKCINTDGSYMIKVPFNIINEAIEETC
>NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase
MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP
>NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein
MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ
>NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase
MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI
>NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator
MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein
MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN
>NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK
>NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_3

2310663-2310889

TypeIII-C

III-B

Consensus_repeat	Method
TTTAAATACATCCTATGTTACTGTTCAAC	PILER-CR
TTTAAATACATCCTATGTTACTGTTCAACCA	CRISPRCasFinder

3 spacers

cmr6gr7

The CRISPR arrays of NC_017299_3

>merge|NC_017299|3|2310663-2310889|PILER-CR,CRISPRCasFinder
TTTAAATACATCTCATGTTACTGTTCAACGTAGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTATTTAAATACATCTTATGTTACTGTTCAACTTATATAAGTGAATATAATTTAACAATTCAATGGTTATTTAAATACATCCTATGTTACTGTTCAACCAACACGAGGTATGGGATGGAACTTATACATTAGACTTTAAATACATCCTATGTTACTGTTCAACCA

>NC_017299|3|1|2310663-2310887|PILER-CR
TTTAAATACATCTCATGTTACTGTTCAAC	GTAGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTA
TTTAAATACATCTTATGTTACTGTTCAAC	TTATATAAGTGAATATAATTTAACAATTCAATGGTTA
TTTAAATACATCCTATGTTACTGTTCAAC	CAACACGAGGTATGGGATGGAACTTATACATTAGAC
TTTAAATACATCCTATGTTACTGTTCAAC

>NC_017299|3|3|2310663-2310889|CRISPRCasFinder
TTTAAATACATCTCATGTTACTGTTCAACGT	AGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTA
TTTAAATACATCTTATGTTACTGTTCAACTT	ATATAAGTGAATATAATTTAACAATTCAATGGTTA
TTTAAATACATCCTATGTTACTGTTCAACCA	ACACGAGGTATGGGATGGAACTTATACATTAGAC
TTTAAATACATCCTATGTTACTGTTCAACCA

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_017299.1\|WP_014521019.1\|2299554_2301546_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|376899
NC_017299.1\|WP_003358211.1\|2306073_2307438_-\|PTS-ascorbate-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|236502
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|379112
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187564
NC_017299.1\|WP_014521021.1\|2301535_2302303_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224059
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	unknown	unknown	gnl\|CDD\|236545
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|214874
NC_017299.1\|WP_041926685.1\|2323789_2324098_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|213662
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	unknown	unknown	gnl\|CDD\|183481
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	unknown	unknown	gnl\|CDD\|238129
NC_017299.1\|WP_014521022.1\|2303768_2305862_-\|transcription-antiterminator	unknown	unknown	gnl\|CDD\|226234
NC_017299.1\|WP_014521018.1\|2297849_2298989_-\|DOIS-domain-containing-protein	unknown	unknown	gnl\|CDD\|341476
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_017299.1\|WP_003358205.1\|2303089_2303443_-\|zinc-ribbon-domain-containing-protein	unknown	unknown	gnl\|CDD\|379915
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	unknown	unknown	gnl\|CDD\|99905

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	8.44942e-25
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	9.02096e-120
NC_017299.1\|WP_014521019.1\|2299554_2301546_-\|ABC-transporter-permease	gnl\|CDD\|376899	pfam02687, FtsX, FtsX-like permease family. This is a family of predicted permeases and hypothetical transmembrane proteins. Buchnera aphidicola LolC has been shown to transport lipids targeted to the outer membrane across the inner membrane. Both LolC and Streptococcus cristatus TptD have been shown to require ATP. This region contains three transmembrane helices.	0.000742437
NC_017299.1\|WP_003358211.1\|2306073_2307438_-\|PTS-ascorbate-transporter-subunit-IIC	gnl\|CDD\|236502	PRK09410, ulaA, PTS system ascorbate-specific transporter subunit IIC; Reviewed.	0
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|379112	pfam13302, Acetyltransf_3, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	3.84974e-18
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187564	cd05254, dTDP_HR_like_SDR_e, dTDP-6-deoxy-L-lyxo-4-hexulose reductase and related proteins, extended (e) SDRs. dTDP-6-deoxy-L-lyxo-4-hexulose reductase, an extended SDR, synthesizes dTDP-L-rhamnose from alpha-D-glucose-1-phosphate, providing the precursor of L-rhamnose, an essential cell wall component of many pathogenic bacteria. This subgroup has the characteristic active site tetrad and NADP-binding motif. This subgroup also contains human MAT2B, the regulatory subunit of methionine adenosyltransferase (MAT); MAT catalyzes S-adenosylmethionine synthesis. The human gene encoding MAT2B encodes two major splicing variants which are induced in human cell liver cancer and regulate HuR, an mRNA-binding protein which stabilizes the mRNA of several cyclins, to affect cell proliferation. Both MAT2B variants include this extended SDR domain. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.29392e-17
NC_017299.1\|WP_014521021.1\|2301535_2302303_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224059	COG1136, SalX, ABC-type antimicrobial peptide transport system, ATPase component [Defense mechanisms].	2.77881e-103
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	gnl\|CDD\|236545	PRK09510, tolA, cell envelope integrity inner membrane protein TolA; Provisional.	1.09003e-10
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|214874	smart00871, AraC_E_bind, Bacterial transcription activator, effector binding domain. This domain is found in the probable effector binding domain of a number of different bacterial transcription activators.and is also present in some DNA gyrase inhibitors. The absence of a HTH motif in the DNA gyrase inhibitors is thought to indicate the fact that these do not bind DNA.	1.18623e-26
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|213662	TIGR01898, repair_system, CRISPR type III-B/RAMP module RAMP protein Cmr6. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This family, represented by TM1791 of Thermotoga maritima, is designated Cmr6 [sic], for CRISPR/Cas Ramp Module protein 6. This family is both closely related to and frequently encoded next to the TM1792 family of Cas proteins described by TIGR01867. The two proteins are fused in an example from Methanopyrus kandleri.	4.38545e-34
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	3.96471e-12
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	gnl\|CDD\|183481	PRK12376, PRK12376, putative translaldolase; Provisional.	1.30653e-155
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	gnl\|CDD\|238129	cd00211, PTS_IIA_fru, PTS_IIA, PTS system, fructose/mannitol specific IIA subunit. The bacterial phosphoenolpyruvate: sugar phosphotransferase system (PTS) is a multi-protein system involved in the regulation of a variety of metabolic and transcriptional processes. This family is one of four structurally and functionally distinct group IIA PTS system cytoplasmic enzymes, necessary for the uptake of carbohydrates across the cytoplasmic membrane and their phosphorylation.	4.79769e-38
NC_017299.1\|WP_014521022.1\|2303768_2305862_-\|transcription-antiterminator	gnl\|CDD\|226234	COG3711, BglG, Transcriptional antiterminator [Transcription].	1.54549e-57
NC_017299.1\|WP_014521018.1\|2297849_2298989_-\|DOIS-domain-containing-protein	gnl\|CDD\|341476	cd08197, DOIS, 2-deoxy-scyllo-inosose synthase (DOIS) catalyzes carbocycle formation from D-glucose-6-phosphate to 2-deoxy-scyllo-inosose. 2-deoxy-scyllo-inosose synthase (DOIS) catalyzes carbocycle formation from D-glucose-6-phosphate to 2-deoxy-scyllo-inosose through a multistep reaction in the biosynthesis of aminoglycoside antibiotics. 2-deoxystreptamine (DOS)-containing aminoglycoside antibiotics includes neomycin, kanamycin, gentamicin, and ribostamycin. They are important antibacterial agents. DOIS is a homolog of the dehydroquinate synthase which catalyzes the cyclization of 3-deoxy-D-arabino-heputulosonate-7-phosphate to dehydroquinate (DHQ) in the shikimate pathway.	2.68903e-154
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	5.14673e-15
NC_017299.1\|WP_003358205.1\|2303089_2303443_-\|zinc-ribbon-domain-containing-protein	gnl\|CDD\|379915	pfam17032, zinc_ribbon_15, zinc-ribbon family. This zinc-ribbon region is found on a set of largely microsporidia-specific proteins.	0.000168002
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	gnl\|CDD\|99905	cd05563, PTS_IIB_ascorbate, PTS_IIB_ascorbate: subunit IIB of enzyme II (EII) of the L-ascorbate-specific phosphoenolpyruvate:carbohydrate phosphotransferase system (PTS). In this system, EII is an L-ascorbate-specific permease with two cytoplasmic subunits (IIA and IIB) and a transmembrane channel IIC subunit. Subunits IIA, IIB, and IIC are encoded by the sgaA, sgaB, and sgaT genes of the E. coli sgaTBA operon. In some bacteria, the IIB (SgaB) domain is fused C-terminal to the IIA (SgaT) domain. The IIB domain fold includes a central four-stranded parallel open twisted beta-sheet flanked by alpha-helices on both sides. The seven major PTS systems with this IIB fold include ascorbate, chitobiose/lichenan, lactose, galactitol, mannitol, fructose, and a sensory system with similarity to the bacterial bgl system.	2.52704e-28

>NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase
MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP
>NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase
MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL
>NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA
MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK
>NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB
MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK
>NC_017299.1|WP_003358211.1|2306073_2307438_-|PTS-ascorbate-transporter-subunit-IIC
MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE
>NC_017299.1|WP_014521022.1|2303768_2305862_-|transcription-antiterminator
MLNKRCSNILQIIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFATINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKVLKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNSSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTPTEDHKPSLKELLKPDFIKLNEEAKDWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISNVKNIKASSEIDSILYS
>NC_017299.1|WP_003358205.1|2303089_2303443_-|zinc-ribbon-domain-containing-protein
MIIWGWGKVTKKIIGAVFERTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK
>NC_017299.1|WP_014521021.1|2301535_2302303_-|ABC-transporter-ATP-binding-protein
MQNILSVEKIEKYYGNKDNVTKAIDNISFKVDEGEFVGIMGPSGSGKTTLLNCISTIDNVTTGKIMINNNDITRLKSKLLDKFRQNELGFIFQDFNLLDTLTAYENIALALTIQGEKTSKIDGKVKSVAKYLEIEKVLEKYPYQMSGGQKQRVASARAIVTNPSLILADEPTGALDSKSARLLLERFEKLNKELKATILMVTHDAFAASYAHRILFIKDGKIFNELVRGNDTRKEFFNKIIEVTSLLGGDDNNVF
>NC_017299.1|WP_014521019.1|2299554_2301546_-|ABC-transporter-permease
MYSKIALKNIKKSYKDYTIYFLTLILAVCIFYSFNSIDSQKALTDIKSSGGSYVSRLMEFMSAISVFVSIILGSLILYANNFLIKKRKKELGMYMILGMGKRKISKILVTETSIVGVISLIAGLIIGIGVSQGLSVFALKLFEVSINEYRFAVSTRAIGKTILYFGIMFLLVMIFNVFVISKYKIIDLLTSGRKNENIKFKNTFIYLLSFLLCAALLGFAYKSILKIGLKLREPMFKPSIAFVIVGTVLFFFSLAGVILYVVNKNKKIYFKGLNMFVVKQINSKVNTNFLSMSLICLMLFITILILSTGISFKNGFEEGVKIRAPFDASIIISNNSKKNNLEDVLDKINFKRSKDEKYATFNEYFSGVKLESLLSITDKNYKDGEVSFVKISDYNKILKLKGKKEINLNKDEILVMSTNNAVVKQANEKLKNSKKFNIKGKEYLVKNDTIIEENLATYLLADNVFTIVISDEFLYDYNKIVYSILNVMYSDKNREQNNKKYSEINKNYLDGKYKSLNISYMGAFSKDDIYSGSKGGTTSILFVGIYLGLVFLITSMAVLALQQLSEASDSIERYKVLKRIGANSKMIEKTIFLQTLIYFALPMILALIHSVIGIKVISDYIEVFTKIDISFSALITALIFSVVYAGYFYTTYIGYKNIVESNI
>NC_017299.1|WP_014521018.1|2297849_2298989_-|DOIS-domain-containing-protein
MYMNLAQKINDDYYHPEVKLETNLLESSPIYLGCNIWRESLLEKMMDLNTDKFFLITDDVVYNLFGKELLEYMNRKVSVKLIKLPSGEKHKNIKVFNDLMEDLFDNNVTKSSILISLGGGVVGNITGLAAALAFRGIRFFHIPTTFMSQTDSILSRKQGINSFYGKNMIGSYYTPLFNFIDTSFLTFDSERFIRGSFVETVKNGFIYNADFLNKLKSVIKNDFNVNQEGIFNLVKMSIESKLPIMKADPTEKGLAMILEYGHTVGHAIEKLSYGKLSHGESVSIGMMVAARVSEKLGYLSKQDVKEHLDILSALKTPTKIPSNIKISDIINRIKLDNKKDMNGIRFVVLENIGKCINTDGSYMIKVPFNIINEAIEETC
>NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase
MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP
>NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein
MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ
>NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase
MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI
>NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator
MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein
MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN
>NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK
>NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_4

2312860-2313087

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAT	CRISPRCasFinder

3 spacers

cmr6gr7,cmr5gr11,cmr4gr7

The CRISPR arrays of NC_017299_4

>merge|NC_017299|4|2312860-2313087|CRISPRCasFinder
AATTAAATGCATCCTATGTTAATGTTCAACTTTATATGAAAGGAATAGATATAAGTATGCATAAATTTAAATACATCTTATGTTACTGTTCAACCTAGAACTGATTTTGACAAATATGTAGACCATGCTATATTTAAATACATCTCATGTTAATGTTCAATACAGAAGAAGAGCTTGAAAATGCTACTGGTAAGTTCAATTTAAATACATCTCATGTTAATGTTCAAT

>NC_017299|4|4|2312860-2313087|CRISPRCasFinder
AATTAAATGCATCCTATGTTAATGTTCAAC	TTTATATGAAAGGAATAGATATAAGTATGCATAA
ATTTAAATACATCTTATGTTACTGTTCAAC	CTAGAACTGATTTTGACAAATATGTAGACCATGCTAT
ATTTAAATACATCTCATGTTAATGTTCAAT	ACAGAAGAAGAGCTTGAAAATGCTACTGGTAAGTTCA
ATTTAAATACATCTCATGTTAATGTTCAAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	unknown	unknown	gnl\|CDD\|238129
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	cmr5gr11	pfam09701_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_017299.1\|WP_003358205.1\|2303089_2303443_-\|zinc-ribbon-domain-containing-protein	unknown	unknown	gnl\|CDD\|379915
NC_017299.1\|WP_003358211.1\|2306073_2307438_-\|PTS-ascorbate-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|236502
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|379112
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	COG1336_cmr4gr7_CAS-III-C	gnl\|CDD\|224255
NC_017299.1\|WP_014521021.1\|2301535_2302303_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224059
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	unknown	unknown	gnl\|CDD\|236545
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|214874
NC_017299.1\|WP_041926685.1\|2323789_2324098_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|213662
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	unknown	unknown	gnl\|CDD\|183481
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187564
NC_017299.1\|WP_014521022.1\|2303768_2305862_-\|transcription-antiterminator	unknown	unknown	gnl\|CDD\|226234
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	unknown	unknown	gnl\|CDD\|99905

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	8.44942e-25
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	gnl\|CDD\|238129	cd00211, PTS_IIA_fru, PTS_IIA, PTS system, fructose/mannitol specific IIA subunit. The bacterial phosphoenolpyruvate: sugar phosphotransferase system (PTS) is a multi-protein system involved in the regulation of a variety of metabolic and transcriptional processes. This family is one of four structurally and functionally distinct group IIA PTS system cytoplasmic enzymes, necessary for the uptake of carbohydrates across the cytoplasmic membrane and their phosphorylation.	4.79769e-38
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	1.60766e-29
NC_017299.1\|WP_003358205.1\|2303089_2303443_-\|zinc-ribbon-domain-containing-protein	gnl\|CDD\|379915	pfam17032, zinc_ribbon_15, zinc-ribbon family. This zinc-ribbon region is found on a set of largely microsporidia-specific proteins.	0.000168002
NC_017299.1\|WP_003358211.1\|2306073_2307438_-\|PTS-ascorbate-transporter-subunit-IIC	gnl\|CDD\|236502	PRK09410, ulaA, PTS system ascorbate-specific transporter subunit IIC; Reviewed.	0
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|379112	pfam13302, Acetyltransf_3, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	3.84974e-18
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|224255	COG1336, COG1336, CRISPR system related protein, RAMP superfamily [Defense mechanisms].	1.44816e-62
NC_017299.1\|WP_014521021.1\|2301535_2302303_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224059	COG1136, SalX, ABC-type antimicrobial peptide transport system, ATPase component [Defense mechanisms].	2.77881e-103
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	gnl\|CDD\|236545	PRK09510, tolA, cell envelope integrity inner membrane protein TolA; Provisional.	1.09003e-10
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|214874	smart00871, AraC_E_bind, Bacterial transcription activator, effector binding domain. This domain is found in the probable effector binding domain of a number of different bacterial transcription activators.and is also present in some DNA gyrase inhibitors. The absence of a HTH motif in the DNA gyrase inhibitors is thought to indicate the fact that these do not bind DNA.	1.18623e-26
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|213662	TIGR01898, repair_system, CRISPR type III-B/RAMP module RAMP protein Cmr6. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This family, represented by TM1791 of Thermotoga maritima, is designated Cmr6 [sic], for CRISPR/Cas Ramp Module protein 6. This family is both closely related to and frequently encoded next to the TM1792 family of Cas proteins described by TIGR01867. The two proteins are fused in an example from Methanopyrus kandleri.	4.38545e-34
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	3.96471e-12
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	gnl\|CDD\|183481	PRK12376, PRK12376, putative translaldolase; Provisional.	1.30653e-155
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187564	cd05254, dTDP_HR_like_SDR_e, dTDP-6-deoxy-L-lyxo-4-hexulose reductase and related proteins, extended (e) SDRs. dTDP-6-deoxy-L-lyxo-4-hexulose reductase, an extended SDR, synthesizes dTDP-L-rhamnose from alpha-D-glucose-1-phosphate, providing the precursor of L-rhamnose, an essential cell wall component of many pathogenic bacteria. This subgroup has the characteristic active site tetrad and NADP-binding motif. This subgroup also contains human MAT2B, the regulatory subunit of methionine adenosyltransferase (MAT); MAT catalyzes S-adenosylmethionine synthesis. The human gene encoding MAT2B encodes two major splicing variants which are induced in human cell liver cancer and regulate HuR, an mRNA-binding protein which stabilizes the mRNA of several cyclins, to affect cell proliferation. Both MAT2B variants include this extended SDR domain. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.29392e-17
NC_017299.1\|WP_014521022.1\|2303768_2305862_-\|transcription-antiterminator	gnl\|CDD\|226234	COG3711, BglG, Transcriptional antiterminator [Transcription].	1.54549e-57
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	5.14673e-15
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	9.02096e-120
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	gnl\|CDD\|99905	cd05563, PTS_IIB_ascorbate, PTS_IIB_ascorbate: subunit IIB of enzyme II (EII) of the L-ascorbate-specific phosphoenolpyruvate:carbohydrate phosphotransferase system (PTS). In this system, EII is an L-ascorbate-specific permease with two cytoplasmic subunits (IIA and IIB) and a transmembrane channel IIC subunit. Subunits IIA, IIB, and IIC are encoded by the sgaA, sgaB, and sgaT genes of the E. coli sgaTBA operon. In some bacteria, the IIB (SgaB) domain is fused C-terminal to the IIA (SgaT) domain. The IIB domain fold includes a central four-stranded parallel open twisted beta-sheet flanked by alpha-helices on both sides. The seven major PTS systems with this IIB fold include ascorbate, chitobiose/lichenan, lactose, galactitol, mannitol, fructose, and a sensory system with similarity to the bacterial bgl system.	2.52704e-28

>NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein
MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ
>NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase
MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP
>NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase
MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP
>NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase
MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL
>NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA
MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK
>NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB
MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK
>NC_017299.1|WP_003358211.1|2306073_2307438_-|PTS-ascorbate-transporter-subunit-IIC
MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE
>NC_017299.1|WP_014521022.1|2303768_2305862_-|transcription-antiterminator
MLNKRCSNILQIIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFATINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKVLKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNSSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTPTEDHKPSLKELLKPDFIKLNEEAKDWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISNVKNIKASSEIDSILYS
>NC_017299.1|WP_003358205.1|2303089_2303443_-|zinc-ribbon-domain-containing-protein
MIIWGWGKVTKKIIGAVFERTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK
>NC_017299.1|WP_014521021.1|2301535_2302303_-|ABC-transporter-ATP-binding-protein
MQNILSVEKIEKYYGNKDNVTKAIDNISFKVDEGEFVGIMGPSGSGKTTLLNCISTIDNVTTGKIMINNNDITRLKSKLLDKFRQNELGFIFQDFNLLDTLTAYENIALALTIQGEKTSKIDGKVKSVAKYLEIEKVLEKYPYQMSGGQKQRVASARAIVTNPSLILADEPTGALDSKSARLLLERFEKLNKELKATILMVTHDAFAASYAHRILFIKDGKIFNELVRGNDTRKEFFNKIIEVTSLLGGDDNNVF
>NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase
MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI
>NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator
MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein
MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN
>NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK
>NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP
>NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5
MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD
>NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_6

2319824-2320039

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCCTATGTTACTGTTCAA	CRISPRCasFinder
ATTTAAATACATCCTATGTTAATGTTCAA	PILER-CR

3 spacers

cmr6gr7,cmr5gr11,cmr4gr7,csx1,cmr3gr5,cas10,cmr1gr7

The CRISPR arrays of NC_017299_6

>merge|NC_017299|6|2319824-2320039|CRISPRCasFinder,PILER-CR
GCTTAAATACATCTCATGTTAATGTTCAATAACTATAATGGGAGAATAACAGCAGAGCAGGCTTCATTTAAATACATCTTATGTTACTTTATTTTATTTTCTATTCTTAACTCTTTATCTTCATTTAAATACATCCTATGTTACTGTTCAACAGGATATTCAATAGAAGCAGGTAAGGGAGATAATGATTTAAATACATCCTATGTTAATGTTCAA

>NC_017299|6|6|2319824-2320039|CRISPRCasFinder
GCTTAAATACATCTCATGTTAATGTTCAA	TAACTATAATGGGAGAATAACAGCAGAGCAGGCTTC
ATTTAAATACATCTTATGTTACTTTATTT	TATTTTCTATTCTTAACTCTTTATCTTC
ATTTAAATACATCCTATGTTACTGTTCAA	CAGGATATTCAATAGAAGCAGGTAAGGGAGATAATG
ATTTAAATACATCCTATGTTAATGTTCAA

>NC_017299|6|2|2319826-2320039|PILER-CR
TTAAATACATCTCATGTTAATGTTCAATA	ACTATAATGGGAGAATAACAGCAGAGCAGGCTTCAT
TTAAATACATCTTATGTTACTTTATTTTA	TTTTCTATTCTTAACTCTTTATCTTCATTTAAATAC
ATCCTATGTTACTGTTCAACAGGATATTC	AATAGAAGCAGGTAAGGGAGATAATGATTTAAATAC
ATCCTATGTTAATGTTCAA

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|213662
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	cmr5gr11	pfam09701_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	cd09748_cmr3gr5_CAS-III-B	gnl\|CDD\|187879
NC_017299.1\|WP_014521043.1\|2326794_2328144_-\|hypothetical-protein	csx1	mkCas0085_csx1_CAS-III	unknown
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	unknown	unknown	gnl\|CDD\|238129
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|379112
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	unknown	unknown	gnl\|CDD\|99905
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|214874
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	unknown	unknown	gnl\|CDD\|236545
NC_017299.1\|WP_041926685.1\|2323789_2324098_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	COG1336_cmr4gr7_CAS-III-C	gnl\|CDD\|224255
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	unknown	unknown	gnl\|CDD\|183481
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187564
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	cmr1gr7	COG1367_cmr1gr7_CAS-III-B	gnl\|CDD\|273859
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	8.44942e-25
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|213662	TIGR01898, repair_system, CRISPR type III-B/RAMP module RAMP protein Cmr6. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This family, represented by TM1791 of Thermotoga maritima, is designated Cmr6 [sic], for CRISPR/Cas Ramp Module protein 6. This family is both closely related to and frequently encoded next to the TM1792 family of Cas proteins described by TIGR01867. The two proteins are fused in an example from Methanopyrus kandleri.	4.38545e-34
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	1.60766e-29
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|187879	cd09748, Cmr3_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	4.05127e-103
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	gnl\|CDD\|273859	TIGR01894, hypothetical_protein, CRISPR type III-B/RAMP module RAMP protein Cmr1. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model represents the region of stongest conservation, the N-terminal half, of one such family, represented by TM1795 from Thermotoga maritima. This protein is the first of a set of six genes, mostly from the RAMP superfamily, that we designated the CRISPR-associated RAMP module.	4.41756e-16
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	gnl\|CDD\|238129	cd00211, PTS_IIA_fru, PTS_IIA, PTS system, fructose/mannitol specific IIA subunit. The bacterial phosphoenolpyruvate: sugar phosphotransferase system (PTS) is a multi-protein system involved in the regulation of a variety of metabolic and transcriptional processes. This family is one of four structurally and functionally distinct group IIA PTS system cytoplasmic enzymes, necessary for the uptake of carbohydrates across the cytoplasmic membrane and their phosphorylation.	4.79769e-38
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|379112	pfam13302, Acetyltransf_3, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	3.84974e-18
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	gnl\|CDD\|99905	cd05563, PTS_IIB_ascorbate, PTS_IIB_ascorbate: subunit IIB of enzyme II (EII) of the L-ascorbate-specific phosphoenolpyruvate:carbohydrate phosphotransferase system (PTS). In this system, EII is an L-ascorbate-specific permease with two cytoplasmic subunits (IIA and IIB) and a transmembrane channel IIC subunit. Subunits IIA, IIB, and IIC are encoded by the sgaA, sgaB, and sgaT genes of the E. coli sgaTBA operon. In some bacteria, the IIB (SgaB) domain is fused C-terminal to the IIA (SgaT) domain. The IIB domain fold includes a central four-stranded parallel open twisted beta-sheet flanked by alpha-helices on both sides. The seven major PTS systems with this IIB fold include ascorbate, chitobiose/lichenan, lactose, galactitol, mannitol, fructose, and a sensory system with similarity to the bacterial bgl system.	2.52704e-28
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|214874	smart00871, AraC_E_bind, Bacterial transcription activator, effector binding domain. This domain is found in the probable effector binding domain of a number of different bacterial transcription activators.and is also present in some DNA gyrase inhibitors. The absence of a HTH motif in the DNA gyrase inhibitors is thought to indicate the fact that these do not bind DNA.	1.18623e-26
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	gnl\|CDD\|236545	PRK09510, tolA, cell envelope integrity inner membrane protein TolA; Provisional.	1.09003e-10
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|224255	COG1336, COG1336, CRISPR system related protein, RAMP superfamily [Defense mechanisms].	1.44816e-62
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	3.96471e-12
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	gnl\|CDD\|183481	PRK12376, PRK12376, putative translaldolase; Provisional.	1.30653e-155
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187564	cd05254, dTDP_HR_like_SDR_e, dTDP-6-deoxy-L-lyxo-4-hexulose reductase and related proteins, extended (e) SDRs. dTDP-6-deoxy-L-lyxo-4-hexulose reductase, an extended SDR, synthesizes dTDP-L-rhamnose from alpha-D-glucose-1-phosphate, providing the precursor of L-rhamnose, an essential cell wall component of many pathogenic bacteria. This subgroup has the characteristic active site tetrad and NADP-binding motif. This subgroup also contains human MAT2B, the regulatory subunit of methionine adenosyltransferase (MAT); MAT catalyzes S-adenosylmethionine synthesis. The human gene encoding MAT2B encodes two major splicing variants which are induced in human cell liver cancer and regulate HuR, an mRNA-binding protein which stabilizes the mRNA of several cyclins, to affect cell proliferation. Both MAT2B variants include this extended SDR domain. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.29392e-17
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	4.55908e-24
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	5.14673e-15
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	9.02096e-120
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0

>NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein
MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN
>NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator
MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase
MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI
>NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein
MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ
>NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase
MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP
>NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase
MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP
>NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase
MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL
>NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA
MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK
>NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB
MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK
>NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK
>NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP
>NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5
MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD
>NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE
>NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein
MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG
>NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3
MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE
>NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN
>NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1
MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_5

2319326-2319553

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCCTATGTTACTGTTCAA	CRISPRCasFinder

3 spacers

cmr6gr7,cmr5gr11,cmr4gr7,csx1,cmr3gr5,cas10,cmr1gr7

The CRISPR arrays of NC_017299_5

>merge|NC_017299|5|2319326-2319553|CRISPRCasFinder
GCTTAAGTACATCTCATGTTATTGTTCAACTTGAGGGACTTAAAGACAAGCTTAGGGTAAAAATAAGATTTAAATACATCCTATGTTACTGTTCAACACTGATATGAGTGTACTTTTTATGAGTACAGTATTATTTAAATACATCTTATGTTACTGTTCAACTAAAGGTAAGATTAATATAAAAATTAATTCGTAATTATTTAAATACATCCTATGTTACTGTTCAAC

>NC_017299|5|5|2319326-2319553|CRISPRCasFinder
GCTTAAGTACATCTCATGTTATTGTTCAA	CTTGAGGGACTTAAAGACAAGCTTAGGGTAAAAATAAG
ATTTAAATACATCCTATGTTACTGTTCAA	CACTGATATGAGTGTACTTTTTATGAGTACAGTATT
ATTTAAATACATCTTATGTTACTGTTCAA	CTAAAGGTAAGATTAATATAAAAATTAATTCGTAATT
ATTTAAATACATCCTATGTTACTGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|213662
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	cmr5gr11	pfam09701_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	cd09748_cmr3gr5_CAS-III-B	gnl\|CDD\|187879
NC_017299.1\|WP_014521043.1\|2326794_2328144_-\|hypothetical-protein	csx1	mkCas0085_csx1_CAS-III	unknown
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	unknown	unknown	gnl\|CDD\|238129
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|379112
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	unknown	unknown	gnl\|CDD\|99905
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|214874
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	unknown	unknown	gnl\|CDD\|236545
NC_017299.1\|WP_041926685.1\|2323789_2324098_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	COG1336_cmr4gr7_CAS-III-C	gnl\|CDD\|224255
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	unknown	unknown	gnl\|CDD\|183481
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187564
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	cmr1gr7	COG1367_cmr1gr7_CAS-III-B	gnl\|CDD\|273859
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_014521034.1\|2318583_2319105_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	8.44942e-25
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|213662	TIGR01898, repair_system, CRISPR type III-B/RAMP module RAMP protein Cmr6. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This family, represented by TM1791 of Thermotoga maritima, is designated Cmr6 [sic], for CRISPR/Cas Ramp Module protein 6. This family is both closely related to and frequently encoded next to the TM1792 family of Cas proteins described by TIGR01867. The two proteins are fused in an example from Methanopyrus kandleri.	4.38545e-34
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	1.60766e-29
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|187879	cd09748, Cmr3_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	4.05127e-103
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	gnl\|CDD\|273859	TIGR01894, hypothetical_protein, CRISPR type III-B/RAMP module RAMP protein Cmr1. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model represents the region of stongest conservation, the N-terminal half, of one such family, represented by TM1795 from Thermotoga maritima. This protein is the first of a set of six genes, mostly from the RAMP superfamily, that we designated the CRISPR-associated RAMP module.	4.41756e-16
NC_017299.1\|WP_003485280.1\|2307763_2308201_-\|PTS-sugar-transporter-subunit-IIA	gnl\|CDD\|238129	cd00211, PTS_IIA_fru, PTS_IIA, PTS system, fructose/mannitol specific IIA subunit. The bacterial phosphoenolpyruvate: sugar phosphotransferase system (PTS) is a multi-protein system involved in the regulation of a variety of metabolic and transcriptional processes. This family is one of four structurally and functionally distinct group IIA PTS system cytoplasmic enzymes, necessary for the uptake of carbohydrates across the cytoplasmic membrane and their phosphorylation.	4.79769e-38
NC_017299.1\|WP_014521025.1\|2311158_2311704_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|379112	pfam13302, Acetyltransf_3, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	3.84974e-18
NC_017299.1\|WP_003361919.1\|2307450_2307735_-\|PTS-sugar-transporter-subunit-IIB	gnl\|CDD\|99905	cd05563, PTS_IIB_ascorbate, PTS_IIB_ascorbate: subunit IIB of enzyme II (EII) of the L-ascorbate-specific phosphoenolpyruvate:carbohydrate phosphotransferase system (PTS). In this system, EII is an L-ascorbate-specific permease with two cytoplasmic subunits (IIA and IIB) and a transmembrane channel IIC subunit. Subunits IIA, IIB, and IIC are encoded by the sgaA, sgaB, and sgaT genes of the E. coli sgaTBA operon. In some bacteria, the IIB (SgaB) domain is fused C-terminal to the IIA (SgaT) domain. The IIB domain fold includes a central four-stranded parallel open twisted beta-sheet flanked by alpha-helices on both sides. The seven major PTS systems with this IIB fold include ascorbate, chitobiose/lichenan, lactose, galactitol, mannitol, fructose, and a sensory system with similarity to the bacterial bgl system.	2.52704e-28
NC_017299.1\|WP_014521033.1\|2317392_2318283_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|214874	smart00871, AraC_E_bind, Bacterial transcription activator, effector binding domain. This domain is found in the probable effector binding domain of a number of different bacterial transcription activators.and is also present in some DNA gyrase inhibitors. The absence of a HTH motif in the DNA gyrase inhibitors is thought to indicate the fact that these do not bind DNA.	1.18623e-26
NC_017299.1\|WP_014521024.1\|2309210_2309945_-\|multimodular-transpeptidase-transglycosylase	gnl\|CDD\|236545	PRK09510, tolA, cell envelope integrity inner membrane protein TolA; Provisional.	1.09003e-10
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|224255	COG1336, COG1336, CRISPR system related protein, RAMP superfamily [Defense mechanisms].	1.44816e-62
NC_017299.1\|WP_014521032.1\|2316645_2317386_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	3.96471e-12
NC_017299.1\|WP_014521023.1\|2308224_2308941_-\|transaldolase	gnl\|CDD\|183481	PRK12376, PRK12376, putative translaldolase; Provisional.	1.30653e-155
NC_017299.1\|WP_014521026.1\|2312025_2312826_-\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187564	cd05254, dTDP_HR_like_SDR_e, dTDP-6-deoxy-L-lyxo-4-hexulose reductase and related proteins, extended (e) SDRs. dTDP-6-deoxy-L-lyxo-4-hexulose reductase, an extended SDR, synthesizes dTDP-L-rhamnose from alpha-D-glucose-1-phosphate, providing the precursor of L-rhamnose, an essential cell wall component of many pathogenic bacteria. This subgroup has the characteristic active site tetrad and NADP-binding motif. This subgroup also contains human MAT2B, the regulatory subunit of methionine adenosyltransferase (MAT); MAT catalyzes S-adenosylmethionine synthesis. The human gene encoding MAT2B encodes two major splicing variants which are induced in human cell liver cancer and regulate HuR, an mRNA-binding protein which stabilizes the mRNA of several cyclins, to affect cell proliferation. Both MAT2B variants include this extended SDR domain. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.29392e-17
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	4.55908e-24
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	5.14673e-15
NC_017299.1\|WP_014521031.1\|2315136_2316543_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	9.02096e-120
NC_017299.1\|WP_014521035.1\|2320335_2322333_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0

>NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein
MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN
>NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator
MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase
MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI
>NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein
MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ
>NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase
MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP
>NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase
MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP
>NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase
MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL
>NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA
MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK
>NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB
MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK
>NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK
>NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP
>NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5
MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD
>NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE
>NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein
MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG
>NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3
MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE
>NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN
>NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1
MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_7

2333111-2333668

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTTATGTTAATGTTCAAC	CRT
ATTTAAATACATCTTATGTTAATGTTCAAC	PILER-CR
ATTTAAATACATCTTATGTTAATGTTCAAC	CRISPRCasFinder

8 spacers

cas6,cmr1gr7,cas10,cmr3gr5,csx1,cmr4gr7,cmr5gr11,cmr6gr7

The CRISPR arrays of NC_017299_7

>merge|NC_017299|7|2333111-2333668|CRT,PILER-CR,CRISPRCasFinder
TTTTTAATATATTATGTTATTGTGTTCAACAACAGTTTGATATCATTCCCCTTATGGCACGTGCAAATTTAAATACATCTTATGTTAATGTTCAACTAATGTACTGATTTTCAGTAGGTGGGTCCATGTACATTTAAATACATCTCATGTTAATGTTCAACATTTATAGAAGATGGTACATATACAATTATTTATTGATTTAAATACATCTCATGTTAATGTTCAACTTTCACTTGATTTAGATAATGGAAAGCTATTACCTTTATTTAAATACATCTTACGTTAATGTTCAATTGAAATGATAAGTAAAACACTTTCTTATTACTATAAATTTAAATACATCTTATGTTAATGTTCAACGATATAGTAATTTATATCCTGGTACAATAAATGAATATTTAAATACATCTTATGTTAATGTTCAACTGATGGCTATATAATAAATATAGTTTCGGAAGTCAAATTTAAATACATCTTATGTTAATGTTCAACTATATTAATATTACAAAAGAAGTTAGAAAATCATACATTTAAATACATCTTATGTTAATGTTCAAC

>NC_017299|7|1|2333111-2333668|CRT
TTTTTAATATATTATGTTATTGTGTTCAAC	AACAGTTTGATATCATTCCCCTTATGGCACGTGCAA
ATTTAAATACATCTTATGTTAATGTTCAAC	TAATGTACTGATTTTCAGTAGGTGGGTCCATGTAC
ATTTAAATACATCTCATGTTAATGTTCAAC	ATTTATAGAAGATGGTACATATACAATTATTTATTG
ATTTAAATACATCTCATGTTAATGTTCAAC	TTTCACTTGATTTAGATAATGGAAAGCTATTACCTTT
ATTTAAATACATCTTACGTTAATGTTCAAT	TGAAATGATAAGTAAAACACTTTCTTATTACTATAA
ATTTAAATACATCTTATGTTAATGTTCAAC	GATATAGTAATTTATATCCTGGTACAATAAATGAAT
ATTTAAATACATCTTATGTTAATGTTCAAC	TGATGGCTATATAATAAATATAGTTTCGGAAGTCAA
ATTTAAATACATCTTATGTTAATGTTCAAC	TATATTAATATTACAAAAGAAGTTAGAAAATCATAC
ATTTAAATACATCTTATGTTAATGTTCAAC

>NC_017299|7|3|2333177-2333668|PILER-CR
ATTTAAATACATCTTATGTTAATGTTCAAC	TAATGTACTGATTTTCAGTAGGTGGGTCCATGTAC
ATTTAAATACATCTCATGTTAATGTTCAAC	ATTTATAGAAGATGGTACATATACAATTATTTATTG
ATTTAAATACATCTCATGTTAATGTTCAAC	TTTCACTTGATTTAGATAATGGAAAGCTATTACCTTT
ATTTAAATACATCTTACGTTAATGTTCAAT	TGAAATGATAAGTAAAACACTTTCTTATTACTATAA
ATTTAAATACATCTTATGTTAATGTTCAAC	GATATAGTAATTTATATCCTGGTACAATAAATGAAT
ATTTAAATACATCTTATGTTAATGTTCAAC	TGATGGCTATATAATAAATATAGTTTCGGAAGTCAA
ATTTAAATACATCTTATGTTAATGTTCAAC	TATATTAATATTACAAAAGAAGTTAGAAAATCATAC
ATTTAAATACATCTTATGTTAATGTTCAAC

>NC_017299|7|7|2333177-2333668|CRISPRCasFinder
ATTTAAATACATCTTATGTTAATGTTCAAC	TAATGTACTGATTTTCAGTAGGTGGGTCCATGTAC
ATTTAAATACATCTCATGTTAATGTTCAAC	ATTTATAGAAGATGGTACATATACAATTATTTATTG
ATTTAAATACATCTCATGTTAATGTTCAAC	TTTCACTTGATTTAGATAATGGAAAGCTATTACCTTT
ATTTAAATACATCTTACGTTAATGTTCAAT	TGAAATGATAAGTAAAACACTTTCTTATTACTATAA
ATTTAAATACATCTTATGTTAATGTTCAAC	GATATAGTAATTTATATCCTGGTACAATAAATGAAT
ATTTAAATACATCTTATGTTAATGTTCAAC	TGATGGCTATATAATAAATATAGTTTCGGAAGTCAA
ATTTAAATACATCTTATGTTAATGTTCAAC	TATATTAATATTACAAAAGAAGTTAGAAAATCATAC
ATTTAAATACATCTTATGTTAATGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_014521054.1\|2342031_2342538_-\|MarR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|197670
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|213662
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	cmr5gr11	pfam09701_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	cd09748_cmr3gr5_CAS-III-B	gnl\|CDD\|187879
NC_017299.1\|WP_014521058.1\|2345237_2346137_+\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521049.1\|2336437_2337286_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_017299.1\|WP_014521055.1\|2343094_2343541_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|378897
NC_017299.1\|WP_014521052.1\|2340710_2341076_-\|VOC-family-protein	unknown	unknown	gnl\|CDD\|366361
NC_017299.1\|WP_014521048.1\|2333879_2335466_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_017299.1\|WP_041926685.1\|2323789_2324098_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	COG1336_cmr4gr7_CAS-III-C	gnl\|CDD\|224255
NC_017299.1\|WP_014521051.1\|2338821_2340315_+\|PLP-dependent-aminotransferase-family-protein	unknown	unknown	gnl\|CDD\|224089
NC_017299.1\|WP_033065806.1\|2343772_2344804_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|369561
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_017299.1\|WP_014521053.1\|2341148_2342009_-\|NmrA-family-NAD(P)-binding-protein	unknown	unknown	gnl\|CDD\|187561
NC_017299.1\|WP_014521047.1\|2332211_2332901_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_017299.1\|WP_014521043.1\|2326794_2328144_-\|hypothetical-protein	csx1	mkCas0085_csx1_CAS-III	unknown
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	cmr1gr7	COG1367_cmr1gr7_CAS-III-B	gnl\|CDD\|273859
NC_017299.1\|WP_014521050.1\|2337576_2338497_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_014521054.1\|2342031_2342538_-\|MarR-family-transcriptional-regulator	gnl\|CDD\|197670	smart00347, HTH_MARR, helix_turn_helix multiple antibiotic resistance protein.	5.9924e-18
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|213662	TIGR01898, repair_system, CRISPR type III-B/RAMP module RAMP protein Cmr6. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This family, represented by TM1791 of Thermotoga maritima, is designated Cmr6 [sic], for CRISPR/Cas Ramp Module protein 6. This family is both closely related to and frequently encoded next to the TM1792 family of Cas proteins described by TIGR01867. The two proteins are fused in an example from Methanopyrus kandleri.	4.38545e-34
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	1.60766e-29
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|187879	cd09748, Cmr3_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	4.05127e-103
NC_017299.1\|WP_014521049.1\|2336437_2337286_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	1.43602e-61
NC_017299.1\|WP_014521055.1\|2343094_2343541_+\|hypothetical-protein	gnl\|CDD\|378897	pfam12638, Staygreen, Staygreen protein. This family of proteins have been implicated in chlorophyll degradation. Intriguingly members of this family are also found in non-photosynthetic bacteria.	9.76376e-77
NC_017299.1\|WP_014521052.1\|2340710_2341076_-\|VOC-family-protein	gnl\|CDD\|366361	pfam00903, Glyoxalase, Glyoxalase/Bleomycin resistance protein/Dioxygenase superfamily.	3.34662e-15
NC_017299.1\|WP_014521048.1\|2333879_2335466_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	6.98155e-06
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|224255	COG1336, COG1336, CRISPR system related protein, RAMP superfamily [Defense mechanisms].	1.44816e-62
NC_017299.1\|WP_014521051.1\|2338821_2340315_+\|PLP-dependent-aminotransferase-family-protein	gnl\|CDD\|224089	COG1167, ARO8, Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs [Transcription / Amino acid transport and metabolism].	5.15256e-121
NC_017299.1\|WP_033065806.1\|2343772_2344804_-\|alpha/beta-hydrolase	gnl\|CDD\|369561	pfam07859, Abhydrolase_3, alpha/beta hydrolase fold. This catalytic domain is found in a very wide range of enzymes.	2.35538e-93
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	4.55908e-24
NC_017299.1\|WP_014521053.1\|2341148_2342009_-\|NmrA-family-NAD(P)-binding-protein	gnl\|CDD\|187561	cd05251, NmrA_like_SDR_a, NmrA (a transcriptional regulator) and HSCARG (an NADPH sensor) like proteins, atypical (a) SDRs. NmrA and HSCARG like proteins. NmrA is a negative transcriptional regulator of various fungi, involved in the post-translational modulation of the GATA-type transcription factor AreA. NmrA lacks the canonical GXXGXXG NAD-binding motif and has altered residues at the catalytic triad, including a Met instead of the critical Tyr residue. NmrA may bind nucleotides but appears to lack any dehydrogenase activity. HSCARG has been identified as a putative NADP-sensing molecule, and redistributes and restructures in response to NADPH/NADP ratios. Like NmrA, it lacks most of the active site residues of the SDR family, but has an NAD(P)-binding motif similar to the extended SDR family, GXXGXXG. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Atypical SDRs are distinct from classical SDRs. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. In addition to the Rossmann fold core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	5.63822e-52
NC_017299.1\|WP_014521047.1\|2332211_2332901_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.27301e-21
NC_017299.1\|WP_041926594.1\|2322429_2323227_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	5.14673e-15
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	gnl\|CDD\|273859	TIGR01894, hypothetical_protein, CRISPR type III-B/RAMP module RAMP protein Cmr1. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model represents the region of stongest conservation, the N-terminal half, of one such family, represented by TM1795 from Thermotoga maritima. This protein is the first of a set of six genes, mostly from the RAMP superfamily, that we designated the CRISPR-associated RAMP module.	4.41756e-16
NC_017299.1\|WP_014521050.1\|2337576_2338497_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	3.12391e-88

>NC_017299.1|WP_014521047.1|2332211_2332901_-|CRISPR-associated-endoribonuclease-Cas6
MELWELIATVMLKEDIYFEDCGYIIGKNINKSMLLDKDLKEVHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNEFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQVEDNEEAQKVAFLARAIGLGEKNSSIGAGFCK
>NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1
MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV
>NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN
>NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3
MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE
>NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein
MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG
>NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE
>NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5
MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD
>NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP
>NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK
>NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_017299.1|WP_014521048.1|2333879_2335466_-|AAA-family-ATPase
MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRSDEEYKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKQVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSQLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGSGFAFKEVKAGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENNSKKIIQIYC
>NC_017299.1|WP_014521049.1|2336437_2337286_-|PhzF-family-phenazine-biosynthesis-protein
MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRIDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSQEFPMEVVSTGLPYLLVPLTSGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL
>NC_017299.1|WP_014521050.1|2337576_2338497_-|PhzF-family-phenazine-biosynthesis-protein
MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGAVQTREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGQVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYGGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL
>NC_017299.1|WP_014521051.1|2338821_2340315_+|PLP-dependent-aminotransferase-family-protein
MNIKIDKNSLITITQQLVHYFSDRIMSGFIKAGQKLPSIRSLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLGLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSKRKAELLDIARYNDILIVEDDPWNEISYKREKIKTIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKANHDLGTSVLIQKTIINFIQSNKITYYIESLNKQLVKRRDKVISLLKSHAPSGMKWTIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII
>NC_017299.1|WP_014521052.1|2340710_2341076_-|VOC-family-protein
MNFCWITLNVSNMEESLNFYHEIIGLKISERFNVGEDIEIAMLGETDCTKVELIYNKKQNVLSRSEGLSIGFEVKSLDEAMELLKNKNIPIKRGPISPLPSSRFFFIDDPNGIEIQIVQHS
>NC_017299.1|WP_014521053.1|2341148_2342009_-|NmrA-family-NAD(P)-binding-protein
MILITGANGQTGRAIIKALLSKGERIRAFVHTTEQIQEIKSLGEMEVVAGDMMNQRDVEEAFIGVSAVYHICSAVNPNEVEIGQMAINAARKAKVEHFVYHSVLHSVLQDMLHHQKKLKVEELLVNSAIPYTIIQPAVFMQNILESWNSLSEKGIFQQKFFTTQETRMCMVDLEDLAEAVSIILTSPGHTGATYELCGPEDLSLSDMIATMEQHIGLKIKVETPQDEMFAAQLKKLGVGDYQVNTLLKMFQHYNEHGFIGNPNVLTWILGRRPNDFSSFILRTLRS
>NC_017299.1|WP_014521054.1|2342031_2342538_-|MarR-family-transcriptional-regulator
MESFKFSLRDIPKREILNEYSSRFPGINVDAVESCIALLRTASDISKILDEHFSKYGISEGKFTILMLLYRQSDYQLSPISLSKKAEVTKGTMTGLIAGLENQGFIEKISNPCDKRGYLVRLSSKGLRILEEILPVHYTLIAKLMAGLEDGQLKELTTLLNLLSKNLL
>NC_017299.1|WP_014521055.1|2343094_2343541_+|hypothetical-protein
MNKLNTDKLSVEFRNGVTSTEPTLGRRYTLTHSDITAELFLTIGSAYAYDKINATRDEVLGEWIGKQKNYLFHVYLHIDGNNPIVTGVRNHIFRLELPLALKAIRYVDRKLFSAHSKLDNSPIIVHFMSSYPSFNRTEKWGTFSDYKT
>NC_017299.1|WP_033065806.1|2343772_2344804_-|alpha/beta-hydrolase
MKKVIKIVSVILVILVISGFFIIKNLTETKDGKLNMYVAANLQLYKILNLKSINSKSIEEIRGNLNKQSTKWSNKPILFSNIKNLDIKMNNEKIPVRIYTPENGSNFPIIIYSHGGFWIGGNVDTSDRVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNAKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPPIICQVLIYPSTNIFELNSKSWSYFSNSVNVSREDMEKYISIYAPKKEDRKNPYASPLLSKDFRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKVDVARYKGITHGFITMDKITNKADEALNQISLYIQKEFQK
>NC_017299.1|WP_014521058.1|2345237_2346137_+|hypothetical-protein
MSNKRNLQSLRSFYICILIFNMVSNSIFHLNNNGFNIELFKNFTIRSVILLDLNILLFLIIVIAFEKKINIDEEVNTQLNTRIRPLYLVNIFFIAYILVCIFLLKDIDVILSSFIMEIIYIGIIILSKKIITLELTNRQLQWQKACGYIDEDCEESSFLWRFKLWWSPHVNVPFKNRWKGPSRLLYDLALVYGIIISKGNLFPLILLILLLPDVISWLEGLLGLQTSLTGICTGITEHHSKNSHVLYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_8

2335819-2336173

TypeIII

III-B

Consensus_repeat	Method
TTAAATACATCCTATGTTAATGTTCAAC	CRISPRCasFinder

5 spacers

cas6,cmr1gr7,cas10,cmr3gr5,csx1,cmr4gr7,cmr5gr11,cmr6gr7

The CRISPR arrays of NC_017299_8

>merge|NC_017299|8|2335819-2336173|CRISPRCasFinder
TTAAATACATCCTATGTTAATGTTCAACTTTTTAAATAATTATCTTTTAGGAAGTTTTCATCTTATTTAAATACATCTTATGTTAATGTTCAACATTTCATTATTCTTTTGTAATTTCGTATACACCGCATTTAAATACATCTTATGTTAATGTTCAACAGCATATGGGAATATGGATAATGCTATAAAAACTGCATTTAAATACATCTTATGTTGATGTTCAACTAGGTACATCAAATGGAGTTGTACTTACTACAGGATTTAAATACATCCTATGTTAATGTTCAACACCAGAAAAAAGCATAGCTGCTGCTATGGGAAACATATTTAAATACATCCTATGTTAATGTTCAAC

>NC_017299|8|8|2335819-2336173|CRISPRCasFinder
TTAAATACATCCTATGTTAATGTTCAAC	TTTTTAAATAATTATCTTTTAGGAAGTTTTCATCTTAT
TTAAATACATCTTATGTTAATGTTCAAC	ATTTCATTATTCTTTTGTAATTTCGTATACACCGCAT
TTAAATACATCTTATGTTAATGTTCAAC	AGCATATGGGAATATGGATAATGCTATAAAAACTGCAT
TTAAATACATCTTATGTTGATGTTCAAC	TAGGTACATCAAATGGAGTTGTACTTACTACAGGAT
TTAAATACATCCTATGTTAATGTTCAAC	ACCAGAAAAAAGCATAGCTGCTGCTATGGGAAACATAT
TTAAATACATCCTATGTTAATGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_003398566.1\|2346477_2347800_+\|APC-family-permease	unknown	unknown	gnl\|CDD\|223605
NC_017299.1\|WP_014521054.1\|2342031_2342538_-\|MarR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|197670
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|213662
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	cmr5gr11	pfam09701_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	cd09748_cmr3gr5_CAS-III-B	gnl\|CDD\|187879
NC_017299.1\|WP_014521058.1\|2345237_2346137_+\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521049.1\|2336437_2337286_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_017299.1\|WP_014521055.1\|2343094_2343541_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|378897
NC_017299.1\|WP_014521052.1\|2340710_2341076_-\|VOC-family-protein	unknown	unknown	gnl\|CDD\|366361
NC_017299.1\|WP_014521048.1\|2333879_2335466_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_017299.1\|WP_041926685.1\|2323789_2324098_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	COG1336_cmr4gr7_CAS-III-C	gnl\|CDD\|224255
NC_017299.1\|WP_014521051.1\|2338821_2340315_+\|PLP-dependent-aminotransferase-family-protein	unknown	unknown	gnl\|CDD\|224089
NC_017299.1\|WP_033065806.1\|2343772_2344804_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|369561
NC_017299.1\|WP_014521053.1\|2341148_2342009_-\|NmrA-family-NAD(P)-binding-protein	unknown	unknown	gnl\|CDD\|187561
NC_017299.1\|WP_014521047.1\|2332211_2332901_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	cmr1gr7	COG1367_cmr1gr7_CAS-III-B	gnl\|CDD\|273859
NC_017299.1\|WP_014521043.1\|2326794_2328144_-\|hypothetical-protein	csx1	mkCas0085_csx1_CAS-III	unknown
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_017299.1\|WP_014521050.1\|2337576_2338497_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_003398566.1\|2346477_2347800_+\|APC-family-permease	gnl\|CDD\|223605	COG0531, PotE, Amino acid transporters [Amino acid transport and metabolism].	5.22876e-27
NC_017299.1\|WP_014521054.1\|2342031_2342538_-\|MarR-family-transcriptional-regulator	gnl\|CDD\|197670	smart00347, HTH_MARR, helix_turn_helix multiple antibiotic resistance protein.	5.9924e-18
NC_017299.1\|WP_041926595.1\|2324121_2325426_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|213662	TIGR01898, repair_system, CRISPR type III-B/RAMP module RAMP protein Cmr6. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This family, represented by TM1791 of Thermotoga maritima, is designated Cmr6 [sic], for CRISPR/Cas Ramp Module protein 6. This family is both closely related to and frequently encoded next to the TM1792 family of Cas proteins described by TIGR01867. The two proteins are fused in an example from Methanopyrus kandleri.	4.38545e-34
NC_017299.1\|WP_014521040.1\|2325418_2325886_-\|type-III-B-CRISPR-module-associated-protein-Cmr5	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	1.60766e-29
NC_017299.1\|WP_014521044.1\|2328146_2329250_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|187879	cd09748, Cmr3_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	4.05127e-103
NC_017299.1\|WP_014521049.1\|2336437_2337286_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	1.43602e-61
NC_017299.1\|WP_014521055.1\|2343094_2343541_+\|hypothetical-protein	gnl\|CDD\|378897	pfam12638, Staygreen, Staygreen protein. This family of proteins have been implicated in chlorophyll degradation. Intriguingly members of this family are also found in non-photosynthetic bacteria.	9.76376e-77
NC_017299.1\|WP_014521052.1\|2340710_2341076_-\|VOC-family-protein	gnl\|CDD\|366361	pfam00903, Glyoxalase, Glyoxalase/Bleomycin resistance protein/Dioxygenase superfamily.	3.34662e-15
NC_017299.1\|WP_014521048.1\|2333879_2335466_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	6.98155e-06
NC_017299.1\|WP_014521041.1\|2325878_2326781_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|224255	COG1336, COG1336, CRISPR system related protein, RAMP superfamily [Defense mechanisms].	1.44816e-62
NC_017299.1\|WP_014521051.1\|2338821_2340315_+\|PLP-dependent-aminotransferase-family-protein	gnl\|CDD\|224089	COG1167, ARO8, Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs [Transcription / Amino acid transport and metabolism].	5.15256e-121
NC_017299.1\|WP_033065806.1\|2343772_2344804_-\|alpha/beta-hydrolase	gnl\|CDD\|369561	pfam07859, Abhydrolase_3, alpha/beta hydrolase fold. This catalytic domain is found in a very wide range of enzymes.	2.35538e-93
NC_017299.1\|WP_014521053.1\|2341148_2342009_-\|NmrA-family-NAD(P)-binding-protein	gnl\|CDD\|187561	cd05251, NmrA_like_SDR_a, NmrA (a transcriptional regulator) and HSCARG (an NADPH sensor) like proteins, atypical (a) SDRs. NmrA and HSCARG like proteins. NmrA is a negative transcriptional regulator of various fungi, involved in the post-translational modulation of the GATA-type transcription factor AreA. NmrA lacks the canonical GXXGXXG NAD-binding motif and has altered residues at the catalytic triad, including a Met instead of the critical Tyr residue. NmrA may bind nucleotides but appears to lack any dehydrogenase activity. HSCARG has been identified as a putative NADP-sensing molecule, and redistributes and restructures in response to NADPH/NADP ratios. Like NmrA, it lacks most of the active site residues of the SDR family, but has an NAD(P)-binding motif similar to the extended SDR family, GXXGXXG. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Atypical SDRs are distinct from classical SDRs. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. In addition to the Rossmann fold core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	5.63822e-52
NC_017299.1\|WP_014521047.1\|2332211_2332901_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.27301e-21
NC_017299.1\|WP_041926596.1\|2330975_2332166_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr1	gnl\|CDD\|273859	TIGR01894, hypothetical_protein, CRISPR type III-B/RAMP module RAMP protein Cmr1. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model represents the region of stongest conservation, the N-terminal half, of one such family, represented by TM1795 from Thermotoga maritima. This protein is the first of a set of six genes, mostly from the RAMP superfamily, that we designated the CRISPR-associated RAMP module.	4.41756e-16
NC_017299.1\|WP_014521045.1\|2329230_2330976_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	4.55908e-24
NC_017299.1\|WP_014521050.1\|2337576_2338497_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	3.12391e-88

>NC_017299.1|WP_014521048.1|2333879_2335466_-|AAA-family-ATPase
MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRSDEEYKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKQVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSQLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGSGFAFKEVKAGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENNSKKIIQIYC
>NC_017299.1|WP_014521047.1|2332211_2332901_-|CRISPR-associated-endoribonuclease-Cas6
MELWELIATVMLKEDIYFEDCGYIIGKNINKSMLLDKDLKEVHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNEFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQVEDNEEAQKVAFLARAIGLGEKNSSIGAGFCK
>NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1
MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV
>NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN
>NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3
MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE
>NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein
MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG
>NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE
>NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5
MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD
>NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP
>NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK
>NC_017299.1|WP_014521049.1|2336437_2337286_-|PhzF-family-phenazine-biosynthesis-protein
MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRIDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSQEFPMEVVSTGLPYLLVPLTSGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL
>NC_017299.1|WP_014521050.1|2337576_2338497_-|PhzF-family-phenazine-biosynthesis-protein
MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGAVQTREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGQVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYGGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL
>NC_017299.1|WP_014521051.1|2338821_2340315_+|PLP-dependent-aminotransferase-family-protein
MNIKIDKNSLITITQQLVHYFSDRIMSGFIKAGQKLPSIRSLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLGLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSKRKAELLDIARYNDILIVEDDPWNEISYKREKIKTIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKANHDLGTSVLIQKTIINFIQSNKITYYIESLNKQLVKRRDKVISLLKSHAPSGMKWTIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII
>NC_017299.1|WP_014521052.1|2340710_2341076_-|VOC-family-protein
MNFCWITLNVSNMEESLNFYHEIIGLKISERFNVGEDIEIAMLGETDCTKVELIYNKKQNVLSRSEGLSIGFEVKSLDEAMELLKNKNIPIKRGPISPLPSSRFFFIDDPNGIEIQIVQHS
>NC_017299.1|WP_014521053.1|2341148_2342009_-|NmrA-family-NAD(P)-binding-protein
MILITGANGQTGRAIIKALLSKGERIRAFVHTTEQIQEIKSLGEMEVVAGDMMNQRDVEEAFIGVSAVYHICSAVNPNEVEIGQMAINAARKAKVEHFVYHSVLHSVLQDMLHHQKKLKVEELLVNSAIPYTIIQPAVFMQNILESWNSLSEKGIFQQKFFTTQETRMCMVDLEDLAEAVSIILTSPGHTGATYELCGPEDLSLSDMIATMEQHIGLKIKVETPQDEMFAAQLKKLGVGDYQVNTLLKMFQHYNEHGFIGNPNVLTWILGRRPNDFSSFILRTLRS
>NC_017299.1|WP_014521054.1|2342031_2342538_-|MarR-family-transcriptional-regulator
MESFKFSLRDIPKREILNEYSSRFPGINVDAVESCIALLRTASDISKILDEHFSKYGISEGKFTILMLLYRQSDYQLSPISLSKKAEVTKGTMTGLIAGLENQGFIEKISNPCDKRGYLVRLSSKGLRILEEILPVHYTLIAKLMAGLEDGQLKELTTLLNLLSKNLL
>NC_017299.1|WP_014521055.1|2343094_2343541_+|hypothetical-protein
MNKLNTDKLSVEFRNGVTSTEPTLGRRYTLTHSDITAELFLTIGSAYAYDKINATRDEVLGEWIGKQKNYLFHVYLHIDGNNPIVTGVRNHIFRLELPLALKAIRYVDRKLFSAHSKLDNSPIIVHFMSSYPSFNRTEKWGTFSDYKT
>NC_017299.1|WP_033065806.1|2343772_2344804_-|alpha/beta-hydrolase
MKKVIKIVSVILVILVISGFFIIKNLTETKDGKLNMYVAANLQLYKILNLKSINSKSIEEIRGNLNKQSTKWSNKPILFSNIKNLDIKMNNEKIPVRIYTPENGSNFPIIIYSHGGFWIGGNVDTSDRVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNAKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPPIICQVLIYPSTNIFELNSKSWSYFSNSVNVSREDMEKYISIYAPKKEDRKNPYASPLLSKDFRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKVDVARYKGITHGFITMDKITNKADEALNQISLYIQKEFQK
>NC_017299.1|WP_014521058.1|2345237_2346137_+|hypothetical-protein
MSNKRNLQSLRSFYICILIFNMVSNSIFHLNNNGFNIELFKNFTIRSVILLDLNILLFLIIVIAFEKKINIDEEVNTQLNTRIRPLYLVNIFFIAYILVCIFLLKDIDVILSSFIMEIIYIGIIILSKKIITLELTNRQLQWQKACGYIDEDCEESSFLWRFKLWWSPHVNVPFKNRWKGPSRLLYDLALVYGIIISKGNLFPLILLILLLPDVISWLEGLLGLQTSLTGICTGITEHHSKNSHVLYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR
>NC_017299.1|WP_003398566.1|2346477_2347800_+|APC-family-permease
MLEKKYGLWTTVSMVIGIVIGSGVFFKADNILMASGGNVKTALLAWLVGAISMIFGALVFAECANRFERSNGIVDYAEGMLSEKFAYLIGWFNGIIYYPAIAAVLAWAAGNYTAILFNKDGNFVWIMAAIYMIGIYILNYISPILSGKFQIASTAIKLVPLMIIAIFGIFQGLNNGILIENFSKVSIISDSGSGFAAAVLGAAFAYEGWIIATTINGEIKDAKNTLPKALVFGSLVIVIIYILYFLGIVGMIPTETILKQGDNTVNVAARTVFGNFGASILTIFIIVSCLGTLNGLILGGSRSFYSLAIRGQGIKPEAFSKLNSKTNIPTNSTIANFILICIYLVVWYMNFKGLFPNKLFIDISELPIALIYGIYIIIYIAYMMKMKDLSFIKRFVIPSLALMGALIVVYGGLSKTSVIIDLGISVFVFLSGLLFYNKKK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_017299_9

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_017299_9

2446898-2447047

Orphan

Consensus_repeat	Method
ATTCTCTGGTTTATCTTC	CRT

3 spacers

The CRISPR arrays of NC_017299_9

>merge|NC_017299|9|2446898-2447047|CRT
ATTCTCTGGTTTATCTTCTGGTTTATCCTCTGGTTTATCCTCTGGCTTATTCTCTGGTTTATCTTCTGGTTTATCCTCTGGTTTATTCTCTGGTTTATCTTCTGGTTTATCTTCTGGTTTATCCTCTGGTTTATTCTCTGTTTTATCCTC

>NC_017299|9|2|2446898-2447047|CRT
ATTCTCTGGTTTATCTTC	TGGTTTATCCTCTGGTTTATCCTCTGGCTT
ATTCTCTGGTTTATCTTC	TGGTTTATCCTCTGGTTT
ATTCTCTGGTTTATCTTC	TGGTTTATCTTCTGGTTTATCCTCTGGTTT
ATTCTCTGTTTTATCCTC

Protein	Signature genes	Signature genes Name	Protein_function
NC_017299.1\|WP_041926688.1\|2442237_2442405_-\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|224393
NC_017299.1\|WP_014521129.1\|2442894_2443770_+\|Ig-like-domain-containing-protein	unknown	unknown	gnl\|CDD\|379073
NC_017299.1\|WP_014521136.1\|2449193_2449367_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_003385468.1\|2455252_2455705_-\|DUF2634-domain-containing-protein	unknown	unknown	gnl\|CDD\|378510
NC_017299.1\|WP_012705217.1\|2453484_2454120_-\|YmfQ-family-protein	unknown	unknown	gnl\|CDD\|378379
NC_017299.1\|WP_041926603.1\|2451732_2453448_-\|phage-tail-protein	unknown	unknown	gnl\|CDD\|372197
NC_017299.1\|WP_014521125.1\|2440552_2440891_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_170876226.1\|2441900_2442056_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521124.1\|2438157_2440542_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_041926602.1\|2441653_2441899_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521141.1\|2454116_2455247_-\|baseplate-J/gp47-family-protein	unknown	unknown	gnl\|CDD\|377414
NC_017299.1\|WP_014521131.1\|2444682_2444913_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521135.1\|2448135_2449158_-\|peptidoglycan-binding-protein	unknown	unknown	gnl\|CDD\|119385
NC_017299.1\|WP_014521137.1\|2449379_2449604_-\|hemolysin-XhlA-family-protein	unknown	unknown	gnl\|CDD\|371241
NC_017299.1\|WP_014521123.1\|2437996_2438149_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_003360655.1\|2451192_2451315_-\|XkdX-family-protein	unknown	unknown	gnl\|CDD\|378241
NC_017299.1\|WP_014521138.1\|2449811_2450975_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133381
NC_017299.1\|WP_014521130.1\|2443784_2444348_+\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521139.1\|2451307_2451700_-\|hypothetical-protein	unknown	unknown	unknown
NC_017299.1\|WP_014521126.1\|2440901_2441327_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_017299.1\|WP_041926688.1\|2442237_2442405_-\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|224393	COG1476, COG1476, Predicted transcriptional regulators [Transcription].	1.27752e-12
NC_017299.1\|WP_014521135.1\|2448135_2449158_-\|peptidoglycan-binding-protein	gnl\|CDD\|119385	cd06525, GH25_Lyc-like, Lyc muramidase is an autolytic lysozyme (autolysin) from Clostridium acetobutylicum encoded by the lyc gene. Lyc has a glycosyl hydrolase family 25 (GH25) catalytic domain. Endo-N-acetylmuramidases are lysozymes (also referred to as peptidoglycan hydrolases) that degrade bacterial cell walls by catalyzing the hydrolysis of 1,4-beta-linkages between N-acetylmuramic acid and N-acetyl-D-glucosamine residues.	6.18732e-89
NC_017299.1\|WP_014521137.1\|2449379_2449604_-\|hemolysin-XhlA-family-protein	gnl\|CDD\|371241	pfam10779, XhlA, Haemolysin XhlA. XhlA is a cell-surface associated haemolysin that lyses the two most prevalent types of insect immune cells (granulocytes and plasmatocytes) as well as rabbit and horse erythrocytes. This family has had DUF1267, pfam06895, merged into it.	1.30232e-13
NC_017299.1\|WP_014521138.1\|2449811_2450975_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133381	cd01106, HTH_TipAL-Mta, Helix-Turn-Helix DNA binding domain of the transcription regulators TipAL, Mta, and SkgA. Helix-turn-helix (HTH) TipAL, Mta, and SkgA transcription regulators, and related proteins, N-terminal domain. TipAL regulates resistance to and activation by numerous cyclic thiopeptide antibiotics, such as thiostrepton. Mta is a global transcriptional regulator; the N-terminal DNA-binding domain of Mta interacts directly with the promoters of mta, bmr, blt, and ydfK, and induces transcription of these multidrug-efflux transport genes. SkgA has been shown to control stationary-phase expression of catalase-peroxidase in Caulobacter crescentus. These proteins are comprised of distinct domains that harbor an N-terminal active (DNA-binding) site and a regulatory (effector-binding) site. The conserved N-terminal domain of these transcription regulators contains winged HTH motifs that mediate DNA binding. These proteins share the N-terminal DNA binding domain with other transcription regulators of the MerR superfamily that promote transcription by reconfiguring the spacer between the -35 and -10 promoter elements. Unique to this family, is a TipAL-like, lineage specific Bacilli subgroup, which has five conserved cysteines in the C-terminus of the protein.	1.13407e-46
NC_017299.1\|WP_003385468.1\|2455252_2455705_-\|DUF2634-domain-containing-protein	gnl\|CDD\|378510	pfam10934, DUF2634, Protein of unknown function (DUF2634). Some members in this family of proteins are annotated as phage related, xkdS however currently there is no known function.	3.68449e-36
NC_017299.1\|WP_012705217.1\|2453484_2454120_-\|YmfQ-family-protein	gnl\|CDD\|378379	pfam10076, DUF2313, Uncharacterized protein conserved in bacteria (DUF2313). Members of this family of proteins comprise various hypothetical and putative bacteriophage tail proteins.	6.60946e-50
NC_017299.1\|WP_041926603.1\|2451732_2453448_-\|phage-tail-protein	gnl\|CDD\|372197	pfam12571, DUF3751, Phage tail-collar fibre protein. This domain family is found in bacteria and viruses, and is approximately 160 amino acids in length. There are two completely conserved residues (K and W) that may be functionally important. The members are annotated as being putative phage tail or tail-collar proteins.	8.52827e-68
NC_017299.1\|WP_003360655.1\|2451192_2451315_-\|XkdX-family-protein	gnl\|CDD\|378241	pfam09693, Phage_XkdX, Phage uncharacterized protein (Phage_XkdX). This entry identifies a family of small (about 50 amino acid) phage proteins, found in at least 12 different phage and prophage regions of Gram-positive bacteria. In a number of these phage, the gene for this protein is found near the holin and endolysin genes.	0.00600102
NC_017299.1\|WP_014521129.1\|2442894_2443770_+\|Ig-like-domain-containing-protein	gnl\|CDD\|379073	pfam13205, Big_5, Bacterial Ig-like domain.	9.80634e-06
NC_017299.1\|WP_014521141.1\|2454116_2455247_-\|baseplate-J/gp47-family-protein	gnl\|CDD\|377414	pfam04865, Baseplate_J, Baseplate J-like protein. The P2 bacteriophage J protein lies at the edge of the baseplate. This family also includes a number of bacterial homologs, which are thought to have been horizontally transferred.	7.77905e-82

>NC_017299.1|WP_014521131.1|2444682_2444913_-|hypothetical-protein
MKKIVIGLLTALILGVNVSSAYAAESCPRCGATVGRGENHKCCDYLGHDFKPLHDFHGKLVCMACRNCGYTIPYNN
>NC_017299.1|WP_014521130.1|2443784_2444348_+|hypothetical-protein
MINSISNSQPYLNIKGSTKKNDIEQNNQTEDNKFKKYLSDYVPKYTGDEGMPKKCDYKEMTVFEKRIFDDYMQTDFLYGVSYEDFKKTLCGFPPVDAPKSIIEAYQNTISKYPENQRKKIMGELSYLESPNDNLDMGTIIRNAVDHCKLVEIITGQSQRHRENLYEDFLNEFNKVNTIDDSHRKTTL
>NC_017299.1|WP_014521129.1|2442894_2443770_+|Ig-like-domain-containing-protein
MKKSKKLFITTSASFLFILSFFLFFTKSNVQASSSPVISNVDIVGYSYDSIYPTFKSTTPRKDSYDVFYNPSKSKSGNVYIRVIQTGSGGTRNIVVDNDDNNFVNAKFSDISTDLLTSGGILTGYDEKFEITDLKKGYHNIKRLGFNNNTLGKPMVQDIIRVRVCEHNEFPAISNVPVNKTFTINFNRAVKIDSSTKNFVKVLDSNNREVPISIGLGSNPNYLEIYAPSNNYLPNSNYTLQVLPGLKSTDGKELFTSTTMNFSTSSSSRSLLSRSIHTFGTTTPDLTLNFD
>NC_017299.1|WP_041926688.1|2442237_2442405_-|helix-turn-helix-domain-containing-protein
MREYLMEPQEFAKLIDVNYKTYYSWERGVAGPSLETALNIAKRLNKKVEDVWYLD
>NC_017299.1|WP_170876226.1|2441900_2442056_-|hypothetical-protein
MADRLRVVLEFRKTDIKELQLYGKLLKFSNPAAVVKDILKGTLPIEILEED
>NC_017299.1|WP_041926602.1|2441653_2441899_-|hypothetical-protein
MNLETRLKKCCCKNISVTYKQNEWYKVELFYNNRYYRFFDVSLKEVERKSLNYMRKLNRRLKVKMMARGEVTWFQKHRAML
>NC_017299.1|WP_014521126.1|2440901_2441327_-|hypothetical-protein
MFFNKEKVYSFEEGLKVLNKTKTEKVSLKMLQELNDEGIYLREGNKLYNTLACTLGILMYAEKVIAVPKTGVPKLDQGGWKMVGVAQSVIFWASMIYAFKALLELAVKGEGTWKKVGTGFLICAMNYLIPWGFELIKGIFM
>NC_017299.1|WP_014521125.1|2440552_2440891_-|hypothetical-protein
MSIQEFLQNKQCYAFLNPFDVSNLEIVKSINEFNYNTKAFFESITRFIYYMKHPKELSWLIWLGVVENSFWICIFICLFSIIAYIIGWKKGKLWAKGSVLAYIIIMMFNSAL
>NC_017299.1|WP_014521124.1|2438157_2440542_-|hypothetical-protein
MFNFLKREKSIKISDYFEIIHPKYSVLQITPNTGNRNYDTELIAKTIANMYRMPYQRIMKEIKNKGFKIVYELPVKTMFEISITKDDCTFHITVPRLYKNLFVEKCTEVWKRITVKEVATIPINEDELQEALKYELHYEKEDPLSLKVNKKTNDPLNNILNVMDVMENNDKIDILYNFIPINQGRWKGNYKETMKKIKAGLPIDKEKLNPGVILKYLGIGTIKAIDFVFNVLNDVVSDGKPRSHSEVAVTMIDKFSNLSAITRKKENTVVIDTQLIVVSRSKEKIRQQNNAYAVLESYKSLAQDNSLKYKKLNNKIKINPYDYKIKGVDTNRMSTLECNNFIQIPGRELLQRFRINTKVDVLENPIPEELQKGYVYLGPSNYKGKEYKAYMRNKYNFGNLALLLLSPQGGGKTTFIANMSKNNNDKHESVIILDYIKNCELANTVKKVVNKDDVIDLDLSKKECFQGLGFNEVKCEGKDEFEMFKMSNMKAEQTMSFIDAINTDGLPLTSKMRRYLSAAANLVYIHDDTSIGDVIKCLQDFRKRNYYISYIDKLSEDGKNYFYDMITTLKELNEIKEEKDKKTKEVIRREIVGTKESKIDGILDRVNLIQENIYLKYMFNMKCDNNVDFIKAMDEGKVILIKMPEDSFNNQMVKNVLVTFFTSKIVLATKLRGSLHEKPSRCNVFYDELYQAPTAENVICSVLSQLRKFGTKIIISAHYMNQLIPQLKNEIKASGASYMLLQGADKKNFEELREEMKPYELEDLLNLKQFHSLNLIKYEKGYAKFITKLPKPLN
>NC_017299.1|WP_014521123.1|2437996_2438149_-|hypothetical-protein
MVKYIIMSCIMGFAGNKLFNKKDKSSKNSIKWGCISGSLLIIIYVIVLKL
>NC_017299.1|WP_014521135.1|2448135_2449158_-|peptidoglycan-binding-protein
MAKGIDISMHNGTVNFGAVKASGCNIVIIKATEGVQYVDPYLNQHYNGAKAVGMNIGFYHFMSEKTDPSQQAVDFWNSIKGKQFNISPTLDIETNNQGRSQSQISDRCIEFLQKFKALSGYNCLIYTGGYFGRDNLDSRVKQYKGWIAHYNVNTPMATGFNAVGHQYTEDGHINGVSTRVDMNNFTDGIFIGKATKPIETKEMQIQKMLVTIGYPIGNSGIDGIIGNGTITAIKAFQKDCNLTVTGNVDTKTWNKLEQEYNKKLGIKPNNKEEFDMDKVVLYFGPLDALSAVLVSQKHQCPMMLKKDFEDKKLKAKEIIIIGGKPGTDRYDSFKDAAKLL
>NC_017299.1|WP_014521136.1|2449193_2449367_-|hypothetical-protein
MNRVLTKITSARWLIAVIMTIVFAILAIKNTLNTEFITIYTMVVAFYFSKDRKEQDK
>NC_017299.1|WP_014521137.1|2449379_2449604_-|hemolysin-XhlA-family-protein
MDSNIQQEILERIVRIETKIDGYNSTREKADVAYNKACQNEKDITEMKDNQKWLWRTIAGAIILGILGAVIKFN
>NC_017299.1|WP_014521138.1|2449811_2450975_-|MerR-family-transcriptional-regulator
MRTVKQVSDLTGISVRTLHYYDEIGLLKPSEITEAGYRFYDDEALKTLQQILFFKELDIPLKDVKEIMSSPYFDKMQALKNQKKLLLLKRKRLDGLIKLINKTLKGESTMNFKEFDMSEYFNVLEEFKTEHEDKVIRIYGSVDKYNECIEKCKSKEDEIAKMAMKKYGSIEKYAKALKKNLNSDILTLAEKYDVFKKDFLEDKHPKLRELYKKLVSDLSKDPSSKKIQQIAEEITNTAKKDYEIFKMDNGDDHWYYMVQMYLVYPGWIEVVDKKYGNGASKFIGEALKNYSGDKHPKVEELYEKLTSDLSKAPFSKEIQQIIEEISDESKKSQKLYKVDEGENHWGYMAELYLSDSMLQEVTDEKYGNGASKFIGEALKFYSENSKS
>NC_017299.1|WP_003360655.1|2451192_2451315_-|XkdX-family-protein
MLSYIKEYFLMGLYVEEDLDIFVQAKWITIEEKENIIKTQ
>NC_017299.1|WP_014521139.1|2451307_2451700_-|hypothetical-protein
MIFLGELKKIEENKIKAKFIHYIPFDNVYGLHKTKEELEQEGILIENIPEPKYIENKQAIMYWNPEDKQIFYEYEDVLKSDEELEQQKQQSLNAKLLKDNAEIQIELNKQKELNADLLLKIAQLGGNANA
>NC_017299.1|WP_041926603.1|2451732_2453448_-|phage-tail-protein
MGKAKIANSAGFGSKINFVKMKVGDGGGSYYNPREDQEDLINTVWEGNITHVAIDEKNPNWINVEMMIPANVGGFMIREYGVFDEDNNMLAIAKCAESYKPLAEDGSTKELIMKMVLTVSNTENITLKIDPTIIFAKKSEIEILENKIKNIKIPVTSVNSKTGAIELKASDIKTEDGKTIESQLADITTEIGTEELKTNAKDIKSSINELFISASNGKTKVATAITGKGIPASGSDSYDTLSNKIKNIKTGYTQNDLINIENVEFSIKNIFSKNMDSGMLFFIKDYIYVINWKDSIKKYSLDGNLILSKKIEHNGFSSGSYTYFDDIYKIFFHNNSFYIFNKGLKHSGKYYYRVYAETCDIERISTYGFGGQGAYSYYGYGGVAINNNGICCGYNEYSGEVFLFSLSYADVIWSKCLFGWNTKYDFSNIFSDGTDFYISSNYSSGSYYKINVNGDITELEKKSLPYESNSVMLGEYVYCYDSNKKIWRYNIKTNKTEQIGSNCKYIELDFLRKYLYIYTGSILHKIDKNGNIICSYNCTDDHFLGSDKDACIYFYNNNVINKIKLAYKVLV
>NC_017299.1|WP_012705217.1|2453484_2454120_-|YmfQ-family-protein
MIKSKKGKEMITYVSPIYEQSKVIQSIFEAIGYEWDTAGLLANDILKQFFPQTATWGLIYWEEAVNVVNNPTEEIERRRRKVIAKLQSRYAINPKRMALILKNYTGADILITEDIAPYTFEVKLTGREGFPKSLEDLYKEVKKIKPSHLSVKYKLISLTESNLYIGATSFSGETITVYPWTPNNIETTGNIEIALAQNAGLETITTYPKEG
>NC_017299.1|WP_014521141.1|2454116_2455247_-|baseplate-J/gp47-family-protein
MERDLLIPEFLQEDADTIHERMLEKAPPNVSTIEGDFYWDNTRPTAEEKASLMQVQLQNMLRLAFPQTSYGVWLEYLGECKGVFKNLPTKSIGVIKVIGRKGTNIYKDKLIGTVATDDSESVVFKFTENKVIDETGVAYVKAECTKAGTIGNVLKNTITILMDRINGIESITNEEEFTGGTDLEDEEHYRERVLEEYKNEATSGNNEHYKKWAKEVDGVGYAYVIDEWNGPGTVKVLILDKNNKPATRELIDKVQNYIYEIVPREENRGGKAPIGAIATIDTPITLVIDIKANFKFKEDFNSEIVLNSLKENLSKYLSGISIGGTILYTAIHTIVGSMILTGEGIEDFKNLTVNGITENIKLIDQVAVIGEVTNIQ
>NC_017299.1|WP_003385468.1|2455252_2455705_-|DUF2634-domain-containing-protein
MPNLFPDNLEENNIEELEETIIDFKGSYLFDFKTGEFVTNPDGTIAKANDLEAYVQWCYKAMATPRYKLAYSDLYGQEFKNIIGQDISKDAMELEIKRMTEETLMVHPRTKDVDNFIFKWSENKEEVYYEFEIITIDEEKFMLHSELKVW

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity
NC_017299_9	9.2\|2446964\|18\|NC_017299\|CRT	2446964-2446981	18	NC_017299.1	2446880-2446897	1	0.944
NC_017299_9	9.2\|2446964\|18\|NC_017299\|CRT	2446964-2446981	18	NC_017299.1	2446892-2446909	1	0.944
NC_017299_9	9.2\|2446964\|18\|NC_017299\|CRT	2446964-2446981	18	NC_017299.1	2447036-2447053	1	0.944

1. spacer 9.2|2446964|18|NC_017299|CRT matches to position: 2446880-2446897, mismatch: 1, identity: 0.944

tggtttatcctctggttt	CRISPR spacer
tggcttatcctctggttt	Protospacer
***.**************

2. spacer 9.2|2446964|18|NC_017299|CRT matches to position: 2446892-2446909, mismatch: 1, identity: 0.944

tggtttatcctctggttt	CRISPR spacer
tggtttattctctggttt	Protospacer
********.*********

3. spacer 9.2|2446964|18|NC_017299|CRT matches to position: 2447036-2447053, mismatch: 1, identity: 0.944

tggtttatcctctggttt	CRISPR spacer
tgttttatcctctggttt	Protospacer
** ***************

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NZ_CP014152	Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence	162522-162557	0	1.0
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NZ_CP013684	Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence	136408-136443	0	1.0
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NZ_CP013710	Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence	116828-116863	0	1.0
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NC_025146	Clostridium botulinum plasmid pCB111 DNA, complete sequence, strain: 111	110843-110878	0	1.0
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NC_012654	Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence	250707-250742	1	0.972
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NZ_CP031095	Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence	131441-131476	1	0.972
NC_017299_3	3.1\|2310692\|36\|NC_017299\|PILER-CR	2310692-2310727	36	NZ_CP013709	Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence	120963-120998	2	0.944
NC_017299_3	3.1\|2310692\|36\|NC_017299\|PILER-CR	2310692-2310727	36	NZ_CP013844	Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence	166400-166435	2	0.944
NC_017299_3	3.4\|2310694\|34\|NC_017299\|CRISPRCasFinder	2310694-2310727	34	NZ_CP013709	Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence	120963-120996	2	0.941
NC_017299_3	3.4\|2310694\|34\|NC_017299\|CRISPRCasFinder	2310694-2310727	34	NZ_CP013844	Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence	166400-166433	2	0.941
NC_017299_6	6.3\|2319975\|36\|NC_017299\|CRISPRCasFinder	2319975-2320010	36	NZ_CP006909	Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence	133437-133472	2	0.944
NC_017299_6	6.3\|2319975\|36\|NC_017299\|CRISPRCasFinder	2319975-2320010	36	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	156920-156955	2	0.944
NC_017299_6	6.6\|2319985\|36\|NC_017299\|PILER-CR	2319985-2320020	36	NZ_CP006909	Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence	133437-133472	2	0.944
NC_017299_6	6.6\|2319985\|36\|NC_017299\|PILER-CR	2319985-2320020	36	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	156920-156955	2	0.944
NC_017299_7	7.3\|2333272\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333272-2333307	36	NZ_CP013709	Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence	100389-100424	2	0.944
NC_017299_7	7.3\|2333272\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333272-2333307	36	NZ_CP013682	Clostridium botulinum strain 1169 plasmid pRSJ8_1, complete sequence	102721-102756	2	0.944
NC_017299_7	7.3\|2333272\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333272-2333307	36	NZ_CP013295	Clostridium botulinum strain CDC_54064 plasmid pNPD1_1, complete sequence	113437-113472	2	0.944
NC_017299_7	7.3\|2333272\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333272-2333307	36	NZ_CP013844	Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence	145826-145861	2	0.944
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NZ_CP006909	Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence	263676-263711	2	0.944
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	22954-22989	2	0.944
NC_017299_7	7.8\|2333603\|36\|NC_017299\|CRT,PILER-CR,CRISPRCasFinder	2333603-2333638	36	NZ_CP013700	Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence	32871-32906	2	0.944
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP045607	Bacillus cereus strain SB1 plasmid p1, complete sequence	487812-487841	2	0.933
NC_017299_6	6.3\|2319975\|36\|NC_017299\|CRISPRCasFinder	2319975-2320010	36	NZ_CP031095	Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence	1711-1746	3	0.917
NC_017299_6	6.3\|2319975\|36\|NC_017299\|CRISPRCasFinder	2319975-2320010	36	NZ_CP013700	Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence	156752-156787	3	0.917
NC_017299_6	6.3\|2319975\|36\|NC_017299\|CRISPRCasFinder	2319975-2320010	36	NC_012654	Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence	110413-110448	3	0.917
NC_017299_6	6.3\|2319975\|36\|NC_017299\|CRISPRCasFinder	2319975-2320010	36	NC_010379	Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence	23508-23543	3	0.917
NC_017299_6	6.6\|2319985\|36\|NC_017299\|PILER-CR	2319985-2320020	36	NZ_CP031095	Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence	1711-1746	3	0.917
NC_017299_6	6.6\|2319985\|36\|NC_017299\|PILER-CR	2319985-2320020	36	NZ_CP013700	Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence	156752-156787	3	0.917
NC_017299_6	6.6\|2319985\|36\|NC_017299\|PILER-CR	2319985-2320020	36	NC_012654	Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence	110413-110448	3	0.917
NC_017299_6	6.6\|2319985\|36\|NC_017299\|PILER-CR	2319985-2320020	36	NC_010379	Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence	23508-23543	3	0.917
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	NZ_CP023496	Staphylococcus simulans strain FDAARGOS_383 plasmid unnamed, complete sequence	119840-119867	4	0.857
NC_017299_4	4.2\|2312954\|37\|NC_017299\|CRISPRCasFinder	2312954-2312990	37	NZ_CP020425	Clostridioides difficile strain FDAARGOS_267 plasmid unnamed1, complete sequence	44200-44236	5	0.865
NC_017299_4	4.2\|2312954\|37\|NC_017299\|CRISPRCasFinder	2312954-2312990	37	FN668942	Clostridium difficile BI1 plasmid pCDBI1, complete sequence	42934-42970	5	0.865
NC_017299_4	4.2\|2312954\|37\|NC_017299\|CRISPRCasFinder	2312954-2312990	37	NZ_CP011969	Clostridioides difficile ATCC 9689 = DSM 1296 plasmid unnamed, complete sequence	39522-39558	5	0.865
NC_017299_4	4.2\|2312954\|37\|NC_017299\|CRISPRCasFinder	2312954-2312990	37	NZ_CP029156	Clostridioides difficile strain CD161 plasmid unnamed2, complete sequence	3-39	5	0.865
NC_017299_4	4.2\|2312954\|37\|NC_017299\|CRISPRCasFinder	2312954-2312990	37	NZ_CP029153	Clostridioides difficile strain CDT4 plasmid unnamed1, complete sequence	42640-42676	5	0.865
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP011350	Bacillus thuringiensis strain YC-10 plasmid pYC1, complete sequence	34022-34051	5	0.833
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP004877	Bacillus thuringiensis serovar kurstaki str. HD-1 plasmid pBMB431, complete sequence	373788-373817	5	0.833
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP004860	Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB422, complete sequence	385449-385478	5	0.833
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP053953	Bacillus cereus strain FDAARGOS_798 plasmid unnamed2, complete sequence	257625-257654	5	0.833
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP010090	Bacillus thuringiensis serovar galleriae strain 4G5 plasmid pBMB426, complete sequence	387720-387749	5	0.833
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP053950	Bacillus cereus strain FDAARGOS_799 plasmid unnamed2, complete sequence	151872-151901	5	0.833
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_CP007616	Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB400, complete sequence	409186-409215	5	0.833
NC_017299_3	3.4\|2310694\|34\|NC_017299\|CRISPRCasFinder	2310694-2310727	34	NC_021292	Vibrio parahaemolyticus strain v110 plasmid, complete sequence	3251-3284	6	0.824
NC_017299_3	3.4\|2310694\|34\|NC_017299\|CRISPRCasFinder	2310694-2310727	34	NC_011797	Vibrio fluvialis strain BD146 plasmid pBD146, complete sequence	6811-6844	6	0.824
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	LC168164	Tenacibaculum phage pT24 DNA, complete genome	36142-36169	6	0.786
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	NZ_CP013700	Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence	218170-218197	6	0.786
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	NZ_CP045269	Bacillus megaterium strain FDU301 plasmid pFDU301G, complete sequence	18092-18119	6	0.786
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	NZ_CP013684	Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence	219024-219051	6	0.786
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	MN694464	Marine virus AFVG_250M526, complete genome	21991-22018	6	0.786
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	MN694042	Marine virus AFVG_250M538, complete genome	31267-31294	6	0.786
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MG264739	UNVERIFIED: Enterococcus phage phiNASRA1, complete genome	23423-23452	6	0.8
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MG264739	UNVERIFIED: Enterococcus phage phiNASRA1, complete genome	23399-23428	6	0.8
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MN855763	Myoviridae sp. isolate 210, complete genome	165195-165224	6	0.8
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MG264739	UNVERIFIED: Enterococcus phage phiNASRA1, complete genome	23399-23428	6	0.8
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NC_042040	Rhodococcus phage Trina, complete genome	128989-129018	6	0.8
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MN855763	Myoviridae sp. isolate 210, complete genome	165195-165224	6	0.8
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MT778839	Rhizobium phage P9VFCI, complete genome	101804-101833	6	0.8
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	NZ_CP041977	Bacillus pacificus strain NCCP 15909 plasmid unnamed2, complete sequence	6280-6307	7	0.75
NC_017299_6	6.2\|2319918\|28\|NC_017299\|CRISPRCasFinder	2319918-2319945	28	NC_018499	Bacillus cereus FRI-35 plasmid p03, complete sequence	13127-13154	7	0.75
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MK605246	Nodularia phage vB_NspS-kac68v162, complete genome	17947-17976	7	0.767
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MK605244	Nodularia phage vB_NspS-kac65v162, complete genome	16693-16722	7	0.767
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	KU230356	Bacteriophage vB_NpeS-2AV2, complete genome	16530-16559	7	0.767
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MK605242	Nodularia phage vB_NspS-kac65v151, complete genome	16694-16723	7	0.767
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	NC_048757	Nodularia phage vB_NspS-kac68v161, complete genome	17848-17877	7	0.767
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MK605243	Nodularia phage vB_NspS-kac65v161, complete genome	16694-16723	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_KY303941	Enterococcus faecalis strain 3 plasmid pGTC3, complete sequence	22282-22311	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NZ_AP018540	Enterococcus faecalis strain KUB3006 plasmid pKUB3006-2, complete sequence	24475-24504	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MT074461	Salmonella phage smaug, complete genome	104173-104202	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MT074447	Salmonella phage phagemcphageface, complete genome	95963-95992	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NC_010856	Candidatus Phytoplasma australiense plasmid pPASb11, complete sequence	1277-1306	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	CP019598	Staphylococcus cohnii strain SNUDS-2 plasmid pSC-SNUDS-2-1, complete sequence	29193-29222	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MH707430	Bacillus phage BSP7, complete genome	30322-30351	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NC_009130	Staphylococcus sp. 693-2 plasmid pLEW6932, complete sequence	45009-45038	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MT778837	Rhizobium phage AF3, complete genome	83564-83593	7	0.767
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NC_025429	Rhizobium phage vB_RleM_P10VF, complete genome	70566-70595	7	0.767
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	MH884508	Bacillus phage vB_BcoS-136, complete genome	8277-8306	8	0.733
NC_017299_9	9.1\|2446916\|30\|NC_017299\|CRT	2446916-2446945	30	KP942676	Pectobacterium carotovorum plasmid Drgb1, complete sequence	100833-100862	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MT119359	Enterococcus phage heks, complete genome	10737-10766	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MK125140	Enterococcus phage Nonaheksakonda, complete genome	6254-6283	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MT774409	CrAssphage cr131_1, complete genome	26293-26322	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MN549360	Rhizobium phage RL38J1, complete genome	18881-18910	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NC_019775	Anabaena cylindrica PCC 7122 plasmid pANACY.06, complete sequence	19857-19886	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MK605246	Nodularia phage vB_NspS-kac68v162, complete genome	95907-95936	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MK605244	Nodularia phage vB_NspS-kac65v162, complete genome	94581-94610	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	KU230356	Bacteriophage vB_NpeS-2AV2, complete genome	91288-91317	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MK605242	Nodularia phage vB_NspS-kac65v151, complete genome	94258-94287	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	NC_048757	Nodularia phage vB_NspS-kac68v161, complete genome	97300-97329	8	0.733
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MK605243	Nodularia phage vB_NspS-kac65v161, complete genome	94292-94321	8	0.733
NC_017299_4	4.1\|2312890\|34\|NC_017299\|CRISPRCasFinder	2312890-2312923	34	NZ_CP029455	Bacillus cereus strain FORC087 plasmid pFORC087.1, complete sequence	437444-437477	9	0.735
NC_017299_4	4.1\|2312890\|34\|NC_017299\|CRISPRCasFinder	2312890-2312923	34	NZ_CP016590	Bacillus thuringiensis strain KNU-07 plasmid pBTKNU07-02, complete sequence	113232-113265	9	0.735
NC_017299_9	9.3\|2447000\|30\|NC_017299\|CRT	2447000-2447029	30	MK047642	Phage NG55, complete genome	25164-25193	9	0.7
NC_017299_1	1.1\|848655\|43\|NC_017299\|CRISPRCasFinder	848655-848697	43	KM983327	Clostridium phage phiCT453A, complete genome	6301-6343	12	0.721

1. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 0, identity: 1.0

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatattacaaaagaagttagaaaatcatac	Protospacer
************************************

2. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 0, identity: 1.0

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatattacaaaagaagttagaaaatcatac	Protospacer
************************************

3. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 0, identity: 1.0

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatattacaaaagaagttagaaaatcatac	Protospacer
************************************

4. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NC_025146 (Clostridium botulinum plasmid pCB111 DNA, complete sequence, strain: 111) position: , mismatch: 0, identity: 1.0

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatattacaaaagaagttagaaaatcatac	Protospacer
************************************

5. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 1, identity: 0.972

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatattacaaaagaagttagaaaatcataa	Protospacer
***********************************

6. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 1, identity: 0.972

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatattacaaaagaagttagaaaatcataa	Protospacer
***********************************

7. spacer 3.1|2310692|36|NC_017299|PILER-CR matches to NZ_CP013709 (Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence) position: , mismatch: 2, identity: 0.944

gtaggtggaaaaggtgcaaaaggtggagtaaactta	CRISPR spacer
gtaggtggcaaaggtgcaaaaggtggagtaaacttt	Protospacer
******** **************************

8. spacer 3.1|2310692|36|NC_017299|PILER-CR matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 2, identity: 0.944

gtaggtggaaaaggtgcaaaaggtggagtaaactta	CRISPR spacer
gtaggtggcaaaggtgcaaaaggtggagtaaacttt	Protospacer
******** **************************

9. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NZ_CP013709 (Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence) position: , mismatch: 2, identity: 0.941

aggtggaaaaggtgcaaaaggtggagtaaactta	CRISPR spacer
aggtggcaaaggtgcaaaaggtggagtaaacttt	Protospacer
****** **************************

10. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 2, identity: 0.941

aggtggaaaaggtgcaaaaggtggagtaaactta	CRISPR spacer
aggtggcaaaggtgcaaaaggtggagtaaacttt	Protospacer
****** **************************

11. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 2, identity: 0.944

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaagggagataatc	Protospacer
 **********************************

12. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 2, identity: 0.944

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaagggagacaatg	Protospacer
 ******************************.****

13. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 2, identity: 0.944

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaagggagataatc	Protospacer
 **********************************

14. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 2, identity: 0.944

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaagggagacaatg	Protospacer
 ******************************.****

15. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013709 (Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence) position: , mismatch: 2, identity: 0.944

atttatagaagatggtacatatacaattatttattg	CRISPR spacer
atttatagaggatggtacatatacaattatctattg	Protospacer
*********.********************.*****

16. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013682 (Clostridium botulinum strain 1169 plasmid pRSJ8_1, complete sequence) position: , mismatch: 2, identity: 0.944

atttatagaagatggtacatatacaattatttattg	CRISPR spacer
atttatagaggatggtacatatacaattatctattg	Protospacer
*********.********************.*****

17. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013295 (Clostridium botulinum strain CDC_54064 plasmid pNPD1_1, complete sequence) position: , mismatch: 2, identity: 0.944

atttatagaagatggtacatatacaattatttattg	CRISPR spacer
atttatagaggatggtacatatacaattatctattg	Protospacer
*********.********************.*****

18. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 2, identity: 0.944

atttatagaagatggtacatatacaattatttattg	CRISPR spacer
atttatagaggatggtacatatacaattatctattg	Protospacer
*********.********************.*****

19. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 2, identity: 0.944

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatactacaaaagaagttagaaaataatac	Protospacer
**********.******************** ****

20. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 2, identity: 0.944

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatactacaaaaaaagttagaaaatcatac	Protospacer
**********.*******.*****************

21. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 2, identity: 0.944

tatattaatattacaaaagaagttagaaaatcatac	CRISPR spacer
tatattaatactacaaaagaagttagaaaataatac	Protospacer
**********.******************** ****

22. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP045607 (Bacillus cereus strain SB1 plasmid p1, complete sequence) position: , mismatch: 2, identity: 0.933

tggtttatcttctggtttatcctctggttt	CRISPR spacer
tggtttttcttctggtttttcctctggttt	Protospacer
****** *********** ***********

23. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaaggtagataatc	Protospacer
 ************************** *******

24. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaggcaggtaagggagataata	Protospacer
 ***************.******************.

25. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaaggtagataatc	Protospacer
 ************************** *******

26. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggcaagggagacaatg	Protospacer
 *********************.********.****

27. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaaggtagataatc	Protospacer
 ************************** *******

28. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaggcaggtaagggagataata	Protospacer
 ***************.******************.

29. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggtaaggtagataatc	Protospacer
 ************************** *******

30. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.917

caggatattcaatagaagcaggtaagggagataatg	CRISPR spacer
aaggatattcaatagaagcaggcaagggagacaatg	Protospacer
 *********************.********.****

31. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP023496 (Staphylococcus simulans strain FDAARGOS_383 plasmid unnamed, complete sequence) position: , mismatch: 4, identity: 0.857

tattttctattcttaactctttatcttc	CRISPR spacer
tattttcttttcttaactcattatcatt	Protospacer
******** ********** ***** *.

32. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP020425 (Clostridioides difficile strain FDAARGOS_267 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.865

ctagaactgattttgacaaatatgtagaccatgctat	CRISPR spacer
ctagaactgattttgataaatatatagaccatatgat	Protospacer
****************.******.********.. **

33. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to FN668942 (Clostridium difficile BI1 plasmid pCDBI1, complete sequence) position: , mismatch: 5, identity: 0.865

ctagaactgattttgacaaatatgtagaccatgctat	CRISPR spacer
ctagaactgattttgataaatatatagaccatatgat	Protospacer
****************.******.********.. **

34. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP011969 (Clostridioides difficile ATCC 9689 = DSM 1296 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.865

ctagaactgattttgacaaatatgtagaccatgctat	CRISPR spacer
ctagaactgattttgataaatatatagaccatatgat	Protospacer
****************.******.********.. **

35. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP029156 (Clostridioides difficile strain CD161 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.865

ctagaactgattttgacaaatatgtagaccatgctat	CRISPR spacer
ctagaactgattttgataaatatatagaccatatgat	Protospacer
****************.******.********.. **

36. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP029153 (Clostridioides difficile strain CDT4 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.865

ctagaactgattttgacaaatatgtagaccatgctat	CRISPR spacer
ctagaactgattttgataaatatatagaccatatgat	Protospacer
****************.******.********.. **

37. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP011350 (Bacillus thuringiensis strain YC-10 plasmid pYC1, complete sequence) position: , mismatch: 5, identity: 0.833

tggttta---tcttctggtttatcctctggttt	CRISPR spacer
---tttaggctgttctggtttttcctctggttt	Protospacer
   ****   * ********* ***********

38. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP004877 (Bacillus thuringiensis serovar kurstaki str. HD-1 plasmid pBMB431, complete sequence) position: , mismatch: 5, identity: 0.833

tggttta---tcttctggtttatcctctggttt	CRISPR spacer
---tttaggctgttctggtttttcctctggttt	Protospacer
   ****   * ********* ***********

39. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP004860 (Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB422, complete sequence) position: , mismatch: 5, identity: 0.833

tggttta---tcttctggtttatcctctggttt	CRISPR spacer
---tttaggctgttctggtttttcctctggttt	Protospacer
   ****   * ********* ***********

40. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP053953 (Bacillus cereus strain FDAARGOS_798 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.833

tggttta---tcttctggtttatcctctggttt	CRISPR spacer
---tttaggctgttctggtttttcctctggttt	Protospacer
   ****   * ********* ***********

41. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP010090 (Bacillus thuringiensis serovar galleriae strain 4G5 plasmid pBMB426, complete sequence) position: , mismatch: 5, identity: 0.833

tggttta---tcttctggtttatcctctggttt	CRISPR spacer
---tttaggctgttctggtttttcctctggttt	Protospacer
   ****   * ********* ***********

42. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP053950 (Bacillus cereus strain FDAARGOS_799 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.833

tggttta---tcttctggtttatcctctggttt	CRISPR spacer
---tttaggctgttctggtttttcctctggttt	Protospacer
   ****   * ********* ***********

43. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP007616 (Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB400, complete sequence) position: , mismatch: 5, identity: 0.833

tggttta---tcttctggtttatcctctggttt	CRISPR spacer
---tttaggctgttctggtttttcctctggttt	Protospacer
   ****   * ********* ***********

44. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NC_021292 (Vibrio parahaemolyticus strain v110 plasmid, complete sequence) position: , mismatch: 6, identity: 0.824

aggtggaaaaggtgcaaaaggtgga-gtaaactta	CRISPR spacer
gggtggaaaagtttcaaaaggtggaggtagacct-	Protospacer
.********** * *********** ***.**.*

45. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NC_011797 (Vibrio fluvialis strain BD146 plasmid pBD146, complete sequence) position: , mismatch: 6, identity: 0.824

aggtggaaaaggtgcaaaaggtgga-gtaaactta	CRISPR spacer
gggtggaaaagtttcaaaaggtggaggtagacct-	Protospacer
.********** * *********** ***.**.*

46. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to LC168164 (Tenacibaculum phage pT24 DNA, complete genome) position: , mismatch: 6, identity: 0.786

tattttctattcttaactctttatcttc	CRISPR spacer
tattttctattctttattctttattagt	Protospacer
************** *.*******.  .

47. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 6, identity: 0.786

tattttctattcttaactctttatcttc	CRISPR spacer
ctttttctattgttaactctttaatatc	Protospacer
. ********* *********** . **

48. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP045269 (Bacillus megaterium strain FDU301 plasmid pFDU301G, complete sequence) position: , mismatch: 6, identity: 0.786

tattttctattcttaactctttatcttc	CRISPR spacer
gattttctcttcttaactctttggtatc	Protospacer
 ******* *************. . **

49. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 6, identity: 0.786

tattttctattcttaactctttatcttc	CRISPR spacer
ctttttctattgttaactctttaatatc	Protospacer
. ********* *********** . **

50. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to MN694464 (Marine virus AFVG_250M526, complete genome) position: , mismatch: 6, identity: 0.786

tattttctattcttaactctttatcttc	CRISPR spacer
gggtttcgattcttaactctctatctac	Protospacer
 . **** ************.***** *

51. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to MN694042 (Marine virus AFVG_250M538, complete genome) position: , mismatch: 6, identity: 0.786

tattttctattcttaactctttatcttc	CRISPR spacer
ttctttcttttcttaactctttaactat	Protospacer
* .***** ************** ** .

52. spacer 9.1|2446916|30|NC_017299|CRT matches to MG264739 (UNVERIFIED: Enterococcus phage phiNASRA1, complete genome) position: , mismatch: 6, identity: 0.8

tggtttatcctctggtttatcctctggctt	CRISPR spacer
tggtttctcctctggtttctcctcatcttt	Protospacer
****** *********** *****   .**

53. spacer 9.1|2446916|30|NC_017299|CRT matches to MG264739 (UNVERIFIED: Enterococcus phage phiNASRA1, complete genome) position: , mismatch: 6, identity: 0.8

tggtttatcctctggtttatcctctggctt	CRISPR spacer
aggctcttcctctggtttctcctctggttt	Protospacer
 **.*. *********** ********.**

54. spacer 9.1|2446916|30|NC_017299|CRT matches to MN855763 (Myoviridae sp. isolate 210, complete genome) position: , mismatch: 6, identity: 0.8

tggtttatcctctggtttatcctctggctt	CRISPR spacer
tttcttatcttctggtttatcttctggctc	Protospacer
*  .*****.***********.*******.

55. spacer 9.3|2447000|30|NC_017299|CRT matches to MG264739 (UNVERIFIED: Enterococcus phage phiNASRA1, complete genome) position: , mismatch: 6, identity: 0.8

tggtttatcttctggtttatcctctggttt	CRISPR spacer
aggctcttcctctggtttctcctctggttt	Protospacer
 **.*. **.******** ***********

56. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_042040 (Rhodococcus phage Trina, complete genome) position: , mismatch: 6, identity: 0.8

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctttctatcttctggtttatcccctggtat	Protospacer
.  *.*****************.***** *

57. spacer 9.3|2447000|30|NC_017299|CRT matches to MN855763 (Myoviridae sp. isolate 210, complete genome) position: , mismatch: 6, identity: 0.8

tggtttatcttctggtttatcctctggttt	CRISPR spacer
tttcttatcttctggtttatcttctggctc	Protospacer
*  .*****************.*****.*.

58. spacer 9.3|2447000|30|NC_017299|CRT matches to MT778839 (Rhizobium phage P9VFCI, complete genome) position: , mismatch: 6, identity: 0.8

--tggtttatcttctggtttatcctctggttt	CRISPR spacer
atcgg--aatcttctggtttatccactggttc	Protospacer
  .**   **************** ******.

59. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP041977 (Bacillus pacificus strain NCCP 15909 plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.75

tattttctattcttaactctttatcttc	CRISPR spacer
gattttctatttttaactttttatacaa	Protospacer
 **********.******.***** .

60. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NC_018499 (Bacillus cereus FRI-35 plasmid p03, complete sequence) position: , mismatch: 7, identity: 0.75

tattttctattcttaactctttatcttc	CRISPR spacer
gattttctatttttaactttttatacaa	Protospacer
 **********.******.***** .

61. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605246 (Nodularia phage vB_NspS-kac68v162, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcctctggtttatcctctggctt	CRISPR spacer
cagtttatcctctagtttatccttttcttt	Protospacer
..***********.*********.*  .**

62. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605244 (Nodularia phage vB_NspS-kac65v162, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcctctggtttatcctctggctt	CRISPR spacer
cagtttatcctctagtttatccttttcttt	Protospacer
..***********.*********.*  .**

63. spacer 9.1|2446916|30|NC_017299|CRT matches to KU230356 (Bacteriophage vB_NpeS-2AV2, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcctctggtttatcctctggctt	CRISPR spacer
cagtttatcctctagtttatccttttcttt	Protospacer
..***********.*********.*  .**

64. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605242 (Nodularia phage vB_NspS-kac65v151, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcctctggtttatcctctggctt	CRISPR spacer
cagtttatcctctagtttatccttttcttt	Protospacer
..***********.*********.*  .**

65. spacer 9.1|2446916|30|NC_017299|CRT matches to NC_048757 (Nodularia phage vB_NspS-kac68v161, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcctctggtttatcctctggctt	CRISPR spacer
cagtttatcctctagtttatccttttcttt	Protospacer
..***********.*********.*  .**

66. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605243 (Nodularia phage vB_NspS-kac65v161, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcctctggtttatcctctggctt	CRISPR spacer
cagtttatcctctagtttatccttttcttt	Protospacer
..***********.*********.*  .**

67. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_KY303941 (Enterococcus faecalis strain 3 plasmid pGTC3, complete sequence) position: , mismatch: 7, identity: 0.767

tggtt--tatcttctggtttatcctctggttt	CRISPR spacer
--attagaatcttctggttcatcctctggtgg	Protospacer
  .**   ***********.**********

68. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_AP018540 (Enterococcus faecalis strain KUB3006 plasmid pKUB3006-2, complete sequence) position: , mismatch: 7, identity: 0.767

tggtt--tatcttctggtttatcctctggttt	CRISPR spacer
--attagaatcttcttgtttatcctctggtgg	Protospacer
  .**   ******* **************

69. spacer 9.3|2447000|30|NC_017299|CRT matches to MT074461 (Salmonella phage smaug, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcttctggtttatcctctggttt	CRISPR spacer
tgcttaatcttctggtttatcctccaggaa	Protospacer
** ** ******************..*

70. spacer 9.3|2447000|30|NC_017299|CRT matches to MT074447 (Salmonella phage phagemcphageface, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcttctggtttatcctctggttt	CRISPR spacer
tgcttaatcttctggtttatcctccaggaa	Protospacer
** ** ******************..*

71. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_010856 (Candidatus Phytoplasma australiense plasmid pPASb11, complete sequence) position: , mismatch: 7, identity: 0.767

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ttgtttatcttctgttttatcttcttttgg	Protospacer
* ************ ******.***  *

72. spacer 9.3|2447000|30|NC_017299|CRT matches to CP019598 (Staphylococcus cohnii strain SNUDS-2 plasmid pSC-SNUDS-2-1, complete sequence) position: , mismatch: 7, identity: 0.767

tggtttatcttctggtttatcctctggttt---	CRISPR spacer
gggtttatcttctggtttaccc---aattttaa	Protospacer
 ******************.**   ..***

73. spacer 9.3|2447000|30|NC_017299|CRT matches to MH707430 (Bacillus phage BSP7, complete genome) position: , mismatch: 7, identity: 0.767

tggtttatcttctggtttatcctctggttt	CRISPR spacer
agctgcttcttcttgtttagcctctggttt	Protospacer
 * * . ****** ***** **********

74. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_009130 (Staphylococcus sp. 693-2 plasmid pLEW6932, complete sequence) position: , mismatch: 7, identity: 0.767

tggtttatcttctggtttatcctctggttt---	CRISPR spacer
gggtttatcttctggtttaccc---aattttaa	Protospacer
 ******************.**   ..***

75. spacer 9.3|2447000|30|NC_017299|CRT matches to MT778837 (Rhizobium phage AF3, complete genome) position: , mismatch: 7, identity: 0.767

--tggtttatcttctggtttatcctctggttt	CRISPR spacer
atcgg--aatcttctggttcatccactggttc	Protospacer
  .**   ***********.**** ******.

76. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_025429 (Rhizobium phage vB_RleM_P10VF, complete genome) position: , mismatch: 7, identity: 0.767

--tggtttatcttctggtttatcctctggttt	CRISPR spacer
atcgg--aatcttctggttcatccactggttc	Protospacer
  .**   ***********.**** ******.

77. spacer 9.1|2446916|30|NC_017299|CRT matches to MH884508 (Bacillus phage vB_BcoS-136, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcctctggtttatcctctggctt	CRISPR spacer
ctatttatcctctggtttatactctaattc	Protospacer
. .***************** ****...*.

78. spacer 9.1|2446916|30|NC_017299|CRT matches to KP942676 (Pectobacterium carotovorum plasmid Drgb1, complete sequence) position: , mismatch: 8, identity: 0.733

tggtttatcctctggtttatcctctggctt	CRISPR spacer
cattcactactctggtttatcttctggctt	Protospacer
.. *.  * ************.********

79. spacer 9.3|2447000|30|NC_017299|CRT matches to MT119359 (Enterococcus phage heks, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctctccatcttttggtttatcctctgtttg	Protospacer
.  *..*****.************** **

80. spacer 9.3|2447000|30|NC_017299|CRT matches to MK125140 (Enterococcus phage Nonaheksakonda, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctctccatcttttggtttatcctctgtttg	Protospacer
.  *..*****.************** **

81. spacer 9.3|2447000|30|NC_017299|CRT matches to MT774409 (CrAssphage cr131_1, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
aggtttatctgctggtttatcatcatcctc	Protospacer
 ********* ********** **   .*.

82. spacer 9.3|2447000|30|NC_017299|CRT matches to MN549360 (Rhizobium phage RL38J1, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
atcgtgatcttctggttcatccactggttc	Protospacer
    * ***********.**** ******.

83. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_019775 (Anabaena cylindrica PCC 7122 plasmid pANACY.06, complete sequence) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
cttatcatcttctggtttatcgtctgggta	Protospacer
.   *.*************** ***** *

84. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605246 (Nodularia phage vB_NspS-kac68v162, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctcctcttcttcagttttatcctctggttt	Protospacer
.  .*. ***** * ***************

85. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605244 (Nodularia phage vB_NspS-kac65v162, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctcctcttcttcagttttatcctctggttt	Protospacer
.  .*. ***** * ***************

86. spacer 9.3|2447000|30|NC_017299|CRT matches to KU230356 (Bacteriophage vB_NpeS-2AV2, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctcctcttcttcagttttatcctctggttt	Protospacer
.  .*. ***** * ***************

87. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605242 (Nodularia phage vB_NspS-kac65v151, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctcctcttcttcagttttatcctctggttt	Protospacer
.  .*. ***** * ***************

88. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_048757 (Nodularia phage vB_NspS-kac68v161, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctcctcttcttcagttttatcctctggttt	Protospacer
.  .*. ***** * ***************

89. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605243 (Nodularia phage vB_NspS-kac65v161, complete genome) position: , mismatch: 8, identity: 0.733

tggtttatcttctggtttatcctctggttt	CRISPR spacer
ctcctcttcttcagttttatcctctggttt	Protospacer
.  .*. ***** * ***************

90. spacer 4.1|2312890|34|NC_017299|CRISPRCasFinder matches to NZ_CP029455 (Bacillus cereus strain FORC087 plasmid pFORC087.1, complete sequence) position: , mismatch: 9, identity: 0.735

tttatatgaaaggaatagatataagtatgcataa	CRISPR spacer
ttaatataaaaggaatagatataatattttttag	Protospacer
** ****.****************   * . **.

91. spacer 4.1|2312890|34|NC_017299|CRISPRCasFinder matches to NZ_CP016590 (Bacillus thuringiensis strain KNU-07 plasmid pBTKNU07-02, complete sequence) position: , mismatch: 9, identity: 0.735

tttatatgaaaggaatagatataagtatgcataa	CRISPR spacer
ttaatataaaaggaatagatataatattttttag	Protospacer
** ****.****************   * . **.

92. spacer 9.3|2447000|30|NC_017299|CRT matches to MK047642 (Phage NG55, complete genome) position: , mismatch: 9, identity: 0.7

tggtttatcttctggtttatcctctggttt	CRISPR spacer
atctttatcttctggttcatcatctgtcgc	Protospacer
   **************.*** **** . .

93. spacer 1.1|848655|43|NC_017299|CRISPRCasFinder matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 12, identity: 0.721

tttaaattttgaattaaattctgctgtaattttcataattttt	CRISPR spacer
ctcctcactactattaaattctgctgtaattttcatatttatt	Protospacer
.*.    .*   ************************* ** **

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

188147 : 197750

Clostridium_phage(33.33%)

protease

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014519502.1\|188147_189224_+	stage II sporulation protein D	Q2XU88	Pseudomonas_phage	3.4e-36	37.2
WP_014519503.1\|189809_190532_+	M23 family metallopeptidase	NA	NA	NA	NA
WP_003356559.1\|190639_190894_+	sporulation transcriptional regulator SpoIIID	M9Q261	Clostridium_phage	3.3e-19	60.0
WP_003356149.1\|190993_192022_+	rod shape-determining protein	NA	NA	NA	NA
WP_014519504.1\|192146_192671_-\|protease	spore protease YyaC	A0A0A8WIQ6	Clostridium_phage	5.5e-32	44.6
WP_014519505.1\|192719_193442_-	hypothetical protein	A0A0U2S5Z2	Escherichia_phage	2.1e-29	34.6
WP_012343331.1\|194149_195325_+	methionine adenosyltransferase	A0A2H4PQS6	Staphylococcus_phage	9.7e-154	71.2
WP_014519506.1\|195515_197750_+	ATP-dependent RecD-like DNA helicase	A0A218KCE8	Bacillus_phage	1.8e-76	32.2

DBSCAN-SWA_2

699366 : 732082

Lactococcus_phage(25.0%)

protease,transposase,integrase

attL 707159:707175|attR 736487:736503

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_162470373.1\|699366_700152_-\|transposase	transposase family protein	A0A059NT83	Lactococcus_phage	1.6e-19	33.8
WP_014519810.1\|700422_700617_+	hypothetical protein	NA	NA	NA	NA
WP_014519811.1\|700594_700759_+	hypothetical protein	NA	NA	NA	NA
WP_041926527.1\|701056_701365_+	hypothetical protein	NA	NA	NA	NA
WP_139369702.1\|702200_702452_+	hypothetical protein	NA	NA	NA	NA
WP_139369695.1\|702526_703063_+\|transposase	transposase	NA	NA	NA	NA
WP_139369696.1\|703084_703327_+	hypothetical protein	NA	NA	NA	NA
WP_041926529.1\|704097_704787_-	hypothetical protein	NA	NA	NA	NA
WP_079007346.1\|705559_705817_-	IS66 family insertion sequence element accessory protein TnpB	NA	NA	NA	NA
WP_014519816.1\|706289_706445_-	hypothetical protein	NA	NA	NA	NA
WP_014519817.1\|706555_707311_-	flavodoxin family protein	NA	NA	NA	NA
707159:707175	attL	NA	NA	NA	NA
WP_014519818.1\|707321_709502_-	ATP-binding cassette domain-containing protein	W8CYL7	Bacillus_phage	3.2e-25	26.1
WP_014519819.1\|710389_712534_-	ATP-binding cassette domain-containing protein	G3M9Y6	Bacillus_virus	2.5e-14	30.2
WP_014519820.1\|712549_713050_-	hypothetical protein	NA	NA	NA	NA
WP_014519821.1\|714138_714330_+	hypothetical protein	NA	NA	NA	NA
WP_014519822.1\|714363_714579_+	plantaricin C family lantibiotic	NA	NA	NA	NA
WP_158308769.1\|714884_717902_+	type 2 lantipeptide synthetase LanM	NA	NA	NA	NA
WP_158308770.1\|717962_720734_+	type 2 lantipeptide synthetase LanM	NA	NA	NA	NA
WP_041926654.1\|721025_721241_+\|transposase	transposase	NA	NA	NA	NA
WP_158308771.1\|721778_721970_+	hypothetical protein	NA	NA	NA	NA
WP_014519826.1\|722101_722998_+	ABC transporter ATP-binding protein	A0A2H4PQG7	Staphylococcus_phage	7.4e-45	44.4
WP_014519827.1\|723140_723884_+	ABC transporter permease	NA	NA	NA	NA
WP_014519828.1\|723904_724144_+	hypothetical protein	NA	NA	NA	NA
WP_041926530.1\|724166_724607_+	hypothetical protein	NA	NA	NA	NA
WP_079007347.1\|724799_724961_-\|integrase,transposase	DDE-type integrase/transposase/recombinase	NA	NA	NA	NA
WP_158308772.1\|725135_725294_-	hypothetical protein	NA	NA	NA	NA
WP_139369697.1\|725687_725792_-\|transposase	transposase	NA	NA	NA	NA
WP_014519833.1\|727599_728469_-	AraC family transcriptional regulator	NA	NA	NA	NA
WP_014519835.1\|728777_730031_+	dicarboxylate/amino acid:cation symporter	NA	NA	NA	NA
WP_014519836.1\|730606_731044_+	GNAT family N-acetyltransferase	NA	NA	NA	NA
WP_014519837.1\|731077_732082_+\|protease	CPBP family intramembrane metalloprotease	NA	NA	NA	NA
736487:736503	attR	NA	NA	NA	NA

DBSCAN-SWA_3

952809 : 964454

Clostridium_botulinum_D_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014520034.1\|952809_954690_-	botulinum neurotoxin hemagglutinin HA70 subunit	Q786X9	Clostridium_botulinum_D_phage	9.5e-236	66.9
WP_014520035.1\|954703_955144_-	hemagglutinin	Q786Y1	Clostridium_botulinum_D_phage	6.0e-48	63.7
WP_014520036.1\|955206_956091_-	ricin-type beta-trefoil lectin domain protein	Q38196	Clostridium_botulinum_phage	1.4e-40	36.5
WP_014520037.1\|956240_956777_+	botulinum neurotoxin transcription-activating sigma factor BotR	Q38195	Clostridium_botulinum_phage	1.2e-39	52.2
WP_014520038.1\|956938_960520_+	non-toxic nonhemagglutinin NTNH	Q332E1	Clostridium_botulinum_C_phage	0.0e+00	65.9
WP_014520039.1\|960563_964454_+	botulinum neurotoxin type A	Q332E0	Clostridium_botulinum_C_phage	2.3e-175	32.4

DBSCAN-SWA_4

1742686 : 1749751

uncultured_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014520616.1\|1742686_1743631_-	YafY family transcriptional regulator	A0A1B0RXM1	Streptococcus_phage	1.5e-11	28.9
WP_014520617.1\|1744253_1745249_+	2-hydroxyacyl-CoA dehydratase	NA	NA	NA	NA
WP_003358645.1\|1745365_1746127_+	2-hydroxyglutaryl-CoA dehydratase	NA	NA	NA	NA
WP_014520618.1\|1746144_1746576_+	6-carboxytetrahydropterin synthase QueD	A0A1U9WRB3	Streptococcus_virus	8.8e-12	31.6
WP_014520619.1\|1746577_1747243_+	putative 7-carboxy-7-deazaguanine synthase QueE	S4TZT1	uncultured_phage	1.1e-37	43.7
WP_014520620.1\|1747246_1747837_+	GTP cyclohydrolase I FolE	S4U0J3	uncultured_phage	2.7e-43	52.3
WP_014520621.1\|1748020_1748680_+	7-cyano-7-deazaguanine synthase QueC	A0A2H4J8Q7	uncultured_Caudovirales_phage	1.7e-59	51.2
WP_014520622.1\|1748794_1749751_+	chemotaxis protein	A0A2H4J162	uncultured_Caudovirales_phage	7.7e-16	33.5

DBSCAN-SWA_5

2449379 : 2473869

uncultured_Caudovirales_phage(66.67%)

tail,plate,terminase,capsid,portal

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014521137.1\|2449379_2449604_-	hemolysin XhlA family protein	A0A0A7RWP8	Clostridium_phage	2.2e-30	89.0
WP_014521138.1\|2449811_2450975_-	MerR family transcriptional regulator	NA	NA	NA	NA
WP_003360655.1\|2451192_2451315_-	XkdX family protein	A0A0A7S0E7	Clostridium_phage	5.3e-07	62.5
WP_014521139.1\|2451307_2451700_-	hypothetical protein	B6SBV4	Clostridium_virus	1.2e-07	38.7
WP_041926603.1\|2451732_2453448_-\|tail	phage tail protein	A0A0A7RTQ0	Clostridium_phage	1.4e-55	47.7
WP_012705217.1\|2453484_2454120_-	YmfQ family protein	A0A2H4J1P4	uncultured_Caudovirales_phage	5.0e-72	65.6
WP_014521141.1\|2454116_2455247_-\|plate	baseplate J/gp47 family protein	A0A2H4J7K8	uncultured_Caudovirales_phage	1.6e-124	63.0
WP_003385468.1\|2455252_2455705_-	DUF2634 domain-containing protein	A0A2H4J4Q8	uncultured_Caudovirales_phage	3.6e-64	75.7
WP_003385469.1\|2455697_2456030_-	hypothetical protein	A0A2H4J746	uncultured_Caudovirales_phage	6.3e-34	67.9
WP_014521142.1\|2456013_2456982_-	hypothetical protein	A0A2H4J063	uncultured_Caudovirales_phage	1.1e-113	63.7
WP_014521143.1\|2456983_2457637_-	LysM peptidoglycan-binding domain-containing protein	A0A2H4J045	uncultured_Caudovirales_phage	3.5e-60	70.1
WP_003385472.1\|2457705_2458218_-	hypothetical protein	A0A2H4J333	uncultured_Caudovirales_phage	5.0e-30	57.0
WP_014521144.1\|2458271_2461250_-\|tail	phage tail tape measure protein	A0A2H4J055	uncultured_Caudovirales_phage	3.5e-240	55.0
WP_003385475.1\|2461433_2461868_-	hypothetical protein	A0A2H4J883	uncultured_Caudovirales_phage	1.1e-54	74.8
WP_003385476.1\|2461891_2462302_-\|tail	phage tail tube protein	A0A2H4J032	uncultured_Caudovirales_phage	8.8e-62	86.5
WP_014521146.1\|2462314_2463721_-\|tail	phage tail sheath subtilisin-like domain-containing protein	A0A2H4J1N7	uncultured_Caudovirales_phage	8.7e-226	80.6
WP_014521147.1\|2463720_2463912_-	hypothetical protein	A0A2H4J7J8	uncultured_Caudovirales_phage	2.0e-16	71.0
WP_003385479.1\|2463922_2464744_-	hypothetical protein	A0A2H4J4Q0	uncultured_Caudovirales_phage	4.9e-120	74.7
WP_014521148.1\|2464746_2465154_-	hypothetical protein	A0A2H4J736	uncultured_Caudovirales_phage	2.4e-51	70.1
WP_012704063.1\|2465155_2465542_-	hypothetical protein	A0A2H4J057	uncultured_Caudovirales_phage	1.9e-42	65.4
WP_014521149.1\|2465542_2465863_-	hypothetical protein	A0A2H4J040	uncultured_Caudovirales_phage	1.0e-25	57.4
WP_003385482.1\|2465865_2466057_-	hypothetical protein	NA	NA	NA	NA
WP_012705425.1\|2466113_2467166_-\|capsid	major capsid protein	D9ZND6	Clostridium_phage	1.8e-87	50.6
WP_003385484.1\|2467179_2467572_-	hypothetical protein	NA	NA	NA	NA
WP_014521150.1\|2467592_2468207_-	phage scaffolding protein	A0A0A7RW68	Clostridium_phage	6.4e-24	35.3
WP_003385486.1\|2468273_2468417_-	hypothetical protein	A0A2H4J726	uncultured_Caudovirales_phage	3.8e-12	79.5
WP_014521151.1\|2468422_2470081_-	exonuclease SbcC	A0A2H4J048	uncultured_Caudovirales_phage	4.8e-191	63.8
WP_014521152.1\|2470080_2471607_-\|portal	phage portal protein	D9ZNC8	Clostridium_phage	1.2e-140	53.3
WP_014521153.1\|2471606_2472959_-\|terminase	PBSX family phage terminase large subunit	A0A0A7S0Q5	Clostridium_phage	1.2e-208	78.2
WP_014521154.1\|2472951_2473869_-\|terminase	terminase small subunit	A0A0A7RTY1	Clostridium_phage	2.7e-135	80.7

DBSCAN-SWA_6

2478528 : 2494617

Clostridium_phage(26.67%)

integrase

attL 2477081:2477095|attR 2503539:2503553

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
2477081:2477095	attL	NA	NA	NA	NA
WP_014521164.1\|2478528_2479521_-\|integrase	tyrosine-type recombinase/integrase	B6SCW8	Bacteriophage	2.8e-05	25.5
WP_014521167.1\|2480213_2480459_-	hypothetical protein	NA	NA	NA	NA
WP_014521168.1\|2480488_2480704_-	hypothetical protein	NA	NA	NA	NA
WP_014521169.1\|2480734_2481718_-	hypothetical protein	NA	NA	NA	NA
WP_012704046.1\|2481809_2482157_-	hypothetical protein	A0A0A7RTL9	Clostridium_phage	1.4e-28	57.0
WP_014521170.1\|2482243_2482648_-	hypothetical protein	NA	NA	NA	NA
WP_014521171.1\|2482635_2483058_-	DUF1064 domain-containing protein	A0A0A7RTV9	Clostridium_phage	2.6e-56	76.6
WP_014521172.1\|2483054_2483216_-	hypothetical protein	NA	NA	NA	NA
WP_014521173.1\|2483306_2483687_-	nucleotide pyrophosphohydrolase	R4T830	Halovirus	9.5e-10	46.3
WP_014521174.1\|2483686_2483929_-	AbrB/MazE/SpoVT family DNA-binding domain-containing protein	A0A0K2CZ86	Paenibacillus_phage	1.8e-14	50.6
WP_014521175.1\|2483931_2484237_-	hypothetical protein	NA	NA	NA	NA
WP_014521176.1\|2484266_2485262_-	sigma-70 family RNA polymerase sigma factor	A0A0A0RV91	Bacillus_phage	1.7e-05	22.6
WP_014521177.1\|2485274_2485508_-	hypothetical protein	A0A0A7RTQ4	Clostridium_phage	8.9e-11	42.2
WP_014521178.1\|2485526_2486330_-	ATP-binding protein	A0A2K9V3L7	Faecalibacterium_phage	4.3e-36	36.1
WP_014521179.1\|2486289_2487162_-	phage replisome organizer N-terminal domain-containing protein	Q7Y4K5	Streptococcus_phage	4.1e-40	41.2
WP_014521180.1\|2487184_2487484_-	hypothetical protein	NA	NA	NA	NA
WP_014521181.1\|2487577_2487754_-	hypothetical protein	NA	NA	NA	NA
WP_012721435.1\|2487769_2487916_-	hypothetical protein	NA	NA	NA	NA
WP_014521182.1\|2487918_2488803_-	recombinase RecT	A0A139ZPK0	Marinitoga_camini_virus	1.3e-41	45.3
WP_014521183.1\|2488815_2489865_-	YqaJ viral recombinase family protein	O48490	Bacillus_phage	7.9e-22	28.8
WP_014521184.1\|2489865_2490201_-	hypothetical protein	NA	NA	NA	NA
WP_014521185.1\|2490212_2491943_-	AAA family ATPase	R9TQJ2	Paenibacillus_phage	9.7e-102	39.6
WP_014521186.1\|2492069_2492228_-	hypothetical protein	NA	NA	NA	NA
WP_014521187.1\|2492555_2492747_+	hypothetical protein	NA	NA	NA	NA
WP_014521188.1\|2492902_2493688_-	phage antirepressor KilAC domain-containing protein	A0A0C5AEJ9	Bacteriophage	9.5e-81	62.1
WP_014521189.1\|2493741_2493975_-	helix-turn-helix domain-containing protein	A0A0B5A7F0	Streptococcus_phage	1.5e-05	42.4
WP_014521190.1\|2494152_2494617_+	helix-turn-helix transcriptional regulator	A0A0A8WE28	Clostridium_phage	7.5e-17	45.5
2503539:2503553	attR	NA	NA	NA	NA

DBSCAN-SWA_7

2694256 : 2737597

Clostridium_phage(60.47%)

tail,head,plate,transposase,terminase,capsid,portal

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014521301.1\|2694256_2694490_+	helix-turn-helix transcriptional regulator	A0A0A7RUG5	Clostridium_phage	4.7e-20	66.2
WP_014521302.1\|2694564_2694843_+	helix-turn-helix transcriptional regulator	A0A0A7S0F1	Clostridium_phage	3.0e-37	88.0
WP_014520407.1\|2694929_2695238_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_148265697.1\|2695373_2695589_+\|transposase	IS3 family transposase	NA	NA	NA	NA
WP_014521304.1\|2695666_2695981_+	hypothetical protein	A0A2I6AZV9	Macacine_betaherpesvirus	2.6e-05	44.4
WP_080019262.1\|2695970_2696117_+\|transposase	IS3 family transposase	NA	NA	NA	NA
WP_014521305.1\|2696193_2696439_-	hypothetical protein	NA	NA	NA	NA
WP_014521306.1\|2696455_2696644_-	hypothetical protein	A0A2H4J069	uncultured_Caudovirales_phage	7.7e-13	78.4
WP_014521307.1\|2697078_2697846_-	N-acetylmuramoyl-L-alanine amidase	A0A2H4J8A3	uncultured_Caudovirales_phage	9.3e-89	66.7
WP_014521308.1\|2697888_2698083_-	hypothetical protein	NA	NA	NA	NA
WP_014521310.1\|2698397_2698790_-	hypothetical protein	NA	NA	NA	NA
WP_014521311.1\|2698746_2698914_-	hypothetical protein	NA	NA	NA	NA
WP_014521312.1\|2699073_2699235_-	hypothetical protein	A0A0A8WJT8	Clostridium_phage	1.4e-10	62.0
WP_014521313.1\|2699234_2699603_-	hypothetical protein	A0A2H4J342	uncultured_Caudovirales_phage	9.5e-23	51.6
WP_014521315.1\|2700796_2701423_-	DUF2313 domain-containing protein	A0A0A7RVP9	Clostridium_phage	4.6e-86	75.6
WP_014521316.1\|2701403_2702498_-\|plate	baseplate J/gp47 family protein	A0A0A7S096	Clostridium_phage	4.6e-158	76.4
WP_014521317.1\|2702501_2702909_-	DUF2634 domain-containing protein	A0A0A7RTH1	Clostridium_phage	2.3e-54	83.1
WP_014521318.1\|2702911_2703256_-	DUF2577 domain-containing protein	A0A0A7RTJ2	Clostridium_phage	2.2e-37	74.6
WP_014521319.1\|2703258_2704233_-	hypothetical protein	A0A0A7RTZ4	Clostridium_phage	5.9e-157	84.6
WP_014521320.1\|2704244_2704925_-	LysM peptidoglycan-binding domain-containing protein	A0A0A7RVP5	Clostridium_phage	1.3e-94	74.8
WP_014521321.1\|2704925_2707085_-	hypothetical protein	A0A0A7S091	Clostridium_phage	1.8e-142	53.6
WP_014521322.1\|2707174_2707753_-	hypothetical protein	A0A0A7RTT9	Clostridium_phage	6.0e-56	56.6
WP_014521323.1\|2707993_2708407_-	hypothetical protein	A0A0A7RTN3	Clostridium_phage	1.1e-51	74.8
WP_014521324.1\|2708422_2708887_-\|tail	phage tail tube protein	A0A0A7RVP1	Clostridium_phage	8.4e-69	83.1
WP_014521325.1\|2708890_2710201_-\|tail	phage tail sheath subtilisin-like domain-containing protein	A0A0A7S087	Clostridium_phage	8.1e-210	84.6
WP_014521326.1\|2710202_2710373_-	hypothetical protein	A0A0A7RTV4	Clostridium_phage	1.2e-12	71.2
WP_014521327.1\|2710362_2710794_-	hypothetical protein	A0A0A7RTI2	Clostridium_phage	9.3e-54	76.9
WP_014521328.1\|2710795_2711287_-	HK97 gp10 family phage protein	A0A0A7RTT0	Clostridium_phage	8.1e-62	74.1
WP_041926696.1\|2711675_2712020_-\|head,tail	phage head-tail connector protein	A0A0A7RTX9	Clostridium_phage	3.2e-49	86.0
WP_014521330.1\|2712039_2713107_-	hypothetical protein	A0A0A7RTH8	Clostridium_phage	2.5e-180	88.5
WP_014521331.1\|2713129_2713699_-	phage scaffolding protein	A0A0A7RTM5	Clostridium_phage	9.2e-33	50.5
WP_014521332.1\|2713719_2713983_-	hypothetical protein	A0A0K2FMK5	Brevibacillus_phage	5.9e-19	52.7
WP_014521333.1\|2713999_2714368_-	hypothetical protein	A0A2H4J4N9	uncultured_Caudovirales_phage	1.6e-38	67.2
WP_014521334.1\|2714398_2714593_-	hypothetical protein	NA	NA	NA	NA
WP_014521335.1\|2714625_2716416_-\|capsid	minor capsid protein	A0A0A7RVY7	Clostridium_phage	6.4e-149	64.7
WP_014521336.1\|2716405_2717848_-\|portal	phage portal protein	A0A0A7S074	Clostridium_phage	5.9e-246	86.8
WP_014521337.1\|2717861_2719271_-\|terminase	phage terminase large subunit	A0A0A7RTS1	Clostridium_phage	6.7e-210	86.9
WP_014521338.1\|2719263_2719857_-\|terminase	terminase small subunit	U5PZD3	Bacillus_phage	3.2e-20	35.8
WP_014521339.1\|2719955_2720147_-	hypothetical protein	NA	NA	NA	NA
WP_014521340.1\|2720333_2720771_-	siderophore-interacting protein	A0A2H4J015	uncultured_Caudovirales_phage	5.2e-20	40.4
WP_041349352.1\|2721137_2721317_-	hypothetical protein	NA	NA	NA	NA
WP_041926698.1\|2723580_2723862_-	DUF1599 domain-containing protein	A0A2H4J4N1	uncultured_Caudovirales_phage	2.5e-31	79.3
WP_014521344.1\|2724387_2724537_-	hypothetical protein	NA	NA	NA	NA
WP_014521169.1\|2724639_2725623_-	hypothetical protein	NA	NA	NA	NA
WP_014521345.1\|2725722_2727417_-	hypothetical protein	A0A2H4J041	uncultured_Caudovirales_phage	7.6e-293	84.9
WP_014521346.1\|2727416_2727605_-	hypothetical protein	A0A0A7S0P6	Clostridium_phage	3.3e-16	65.0
WP_014521347.1\|2727656_2728115_-	DUF669 domain-containing protein	A0A2H4J1S8	uncultured_Caudovirales_phage	1.3e-58	68.7
WP_014521348.1\|2728115_2728436_-	hypothetical protein	NA	NA	NA	NA
WP_014521349.1\|2728435_2730232_-	AAA family ATPase	A0A2H4J7Q2	uncultured_Caudovirales_phage	4.2e-233	80.2
WP_014521350.1\|2730236_2730404_-	hypothetical protein	NA	NA	NA	NA
WP_014521351.1\|2730409_2731213_-	HD domain-containing protein	A0A2H4J786	uncultured_Caudovirales_phage	3.2e-132	82.8
WP_014521352.1\|2731205_2731535_-	hypothetical protein	NA	NA	NA	NA
WP_014521353.1\|2731539_2731836_-	VRR-NUC domain-containing protein	A0A2H4J095	uncultured_Caudovirales_phage	3.3e-42	83.5
WP_014521354.1\|2731835_2732651_-	DUF1351 domain-containing protein	A0A2H4J082	uncultured_Caudovirales_phage	1.4e-114	77.1
WP_014521355.1\|2732651_2733752_-	DEAD/DEAH box helicase	A0A2H4J064	uncultured_Caudovirales_phage	1.3e-171	79.0
WP_003355976.1\|2733911_2734082_-	hypothetical protein	NA	NA	NA	NA
WP_014521358.1\|2734338_2734536_-	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_014521359.1\|2734757_2735201_+	helix-turn-helix transcriptional regulator	A0A0A7RTK4	Clostridium_phage	2.2e-13	35.2
WP_014521360.1\|2735220_2735676_+	ImmA/IrrE family metallo-endopeptidase	Q0H245	Geobacillus_phage	2.9e-05	30.4
WP_014521361.1\|2735818_2737597_+	recombinase family protein	A0A0A7RTR0	Clostridium_phage	7.4e-206	71.5

DBSCAN-SWA_8

3084153 : 3093732

Synechococcus_phage(42.86%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014521595.1\|3084153_3085653_-	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase	Q58MG4	Prochlorococcus_phage	1.9e-69	46.9
WP_014521596.1\|3085866_3086484_-	phosphoribosylglycinamide formyltransferase	M4QRX9	Synechococcus_phage	1.5e-25	40.3
WP_014521597.1\|3086610_3087606_-	phosphoribosylformylglycinamidine cyclo-ligase	M4QRQ6	Synechococcus_phage	4.5e-67	43.7
WP_014521598.1\|3087777_3089226_-	amidophosphoribosyltransferase	A0A0M3SGR2	Mollivirus	7.2e-58	35.1
WP_014521599.1\|3089317_3090022_-	phosphoribosylaminoimidazolesuccinocarboxamide synthase	G8EYA2	Synechococcus_phage	1.6e-42	42.5
WP_014521600.1\|3090021_3090501_-	5-(carboxyamino)imidazole ribonucleotide mutase	A0A2P0VNU7	Tetraselmis_virus	3.7e-27	49.4
WP_014521601.1\|3091176_3093732_-	selenium-dependent xanthine dehydrogenase	A0A0P0IVM8	Acinetobacter_phage	1.3e-09	32.4

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_017299

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection