CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_009496	Clostridium botulinum A str. ATCC 3502 plasmid pBOT3502, complete sequence	0 crisprs	NA	0	0	0	0
NC_009495	Clostridium botulinum A str. ATCC 3502, complete genome	10 crisprs	DEDDh,csa3,DinG,WYL,cas3,cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7,cas6,casR	0	11	7	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_009495_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_1

1897862-1898079

Unclear

Consensus_repeat	Method
ATAATAATATAAAAGATATATCT	CRISPRCasFinder

3 spacers

cas3

The CRISPR arrays of NC_009495_1

>merge|NC_009495|1|1897862-1898079|CRISPRCasFinder
ATAATAATATAGAAGATATATCTCCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTAAAAATAAAGTAAAAGACATATCTTATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAGATAATAAAATAGAAAATATAGAAGTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTAATAATAGTATTAAGGATTTCTTA

>NC_009495|1|1|1897862-1898079|CRISPRCasFinder
ATAATAATATAGAAGATATATCT	CCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTA
AAAATAAAGTAAAAGACATATCT	TATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAG
ATAATAAAATAGAAAATATAGAA	GTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTA
ATAATAGTATTAAGGATTTCTTA

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_011986369.1\|1892368_1896826_+\|DUF5050-domain-containing-protein	unknown	unknown	gnl\|CDD\|379846
NC_009495.1\|WP_003403076.1\|1902764_1903280_-\|ferritin	unknown	unknown	gnl\|CDD\|153113
NC_009495.1\|WP_011986376.1\|1910496_1910970_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986324.1\|1880093_1880303_+\|cold-shock-domain-containing-protein	unknown	unknown	gnl\|CDD\|278729
NC_009495.1\|WP_003358892.1\|1909193_1910174_+\|tyrosine-recombinase-XerC	unknown	unknown	gnl\|CDD\|234698
NC_009495.1\|WP_003403080.1\|1907278_1907482_+\|alpha/beta-type-small-acid-soluble-spore-protein	unknown	unknown	gnl\|CDD\|365990
NC_009495.1\|WP_011986365.1\|1885910_1886765_+\|4Fe-4S-binding-protein	unknown	unknown	gnl\|CDD\|225131
NC_009495.1\|WP_003363259.1\|1907542_1907743_+\|alpha/beta-type-small-acid-soluble-spore-protein	unknown	unknown	gnl\|CDD\|365990
NC_009495.1\|WP_004450459.1\|1904538_1905000_+\|chemotaxis-protein-CheX	unknown	unknown	gnl\|CDD\|224324
NC_009495.1\|WP_012047671.1\|1884881_1885340_+\|YbaK/EbsC-family-protein	unknown	unknown	gnl\|CDD\|239825
NC_009495.1\|WP_011986363.1\|1882962_1884543_-\|ABC-F-family-ATP-binding-cassette-domain-containing-protein	unknown	unknown	gnl\|CDD\|237894
NC_009495.1\|WP_011986367.1\|1889754_1890591_+\|S1-RNA-binding-domain-containing-protein	unknown	unknown	gnl\|CDD\|225543
NC_009495.1\|WP_011986373.1\|1903684_1904539_+\|response-regulator	unknown	unknown	gnl\|CDD\|381097
NC_009495.1\|WP_011986371.1\|1901709_1902639_+\|glucosaminidase-domain-containing-protein	unknown	unknown	gnl\|CDD\|224619
NC_009495.1\|WP_011986374.1\|1905182_1906541_-\|YjiH-family-protein	unknown	unknown	gnl\|CDD\|225851
NC_009495.1\|WP_011986375.1\|1907946_1908276_-\|HesB-like-protein	unknown	unknown	gnl\|CDD\|188182
NC_009495.1\|WP_011986325.1\|1880678_1882682_+\|methyl-accepting-chemotaxis-protein	unknown	unknown	gnl\|CDD\|223910
NC_009495.1\|WP_011986368.1\|1890769_1892215_+\|DEAD/DEAH-box-helicase	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|223587
NC_009495.1\|WP_011986366.1\|1888166_1889432_+\|DEAD/DEAH-box-helicase	unknown	unknown	gnl\|CDD\|223587
NC_009495.1\|WP_003403172.1\|1886904_1887798_-\|chemotaxis-protein-CheV	unknown	unknown	gnl\|CDD\|223905

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_011986369.1\|1892368_1896826_+\|DUF5050-domain-containing-protein	gnl\|CDD\|379846	pfam16472, DUF5050, Domain of unknown function (DUF5050).	4.97435e-50
NC_009495.1\|WP_003403076.1\|1902764_1903280_-\|ferritin	gnl\|CDD\|153113	cd01055, Nonheme_Ferritin, nonheme-containing ferritins. Nonheme Ferritin domain, found in archaea and bacteria, is a member of a broad superfamily of ferritin-like diiron-carboxylate proteins. The ferritin protein shell is composed of 24 protein subunits arranged in 432 symmetry. Each protein subunit, a four-helix bundle with a fifth short terminal helix, contains a dinuclear ferroxidase center (H type). Unique to this group of proteins is a third metal site in the ferroxidase center. Iron storage involves the uptake of iron (II) at the protein shell, its oxidation by molecular oxygen at the ferroxidase centers, and the movement of iron (III) into the cavity for deposition as ferrihydrite.	1.58716e-79
NC_009495.1\|WP_011986324.1\|1880093_1880303_+\|cold-shock-domain-containing-protein	gnl\|CDD\|278729	pfam00313, CSD, 'Cold-shock' DNA-binding domain.	2.82889e-20
NC_009495.1\|WP_003358892.1\|1909193_1910174_+\|tyrosine-recombinase-XerC	gnl\|CDD\|234698	PRK00236, xerC, site-specific tyrosine recombinase XerC; Reviewed.	5.17916e-140
NC_009495.1\|WP_003403080.1\|1907278_1907482_+\|alpha/beta-type-small-acid-soluble-spore-protein	gnl\|CDD\|365990	pfam00269, SASP, Small, acid-soluble spore proteins, alpha/beta type.	1.88902e-25
NC_009495.1\|WP_011986365.1\|1885910_1886765_+\|4Fe-4S-binding-protein	gnl\|CDD\|225131	COG2221, DsrA, Dissimilatory sulfite reductase (desulfoviridin), alpha and beta subunits [Energy production and conversion].	2.96712e-74
NC_009495.1\|WP_003363259.1\|1907542_1907743_+\|alpha/beta-type-small-acid-soluble-spore-protein	gnl\|CDD\|365990	pfam00269, SASP, Small, acid-soluble spore proteins, alpha/beta type.	6.55884e-25
NC_009495.1\|WP_004450459.1\|1904538_1905000_+\|chemotaxis-protein-CheX	gnl\|CDD\|224324	COG1406, COG1406, Predicted inhibitor of MCP methylation, homolog of CheC [Cell motility and secretion].	3.81904e-42
NC_009495.1\|WP_012047671.1\|1884881_1885340_+\|YbaK/EbsC-family-protein	gnl\|CDD\|239825	cd04333, ProX_deacylase, This CD, composed mainly of bacterial single-domain proteins, includes the Thermus thermophilus (Tt) YbaK-like protein, a homolog of the trans-acting Escherichia coli YbaK Cys-tRNA(Pro) deacylase and the Agrobacterium tumefaciens ProX Ala-tRNA(Pro) deacylase and also the cis-acting prolyl-tRNA synthetase-editing domain (ProRS-INS). While ProX and ProRS-INS hydrolyze misacylated Ala-tRNA(Pro), the E. coli YbaK hydrolyzes misacylated Cys-tRNA(Pro). A few CD members are N-terminal, YbaK-ProX-like domains of an uncharacterized protein with a C-terminal, predicted Fe-S protein domain.	3.37813e-76
NC_009495.1\|WP_011986363.1\|1882962_1884543_-\|ABC-F-family-ATP-binding-cassette-domain-containing-protein	gnl\|CDD\|237894	PRK15064, PRK15064, ABC transporter ATP-binding protein; Provisional.	0
NC_009495.1\|WP_011986367.1\|1889754_1890591_+\|S1-RNA-binding-domain-containing-protein	gnl\|CDD\|225543	COG2996, COG2996, Predicted RNA-bindining protein (contains S1 and HTH domains) [General function prediction only].	3.91906e-82
NC_009495.1\|WP_011986373.1\|1903684_1904539_+\|response-regulator	gnl\|CDD\|381097	cd17542, REC_CheY, phosphoacceptor receiver (REC) domain of chemotaxis protein CheY. The chemotaxis response regulator CheY contains a stand-alone REC domain. Chemotaxis is a behavior known for motile bacteria that directs their movement in response to chemical gradients. CheY is involved in transmitting sensory signals from chemoreceptors to the flagellar motors. Phosphorylated CheY interacts with the flagella switch components FliM and FliY, which causes counterclockwise rotation of the flagella, resulting in smooth swimming. REC domains function as phosphorylation-mediated switches within response regulators, but some also transfer phosphoryl groups in multistep phosphorelays.	1.4036e-51
NC_009495.1\|WP_011986371.1\|1901709_1902639_+\|glucosaminidase-domain-containing-protein	gnl\|CDD\|224619	COG1705, FlgJ, Muramidase (flagellum-specific) [Cell motility and secretion / Intracellular trafficking and secretion].	6.44229e-49
NC_009495.1\|WP_011986374.1\|1905182_1906541_-\|YjiH-family-protein	gnl\|CDD\|225851	COG3314, COG3314, Uncharacterized protein conserved in bacteria [Function unknown].	5.74838e-117
NC_009495.1\|WP_011986375.1\|1907946_1908276_-\|HesB-like-protein	gnl\|CDD\|188182	TIGR01911, conserved_protein, HesB-like selenoprotein. This model represents a family of small proteins related to HesB and its close homologs, which are likely to be invovlved in iron-sulfur cluster assembly (See TIGR00049 and pfam01521). Several members are selenoproteins, with a TGA codon and Sec residue that aligns to the conserved Cys of the HesB domain. A variable Cys/Ser/Gly-rich C-terminal region is not included in the seed alignment and model. [Unknown function, General].	7.90839e-23
NC_009495.1\|WP_011986325.1\|1880678_1882682_+\|methyl-accepting-chemotaxis-protein	gnl\|CDD\|223910	COG0840, Tar, Methyl-accepting chemotaxis protein [Cell motility and secretion / Signal transduction mechanisms].	9.04356e-54
NC_009495.1\|WP_011986368.1\|1890769_1892215_+\|DEAD/DEAH-box-helicase	gnl\|CDD\|223587	COG0513, SrmB, Superfamily II DNA and RNA helicases [DNA replication, recombination, and repair / Transcription / Translation, ribosomal structure and biogenesis].	3.74715e-150
NC_009495.1\|WP_011986366.1\|1888166_1889432_+\|DEAD/DEAH-box-helicase	gnl\|CDD\|223587	COG0513, SrmB, Superfamily II DNA and RNA helicases [DNA replication, recombination, and repair / Transcription / Translation, ribosomal structure and biogenesis].	9.40869e-114
NC_009495.1\|WP_003403172.1\|1886904_1887798_-\|chemotaxis-protein-CheV	gnl\|CDD\|223905	COG0835, CheW, Chemotaxis signal transduction protein [Cell motility and secretion / Signal transduction mechanisms].	4.95044e-31

>NC_009495.1|WP_011986369.1|1892368_1896826_+|DUF5050-domain-containing-protein
MIRGVFAIFSKKFVAKFLLYSSIVIIPMFNHNYVQAASSKQYETKYNVSLDKVWKIRFSREVDKATLNPENIKILDNQGKEMPIDLSLDVDKHYVKIALKSGTYNGVHYSGKYEKDKKYSLIVKEGLMSEPSKNKKSKNLAYETMMDFNTIGDNEYPGLPIEDGLIVIGDKAYSVGYLSKHSSIANEITSNGNYYIAYISKEYGEKIKQVLGNNTTKGNQERANKILYYAPNGNQYEYEWNEAFGEYKIVLPKAYVDVTPGVINGVVNLAVKQVKAVPGAKYFKLAHSNTIKPIGESISYSMTYPTEKLTILSADETPLATALVDVYLPKTGYVSLSSVNETLGNTAGNISNNGSAAMDLDFYVYYVNSADKNSLYRKTLTGRMDTQISLDKAQYINVIGDWIYYSNYNDNGKIYKMKKDGTKKQILCDDTATYITVSGGVVYYANQSDKGRLYKINTDGTIDGGASNRDPAGKVHGMPVMDDYGNYNKATDQANFINVVGDWIYYSNFSDGHKIYTVNKDGNIRRKVNDEWADGIQIVGAWAYYCSGSGAISKVRVDGTGSVIPLRGTTRKVDKGYHLNIVDGWLYYSNAEDGGKLYRIKEDGSGEKKKLADLATDYINIVGDTMYLISGGKTYTLPLNTDGTIKPTLVTKDNNGNTVVDVKDLNITVAYEDANKTIGELEAKYLPQKVAVFMKDDTVQQLPVDWDIKNRKYNGQGIYTYTGTVLGHGKQIKCTLTIPSEMLNATSIIEVYNNGPKNGSIMIKERSFGPSKQDQELKEKLKLAKRVEIGDVIKVYDNPNSEKPLGNIKVDANNANGPLVKSLDLDMYGRSFWITITRKNKAESKPTEVRQLGAAVLSGDVLDEDGEALGVDGRDFTVKGWNNPSIRDDGFISDTTEIAAQGTKSIYVIPGTGKLNMENQGVIPAGITSANYWNGGNARALLTNYDLLTNDSLKNKLKEGNYSIYVVVGYDGKAEEDVNGFGSPLVIGKTASIPKAMKATEEKIPKAPSVTKQYAKSGDTVKISGVTNEDEIYLAPEGASYIAKDITNKPYKSHDNLFFEDQSKSKEEREKEYEKSGKPSIEDGYQCKLVNGKIPQGVRSGKYKVYMVNAIGSSSPASGEIIVDNEDPVVRLDSAKQEDVIKTVTQNGTTTQETTGQKFKVNFAAFDNSFDNSIKEGITVSMARLDSPKSAIKAQEIKDKGNKTFEVIINDPHANLNDYAIYAEDKAGNIGQVNLKVQDPPANINNISLAIRTSNEGVDLVKSRLVGRTKYMTKDLTRASDNYEVTVDGVKYVLQEEALRNLGTSPSIDAFMNALMQAKQWDIANNKPMEDKPKLSSKVSIYKVNDVIYIEGNDNTPIQIEDKTKIDSDTAIVSNMIGLNPNENNTGENSKNQQYVINVTGTAQKNGKLKVCLAGKCFDINMVAGDSRTNIAAKIKEAINNNTILDSYQYPGTNVESNGSEVRLTRKSPGAVVPTFTVEYFNYDN
>NC_009495.1|WP_011986368.1|1890769_1892215_+|DEAD/DEAH-box-helicase
MNKLTFENYKLSDEILKSLGKLGYKNPSEVQKQVIPLILKDKDIIVKSETGSGKTAAFSIPICEKLELEEKDPQVLVLTPTRELALQIKEEISSIALYKRLRCTAIFGKQPMSLQKRELKQRVHLVVGTPGRTLDHIERENLNLKKIKYFVLDEADEMLNMGFIDQVEAVIKRLPKNRVTMLFSATIPEKVENLCKKYMNNPENININPENITTGTINQCYYEVEDKDKFYLLQKIIYKEVVDNSIIFCNTREKVDEVLKHMKKKGLNAIGLHGGMEQKDRLETMKKFKEGEFQFLVCTDVAARGIHIENISHVINYEMPYEKESYVHRIGRTGRAGKEGVAITFIEPNKVRFLKDIEDYIEKEIPKRKEPSSEEVAKGKKIFEENIKNRIKTKVPKDNKKQKDITKIYISAGRKKKIRPGDIVGAITSIEGINVDNIGIIDIQDNHSYVDILERKGDIVLKASEDMKIKGKKVRIQRAVK
>NC_009495.1|WP_011986367.1|1889754_1890591_+|S1-RNA-binding-domain-containing-protein
MIKLGEIQKLEIIREAPMGVYLNSKEDKSENDILLPGKQVPKDAKIGDEVEVFVYRDSEDRMIATINRPKITIGEIATLKVIEKTKMGAFLDWGLERDLFLPFKEQTYGIQEGMECLVYLYIDKSDRLCASMNVYRVLSTESPYKEDDEVKGFIYDIKREIGAFVAVDNEYHGLIPKNELYGKFRYGDIVEARVTKVKEDGKLDLSIRKKAYKQMDEDVDTILEKLNSNGGKLYLNDNSDPRAIKELLNMSKNAFKRAVGRLLKEGKIEFIEKGIKLK
>NC_009495.1|WP_011986366.1|1888166_1889432_+|DEAD/DEAH-box-helicase
MNNSFDTLNLNPKLVQGLKKLNINIPTEIQAEAIPLAMENKDIIGQSETGTGKTLAYLLPIFEKITTEKREMQAIILAPTHELAMQINNEIKNISSNSNMDVKSMAIIGEANIKRQIEKLKEKPHIIVGSPGRILELIKKKKITAHTVKTIVIDEGDKLLDKNNLKVVKEVIKTTLRERQLMLFSATITESTLNIAKDLMKDSVIVKVKEKNTVNENIKHLYITGEHRERIEILRKLIAATNPKRAIVFINRNEEIELTTLKLQYHKIKAYGIYGAAEKEQRKKALEDFRSGKVQILVSSDLSARGLDVKDVTHIFNLDLPENPKEYLHRVGRTGRASKEGIAISIITEKEKALIRKYEKEFNINIEEKKIYKGTLISSKGERSSQPKSKNKSTSAHKDNNKKKRSSSINKSKNNHKKKKY
>NC_009495.1|WP_003403172.1|1886904_1887798_-|chemotaxis-protein-CheV
METNILLESGTGEVEIIEFLVNNKHYAINVIKVKEVIEVDNVTKVPQSDPAIEGLILCREKIFPLIDLSYILGQKNTSKKKFKTIICEFNRVSVAFKIDEIVAVHRIGWDKILKPDDIAANPLVIGNILLKDKIILLLDFEKIVTDINPSTGISEERIVNVDYKDRSHIKVFLADDSSLIRKLLKDTLTKAGFKKLTIFDDGKQVLDKLLELVEKKGEDFTEDVQILITDIEMPQMDGHTLTRKVKEHPILKRLPVIIFSSLITKDLKHKGTSVGADEQLSKPDIGELVNIIDNYIE
>NC_009495.1|WP_011986365.1|1885910_1886765_+|4Fe-4S-binding-protein
MKMISKNEIAKLKGEGFLAQKQEGYFSVRILSRAGNFTSKQIIKLAEIADNYGKGYLGVTTRLATEIPWIRYEDIEAVKKEIVSSGMSHGGTGKRVRPLVSCKGTVCVHGLYDTQKLCGELHDKYFGYELPSKFKITLVGCPNNCAKASINDIGIMGQAYVEFDEEKCKVCGICTKSCRQKAVTVENKKIVYKKDLCVNCGKCATVCPFEAMTIKEQGLQVYLGGRFGREYRMGNRLKGLYKEEEIPALVQKIFDVYSEMGNPGERLAKMIERVGFDKVEEAIL
>NC_009495.1|WP_012047671.1|1884881_1885340_+|YbaK/EbsC-family-protein
MSLEGVKKQFTDENLNLKILEFDESTATVELAAKALGVEPGQIAKTLAFHVKGENMLIVAKGDARIDNKKFKAYFNGKGKMMAPEVVLEVTGHAIGGVCPFGLENPINIYLDQSLKEFEKVYPAAGNANTAVEVTLDELEGITKGLWIDVCK
>NC_009495.1|WP_011986363.1|1882962_1884543_-|ABC-F-family-ATP-binding-cassette-domain-containing-protein
MITVTNLSLRYGDKKLFEDVNLKFTPGNCYGVIGANGAGKSTFLKILSGEIEANTGDVSIQPGVRMSILKQDHFKYDEFPVLETVIMGNERLYEIMKEKDAIYAKTPFTDEDGIKASELEGEFADLNGWEAEAEASSLLQGLGIGTELHEKNMKDLSGSEKVKVLLAQALFGNPGVLILDEPTNHLDIKSVNWLEEFLINFEGTVIVVSHDRHFLNKVCTHMADVDFGKIKLYVGNYDFWYESSQLALQMAKDQNKKKEEKIKELQEFIARFSANASKSKQATSRKKLLDKIDLDNIQPSSRKYPYIAFKPERKVGNDILRVEGLTKTIDGTKILDNISFIIGKDDKIAFVGDELSITTLFKIISGELEPDSGEYKWGITITNAYFPKDNSEYFNDVDLNLVDWLRQYSEEKSESYLRGFLGRMLFSGEEALKEVKVLSGGEKVRCMLSKMMLNNANVIILDQPTNHLDLESITALNNGLMDYKSNILFTSHDHQFIQTIANRIIEVSEAKFVDKKVTYDEYLESK
>NC_009495.1|WP_011986325.1|1880678_1882682_+|methyl-accepting-chemotaxis-protein
MKFKTMKGKMLTYFLSLFLIICIAISFMAYFMSKRMIERKASSLMSEVSRQAVQNIEARLNGTLDSIETVANMPTIKDPKLGWDKKKTILDEEIKLHGHVKMGIVGKDGQSIQTDGTTVNIKDRNYFKETMEGKRTISEPIVSKVDGKVVIIYTVPIKNGNTIMGALTAVREGNDISNISNSIKVGESGGAYLIDSTGTVIAHKNKESVIKRENSIKDAQSNEELKPIAAIEKSMIEGKEGIGQYKYKGAEKYISYSPMKSTGWSLAIYAPKNEILKEVSEITRNIIIVSILGIGIALVCIWFISTQISNNLISMRDSLNIVATGDLTTNVDSKIEKEKDEIGHMARALSKTVLSIGNMINSLKGSSFNIDDKANNLAAISEEFTATTENVSTAIQEVATGATNQAQALTEIVSMLNDFSDKINSTVNNIEEIDGMSKEIDEKANVSNKDMKELLNSIENLTKVFENFETKIWTMESNVQKINEITNLINDIAEKTNLLALNAAIEAARAGESGKGFAVVAEEIRKLAEMSRKSSEDIYTIVNGVLEDTKDMVKSSNEVNEKLNGQRSTADEAMNSFMEISKSVTNMIPKIRNINNSANIIEKNKNEILNKSETIASISQEISASAEEISASSEEMSASSEEVANTAQSLNDMTQDMLDEMNKFKTE
>NC_009495.1|WP_011986324.1|1880093_1880303_+|cold-shock-domain-containing-protein
MSMHTGTVKWFDNERGYGFIAGNNGKDVYVHSMQIKEKTLNKDLHEGEEVLFDIVEKEKGPIAINVQKL
>NC_009495.1|WP_011986371.1|1901709_1902639_+|glucosaminidase-domain-containing-protein
MKKATGLILKLMILVLLAFTIFIMFNSLILNKKNERFLPENAMNIYIKAADEVSENKLQVNWKYIAALDGVKNKEDFSKANIEDSKVLGEKFLEISKSTKFKNTNYRLLTLDEVISKMSFTEEEKKNVHKYLDKLNNIYPITPDEYKRQFIDELIPISKELYDEYGILPSVTIGQAILESDWGRSELSKKGNNLFGIKATPSWQGKVLNMETSENYNDKIKDNFRYYSSKEDSIKDYANFLVKNKRYRENKVFRATEYKTQAKAIEKAGYSTKKDKDGNLLYSSLLGKIIREYNLQLIDSKTQEEISKK
>NC_009495.1|WP_003403076.1|1902764_1903280_-|ferritin
MLSEKLLEALNNQINFEFYSSYIYLAMASYAESEDLAGFANFFRVQAQEEIFHAMKFYDYVNQMGGRVILEKIDQPKAEYKNILECFEDGFNHEKIVTSRIYNLTDIATEEKEHATISLLKWFIDEQVEEENNFNTIIRKLRRAESNPAVLYMLDDELSARVFTPPTNTGA
>NC_009495.1|WP_011986373.1|1903684_1904539_+|response-regulator
MKDTKVVIVDDSPFSISIIKDILEENGLTVVGEAGNLEEVINVVKDKKPDIVTMDMTLPGTDGIECIKAINKINKNVKVIVISSMMDEEIVKKANKNKVCGYIQKPIDPEELIATIEKVVMKEELFLQLENDYFQIFKESFKDALNKFTKTTAEFSEDTKCTISETSRGMVVVIGIIGNFSGRMILDLSQETANSMVNFMLKREPKDMNEVLNVIGEFSNIVAGNACSMLNRKSKVFGLRIAPPSIFYGKSLNISQSLIKSLSVESNTEFGQIYMNVGFKRGES
>NC_009495.1|WP_004450459.1|1904538_1905000_+|chemotaxis-protein-CheX
MDAKYINPFIDSFYNVLPQLGFSNVTREDVAIKNNVESLGILINLGIVGDIRGNIVYNIQGENGKKIASKMMMGLPVEELNEMAQSALSELSNMLTANASINFSNIGVNVNISTPTLMYGQDIKIKLNTDKILNIKIVADDIPIDVNIAFEKI
>NC_009495.1|WP_011986374.1|1905182_1906541_-|YjiH-family-protein
METQKNNKYSFSELFKFICPSLIGFILFIIPISYDGEITIPIAVLSKIVLAGLGSILPQLMGIIICITFICTAITKIFKPKAILENKFFNNLFNVSPVWVLARILGFIFIVSTFFKIGPEWMWSKNTGGLLLYDLLPILFSVFIFAGMLLPLLLDFGLLEFVGALLTKVMRPIFNLPGRSSIDCMASWLGDGTIGVLLTSKQYEEGYYSEREAAVIGTTFSAVSITFSLVVISQVKLAHMFVPFYLTVCLSGIIAAILIPRIPPLSRKPDTYLNGGESKNSEALPEGYTPFTWGLEKAVAKAGSNGDPLNFIRQGLQNVLDMLLGVTPVVMAMGTSALILAEYTPLFKWLGLPFIPLLNLLKIPEAALASQTIVVGFADMFLPSVIAATIQSEMTRFIIACLSVTQLIYMSEVGGLLLGSKIPVSLKDLVIIFLERTLVTLPIITLVAHILF
>NC_009495.1|WP_003403080.1|1907278_1907482_+|alpha/beta-type-small-acid-soluble-spore-protein
MPSNKNSNNLVVPEAQQGLNQLKMEVANEVGIANYDSMDKGNLTSRQNGYVGGNMVKKMVEAYERNL
>NC_009495.1|WP_003363259.1|1907542_1907743_+|alpha/beta-type-small-acid-soluble-spore-protein
MANRNSNNLVVPEAKHGLNQLKMEVANEVGIANYDAVDKGNLTSRQNGYVGGNMVRKMVEAYERNL
>NC_009495.1|WP_011986375.1|1907946_1908276_-|HesB-like-protein
MILVNMSDLAYKEFKNFIKENNVNSNIFRIFLAGNGUGGPVFNIVLDEQTSEDLLSPIGELSFLVHKDLFSEFGGFIIKCAEENGKGGFTIDPIIQSENISCSTCSSCS
>NC_009495.1|WP_003358892.1|1909193_1910174_+|tyrosine-recombinase-XerC
MKYNIQQLYDANFPQRLNDFLNYLRTIKGKSENTIESYKLDLIMFFRFLKLYKGMVPGETEFNDIEIKDISDEDIKNISLTDLFAFVSFVENYRNNGSYAKARKVATLKSFFRFLQGKVKIIKENPALELESPKISKRNPVYLTLDESKRLLSSIDGKFKERDLCIVTMFLNCGLRLSELCGINISNIKNDILTVVGKGNKERTVYLNKACIKTLNDYLNVRKEMGEKIVDKDALFLSKNYTRINKRSVEMLVKKYVKKAGLDGEKYSPHKLRHTAATLMYKHGGVDIRSLQMILGHENISTTQIYTHVDSDRLREAVKSNPLSDE
>NC_009495.1|WP_011986376.1|1910496_1910970_-|hypothetical-protein
MNRETCIFNYTKKCTDCGECEICDLDQNKKCDNCGECLQREGIDTQAIKIDEIKEDKNFVDKEDLKKVLKEDEKELESLKEFEEDLENEILQETQLLKDYDENFKEQGLYAIENVEGVQIEYIEDVDGLSELMEDESRLKKVAYEEFPGLIKIRENK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_2

2302049-2302408

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAC	CRISPRCasFinder
ATTTAAATACATCTNATGTTAATGTTCAAC	CRT

5 spacers

The CRISPR arrays of NC_009495_2

>merge|NC_009495|2|2302049-2302408|CRISPRCasFinder,CRT
GTTTAAATACATCCTATGTTAATGTTCAACTTATATGGTATTTAAGGTTATAGATAAATTAACTGGATTTAAATACACCTCATGTTAATGTTCAACCTTAAATATATAGGTATAGATCAAGACGCTAAAGAATTTAAATACATCTCATGTTAATGTTCAACTCTTAACCTTTAATTACATTATATATTATAAGTTCAATTTAAATACATCTTATGTTACTGTTCAACATTTCATCAAATCCGCATCAATAAATGAGATAAACTATTTAAATACATCTCATGTTAATGTTCAACTAAATTATACCTTAATGCTTATCAATATAGTCTTGTAATTTAAATACATCTCATGTTAATGTTCAAC

>NC_009495|2|2|2302049-2302408|CRISPRCasFinder
GTTTAAATACATCCTATGTTAATGTTCAAC	TTATATGGTATTTAAGGTTATAGATAAATTAACTGG
ATTTAAATACACCTCATGTTAATGTTCAAC	CTTAAATATATAGGTATAGATCAAGACGCTAAAGA
ATTTAAATACATCTCATGTTAATGTTCAAC	TCTTAACCTTTAATTACATTATATATTATAAGTTCA
ATTTAAATACATCTTATGTTACTGTTCAAC	ATTTCATCAAATCCGCATCAATAAATGAGATAAACT
ATTTAAATACATCTCATGTTAATGTTCAAC	TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA
ATTTAAATACATCTCATGTTAATGTTCAAC

>NC_009495|2|1|2302049-2302408|CRT
GTTTAAATACATCCTATGTTAATGTTCAAC	TTATATGGTATTTAAGGTTATAGATAAATTAACTGG
ATTTAAATACACCTCATGTTAATGTTCAAC	CTTAAATATATAGGTATAGATCAAGACGCTAAAGA
ATTTAAATACATCTCATGTTAATGTTCAAC	TCTTAACCTTTAATTACATTATATATTATAAGTTCA
ATTTAAATACATCTTATGTTACTGTTCAAC	ATTTCATCAAATCCGCATCAATAAATGAGATAAACT
ATTTAAATACATCTCATGTTAATGTTCAAC	TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA
ATTTAAATACATCTCATGTTAATGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	unknown	unknown	gnl\|CDD\|379790
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	unknown	unknown	gnl\|CDD\|227595
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_009495.1\|WP_011986655.1\|2297239_2297956_-\|transaldolase	unknown	unknown	gnl\|CDD\|183481
NC_009495.1\|WP_011986653.1\|2292783_2294877_-\|transcription-antiterminator	unknown	unknown	gnl\|CDD\|226234
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	unknown	unknown	gnl\|CDD\|100047
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_009495.1\|WP_012047734.1\|2302698_2303193_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986652.1\|2292104_2292458_-\|zinc-ribbon-domain-containing-protein	unknown	unknown	gnl\|CDD\|379915
NC_009495.1\|WP_011986656.1\|2298190_2298595_-\|membrane-protein	unknown	unknown	unknown
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	unknown	unknown	gnl\|CDD\|238518
NC_009495.1\|WP_003358211.1\|2295088_2296453_-\|PTS-ascorbate-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|236502
NC_009495.1\|WP_011986657.1\|2298932_2299667_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|236545
NC_009495.1\|WP_003361919.1\|2296465_2296750_-\|PTS-sugar-transporter-subunit-IIB	unknown	unknown	gnl\|CDD\|99905
NC_009495.1\|WP_011986654.1\|2296778_2297216_-\|PTS-sugar-transporter-subunit-IIA	unknown	unknown	gnl\|CDD\|238129
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|172889

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	gnl\|CDD\|379790	pfam16189, Creatinase_N_2, Creatinase/Prolidase N-terminal domain.	1.22915e-13
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	gnl\|CDD\|227595	COG5270, COG5270, PUA domain (predicted RNA-binding domain) [Translation, ribosomal structure and biogenesis].	0.00289543
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_009495.1\|WP_011986655.1\|2297239_2297956_-\|transaldolase	gnl\|CDD\|183481	PRK12376, PRK12376, putative translaldolase; Provisional.	3.52947e-157
NC_009495.1\|WP_011986653.1\|2292783_2294877_-\|transcription-antiterminator	gnl\|CDD\|226234	COG3711, BglG, Transcriptional antiterminator [Transcription].	2.75036e-58
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	1.11537e-120
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	1.00606e-25
NC_009495.1\|WP_011986652.1\|2292104_2292458_-\|zinc-ribbon-domain-containing-protein	gnl\|CDD\|379915	pfam17032, zinc_ribbon_15, zinc-ribbon family. This zinc-ribbon region is found on a set of largely microsporidia-specific proteins.	0.000160235
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	gnl\|CDD\|100047	cd03357, LbH_MAT_GAT, Maltose O-acetyltransferase (MAT) and Galactoside O-acetyltransferase (GAT): MAT and GAT catalyze the CoA-dependent acetylation of the 6-hydroxyl group of their respective sugar substrates. MAT acetylates maltose and glucose exclusively at the C6 position of the nonreducing end glucosyl moiety. GAT specifically acetylates galactopyranosides. Furthermore, MAT shows higher affinity toward artificial substrates containing an alkyl or hydrophobic chain as well as a glucosyl unit. Active MAT and GAT are homotrimers, with each subunit consisting of an N-terminal alpha-helical region and a C-terminal left-handed parallel alpha-helix (LbH) subdomain with 6 turns, each containing three imperfect tandem repeats of a hexapeptide repeat motif (X-[STAV]-X-[LIV]-[GAED]-X).	3.96023e-99
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	gnl\|CDD\|238518	cd01085, APP, X-Prolyl Aminopeptidase 2. E.C. 3.4.11.9. Also known as X-Pro aminopeptidase, proline aminopeptidase, aminopeptidase P, and aminoacylproline aminopeptidase. Catalyses release of any N-terminal amino acid, including proline, that is linked with proline, even from a dipeptide or tripeptide.	3.56433e-13
NC_009495.1\|WP_003358211.1\|2295088_2296453_-\|PTS-ascorbate-transporter-subunit-IIC	gnl\|CDD\|236502	PRK09410, ulaA, PTS system ascorbate-specific transporter subunit IIC; Reviewed.	0
NC_009495.1\|WP_011986657.1\|2298932_2299667_-\|hypothetical-protein	gnl\|CDD\|236545	PRK09510, tolA, cell envelope integrity inner membrane protein TolA; Provisional.	1.9151e-11
NC_009495.1\|WP_003361919.1\|2296465_2296750_-\|PTS-sugar-transporter-subunit-IIB	gnl\|CDD\|99905	cd05563, PTS_IIB_ascorbate, PTS_IIB_ascorbate: subunit IIB of enzyme II (EII) of the L-ascorbate-specific phosphoenolpyruvate:carbohydrate phosphotransferase system (PTS). In this system, EII is an L-ascorbate-specific permease with two cytoplasmic subunits (IIA and IIB) and a transmembrane channel IIC subunit. Subunits IIA, IIB, and IIC are encoded by the sgaA, sgaB, and sgaT genes of the E. coli sgaTBA operon. In some bacteria, the IIB (SgaB) domain is fused C-terminal to the IIA (SgaT) domain. The IIB domain fold includes a central four-stranded parallel open twisted beta-sheet flanked by alpha-helices on both sides. The seven major PTS systems with this IIB fold include ascorbate, chitobiose/lichenan, lactose, galactitol, mannitol, fructose, and a sensory system with similarity to the bacterial bgl system.	2.52704e-28
NC_009495.1\|WP_011986654.1\|2296778_2297216_-\|PTS-sugar-transporter-subunit-IIA	gnl\|CDD\|238129	cd00211, PTS_IIA_fru, PTS_IIA, PTS system, fructose/mannitol specific IIA subunit. The bacterial phosphoenolpyruvate: sugar phosphotransferase system (PTS) is a multi-protein system involved in the regulation of a variety of metabolic and transcriptional processes. This family is one of four structurally and functionally distinct group IIA PTS system cytoplasmic enzymes, necessary for the uptake of carbohydrates across the cytoplasmic membrane and their phosphorylation.	9.05568e-38
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	1.14321e-11
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	6.33103e-27
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	3.66461e-14
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	gnl\|CDD\|172889	PRK14413, PRK14413, glycerol-3-phosphate acyltransferase.	7.39905e-94

>NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein
MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN
>NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase
MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK
>NC_009495.1|WP_011986657.1|2298932_2299667_-|hypothetical-protein
MDKFRNMKKSHIALLVIMYMVLMGSFPRFTGWATIFSAIAVGGYFLKNKKDLKGLTRKNKNFIFAGIIILAIIGSLNVAVGNNIQNEKLMADKAKQEQEIKQEEQKKVEEKKLAEEQKRVQEEEAKKKAAEEKRKQEEEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKGDSNSQSNESQNADDNQNYTVYKTRTGSKYHSSGCRYLKKSCYETTVSQARNEGLTPCSVCNP
>NC_009495.1|WP_011986656.1|2298190_2298595_-|membrane-protein
MNILMLTCSIAIPVLMILIGILFKCNSYKKIDRTLDLIIPIATFFTGFSERDREHLYKNTNNLASVNRKCSLIWSISGVCTLLLTIISLILNKSDIYNTSVILLEPELLILVIVFISVEYILKRNFNKKISEQY
>NC_009495.1|WP_011986655.1|2297239_2297956_-|transaldolase
MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTAPLIKKLSEKGYHLNVTAIFTIDQVKEVVGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDVLKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL
>NC_009495.1|WP_011986654.1|2296778_2297216_-|PTS-sugar-transporter-subunit-IIA
MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDMVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK
>NC_009495.1|WP_003361919.1|2296465_2296750_-|PTS-sugar-transporter-subunit-IIB
MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK
>NC_009495.1|WP_003358211.1|2295088_2296453_-|PTS-ascorbate-transporter-subunit-IIC
MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE
>NC_009495.1|WP_011986653.1|2292783_2294877_-|transcription-antiterminator
MLNKRCSNILQMIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFVTINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKILKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNGSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTLTEDHKPSLKELLKPDFIKLNEEAENWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISKVKNIKASSEIDSILYS
>NC_009495.1|WP_011986652.1|2292104_2292458_-|zinc-ribbon-domain-containing-protein
MIIWGWGKVTKKIIGAVFQRTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK
>NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein
MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII
>NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase
MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE
>NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein
MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV
>NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase
MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG
>NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase
MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI
>NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator
MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein
MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN
>NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_3

2309045-2309340

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAC	CRISPRCasFinder
ATTTAAATACATCTCATGTTAATGTTCAAC	CRT
ATTTAAATACATCTCATGTTAATGTTCAAC	PILER-CR

4 spacers

cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7

The CRISPR arrays of NC_009495_3

>merge|NC_009495|3|2309045-2309340|CRISPRCasFinder,CRT,PILER-CR
GCTTAAGTACATCTCATGTTAATGTTCAACTGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTTATTTAAATACATCTCATGTTAATGTTCAACATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGTATTTAAATACATCTCATGTTAATGTTCAACTTAAGTATGATAATATAAAACCTTGGTAAATATATTAAATTTAAATACATTTCATGTTAATGTTCAACGAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGAATTTAAATACATCTCATGTTAATGTTCAACC

>NC_009495|3|3|2309045-2309340|CRISPRCasFinder
GCTTAAGTACATCTCATGTTAATGTTCAAC	TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT
ATTTAAATACATCTCATGTTAATGTTCAAC	ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT
ATTTAAATACATCTCATGTTAATGTTCAAC	TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA
ATTTAAATACATTTCATGTTAATGTTCAAC	GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA
ATTTAAATACATCTCATGTTAATGTTCAACC

>NC_009495|3|2|2309045-2309339|CRT
GCTTAAGTACATCTCATGTTAATGTTCAAC	TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT
ATTTAAATACATCTCATGTTAATGTTCAAC	ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT
ATTTAAATACATCTCATGTTAATGTTCAAC	TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA
ATTTAAATACATTTCATGTTAATGTTCAAC	GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA
ATTTAAATACATCTCATGTTAATGTTCAAC

>NC_009495|3|1|2309047-2309274|PILER-CR
TTAAGTACATCTCATGTTAATGTTCAACTG	AACTTATGAAAGAACTAGAGTGTGGAGAACCCTTAT
TTAAATACATCTCATGTTAATGTTCAACAT	TAGGTTTGCCACCACATTCCGTTACTGCAGTAGTAT
TTAAATACATCTCATGTTAATGTTCAACTT	AAGTATGATAATATAAAACCTTGGTAAATATATTAAAT
TTAAATACATTTCATGTTAATGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	unknown	unknown	gnl\|CDD\|379790
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	unknown	unknown	gnl\|CDD\|227595
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	cd09682_cmr4gr7_CAS-III-B	gnl\|CDD\|274210
NC_009495.1\|WP_011986669.1\|2314148_2314487_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	pfam09700_cmr3gr5_CAS-III-B	gnl\|CDD\|273855
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_009495.1\|WP_012047734.1\|2302698_2303193_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	unknown	unknown	gnl\|CDD\|238518
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	unknown	unknown	gnl\|CDD\|100047
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	cmr5gr11	mkCas0098_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|187792
NC_009495.1\|WP_011986668.1\|2313663_2313957_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_009495.1\|WP_011986675.1\|2319645_2320833_-\|hypothetical-protein	cmr1gr7	mkCas0086_cmr1gr7_CAS-III-B	unknown
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|172889

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	gnl\|CDD\|379790	pfam16189, Creatinase_N_2, Creatinase/Prolidase N-terminal domain.	1.22915e-13
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	gnl\|CDD\|227595	COG5270, COG5270, PUA domain (predicted RNA-binding domain) [Translation, ribosomal structure and biogenesis].	0.00289543
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|274210	TIGR02580, putative_CRISPR-associated_protein, CRISPR type III-B/RAMP module RAMP protein Cmr4. This model represents a CRISPR-associated protein from the family that includes TM1792 of Thermotoga maritima. This family is part of the broad RAMP superfamily (pfam03787) collection of CRISPR-associated proteins. It is the fourth of a recurring set of six proteins, four of are in the RAMP superfamily, that we designate the CRISPR RAMP module.	1.14208e-46
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|273855	TIGR01888, Hypothetical_protein_SSO1730, CRISPR type III-B/RAMP module-associated protein Cmr3. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This highly divergent family is found in at least ten different archaeal and bacterial species as part of the CRISPR RAMP modulue but is not a member of the RAMP superfamily itself. A typical example is TM1793 from Thermotoga maritima.	5.08335e-12
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	1.11537e-120
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	1.00606e-25
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	gnl\|CDD\|238518	cd01085, APP, X-Prolyl Aminopeptidase 2. E.C. 3.4.11.9. Also known as X-Pro aminopeptidase, proline aminopeptidase, aminopeptidase P, and aminoacylproline aminopeptidase. Catalyses release of any N-terminal amino acid, including proline, that is linked with proline, even from a dipeptide or tripeptide.	3.56433e-13
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	gnl\|CDD\|100047	cd03357, LbH_MAT_GAT, Maltose O-acetyltransferase (MAT) and Galactoside O-acetyltransferase (GAT): MAT and GAT catalyze the CoA-dependent acetylation of the 6-hydroxyl group of their respective sugar substrates. MAT acetylates maltose and glucose exclusively at the C6 position of the nonreducing end glucosyl moiety. GAT specifically acetylates galactopyranosides. Furthermore, MAT shows higher affinity toward artificial substrates containing an alkyl or hydrophobic chain as well as a glucosyl unit. Active MAT and GAT are homotrimers, with each subunit consisting of an N-terminal alpha-helical region and a C-terminal left-handed parallel alpha-helix (LbH) subdomain with 6 turns, each containing three imperfect tandem repeats of a hexapeptide repeat motif (X-[STAV]-X-[LIV]-[GAED]-X).	3.96023e-99
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	2.17511e-33
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	2.53577e-07
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|187792	cd09661, Cmr6_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr6. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	3.38689e-26
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	1.14321e-11
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	6.33103e-27
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	3.66461e-14
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	gnl\|CDD\|172889	PRK14413, PRK14413, glycerol-3-phosphate acyltransferase.	7.39905e-94

>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein
MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN
>NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator
MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase
MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI
>NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase
MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG
>NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein
MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV
>NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase
MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE
>NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein
MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII
>NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein
MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN
>NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase
MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK
>NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein
MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG
>NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK
>NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY
>NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein
MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES
>NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI
>NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3
MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI
>NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN
>NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein
MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_6

2310339-2310434

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAC	CRISPRCasFinder

1 spacers

cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7

The CRISPR arrays of NC_009495_6

>merge|NC_009495|6|2310339-2310434|CRISPRCasFinder
GCTTAAATACATCTCATGTTAATGTTCAACAGGTGGAGTATTAGAAGATATGCATCTATATAAAGAATTTAAATACATCCTATGTTATTGTTCAAT

>NC_009495|6|6|2310339-2310434|CRISPRCasFinder
GCTTAAATACATCTCATGTTAATGTTCAAC	AGGTGGAGTATTAGAAGATATGCATCTATATAAAGA
ATTTAAATACATCCTATGTTATTGTTCAAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	unknown	unknown	gnl\|CDD\|379790
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	unknown	unknown	gnl\|CDD\|227595
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	cd09682_cmr4gr7_CAS-III-B	gnl\|CDD\|274210
NC_009495.1\|WP_011986669.1\|2314148_2314487_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	pfam09700_cmr3gr5_CAS-III-B	gnl\|CDD\|273855
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_009495.1\|WP_012047734.1\|2302698_2303193_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	unknown	unknown	gnl\|CDD\|238518
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	unknown	unknown	gnl\|CDD\|100047
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	cmr5gr11	mkCas0098_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|187792
NC_009495.1\|WP_011986668.1\|2313663_2313957_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_009495.1\|WP_011986675.1\|2319645_2320833_-\|hypothetical-protein	cmr1gr7	mkCas0086_cmr1gr7_CAS-III-B	unknown
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|172889

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	gnl\|CDD\|379790	pfam16189, Creatinase_N_2, Creatinase/Prolidase N-terminal domain.	1.22915e-13
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	gnl\|CDD\|227595	COG5270, COG5270, PUA domain (predicted RNA-binding domain) [Translation, ribosomal structure and biogenesis].	0.00289543
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|274210	TIGR02580, putative_CRISPR-associated_protein, CRISPR type III-B/RAMP module RAMP protein Cmr4. This model represents a CRISPR-associated protein from the family that includes TM1792 of Thermotoga maritima. This family is part of the broad RAMP superfamily (pfam03787) collection of CRISPR-associated proteins. It is the fourth of a recurring set of six proteins, four of are in the RAMP superfamily, that we designate the CRISPR RAMP module.	1.14208e-46
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|273855	TIGR01888, Hypothetical_protein_SSO1730, CRISPR type III-B/RAMP module-associated protein Cmr3. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This highly divergent family is found in at least ten different archaeal and bacterial species as part of the CRISPR RAMP modulue but is not a member of the RAMP superfamily itself. A typical example is TM1793 from Thermotoga maritima.	5.08335e-12
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	1.11537e-120
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	1.00606e-25
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	gnl\|CDD\|238518	cd01085, APP, X-Prolyl Aminopeptidase 2. E.C. 3.4.11.9. Also known as X-Pro aminopeptidase, proline aminopeptidase, aminopeptidase P, and aminoacylproline aminopeptidase. Catalyses release of any N-terminal amino acid, including proline, that is linked with proline, even from a dipeptide or tripeptide.	3.56433e-13
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	gnl\|CDD\|100047	cd03357, LbH_MAT_GAT, Maltose O-acetyltransferase (MAT) and Galactoside O-acetyltransferase (GAT): MAT and GAT catalyze the CoA-dependent acetylation of the 6-hydroxyl group of their respective sugar substrates. MAT acetylates maltose and glucose exclusively at the C6 position of the nonreducing end glucosyl moiety. GAT specifically acetylates galactopyranosides. Furthermore, MAT shows higher affinity toward artificial substrates containing an alkyl or hydrophobic chain as well as a glucosyl unit. Active MAT and GAT are homotrimers, with each subunit consisting of an N-terminal alpha-helical region and a C-terminal left-handed parallel alpha-helix (LbH) subdomain with 6 turns, each containing three imperfect tandem repeats of a hexapeptide repeat motif (X-[STAV]-X-[LIV]-[GAED]-X).	3.96023e-99
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	2.17511e-33
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	2.53577e-07
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|187792	cd09661, Cmr6_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr6. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	3.38689e-26
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	1.14321e-11
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	6.33103e-27
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	3.66461e-14
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	gnl\|CDD\|172889	PRK14413, PRK14413, glycerol-3-phosphate acyltransferase.	7.39905e-94

>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein
MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN
>NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator
MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase
MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI
>NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase
MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG
>NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein
MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV
>NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase
MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE
>NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein
MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII
>NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein
MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN
>NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase
MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK
>NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein
MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG
>NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK
>NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY
>NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein
MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES
>NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI
>NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3
MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI
>NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN
>NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein
MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_4

2309620-2309716

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAC	CRISPRCasFinder

1 spacers

cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7

The CRISPR arrays of NC_009495_4

>merge|NC_009495|4|2309620-2309716|CRISPRCasFinder
GCTTAAATACATCTTATGTTATTGTTCAACATGTTGTAAATGTTGTGGTATAACAGAATGTAAATAATTTAAATACATCTCATGTTAATGTTCAACC

>NC_009495|4|4|2309620-2309716|CRISPRCasFinder
GCTTAAATACATCTTATGTTATTGTTCAAC	ATGTTGTAAATGTTGTGGTATAACAGAATGTAAATA
ATTTAAATACATCTCATGTTAATGTTCAACC

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	unknown	unknown	gnl\|CDD\|379790
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	unknown	unknown	gnl\|CDD\|227595
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	cd09682_cmr4gr7_CAS-III-B	gnl\|CDD\|274210
NC_009495.1\|WP_011986669.1\|2314148_2314487_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	pfam09700_cmr3gr5_CAS-III-B	gnl\|CDD\|273855
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_009495.1\|WP_012047734.1\|2302698_2303193_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	unknown	unknown	gnl\|CDD\|238518
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	unknown	unknown	gnl\|CDD\|100047
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	cmr5gr11	mkCas0098_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|187792
NC_009495.1\|WP_011986668.1\|2313663_2313957_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_009495.1\|WP_011986675.1\|2319645_2320833_-\|hypothetical-protein	cmr1gr7	mkCas0086_cmr1gr7_CAS-III-B	unknown
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|172889

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	gnl\|CDD\|379790	pfam16189, Creatinase_N_2, Creatinase/Prolidase N-terminal domain.	1.22915e-13
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	gnl\|CDD\|227595	COG5270, COG5270, PUA domain (predicted RNA-binding domain) [Translation, ribosomal structure and biogenesis].	0.00289543
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|274210	TIGR02580, putative_CRISPR-associated_protein, CRISPR type III-B/RAMP module RAMP protein Cmr4. This model represents a CRISPR-associated protein from the family that includes TM1792 of Thermotoga maritima. This family is part of the broad RAMP superfamily (pfam03787) collection of CRISPR-associated proteins. It is the fourth of a recurring set of six proteins, four of are in the RAMP superfamily, that we designate the CRISPR RAMP module.	1.14208e-46
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|273855	TIGR01888, Hypothetical_protein_SSO1730, CRISPR type III-B/RAMP module-associated protein Cmr3. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This highly divergent family is found in at least ten different archaeal and bacterial species as part of the CRISPR RAMP modulue but is not a member of the RAMP superfamily itself. A typical example is TM1793 from Thermotoga maritima.	5.08335e-12
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	1.11537e-120
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	1.00606e-25
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	gnl\|CDD\|238518	cd01085, APP, X-Prolyl Aminopeptidase 2. E.C. 3.4.11.9. Also known as X-Pro aminopeptidase, proline aminopeptidase, aminopeptidase P, and aminoacylproline aminopeptidase. Catalyses release of any N-terminal amino acid, including proline, that is linked with proline, even from a dipeptide or tripeptide.	3.56433e-13
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	gnl\|CDD\|100047	cd03357, LbH_MAT_GAT, Maltose O-acetyltransferase (MAT) and Galactoside O-acetyltransferase (GAT): MAT and GAT catalyze the CoA-dependent acetylation of the 6-hydroxyl group of their respective sugar substrates. MAT acetylates maltose and glucose exclusively at the C6 position of the nonreducing end glucosyl moiety. GAT specifically acetylates galactopyranosides. Furthermore, MAT shows higher affinity toward artificial substrates containing an alkyl or hydrophobic chain as well as a glucosyl unit. Active MAT and GAT are homotrimers, with each subunit consisting of an N-terminal alpha-helical region and a C-terminal left-handed parallel alpha-helix (LbH) subdomain with 6 turns, each containing three imperfect tandem repeats of a hexapeptide repeat motif (X-[STAV]-X-[LIV]-[GAED]-X).	3.96023e-99
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	2.17511e-33
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	2.53577e-07
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|187792	cd09661, Cmr6_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr6. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	3.38689e-26
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	1.14321e-11
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	6.33103e-27
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	3.66461e-14
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	gnl\|CDD\|172889	PRK14413, PRK14413, glycerol-3-phosphate acyltransferase.	7.39905e-94

>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein
MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN
>NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator
MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase
MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI
>NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase
MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG
>NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein
MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV
>NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase
MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE
>NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein
MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII
>NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein
MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN
>NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase
MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK
>NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein
MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG
>NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK
>NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY
>NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein
MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES
>NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI
>NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3
MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI
>NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN
>NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein
MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_5

2309834-2310065

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAC	CRISPRCasFinder

3 spacers

cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7

The CRISPR arrays of NC_009495_5

>merge|NC_009495|5|2309834-2310065|CRISPRCasFinder
GCTTAAATACATATCATGTTAAGGTTCAACTGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTATATTTAAATACATTCTATATTACTGTTCAACAAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAAATTTAAATACATCTTATGTTACTGTTCAACACGAATAGGGGGTGATAAATATTGTTATTTGGACAAATATTTAAATACATCCTATGTTACTGTTCAACC

>NC_009495|5|5|2309834-2310065|CRISPRCasFinder
GCTTAAATACATATCATGTTAAGGTTCAAC	TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTAT
ATTTAAATACATTCTATATTACTGTTCAAC	AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAA
ATTTAAATACATCTTATGTTACTGTTCAAC	ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAAT
ATTTAAATACATCCTATGTTACTGTTCAACC

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	unknown	unknown	gnl\|CDD\|379790
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	unknown	unknown	gnl\|CDD\|227595
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|239241
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	cd09682_cmr4gr7_CAS-III-B	gnl\|CDD\|274210
NC_009495.1\|WP_011986669.1\|2314148_2314487_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	unknown	unknown	gnl\|CDD\|379767
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	pfam09700_cmr3gr5_CAS-III-B	gnl\|CDD\|273855
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	unknown	unknown	gnl\|CDD\|340904
NC_009495.1\|WP_012047734.1\|2302698_2303193_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	unknown	unknown	gnl\|CDD\|238518
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	unknown	unknown	gnl\|CDD\|100047
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	cmr5gr11	mkCas0098_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|187792
NC_009495.1\|WP_011986668.1\|2313663_2313957_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133378
NC_009495.1\|WP_011986675.1\|2319645_2320833_-\|hypothetical-protein	cmr1gr7	mkCas0086_cmr1gr7_CAS-III-B	unknown
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|172889

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_079995891.1\|2304164_2304527_+\|aminopeptidase-P-family-N-terminal-domain-containing-protein	gnl\|CDD\|379790	pfam16189, Creatinase_N_2, Creatinase/Prolidase N-terminal domain.	1.22915e-13
NC_009495.1\|WP_011986659.1\|2301427_2301916_+\|lipoprotein	gnl\|CDD\|227595	COG5270, COG5270, PUA domain (predicted RNA-binding domain) [Translation, ribosomal structure and biogenesis].	0.00289543
NC_009495.1\|WP_011986666.1\|2310724_2312722_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|239241	cd02931, ER_like_FMN, Enoate reductase (ER)-like FMN-binding domain. Enoate reductase catalyzes the NADH-dependent reduction of carbon-carbon double bonds of several molecules, including nonactivated 2-enoates, alpha,beta-unsaturated aldehydes, cyclic ketones, and methylketones. ERs are similar to 2,4-dienoyl-CoA reductase from E. coli and to the old yellow enzyme from Saccharomyces cerevisiae.	0
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|274210	TIGR02580, putative_CRISPR-associated_protein, CRISPR type III-B/RAMP module RAMP protein Cmr4. This model represents a CRISPR-associated protein from the family that includes TM1792 of Thermotoga maritima. This family is part of the broad RAMP superfamily (pfam03787) collection of CRISPR-associated proteins. It is the fourth of a recurring set of six proteins, four of are in the RAMP superfamily, that we designate the CRISPR RAMP module.	1.14208e-46
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|273855	TIGR01888, Hypothetical_protein_SSO1730, CRISPR type III-B/RAMP module-associated protein Cmr3. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This highly divergent family is found in at least ten different archaeal and bacterial species as part of the CRISPR RAMP modulue but is not a member of the RAMP superfamily itself. A typical example is TM1793 from Thermotoga maritima.	5.08335e-12
NC_009495.1\|WP_011986662.1\|2304857_2306264_+\|peptide-MFS-transporter	gnl\|CDD\|340904	cd17346, MFS_DtpA_like, Dipeptide and tripeptide permease A (DtpA)-like subfamily of the Major Facilitator Superfamily of transporters. The DtpA-like subfamily includes four Escherichia coli proteins: dipeptide and tripeptide permeases A (DtpA, TppB or YdgR), B (DtpB or YhiP), C (DtpC or YjdL), and D (DtpD or YbgH). They are proton-dependent permeases that transport di- and tripeptides. DtpA and DtpB display a preference for di- and tripeptides composed of L-amino acids. DtpC shows higher specificity for dipeptides compared to tripeptides, and prefers dipeptides containing a C-terminal lysine residue. The DtpA-like subfamily belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	1.11537e-120
NC_009495.1\|WP_011986665.1\|2308304_2308826_+\|DUF4825-domain-containing-protein	gnl\|CDD\|379767	pfam16107, DUF4825, Domain of unknown function (DUF4825). This domain forms the N-terminal, extracellular domain of some homologs of Staph BlaR1 proteases, where it replaces the penicillin-binding domain of BlaR1. It is also found in many uncharacterized proteins in a broad range of bacteria. Its association with BlaR1 homologs suggests it may be involved in substrate-, possibly antibiotic-binding, but this prediction has not been verified experimentally.	1.00606e-25
NC_009495.1\|WP_021134338.1\|2304610_2304784_+\|M24-family-metallopeptidase	gnl\|CDD\|238518	cd01085, APP, X-Prolyl Aminopeptidase 2. E.C. 3.4.11.9. Also known as X-Pro aminopeptidase, proline aminopeptidase, aminopeptidase P, and aminoacylproline aminopeptidase. Catalyses release of any N-terminal amino acid, including proline, that is linked with proline, even from a dipeptide or tripeptide.	3.56433e-13
NC_009495.1\|WP_011986661.1\|2303235_2303850_-\|sugar-O-acetyltransferase	gnl\|CDD\|100047	cd03357, LbH_MAT_GAT, Maltose O-acetyltransferase (MAT) and Galactoside O-acetyltransferase (GAT): MAT and GAT catalyze the CoA-dependent acetylation of the 6-hydroxyl group of their respective sugar substrates. MAT acetylates maltose and glucose exclusively at the C6 position of the nonreducing end glucosyl moiety. GAT specifically acetylates galactopyranosides. Furthermore, MAT shows higher affinity toward artificial substrates containing an alkyl or hydrophobic chain as well as a glucosyl unit. Active MAT and GAT are homotrimers, with each subunit consisting of an N-terminal alpha-helical region and a C-terminal left-handed parallel alpha-helix (LbH) subdomain with 6 turns, each containing three imperfect tandem repeats of a hexapeptide repeat motif (X-[STAV]-X-[LIV]-[GAED]-X).	3.96023e-99
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	2.17511e-33
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	2.53577e-07
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|187792	cd09661, Cmr6_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr6. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	3.38689e-26
NC_009495.1\|WP_011986663.1\|2306366_2307107_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	1.14321e-11
NC_009495.1\|WP_011986664.1\|2307113_2308004_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	6.33103e-27
NC_009495.1\|WP_011986667.1\|2312818_2313616_-\|MerR-family-transcriptional-regulator	gnl\|CDD\|133378	cd00592, HTH_MerR-like, Helix-Turn-Helix DNA binding domain of MerR-like transcription regulators. Helix-turn-helix (HTH) MerR-like transcription regulator, N-terminal domain. The MerR family transcription regulators have been shown to mediate responses to stress including exposure to heavy metals, drugs, or oxygen radicals in eubacterial and some archaeal species. They regulate transcription of multidrug/metal ion transporter genes and oxidative stress regulons by reconfiguring the spacer between the -35 and -10 promoter elements. A typical MerR regulator is comprised of two distinct domains that harbor the regulatory (effector-binding) site and the active (DNA-binding) site. Their N-terminal domains are homologous and contain a DNA-binding winged HTH motif, while the C-terminal domains are often dissimilar and bind specific coactivator molecules such as metal ions, drugs, and organic substrates.	3.66461e-14
NC_009495.1\|WP_011986658.1\|2300006_2300600_-\|glycerol-3-phosphate-acyltransferase	gnl\|CDD\|172889	PRK14413, PRK14413, glycerol-3-phosphate acyltransferase.	7.39905e-94

>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein
MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN
>NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator
MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER
>NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase
MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI
>NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter
MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK
>NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase
MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG
>NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein
MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV
>NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase
MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE
>NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein
MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII
>NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein
MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN
>NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase
MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK
>NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase
MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI
>NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator
MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI
>NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein
MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG
>NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK
>NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY
>NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein
MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES
>NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI
>NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3
MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI
>NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN
>NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein
MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_7

2323921-2324079

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAC	CRISPRCasFinder

2 spacers

cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7

The CRISPR arrays of NC_009495_7

>merge|NC_009495|7|2323921-2324079|CRISPRCasFinder
ATTTAAATACATCTCATGTTAATGTTCAACGGTTACTGGCTTTCTAATACATATAATTAAATTAGATTTAAATACATCTCATGTTAATGTTCAACCTATATAAAAGCCATTGGGAATTTTGTTTATACATTTAAATACATCTCATGTTAATGTTCAACC

>NC_009495|7|7|2323921-2324079|CRISPRCasFinder
ATTTAAATACATCTCATGTTAATGTTCAAC	GGTTACTGGCTTTCTAATACATATAATTAAATTAG
ATTTAAATACATCTCATGTTAATGTTCAAC	CTATATAAAAGCCATTGGGAATTTTGTTTATAC
ATTTAAATACATCTCATGTTAATGTTCAACC

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_011986676.1\|2320845_2322549_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|213357
NC_009495.1\|WP_011986684.1\|2333190_2333658_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|238045
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|187792
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	cd09682_cmr4gr7_CAS-III-B	gnl\|CDD\|274210
NC_009495.1\|WP_011986669.1\|2314148_2314487_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_162266011.1\|2324488_2324650_+\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986687.1\|2336683_2338027_-\|purine-permease	unknown	unknown	gnl\|CDD\|274468
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	pfam09700_cmr3gr5_CAS-III-B	gnl\|CDD\|273855
NC_009495.1\|WP_011986678.1\|2322994_2323684_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_009495.1\|WP_011986686.1\|2335122_2336475_-\|amidohydrolase	unknown	unknown	gnl\|CDD\|238623
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	cmr5gr11	mkCas0098_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_009495.1\|WP_012047739.1\|2333825_2334857_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|369561
NC_009495.1\|WP_011986683.1\|2332655_2333111_+\|staygreen-family-protein	unknown	unknown	gnl\|CDD\|378897
NC_009495.1\|WP_011986677.1\|2322600_2322975_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_012047738.1\|2327854_2328703_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_009495.1\|WP_011986682.1\|2330237_2331731_+\|PLP-dependent-aminotransferase-family-protein	unknown	unknown	gnl\|CDD\|224089
NC_009495.1\|WP_011986681.1\|2328993_2329914_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_009495.1\|WP_011986675.1\|2319645_2320833_-\|hypothetical-protein	cmr1gr7	mkCas0086_cmr1gr7_CAS-III-B	unknown
NC_009495.1\|WP_011986679.1\|2325422_2327078_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_011986676.1\|2320845_2322549_-\|hypothetical-protein	gnl\|CDD\|213357	cd12823, Mrs2_Mfm1p-like, Saccharomyces cerevisiae inner mitochondrial membrane Mg2+ transporters Mfm1p and Mrs2p-like family. A eukaryotic subfamily belonging to the Escherichia coli CorA-Salmonella typhimurium ZntB_like family (EcCorA_ZntB-like) family of the MIT superfamily of essential membrane proteins involved in transporting divalent cations (uptake or efflux) across membranes. This functionally diverse subfamily includes the inner mitochondrial membrane Mg2+ transporters Saccharomyces cerevisiae Mfm1p/Lpe10p, Mrs2p, and human MRS2/ MRS2L. It also includes a family of Arabidopsis thaliana proteins (AtMGTs) some of which are localized to distinct tissues, and not all of which can transport Mg2+. Structures of the intracellular domain of two EcCorA_ZntB-like family transporters: Vibrio parahaemolyticus and Salmonella typhimurium ZntB form funnel-shaped homopentamers, the tip of the funnel is formed from two C-terminal transmembrane (TM) helices from each monomer, and the large opening of the funnel from the N-terminal cytoplasmic domains. The GMN signature motif of the MIT superfamily occurs just after TM1, mutation within this motif is known to abolish Mg2+ transport through Salmonella typhimurium CorA, and Mrs2p. Natural variants such as GVN and GIN, as in some ZntB family proteins, may be associated with the transport of different divalent cations, such as zinc and cadmium. The functional diversity of MIT transporters may also be due to minor structural differences regulating gating, substrate selection, and transport.	0.00264746
NC_009495.1\|WP_011986684.1\|2333190_2333658_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	2.23324e-15
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|187792	cd09661, Cmr6_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr6. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	3.38689e-26
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|274210	TIGR02580, putative_CRISPR-associated_protein, CRISPR type III-B/RAMP module RAMP protein Cmr4. This model represents a CRISPR-associated protein from the family that includes TM1792 of Thermotoga maritima. This family is part of the broad RAMP superfamily (pfam03787) collection of CRISPR-associated proteins. It is the fourth of a recurring set of six proteins, four of are in the RAMP superfamily, that we designate the CRISPR RAMP module.	1.14208e-46
NC_009495.1\|WP_011986687.1\|2336683_2338027_-\|purine-permease	gnl\|CDD\|274468	TIGR03173, pbuX, xanthine permease. All the seed members of this model are observed adjacent to genes for either xanthine phosphoribosyltransferase (for the conversion of xanthine to guanine, GenProp0696) or genes for the conversion of xanthine to urate and its concomitant catabolism (GenProp0640, GenProp0688, GenProp0686 and GenProp0687). A number of sequences scoring higher than trusted to this model are found in different genomic contexts, and the possibility exist that these transport related compounds in addition to or instead of xanthine itself. The outgroup to this family are sequences which are characterized as uracil permeases or are adjacent to established uracil phosphoribosyltransferases.	1.61201e-137
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|273855	TIGR01888, Hypothetical_protein_SSO1730, CRISPR type III-B/RAMP module-associated protein Cmr3. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This highly divergent family is found in at least ten different archaeal and bacterial species as part of the CRISPR RAMP modulue but is not a member of the RAMP superfamily itself. A typical example is TM1793 from Thermotoga maritima.	5.08335e-12
NC_009495.1\|WP_011986678.1\|2322994_2323684_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	4.52022e-22
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	2.17511e-33
NC_009495.1\|WP_011986686.1\|2335122_2336475_-\|amidohydrolase	gnl\|CDD\|238623	cd01298, ATZ_TRZ_like, TRZ/ATZ family contains enzymes from the atrazine degradation pathway and related hydrolases. Atrazine, a chlorinated herbizide, can be catabolized by a variety of different bacteria. The first three steps of the atrazine dehalogenation pathway are catalyzed by atrazine chlorohydrolase (AtzA), hydroxyatrazine ethylaminohydrolase (AtzB), and N-isopropylammelide N-isopropylaminohydrolase (AtzC). All three enzymes belong to the superfamily of metal dependent hydrolases. AtzA and AtzB, beside other related enzymes are represented in this CD.	0
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	2.53577e-07
NC_009495.1\|WP_012047739.1\|2333825_2334857_-\|alpha/beta-hydrolase	gnl\|CDD\|369561	pfam07859, Abhydrolase_3, alpha/beta hydrolase fold. This catalytic domain is found in a very wide range of enzymes.	4.63467e-90
NC_009495.1\|WP_011986683.1\|2332655_2333111_+\|staygreen-family-protein	gnl\|CDD\|378897	pfam12638, Staygreen, Staygreen protein. This family of proteins have been implicated in chlorophyll degradation. Intriguingly members of this family are also found in non-photosynthetic bacteria.	2.29895e-84
NC_009495.1\|WP_011986679.1\|2325422_2327078_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	0.000420917
NC_009495.1\|WP_012047738.1\|2327854_2328703_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	2.02726e-60
NC_009495.1\|WP_011986682.1\|2330237_2331731_+\|PLP-dependent-aminotransferase-family-protein	gnl\|CDD\|224089	COG1167, ARO8, Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs [Transcription / Amino acid transport and metabolism].	4.97681e-118
NC_009495.1\|WP_011986681.1\|2328993_2329914_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	4.27346e-88

>NC_009495.1|WP_011986678.1|2322994_2323684_-|CRISPR-associated-endoribonuclease-Cas6
MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK
>NC_009495.1|WP_011986677.1|2322600_2322975_-|hypothetical-protein
MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK
>NC_009495.1|WP_011986676.1|2320845_2322549_-|hypothetical-protein
MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK
>NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein
MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK
>NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN
>NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3
MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI
>NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI
>NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein
MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES
>NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY
>NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein
MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK
>NC_009495.1|WP_162266011.1|2324488_2324650_+|hypothetical-protein
MLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE
>NC_009495.1|WP_011986679.1|2325422_2327078_-|AAA-family-ATPase
MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC
>NC_009495.1|WP_012047738.1|2327854_2328703_-|PhzF-family-phenazine-biosynthesis-protein
MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL
>NC_009495.1|WP_011986681.1|2328993_2329914_-|PhzF-family-phenazine-biosynthesis-protein
MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL
>NC_009495.1|WP_011986682.1|2330237_2331731_+|PLP-dependent-aminotransferase-family-protein
MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII
>NC_009495.1|WP_011986683.1|2332655_2333111_+|staygreen-family-protein
MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR
>NC_009495.1|WP_011986684.1|2333190_2333658_-|helix-turn-helix-transcriptional-regulator
MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI
>NC_009495.1|WP_012047739.1|2333825_2334857_-|alpha/beta-hydrolase
MKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK
>NC_009495.1|WP_011986686.1|2335122_2336475_-|amidohydrolase
MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF
>NC_009495.1|WP_011986687.1|2336683_2338027_-|purine-permease
MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_8

2324983-2325212

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATGTTCAAC	CRISPRCasFinder
TTTAAATACATCTCATGTTAATGTTCAAT	CRT
GTTTAAATACATCTCATGTTAATGTTCAATC	PILER-CR

3 spacers

cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7

The CRISPR arrays of NC_009495_8

>merge|NC_009495|8|2324983-2325212|CRISPRCasFinder,CRT,PILER-CR
TTTTCAATACATTTAATGTTAATGTTCAATAATAGAGTATTCAGATGAATATAAATTCTTGGAAGAATTTAAATACATCTCATGTTAATGTTCAATTAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAGTTTAAATACATCTCATGTTAATGTTCAATCGACCCTATAACAGTTTCAGAAGTAGAACAAAATATGTTTAAATACATCTCATGTTAATGTTCAATC

>NC_009495|8|8|2324983-2325211|CRISPRCasFinder
TTTTCAATACATTTAATGTTAATGTTCAAT	AATAGAGTATTCAGATGAATATAAATTCTTGGAAGA
ATTTAAATACATCTCATGTTAATGTTCAAT	TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAA
GTTTAAATACATCTCATGTTAATGTTCAAT	CGACCCTATAACAGTTTCAGAAGTAGAACAAAATAT
GTTTAAATACATCTCATGTTAATGTTCAAT

>NC_009495|8|3|2324984-2325211|CRT
TTTCAATACATTTAATGTTAATGTTCAAT	AATAGAGTATTCAGATGAATATAAATTCTTGGAAGAA
TTTAAATACATCTCATGTTAATGTTCAAT	TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAG
TTTAAATACATCTCATGTTAATGTTCAAT	CGACCCTATAACAGTTTCAGAAGTAGAACAAAATATG
TTTAAATACATCTCATGTTAATGTTCAAT

>NC_009495|8|2|2325050-2325212|PILER-CR
TTTAAATACATCTCATGTTAATGTTCAATTA	GAGGTGATTTTATATGAAAAAGGAAAACATAACAAG
TTTAAATACATCTCATGTTAATGTTCAATCG	ACCCTATAACAGTTTCAGAAGTAGAACAAAATATG
TTTAAATACATCTCATGTTAATGTTCAATC

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_011986676.1\|2320845_2322549_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|213357
NC_009495.1\|WP_011986684.1\|2333190_2333658_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|238045
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	cmr6gr7	cd09661_cmr6gr7_CAS-III-B	gnl\|CDD\|187792
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	cd09682_cmr4gr7_CAS-III-B	gnl\|CDD\|274210
NC_009495.1\|WP_012047740.1\|2338462_2339362_+\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_162266011.1\|2324488_2324650_+\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986687.1\|2336683_2338027_-\|purine-permease	unknown	unknown	gnl\|CDD\|274468
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	pfam09700_cmr3gr5_CAS-III-B	gnl\|CDD\|273855
NC_009495.1\|WP_011986678.1\|2322994_2323684_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_009495.1\|WP_011986686.1\|2335122_2336475_-\|amidohydrolase	unknown	unknown	gnl\|CDD\|238623
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	cmr5gr11	mkCas0098_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_009495.1\|WP_012047739.1\|2333825_2334857_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|369561
NC_009495.1\|WP_011986683.1\|2332655_2333111_+\|staygreen-family-protein	unknown	unknown	gnl\|CDD\|378897
NC_009495.1\|WP_011986677.1\|2322600_2322975_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_012047738.1\|2327854_2328703_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_009495.1\|WP_011986682.1\|2330237_2331731_+\|PLP-dependent-aminotransferase-family-protein	unknown	unknown	gnl\|CDD\|224089
NC_009495.1\|WP_011986681.1\|2328993_2329914_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_009495.1\|WP_011986675.1\|2319645_2320833_-\|hypothetical-protein	cmr1gr7	mkCas0086_cmr1gr7_CAS-III-B	unknown
NC_009495.1\|WP_011986679.1\|2325422_2327078_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_011986676.1\|2320845_2322549_-\|hypothetical-protein	gnl\|CDD\|213357	cd12823, Mrs2_Mfm1p-like, Saccharomyces cerevisiae inner mitochondrial membrane Mg2+ transporters Mfm1p and Mrs2p-like family. A eukaryotic subfamily belonging to the Escherichia coli CorA-Salmonella typhimurium ZntB_like family (EcCorA_ZntB-like) family of the MIT superfamily of essential membrane proteins involved in transporting divalent cations (uptake or efflux) across membranes. This functionally diverse subfamily includes the inner mitochondrial membrane Mg2+ transporters Saccharomyces cerevisiae Mfm1p/Lpe10p, Mrs2p, and human MRS2/ MRS2L. It also includes a family of Arabidopsis thaliana proteins (AtMGTs) some of which are localized to distinct tissues, and not all of which can transport Mg2+. Structures of the intracellular domain of two EcCorA_ZntB-like family transporters: Vibrio parahaemolyticus and Salmonella typhimurium ZntB form funnel-shaped homopentamers, the tip of the funnel is formed from two C-terminal transmembrane (TM) helices from each monomer, and the large opening of the funnel from the N-terminal cytoplasmic domains. The GMN signature motif of the MIT superfamily occurs just after TM1, mutation within this motif is known to abolish Mg2+ transport through Salmonella typhimurium CorA, and Mrs2p. Natural variants such as GVN and GIN, as in some ZntB family proteins, may be associated with the transport of different divalent cations, such as zinc and cadmium. The functional diversity of MIT transporters may also be due to minor structural differences regulating gating, substrate selection, and transport.	0.00264746
NC_009495.1\|WP_011986684.1\|2333190_2333658_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	2.23324e-15
NC_009495.1\|WP_011986670.1\|2314498_2315392_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr6	gnl\|CDD\|187792	cd09661, Cmr6_III-B, CRISPR/Cas system-associated RAMP superfamily protein Cmr6. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; This protein is a subunit of Cmr complex.	3.38689e-26
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|274210	TIGR02580, putative_CRISPR-associated_protein, CRISPR type III-B/RAMP module RAMP protein Cmr4. This model represents a CRISPR-associated protein from the family that includes TM1792 of Thermotoga maritima. This family is part of the broad RAMP superfamily (pfam03787) collection of CRISPR-associated proteins. It is the fourth of a recurring set of six proteins, four of are in the RAMP superfamily, that we designate the CRISPR RAMP module.	1.14208e-46
NC_009495.1\|WP_011986687.1\|2336683_2338027_-\|purine-permease	gnl\|CDD\|274468	TIGR03173, pbuX, xanthine permease. All the seed members of this model are observed adjacent to genes for either xanthine phosphoribosyltransferase (for the conversion of xanthine to guanine, GenProp0696) or genes for the conversion of xanthine to urate and its concomitant catabolism (GenProp0640, GenProp0688, GenProp0686 and GenProp0687). A number of sequences scoring higher than trusted to this model are found in different genomic contexts, and the possibility exist that these transport related compounds in addition to or instead of xanthine itself. The outgroup to this family are sequences which are characterized as uracil permeases or are adjacent to established uracil phosphoribosyltransferases.	1.61201e-137
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|273855	TIGR01888, Hypothetical_protein_SSO1730, CRISPR type III-B/RAMP module-associated protein Cmr3. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This highly divergent family is found in at least ten different archaeal and bacterial species as part of the CRISPR RAMP modulue but is not a member of the RAMP superfamily itself. A typical example is TM1793 from Thermotoga maritima.	5.08335e-12
NC_009495.1\|WP_011986678.1\|2322994_2323684_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	4.52022e-22
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	2.17511e-33
NC_009495.1\|WP_011986686.1\|2335122_2336475_-\|amidohydrolase	gnl\|CDD\|238623	cd01298, ATZ_TRZ_like, TRZ/ATZ family contains enzymes from the atrazine degradation pathway and related hydrolases. Atrazine, a chlorinated herbizide, can be catabolized by a variety of different bacteria. The first three steps of the atrazine dehalogenation pathway are catalyzed by atrazine chlorohydrolase (AtzA), hydroxyatrazine ethylaminohydrolase (AtzB), and N-isopropylammelide N-isopropylaminohydrolase (AtzC). All three enzymes belong to the superfamily of metal dependent hydrolases. AtzA and AtzB, beside other related enzymes are represented in this CD.	0
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	2.53577e-07
NC_009495.1\|WP_012047739.1\|2333825_2334857_-\|alpha/beta-hydrolase	gnl\|CDD\|369561	pfam07859, Abhydrolase_3, alpha/beta hydrolase fold. This catalytic domain is found in a very wide range of enzymes.	4.63467e-90
NC_009495.1\|WP_011986683.1\|2332655_2333111_+\|staygreen-family-protein	gnl\|CDD\|378897	pfam12638, Staygreen, Staygreen protein. This family of proteins have been implicated in chlorophyll degradation. Intriguingly members of this family are also found in non-photosynthetic bacteria.	2.29895e-84
NC_009495.1\|WP_011986679.1\|2325422_2327078_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	0.000420917
NC_009495.1\|WP_012047738.1\|2327854_2328703_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	2.02726e-60
NC_009495.1\|WP_011986682.1\|2330237_2331731_+\|PLP-dependent-aminotransferase-family-protein	gnl\|CDD\|224089	COG1167, ARO8, Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs [Transcription / Amino acid transport and metabolism].	4.97681e-118
NC_009495.1\|WP_011986681.1\|2328993_2329914_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	4.27346e-88

>NC_009495.1|WP_162266011.1|2324488_2324650_+|hypothetical-protein
MLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE
>NC_009495.1|WP_011986678.1|2322994_2323684_-|CRISPR-associated-endoribonuclease-Cas6
MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK
>NC_009495.1|WP_011986677.1|2322600_2322975_-|hypothetical-protein
MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK
>NC_009495.1|WP_011986676.1|2320845_2322549_-|hypothetical-protein
MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK
>NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein
MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK
>NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN
>NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3
MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI
>NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI
>NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein
MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES
>NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6
MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY
>NC_009495.1|WP_011986679.1|2325422_2327078_-|AAA-family-ATPase
MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC
>NC_009495.1|WP_012047738.1|2327854_2328703_-|PhzF-family-phenazine-biosynthesis-protein
MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL
>NC_009495.1|WP_011986681.1|2328993_2329914_-|PhzF-family-phenazine-biosynthesis-protein
MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL
>NC_009495.1|WP_011986682.1|2330237_2331731_+|PLP-dependent-aminotransferase-family-protein
MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII
>NC_009495.1|WP_011986683.1|2332655_2333111_+|staygreen-family-protein
MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR
>NC_009495.1|WP_011986684.1|2333190_2333658_-|helix-turn-helix-transcriptional-regulator
MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI
>NC_009495.1|WP_012047739.1|2333825_2334857_-|alpha/beta-hydrolase
MKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK
>NC_009495.1|WP_011986686.1|2335122_2336475_-|amidohydrolase
MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF
>NC_009495.1|WP_011986687.1|2336683_2338027_-|purine-permease
MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV
>NC_009495.1|WP_012047740.1|2338462_2339362_+|hypothetical-protein
MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_9

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_9

2327430-2327590

TypeIII

III-B

Consensus_repeat	Method
ATTTAAATACATCCTATGTTAATGTTCAAC	CRISPRCasFinder

2 spacers

cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11

The CRISPR arrays of NC_009495_9

>merge|NC_009495|9|2327430-2327590|CRISPRCasFinder
GCTTAAATACATCTTATGTTACTGTTCAACACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATAATTTAAATACATCCTATGTTAATGTTCAACTTTAATATTTTTTCTATATCCATAGGCTTAAAATCATTTAAATACATCCTATGTTAATGTTCAAC

>NC_009495|9|9|2327430-2327590|CRISPRCasFinder
GCTTAAATACATCTTATGTTACTGTTCAAC	ACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATA
ATTTAAATACATCCTATGTTAATGTTCAAC	TTTAATATTTTTTCTATATCCATAGGCTTAAAATC
ATTTAAATACATCCTATGTTAATGTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_011986676.1\|2320845_2322549_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|213357
NC_009495.1\|WP_011986684.1\|2333190_2333658_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|238045
NC_009495.1\|WP_011986687.1\|2336683_2338027_-\|purine-permease	unknown	unknown	gnl\|CDD\|274468
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	cmr4gr7	cd09682_cmr4gr7_CAS-III-B	gnl\|CDD\|274210
NC_009495.1\|WP_012047740.1\|2338462_2339362_+\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_162266011.1\|2324488_2324650_+\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	cmr3gr5	pfam09700_cmr3gr5_CAS-III-B	gnl\|CDD\|273855
NC_009495.1\|WP_011986678.1\|2322994_2323684_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	cas10	cls000742_cas10_CAS-III	gnl\|CDD\|187810
NC_009495.1\|WP_011986686.1\|2335122_2336475_-\|amidohydrolase	unknown	unknown	gnl\|CDD\|238623
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	cmr5gr11	mkCas0098_cmr5gr11_CAS-III-B	gnl\|CDD\|187880
NC_009495.1\|WP_012047739.1\|2333825_2334857_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|369561
NC_009495.1\|WP_011986683.1\|2332655_2333111_+\|staygreen-family-protein	unknown	unknown	gnl\|CDD\|378897
NC_009495.1\|WP_011986679.1\|2325422_2327078_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|313108
NC_009495.1\|WP_011986689.1\|2339702_2341022_+\|APC-family-permease	unknown	unknown	gnl\|CDD\|223605
NC_009495.1\|WP_012047738.1\|2327854_2328703_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_009495.1\|WP_011986682.1\|2330237_2331731_+\|PLP-dependent-aminotransferase-family-protein	unknown	unknown	gnl\|CDD\|224089
NC_009495.1\|WP_011986681.1\|2328993_2329914_-\|PhzF-family-phenazine-biosynthesis-protein	unknown	unknown	gnl\|CDD\|223461
NC_009495.1\|WP_011986675.1\|2319645_2320833_-\|hypothetical-protein	cmr1gr7	mkCas0086_cmr1gr7_CAS-III-B	unknown
NC_009495.1\|WP_011986677.1\|2322600_2322975_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_011986676.1\|2320845_2322549_-\|hypothetical-protein	gnl\|CDD\|213357	cd12823, Mrs2_Mfm1p-like, Saccharomyces cerevisiae inner mitochondrial membrane Mg2+ transporters Mfm1p and Mrs2p-like family. A eukaryotic subfamily belonging to the Escherichia coli CorA-Salmonella typhimurium ZntB_like family (EcCorA_ZntB-like) family of the MIT superfamily of essential membrane proteins involved in transporting divalent cations (uptake or efflux) across membranes. This functionally diverse subfamily includes the inner mitochondrial membrane Mg2+ transporters Saccharomyces cerevisiae Mfm1p/Lpe10p, Mrs2p, and human MRS2/ MRS2L. It also includes a family of Arabidopsis thaliana proteins (AtMGTs) some of which are localized to distinct tissues, and not all of which can transport Mg2+. Structures of the intracellular domain of two EcCorA_ZntB-like family transporters: Vibrio parahaemolyticus and Salmonella typhimurium ZntB form funnel-shaped homopentamers, the tip of the funnel is formed from two C-terminal transmembrane (TM) helices from each monomer, and the large opening of the funnel from the N-terminal cytoplasmic domains. The GMN signature motif of the MIT superfamily occurs just after TM1, mutation within this motif is known to abolish Mg2+ transport through Salmonella typhimurium CorA, and Mrs2p. Natural variants such as GVN and GIN, as in some ZntB family proteins, may be associated with the transport of different divalent cations, such as zinc and cadmium. The functional diversity of MIT transporters may also be due to minor structural differences regulating gating, substrate selection, and transport.	0.00264746
NC_009495.1\|WP_011986684.1\|2333190_2333658_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	2.23324e-15
NC_009495.1\|WP_011986681.1\|2328993_2329914_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	4.27346e-88
NC_009495.1\|WP_011986672.1\|2315865_2316705_-\|type-III-B-CRISPR-module-RAMP-protein-Cmr4	gnl\|CDD\|274210	TIGR02580, putative_CRISPR-associated_protein, CRISPR type III-B/RAMP module RAMP protein Cmr4. This model represents a CRISPR-associated protein from the family that includes TM1792 of Thermotoga maritima. This family is part of the broad RAMP superfamily (pfam03787) collection of CRISPR-associated proteins. It is the fourth of a recurring set of six proteins, four of are in the RAMP superfamily, that we designate the CRISPR RAMP module.	1.14208e-46
NC_009495.1\|WP_011986687.1\|2336683_2338027_-\|purine-permease	gnl\|CDD\|274468	TIGR03173, pbuX, xanthine permease. All the seed members of this model are observed adjacent to genes for either xanthine phosphoribosyltransferase (for the conversion of xanthine to guanine, GenProp0696) or genes for the conversion of xanthine to urate and its concomitant catabolism (GenProp0640, GenProp0688, GenProp0686 and GenProp0687). A number of sequences scoring higher than trusted to this model are found in different genomic contexts, and the possibility exist that these transport related compounds in addition to or instead of xanthine itself. The outgroup to this family are sequences which are characterized as uracil permeases or are adjacent to established uracil phosphoribosyltransferases.	1.61201e-137
NC_009495.1\|WP_011986673.1\|2316716_2317916_-\|CRISPR-associated-protein-Cmr3	gnl\|CDD\|273855	TIGR01888, Hypothetical_protein_SSO1730, CRISPR type III-B/RAMP module-associated protein Cmr3. CRISPR is a term for Clustered Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR associated) proteins. This highly divergent family is found in at least ten different archaeal and bacterial species as part of the CRISPR RAMP modulue but is not a member of the RAMP superfamily itself. A typical example is TM1793 from Thermotoga maritima.	5.08335e-12
NC_009495.1\|WP_011986678.1\|2322994_2323684_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	4.52022e-22
NC_009495.1\|WP_011986674.1\|2317932_2319645_-\|type-III-B-CRISPR-associated-protein-Cas10/Cmr2	gnl\|CDD\|187810	cd09679, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; MTH326-like has inactivated polymerase catalytic domain; alr1562 and slr7011 - predicted only on the basis of size, presence of HD domain, and location with RAMPs in one operon; signature gene for type III; also known as Crm2 family.	2.17511e-33
NC_009495.1\|WP_011986686.1\|2335122_2336475_-\|amidohydrolase	gnl\|CDD\|238623	cd01298, ATZ_TRZ_like, TRZ/ATZ family contains enzymes from the atrazine degradation pathway and related hydrolases. Atrazine, a chlorinated herbizide, can be catabolized by a variety of different bacteria. The first three steps of the atrazine dehalogenation pathway are catalyzed by atrazine chlorohydrolase (AtzA), hydroxyatrazine ethylaminohydrolase (AtzB), and N-isopropylammelide N-isopropylaminohydrolase (AtzC). All three enzymes belong to the superfamily of metal dependent hydrolases. AtzA and AtzB, beside other related enzymes are represented in this CD.	0
NC_009495.1\|WP_011986671.1\|2315403_2315838_-\|hypothetical-protein	gnl\|CDD\|187880	cd09749, Cmr5_III-B, CRISPR/Cas system-associated protein Cmr5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; signature gene for subtype III-B.	2.53577e-07
NC_009495.1\|WP_012047739.1\|2333825_2334857_-\|alpha/beta-hydrolase	gnl\|CDD\|369561	pfam07859, Abhydrolase_3, alpha/beta hydrolase fold. This catalytic domain is found in a very wide range of enzymes.	4.63467e-90
NC_009495.1\|WP_011986679.1\|2325422_2327078_-\|AAA-family-ATPase	gnl\|CDD\|313108	pfam09820, AAA-ATPase_like, Predicted AAA-ATPase. This family contains many hypothetical bacterial proteins. This family was previously the N-terminal part of the Pfam DUF1703 (pfam08011) family before it was split into two. This region is predicted to be an AAA-ATPase domain.	0.000420917
NC_009495.1\|WP_012047738.1\|2327854_2328703_-\|PhzF-family-phenazine-biosynthesis-protein	gnl\|CDD\|223461	COG0384, COG0384, Predicted epimerase, PhzC/PhzF homolog [General function prediction only].	2.02726e-60
NC_009495.1\|WP_011986682.1\|2330237_2331731_+\|PLP-dependent-aminotransferase-family-protein	gnl\|CDD\|224089	COG1167, ARO8, Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs [Transcription / Amino acid transport and metabolism].	4.97681e-118
NC_009495.1\|WP_011986683.1\|2332655_2333111_+\|staygreen-family-protein	gnl\|CDD\|378897	pfam12638, Staygreen, Staygreen protein. This family of proteins have been implicated in chlorophyll degradation. Intriguingly members of this family are also found in non-photosynthetic bacteria.	2.29895e-84
NC_009495.1\|WP_011986689.1\|2339702_2341022_+\|APC-family-permease	gnl\|CDD\|223605	COG0531, PotE, Amino acid transporters [Amino acid transport and metabolism].	4.6355e-27

>NC_009495.1|WP_011986679.1|2325422_2327078_-|AAA-family-ATPase
MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC
>NC_009495.1|WP_162266011.1|2324488_2324650_+|hypothetical-protein
MLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE
>NC_009495.1|WP_011986678.1|2322994_2323684_-|CRISPR-associated-endoribonuclease-Cas6
MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK
>NC_009495.1|WP_011986677.1|2322600_2322975_-|hypothetical-protein
MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK
>NC_009495.1|WP_011986676.1|2320845_2322549_-|hypothetical-protein
MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK
>NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein
MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK
>NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2
MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN
>NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3
MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI
>NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4
MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI
>NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein
MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES
>NC_009495.1|WP_012047738.1|2327854_2328703_-|PhzF-family-phenazine-biosynthesis-protein
MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL
>NC_009495.1|WP_011986681.1|2328993_2329914_-|PhzF-family-phenazine-biosynthesis-protein
MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL
>NC_009495.1|WP_011986682.1|2330237_2331731_+|PLP-dependent-aminotransferase-family-protein
MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII
>NC_009495.1|WP_011986683.1|2332655_2333111_+|staygreen-family-protein
MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR
>NC_009495.1|WP_011986684.1|2333190_2333658_-|helix-turn-helix-transcriptional-regulator
MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI
>NC_009495.1|WP_012047739.1|2333825_2334857_-|alpha/beta-hydrolase
MKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK
>NC_009495.1|WP_011986686.1|2335122_2336475_-|amidohydrolase
MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF
>NC_009495.1|WP_011986687.1|2336683_2338027_-|purine-permease
MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV
>NC_009495.1|WP_012047740.1|2338462_2339362_+|hypothetical-protein
MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR
>NC_009495.1|WP_011986689.1|2339702_2341022_+|APC-family-permease
MLEKKYGLWTTVSMVIGIVIGSGVFFKADNILMASGGNVKTALLAWLVGAISMIFGALVFAECANRFERSNGIVDYAEGMLSEKFAYLIGWFNGIIYYPAIAAVLAWAAGNYTAILFNKDGNFVWIMAAIYMIGIYILNYISPILSGKFQIASTAIKLVPLMLIAILGTFQGLNNGILIENFSKVSTIGDSGSGFAAAVLGAAFAYEGWIIATTINGEIKDAKNTLPKALVFGSLVIVIIYILYFLGIVGMIPTETILKQGDNTVNVAARTVFGNFGASILTTFIIVSCLGTLNGLILGGSRSFYSLAIRGQGIKPEAFSKLDSKTNIPTNSTIANFILICIYLVVWYMNFKGLFPNKMFVDISELPIALIYGIYIIIYIAYMMKMKDLSFIKRFVIPSLALMGALIVVYGGLSKPSVIIDLGISVFVFLSGLLFYNKK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_009495_10

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_009495_10

3774243-3774350

Unclear

Consensus_repeat	Method
AGGACTTGAACCTACGACACTTCGGGT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_009495_10

>merge|NC_009495|10|3774243-3774350|CRISPRCasFinder
AGGACTTGAACCTACGACACTTCGGGTATGAACCGAATGCTCTAGCCAGCTGAGCTATTCCGCCACAATGGTTGCGGGGGCAGGACTTGAACCTACGACCTTCGGGTT

>NC_009495|10|10|3774243-3774350|CRISPRCasFinder
AGGACTTGAACCTACGACACTTCGGGT	ATGAACCGAATGCTCTAGCCAGCTGAGCTATTCCGCCACAATGGTTGCGGGGGC
AGGACTTGAACCTACGACCTTCGGGTT

Protein	Signature genes	Signature genes Name	Protein_function
NC_009495.1\|WP_003359471.1\|3774620_3775025_-\|RNA-binding-protein-S1	unknown	unknown	gnl\|CDD\|235614
NC_009495.1\|WP_012099544.1\|3776992_3778438_-\|nucleoside-triphosphate-pyrophosphohydrolase	unknown	unknown	gnl\|CDD\|226465
NC_009495.1\|WP_012048382.1\|3780870_3781881_-\|peptidylprolyl-isomerase	unknown	unknown	gnl\|CDD\|234605
NC_009495.1\|WP_003359327.1\|3767543_3769349_-\|ATP-dependent-zinc-metalloprotease-FtsH	unknown	unknown	gnl\|CDD\|273520
NC_009495.1\|WP_012048371.1\|3760732_3762247_-\|lysine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234778
NC_009495.1\|WP_012048377.1\|3771514_3773902_-\|stage-II-sporulation-protein-E	unknown	unknown	gnl\|CDD\|274328
NC_009495.1\|WP_003359412.1\|3769430_3769976_-\|hypoxanthine-phosphoribosyltransferase	unknown	unknown	gnl\|CDD\|223707
NC_009495.1\|WP_003359333.1\|3776586_3776865_-\|HU-family-DNA-binding-protein	unknown	unknown	gnl\|CDD\|259853
NC_009495.1\|WP_012048376.1\|3769959_3771366_-\|tRNA-lysidine(34)-synthetase-TilS	unknown	unknown	gnl\|CDD\|274129
NC_009495.1\|WP_003359440.1\|3775450_3775849_-\|spore-cortex-biosynthesis-protein-YabQ	unknown	unknown	gnl\|CDD\|131939
NC_009495.1\|WP_003359441.1\|3764736_3765513_-\|type-III-pantothenate-kinase	unknown	unknown	gnl\|CDD\|237347
NC_009495.1\|WP_012048381.1\|3778452_3779988_-\|polysaccharide-biosynthesis-protein	unknown	unknown	gnl\|CDD\|240529
NC_009495.1\|WP_003359411.1\|3780120_3780672_-\|stage-V-sporulation-protein-T	unknown	unknown	gnl\|CDD\|131898
NC_009495.1\|WP_012048375.1\|3765667_3767341_-\|formate--tetrahydrofolate-ligase	unknown	unknown	gnl\|CDD\|376511
NC_009495.1\|WP_012048372.1\|3762265_3762748_-\|transcription-elongation-factor-GreA	unknown	unknown	gnl\|CDD\|234693
NC_009495.1\|WP_012048374.1\|3763755_3764727_-\|tRNA-dihydrouridine-synthase-DusB	unknown	unknown	gnl\|CDD\|129820
NC_009495.1\|WP_012048379.1\|3776273_3776513_-\|RNA-binding-S4-domain-containing-protein	unknown	unknown	gnl\|CDD\|224109
NC_009495.1\|WP_012048373.1\|3762878_3763706_-\|hypothetical-protein	unknown	unknown	unknown
NC_009495.1\|WP_003359350.1\|3775086_3775356_-\|septum-formation-initiator-family-protein	unknown	unknown	gnl\|CDD\|368217
NC_009495.1\|WP_003361720.1\|3775863_3776154_-\|sporulation-protein-YabP	unknown	unknown	gnl\|CDD\|274341

Protein	Function_ID	Function_description	E-value
NC_009495.1\|WP_003359471.1\|3774620_3775025_-\|RNA-binding-protein-S1	gnl\|CDD\|235614	PRK05807, PRK05807, RNA-binding protein S1.	4.75791e-79
NC_009495.1\|WP_012099544.1\|3776992_3778438_-\|nucleoside-triphosphate-pyrophosphohydrolase	gnl\|CDD\|226465	COG3956, COG3956, Protein containing tetrapyrrole methyltransferase domain and MazG-like (predicted pyrophosphatase) domain [General function prediction only].	0
NC_009495.1\|WP_012048382.1\|3780870_3781881_-\|peptidylprolyl-isomerase	gnl\|CDD\|234605	PRK00059, prsA, peptidylprolyl isomerase; Provisional.	1.06851e-146
NC_009495.1\|WP_003359327.1\|3767543_3769349_-\|ATP-dependent-zinc-metalloprotease-FtsH	gnl\|CDD\|273520	TIGR01241, ATP-dependent_zinc_metalloprotease_FtsH, ATP-dependent metalloprotease FtsH. HflB(FtsH) is a pleiotropic protein required for correct cell division in bacteria. It has ATP-dependent zinc metalloprotease activity. It was formerly designated cell division protein FtsH. [Cellular processes, Cell division, Protein fate, Degradation of proteins, peptides, and glycopeptides].	0
NC_009495.1\|WP_012048371.1\|3760732_3762247_-\|lysine--tRNA-ligase	gnl\|CDD\|234778	PRK00484, lysS, lysyl-tRNA synthetase; Reviewed.	0
NC_009495.1\|WP_012048377.1\|3771514_3773902_-\|stage-II-sporulation-protein-E	gnl\|CDD\|274328	TIGR02865, Stage_II_sporulation_protein_E, stage II sporulation protein E. Stage II sporulation protein E (SpoIIE) is a multiple membrane spanning protein with two separable functions. It plays a role in the switch to polar cell division during sporulation. By means of it protein phosphatase activity, located in the C-terminal region, it activates sigma-F. All proteins that score above the trusted cutoff to this model are found in endospore-forming Gram-positive bacteria. Surprisingly, a sequence from the Cyanobacterium-like (and presumably non-spore-forming) photosynthesizer Heliobacillus mobilis is homologous, and scores between the trusted and noise cutoffs. [Cellular processes, Sporulation and germination].	0
NC_009495.1\|WP_003359412.1\|3769430_3769976_-\|hypoxanthine-phosphoribosyltransferase	gnl\|CDD\|223707	COG0634, Hpt, Hypoxanthine-guanine phosphoribosyltransferase [Nucleotide transport and metabolism].	3.43574e-93
NC_009495.1\|WP_003359333.1\|3776586_3776865_-\|HU-family-DNA-binding-protein	gnl\|CDD\|259853	cd13831, HU, histone-like DNA-binding protein HU. This subfamily includes HU and HU-like domains. HU is a conserved nucleoid-associated protein (NAP) which binds non-specifically to duplex DNA with a particular preference for targeting nicked and bent DNA. It is highly basic and contributes to chromosomal compaction and maintenance of negative supercoiling, thus often referred to as histone-like protein. HU can induce DNA bends, condense DNA in a fiber and also interact with single stranded DNA. It contains two homologous subunits, alpha and beta, typically forming homodimers (alpha-alpha and beta-beta), except in E. coli and other enterobacteria, which form heterodimers (alpha-beta). In E. coli, HU binds uniformly to the chromosome, with a preference for damaged or distorted DNA structures and can introduce negative supercoils into closed circular DNA in the presence of topoisomerase I. Anabaena HU (AHU) shows preference for A/T-rich region in the center of its DNA binding site.	4.45296e-40
NC_009495.1\|WP_012048376.1\|3769959_3771366_-\|tRNA-lysidine(34)-synthetase-TilS	gnl\|CDD\|274129	TIGR02432, tRNAIle-lysidine_synthase, tRNA(Ile)-lysidine synthetase, N-terminal domain. The only examples in which the wobble position of a tRNA must discriminate between G and A of mRNA are AUA (Ile) vs. AUG (Met) and UGA (stop) vs. UGG (Trp). In all bacteria, the wobble position of the tRNA(Ile) recognizing AUA is lysidine, a lysine derivative of cytidine. This family describes a protein domain found, apparently, in all bacteria in a single copy. Eukaryotic sequences appear to be organellar. The domain archictecture of this protein family is variable; some, including characterized proteins of E. coli and B. subtilis known to be tRNA(Ile)-lysidine synthetase, include a conserved 50-residue domain that many other members lack. This protein belongs to the ATP-binding PP-loop family ( pfam01171). It appears in the literature and protein databases as TilS, YacA, and putative cell cycle protein MesJ (a misnomer). [Protein synthesis, tRNA and rRNA base modification].	1.58034e-72
NC_009495.1\|WP_003359440.1\|3775450_3775849_-\|spore-cortex-biosynthesis-protein-YabQ	gnl\|CDD\|131939	TIGR02893, Spore_protein_YabQ, spore cortex biosynthesis protein YabQ. YabQ, a protein predicted to span the membrane several times, is found in exactly those genomes whose species perform sporulation in the style of Bacillus subtilis, Clostridium tetani, and others of the Firmicutes. Mutation of this sigma(E)-dependent gene blocks development of the spore cortex. The length of the C-terminal region, including some hydrophobic regions, is rather variable between members. [Cellular processes, Sporulation and germination].	1.7502e-26
NC_009495.1\|WP_003359441.1\|3764736_3765513_-\|type-III-pantothenate-kinase	gnl\|CDD\|237347	PRK13318, PRK13318, type III pantothenate kinase.	7.15192e-153
NC_009495.1\|WP_012048381.1\|3778452_3779988_-\|polysaccharide-biosynthesis-protein	gnl\|CDD\|240529	cd13124, MATE_SpoVB_like, Stage V sporulation protein B, also known as Stage III sporulation protein F, and related proteins. The integral membrane protein SpoVB has been implicated in the biosynthesis of the peptidoglycan component of the spore cortex in Bacillus subtilis. This model represents a subfamily of the multidrug and toxic compound extrusion (MATE)-like proteins. Proteins from the MATE family are involved in exporting metabolites across the cell membrane and are often responsible for multidrug resistance (MDR).	1.53349e-137
NC_009495.1\|WP_003359411.1\|3780120_3780672_-\|stage-V-sporulation-protein-T	gnl\|CDD\|131898	TIGR02851, stage_V_sporulation_protein_T, stage V sporulation protein T. Members of this protein family are the stage V sporulation protein T (SpoVT), a protein of the sporulation/germination program in Bacillus subtilis and related species. The amino-terminal 50 amino acids are nearly perfectly conserved across all endospore-forming bacteria. SpoVT is a DNA-binding transcriptional regulator related to AbrB (See pfam04014). [Regulatory functions, DNA interactions, Cellular processes, Sporulation and germination].	1.03643e-93
NC_009495.1\|WP_012048375.1\|3765667_3767341_-\|formate--tetrahydrofolate-ligase	gnl\|CDD\|376511	pfam01268, FTHFS, Formate--tetrahydrofolate ligase.	0
NC_009495.1\|WP_012048372.1\|3762265_3762748_-\|transcription-elongation-factor-GreA	gnl\|CDD\|234693	PRK00226, greA, transcription elongation factor GreA; Reviewed.	2.43881e-75
NC_009495.1\|WP_012048374.1\|3763755_3764727_-\|tRNA-dihydrouridine-synthase-DusB	gnl\|CDD\|129820	TIGR00737, Probable_tRNA-dihydrouridine_synthase, putative TIM-barrel protein, nifR3 family. This model represents one branch of COG0042 (Predicted TIM-barrel enzymes, possibly dehydrogenases, nifR3 family). This branch includes NifR3 itself, from Rhodobacter capsulatus. It excludes a broadly distributed but more sparsely populated subfamily that contains sll0926 from Synechocystis PCC6803, HI0634 from Haemophilus influenzae, and BB0225 from Borrelia burgdorferi. It also excludes a shorter and more distant archaeal subfamily.The function of nifR3, a member of this family, is unknown, but it is found in an operon with nitrogen-sensing two component regulators in Rhodobacter capsulatus.Members of this family show a distant relationship to alpha/beta (TIM) barrel enzymes such as dihydroorotate dehydrogenase and glycolate oxidase. [Unknown function, General].	5.84434e-128
NC_009495.1\|WP_012048379.1\|3776273_3776513_-\|RNA-binding-S4-domain-containing-protein	gnl\|CDD\|224109	COG1188, COG1188, Ribosome-associated heat shock protein implicated in the recycling of the 50S subunit (S4 paralog) [Translation, ribosomal structure and biogenesis].	1.13439e-24
NC_009495.1\|WP_003359350.1\|3775086_3775356_-\|septum-formation-initiator-family-protein	gnl\|CDD\|368217	pfam04977, DivIC, Septum formation initiator. DivIC from B. subtilis is necessary for both vegetative and sporulation septum formation. These proteins are mainly composed of an amino terminal coiled-coil.	3.85886e-08
NC_009495.1\|WP_003361720.1\|3775863_3776154_-\|sporulation-protein-YabP	gnl\|CDD\|274341	TIGR02892, conserved_hypothetical_protein, sporulation protein YabP. Members of this protein family are the YabP protein of the bacterial sporulation program, as found in Bacillus subtilis, Clostridium tetani, and other spore-forming members of the Firmicutes. In Bacillus subtilis, a yabP single mutant appears to sporulate and germinate normally (), but is in an operon with yabQ (essential for formation of the spore cortex), it near-universal among endospore-forming bacteria, and is found nowhere else. It is likely, therefore, that YabP does have a function in sporulation or germination, one that is either unappreciated or partially redundant with that of another protein. [Cellular processes, Sporulation and germination].	5.3622e-31

>NC_009495.1|WP_012048377.1|3771514_3773902_-|stage-II-sporulation-protein-E
MQYGAELLPYQRLKKIDKQKYKKSINFSSIVNMIIFFISSFLVSRVIFINNMAPFGIAFLLSISRQKEYNKYLFISAVGSIVGYISLINNIGYISLNMLEVVTITLLSYVFKNVEDKKNTIIICMIIYLEIFTYKIFVTKISTTMAMLGATFEIGCIFPIYYIINYSILCFKNMNTSHLYSNEEIVSMAITLSLVVSGTWGANIAGINLMNLISITMILIIGYVKGSTSASAIGVAMGAISGLSSNNMMIYISIYGLCGLISGVFKETGKLMTGISYLVSFLILKFYSNINYDFKIIEVLISLTLFYIIPNKIYMKMEYELDYQKKQKNLQENYMDKIKGIITDKLGNFSDVLYNMGNILEKLVDNEKLAMKNKSGALIENLADRVCSSCNMNHICWKREGYYTYNALGELIQNYQENKKELPYEIERKCVKRTQLINNTEDIANNYIINEMWKKRLSECREVLANQINTMAYSVEEITKEFGQSIRFSNLTEKDIRRMLNKNNIKYKDIFCYNNENGRLIINLKIDACTGKQKCVKEILPLINKVTGKLMCVANESCNLDLKNNDCNIIFEETPKYHVASYVNKMAKDGEQCNGDSYSFGKLQSGSYMTIISDGMGSGPQAVQESSAVVELIERFAQSGFSKITAINTINSIMSIKFSQDEKFSTVDLSNIDLYEGKIDFMKVGAVASFIKRGTEVYTIRSKTLPIGVLDKVDIDIETRDLKNGDIIVMVSDGVLDYESSSAGKVEWVVEFLKNTTLNNPKEISEELIENAKKLSKGKVKDDMTAIVQKVYSLY
>NC_009495.1|WP_012048376.1|3769959_3771366_-|tRNA-lysidine(34)-synthetase-TilS
MKDVVINTIKKYNMIEANDKIIVGVSGGPDSMCLLHMLCLLKNQLRIKDIYVAHINHGVRGAESDADEKYVENFCYTNNLGFFSKTINMDKIAKEKGISSESAGREARYDFFNYLRKELGAQKIATAHNANDQAETVLMRIMRGTGLQGLIGINPIRDDLYIRPLINVLREDIENYCDKYELNPRIDKTNLQSIYTRNRIRLELIPYIKDNFNEDIVNTLCRFSNIVSKDNNYLEEVSKDKFERYCTKKLQRVIIDKRAFLEHESISTRILREAILYINQNLYNLEMRNIYDVLELSLNTTGKFVNLPSNIKAENIYGDIHLYKEDNFIKKVNNVQCELKIGFNQVEDLNINLKIYSIKDHNYNINDNKYIQYFDYDKVSNEKIYLRNRKNGDKFTPLGMKGSKKLKDFFIDSKIPREQRDKLKLVCFGEEIAWIIGCRTGNNFKIDKNTKNVLEITVERGEANGFDK
>NC_009495.1|WP_003359412.1|3769430_3769976_-|hypoxanthine-phosphoribosyltransferase
MDLISRDIEKILISEEQIQSKINELGDQISKDYDGKNLMLVGILKGSVPFMADLLKRITIPCTMDFMAVSSYGNSTTSSGVVRILKDLDFEIEGKDILIVEDIIDSGITLKYLLENLRARKPASINIACLLNKEERRKAEIDVHYLGFNVPDYFLVGYGLDFAEKYRNLPYIGILKEEVYK
>NC_009495.1|WP_003359327.1|3767543_3769349_-|ATP-dependent-zinc-metalloprotease-FtsH
MKKFSSATAWIVVLILVIFSSLMLVRTGTNSTAINFSEFQKSWIQNEIKSFQVKDDKMTVVGTLKDGKQYETIVPSERLFQFINEHPKNGEVKEVYVKPASVPIWVQYLPMILIVLMLLGFWFMFMQQAQGGGGNRNVMNFGKSKAKMATPDKKKVTFDDVAGADEEKEELAEIVDFLKSPKRYIDMGARIPKGVLLVGPPGTGKTLLAKAIAGEAGVPFFSISGSDFVEMFVGVGASRVRDLFEQAKKNSPCIIFIDEIDAVGRQRGAGLGGGHDEREQTLNQLLVEMDGFGANEGIIMIAATNRPDILDPALLRPGRFDRQIVVGAPDVKGREAILKVHSKNKHLAEEISLGILAKRTPGFTGADLENLMNESALLAVRKRKELIDMEDLEEAVTRVIAGPEKKSRVIDEEDRKLTAYHEAGHAVVMKLLPHADPVHQISIVPRGMAGGYTMHLPEKDSSYMSKSKLEDEIVGLLGGRVAEKLIIGDISTGAKNDIDRATTIARKMVMDYGMSNTLGPIAFGSGHDEVFLGRDLGKGRNFSEDVAYKIDQEIKKLIDTGYNEAERLLNENISKLHAVAQELLKKEKLEADEFEEIFKNS
>NC_009495.1|WP_012048375.1|3765667_3767341_-|formate--tetrahydrofolate-ligase
MFKSDIEIAQESKMKNIKNIAEKIGLTEEDIDLYGKYKCKISLDVLKRNKDKKDGKLILVTAINPTPAGEGKSTVTVGLGQALWKKNKKAVIALREPSLGPVFGIKGGAAGGGYSQVVPMEDINLHFTGDMHAITSANNLLAAAIDNHIHQGNILKIDQRRILFKRVMDMNDRALRNVIVALGGKINGFPREDGFMITVASEIMAILCLAEDLMDLKNKMGEILVAYSTEGKPIYCEDLEVQGAMALLMKDAIKPNLVQTLENTPAIIHGGPFANIAHGCNSILGTKMALKLGDYVITEAGFGADLGAEKFFDIKCRKANLKPNCVVIVATVRALKYNGGIPKENLKEQNMEALSKGIKNLGKHIENVNKFGVPAVVAINKFISDTEEEIEFIKKYCKELGAEVSIAEVWEKGGNGGLELADKVLDTIENKESKFNPIYEETLSIKQKIETIAEEIYGAEGVDYSKEAEKQISEIEKLDLDKKPVCMAKTQYSLSDDAKLLGRPCGFRINVKEVRISNGAGFIVVLTGNVMTMPGLPKKPAANNMNVLSDGNIVGLF
>NC_009495.1|WP_003359441.1|3764736_3765513_-|type-III-pantothenate-kinase
MILVLDVGNTNIVLGIYKNKELIANWRLATDNKRTADEYGIQVIELFSHNNLSFSDIEGVIISSVVPNIMYSLEHMISKYFNIKPIIVGPGVKTGINIKYDNPKEVGADRIVNAVAAHEIYKKPLIIIDFGTATTFCAVTKEANYLGGTICPGIKISSDALFDKAAKLPRVELVKTPGVICKNTVASIQSGIIYGYAGQVDYIVSKMKKEMMDLGEEEPFVVATGGFAKLISEESKSIDEINAILTLEGLRVIYEKNK
>NC_009495.1|WP_012048374.1|3763755_3764727_-|tRNA-dihydrouridine-synthase-DusB
MNIGNLIFHNNVFLAPMAGFTDIAFREICKELGCGLVYTEMVSAKALYYESNNTKELCVISNKEKPVALQLFGHEPEIMANAVEFFNNNDDVCILDVNMGCPAPKIVKNGDGSALMKDPKLASEIIKAMKKVAKKPITVKFRKGFDKNNINAVEFAKIMEQSGVDAITIHGRTREQMYEGKADWAIISKVKNSVSIPVIGNGDVFSSEDALEMINKTYCDGIMIGRGAQGNPWIFKQINEKIKGEHVYYPTPQERIDICINHYKKSLEYFEEHKAVREMRKHVAVYVKGLKNCTDIKDKVNMEKDPDKVLEELIKYRETLREF
>NC_009495.1|WP_012048373.1|3762878_3763706_-|hypothetical-protein
MKPIIDISSNIIKDYNKNNFIFKIKDEFLTHFRGNCFIEELNLVISKVRISPNFNEKAYHKNIKRSIKYSRHKDFVLAPKTFRFLDYYLLNSFQKELFALSVCESIKTVLRLKGKTIRNSCIVIFDAKEEYVFNIINCVSKEAKYIILVSEDLNKLANLNDYIIANYGITPIITKDTKASFSKADFIITTKDVEIMKDIPVWYINNSKIYKNKGNCNINNIIYKVPWKTNLNFNPELLGAILCQMDKKNVEEAIRYNGIVLDKIMFNKDIVKIIR
>NC_009495.1|WP_012048372.1|3762265_3762748_-|transcription-elongation-factor-GreA
MSEAKKYVMTYEGVKKLEEELEFLKTVKRKEITEKIKVALSFGDLSENSEYDEAKNEQAFVEGRIIQLENMLKNASIVDENEVPKDVVSVGSIVKVKDYEFDEEVEYIIVGSAEADPMNNKISNESPVGHGLIGKKAGDIIEVAVPDGVSKYEILEVNRA
>NC_009495.1|WP_012048371.1|3760732_3762247_-|lysine--tRNA-ligase
MSKEDNVMNSFEEQANELMKERFQKLKELQSNGKDPFDVYKVERTHTSKEVKENYEDLEGKTVTVAGRLMSKRVHGKAGFSDIHDRYGKIQLYIKINDVGEEKLKEYKTFDIGDIISVTGTVFKTKTGETSIHITDFQLVCKSLRPLPEKWHGLKDPDLRYRQRYVDLIINQDVRDTFMKRTAIIKTMREYLDNKGFLEVETPILSPIAGGAAAKPFITHHNALNIDMYLRIATELYLKRLIVGGFEKVYEIGRNFRNEGMDIRHNPEFTVIELYEAYADYNDMMEITENMIAYICEKVLGTTKVQYEGTEIDFTPPWRRLTMVDAVREYAGVDFNTIKDDIEARTIAKEKHIEFKKELKDCTKGDVLIGLFEEFCEDKLMQPTFICDYPVENSPLTKKKRGNEAFTERFEGFVFGREVCNAYSELNDSIVQKERFMQQLKERELGDDEAYMMDDDFITSLEVGMPPTGGLGIGIDRLIMFLTDTHSIRDVILFPTMKPQPNNQ
>NC_009495.1|WP_003359471.1|3774620_3775025_-|RNA-binding-protein-S1
MTLNAGSILEGTVVNITNFGAFVEIEGKTGLVHISEVSDSYVKDIREYLKEQDKVKVKVISIDDKGKISLSIKQAMQQKKSCKPAEIDWSREKPKKNEANFEDRLSKFLKDSEERFQDLKKHQDSRGRGSKKSY
>NC_009495.1|WP_003359350.1|3775086_3775356_-|septum-formation-initiator-family-protein
MKKINVKKLIFFLAIVYSTVIFINQQITMHKIRDQISEKKIELKEVKEKNQKLQDEVKLSKSKDYIEKLARERLRLIKKGETPVINNTQ
>NC_009495.1|WP_003359440.1|3775450_3775849_-|spore-cortex-biosynthesis-protein-YabQ
MVISISKQLGLLIFSFLSGLITGVFFDIYRSIRMDKNLSPIIKIIEDILFWCLAAIVIFIFLLYNDCAFIGVYVYLWIAIGLYIYIFFISKYLNPIFIYVVQNINKFFRISINIIVYPFKILIYKIKSNKMH
>NC_009495.1|WP_003361720.1|3775863_3776154_-|sporulation-protein-YabP
MEKKEFKNDDKISNLNLESRKKLILSGINEVISFNEEEIMLKTTLGDLDIKGSNLKMNKLDVQNGDVVIVGTINSCTYLNNESKANRSNIFSKLFK
>NC_009495.1|WP_012048379.1|3776273_3776513_-|RNA-binding-S4-domain-containing-protein
MRLDKFLKVSRIIKRRTVAKEACENERVFVNSKIAKPGTEVKEGDILEIQYANKTMKYEIISVLEHVKKEDAENMYKII
>NC_009495.1|WP_003359333.1|3776586_3776865_-|HU-family-DNA-binding-protein
MNKSELITSMAEKSKLTKKDAETALKAFIESVEEALEGGEKVQLVGFGTFETRERAERVGRNPRTKEEITIPASIAPVFKAGKELKEKVNKK
>NC_009495.1|WP_012099544.1|3776992_3778438_-|nucleoside-triphosphate-pyrophosphohydrolase
MINIIGLGPGSKESITLGTIDSLKTVDKVFLRTEKHPTVEYINKLGITYETFDGEYEVGESFDDVYNSIAKSLIEASKNYSDIIYAVPGHPLVAEKSVDILIKLCRQNDIKFKILPAVSFVDALMESLLLDPVEGLKIIDAFDIKKQAMDKRIGTIITQVYDKFIASEVKLNLMNYYKDDTEIFFVRAAGIEGLEEIRKIPLYELDRQHNIDHLTSVYIPKVPNNNYDFMDLLDIMDKLRGEDGCPWDREQTHVSLKKYLIEESYEVIEAIDNKDVDMLIEELGDVLLQVVFHSQIGKEDGFFEIKDVIQSICDKMINRHPHVFGDLEINNSIEVLENWDKIKSKEQGTETYTDSIRHIAKTLPALMRADKVQKKASKVGFDWDNIEDAMKKIIEEYKEIEDVYKSKNKVKILEEIGDLLFSVVNVARFLDIDPENALNYSIDKFINRFQYIEDEAISMGRQLDNMSLEEMDKLWKEAKNK
>NC_009495.1|WP_012048381.1|3778452_3779988_-|polysaccharide-biosynthesis-protein
MKKQSLIKGTFILGVAGIIAKFLGLFFRWPLQMLIGDEGIGYYQMSYPLYMFFIAAASGIPVAVSKLVSERNAVRDEGGIISVLKEAMIFMFIMGMGFTIILLLFSKDIIRFLKWDTRSYYSLIGISLAPLFISIMSVFRGFFQGMQNMNYTAISQLIEQLGRVIFGVGLAYILLPKGIEYSAGGAAIGAAAGGLLGGIYLFLKYLGVKKEFRVKKVKRNFKIMNTILYTAIPISIGSAVGTIMSLIDSALVPQKLLEAGFTYKQSTILYGQLTGKAFTLVNVPLTLSVSLCAALVPIIAEDYILNRKMAVLKKVELAIKISMVIAVPSCLGLNFMAKPILNLIFPGQEAGYEILKHLALSIPFIVLCQTSTAILQGIGRYIRPIINLCIGCILKIVITLILVPMNNINIYGAVIGTIAGYVISAILNMMSLKRSLNISINYYEIMIKPLIASTIMIIAVVFIYFYAYNYTISSKIACLIAVFLGMIIYFIIIGLIGILDYNYIKRKIIKR
>NC_009495.1|WP_003359411.1|3780120_3780672_-|stage-V-sporulation-protein-T
MKATGIVRRIDDLGRVVIPKEIRRTLRIREGDPLEIFTDREGGVILKKYSPIGDLSEFSKGYTDSLQQTIGNIIMICDKDTIISISGAPKKEYLEKKISYDLEKIIEERKTVYFGDDNKAVSIYDDEDVDEKYSAQVISPIIAEGDTVGAVIIVSKEGGKKFNELEMKLAETASSFLGKQMEE
>NC_009495.1|WP_012048382.1|3780870_3781881_-|peptidylprolyl-isomerase
MKSAKKLLSVLCLGIFILTFTACDMVEKTPEAKAKSTIAKVNGEKIQRKDLDESPSMQQVLSQIKTQYGEEFEKSEQGKEVIKEQKKQILENLITEKVLLQKGKELKVIPKDEELNKEADKKVNEIKAVYNNDEKKFEETLKSTGFTKETLKEYLRDQIVIEKVINEVTKDVKVEDKDAQKYYNENQSMFTEKPNTMNVSHILVKTEDEAKKVKKRLDAKEDFAKVAKEVSQDPGSKDKGGLLGDISYSDSNYDPTFMKAAIALKEGTISNPVHTQWGYHIIKVNSKKEYPVKKFDSVKEDIKKQLKQEKQQEAYTKKIEEWKKASKIKTYEKNLL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_009495_2	2.4\|2302276\|36\|NC_009495\|CRISPRCasFinder,CRT	2302276-2302311	36	NC_012654	Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence	174503-174538	0	1.0
NC_009495_2	2.4\|2302276\|36\|NC_009495\|CRISPRCasFinder,CRT	2302276-2302311	36	NZ_CP006909	Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence	62802-62837	0	1.0
NC_009495_2	2.4\|2302276\|36\|NC_009495\|CRISPRCasFinder,CRT	2302276-2302311	36	NZ_CP031095	Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence	207645-207680	0	1.0
NC_009495_4	4.1\|2309650\|36\|NC_009495\|CRISPRCasFinder	2309650-2309685	36	NZ_CP014152	Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence	149447-149482	0	1.0
NC_009495_4	4.1\|2309650\|36\|NC_009495\|CRISPRCasFinder	2309650-2309685	36	NZ_CP013684	Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence	128281-128316	0	1.0
NC_009495_4	4.1\|2309650\|36\|NC_009495\|CRISPRCasFinder	2309650-2309685	36	NZ_CP013710	Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence	129903-129938	0	1.0
NC_009495_4	4.1\|2309650\|36\|NC_009495\|CRISPRCasFinder	2309650-2309685	36	NC_010379	Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence	80344-80379	0	1.0
NC_009495_4	4.1\|2309650\|36\|NC_009495\|CRISPRCasFinder	2309650-2309685	36	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	37712-37747	0	1.0
NC_009495_2	2.4\|2302276\|36\|NC_009495\|CRISPRCasFinder,CRT	2302276-2302311	36	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	219276-219311	1	0.972
NC_009495_4	4.1\|2309650\|36\|NC_009495\|CRISPRCasFinder	2309650-2309685	36	NZ_CP013700	Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence	47769-47804	2	0.944
NC_009495_8	8.1\|2325013\|36\|NC_009495\|CRISPRCasFinder	2325013-2325048	36	GU949551	Clostridium phage phiCD6356, complete genome	4906-4941	2	0.944
NC_009495_2	2.2\|2302145\|35\|NC_009495\|CRISPRCasFinder,CRT	2302145-2302179	35	NC_010379	Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence	30926-30960	3	0.914
NC_009495_2	2.2\|2302145\|35\|NC_009495\|CRISPRCasFinder,CRT	2302145-2302179	35	NC_010418	Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence	163878-163912	3	0.914
NC_009495_8	8.4\|2325013\|37\|NC_009495\|CRT	2325013-2325049	37	GU949551	Clostridium phage phiCD6356, complete genome	4906-4942	3	0.919
NC_009495_8	8.8\|2325148\|35\|NC_009495\|PILER-CR	2325148-2325182	35	NZ_CP013844	Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence	17536-17570	4	0.886
NC_009495_8	8.3\|2325146\|36\|NC_009495\|CRISPRCasFinder	2325146-2325181	36	NZ_CP013844	Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence	17535-17570	5	0.861
NC_009495_8	8.6\|2325146\|37\|NC_009495\|CRT	2325146-2325182	37	NZ_CP013844	Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence	17535-17571	6	0.838
NC_009495_8	8.8\|2325148\|35\|NC_009495\|PILER-CR	2325148-2325182	35	MN693403	Marine virus AFVG_25M412, complete genome	14464-14498	6	0.829
NC_009495_9	9.2\|2327526\|35\|NC_009495\|CRISPRCasFinder	2327526-2327560	35	MN694042	Marine virus AFVG_250M538, complete genome	50649-50683	7	0.8
NC_009495_2	2.3\|2302210\|36\|NC_009495\|CRISPRCasFinder,CRT	2302210-2302245	36	MT795651	Vibrio phage vB_VnaS-AQKL99, complete genome	5039-5074	8	0.778
NC_009495_9	9.2\|2327526\|35\|NC_009495\|CRISPRCasFinder	2327526-2327560	35	NZ_CP054613	Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence	1277029-1277063	8	0.771
NC_009495_8	8.3\|2325146\|36\|NC_009495\|CRISPRCasFinder	2325146-2325181	36	MN693403	Marine virus AFVG_25M412, complete genome	14464-14499	10	0.722
NC_009495_1	1.2\|1897951\|40\|NC_009495\|CRISPRCasFinder	1897951-1897990	40	NC_018689	Bacillus thuringiensis MC28 plasmid pMC429, complete sequence	417214-417253	11	0.725
NC_009495_8	8.6\|2325146\|37\|NC_009495\|CRT	2325146-2325182	37	MN693403	Marine virus AFVG_25M412, complete genome	14463-14499	11	0.703

1. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 0, identity: 1.0

atttcatcaaatccgcatcaataaatgagataaact	CRISPR spacer
atttcatcaaatccgcatcaataaatgagataaact	Protospacer
************************************

2. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 0, identity: 1.0

atttcatcaaatccgcatcaataaatgagataaact	CRISPR spacer
atttcatcaaatccgcatcaataaatgagataaact	Protospacer
************************************

3. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 0, identity: 1.0

atttcatcaaatccgcatcaataaatgagataaact	CRISPR spacer
atttcatcaaatccgcatcaataaatgagataaact	Protospacer
************************************

4. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 0, identity: 1.0

atgttgtaaatgttgtggtataacagaatgtaaata	CRISPR spacer
atgttgtaaatgttgtggtataacagaatgtaaata	Protospacer
************************************

5. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 0, identity: 1.0

atgttgtaaatgttgtggtataacagaatgtaaata	CRISPR spacer
atgttgtaaatgttgtggtataacagaatgtaaata	Protospacer
************************************

6. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 0, identity: 1.0

atgttgtaaatgttgtggtataacagaatgtaaata	CRISPR spacer
atgttgtaaatgttgtggtataacagaatgtaaata	Protospacer
************************************

7. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 0, identity: 1.0

atgttgtaaatgttgtggtataacagaatgtaaata	CRISPR spacer
atgttgtaaatgttgtggtataacagaatgtaaata	Protospacer
************************************

8. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 0, identity: 1.0

atgttgtaaatgttgtggtataacagaatgtaaata	CRISPR spacer
atgttgtaaatgttgtggtataacagaatgtaaata	Protospacer
************************************

9. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 1, identity: 0.972

atttcatcaaatccgcatcaataaatgagataaact	CRISPR spacer
atttcatcaaatccgcatcaataaatgagattaact	Protospacer
******************************* ****

10. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 2, identity: 0.944

atgttgtaaatgttgtggtataacagaatgtaaata	CRISPR spacer
atgttgtaagtgttgtagtataacagaatgtaaata	Protospacer
*********.******.*******************

11. spacer 8.1|2325013|36|NC_009495|CRISPRCasFinder matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 2, identity: 0.944

aatagagtattcagatgaatataaattcttggaaga	CRISPR spacer
aatagagtattcagatgaatataagttcttagaaga	Protospacer
************************.*****.*****

12. spacer 2.2|2302145|35|NC_009495|CRISPRCasFinder,CRT matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.914

cttaaatatataggtatagatcaagacgctaaaga	CRISPR spacer
ttgaaatatataggcatagatcaagacgctaaaga	Protospacer
.* ***********.********************

13. spacer 2.2|2302145|35|NC_009495|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 3, identity: 0.914

cttaaatatataggtatagatcaagacgctaaaga	CRISPR spacer
ttgaaatatataggcatagatcaagacgctaaaga	Protospacer
.* ***********.********************

14. spacer 8.4|2325013|37|NC_009495|CRT matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 3, identity: 0.919

aatagagtattcagatgaatataaattcttggaagaa	CRISPR spacer
aatagagtattcagatgaatataagttcttagaagat	Protospacer
************************.*****.*****

15. spacer 8.8|2325148|35|NC_009495|PILER-CR matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 4, identity: 0.886

gaccctataacagtttcagaagtagaacaaaatat	CRISPR spacer
aaatctataacagtttcagaagtagaaaaaaatat	Protospacer
.* .*********************** *******

16. spacer 8.3|2325146|36|NC_009495|CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 5, identity: 0.861

cgaccctataacagtttcagaagtagaacaaaatat	CRISPR spacer
taaatctataacagtttcagaagtagaaaaaaatat	Protospacer
..* .*********************** *******

17. spacer 8.6|2325146|37|NC_009495|CRT matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 6, identity: 0.838

cgaccctataacagtttcagaagtagaacaaaatatg	CRISPR spacer
taaatctataacagtttcagaagtagaaaaaaatata	Protospacer
..* .*********************** *******.

18. spacer 8.8|2325148|35|NC_009495|PILER-CR matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 6, identity: 0.829

gacccta-taacagtttcagaagtagaacaaaatat	CRISPR spacer
-acagtactaacagcttcagaagtagcacaaaattt	Protospacer
 **  ** ******.*********** ******* *

19. spacer 9.2|2327526|35|NC_009495|CRISPRCasFinder matches to MN694042 (Marine virus AFVG_250M538, complete genome) position: , mismatch: 7, identity: 0.8

tttaatattttttctatatccataggcttaaaatc	CRISPR spacer
tttaatatttcttctttatccatagtgtttataac	Protospacer
**********.**** *********  ** * * *

20. spacer 2.3|2302210|36|NC_009495|CRISPRCasFinder,CRT matches to MT795651 (Vibrio phage vB_VnaS-AQKL99, complete genome) position: , mismatch: 8, identity: 0.778

tcttaacctttaattacattatatattataagttca	CRISPR spacer
gcttaacctttaaatacattatacattaccaaccca	Protospacer
 ************ *********.****. *...**

21. spacer 9.2|2327526|35|NC_009495|CRISPRCasFinder matches to NZ_CP054613 (Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence) position: , mismatch: 8, identity: 0.771

tttaatattttttctatatccataggcttaaaatc--	CRISPR spacer
agtaatattttttctatattcataggc--agcttccg	Protospacer
  *****************.*******  *.  **

22. spacer 8.3|2325146|36|NC_009495|CRISPRCasFinder matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 10, identity: 0.722

cgaccctataacagtttcagaagtagaacaaaatat	CRISPR spacer
cacagtactaacagcttcagaagtagcacaaaattt	Protospacer
*.   .  ******.*********** ******* *

23. spacer 1.2|1897951|40|NC_009495|CRISPRCasFinder matches to NC_018689 (Bacillus thuringiensis MC28 plasmid pMC429, complete sequence) position: , mismatch: 11, identity: 0.725

tatttaaaggatttaaactta---catcatttagatctaagag	CRISPR spacer
tatttaaaggatttaaacttagttcattacataggttatc---	Protospacer
*********************   ***.*. ***.*.

24. spacer 8.6|2325146|37|NC_009495|CRT matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 11, identity: 0.703

cgaccctataacagtttcagaagtagaacaaaatatg	CRISPR spacer
cacagtactaacagcttcagaagtagcacaaaatttt	Protospacer
*.   .  ******.*********** ******* *

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

901880 : 913599

Clostridium_botulinum_D_phage(50.0%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_011948507.1\|901880_903761_-	botulinum neurotoxin hemagglutinin HA70 subunit	Q786X9	Clostridium_botulinum_D_phage	1.3e-240	68.5
WP_003356711.1\|903774_904215_-	hemagglutinin	Q786Y1	Clostridium_botulinum_D_phage	1.9e-46	63.0
WP_011948508.1\|904277_905159_-	ricin-type beta-trefoil lectin domain protein	Q38196	Clostridium_botulinum_phage	3.5e-39	36.7
WP_011948509.1\|905385_905922_+	botulinum neurotoxin transcription-activating sigma factor BotR	Q9ZWV5	Clostridium_botulinum_D_phage	2.1e-39	52.2
WP_011948510.1\|906083_909665_+	non-toxic nonhemagglutinin NTNH	Q332E1	Clostridium_botulinum_C_phage	0.0e+00	66.2
WP_011948511.1\|909708_913599_+	botulinum neurotoxin type A	Q332E0	Clostridium_botulinum_C_phage	5.8e-179	32.5

DBSCAN-SWA_2

1684282 : 1691348

uncultured_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_011949098.1\|1684282_1685227_-	YafY family transcriptional regulator	A0A1B0RXM1	Streptococcus_phage	4.2e-14	31.6
WP_011949099.1\|1685850_1686846_+	2-hydroxyacyl-CoA dehydratase	NA	NA	NA	NA
WP_003358645.1\|1686962_1687724_+	2-hydroxyglutaryl-CoA dehydratase	NA	NA	NA	NA
WP_011949100.1\|1687741_1688173_+	6-carboxytetrahydropterin synthase QueD	A0A1U9WRB3	Streptococcus_virus	4.0e-12	32.4
WP_011949101.1\|1688174_1688840_+	putative 7-carboxy-7-deazaguanine synthase QueE	S4TZT1	uncultured_phage	1.7e-38	44.1
WP_004451708.1\|1688843_1689434_+	GTP cyclohydrolase I FolE	S4U0J3	uncultured_phage	7.0e-44	52.8
WP_011949102.1\|1689617_1690277_+	7-cyano-7-deazaguanine synthase QueC	A0A2H4J8Q7	uncultured_Caudovirales_phage	3.0e-59	51.2
WP_011949103.1\|1690391_1691348_+	methyl-accepting chemotaxis protein	A0A2H4J162	uncultured_Caudovirales_phage	1.0e-15	33.5

DBSCAN-SWA_3

1822763 : 1878926

Clostridium_phage(81.25%)

terminase,capsid,plate,coat,tail,portal,head,integrase

attL 1807218:1807237|attR 1866679:1866698

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1807218:1807237	attL	NA	NA	NA	NA
WP_012047593.1\|1822763_1823813_-\|integrase	site-specific integrase	Q8SBN2	Clostridium_phage	2.1e-128	63.8
WP_164928177.1\|1823799_1824021_-	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_012047595.1\|1824207_1824567_-	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_003395988.1\|1825015_1825216_+	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_012047597.1\|1825216_1825915_+	phage regulatory protein	A0A0A7RVQ9	Clostridium_phage	1.0e-41	49.2
WP_003395994.1\|1825916_1826084_+	hypothetical protein	Q8SBM7	Clostridium_phage	7.8e-09	51.9
WP_012047598.1\|1826096_1826450_+	hypothetical protein	NA	NA	NA	NA
WP_012721227.1\|1826442_1826610_+	hypothetical protein	NA	NA	NA	NA
WP_164928178.1\|1826612_1826861_+	hypothetical protein	NA	NA	NA	NA
WP_012047600.1\|1827050_1827362_+	hypothetical protein	NA	NA	NA	NA
WP_012047601.1\|1827361_1827580_+	hypothetical protein	NA	NA	NA	NA
WP_012047603.1\|1827712_1828210_+	host-nuclease inhibitor Gam family protein	A0A0A7S0G6	Clostridium_phage	1.4e-37	51.9
WP_012047604.1\|1828209_1828758_+	ERF family protein	B6SBX8	Clostridium_virus	1.0e-52	63.5
WP_012047605.1\|1828759_1829044_+	hypothetical protein	NA	NA	NA	NA
WP_012047606.1\|1829054_1829948_+	phage replisome organizer N-terminal domain-containing protein	A0A0A7RTL4	Clostridium_phage	3.4e-58	59.3
WP_012047607.1\|1829877_1830645_+	ATP-binding protein	M9Q1J4	Clostridium_phage	1.4e-47	45.6
WP_012720701.1\|1830658_1830853_+	hypothetical protein	A0A0M3ULL3	Bacillus_phage	1.4e-06	56.6
WP_012047609.1\|1830865_1831168_+	hypothetical protein	NA	NA	NA	NA
WP_012047610.1\|1831233_1831953_+	hypothetical protein	A0A2H4J6H9	uncultured_Caudovirales_phage	1.2e-48	43.0
WP_193345349.1\|1831970_1832417_+	phage N-6-adenine-methyltransferase	A0A0A7RUD1	Clostridium_phage	4.0e-68	84.3
WP_012047612.1\|1832483_1832645_+	hypothetical protein	NA	NA	NA	NA
WP_003359708.1\|1832709_1832973_+	hypothetical protein	NA	NA	NA	NA
WP_012047614.1\|1833004_1833322_+	hypothetical protein	NA	NA	NA	NA
WP_012047615.1\|1833351_1833504_+	hypothetical protein	NA	NA	NA	NA
WP_012047616.1\|1833571_1833754_+	hypothetical protein	NA	NA	NA	NA
WP_012047617.1\|1833775_1834054_+	DUF4406 domain-containing protein	A0A088C4A2	Shewanella_sp._phage	3.1e-10	42.0
WP_012047618.1\|1834118_1834430_+	hypothetical protein	NA	NA	NA	NA
WP_012047619.1\|1834483_1834648_+	hypothetical protein	NA	NA	NA	NA
WP_012047620.1\|1834664_1834937_+	hypothetical protein	NA	NA	NA	NA
WP_012047621.1\|1834995_1835205_+	hypothetical protein	NA	NA	NA	NA
WP_162485245.1\|1835309_1835678_+	hypothetical protein	A0A0A7RVR5	Clostridium_phage	2.8e-19	40.3
WP_012721244.1\|1835691_1835856_+	hypothetical protein	NA	NA	NA	NA
WP_012047623.1\|1835852_1836254_+	RusA family crossover junction endodeoxyribonuclease	A0A090D860	Clostridium_phage	1.2e-31	52.3
WP_012047624.1\|1836253_1836679_+	YopX family protein	A8ASP1	Listeria_phage	2.7e-13	37.9
WP_012047625.1\|1836681_1837008_+	hypothetical protein	A0A0A7RWJ7	Clostridium_phage	2.5e-19	47.6
WP_012047626.1\|1837018_1837156_+	hypothetical protein	NA	NA	NA	NA
WP_012047627.1\|1837157_1837316_+	hypothetical protein	NA	NA	NA	NA
WP_012721207.1\|1837437_1837848_+	hypothetical protein	NA	NA	NA	NA
WP_012047629.1\|1837951_1838107_+	hypothetical protein	NA	NA	NA	NA
WP_012047630.1\|1838106_1838727_+	hypothetical protein	NA	NA	NA	NA
WP_012047631.1\|1838719_1839235_+	sigma-70 family RNA polymerase sigma factor	A0A0A7RVX8	Clostridium_phage	2.0e-18	48.0
WP_012047632.1\|1839378_1839531_+	hypothetical protein	NA	NA	NA	NA
WP_012047633.1\|1839801_1839942_+	hypothetical protein	NA	NA	NA	NA
WP_012047634.1\|1840110_1840383_+	hypothetical protein	NA	NA	NA	NA
WP_012047635.1\|1840423_1840858_+\|terminase	terminase small subunit	S5MA50	Brevibacillus_phage	2.1e-37	60.6
WP_012047636.1\|1840850_1842110_+\|terminase	PBSX family phage terminase large subunit	B6CXD2	Clostridium_phage	1.0e-100	47.2
WP_012047637.1\|1842123_1843566_+\|portal	phage portal protein	A0A0A7S074	Clostridium_phage	1.9e-244	86.2
WP_164928179.1\|1843555_1844578_+\|capsid	minor capsid protein	A0A0A7RVY7	Clostridium_phage	3.7e-149	77.6
WP_012047639.1\|1844600_1844894_+	hypothetical protein	A0A0A7RTF2	Clostridium_phage	2.0e-39	79.8
WP_012047640.1\|1844904_1845147_+	phage protein	NA	NA	NA	NA
WP_012047641.1\|1845263_1845863_+	phage scaffolding protein	A0A0A7S0J5	Clostridium_phage	4.2e-20	38.2
WP_012047642.1\|1845882_1846848_+\|coat	coat protein	A0A0A7RVZ1	Clostridium_phage	2.2e-140	77.6
WP_012047643.1\|1846861_1847206_+\|head,tail	phage head-tail connector protein	A0A0A7RTX9	Clostridium_phage	1.4e-49	86.8
WP_012047644.1\|1847207_1847591_+	hypothetical protein	A0A0A7S083	Clostridium_phage	5.7e-55	84.3
WP_012047645.1\|1847590_1848082_+	HK97 gp10 family phage protein	A0A0A7RTT0	Clostridium_phage	3.6e-62	75.3
WP_012047646.1\|1848068_1848527_+	hypothetical protein	A0A0A7RTI2	Clostridium_phage	2.9e-53	77.7
WP_012720654.1\|1848516_1848687_+	hypothetical protein	A0A0A7RTV4	Clostridium_phage	2.4e-13	71.2
WP_012047647.1\|1848688_1849999_+\|tail	phage tail sheath subtilisin-like domain-containing protein	A0A0A7S087	Clostridium_phage	6.7e-212	84.9
WP_012047648.1\|1850002_1850467_+\|tail	phage tail tube protein	A0A0A7RVP1	Clostridium_phage	6.0e-67	80.5
WP_012047649.1\|1850483_1850897_+	hypothetical protein	A0A0A7RTN3	Clostridium_phage	1.1e-51	74.8
WP_012047650.1\|1851137_1851716_+	hypothetical protein	A0A0A7RTT9	Clostridium_phage	8.6e-55	55.6
WP_012047651.1\|1851803_1853966_+	hypothetical protein	A0A0A7S091	Clostridium_phage	3.5e-149	52.1
WP_012047652.1\|1853965_1854643_+	LysM peptidoglycan-binding domain-containing protein	A0A0A7RVP5	Clostridium_phage	4.5e-95	76.8
WP_012047653.1\|1854654_1855629_+	hypothetical protein	A0A0A7RTZ4	Clostridium_phage	3.0e-156	84.3
WP_012047654.1\|1855638_1855989_+	DUF2577 domain-containing protein	A0A0A7RTJ2	Clostridium_phage	8.1e-40	77.2
WP_012047655.1\|1855985_1856393_+	DUF2634 domain-containing protein	A0A0A7RTH1	Clostridium_phage	9.1e-51	77.7
WP_012047656.1\|1856393_1857488_+\|plate	baseplate J/gp47 family protein	A0A0A7S096	Clostridium_phage	1.0e-157	75.8
WP_012047657.1\|1857468_1858095_+	DUF2313 domain-containing protein	A0A0A7RVP9	Clostridium_phage	9.3e-87	75.6
WP_012047658.1\|1858098_1859793_+\|tail	phage tail protein	A0A0A7RTP0	Clostridium_phage	6.9e-60	64.6
WP_003357937.1\|1859825_1860218_+	hypothetical protein	B6SBV4	Clostridium_virus	4.5e-07	37.6
WP_003357857.1\|1860210_1860333_+	XkdX family protein	A0A0A7S0E7	Clostridium_phage	4.5e-06	57.5
WP_012047659.1\|1860728_1860923_+	hypothetical protein	A0A0A7RU02	Clostridium_phage	6.0e-29	100.0
WP_012721094.1\|1861209_1861965_+	hypothetical protein	NA	NA	NA	NA
WP_012047661.1\|1861987_1862212_+	hemolysin XhlA family protein	A0A0A7RWP8	Clostridium_phage	1.1e-29	87.8
WP_003494435.1\|1862225_1862420_+	hypothetical protein	NA	NA	NA	NA
WP_012047662.1\|1862460_1863222_+	N-acetylmuramoyl-L-alanine amidase	I1TJX3	Clostridium_phage	3.8e-50	56.5
WP_012047663.1\|1863408_1863630_+	hypothetical protein	NA	NA	NA	NA
WP_012047664.1\|1863924_1864065_+	hypothetical protein	NA	NA	NA	NA
WP_012047666.1\|1864239_1864422_+	hypothetical protein	A0A0A7RTH9	Clostridium_phage	7.7e-10	63.2
WP_012047667.1\|1864432_1864678_+	hypothetical protein	NA	NA	NA	NA
WP_011986310.1\|1866034_1866622_-	3'-5' exonuclease	NA	NA	NA	NA
WP_011986311.1\|1866916_1867867_+	DUF1002 domain-containing protein	NA	NA	NA	NA
1866679:1866698	attR	NA	NA	NA	NA
WP_011986312.1\|1868138_1868774_+	class I SAM-dependent methyltransferase	NA	NA	NA	NA
WP_011986313.1\|1868921_1869362_-	Hsp20/alpha crystallin family protein	NA	NA	NA	NA
WP_011986314.1\|1869712_1870897_+	MFS transporter	NA	NA	NA	NA
WP_011986315.1\|1871047_1871611_+	TetR/AcrR family transcriptional regulator	NA	NA	NA	NA
WP_011986316.1\|1871810_1872716_+	1-phosphofructokinase	NA	NA	NA	NA
WP_011986317.1\|1872832_1874212_-	peptide MFS transporter	A0A0P0IY73	Acinetobacter_phage	6.2e-51	29.5
WP_011986318.1\|1874806_1874962_+	hypothetical protein	NA	NA	NA	NA
WP_011986319.1\|1875113_1876088_+	hypothetical protein	NA	NA	NA	NA
WP_011986320.1\|1876198_1876732_-	amidase domain-containing protein	NA	NA	NA	NA
WP_003359020.1\|1876994_1877150_+	hypothetical protein	NA	NA	NA	NA
WP_011986321.1\|1877186_1878146_+	bifunctional hydroxymethylpyrimidine kinase/phosphomethylpyrimidine kinase	NA	NA	NA	NA
WP_011986322.1\|1878290_1878926_-\|coat	SafA/ExsA family spore coat assembly protein	A0A0E3JT82	Bacillus_phage	3.0e-40	45.6

DBSCAN-SWA_4

2474630 : 2506923

uncultured_Caudovirales_phage(50.0%)

terminase,plate,capsid,tail,portal,integrase

attL 2478955:2478970|attR 2507941:2507956

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012047778.1\|2474630_2475722_-	ATP-binding protein	R4TQL5	Phaeocystis_globosa_virus	1.7e-14	27.6
WP_012047779.1\|2476130_2476937_-	hypothetical protein	NA	NA	NA	NA
WP_012047780.1\|2477045_2477807_-	N-acetylmuramoyl-L-alanine amidase	I1TJX3	Clostridium_phage	1.6e-48	54.3
WP_003494435.1\|2477846_2478041_-	hypothetical protein	NA	NA	NA	NA
WP_012047781.1\|2478054_2478309_-	hemolysin XhlA family protein	A0A0A7RTX0	Clostridium_phage	9.7e-27	74.7
WP_164928187.1\|2478333_2479347_-	DNA (cytosine-5-)-methyltransferase	A0A219UR24	Bacillus_phage	4.7e-64	39.8
2478955:2478970	attL	NA	NA	NA	NA
WP_003400227.1\|2479464_2479587_-	XkdX family protein	A0A0A7S0E7	Clostridium_phage	5.9e-06	55.0
WP_012047783.1\|2479579_2479933_-	hypothetical protein	A0A0A7RTN0	Clostridium_phage	3.7e-08	67.4
WP_012047784.1\|2479945_2481631_-\|tail	phage tail protein	A0A0A7RTQ0	Clostridium_phage	2.9e-58	45.6
WP_012047785.1\|2481633_2482269_-	DUF2313 domain-containing protein	A0A2H4J1P4	uncultured_Caudovirales_phage	2.4e-74	66.5
WP_012047786.1\|2482265_2483396_-\|plate	baseplate J/gp47 family protein	A0A2H4J7K8	uncultured_Caudovirales_phage	3.2e-122	61.9
WP_012047787.1\|2483401_2483857_-	DUF2634 domain-containing protein	A0A2H4J4Q8	uncultured_Caudovirales_phage	1.2e-62	73.7
WP_012047788.1\|2483849_2484182_-	hypothetical protein	A0A2H4J746	uncultured_Caudovirales_phage	8.2e-34	67.9
WP_012047789.1\|2484165_2485134_-	hypothetical protein	A0A2H4J063	uncultured_Caudovirales_phage	8.1e-114	65.0
WP_012047790.1\|2485135_2485789_-	LysM peptidoglycan-binding domain-containing protein	A0A2H4J045	uncultured_Caudovirales_phage	1.2e-60	68.9
WP_012047791.1\|2485856_2486375_-	puattive membrane protein	A0A2H4J333	uncultured_Caudovirales_phage	6.6e-30	56.4
WP_012047792.1\|2486427_2489409_-\|tail	phage tail tape measure protein	A0A2H4J055	uncultured_Caudovirales_phage	5.5e-254	56.4
WP_012047794.1\|2489591_2490029_-	hypothetical protein	A0A2H4J883	uncultured_Caudovirales_phage	1.0e-55	75.9
WP_012047795.1\|2490052_2490463_-\|tail	phage tail tube protein	A0A2H4J032	uncultured_Caudovirales_phage	1.0e-62	86.5
WP_012047796.1\|2490475_2491882_-\|tail	phage tail sheath subtilisin-like domain-containing protein	A0A2H4J1N7	uncultured_Caudovirales_phage	1.0e-226	80.8
WP_012047797.1\|2491882_2492083_-	hypothetical protein	A0A2H4J7J8	uncultured_Caudovirales_phage	2.9e-18	83.3
WP_012047798.1\|2492095_2492917_-	hypothetical protein	A0A2H4J4Q0	uncultured_Caudovirales_phage	1.2e-113	72.2
WP_012047799.1\|2492919_2493144_-	hypothetical protein	NA	NA	NA	NA
WP_012047800.1\|2493147_2493552_-	hypothetical protein	A0A2H4J736	uncultured_Caudovirales_phage	6.0e-55	76.1
WP_012047801.1\|2493553_2493940_-	hypothetical protein	A0A2H4J057	uncultured_Caudovirales_phage	7.8e-44	68.5
WP_012047802.1\|2493940_2494261_-	hypothetical protein	A0A2H4J040	uncultured_Caudovirales_phage	9.7e-24	56.0
WP_012047803.1\|2494263_2494494_-	hypothetical protein	NA	NA	NA	NA
WP_012047804.1\|2494551_2495604_-\|capsid	major capsid protein	D9ZND6	Clostridium_phage	8.3e-88	51.4
WP_012047805.1\|2495617_2496010_-	hypothetical protein	NA	NA	NA	NA
WP_012047806.1\|2496024_2496639_-	phage scaffolding protein	A0A0A7RW68	Clostridium_phage	3.6e-27	39.7
WP_012047808.1\|2498875_2500396_-\|portal	phage portal protein	D9ZNC8	Clostridium_phage	4.6e-140	53.5
WP_012047809.1\|2500395_2501742_-\|terminase	PBSX family phage terminase large subunit	B6CXD2	Clostridium_phage	5.8e-102	47.3
WP_012047810.1\|2501734_2502586_-\|terminase	phage terminase small subunit	Q5YA77	Bacillus_phage	6.1e-41	43.5
WP_164928181.1\|2502632_2503220_-	hypothetical protein	Q332A5	Clostridium_botulinum_C_phage	1.0e-26	35.7
WP_012047813.1\|2503624_2503822_-	hypothetical protein	NA	NA	NA	NA
WP_012047815.1\|2504058_2504232_-	hypothetical protein	NA	NA	NA	NA
WP_012047816.1\|2504470_2505004_-	hypothetical protein	A0A0A7RVX8	Clostridium_phage	1.7e-36	61.4
WP_012047817.1\|2504984_2505410_-	YopX family protein	S5MAA0	Brevibacillus_phage	1.6e-10	32.4
WP_012047818.1\|2505406_2505598_-	hypothetical protein	NA	NA	NA	NA
WP_012047819.1\|2505695_2505911_-	hypothetical protein	NA	NA	NA	NA
WP_012047820.1\|2505927_2506923_-\|integrase	tyrosine-type recombinase/integrase	S5M872	Bacillus_phage	1.8e-07	23.2
2507941:2507956	attR	NA	NA	NA	NA

DBSCAN-SWA_5

2510335 : 2520594

Clostridium_phage(36.36%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012047827.1\|2510335_2510965_-	hypothetical protein	A0A0A7RW43	Clostridium_phage	1.4e-82	71.6
WP_012047828.1\|2510952_2511375_-	DUF1064 domain-containing protein	A0A0A7RTV9	Clostridium_phage	2.0e-56	75.7
WP_003398537.1\|2511371_2511533_-	hypothetical protein	NA	NA	NA	NA
WP_164928184.1\|2511623_2512004_-	nucleotide pyrophosphohydrolase	R4T830	Halovirus	5.6e-10	55.4
WP_012047831.1\|2512003_2512243_-	AbrB/MazE/SpoVT family DNA-binding domain-containing protein	A0A0K2CZ86	Paenibacillus_phage	6.6e-17	55.1
WP_041350637.1\|2512245_2512551_-	hypothetical protein	NA	NA	NA	NA
WP_041350636.1\|2512580_2513576_-	sigma-70 family RNA polymerase sigma factor	NA	NA	NA	NA
WP_012047834.1\|2513588_2513822_-	hypothetical protein	A0A0A7RTQ4	Clostridium_phage	8.4e-09	38.6
WP_012047835.1\|2513841_2514645_-	ATP-binding protein	A0A2K9V3L7	Faecalibacterium_phage	4.0e-34	34.2
WP_012047836.1\|2514604_2515465_-	phage replisome organizer N-terminal domain-containing protein	Q7Y4K5	Streptococcus_phage	6.2e-41	41.5
WP_012047837.1\|2515497_2515698_-	hypothetical protein	NA	NA	NA	NA
WP_012047839.1\|2516041_2516188_-	hypothetical protein	NA	NA	NA	NA
WP_012047840.1\|2516190_2517048_-	hypothetical protein	E5DV80	Deep-sea_thermophilic_phage	2.8e-57	47.5
WP_012047841.1\|2517059_2517545_-	siphovirus Gp157 family protein	A0A059T5F1	Listeria_phage	7.3e-31	46.5
WP_012047842.1\|2517785_2517962_-	hypothetical protein	NA	NA	NA	NA
WP_164928185.1\|2518016_2518223_-	hypothetical protein	NA	NA	NA	NA
WP_164928186.1\|2518290_2518560_+	hypothetical protein	NA	NA	NA	NA
WP_012047846.1\|2518903_2519704_-	transporter	A6XMM0	Bacillus_virus	1.9e-52	60.0
WP_012047847.1\|2519763_2519988_-	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_012047848.1\|2520159_2520594_+	helix-turn-helix transcriptional regulator	A0A0A8WE28	Clostridium_phage	5.7e-11	36.0

DBSCAN-SWA_6

3056732 : 3066201

Synechococcus_phage(42.86%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_003385254.1\|3056732_3058232_-	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase	Q58MG4	Prochlorococcus_phage	1.9e-69	46.9
WP_012047940.1\|3058445_3059063_-	phosphoribosylglycinamide formyltransferase	M4QRX9	Synechococcus_phage	1.5e-25	40.6
WP_012099415.1\|3059190_3060186_-	phosphoribosylformylglycinamidine cyclo-ligase	M4QRQ6	Synechococcus_phage	9.9e-67	43.7
WP_012047942.1\|3060246_3061695_-	amidophosphoribosyltransferase	A0A0M3SGR2	Mollivirus	5.5e-58	35.1
WP_012047943.1\|3061786_3062491_-	phosphoribosylaminoimidazolesuccinocarboxamide synthase	G8EYA2	Synechococcus_phage	6.0e-42	42.1
WP_003357851.1\|3062490_3062970_-	5-(carboxyamino)imidazole ribonucleotide mutase	A0A2P0VNU7	Tetraselmis_virus	1.1e-26	48.7
WP_012099417.1\|3063645_3066201_-	selenium-dependent xanthine dehydrogenase	A0A0P0IVM8	Acinetobacter_phage	1.3e-09	32.4

DBSCAN-SWA_7

3214760 : 3236668

Clostridium_phage(85.71%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012048045.1\|3214760_3215846_-	hypothetical protein	A0A0A7RU66	Clostridium_phage	1.1e-140	69.5
WP_012048046.1\|3215857_3216856_-	hypothetical protein	A0A0A7RW91	Clostridium_phage	4.0e-140	72.3
WP_003360052.1\|3216867_3217122_-	hypothetical protein	A0A0A7S0T0	Clostridium_phage	1.1e-33	81.0
WP_012048047.1\|3217127_3219023_-	hypothetical protein	A0A0A7RU09	Clostridium_phage	3.3e-119	52.9
WP_012048048.1\|3219037_3220276_-	hypothetical protein	A0A0A7RU28	Clostridium_phage	1.3e-196	81.1
WP_012048049.1\|3220298_3221279_-	hypothetical protein	A0A0A7RU61	Clostridium_phage	3.2e-110	61.6
WP_012048050.1\|3221280_3222630_-	caspase family protein	A0A0A7RW86	Clostridium_phage	2.1e-75	74.6
WP_012048051.1\|3222644_3222986_-	hypothetical protein	A0A0A7S0S4	Clostridium_phage	7.9e-16	54.3
WP_003403529.1\|3222998_3224084_-	hypothetical protein	NA	NA	NA	NA
WP_012099497.1\|3224070_3224505_-	hypothetical protein	NA	NA	NA	NA
WP_012048053.1\|3224517_3226059_-	membrane protein	A0A0A7RU22	Clostridium_phage	5.8e-05	42.4
WP_012048054.1\|3226134_3226377_-	hypothetical protein	A0A0A7RW80	Clostridium_phage	2.6e-21	66.2
WP_012048055.1\|3226336_3226753_-	hypothetical protein	A0A0A7S0S0	Clostridium_phage	7.6e-45	70.5
WP_012048056.1\|3226768_3227656_-	hypothetical protein	A0A0A7RTZ9	Clostridium_phage	3.1e-120	75.3
WP_012048057.1\|3227660_3228080_-	hypothetical protein	A0A0A7RU17	Clostridium_phage	3.9e-57	71.9
WP_012048058.1\|3228085_3228433_-	hypothetical protein	A0A0A7RU51	Clostridium_phage	1.1e-33	58.9
WP_012048059.1\|3228437_3228803_-	hypothetical protein	A0A0A7RW73	Clostridium_phage	5.0e-32	56.2
WP_012048060.1\|3228802_3229087_-	hypothetical protein	A0A0A7S0R4	Clostridium_phage	1.0e-24	60.2
WP_012048061.1\|3229773_3230295_-	hypothetical protein	A0A0A7RVS1	Clostridium_phage	3.1e-35	49.4
WP_012099498.1\|3230775_3231576_-	ATP-binding protein	A0A2K9V3L7	Faecalibacterium_phage	9.9e-33	34.8
WP_012099499.1\|3231565_3232471_-	phage replisome organizer N-terminal domain-containing protein	A8ASN4	Listeria_phage	9.4e-40	38.7
WP_003384849.1\|3232564_3232777_-	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_012099500.1\|3232838_3233048_-	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_012048067.1\|3233239_3233650_+	helix-turn-helix transcriptional regulator	A0A0A7RUJ5	Clostridium_phage	1.0e-09	56.2
WP_012048068.1\|3235180_3236668_+	MBOAT family protein	A0A125RNP0	Pseudomonas_phage	1.3e-65	38.3

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_009495

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection