CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Target MGE spacer number	Prophage number
CP033398	Escherichia coli strain WCHEC020031 plasmid p2_020031, complete sequence	0 crisprs	NA	0	0
CP033400	Escherichia coli strain WCHEC020031 plasmid pOXA1_020031, complete sequence	0 crisprs	NA	0	2
CP033401	Escherichia coli strain WCHEC020031 chromosome, complete genome	9 crisprs	DEDDh,c2c9_V-U4,DinG,cas3,RT,csa3,PD-DExK,cas5,cas6e,cas1,cas2	19	9
CP033399	Escherichia coli strain WCHEC020031 plasmid pNDM5_020031, complete sequence	0 crisprs	NA	0	0
CP033397	Escherichia coli strain WCHEC020031 plasmid p1_020031, complete sequence	0 crisprs	NA	0	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: CP033401_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_1

371135-371252

Orphan

Consensus_repeat	Method
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP033401_1

>merge|CP033401|1|371135-371252|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGCTGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAACCGAGCCGTAGGCCGGATAAGGCGTTTACGC

>CP033401|1|1|371135-371252|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	TGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAA
CCGAGCCGTAGGCCGGATAAGGCGTTTACGC

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ00374.1\|361656_363285_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	unknown	unknown	gnl\|CDD\|236847
CP033401.1\|AYQ00375.1\|363557_364916_+\|glycerol-3-phosphate-transporter	unknown	unknown	gnl\|CDD\|236889
CP033401.1\|AYQ00371.1\|358128_359028_-\|ISNCY-family-transposase	unknown	unknown	gnl\|CDD\|182167
CP033401.1\|AYQ00373.1\|360407_361667_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	unknown	unknown	gnl\|CDD\|225617
CP033401.1\|AYQ00383.1\|379001_381629_+\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	unknown	unknown	gnl\|CDD\|235502
CP033401.1\|AYQ04223.1\|384229_388624_+\|alpha-2-macroglobulin-family-protein	unknown	unknown	gnl\|CDD\|225248
CP033401.1\|AYQ00379.1\|369653_369908_-\|ferredoxin	unknown	unknown	gnl\|CDD\|182668
CP033401.1\|AYQ00381.1\|374252_378005_+\|AIDA-I-family-autotransporter-YfaL	unknown	unknown	gnl\|CDD\|182059
CP033401.1\|AYQ00378.1\|368949_369600_+\|lipopolysaccharide-kinase-InaA	unknown	unknown	gnl\|CDD\|182136
CP033401.1\|AYQ00387.1\|390278_391055_+\|DUF2135-domain-containing-protein	unknown	unknown	gnl\|CDD\|227021
CP033401.1\|AYQ00380.1\|371271_373557_-\|ribonucleoside-diphosphate-reductase-1-subunit-alpha	unknown	unknown	gnl\|CDD\|181649
CP033401.1\|AYQ04222.1\|369907_371038_-\|ribonucleoside-diphosphate-reductase-1-subunit-beta	unknown	unknown	gnl\|CDD\|181647
CP033401.1\|AYQ00385.1\|383462_384086_+\|DUF1175-domain-containing-protein	unknown	unknown	gnl\|CDD\|225774
CP033401.1\|AYQ00382.1\|378132_378855_-\|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG	unknown	unknown	gnl\|CDD\|235350
CP033401.1\|AYQ00384.1\|381777_383466_+\|DUF2138-domain-containing-protein	unknown	unknown	gnl\|CDD\|227030
CP033401.1\|AYQ00372.1\|359220_360411_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	unknown	unknown	gnl\|CDD\|132422
CP033401.1\|AYQ00388.1\|391128_392313_-\|acetyl-CoA-C-acetyltransferase	unknown	unknown	gnl\|CDD\|180261
CP033401.1\|AYQ00386.1\|388624_390274_+\|DUF2300-domain-containing-protein	unknown	unknown	gnl\|CDD\|227732
CP033401.1\|AYQ00376.1\|364920_365997_+\|glycerophosphodiester-phosphodiesterase	unknown	unknown	gnl\|CDD\|236859
CP033401.1\|AYQ00377.1\|366215_366530_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ00374.1\|361656_363285_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	gnl\|CDD\|236847	PRK11101, glpA, anaerobic glycerol-3-phosphate dehydrogenase subunit A.	0
CP033401.1\|AYQ00375.1\|363557_364916_+\|glycerol-3-phosphate-transporter	gnl\|CDD\|236889	PRK11273, glpT, glycerol-3-phosphate transporter.	0
CP033401.1\|AYQ00371.1\|358128_359028_-\|ISNCY-family-transposase	gnl\|CDD\|182167	PRK09956, PRK09956, ISNCY family transposase.	0
CP033401.1\|AYQ00373.1\|360407_361667_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	gnl\|CDD\|225617	COG3075, GlpB, Anaerobic glycerol-3-phosphate dehydrogenase [Amino acid transport and metabolism].	0
CP033401.1\|AYQ00383.1\|379001_381629_+\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	gnl\|CDD\|235502	PRK05560, PRK05560, DNA gyrase subunit A; Validated.	0
CP033401.1\|AYQ04223.1\|384229_388624_+\|alpha-2-macroglobulin-family-protein	gnl\|CDD\|225248	COG2373, COG2373, Large extracellular alpha-helical protein [General function prediction only].	0
CP033401.1\|AYQ00379.1\|369653_369908_-\|ferredoxin	gnl\|CDD\|182668	PRK10713, PRK10713, 2Fe-2S ferredoxin-like protein.	2.72138e-53
CP033401.1\|AYQ00378.1\|368949_369600_+\|lipopolysaccharide-kinase-InaA	gnl\|CDD\|182136	PRK09902, PRK09902, lipopolysaccharide kinase InaA.	1.43283e-158
CP033401.1\|AYQ00381.1\|374252_378005_+\|AIDA-I-family-autotransporter-YfaL	gnl\|CDD\|182059	PRK09752, PRK09752, AIDA-I family autotransporter YfaL.	0
CP033401.1\|AYQ00387.1\|390278_391055_+\|DUF2135-domain-containing-protein	gnl\|CDD\|227021	COG4676, COG4676, Uncharacterized protein conserved in bacteria [Function unknown].	1.0163e-152
CP033401.1\|AYQ00380.1\|371271_373557_-\|ribonucleoside-diphosphate-reductase-1-subunit-alpha	gnl\|CDD\|181649	PRK09103, PRK09103, ribonucleoside-diphosphate reductase subunit alpha.	0
CP033401.1\|AYQ04222.1\|369907_371038_-\|ribonucleoside-diphosphate-reductase-1-subunit-beta	gnl\|CDD\|181647	PRK09101, nrdB, ribonucleotide-diphosphate reductase subunit beta; Reviewed.	0
CP033401.1\|AYQ00385.1\|383462_384086_+\|DUF1175-domain-containing-protein	gnl\|CDD\|225774	COG3234, COG3234, Uncharacterized protein conserved in bacteria [Function unknown].	7.99004e-141
CP033401.1\|AYQ00382.1\|378132_378855_-\|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG	gnl\|CDD\|235350	PRK05134, PRK05134, bifunctional 2-polyprenyl-6-hydroxyphenol methylase/3-demethylubiquinol 3-O-methyltransferase UbiG.	9.80223e-171
CP033401.1\|AYQ00384.1\|381777_383466_+\|DUF2138-domain-containing-protein	gnl\|CDD\|227030	COG4685, COG4685, Uncharacterized protein conserved in bacteria [Function unknown].	0
CP033401.1\|AYQ00372.1\|359220_360411_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	gnl\|CDD\|132422	TIGR03379, glycerol3P_GlpC, glycerol-3-phosphate dehydrogenase, anaerobic, C subunit. Members of this protein family are the membrane-anchoring, non-catalytic C subunit, product of the glpC gene, of a three-subunit, FAD-dependent, anaerobic glycerol-3-phosphate dehydrogenase. GlpC lasks classical hydrophobic transmembrane helices; Cole, et al suggest interaction with the membrane may involve amphipathic helices. GlcC has conserved Cys-containing motifs suggestive of iron-sulfur binding. This complex is found mostly in Escherichia coli and closely related species. [Energy metabolism, Anaerobic].	0
CP033401.1\|AYQ00388.1\|391128_392313_-\|acetyl-CoA-C-acetyltransferase	gnl\|CDD\|180261	PRK05790, PRK05790, putative acyltransferase; Provisional.	0
CP033401.1\|AYQ00386.1\|388624_390274_+\|DUF2300-domain-containing-protein	gnl\|CDD\|227732	COG5445, COG5445, Predicted secreted protein [Function unknown].	2.06112e-125
CP033401.1\|AYQ00376.1\|364920_365997_+\|glycerophosphodiester-phosphodiesterase	gnl\|CDD\|236859	PRK11143, glpQ, glycerophosphodiester phosphodiesterase; Provisional.	0

>CP033401.1|AYQ04222.1|369907_371038_-|ribonucleoside-diphosphate-reductase-1-subunit-beta
MAYTTFSQTKNDQLKEPMFFGQPVNVARYDQQKYDIFEKLIEKQLSFFWRPEEVDVSRDRIDYQALPEHEKHIFISNLKYQTLLDSIQGRSPNVALLPLISIPELETWVETWAFSETIHSRSYTHIIRNIVNDPSVVFDDIVTNEQIQKRAEGISSYYDELIEMTSYWHLLGEGTHTVNGKTVTVSLRELKKKLYLCLMSVNALEAIRFYVSFACSFAFAERELMEGNAKIIRLIARDEALHLTGTQHMLNLLRSGADDPEMAEIAEECKQECYDLFVQAAQQEKDWADYLFRDGSMIGLNKDILCQYVEYITNIRMQAVGLDLPFQTRSNPIPWINTWLVSDNVQVAPQEVEVSSYLVGQIDSEVDTDDLSNFQL
>CP033401.1|AYQ00379.1|369653_369908_-|ferredoxin
MARVTLRITGTQLLCQDEHPSLLAALESHNVAVEYQCREGYCGSCRTRLVAGQVDWIAEPLAFIQPGEILPCCCRAKGDIEIEM
>CP033401.1|AYQ00378.1|368949_369600_+|lipopolysaccharide-kinase-InaA
MAVSAKYDEFNHWWATEGDWVEEPNYRRNGMSGVQCVERNGKKLYVKRMTHHLFHSVRYPFGRPTIVREVAVIKELERAGVIVPKIVFGEAVKIEGEWRALLVTEDMAGFISIADWYAQHAVSPYSDEVRQAMLKAVALAFKKMHSINRQHGCCYVRHIYVKTEGKAEAGFLDLEKSRRRLRRDKAINHDFRQLEKYLEPIPKADWEQVKAYYYAM
>CP033401.1|AYQ00377.1|366215_366530_-|hypothetical-protein
MTNKLGGELIDIADKKLAPLINDSFSYTRDFFAYSKQENNIFTFDNSKFVDPKEKEGLMIQHSNGQLVITGKYCPEGVQTAFTQEQYDKLIRYINIFFTFPKCE
>CP033401.1|AYQ00376.1|364920_365997_+|glycerophosphodiester-phosphodiesterase
MKLKLKNLSMAIMMSTIVMGSSAMAADSNEKIVIAHRGASGYLPEHTLPAKAMAYAQGADYLEQDLVMTKDDHLVVLHDHYLDRVTDVADRFPDRARKDGRYYAIDFTLDEIKSLKFTEGFDIENGKKVQTYPGRFPMGKSDFRVHTFEEEIEFVQGLNHSTGKNIGIYPEIKAPWFHHQEGKDIAAKTLEVLKKYGYTGKDDKVYLQCFDADELKRIKNELEPKMGMDLNLVQLIAYTDWNETQQKQPDGSWVNYSYDWMFKPGAMKQVAEYADGIGPDYHMLIEETSQPGNIKLTGMVQDAQQNKLVVHPYTVRSDKLPEYTTDVNQLYDVLYNKAGVNGLFTDFPDKAVKFLNKE
>CP033401.1|AYQ00375.1|363557_364916_+|glycerol-3-phosphate-transporter
MLSIFKPAPHKARLPAAEIDPTYRRLRWQIFLGIFFGYAAYYLVRKNFALAMPYLVEQGFSRGDLGFALSGISIAYGFSKFIMGSVSDRSNPRVFLPAGLILAAAVMLFMGFVPWATSSIAVMFVLLFLCGWFQGMGWPPCGRTMVHWWSQKERGGIVSVWNCAHNVGGGIPPLLFLLGMAWFNDWHAALYMPAFCAILVALFAFAMMRDTPQSCGLPPIEEYKNDYPDDYNEKAEQELTAKQIFMQYVLPNKLLWYIAIANVFVYLLRYGILDWSPTYLKEVKHFALDKSSWAYFLYEYAGIPGTLLCGWMSDKVFRGNRGATGVFFMTLVTIATIVYWMNPAGNPTVDMICMIVIGFLIYGPVMLIGLHALELAPKKAAGTAAGFTGLFGYLGGSVAASAIVGYTVDFFGWDGGFMVMIGGSILAVILLIVVMIGEKRRHEQLLQKRNGG
>CP033401.1|AYQ00374.1|361656_363285_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A
MKTRDSQSSDVIIIGGGATGAGIARDCALRGLRVILVERHDIATGATGRNHGLLHSGARYAVTDAESARECISENQILKRIARHCVEPTNGLFITLPEDDLSFQATFIRACEEAGISAEAIDPQQARIIEPAVNPALIGAVKVPDGTVDPFRLTAANMLDAKEHGAVILTAHEVTGLIREGATVCGVRVRNHLTGETQALHAPVVVNAAGIWGQHIAEYADLRIRMFPAKGSLLIMDHRINQHVINRCRKPSDADILVPGDTISLIGTTSLRIDYNEIDDNRVTAEEVDILLREGEKLAPVMAKTRILRAYSGVRPLVASDDDPSGRNVSRGIVLLDHAERDGLDGFITITGGKLMTYRLMAEWATDAVCRKLGNTRPCTTADLALPGSQDPAEVTLRKVISLPAPLRGSAVYRHGDRTPAWLSEGRLHRSLVCECEAVTAGEVQYAVENLNVNSLLDLRRRTRVGMGTCQGELCACRAAGLLQRFNVTTSAQSIEQLSTFLNERWKGVQPIAWGDALRESEFTRWVYQGLCGLEKEQKDAL
>CP033401.1|AYQ00373.1|360407_361667_-|glycerol-3-phosphate-dehydrogenase-subunit-GlpB
MRFDTVIMGGGLAGLLCGLQLQKHGLRCAIVTRGQSALHFSSGSLDLLSHLPDGQPVADIHSGLESLRQQAPAHPYSLLGPQRVLDLACQAQALIAESGAQLQGSVELAHQRITPLGTLRSTWLSSPEVPVWPLPAKKICVVGISGLMDFQAHLAAASLRELDLSVETAEIELPELDVLRNNATEFRAVNIARFLDNEENWPLLLDALIPVANTCEMILMPACFGLADDKLWRWLNEKLPCSLMLLPTLPPSVLGIRLQNQLQRQFVRQGGVWMPGDEVKKVTCKNGVMNEIWTRNHADIPLRPRFAVLASGSFFSGGLVAERNGIREPILGLDVLQTATRGEWYKGDFFAPQPWQQFGVTTDETLRPSQAGQTIENLFAIGSVLGGFDPIAQGCGGGVCAVSALHAAQQIAQRAGGQQ
>CP033401.1|AYQ00372.1|359220_360411_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C
MNDTSFENCIKCTVCTTACPVSRVNPGYPGPKQAGPDGERLRLKDGALYDEALKYCINCKRCEVACPSDVKIGDIIQRARAKYDTTRPSLRNFVLSHTDLMGSVSTPFAPIVNTATSLKPVRQLLDAALKIDHRRTLPKYSFGTFRRWYRSVAAQQAQYKDQVAFFHGCFVNYNHPQLGKDLIKVLNAMGTGVQLLSKEKCCGVPLIANGFTAKARKQAITNVESIREAVGVKGIPVIATSSTCTFALRDEYPEVLNVDNKGLRDHIELATRWLWRKLDEGKTLPLKPLPLKVVYHTPCHMEKMGWTLYTLELLRKIPGLELTVLDSQCCGIAGTYGFKKENYPTSQAIGAPLFRQIEESGADLVVTDCETCKWQIEMSTSLRCEHPITLLAQALA
>CP033401.1|AYQ00371.1|358128_359028_-|ISNCY-family-transposase
MTESTTSSPHDAVFKTFMFTPETARDFLEIHLPEPLRKLCNLQTLRLEPTSFIEKSLRAYYSDVLWSVETSDGDGYIYCVIEHQSSAEKNMAFRLMRYATAAMQRHLDKGYDRVPLVVPLLFYHGETSPYPYSLNWLDEFDDPQLARQLYTEAFPLVDITIVPDDEIMQHRRIALLELIQKHIRDRDLIGMVDRITTLLVKGFTNDSQLQTLFNYLLQCGDTSRFTRFIEEIAKRSPLQKERLMTIAERLRQEGHQIGWQEGMHEQAIKIALRMLEQGFEREIVLATTQLTDADIPNCH
>CP033401.1|AYQ00380.1|371271_373557_-|ribonucleoside-diphosphate-reductase-1-subunit-alpha
MNQNLLVTKRDGSTERINLDKIHRVLDWAAEGLHNVSISQVELRSHIQFYDGIKTSDIHETIIKAAADLISRDAPDYQYLAARLAIFHLRKKAYGQFEPPALYDHVVKMVEMGKYDNHLLEDYTEEEFKQMDTFIDHDRDMTFSYAAVKQLEGKYLVQNRVTGEIYESAQFLYILVAACLFSNYPRETRLQYVKRFYDAVSTFKISLPTPIMSGVRTPTRQFSSCVLIECGDSLDSINATSSAIVKYVSQRAGIGINAGRIRALGSPIRGGEAFHTGCIPFYKHFQTAVKSCSQGGVRGGAATLFYPMWHLEVESLLVLKNNRGVEGNRVRHMDYGVQINKLMYTRLLKGEDITLFSPSDVPGLYDAFFADQEEFERLYTKYEKDDSIRKQRVKAVELFSLMMQERASTGRIYIQNVDHCNTHSPFDPAIAPVRQSNLCLEIALPTKPLNDVNDENGEIALCTLSAFNLGAINNLDELEELAILAVRALDALLDYQDYPIPAAKRGAMGRRTLGIGVINFAYYLAKHGKRYSDGSANNLTHKTFEAIQYYLLKASNELAKEQGACPWFNETTYAKGILPIDTYKKDLDTIANEPLHYDWEALRESIKTHGLRNSTLSALMPSETSSQISNATNGIEPPRGYVSIKASKDGILRQVVPDYEHLHDAYELLWEMPGNDGYLQLVGIMQKFIDQSISANTNYDPSRFPSGKVPMQQLLKDLLTAYKFGVKTLYYQNTRDGAEDAQDDLVPSIQDDGCESGACKI
>CP033401.1|AYQ00381.1|374252_378005_+|AIDA-I-family-autotransporter-YfaL
MRIIFLRKEYLSLLPSMIASLFSANGVAAVTDSCQGYDVKASCQASRQSLSGITQDWSIADGQWLVFSDMTNNASGGAVFLQQGAEFSLLPENETGMTLFANNTVTGEYNNGGAIFAKENSTLNLTDVIFSGNVAGGYGGAIYSSGTNDTGAVDLRVTNAMFRNNIANDGKGGAIYTINNDVYLSDVIFDNNQAYTSTSYSDGDGGAIDVTDNNSDSKHPSGYTIVNNTAFTNNTAEGYGGAIYTNSVTAPYLIDISVDDSYSQNGGVLVDENNSAAGYGDGPSSAAGGFMYLGLSEVTFDIADGKTLVIGNTENDGAVDSIAGTGLITKTGSGDLVLNADNNDFTGEMQIENGEVTLGRSNSLMNVGDTHCQDDPQDCYSLTIGSIDQYQNQAELNVGSTQQTFVHALTGFQNGTLNIDAGGNVTVNQGSFAGIIEGAGQLTIAQNGSYVLAGAQSMALTGDIVVDDGAVLSLEGDAADLTALQDDPQSIVLNGGVLDLSDFSTWQSGTSYNDGLEVSGSSGTVIGSQDVVDLAGGDNLHIGGDGKDGVYVVVDASDGQVSLANNNSYLGTTQIASGTLMVSDNSQLGDTHYNRQVIFTDKQQESVMEITSDVDTRSDAAGHGRDIEMRADGEVAVDAGVDTQWGALMADSSGQHQDEGSTLTKTGAGTLELTASGTTQSAVRVEEGTLKGDVADILPYASSLWVGDGATFVTGADQDIQSIDAISSGTIDISDGTVLRLTGQDTSVALNASLFNGDGTLVNATDGVTLTGELNTNLETDSLTYLSNVTVNGNLTNTSGAVSLQNGVAGDTLTVNGDYTGGGTLLLDSELNGDDSVSDQLVMNGNTAGNTTVVVNSITGIGEPTSTGIKMVDFAADPTQFQNNAQFSLAGSGYVNMGAYDYTLVEDNNDWYLRSQEVTPPSPPDPDPTPDPDPTPDPDPTPDPEPTPAYQPVLNAKVGGYLNNLRAANQAFMMERRDHAGGDGQTLNLRVIGGDYHYTAAGQLAQHEDTSTVQLSGDLFSGRWGTDGEWMLGIVGGYSDNQGDSRSNMTGTRADNQNHGYAVGLTSSWFQHGNQKQGAWLDSWLQYAWFSNDVSEQEDGTDHYHSSGIIASLEAGYQWLPGRGVVIEPQAQVIYQGVQQDDFTAANRARVSQSQGDDIQTRLGLHSEWRTAVHVIPTLDLNYYHDPHSTEIEEDGSTISDDAVKQRGEIKVGVTGNISQRVSLRGSVAWQKGSDDFAQTAGFLSMTVKW
>CP033401.1|AYQ00382.1|378132_378855_-|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG
MNAEKSPENHNVDHEEIAKFEAVASRWWDLEGEFKPLHRINPLRLGYIAERAGGLFGKKVLDVGCGGGILAESMAREGATVTGLDMGFEPLQVAKLHALESGIQVDYVQETVEKHAAKHAGQYDVVTCMEMLEHVPDPQSVVRACAQLVKPGGDVFFSTLNRNGKSWLMAVVGAEYILRMVPKGTHDVKKFIKPAELLGWVDQTSLKERHITGLHYNPITNSFKLGPGVDVNYMLHTQNK
>CP033401.1|AYQ00383.1|379001_381629_+|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A
MSDLAREITPVNIEEELKSSYLDYAMSVIVGRALPDVRDGLKPVHRRVLYAMNVLGNDWNKAYKKSARVVGDVIGKYHPHGDLAVYNTIVRMAQPFSLRYMLVDGQGNFGSIDGDSAAAMRYTEIRLAKIAHELMADLEKETVDFVDNYDGTEKIPDVMPTKIPNLLVNGSSGIAVGMATNIPPHNLTEVINGCLAYIDDEDISIEGLMEHIPGPDFPTAAIINGRRGIEEAYRTGRGKVYIRARAEVEVDAKTGRETIIVHEIPYQVNKARLIEKIAELVKEKRVEGISALRDESDKDGMRIVIEVKRDAVGEVVLNNLYSQTQLQVSFGINMVALHHGQPKIMNLKDIIAAFVRHRREVVTRRTIFELRKARDRAHILEALAVALANIDPIIELIRHAPTPAEAKTALVANPWQLGNVAAMLERAGDDAARPEWLEPEFGVRDGLYYLTEQQAQAILDLRLQKLTGLEHEKLLDEYKELLDQIAELLRILGSADRLMEVIREELELVREQFGDKRRTEITANSADINLEDLITQEDVVVTLSHQGYVKYQPLSEYEAQRRGGKGKSAARIKEEDFIDRLLVANTHDHILCFSSRGRVYSMKVYQLPEATRGARGRPIVNLLPLEQDERITAILPVTEFEEGVKVFMATANGTVKKTVLTEFNRLRTAGKVAIKLVDGDELIGVDLTSGEDEVMLFSAEGKVVRFKESSVRAMGCNTTGVRGIRLGEGDKVVSLIVPRGDGAILTATQNGYGKRTAVAEYPTKSRATKGVISIKVTERNGLVVGAVQVDDCDQIMMITDAGTLVRTRVSEISIVGRNTQGVILIRTAEDENVVGLQRVAEPVDEEDLDTIDGSAAEGDDEIAPEVDVDDEPEEE
>CP033401.1|AYQ00384.1|381777_383466_+|DUF2138-domain-containing-protein
MSGEKKAKGWRFYGLVGFGAIALLSAGVWALQYAGSGPEKTLSPLVVHNNLQIDLNEPDLFLDSDSLSQLPKDLLTIPFLHDVLSEDFVFYYQNHADRLGIEGSIRRIVYEHDLTLKDKLFSSLLDQPAQAALWHDKQGHLSHYMVLIQRSGLSKLLEPLLFAATSDSQLSKTEISSIKINSETVPVYQLRYNGNNALMFATYQDKMLVFSSTDMLFKDDQQDTEATAIAGDLLSGKKRWQASFGLEERTAEKTPVRQRIVVSARWLGFGYQRLMPSFAGVRFEMGNDGWHSFVALNDESASVDASFDFTPVWNSMPAGASFCVAVPYSHGIAEEMLSHISQENDKLNGALDGAAGLCWYEDSKLQTPLFVGQFDGTAEQAQLPGKLFTQNIGAHESKAPEGVLPVSQTQQGEAQIWRREVSSRYGQYPKAQAAQPDQLMSDYFFRVSLAMQNKTLLFSLDDTLVNNALQTLNKTRPAMVDVIPTDGIVPLYINPQGIAKLLRNETLTSLPKNLEPVFYNAAQTLLMPKLDALSQQPRYVMKLAQMEPGAAWQWLPITWQPL
>CP033401.1|AYQ00385.1|383462_384086_+|DUF1175-domain-containing-protein
MRHGLLALICWLCCVVAHSEMLNVEQSGLFRAWFVRIAQEQLRQGPSPRWYQQDCAGLVRFAANETLKVHDSKWLKSNGLSSQYLPPEMTLTPEQRQLAQNWNQGNGKTGPYVTAINLIQYNSQFIGQDINQALPGDMIFFDQGDAQHLMVWMGRYVIYHTGSATKTDNGMRAVSLQQLMTWKDTRWIPNDSNPNFIGIYRLNFLAR
>CP033401.1|AYQ04223.1|384229_388624_+|alpha-2-macroglobulin-family-protein
MRLEAPGRDYRRYQMEEYGGVDVRLYRIPDPMAFLRQQKNLHRIVVQPQYLGDGLNNTLTWLWDNWYGKSRRVMQRTFSSQSRQNVTQALPELQLGNAIIKPSRYVQNNQFSPLKKYPLVEQFRYPLWQAKPFEPQQGVKLEGASSNFISPQPGNIYIPLGQQEPGLYLVEAMVGGYRATTVVFVSDTVALSKVSGNELLVWTAGKKQGEAKPGSEILWTDGLGVMTRGVTDDSGTLQLQHISPERSYILGKDAEGGVFVSENFFYESEIYNTRLYIFTDRPLYRAGDRVDVKVMGREFHDPLHSSPIVSAPAKLSVLDANGSLLQTVDVTLDARNGGQGSFRLPENAVAGGYELRLAYRNQVYSSSFRVANYIKPHFEIGLALAKKEFKTGEAVSGKLQLLYPDGEPVKNARVQLSLRAQQLSMVGNDLRYAGRFPVSLEGSETVSDASGHVALNLPAADKPSRYLLTVSASDGAAYRVTTTKEILIERGLAHYSLSTAAQYSNSGESVVFRYAALESSKQVPVTYEWLRLEDRTSHSGELPSGGKSFTVNFAKPGNYNLTLRDKDGLILAGLSHAVSGKGSTAHTGTVDIVADKTLYQPGETAKMLITFPEPIDEALLTLERDRVEQQSLLSHPANWLTLQRLNDTQYEARVPVSNSFAPNITFSVLYTRNGQYSFQNAGIKVAVPQLDIRVKTDKTHYQPGELVNVELTSSLKGKPVSAQLTVGVVDEMIYALQPEIAPNIGKFFYPLGRNNVRTSSSLSFISYDQALSSEPVAPGATNRSERRVKMLERPRREEVDTAAWMPSLTTDKQGKAYFTFLMPDSLTRWRITARGMNGDGLVGQGRAYLRSEKNLYMKWSMPTVYRVGDKPAAGLFIFSQQDNEPVALVTKFAGAEMRQTLTLHKGANYISLTQNIQQSGLLSAELQQNGQVQDSISTKLSFVDNSWPVEQQKNVMLGGGDNALMLPEQASNIRLQSSETPQEIFRNNLDALVDEPWGGVINTGSRLIPLSLAWRSLADHQSAAANDIRQMIQVNRLRLMQLAGPGARFTWWGEDGNGDAFLTAWAWYADWQASQAIGVTQQPEYWQHMLDSYAEQADNMPLLHRALVLAWAQEMNLPCKTLLKGLDEAIARRGTKTEDFSEEDTRDINDSLILDTPESPLADAVANVLTMTLLKKAQLKSTVMPQVQQYAWDKAANSNQPLAHTVVLLNSGGDATQAAAILSGLTAEQSTIERALAMNWLAKYMATMPPVVLPAPAGAWAKHKLTGGGEYWRWVGQGVPDILSFGDELSPQNVQVRWREPAKTAQQSNIPVTVERQLYRLITGEEEMSFTLQPVTSNEIDSDALYLDEITLTSEQDAVLRYGQVEVPLPPGADVERTTWGISVNKPNAAKQQGQLLEIARNEMGELAYMVPVKELTGTVTFRHLLRFSQKGQFVLPPARYMRSYAPAQQSVAAGSEWTRMQVK
>CP033401.1|AYQ00386.1|388624_390274_+|DUF2300-domain-containing-protein
MNWRRIVWLLALVTLPTLAEEPPLQLALRGAQHDQLYKLSSSGVTNVSTLPDTLTTPLGSLWKLYVYAWLEDTHQPEQPYQCRGNSPEEVYCCQAGESITRDTALVRSCGLYFAPQRLHIGADVWGQYWQQRQAPAWLASLTTLKPETSVTVKSLLDSLATLPAQNKAQEVLLDVVLDEAKIGVASMLGSRVRVKTWSWFADDKQEIRQGGFAGWLTDGTPLWVTGSGTSKTVLTRYATVLNRVLPVPTQVASGQCVEVELFARYPLKKITAEKSTTAVKPGVLNGRYRVTFTNGNHITFVSHGETTLLSEKGKLKLQSHLDREEYVARVLDREAKSTPPEAAKAMTVAIRTFLQQNANREGDCLTIPDSSATQRVSASPATTGARTMAAWTQDLIYAGDPVHYHGSRATEGTLSWRQATAQAGQGERYDQILAFAYPDNSLSRWGAPRSTCQLLPKAKAWLAKKMPQWRRILQAETGYNEPDVFAVCRLVSGFPYTDRQQKRLFIRNFFTLQDRLDLTHEYLHLAFDGYPTGLDENYIETLTRQLLMD
>CP033401.1|AYQ00387.1|390278_391055_+|DUF2135-domain-containing-protein
MRKIFLPLLLVALSPVAHSEGVQEVEIDAPLSGWHPVEGEDASFSQSINYPASSVNMADDQNISAQIRGKIKNYAAAGKVQQGRLVVNGASMPQRIESDGSFARPYIFTEGSNSVQVISPDGQSRQKMQFYSTPGTGTIRARLRLVLSWDTDNTDLDLHVVTPDGEHAWYGNTVLKNSGALDMDVTTGYGPEIFAMPAPVHGRYQVYINYYGGRSETELTTAQLTLITDEGSVNEKQETFIVPMRNAGELTLVKSFDW
>CP033401.1|AYQ00388.1|391128_392313_-|acetyl-CoA-C-acetyltransferase
MKNCVIVSAVRTAIGSFNGSLASTSAIDLGATVIKAAIERAKIDSQHVDEVIMGNVLQAGLGQNPARQALLKSGLAETVCGFTVNKVCGSGLKSVALAAQAIQAGQAQSIVAGGMENMSLAPYLLDAKARSGYRLGDGQVYDVILRDGLMCATHGYHMGITAENVAKEYGITREMQDELALHSQRKAAAAIESGAFTAEIVPVNVVTRKKTFVFSQDEFPKANSTAEALGALRPAFDKAGTVTAGNASGINDGAAALVIMEESAALAAGLTPLARIKSYASGGVPPALMGMGPVPATQKALQLAGLQLADIDLIEANEAFAAQFLAVGKTLGFDPEKVNVNGGAIALGHPIGASGARILVTLLHAMQARDKTLGLATLCIGGGQGIAMVIERLN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_2

976017-976140

Orphan

Consensus_repeat	Method
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP033401_2

>merge|CP033401|2|976017-976140|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTACGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAACGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

>CP033401|2|2|976017-976140|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAA
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ00908.1\|972233_973019_+\|thiosulfate-reductase-cytochrome-B-subunit	unknown	unknown	gnl\|CDD\|184968
CP033401.1\|AYQ00910.1\|973846_975451_-\|FAD-NAD(P)-binding-protein	unknown	unknown	gnl\|CDD\|182134
CP033401.1\|AYQ00921.1\|986606_987188_-\|superoxide-dismutase-[Fe]	unknown	unknown	gnl\|CDD\|182534
CP033401.1\|AYQ00919.1\|985036_985126_+\|YnhF-family-membrane-protein	unknown	unknown	unknown
CP033401.1\|AYQ00903.1\|967439_967649_+\|fumarate-hydratase-FumD	unknown	unknown	gnl\|CDD\|182359
CP033401.1\|AYQ00909.1\|973022_973835_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182159
CP033401.1\|AYQ00912.1\|976454_977711_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|137602
CP033401.1\|AYQ00913.1\|977751_979125_-\|multidrug-resistance-protein-MdtK	unknown	unknown	gnl\|CDD\|234981
CP033401.1\|AYQ00902.1\|965471_966884_-\|pyruvate-kinase-I	unknown	unknown	gnl\|CDD\|181699
CP033401.1\|AYQ00920.1\|985291_986461_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|225371
CP033401.1\|AYQ00906.1\|970857_971505_+\|YdhW-family-putative-oxidoreductase-system-protein	unknown	unknown	gnl\|CDD\|182160
CP033401.1\|AYQ00916.1\|981459_982671_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	unknown	unknown	gnl\|CDD\|182924
CP033401.1\|AYQ00914.1\|979339_979981_+\|riboflavin-synthase	unknown	unknown	gnl\|CDD\|183846
CP033401.1\|AYQ00915.1\|980020_981169_-\|cyclopropane-fatty-acyl-phospholipid-synthase	unknown	unknown	gnl\|CDD\|183282
CP033401.1\|AYQ00917.1\|982783_983716_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|182948
CP033401.1\|AYQ00904.1\|968104_968731_+\|ferredoxin-like-protein	unknown	unknown	gnl\|CDD\|182135
CP033401.1\|AYQ00918.1\|983712_984738_-\|PurR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|236739
CP033401.1\|AYQ00907.1\|971568_972237_+\|4Fe-4S-dicluster-domain-containing-protein	unknown	unknown	gnl\|CDD\|274451
CP033401.1\|AYQ00905.1\|968751_970854_+\|aldehyde-ferredoxin-oxidoreductase	unknown	unknown	gnl\|CDD\|236629
CP033401.1\|AYQ00911.1\|975576_975882_-\|monooxygenase	unknown	unknown	gnl\|CDD\|182975

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ00908.1\|972233_973019_+\|thiosulfate-reductase-cytochrome-B-subunit	gnl\|CDD\|184968	PRK15006, PRK15006, thiosulfate reductase cytochrome B subunit; Provisional.	5.33298e-163
CP033401.1\|AYQ00910.1\|973846_975451_-\|FAD-NAD(P)-binding-protein	gnl\|CDD\|182134	PRK09897, PRK09897, FAD-NAD(P)-binding protein.	0
CP033401.1\|AYQ00921.1\|986606_987188_-\|superoxide-dismutase-[Fe]	gnl\|CDD\|182534	PRK10543, PRK10543, superoxide dismutase [Fe].	3.77321e-138
CP033401.1\|AYQ00903.1\|967439_967649_+\|fumarate-hydratase-FumD	gnl\|CDD\|182359	PRK10292, PRK10292, fumarate hydratase FumD.	2.11502e-34
CP033401.1\|AYQ00909.1\|973022_973835_+\|hypothetical-protein	gnl\|CDD\|182159	PRK09946, PRK09946, hypothetical protein; Provisional.	9.78241e-175
CP033401.1\|AYQ00912.1\|976454_977711_+\|hypothetical-protein	gnl\|CDD\|137602	PRK09945, PRK09945, hypothetical protein; Provisional.	0
CP033401.1\|AYQ00913.1\|977751_979125_-\|multidrug-resistance-protein-MdtK	gnl\|CDD\|234981	PRK01766, PRK01766, multidrug efflux protein; Reviewed.	0
CP033401.1\|AYQ00902.1\|965471_966884_-\|pyruvate-kinase-I	gnl\|CDD\|181699	PRK09206, PRK09206, pyruvate kinase PykF.	0
CP033401.1\|AYQ00920.1\|985291_986461_+\|MFS-transporter	gnl\|CDD\|225371	COG2814, AraJ, Arabinose efflux permease [Carbohydrate transport and metabolism].	1.92383e-98
CP033401.1\|AYQ00906.1\|970857_971505_+\|YdhW-family-putative-oxidoreductase-system-protein	gnl\|CDD\|182160	PRK09947, PRK09947, YdhW family putative oxidoreductase system protein.	2.81741e-122
CP033401.1\|AYQ00916.1\|981459_982671_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	gnl\|CDD\|182924	PRK11043, PRK11043, Bcr/CflA family multidrug efflux MFS transporter.	0
CP033401.1\|AYQ00914.1\|979339_979981_+\|riboflavin-synthase	gnl\|CDD\|183846	PRK13020, PRK13020, riboflavin synthase subunit alpha; Provisional.	2.8868e-122
CP033401.1\|AYQ00915.1\|980020_981169_-\|cyclopropane-fatty-acyl-phospholipid-synthase	gnl\|CDD\|183282	PRK11705, PRK11705, cyclopropane fatty acyl phospholipid synthase.	0
CP033401.1\|AYQ00917.1\|982783_983716_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|182948	PRK11074, PRK11074, putative DNA-binding transcriptional regulator; Provisional.	0
CP033401.1\|AYQ00904.1\|968104_968731_+\|ferredoxin-like-protein	gnl\|CDD\|182135	PRK09898, PRK09898, ferredoxin-like protein.	6.99609e-140
CP033401.1\|AYQ00918.1\|983712_984738_-\|PurR-family-transcriptional-regulator	gnl\|CDD\|236739	PRK10703, PRK10703, HTH-type transcriptional repressor PurR.	0
CP033401.1\|AYQ00907.1\|971568_972237_+\|4Fe-4S-dicluster-domain-containing-protein	gnl\|CDD\|274451	TIGR03149, cyt_nit_nrfC, cytochrome c nitrite reductase, Fe-S protein. Members of this protein family are the Fe-S protein, NrfC, of a cytochrome c nitrite reductase system for which the pentaheme cytochrome c protein, NrfB (family TIGR03146) is an unambiguous marker. Members of this protein family show similarity to other ferredoxin-like proteins, including a subunit of a polysulfide reductase. [Energy metabolism, Electron transport].	2.09652e-76
CP033401.1\|AYQ00905.1\|968751_970854_+\|aldehyde-ferredoxin-oxidoreductase	gnl\|CDD\|236629	PRK09849, PRK09849, putative oxidoreductase; Provisional.	0
CP033401.1\|AYQ00911.1\|975576_975882_-\|monooxygenase	gnl\|CDD\|182975	PRK11118, PRK11118, putative monooxygenase; Provisional.	1.12003e-64

>CP033401.1|AYQ00911.1|975576_975882_-|monooxygenase
MATLLQLHFAFNGPFGDAMAEQLKPLAESINQEPGFLWKVWTESEKNHEAGGIYLFTDEKSALAYLEKHTARLKNLGVEEVVAKVFDVNEPLSQINQAKLA
>CP033401.1|AYQ00910.1|973846_975451_-|FAD-NAD(P)-binding-protein
MKKIAIVGAGPTGIYTLFSLLQQQTPLSISIFEQADEAGVGMPYSDEENSKMMLANIASIEIPPINCTYLEWLQKQEASHLQRYGVKKETLHDRQFLPRILLGEYFRDQFLRLVDQARQQKFAVAVYESCQVTDLQITNAGVMLATNQDLPSETFDLVVIATGHVWPDEEEATRTYFPSPWSGLMEAKVDACNVGIMGTSLSGLDAAMAVAIQHGSFIEDDKQHVVFNRDNASEKLNITLMSRTGILPEADFYCPIPYEPLHIVTDQALNAEIQKGEEGLLDRVFRLIVEEIKFADPDWSQRIALESLNVDSFAQAWFAERKQRDPFDWAEKNLQEVERNKREKHTVPWRYVILRLHEAVQEIVPHLNEHDHKRFSKGLARVFIDNYAAIPSESIRRLLALREAGIIHILALGEDYEMEINESRTVLKTEDNSYSFDVFIDARGQRPLKVKDIPFPGLREQLQKTGDEIPDVGEDYTLQQPEDIRGRVAFGALPWLMHDQPFVQGLTACAEIGEAMARAVVKPASRARRRLSFD
>CP033401.1|AYQ00909.1|973022_973835_+|hypothetical-protein
MIITRADLREWRIGAVMYRWFLRHFPRGGSYADIHHALIEEGYTDWAESLVEYAWKKWLADENFAHQEVSSMQKLATDPGEIPFCSQFARSDDHARIGCCEDNARIATAGYAAQIASMGYSVRIGSVGFNSHIGSSGERARVAVTGNSSRISSAGDSSRIANTGMRVRVCTLGERCHVASNGDLAQIASFGANARIANSGDNVHIIASGENSTVVSTGVVDSIILGPGGSAALAYHDGERVRFAVAIEGENNIRAGVRYRLNEQHQFVEC
>CP033401.1|AYQ00908.1|972233_973019_+|thiosulfate-reductase-cytochrome-B-subunit
MNPSQHAEQFQSQLANYVPQFTPEFWPVWLIIAGVLLVGMWLVLGLHALLRARGVKKSVTDYGEKIYLYCKAVRLWHWSNALLFVLLLASGLINHFALVGATAVKSLVAVHEVCGFLLLACWLGFVLINAVGGNGHHYRIRRQGWLERAAKQTRFYLFGIMQGEEHPFPATTQSKFNPLQQVAYVGVMYGLLPLLLLTGLLCLYPQAVGDVFPGVRYWLLQAHFALAFISLFFIFGHLYLCTTGRTPHETFKSMVDGYHRH
>CP033401.1|AYQ00907.1|971568_972237_+|4Fe-4S-dicluster-domain-containing-protein
MSFTRRKFVLGMGTVIFFTGSASSLLANTRQEKEVRYAMIHDESRCNGCNICARACRKTNHVPAQGSRLSIAHIPVTDNDNETQYHFFRQSCQHCEDAPCIDVCPTGASWRDEQGIVRVEKSQCIGCSYCIGACPYQVRYLNPVTKVADKCDFCAESRLAKGFPPICVSACPEHALIFGREDSPEIQAWLQQNKYYQYQLPGAGKPHLYRRFGQHLIKKENV
>CP033401.1|AYQ00906.1|970857_971505_+|YdhW-family-putative-oxidoreductase-system-protein
MGEMNHRDELPLAKVSEVDEAKRQWLQGMRHPVDTVTEPEPAEILAEFIRQHSAAGQLVARAVFLSPPYSVAEEELSVLLESIKQNGDYADIACMTGSQDDYYYSTQAMSENYAAMSLQVVEQDICRAIAHAVRFECQTYPRPYKVAMLMQAPYYFQEAQIEAAIAAMDVAPEYADIRQVESSTAVLYLFSERFMTYGKAYGLCEWFEVEQFQNP
>CP033401.1|AYQ00905.1|968751_970854_+|aldehyde-ferredoxin-oxidoreductase
MANGWTGNILRVNLTTGNITLEDSSKFKSFVGGMGFGYKIMYDEVPPGTKPFDEANKLVFATGPLTGSGAPCSSRVNITSLSTFTKGNLVVDAHMGGFFAAQMKFAGYDVIIIEGKAKSPVWLKIKDDKVSLEKADFLWGKGTRATTEEICRLTSPETCVAAIGQAGENLVPLSGMLNSRNHSGGAGTGAIMGSKNLKAIAVEGTKGVNIADRQEMKRLNDYMMTELIGANNNHVVPSTPQSWAEYSDPKSRWTARKELFWGAAEGGPIETGEIPPGNQNTVGFRTYKSVFDLGPAAEKYTVKMSGCHSCPIRCMTQMNIPRVKEFGVPSTGGNTCVANFVHTTIFPNGPKDFEDKDDGRVIGNLVGLNLFDDYGLWCNYGQLHRDFTYCYSKGVFKRVLPAEEYAEIHWDQLEAGDVNFIKDFYYRLAHRVGELSHLADGSYAIAERWNLGEEYWGYAKNKLWSPFGYPVHHANEASAQVGSIVNCMFNRDCMTHTHINFIGSGLPLKLQREVAKELFGSEDAYDETKNYTPINDAKIKYAKWSLLRVCLHNAVTLCNWVWPMTVSPLKSRNYRGDLALEAKFFKAITGEEMTQEKLDLAAERIFTLHRAYTVKLMQTKDMRNEHDLICSWVFDKDPQIPVFTEGTDKMDRDDMHASLTMFYKEMGWDPQLGCPTRETLQRLGLEDIAADLAAHNLLPV
>CP033401.1|AYQ00904.1|968104_968731_+|ferredoxin-like-protein
MNPVDRPLLDIGLTRLEFLRISGKGLAGLTIAPALLSLLGCKQEDIDSGTVGLINTPKGVLVTQRARCTGCHRCEISCTNFNDGSVGTFFSRIKIHRNYFFGDNGVGSGGGLYGDLNYTADTCRQCKEPQCMNVCPIGAITWQQKEGCITVDHKRCIGCSACTTACPWMMATVNTESKKSSKCVLCGECANACPTGALKIIEWKDITV
>CP033401.1|AYQ00903.1|967439_967649_+|fumarate-hydratase-FumD
MGNRTKEDELYREMCRVVGKVVLEMRDLGQEPKHIVIAGVLRTALANKRIQRSELEKQAMETVINALVK
>CP033401.1|AYQ00902.1|965471_966884_-|pyruvate-kinase-I
MKKTKIVCTIGPKTESEEMLAKMLDAGMNVMRLNFSHGDYAEHGQRIQNLRNVMSKTGKTAAILLDTKGPEIRTMKLEGGNDVSLKAGQTFTFTTDKSVIGNSEMVAVTYEGFTTDLSVGNTVLVDDGLIGMEVTAIEGNKVICKVLNNGDLGENKGVNLPGVSIALPALAEKDKQDLIFGCEQGVDFVAASFIRKRSDVIEIREHLKAHGGENIHIISKIENQEGLNNFDEILEASDGIMVARGDLGVEIPVEEVIFAQKMMIEKCIRARKVVITATQMLDSMIKNPRPTRAEAGDVANAILDGTDAVMLSGESAKGKYPLEAVSIMATICERTDRVMNSRLEFNNDNRKLRITEAVCRGAVETAEKLDAPLIVVATQGGKSARAVRKYFPDATILALTTNEKTAHQLVLSKGVVPQLVKEITSTDDFYRLGKELALQSGLAHKGDVVVMVSGALVPSGTTNTASVHVL
>CP033401.1|AYQ00912.1|976454_977711_+|hypothetical-protein
MGSDAKNLMSDGNVQIVKTGEVIGATQLTEGELIVEAGGRAENTVVTGAGWLKVATGGIAKCTQYGNNGTLSVSDGAIATDIVQSEGGAISLSTLATVNGRHPEGEFSVDQGYACGLLLENGGNLRVLEGHRAEKIILDQEGGLLVNGTTSAVVVDEGGELLVYPGGEASNCEINQGGVFMLAGKASDTLLAGGTMNNLGGEDSDTIVENGSIYRLGTDGLQLYSSGKTQNLSVNVGGRAEVHAGTLENAVIQGGTVILLSPTSADENFVVEEDRAPVELTGSVALLDGASMIIGYGADLQQSTITVQQGGVLILDGSTVKGDGVTFIVGNINLNGGKLWLITGAATHVQLKVKRLRGEGAICLQTSAKEISPDFINVKGEVTGDIHVEITDASRQTLCNALKLQPDEDGIGATLQPA
>CP033401.1|AYQ00913.1|977751_979125_-|multidrug-resistance-protein-MdtK
MQKYISEARLLLALAIPVILAQIAQTAMGFVDTVMAGGYSATDMAAVAIGTSIWLPAILFGHGLLLALTPVIAQLNGSGRRERIAHQVRQGFWLAGFVSVLIMLVLWNAGYIIRSMENIDPALADKAVGYLRALLWGAPGYLFFQVARNQCEGLAKTKPGMVMGFIGLLVNIPVNYIFIYGHFGMPELGGVGCGVATAAVYWVMFLAMVSYIKRARSMRDIRNEKGTAKPDPAVMKRLIQLGLPIALALFFEVTLFAVVALLVSPLGIVDVAGHQIALNFSSLMFVLPMSLAAAVTIRVGYRLGQGSTLDAQTAARTGLMVGVCMATLTAIFTVSLREQIALLYNDNPEVVTLAAHLMLLAAVYQISDSIQVIGSGILRGYKDTRSIFYITFTAYWVLGLPSGYILALTDLVVEPMGPAGFWIGFIIGLTSAAIMMMLRMRFLQRLPSVIILQRASR
>CP033401.1|AYQ00914.1|979339_979981_+|riboflavin-synthase
MFTGIVQGTVKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLAARENAMNQPGTEA
>CP033401.1|AYQ00915.1|980020_981169_-|cyclopropane-fatty-acyl-phospholipid-synthase
MSSSCIEEVSVPDDNWYRIANELLSRAGIAINGSAPADIRVKNPDFFKRVLQEGSLGLGESYMDGWWECDRLDMFFSKVLRAGLENQLPHHFKDTLRIASARLFNLQSKKRAWIVGKEHYDLGNDLFSRMLDPFMQYSCAYWKDADNLESAQQAKLKMICEKLQLKPGMRVLDIGCGWGGLAHYMASNYDVSVVGVTISAEQQKMAQERCEGLDVTILLQDYRDLNDQFDRIVSVGMFEHVGPKNYDTYFAVVDRNLKPEGIFLLHTIGSKKTDLNVDPWINKYIFPNGCLPSVRQIAQSSEPHFVMEDWHNFGADYDTTLMAWYERFLAAWPEIADNYSERFKRMFTYYLNACAGAFRARDIQLWQVVFSRGVENGLRVAR
>CP033401.1|AYQ00916.1|981459_982671_-|Bcr/CflA-family-multidrug-efflux-MFS-transporter
MQPGKRFLVWLAGLSVLGFLATDMYLPAFAAIQADLQTPASAVSASLSLFLAGFAAAQLLWGPLSDRYGRKPVLLIGLTIFALGSLGMLWVENAATLLVLRFVQAVGVCAAAVIWQALVTDYYPSQKVNRIFATIMPLVGLSPALAPLLGSWLLVHFSWQAIFATLFAITVVLILPIFWLKPTTKARNNSQDGLTFTDLLRSKTYRGNVLIYAACSASFFAWLTGSPFILSEMGYSPAVIGLSYVPQTIAFLIGGYGCRAALQKWQGKQLLPWLLVLFAVSVIATWAAGFISHVSLVEILIPFCVMAIANGAIYPIVVAQALRPFPHATGRAAALQNTLQLGLCFLASLVVSWLISISTPLLTTTSVMLSTVVLVALGYMMQRCEEVGCQNHGNAEVAHSESH
>CP033401.1|AYQ00917.1|982783_983716_+|LysR-family-transcriptional-regulator
MWSEYSLEVVDAVARNGSFSAAAQELHRVPSAVSYTVRQLEEWLAVPLFERRHRDVELTAAGAWFLKEGRSVVKKMQITRQQCQQIANGWRGQLAIAVDNIVRPERTRQMIVDFYRHFDDVELLVFQEVFNGVWDALSDGRVELAIGATRAIPVGGRYAFRDMGMLSWSCVVASHHPLALMDGPFSDDTLRNWPSLVREDTSRTLPKRITWLLDNQKRVVVPDWESSATCISAGLCIGMVPTHFAKPWLNEGKWVVLELENPFPDSACCLTWQQNDMSPALTWLLEYLGDSETLNKEWLREPEETPATGD
>CP033401.1|AYQ00918.1|983712_984738_-|PurR-family-transcriptional-regulator
MATIKDVAKRANVSTTTVSHVINKTRFVAEETRNAVWAAIKELHYSPSAVARSLKVNHTKSIGLLATSSEAAYFAEIIEAVEKNCFQKGYTLILGNAWNNLEKQRAYLSMMAQKRVDGLLVMCSEYPEPLLAMLEEYRHIPMVVMDWGEAKADFTDAVIDNAFEGGYMAGRYLIERGHREIGVIPGPLERNTGAGRLAGFMKAMEEAMIKVPESWIVQGDFEPESGYRAMQQILSQPHRPTAVFCGGDIMAMGALCAADEMGLRVPQDVSLIGYDNVRNARYFTPALTTIHQPKDSLGETAFNMLLDRIVNKREEPQSIEVHPRLIERRSVADGPFRDYRR
>CP033401.1|AYQ00919.1|985036_985126_+|YnhF-family-membrane-protein
MSTDLKFSLVTTIIVLGLIVAVGLTAALH
>CP033401.1|AYQ00920.1|985291_986461_+|MFS-transporter
MKINYPLLALAIGAFGIGTTEFSPMGLLPVIARGVDVSIPAAGMLISAYAVGVMVGAPLMTLLLSHRARRSALIFLMAIFTLGNVLSAIAPDYMTLMLSRILTSLNHGAFFGLGSVVAASVVPKHKQASAVATMFMGLTLANIGGVPAATWLGETIGWRMSFLATAGLGVISMVSLFFSLPKGGAGARPEVKKELAVLMRPQVLSALLTTVLGAGAMFTLYTYISPVLQSITHATPVFVTAMLVLIGVGFSIGNYLGGKLADRSVNGTLKGFLLLLMVIMLAIPFLARNEFGAAISMVVWGAATFAVVPPLQMRVMRVASEAPGLSSSVNIGAFNLGNALGAAAGGAVISAGLGYSFVPVMGAIVAGLALLLVFMSARKQPETVCVANS
>CP033401.1|AYQ00921.1|986606_987188_-|superoxide-dismutase-[Fe]
MSFELPALPYAKDALAPHISAETIEYHYGKHHQTYVTNLNNLIKGTAFEGKSLEEIIRSSEGGVFNNAAQVWNHTFYWNCLAPNAGGEPTGKVAEAIAASFGSFADFKAQFTDAAIKNFGSGWTWLVKNSDGKLAIVSTSNAGTPLTTDATPLLTVDVWEHAYYIDYRNARPGYLEHFWALVNWEFVAKNLAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_4

1986833-1986977

Orphan

Consensus_repeat	Method
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP033401_4

>merge|CP033401|4|1986833-1986977|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGCTGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTCGTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

>CP033401|4|4|1986833-1986977|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	TGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTC
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ01799.1\|1981861_1982044_+\|DUF1317-family-protein	unknown	unknown	gnl\|CDD\|284449
CP033401.1\|AYQ01801.1\|1982218_1982500_+\|cell-division-protein-ZapA	unknown	unknown	unknown
CP033401.1\|AYQ01806.1\|1984082_1984301_+\|excisionase	unknown	unknown	gnl\|CDD\|116439
CP033401.1\|AYQ01816.1\|1996213_1996903_-\|molybdenum-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|181841
CP033401.1\|AYQ01813.1\|1993183_1994179_-\|6-phosphogluconolactonase	unknown	unknown	gnl\|CDD\|182912
CP033401.1\|AYQ01808.1\|1985483_1986767_+\|acyl-CoA-thioesterase	unknown	unknown	gnl\|CDD\|236709
CP033401.1\|AYQ01802.1\|1982598_1982820_+\|TraR/DksA-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|222775
CP033401.1\|AYQ01812.1\|1992189_1993143_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176131
CP033401.1\|AYQ01814.1\|1994333_1995152_+\|pyridoxal-phosphatase	unknown	unknown	gnl\|CDD\|182523
CP033401.1\|AYQ01815.1\|1995152_1996211_-\|molybdenum-import-ATP-binding-protein-ModC	unknown	unknown	gnl\|CDD\|182993
CP033401.1\|AYQ01817.1\|1996902_1997676_-\|molybdate-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|182641
CP033401.1\|AYQ01818.1\|1997842_1997992_-\|multidrug-efflux-pump-accessory-protein-AcrZ	unknown	unknown	gnl\|CDD\|371231
CP033401.1\|AYQ01807.1\|1984278_1985349_+\|integrase	unknown	unknown	gnl\|CDD\|271181
CP033401.1\|AYQ01805.1\|1983875_1984043_+\|hypothetical-protein	unknown	unknown	unknown
CP033401.1\|AYQ01809.1\|1987000_1989262_-\|hydratase	unknown	unknown	gnl\|CDD\|183125
CP033401.1\|AYQ01800.1\|1982016_1982208_+\|DUF1382-family-protein	unknown	unknown	gnl\|CDD\|369224
CP033401.1\|AYQ01811.1\|1990953_1992006_-\|4-oxalomesaconate-tautomerase	unknown	unknown	gnl\|CDD\|380230
CP033401.1\|AYQ01803.1\|1983030_1983633_-\|hypothetical-protein	unknown	unknown	unknown
CP033401.1\|AYQ01810.1\|1989444_1990878_-\|anion-permease	unknown	unknown	gnl\|CDD\|279307
CP033401.1\|AYQ01804.1\|1983757_1983943_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ01799.1\|1981861_1982044_+\|DUF1317-family-protein	gnl\|CDD\|284449	pfam07026, DUF1317, Protein of unknown function (DUF1317). This family consists of several hypothetical bacterial and phage proteins of around 60 residues in length. The function of this family is unknown.	8.0633e-35
CP033401.1\|AYQ01814.1\|1994333_1995152_+\|pyridoxal-phosphatase	gnl\|CDD\|182523	PRK10530, PRK10530, pyridoxal phosphate (PLP) phosphatase; Provisional.	0
CP033401.1\|AYQ01806.1\|1984082_1984301_+\|excisionase	gnl\|CDD\|116439	pfam07825, Exc, Excisionase-like protein. The phage-encoded excisionase protein (Xis) is involved in excisive recombination by regulating the assembly of the excisive intasome and by inhibiting viral integration. It adopts an unusual 'winged'-helix structure in which two alpha helices are packed against two extended strands. Also present in the structure is a two-stranded anti-parallel beta-sheet, whose strands are connected by a four-residue 'wing'. During interaction with DNA, helix alpha2 is thought to insert into the major groove, while the wing contacts the adjacent minor groove or phosphodiester backbone. The C-terminal region of Xis is involved in interaction with phage-encoded integrase (Int), and a putative C-terminal alpha helix may fold upon interaction with Int and/or DNA.	8.49552e-35
CP033401.1\|AYQ01816.1\|1996213_1996903_-\|molybdenum-ABC-transporter-permease	gnl\|CDD\|181841	PRK09421, modB, molybdate ABC transporter permease subunit.	2.41762e-146
CP033401.1\|AYQ01813.1\|1993183_1994179_-\|6-phosphogluconolactonase	gnl\|CDD\|182912	PRK11028, PRK11028, 6-phosphogluconolactonase; Provisional.	0
CP033401.1\|AYQ01808.1\|1985483_1986767_+\|acyl-CoA-thioesterase	gnl\|CDD\|236709	PRK10531, PRK10531, putative acyl-CoA thioester hydrolase.	0
CP033401.1\|AYQ01802.1\|1982598_1982820_+\|TraR/DksA-family-transcriptional-regulator	gnl\|CDD\|222775	PHA00080, PHA00080, DksA-like zinc finger domain containing protein.	1.11886e-26
CP033401.1\|AYQ01812.1\|1992189_1993143_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176131	cd08440, PBP2_LTTR_like_4, TThe C-terminal substrate binding domain of an uncharacterized LysR-type transcriptional regulator, contains the type 2 periplasmic binding fold. LysR-transcriptional regulators comprise the largest family of prokaryotic transcription factor. Homologs of some of LTTRs with similar domain organizations are also found in the archaea and eukaryotic organisms. The LTTRs are composed of two functional domains joined by a linker helix involved in oligomerization: an N-terminal HTH (helix-turn-helix) domain, which is responsible for the DNA-binding specificity, and a C-terminal substrate-binding domain, which is structurally homologous to the type 2 periplasmic binding proteins. As also observed in the periplasmic binding proteins, the C-terminal domain of the bacterial transcriptional repressor undergoes a conformational change upon substrate binding which in turn changes the DNA binding affinity of the repressor. The genes controlled by the LTTRs have diverse functional roles including amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to a name a few. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	1.09679e-82
CP033401.1\|AYQ01815.1\|1995152_1996211_-\|molybdenum-import-ATP-binding-protein-ModC	gnl\|CDD\|182993	PRK11144, modC, molybdenum ABC transporter ATP-binding protein ModC.	0
CP033401.1\|AYQ01817.1\|1996902_1997676_-\|molybdate-ABC-transporter-substrate-binding-protein	gnl\|CDD\|182641	PRK10677, modA, molybdate transporter periplasmic protein; Provisional.	0
CP033401.1\|AYQ01818.1\|1997842_1997992_-\|multidrug-efflux-pump-accessory-protein-AcrZ	gnl\|CDD\|371231	pfam10766, AcrZ, Multidrug efflux pump-associated protein AcrZ. AcrZ is associated with the AcrA-TolC multidrug efflux pump, it may enhance the ability of the pump to recognize and export certain substrates.	1.04381e-17
CP033401.1\|AYQ01807.1\|1984278_1985349_+\|integrase	gnl\|CDD\|271181	cd00800, INT_Lambda_C, C-terminal catalytic domain of Lambda integrase, a tyrosine-based site-specific recombinase. Lambda-type integrases catalyze site-specific integration and excision of temperate bacteriophages and other mobile genetic elements to and from the bacterial host chromosome. They are tyrosine-based site-specific recombinase and belong to the superfamily of DNA breaking-rejoining enzymes, which share the same fold in their catalytic domain and the overall reaction mechanism. The phage lambda integrase can bridge two different and well-separated DNA sequences called arm- and core-sites. The C-terminal domain binds, cleaves and re-ligates DNA strands at the core-sites, while the N-terminal domain is largely responsible for high-affinity binding to the arm-type sites.	8.02573e-62
CP033401.1\|AYQ01809.1\|1987000_1989262_-\|hydratase	gnl\|CDD\|183125	PRK11413, PRK11413, putative hydratase; Provisional.	0
CP033401.1\|AYQ01800.1\|1982016_1982208_+\|DUF1382-family-protein	gnl\|CDD\|369224	pfam07131, DUF1382, Protein of unknown function (DUF1382). This family consists of several hypothetical Escherichia coli and bacteriophage lambda-like proteins of around 60 residues in length. The function of this family is unknown. Structural modelling suggests this domain may bind nucleic acids.	8.16312e-23
CP033401.1\|AYQ01811.1\|1990953_1992006_-\|4-oxalomesaconate-tautomerase	gnl\|CDD\|380230	NF033377, OMA_tautomer, 4-oxalomesaconate tautomerase.	0
CP033401.1\|AYQ01810.1\|1989444_1990878_-\|anion-permease	gnl\|CDD\|279307	pfam00939, Na_sulph_symp, Sodium:sulfate symporter transmembrane region. There are also some members in this family that do not match the Prosite motif, and belong to the subfamily SODIT1.	0

>CP033401.1|AYQ01808.1|1985483_1986767_+|acyl-CoA-thioesterase
MNTFSVSRLALALAFGVTLTACSSTPPDQRPSDQTAPGTSSRPILSAKEAQNFDAQHYFASLTPGAAAWNPSPITLPAQPDFVVGPAGTQGVTHTTIQAAVDAAIIKRTNKRQYIAVMPGEYQGTVYVPAAPGGITLYGTGEKPIDVKIGLSLDGGMSPADWRHDVNPRGKYMPGKPAWYMYDSCQSKRSDSIGVLCSAVFWSQNNGLQLQNLTIENTLGDSVDAGNHPAVALRTDGDQVQINNVNILGRQNTFFVTNSGVQNRLETNRQPRTLVTNSYIEGDVDIVSGRGAVVFDNTEFRVVNSRTQQEAYVFAPATLSNIYYGFLAVNSRFNAFGDGVAQLGRSLDVDANTNGQVVIRDSAINEGFNTAKPWADAVISNRPFAGNTGSVDDNDEIQRNLNDTNYNRMWEYNNRGVGSKVVAEAKK
>CP033401.1|AYQ01807.1|1984278_1985349_+|integrase
MGRRRSHERRDLPPNLYIRNNGYYCYRDPRTGKEFGLGRDRRIAITEAIQANIELFSGHKHKPLTARINSDNSVTLHSWLDRYEKILASRGIKQKTLINYMSKIKAIRRGLPDAPLEDITTKEIAAMLNGYIDEGKAASAKLIRSTLSDAFREAIAEGHITTNPVAATRAAKSEVRRSRLTADEYLKIYQAAESSPCWLRLAMELAVVTGQRVGDLCEMKWSDIVDGYLYVEQSKTGVKIAIPTVLHVDALGISMKETLDKCKEILGGETIIASTRREPLSSGTVSRYFMRARKASGLSFEGDPPTFHELRSLSARLYEKQISDKFAQHLLGHKSDTMASQYRDDRGREWDKIEIK
>CP033401.1|AYQ01806.1|1984082_1984301_+|excisionase
MYLTLQEWNARQRRPRSLETVRRWVRECRIFPPPVKDGREYLFHESAVKVDLNRPVTGSLLKRIRNGKKAKS
>CP033401.1|AYQ01805.1|1983875_1984043_+|hypothetical-protein
MHFRVTGEWNGEPFNRVIEAENISDCYDHWMLWAQIAHADVTNIRIEELKEHQAA
>CP033401.1|AYQ01804.1|1983757_1983943_-|hypothetical-protein
MFSASITLLNGSPFHSPVTRKCIYHLHKTKPAVASSDKRNPRQCEDAVHCCYTLFCSQRKR
>CP033401.1|AYQ01803.1|1983030_1983633_-|hypothetical-protein
MSYFLRKKWMVNLSGSGKILWALNMKKDSYPYLICMTVSGLIFIFLFFWWRADIYRVTFLNQSISHYYILFSMGIAFLLSLFWVKKGIVKQSGWKSLSAYLKVYAGMCIFAGFFLIIPLTTLTYFLPGETSSYVAPYRYTSGSSKSCSGAEVDDPDLHENIRICYPYGNYEYDNIIYVEKKINILGAVVTYAQTARDDTE
>CP033401.1|AYQ01802.1|1982598_1982820_+|TraR/DksA-family-transcriptional-regulator
MADIIDSASEIEELQRNTAIKMRRLNHQAISATHCCECGDPIDERRRLAVQGCRTCASCQQDLELISKQRGSK
>CP033401.1|AYQ01801.1|1982218_1982500_+|cell-division-protein-ZapA
MHFSGSGLHILCAYACRHGACSMTPQQENALRSIARQANSEIKKARQQFPDKNVDDICRSVLKKHRETVTLMGFTPTHLSLAIGMLNGVFKER
>CP033401.1|AYQ01800.1|1982016_1982208_+|DUF1382-family-protein
MHKASPVELRTSIEMAHSLAQIGVRFVPIPVETDEEFHTLAAFLSQKLEMMVAKAEADERDQV
>CP033401.1|AYQ01799.1|1981861_1982044_+|DUF1317-family-protein
MTHPHDNIRVGAITFVYSVTKRGWVFPGLSVIRNPLKAQRLAEEINNKRGAVCTKHLPLS
>CP033401.1|AYQ01809.1|1987000_1989262_-|hydratase
MIKLSEKGVFLASNNEIIAEEHFTGEIKKEEAQKGTIAWSILSSHNTSGNMDKLKIKFDSLASHDITFVGIVQTAKASGMERFPLPYVLTNCHNSLCAVGGTINGDDHVFGLSAAQRYGGIFVPPHIAVIHQYMREMMAGGGKMILGSDSHTRYGALGTMAVGEGGGELVKQLLNDTWDIDYPGVVAVHLTGKPAPYVGPQDVALAIIGAVFKNGYVKNKVMEFVGPGVSALSTDFRNSVDVMTTETTCLSSVWQTDEEVHNWLALHGRGQDYCQLNPQPMAYYDGCISVDLSAIKPMIALPFHPSNVYKIDTLNQNLTDILREIEIESERVAHGKAKLSLLDKVENGRLKVQQGIIAGCSGGNYENVIAAANALRGQSCGNDTFSLAVYPSSQPVFMDLAQKGVVADLIGAGAIIRTAFCGPCFGAGDTPINNGLSIRHTTRNFPNREGSKPANGQMSAVALMDARSIAATAANGGYLTSASELDCWDNVPEYAFDVTPYKNRVYQGFVKGATQQPLIYGPNIKDWPELGALTDNIVLKVCSKILDEVTTTDELIPSGETSSYRSNPIGLAEFTLSRRDPGYVGRSKATAELENQRLAGNVSELTEVFARIKQIAGQEHIDPLQTEIGSMVYAVKPGDGSAREQAASCQRVIGGLANIAEEYATKRYRSNVINWGMLPLQMAEVPTFEVGDYIYIPGIKAALDNPGTTFKGYVIHEDAPVTEITLYMGSLTAEEREIIKAGSLINFNKNRQM
>CP033401.1|AYQ01810.1|1989444_1990878_-|anion-permease
MNKKSLWKLILILAIPCIIGFMPAPAGLSELAWVLFGIYLAAIVGLVIKPFPEPVVLLIAVAASMVVVGNLSDGAFKTTAVLSGYSSGTTWLVFSAFTLSAAFVTTGLGKRIAYLLIGKIGNTTLGLGYVTVFLDLVLAPATPSNTARAGGIVLPIINSVAVALGSEPEKSPRRVGHYLMMSIYMVTKTTSYMFFTAMAGNILALKMINDILHLQISWGGWALAAGLPGIIMLLVTPLVIYTMYPPEIKKVDNKTIAKAGLAELGPMKIREKMLLGVFVLALLGWIFSKSLGVDESTVAIVVMATMLLLGIVTWEDVVKNKGGWNTLIWYGGIIGLSSLLSKVKFFEWLAEVFKNNLAFDGHGNVAFFVIIFLSIIVRYFFASGSAYIVAMLPVFAMLANVSGAPLMLTALALLFSNSYGGMVTHYGGAAGPVIFGVGYNDIKSWWLVGAVLTILTFLVHITLGVWWWNMLIGWNML
>CP033401.1|AYQ01811.1|1990953_1992006_-|4-oxalomesaconate-tautomerase
MKKIPCVMMRGGTSRGAFLLAEHLPEDQTQRDKILMAIMGSGNDLEIDGIGGGNPLTSKVAIISRSSDLRADVDYLFAQVIVHEQRVDTTPNCGNMLSGVGAFAIENGLIAATSPVTRVRIRNVNTGTFIEADVQTPNGVVEYEGSARIDGVPGTAAPVALTFLNAAGTKTGKVFPTDNQIDYFDDVPVTCIDMAMPVVIIPAEYLGKTGYELPAELDADKALLARIESIRLQAGKAMGLGDVSNMVIPKPVLISPAQKGGAINVRYFMPHSCHRALAITGAIAISSSCALEGTVTRQIVPSVGYGNINIEHPSGALDVHLSNEGQDATTLRASVIRTTRKIFSGEVYLP
>CP033401.1|AYQ01812.1|1992189_1993143_+|LysR-family-transcriptional-regulator
MKHELSSMKAFVILAESSSFNNAAKLLNITQPALTRRIKKMEEDLHIQLFERTTRKVTLTKAGKRLLPEARELIKKFDETLFNIRDMNAYHRGMVTLACIPTAVFYFLPLAIGKFNELYPNIKVRILEQGTNNCMESVLCNESDFGINMNNVTNSSIDFTPLVNEPFVLACRRDHPLAKKQLVEWQELVGYKMIGVRSSSGNRLLIEQQLADKPWKLDWFYEVRHLSTSLGLVEAGLGISALPGLAMPHAPYSSIIGIPLVEPVIRRTLGIIRRKDAVLSPAAERFFALLINLWTDDKDNLWTNIVERQRHALQEIG
>CP033401.1|AYQ01813.1|1993183_1994179_-|6-phosphogluconolactonase
MKQTVYIASPESQQIHVWNLNHEGALTLTQVVDVPGQVQPMVVSPDKRYLYVGVRPEFRVLAYSIAPDDGALTFAAESALPGSPTHISTDHQGQFVFVGSYNAGNVSVTRLEDGLPVGVVDVVEGLDGCHSANISPDNRTLWVPALKQDRICLFTVSDDGHLVAQDPAEVTTVEGAGPRHMVFHPNEQYAYCVNELNSSVDVWELKDPHGNIECVQTLDMMPENFSDTRWAADIHITPDGRHLYACDRTASLITVFSVSEDGSVLSKEGFQPTETQPRGFNVDHSGKYLIAAGQKSHHISVYEIVGEQGLLHEKGRYAVGQGPMWVVVNAH
>CP033401.1|AYQ01814.1|1994333_1995152_+|pyridoxal-phosphatase
MTTRVIALDLDGTLLTPKKTLLPSSIEALARAREAGYQLIIVTGRHHVAIHPFYQALALDTPAICCNGTYLYDYHAKTVLEADPMPVNKALQLIEMLNEHHIHGLMYVDDAMVYEHPTGHVIRTSNWAQTLPPEQRPTFTQVASLAETAQQVNAVWKFALTHDDLPQLQHFGKHVEHELGLECEWSWHDQVDIARGGNSKGKRLTKWVEAQGWSMENVVAFGDNFNDISMLEAAGTGVAMGNADDAVKARANIVIGDNTTDSIAQFIYSHLI
>CP033401.1|AYQ01815.1|1995152_1996211_-|molybdenum-import-ATP-binding-protein-ModC
MLELNFSQTLGNHCLTINETLPANGITAIFGVSGAGKTSLINAISGLTRPQKGRIVLNGRVLNDAEKGICLTPEKRRVGYVFQDARLFPHYKVRGNLRYGMSKSMVDQFDKLVALLGIEPLLDRLPGSLSGGEKQRVAIGRALLTAPELLLLDEPLASLDIPRKRELLPYLQRLTREINIPMLYVSHSLDEILHLADRVMVLENGQVKAFGALEEVWGSSVMNPWLPKEQQSSILKVTVLEHHPHYAMTALALGDQHLWVNKLDEPLQAALRIRIQASDVSLVLQPPQQTSIRNVLRAKVVNSYDDNGQVEVELEVGGKTLWARISPWARDELAIKPGLWLYAQIKSVSITA
>CP033401.1|AYQ01816.1|1996213_1996903_-|molybdenum-ABC-transporter-permease
MILTDPEWQAVLLSLKVSSLAVLFSLPFGIFFAWLLVRCTFPGKALLDSVLHLPLVLPPVVVGYLLLVSMGRRGFIGERLYDWFGITFAFSWRGAVLAAAVMSFPLMVRAIRLALEGVDVKLEQAARTLGAGRWRVFFTITLPLTLPGIIVGTVLAFARSLGEFGATITFVSNIPGETRTIPSAMYTLIQTPGGESGAARLCIISIALAMISLLISEWLARISRERAGR
>CP033401.1|AYQ01817.1|1996902_1997676_-|molybdate-ABC-transporter-substrate-binding-protein
MARKWLNLFAGAALSFAVAGNALADEGKITVFAAASLTNAMQDIATQYKKEKGVDVVSSFASSSTLARQIEAGAPADLFISADQKWMDYAVDKKAIDTATRQTLLGNSLVVVAPKASEQKDFTIDSKTNWTSLLNGGRLAVGDPEHVPAGIYAKEALQKLGAWDTLSPKLAPAEDVRGALALVERNEAPLGIVYGSDAVASKGVKVVAIFPEDSHKKVEYPVAVVEGHNNATVKAFYDYLKGPQAAEIFKRYGFTTK
>CP033401.1|AYQ01818.1|1997842_1997992_-|multidrug-efflux-pump-accessory-protein-AcrZ
MLELLKSLVFAVIMVPVVMAIILGLIYGLGEVFNIFSGVGKKDQPGQNH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_5

2497646-2497799

Orphan

Consensus_repeat	Method
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCG	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP033401_5

>merge|CP033401|5|2497646-2497799|CRISPRCasFinder
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCGTCAGCGTCGCATCAGGCATCTGCGCATAACCGCCGGATGCGGCGTAAACGCCTTATCCGGCCTACCGATCCGGCACAGGTTTGTAGGCATGATAAGACGCG

>CP033401|5|5|2497646-2497799|CRISPRCasFinder
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCG	TCAGCGTCGCATCAGGCATCTGCGCATAACCGCCGGATGCGGCGTAAA
CGCCTTATCCGGCCTACCGATCCGGCACAGGTTTGTAGGCATGATAAGACGCG

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ02250.1\|2499551_2500292_+\|transpeptidase	unknown	unknown	gnl\|CDD\|225577
CP033401.1\|AYQ02254.1\|2504540_2505014_-\|inhibitor-of-vertebrate-lysozyme	unknown	unknown	gnl\|CDD\|182187
CP033401.1\|AYQ02239.1\|2487471_2488527_+\|phosphoporin-PhoE	unknown	unknown	gnl\|CDD\|182275
CP033401.1\|AYQ04309.1\|2507837_2510897_-\|RHS-repeat-protein	unknown	unknown	gnl\|CDD\|225750
CP033401.1\|AYQ02247.1\|2495771_2497511_+\|flagellar-type-III-secretion-system-protein-FlhA	unknown	unknown	gnl\|CDD\|224217
CP033401.1\|AYQ02253.1\|2502053_2504498_+\|acyl-CoA-dehydrogenase	unknown	unknown	gnl\|CDD\|236528
CP033401.1\|AYQ02246.1\|2493915_2494971_-\|DNA-polymerase-IV	unknown	unknown	gnl\|CDD\|235035
CP033401.1\|AYQ02242.1\|2490360_2490819_-\|xanthine-phosphoribosyltransferase	unknown	unknown	gnl\|CDD\|236395
CP033401.1\|AYQ02245.1\|2493466_2493919_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|182099
CP033401.1\|AYQ02244.1\|2492893_2493160_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|181972
CP033401.1\|AYQ02255.1\|2505167_2505938_+\|amidohydrolase	unknown	unknown	gnl\|CDD\|182461
CP033401.1\|AYQ02249.1\|2498501_2499260_-\|peptidoglycan-endopeptidase	unknown	unknown	gnl\|CDD\|223862
CP033401.1\|AYQ04308.1\|2495041_2495812_-\|putative-lateral-flagellar-export/assembly-protein-LafU	unknown	unknown	gnl\|CDD\|235860
CP033401.1\|AYQ02243.1\|2491079_2492537_+\|cytosol-nonspecific-dipeptidase	unknown	unknown	gnl\|CDD\|184986
CP033401.1\|AYQ02252.1\|2501235_2501814_-\|D-sedoheptulose-7-phosphate-isomerase	unknown	unknown	gnl\|CDD\|179012
CP033401.1\|AYQ02241.1\|2489024_2490269_-\|esterase	unknown	unknown	gnl\|CDD\|235337
CP033401.1\|AYQ02248.1\|2497828_2498326_-\|transposase	unknown	unknown	gnl\|CDD\|224854
CP033401.1\|AYQ02256.1\|2507376_2507826_-\|hypothetical-protein	unknown	unknown	unknown
CP033401.1\|AYQ02240.1\|2488565_2488967_-\|sigma-factor-binding-protein-Crl	unknown	unknown	gnl\|CDD\|182882
CP033401.1\|AYQ02251.1\|2500262_2501030_-\|class-II-glutamine-amidotransferase	unknown	unknown	gnl\|CDD\|372525

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ02250.1\|2499551_2500292_+\|transpeptidase	gnl\|CDD\|225577	COG3034, COG3034, Uncharacterized protein conserved in bacteria [Function unknown].	1.07529e-116
CP033401.1\|AYQ02254.1\|2504540_2505014_-\|inhibitor-of-vertebrate-lysozyme	gnl\|CDD\|182187	PRK09993, PRK09993, C-lysozyme inhibitor; Provisional.	9.39999e-93
CP033401.1\|AYQ02239.1\|2487471_2488527_+\|phosphoporin-PhoE	gnl\|CDD\|182275	PRK10159, PRK10159, phosphoporin PhoE.	0
CP033401.1\|AYQ04309.1\|2507837_2510897_-\|RHS-repeat-protein	gnl\|CDD\|225750	COG3209, RhsA, Rhs family protein [Cell envelope biogenesis, outer membrane].	1.46409e-133
CP033401.1\|AYQ02247.1\|2495771_2497511_+\|flagellar-type-III-secretion-system-protein-FlhA	gnl\|CDD\|224217	COG1298, FlhA, Flagellar biosynthesis pathway, component FlhA [Cell motility and secretion / Intracellular trafficking and secretion].	0
CP033401.1\|AYQ02253.1\|2502053_2504498_+\|acyl-CoA-dehydrogenase	gnl\|CDD\|236528	PRK09463, fadE, acyl-CoA dehydrogenase; Reviewed.	0
CP033401.1\|AYQ02246.1\|2493915_2494971_-\|DNA-polymerase-IV	gnl\|CDD\|235035	PRK02406, PRK02406, DNA polymerase IV; Validated.	0
CP033401.1\|AYQ02242.1\|2490360_2490819_-\|xanthine-phosphoribosyltransferase	gnl\|CDD\|236395	PRK09177, PRK09177, xanthine-guanine phosphoribosyltransferase; Validated.	5.05624e-113
CP033401.1\|AYQ02245.1\|2493466_2493919_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|182099	PRK09831, PRK09831, GNAT family N-acetyltransferase.	4.77997e-103
CP033401.1\|AYQ02244.1\|2492893_2493160_-\|hypothetical-protein	gnl\|CDD\|181972	PRK09588, PRK09588, hypothetical protein; Reviewed.	1.93527e-42
CP033401.1\|AYQ02255.1\|2505167_2505938_+\|amidohydrolase	gnl\|CDD\|182461	PRK10438, PRK10438, C-N hydrolase family amidase; Provisional.	0
CP033401.1\|AYQ02249.1\|2498501_2499260_-\|peptidoglycan-endopeptidase	gnl\|CDD\|223862	COG0791, Spr, Cell wall-associated hydrolases (invasion-associated proteins) [Cell envelope biogenesis, outer membrane].	3.3314e-41
CP033401.1\|AYQ04308.1\|2495041_2495812_-\|putative-lateral-flagellar-export/assembly-protein-LafU	gnl\|CDD\|235860	PRK06778, PRK06778, hypothetical protein; Validated.	8.79616e-171
CP033401.1\|AYQ02243.1\|2491079_2492537_+\|cytosol-nonspecific-dipeptidase	gnl\|CDD\|184986	PRK15026, PRK15026, aminoacyl-histidine dipeptidase; Provisional.	0
CP033401.1\|AYQ02252.1\|2501235_2501814_-\|D-sedoheptulose-7-phosphate-isomerase	gnl\|CDD\|179012	PRK00414, gmhA, D-sedoheptulose 7-phosphate isomerase.	4.96343e-141
CP033401.1\|AYQ02241.1\|2489024_2490269_-\|esterase	gnl\|CDD\|235337	PRK05077, frsA, esterase FrsA.	0
CP033401.1\|AYQ02248.1\|2497828_2498326_-\|transposase	gnl\|CDD\|224854	COG1943, COG1943, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	7.32036e-43
CP033401.1\|AYQ02240.1\|2488565_2488967_-\|sigma-factor-binding-protein-Crl	gnl\|CDD\|182882	PRK10984, PRK10984, sigma factor-binding protein Crl.	1.11584e-87
CP033401.1\|AYQ02251.1\|2500262_2501030_-\|class-II-glutamine-amidotransferase	gnl\|CDD\|372525	pfam13230, GATase_4, Glutamine amidotransferases class-II. This family captures members that are not found in pfam00310.	8.29603e-146

>CP033401.1|AYQ02247.1|2495771_2497511_+|flagellar-type-III-secretion-system-protein-FlhA
MLSRSDLLTLLTINFIVVTKGAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQTRRKDVASEADFYGAMDGASKFVRGDAIAGMMILAINLIGGVCIGIFKYNLSADAAFQQYVLMTIGDGLVAQIPSLLLSTAAAIIVTRISDNGDITHDVRHQLLASPSVLYTATGIMFVLAVVPGMPHLPFLLFSALLGFTGWRMSKRPQAAEAEEKSLETLTRTITETSEQQVSWETIPLIEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYAIFINGIKADEADIPADKLMALPSSETYGEIDGVLGNDPAYGMPVTWIQPAQKAKALNMGYQVIDSASVIATHVNKIVRSYIPDLFSYDDITQLHNRLSSMAPRLAEDLSAALNYSQLLKVYRALLTEGVSLRDIVTIATVLVASSAVTKDHILLAADVRLALRRSITHPFVRKQELTVYTLNNELENLLTNVVNQAQQGGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVPPQLRPLLARYARLFAPGLHVLSYNEVPDELELKIMGALM
>CP033401.1|AYQ04308.1|2495041_2495812_-|putative-lateral-flagellar-export/assembly-protein-LafU
MIVNSVSKSERESIIAALHGQSIFSGGGLSPLNKISPSHPPKPATVAVPEETEKKARDVNEKTALLKKKSATELGELATSINTIARDAHMEANLEMEIVPQGLRVLIKDDQNRNMFECGSAQIMPFFKTLLVELAPVFDSLDNKIIITGHTDAMAYKNNIYNNWNLSGDRALSARRVLEEAGMPEDKVMQVSAMADQMLLDAKNPQSAGNRRIEIMVLTKSASDTLYQYFGQHGDKVVQPLVQKLDKQQVLSQRMR
>CP033401.1|AYQ02246.1|2493915_2494971_-|DNA-polymerase-IV
MRKIIHVDMDCFFAAVEMRDNPALRDIPIAIGGSRERRGVISTANYPARKFGVRSAMPTGMALKLCPHLTLLPGRFDAYKEASNHIREIFSRYTSRIEPLSLDEAYLDVTDSVHCHGSATLIAQEIRQTIFNELHLTASAGVAPVKFLAKIASDMNKPNGQFVITPAEVPAFLQTLPLAKIPGVGKVSAAKLEAMGLRTCGDVQKCDLVILLKRFGKFGRILWERSQGIDERDVNSERLRKSVGVERTMAEDIHHWSECEAIIERLYPELERRLAKVKPDLLIARQGVKLKFDDFQQTTQEHVWPRLNKADLIATARKTWDERRGGRGVRLVGLHVTLLDPQMERQLVLGL
>CP033401.1|AYQ02245.1|2493466_2493919_-|GNAT-family-N-acetyltransferase
MNNIQIRNYQPGDFQQLCAIFIRAVMMTASQHYSPQQIAAWAQIDESRWKEKLAKSQVRVAVINAQPVGFISRIERHIDMLFVDPEYTRRGVASALLKPLIKSESELTVDASITAKPFFERYGFQIVKQQHVECRGAWFTNFYMRYKPQH
>CP033401.1|AYQ02244.1|2492893_2493160_-|hypothetical-protein
MEWYMGKYIRPLSDAVFTIASDDLWIESLAIQQLHTTANLPNMQRVVGMPDLHPGRGYPIGAAFFSVGRFYPARRRGNGAGNRNGPLL
>CP033401.1|AYQ02243.1|2491079_2492537_+|cytosol-nonspecific-dipeptidase
MSELSQLSPQPLWDIFAKICSIPHPSYHEEQLAEYIVGWAKEKGFHVERDQVGNILIRKPATAGMENRKPVVLQAHLDMVPQKNNDTVHDFTKDPIQPYIDGEWVKARGTTLGADNGIGMASALAVLADENVVHGPLEVLLTMTEEAGMDGAFGLQSNWLQADILINTDSEEEGEIYMGCAGGIDFTSNLHLDREAVPAGFETFKLTLKGLKGGHSGGEIHVGLGNANKLLVRFLAGHAEELDLRLIDFNGGTLRNAIPREAFATIAVAADKVDALKSLVNTYQDILKNELAEKEKNLALLLDSVANDKAALIAKSRDTFIRLLNATPNGVIRNSDVAKGVVETSLNVGVVTMTDNNVEIHCLIRSLIDSGKDYVVSMLDSLGKLAGAKTEAKGAYPGWQPDANSPVMHLVRETYQRLFNKTPNIQIIHAGLECGLFKKPYPEMDMVSIGPTITGPHSPDEQVHIKSVGHYWTLLTELLKEIPAK
>CP033401.1|AYQ02242.1|2490360_2490819_-|xanthine-phosphoribosyltransferase
MSEKYIVTWDMLQIHARKLASRLMPSEQWKGIIAVSRGGLVPGALLARELGIRHVDTVCISSYDHDNQRELKVLKRAEGDGEGFIVIDDLVDTGGTAVAIREMYPKAHFVTIFAKPAGRPLVDNYVVDIPQDTWIEQPWDMGVVFVPPISGR
>CP033401.1|AYQ02241.1|2489024_2490269_-|esterase
MTQANLSETLFKPRFKHPETSTLVRRFNHGAQPPVQSALDGKTIPHWYRMINRLMWIWRGIDPREILDVQARIVMSDAERTDDDLYDTVIGYRGGNWIYEWATQAMVWQQKACAEEDPQLSGRHWLHAATLYNIAAYPHLKGDDLAEQAQALSNRAYEEAAQRLPGTMRQMEFTVPGGAPITGFLHMPKGDGPFPTVLMCGGLDAMQTDYYSLYERYFAPRGIAMLTIDMPSVGFSSKWKLTQDSSLLHQHVLKALPNVPWVDHTRVAAFGFRFGANVAVRLAYLESPRLKAVACLGPVVHTLLSDFKCQQQVPEMYLDVLASRLGMHDASDDALRVELNRYSLKVQGLLGRRCPTPMLSGYWKNDPFSPEEDSRLITSSSADGKLLEIPFNPVYRNFDKGLQEITGWIEKRLC
>CP033401.1|AYQ02240.1|2488565_2488967_-|sigma-factor-binding-protein-Crl
MTLPSGHPKSRLIKKFTALGPYIREGKCEDNRFFFDCLAVCVNVKPAPEVREFWGWWMELEAQESRFTYSYQFGLFDKAGDWKSVPVKDTEVVERLEHTLREFHEKLRELLTTLNLKLEPADDFRDEPVKLTA
>CP033401.1|AYQ02239.1|2487471_2488527_+|phosphoporin-PhoE
MKKSTLALVVMGIVASASVQAAEIYNKDGNKLDVYGKVKAMHYMSDNDSKDGDQSYIRFGFKGETQINDQLTGYGRWEAEFAGNKAESDTAQQKTRLAFAGLKYKDLGSFDYGRNLGALYDVEAWTDMFPEFGGDSSAQTDNFMTKRASGLATYRNTDFFGVIDGLNLTLQYQGKNENRDVKKQNGDGFGTSLTYDFGGSDFAISGAYTNSDRTNEQNLQSRGTGKRAEAWATGLKYDANNIYLATFYSETRKMTPITGGFANKTQNFEAVAQYQFDFGLRPSLGYVLSKGKDIEGIGDEDLVNYIDVGATYYFNKNMSAFVDYKINQLDSDNKLNINNDDIVAVGMTYQF
>CP033401.1|AYQ02248.1|2497828_2498326_-|transposase
MSEYRRYYIKGGTWFFTVNLRNRRSQLLTTQYQMLRHAIIKVKRDRPFEINAWVVLPEHMHCIWTLPEGDDDFSSRWREIKKQFTHACGLKNIWQPRFWEHAIRNTKDYRHHVDYIYINPVKHGWVKQVSDWPFSTFHRDVARGLYPIDWAGDVTDINAGERIIL
>CP033401.1|AYQ02249.1|2498501_2499260_-|peptidoglycan-endopeptidase
MSFMSSFLLGRFLHPGVFSLCVLLPLFASATTSHISFSYAARQRMQNRARLLKQYQTHLKKQASYIVEGNAESRRALRQHNREQIKQHPEWFPAPLKASDRRWQALAENNHFLSSDHLHNITEVAIHRLEQQLGKPYVWGGTRPDQGFDCSGLVFYAYNKILEAKLPRTANEMYHYHRATIVANNDLRRGDLLFFHIHSREIADHMGVYLGDGQFIESPRTGENIRVSRLAEPFWQDHFLGARRILTEETIL
>CP033401.1|AYQ02250.1|2499551_2500292_+|transpeptidase
MRKIALILAMLLIPCVSFAGLLGSSSSTTPVSKEYKQQLMGSPVYIQIFKEERTLDLYVKMGEQYQLLDSYKICKYSGGLGPKQRQGDFKSPEGFYSVQRNQLKPDSRYYKAINIGFPNAYDRAHGYEGKYLMIHGDCVSIGCYAMTNQGIDEIFQFVTGALVFGQPSVQVSIYPFRMTDANMKRHKYSNFKDFWEQLKPGYDYFEQTRKPPTVSVVNGRYVVSKPLSHEVVQPQLASNYTLPEAK
>CP033401.1|AYQ02251.1|2500262_2501030_-|class-II-glutamine-amidotransferase
MCELLGMSANVPTDICFSFTGLVQRGGGTGPHKDGWGITFYEGKGCRTFKDPQPSFNSPIAKLVQDYPIKSCSVVAHIRQANRGEVALENTHPFTRELWGRNWTYAHNGQLTGYKSLETGNFRPVGETDSEKAFCWLLHKLTQRYPRTPGNMAAVFKYIASLADELRQKGVFNMLLSDGRYVMAYCSTNLHWITRRAPFGVATLLDQDVEIDFSSQTTPNDVVTVIATQPLTGNETWQKIMPGEWRLFCLGERVV
>CP033401.1|AYQ02252.1|2501235_2501814_-|D-sedoheptulose-7-phosphate-isomerase
MYQDLIRNELNEAAETLANFLKDDANIHAIQRAAVLLADSFKAGGKVLSCGNGGSHCDAMHFAEELTGRYRENRPGYPAIAISDVSHISCVGNDFGFNDIFSRYVEAVGREGDVLLGISTSGNSANVIKAIAAAREKGMKVITLTGKDGGKMAGTADIEIRVPHFGYADRIQEIHIKVIHILIQLIEKEIVK
>CP033401.1|AYQ02253.1|2502053_2504498_+|acyl-CoA-dehydrogenase
MMILSILATVVLLGALFYHRVSLFISSLILLAWTAALGVAGLWSAWVLVPLAIILVPFNFAPMRKSMISAPVFRGFRKVMPPMSRTEKEAIDAGTTWWEGDLFQGKPDWKKLHNYPQPRLTAEEQAFLDGPVEEACRMANDFQITHELADLPPELWAYLKEHRFFAMIIKKEYGGLEFSAYAQSRVLQKLSGVSGILAITVGVPNSLGPGELLQHYGTDEQKNHYLPRLARGQEIPCFALTSPEAGSDAGAIPDTGIVCMGEWQGQQVLGMRLTWNKRYITLAPIATVLGLAFKLSDPEKLLGGAEDLGITCALIPTTTPGVEIGRRHFPLNVPFQNGPTRGKDVFVPIDYIIGGPKMAGQGWRMLVECLSVGRGITLPSNSTGGVKSVALATGAYAHIRRQFKISIGKMEGIEEPLARIAGNAYVMDAAASLITYGIMLGEKPAVLSAIVKYHCTHRGQQSIIDAMDITGGKGIMLGQSNFLARAYQGAPIAITVEGANILTRSMMIFGQGAIRCHPYVLEEMEAAKNNDVNAFDKLLFKHIGHVGSNKVRSFWLGLTRGLTSSTPTGDATKRYYQHLNRLSANLALLSDVSMAVLGGSLKRRERISARLGDILSQLYLASAVLKRYDDEGRNEADLPLVHWGVQDALYQAEQAMDDLLQNFPNRVVAGLLNVVIFPTGRHYLAPSDKLDHKVAKILQVPNATRSRIGRGQYLTPSEHNPVGLLEEALVDVIAADPIHQRICKELGKNLPFTRLDELAHNALAKGLIDKDEAAILVKAEESRLCSINVDDFDPEELATKPVKLPEKVRKVEAA
>CP033401.1|AYQ02254.1|2504540_2505014_-|inhibitor-of-vertebrate-lysozyme
MGRISSGGMMFKAITTVAALVIATSAMAQDDLTISSLAKGETTKAAFNQMVQGHKLPAWVMKGGTYTPAQTVTLGDETYQVMSACKPHDCGSQRIAVMWSEKSNQMTGLFSTIDEKTSQEKLTWLNVNDALSIDGKTVLFAALTGSLENHPDGFNFK
>CP033401.1|AYQ02255.1|2505167_2505938_+|amidohydrolase
MPGLKITLLQQPLVWMDGPANLRHFDRQLEGITGRDVIVLPEMFTSGFAMEAAASSLAQNDVVNWMTAKAQQCNALIAGSVALQTESGSVNRFLLVEPGGTVHFYDKRHLFRMADEHLHYKAGNARVIVEWRGWRILPLVCYDLRFPVWSRNLNDYDLAIYVANWPAPRSLHWQALLTARAIENQAYVAGCNRVGSDGNGCHYRGDSRVINPQGEIIATADAHQATRIDAELSMVALREYREKFPAWQDADEFRLR
>CP033401.1|AYQ02256.1|2507376_2507826_-|hypothetical-protein
MMKYLMVLLSLFSGSVLGMGRVNELCGIDSVKTIEIINLPSYVTTLVPLSKEGLNEIYRYKVVVNEISDLYAGKIIDLLQMKYFRKEKYNNIRWGVSIISKGNNKCEIYFDAFGECGSVNGINVCFEKNEMIGWIKKEIPLLSQKIGGL
>CP033401.1|AYQ04309.1|2507837_2510897_-|RHS-repeat-protein
MTSPLNSEGRYTEGEGGLKRVVKKEHADGSITRSEYDEAGRLKAQTDAAGRRTEYSLHMASGAVTAVTGPDGRTVRYGYNSQRQVTSVTYPDGLRSSREYDEKGRLTAETSRSGETTRYSYDDPASELPTGIQDATGSTKQMAWSRYGQLLAFTDCSGYTTRYEYDRYGQQIAVHREEGISTYSSYNPRGQLVSQKDAQGREIRYEYSAAGDLTATISPDGKRSTIEYDKRGRPVSVTEGGLTRSMGYDAAGRITVLTNENGSQSTFRYDPVDRLTEQRGFDGRTQRYHYDLTGKLTQSEDEGLITLWHYDASDRITHRTVNGDPAEQWQYDEHGWLTTLSHTCEGHRVSVHYGYDDKGRLTGERQTVENPETGEMLWEHETGHAYSEQGLATRQEPDGLPPVEWLTYGSGYLAGMKLGGTPLVEYTRDRLHRETARSFGGAGSTAGYEQATAYTLTGQLQSRHLNLPQLDCDYTWNDNGQLVRISGPQECREYRYSGTGRLTGVHTTAANLDIDIPYATDPAGNRLPDPELHPDSTLTAWPDNRIAEDAHYVYRYDEYGRLAEKTDRIPEGVIRMHDERTHHYHYDSQHRLVFYTRIQHGEPQVESRYLYDPLGRRTGKRVWRRERDLTGWMSLSRKPEETWYGWDGDRLTTVQTQQTRIQTVYQPGSFTPLLRIETENGEQAKARHRSLAEVLQEDTGVTLPAELAVMLGRLERELRQGSVSEESQQWLAQCGLTAEQMAAQLEAEYIPERKLHLYHCDHRGLPLALISPEGETAWQGEYDEWGNLLGEESAQHLQQSLRLPGQQYDEESGLYYNRNRYYDPLQGRYITQDPIGLRGEWNLYKYPLNPVRFIDSLGLKFHVNGDPSDFNQAVEYLKQDSQMKETIDFLSSSEETINIEYIEGTNVRFNSNNMAIYWNSRASLFCSTELNSKSQSPALGLGHEFAHAQYYLLDKENFMALLSRTDKKYENKEEARVITIIESRAAKTLGECTRGAHSGLPFYRVDGPLQTMKITGTPE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_6

2711093-2711225

Orphan

Consensus_repeat	Method
ATCACCAATATTGAAAA	PILER-CR

2 spacers

The CRISPR arrays of CP033401_6

>merge|CP033401|6|2711093-2711225|PILER-CR
ATCACCAATATTGAAAATGTCACACGCAGATAAATCCAACTTTCAATATTGTTAAGTTCCTCACCAATATTGAAAACATGGCGTAGCAAAAAGAAATTTTCAATATTGCTTTATGGATCACCAATATTGAAAG

>CP033401|6|1|2711093-2711225|PILER-CR
ATCACCAATATTGAAAA	TGTCACACGCAGATAAATCCAACTTTCAATATTGTTAAGTTC
CTCACCAATATTGAAAA	CATGGCGTAGCAAAAAGAAATTTTCAATATTGCTTTATGG
ATCACCAATATTGAAAG

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ02423.1\|2711475_2712990_+\|L-carnitine/gamma-butyrobetaine-antiporter	unknown	unknown	gnl\|CDD\|179568
CP033401.1\|AYQ02414.1\|2701797_2702175_+\|Co2+/Mg2+-efflux-protein-ApaG	unknown	unknown	gnl\|CDD\|180098
CP033401.1\|AYQ02425.1\|2714291_2715509_+\|L-carnitine-CoA-transferase	unknown	unknown	gnl\|CDD\|179589
CP033401.1\|AYQ02431.1\|2722639_2723788_-\|carbamoyl-phosphate-synthase-small-subunit	unknown	unknown	gnl\|CDD\|237139
CP033401.1\|AYQ02419.1\|2707654_2707942_-\|ferredoxin-like-protein-FixX	unknown	unknown	gnl\|CDD\|185346
CP033401.1\|AYQ02429.1\|2718744_2719140_-\|transcriptional-activatory-protein-CaiF	unknown	unknown	gnl\|CDD\|183154
CP033401.1\|AYQ02415.1\|2702181_2703024_+\|diadenosine-tetraphosphatase	unknown	unknown	gnl\|CDD\|273208
CP033401.1\|AYQ02422.1\|2710231_2711002_-\|protein-FixA	unknown	unknown	gnl\|CDD\|179569
CP033401.1\|AYQ02432.1\|2724243_2725065_-\|4-hydroxy-tetrahydrodipicolinate-reductase	unknown	unknown	gnl\|CDD\|223366
CP033401.1\|AYQ02420.1\|2707938_2709225_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182273
CP033401.1\|AYQ02427.1\|2717244_2718030_+\|crotonobetainyl-CoA-hydratase	unknown	unknown	gnl\|CDD\|179599
CP033401.1\|AYQ02418.1\|2706265_2707597_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|340874
CP033401.1\|AYQ02417.1\|2705627_2706158_-\|glutathione-regulated-potassium-efflux-system-ancillary-protein-KefF	unknown	unknown	gnl\|CDD\|234852
CP033401.1\|AYQ02430.1\|2719400_2722622_-\|carbamoyl-phosphate-synthase-large-subunit	unknown	unknown	gnl\|CDD\|235393
CP033401.1\|AYQ02428.1\|2718035_2718626_+\|carnitine-operon-protein-CaiE	unknown	unknown	gnl\|CDD\|184189
CP033401.1\|AYQ04316.1\|2703101_2703581_-\|type-3-dihydrofolate-reductase	unknown	unknown	gnl\|CDD\|182714
CP033401.1\|AYQ02424.1\|2713020_2714163_+\|crotonobetainyl-CoA-dehydrogenase	unknown	unknown	gnl\|CDD\|179566
CP033401.1\|AYQ02416.1\|2703772_2705635_-\|glutathione-regulated-potassium-efflux-system-protein-KefC	unknown	unknown	gnl\|CDD\|235131
CP033401.1\|AYQ02426.1\|2715582_2717136_+\|ATP-dependent-acyl-CoA-ligase	unknown	unknown	gnl\|CDD\|181195
CP033401.1\|AYQ02421.1\|2709275_2710217_-\|protein-FixB	unknown	unknown	gnl\|CDD\|235120

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ02423.1\|2711475_2712990_+\|L-carnitine/gamma-butyrobetaine-antiporter	gnl\|CDD\|179568	PRK03356, PRK03356, L-carnitine/gamma-butyrobetaine antiport BCCT transporter.	0
CP033401.1\|AYQ02414.1\|2701797_2702175_+\|Co2+/Mg2+-efflux-protein-ApaG	gnl\|CDD\|180098	PRK05461, apaG, CO2+/MG2+ efflux protein ApaG; Reviewed.	3.63315e-76
CP033401.1\|AYQ02425.1\|2714291_2715509_+\|L-carnitine-CoA-transferase	gnl\|CDD\|179589	PRK03525, PRK03525, L-carnitine CoA-transferase.	0
CP033401.1\|AYQ02431.1\|2722639_2723788_-\|carbamoyl-phosphate-synthase-small-subunit	gnl\|CDD\|237139	PRK12564, PRK12564, carbamoyl-phosphate synthase small subunit.	0
CP033401.1\|AYQ02419.1\|2707654_2707942_-\|ferredoxin-like-protein-FixX	gnl\|CDD\|185346	PRK15449, PRK15449, ferredoxin-like protein FixX; Provisional.	2.23442e-69
CP033401.1\|AYQ02429.1\|2718744_2719140_-\|transcriptional-activatory-protein-CaiF	gnl\|CDD\|183154	PRK11476, PRK11476, carnitine metabolism transcriptional regulator CaiF.	1.42176e-74
CP033401.1\|AYQ02415.1\|2702181_2703024_+\|diadenosine-tetraphosphatase	gnl\|CDD\|273208	TIGR00668, Bis5'-nucleosyl-tetraphosphatase_symmetrical, bis(5'-nucleosyl)-tetraphosphatase (symmetrical). Diadenosine 5',5"'-P1,P4-tetraphosphate (Ap4A) is a regulatory metabolite of stress conditions. It is hydrolyzed to two ADP by this enzyme. Alternate names include diadenosine-tetraphosphatase and Ap4A hydrolase. [Cellular processes, Adaptations to atypical conditions].	0
CP033401.1\|AYQ02422.1\|2710231_2711002_-\|protein-FixA	gnl\|CDD\|179569	PRK03359, PRK03359, putative electron transfer flavoprotein FixA; Reviewed.	6.8619e-170
CP033401.1\|AYQ02432.1\|2724243_2725065_-\|4-hydroxy-tetrahydrodipicolinate-reductase	gnl\|CDD\|223366	COG0289, DapB, Dihydrodipicolinate reductase [Amino acid transport and metabolism].	9.17052e-141
CP033401.1\|AYQ02420.1\|2707938_2709225_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182273	PRK10157, PRK10157, putative oxidoreductase FixC; Provisional.	0
CP033401.1\|AYQ02427.1\|2717244_2718030_+\|crotonobetainyl-CoA-hydratase	gnl\|CDD\|179599	PRK03580, PRK03580, crotonobetainyl-CoA hydratase.	1.51953e-178
CP033401.1\|AYQ02418.1\|2706265_2707597_-\|MFS-transporter	gnl\|CDD\|340874	cd17316, MFS_SV2_like, Metazoan Synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters of the Major Facilitator Superfamily. This family is composed of metazoan synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters including those that transport inorganic phosphate (Pht), aromatic compounds (PcaK and related proteins), proline/betaine (ProP), alpha-ketoglutarate (KgtP), citrate (CitA), shikimate (ShiA), and cis,cis-muconate (MucK), among others. SV2 is a transporter-like protein that serves as the receptor for botulinum neurotoxin A (BoNT/A), one of seven neurotoxins produced by the bacterium Clostridium botulinum. BoNT/A blocks neurotransmitter release by cleaving synaptosome-associated protein of 25 kD (SNAP-25) within presynaptic nerve terminals. Also included in this family is synaptic vesicle 2 (SV2)-related protein (SVOP) and similar proteins. SVOP is a transporter-like nucleotide binding protein that localizes to neurotransmitter-containing vesicles. The SV2-like family belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	5.4298e-59
CP033401.1\|AYQ02417.1\|2705627_2706158_-\|glutathione-regulated-potassium-efflux-system-ancillary-protein-KefF	gnl\|CDD\|234852	PRK00871, PRK00871, glutathione-regulated potassium-efflux system oxidoreductase KefF.	2.99389e-133
CP033401.1\|AYQ02430.1\|2719400_2722622_-\|carbamoyl-phosphate-synthase-large-subunit	gnl\|CDD\|235393	PRK05294, carB, carbamoyl-phosphate synthase large subunit.	0
CP033401.1\|AYQ02428.1\|2718035_2718626_+\|carnitine-operon-protein-CaiE	gnl\|CDD\|184189	PRK13627, PRK13627, carnitine operon protein CaiE; Provisional.	4.44962e-142
CP033401.1\|AYQ04316.1\|2703101_2703581_-\|type-3-dihydrofolate-reductase	gnl\|CDD\|182714	PRK10769, folA, type 3 dihydrofolate reductase.	1.07206e-127
CP033401.1\|AYQ02424.1\|2713020_2714163_+\|crotonobetainyl-CoA-dehydrogenase	gnl\|CDD\|179566	PRK03354, PRK03354, crotonobetainyl-CoA dehydrogenase; Validated.	0
CP033401.1\|AYQ02416.1\|2703772_2705635_-\|glutathione-regulated-potassium-efflux-system-protein-KefC	gnl\|CDD\|235131	PRK03562, PRK03562, glutathione-regulated potassium-efflux system protein KefC; Provisional.	0
CP033401.1\|AYQ02426.1\|2715582_2717136_+\|ATP-dependent-acyl-CoA-ligase	gnl\|CDD\|181195	PRK08008, caiC, putative crotonobetaine/carnitine-CoA ligase; Validated.	0
CP033401.1\|AYQ02421.1\|2709275_2710217_-\|protein-FixB	gnl\|CDD\|235120	PRK03363, fixB, electron transfer flavoprotein subunit alpha/FixB family protein.	0

>CP033401.1|AYQ02422.1|2710231_2711002_-|protein-FixA
MKIITCYKCVPDEQDIAVNNADGSLDFSKADAKISQYDLNAIEAACQLKQQAAEAQVTALSVGGKALTNAKGRKDVLSRGPDELIVVIDDQFEQALPQQTASALAAAAQKAGFDLILCGDGSSDLYAQQVGLLVGEILNIPAVNGVSKIISLTADTLTVERELEDETETLSIPLPAVVAVSTDINSPQIPSMKAILGAAKKPVQVWSAADIGFNAEAAWSEQQVAAPKQRERQRIVIEGDGEEQIAAFAENLRKVI
>CP033401.1|AYQ02421.1|2709275_2710217_-|protein-FixB
MNTFSQVWVFSDTPSRLPELMNGAQALANQINTFVLNDADGAQAIQLGANHVWKLNGKPDDRMIEDYAGVMADTIRQHGADGLVLLPNTRRGKLLAAKLGYRLKAAVSNDASTVSVQDGKATVKHMVYGGLAIGEERIATPYAVLTISSGTFDAAQPDASRTGETHTVEWQAPAVAITRTATQARQSNSVDLDKARLVVSVGRGIGSKENIALAEQLCKAIGAELACSRPVAENEKWMEHERYVGISNLMLKPELYLAVGISGQIQHMVGANASQTIFAINKDKNAPIFQYADYGIVGDAVKILPALTAALAR
>CP033401.1|AYQ02420.1|2707938_2709225_-|FAD-dependent-oxidoreductase
MSEDIFDAIIVGAGLAGSVAALVLAREGAQVLVIERGNSAGAKNVTGGRLYAHSLEHIIPGFADSAPVERLITHEKLAFMTEKSAMTMDYCNGDETSPSQRSYSVLRSKFDAWLMEQAEEAGAQLITGIRVDNLVQRDGKVVGVEADGDVIEAKTVILADGVNSILAEKLGMAKRVKPTDVAVGVKELIELPKSVIEDRFQLQGNQGAACLFAGSPTDGLMGGGFLYTNENTLSLGLVCGLHHLHDAKKSVPQMLEDFKQHPAVAPLIAGGKLVEYSAHVVPEAGINMLPELVGDGVLIAGDAAGMCMNLGFTIRGMDLAIAAGEAAAKTVLSAMKSDDFSKQKLAEYRQHLESGPLRDMRMYQKLPAFLDNPRMFSGYPELAVGVARDLFTIDGSAPELMRKKILRHGKKVGFINLIKDGMKGVTVL
>CP033401.1|AYQ02419.1|2707654_2707942_-|ferredoxin-like-protein-FixX
MTSPVNVDVKLGVNKFNVDEEHPHIVVKADADKQVLELLVKACPAGLYKKQDDGSVRFDYAGCLECGTCRILGLGSALEQWEYPRGTFGVEFRYG
>CP033401.1|AYQ02418.1|2706265_2707597_-|MFS-transporter
MQPSRNFDDLKFSSIHRRILLWGSGGPFLDGYVLVMIGVALEQLTPALKLDADWIGLLGAGTLAGLFVGTSLFGYISDKVGRRKMFLIDIIAIGVISVATMFVSSPVELLVMRVLIGIVIGADYPIATSMITEFSSTRQRAFSISFIAAMWYVGATCADLVGYWLYDVEGGWRWMLGSAAIPCLLILIGRFELPESPRWLLRKGRVKECEEMMIKLFGEPVAFDEEQPQQTRFRDLFNRRHFPFVLFVAAIWTCQVIPMFAIYTFGPQIVGLLGLGVGKNAALGNVVISLFFMLGCIPPMLWLNTAGRRPLLIGSFAMMTLALAVLGLIPDMGIWLVVMAFAVYAFFSGGPGNLQWLYPNELFPTDIRASAVGVIMSLSRIGTIVSTWALPIFINNYGISNTMLMGAGISLFGLLISVAFAPETRGMSLAQTSNMTIRGQRMG
>CP033401.1|AYQ02417.1|2705627_2706158_-|glutathione-regulated-potassium-efflux-system-ancillary-protein-KefF
MILIIYAHPYPHHSHANKRMLEQARTLEGVEIRSLYQLYPDFNIDIAAEQEALSRADLIVWQHPMQWYSIPPLLKLWIDKVFSHGWAYGHGGTALHGKHLLWAVTTGGGESHFEIGAHPGFDVLSQPLQATAIYCGLNWLPPFAMHCTFICDDETLEGQARHYKQRLLEWQEAHHG
>CP033401.1|AYQ02416.1|2703772_2705635_-|glutathione-regulated-potassium-efflux-system-protein-KefC
MDSHTLIQALIYLGSAALIVPIAVRLGLGSVLGYLIAGCIIGPWGLRLVTDAESILHFAEIGVVLMLFIIGLELDPQRLWKLRAAVFGCGALQMVICGGLLGLFCMLLGLRWQVAELIGMTLALSSTAIAMQAMNERNLMVTQMGRSAFAVLLFQDIAAIPLVAMIPLLATSSASTTMGAFALSALKVAGALVLVVLLGRYVTRPALRFVARSGLREVFSAVALFLVFGFGLLLEEVGLSMAMGAFLAGVLLASSEYRHALESDIEPFKGLLLGLFFIGVGMSIDFGTLLENPLRIVILLLGFLIIKIAMLWLIARPLQVPNKQRRWFAVLLGQGSEFAFVVFGAAQMANVLEPEWAKSLTLAVALSMAATPILLVILNRLEQSSTEEAREADEIDEEQPRVIIAGFGRFGQITGRLLLSSGVKMVVLDHDPDHIETLRKFGMKVFYGDATRMDLLESAGAAKAEVLINAIDDPQTNLQLTEMVKEHFPHLQIIARARDVDHYIRLRQAGVEKPERETFEGALKTGRLALESLGLGPYEARERADVFRRFNIQMVEEMAMVENDTKARAAVYKRTSAMLSEIITEDREHLSLIQRHGWQGTEEGKHTGNMADEPETKPSS
>CP033401.1|AYQ04316.1|2703101_2703581_-|type-3-dihydrofolate-reductase
MISLIAALAVDRVIGMENAMPWNLPADLAWFKRNTLNKPVIMGRHTWESIGRPLPGRKNIILSSQPGTDDRVTWVKSVDEAIAACGDVPEIMVIGGGRVYEQFLPKAQKLYLTHIDAEVEGDTHFPDYEPDDWESVFSEFHDADAQNSHSYCFEILERR
>CP033401.1|AYQ02415.1|2702181_2703024_+|diadenosine-tetraphosphatase
MATYLIGDVHGCYDELIALLHKVEFTPGKDTLWLTGDLVARGPGSLDVLRYVKSLGDSVRLVLGNHDLHLLAVFAGISRNKPKDRLTPLLEAPDADELLNWLRRQPLLQIDEEKKLVMAHAGITPQWDLQTAKECARDVEAVLSSDSYPFFLDAMYGDMPNNWSPELRGLGRLRFITNAFTRMRFCFPNGQLDMYSKESPEEAPAPLKPWFAIPGPVAEEYSIAFGHWASLEGKGTPEGIYALDTGCCWGGTLTCLRWEDKQYFVQPSNRHKDLGEAAAS
>CP033401.1|AYQ02414.1|2701797_2702175_+|Co2+/Mg2+-efflux-protein-ApaG
MINSPRVCIQVQSVYIEAQSSPDNERYVFAYTVTIRNLGRAPVQLLGRYWLITNGNGRETEVQGEGVVGVQPLIAPGEEYQYTSGAIIETPLGTMQGHYEMIDENGVPFSIDIPVFRLAVPTLIH
>CP033401.1|AYQ02423.1|2711475_2712990_+|L-carnitine/gamma-butyrobetaine-antiporter
MKNEKRKTGIEPKVFFPPLIIVGILCWLTVRDLDAANVVINAVFSYVTNVWGWAFEWYMVVMLFGWFWLVFGPYAKKRLGNEPPEFSTASWIFMMFASCTSAAVLFWGSIEIYYYISTPPFGLEPNSTGAKELGLAYSLFHWGPLPWATYSFLSVAFAYFFFVRKMEVIRPSSTLVPLVGEKHAKGLFGTIVDNFYLVALIFAMGTSLGLATPLVTECMQWLFGIPHTLQLDAIIITCWIILNAICVACGLQKGVRIASDVRSYLSFLMLGWVFIVSGASFIMNYFTDSVGMLLMYLPRMLFYTDPIAKGGFPQGWTVFYWAWWVIYAIQMSIFLARISRGRTVRELCFGMVLGLTASTWILWTVLGSNTLLLIDKNIINIPNLIEQYGVARAIIETWAALPLSTATMWGFFILCFIATVTLVNACSYTLAMSTCREVRDGEEPPLLVRIGWSILVGIIGIVLLALGGLKPIQTAIIAGGCPLFFVNIMVTLSFIKDAKQNWKD
>CP033401.1|AYQ02424.1|2713020_2714163_+|crotonobetainyl-CoA-dehydrogenase
MDFNLNDEQELFVAGIRELMASENWEAYFAECDRDSVYPERFVKALADMGIDSLLIPEEHGGLDAGFVTLAAVWMELGRLGAPTYVLYQLPGGFNTFLREGTQEQIDKIMAFRGTGKQMWNSAITEPGAGSDVGSLKTTYTRRNGKIYLNGSKCFITSSAYTPYIVVMARDGASPDKPVYTEWFVDMSKPGIKVTKLEKLGLRMDSCCEITFDDVELDEKDMFGREGNGFNRVKEEFDHERFLVALTNYGTAMCAFEDAAHYANQRVQFGEAIGRFQLIQEKFAHMAIKLNSMKNMLYEAAWKADNGTITSGDAAMCKYFCANAAFEVVDSAMQVLGGVGIAGNHRISRFWRDLRVDRVSGGSDEMQILTLGRAVLKQYR
>CP033401.1|AYQ02425.1|2714291_2715509_+|L-carnitine-CoA-transferase
MDHLPMPKFGPLAGLRVVFSGIEIAGPFAGQMFAEWGAEVIWIENVAWADTIRVQPNYPQLSRRNLHALSLNIFKDEGREAFLKLMETTDIFIEASKGPAFARRGITDEVLWQHNPKLVIAHLSGFGQYGTEEYTNLPAYNTIAQAFSGYLIQNGDVDQPMPAFPYTADYFSGLTATTAALAALHKARETGKGESIDIAMYEVMLRMGQYFMMDYFNGGEMCPRMSKGKDPYYAGCGLYKCADGYIVMELVGITQIEECFKDIGLAHLLSTPEIPEGTQLIHRIECPYGPLVEEKLDAWLAAHTIAEVKERFAELNIACAKVLTVPELESNPQYVARESITQWQTMDGRTCKGPNIMPKFKNNPGQIWRGMPSHGMDTAAILKNIGYSENDIQELVSKGLAKVED
>CP033401.1|AYQ02426.1|2715582_2717136_+|ATP-dependent-acyl-CoA-ligase
MDIIGGQHLRQMWDDLADVYGHKTALICESSGGVVNRYSYLELNQEINRTANLFYTLGIRKGDKVALHLDNCPEFIFCWFGLAKIGAIMVPINARLLREESAWILQNSQACLLVTSAQFYPMYQQIQQEDATQLRHICLTDVALPADDGVSSFTQLKNQQPATLCYAPPLLTDDTAEILFTSGTTSRPKGVVITHYNLRFAGYYSAWQCALRDDDVYLTVMPAFHIDCQCTAAMAAFSAGATFVLVEKYSARAFWGQVQKYRATITECIPMMIRTLMVQPPSANDRQHRLREVMFYLNLSEQEKDAFCERFGVRLLTSYGMTETIVGIIGDRPGDKRRWPSIGRAGFCYEAEIRDDHNRPLPAGEIGEICIKGVPGKTIFKEYFLNPKATAKVLEADGWLHTGDTGYCDEEGFFYFVDRRCNMIKRGGENVSCVELENIIATHPKIQDIVVVGIKDSIRDEAIKAFVVLNEGETLSEEEFFRFCEQNMAKFKVPSYLEIRKDLPRNCSGKIIRKNLK
>CP033401.1|AYQ02427.1|2717244_2718030_+|crotonobetainyl-CoA-hydratase
MSESLHLTRNGSILEITLDRPKANAIDAKTSFEMGEVFLNFRDDPQLRVAIITGAGEKFFSAGWDLKAAAEGEAPDADFGPGGFAGLTEIFNLDKPVIAAVNGYAFGGGFELALAADFIVCADNASFALPEAKLGIVPDSGGVLRLPKILPPAIVNEMVMTGRRMGAEEALRWGIVNRVVNQAELMDNARELAQQLVNSAPLAIAALKEIYRTTSEMPVEEAYRYIRSGVLKHYPSVLHSEDAIEGPLAFAEKRDPVWKGR
>CP033401.1|AYQ02428.1|2718035_2718626_+|carnitine-operon-protein-CaiE
MSYYAFEGLIPVVHPTAFVHPSAVLIGDVIVGAGVYIGPLASLRGDYGRLIVQAGANIQDGCIMHGYCNTDTIVGENGHIGHGAILHGCVIGRDALVGMNSVIMDGAVIGEESIVAAMSFIKAGFRGEKRQLLMGTPARAVRSVSDDELHWKRLNTKEYQDLVGRCHASLHETQPLRQMEENRPRLQGTTDVTPKR
>CP033401.1|AYQ02429.1|2718744_2719140_-|transcriptional-activatory-protein-CaiF
MCEGYVEKPLYLLIAEWMMAENRWVIAREISIHFDIEHSKAVNTLTYILSEVTEISCEVKMIPNKLEGRGCQCQRLVKVVDIDEQIYARLRNNSREKLVGVRKTPRIPAVPLTELNREQKWQMMLSKSMRR
>CP033401.1|AYQ02430.1|2719400_2722622_-|carbamoyl-phosphate-synthase-large-subunit
MPKRTDIKSILILGAGPIVIGQACEFDYSGAQACKALREEGYRVILVNSNPATIMTDPEMADATYIEPIHWEVVRKIIEKERPDAVLPTMGGQTALNCALELERQGVLEEFGVTMIGATADAIDKAEDRRRFDVAMKKIGLETARSGIAHTMEEALAVAADVGFPCIIRPSFTMGGSGGGIAYNREEFEEICARGLDLSPTKELLIDESLIGWKEYEMEVVRDKNDNCIIVCSIENFDAMGIHTGDSITVAPAQTLTDKEYQIMRNASMAVLREIGVETGGSNVQFAVNPKNGRLIVIEMNPRVSRSSALASKATGFPIAKVAAKLAVGYTLDELMNDITGGRTPASFEPSIDYVVTKIPRFNFEKFAGANDRLTTQMKSVGEVMAIGRTQQESLQKALRGLEVGATGFDPKVSLDDPEALTKIRRELKDAGAERIWYIADAFRAGLSVDGVFNLTNIDRWFLVQIEELVRLEEKVAEVGITGLNAEFLRQLKRKGFADARLAKLAGVREAEIRKLRDQYDLHPVYKRVDTCAAEFATDTAYMYSTYEEECEANPSTDREKIMVLGGGPNRIGQGIEFDYCCVHASLALREDGYETIMVNCNPETVSTDYDTSDRLYFEPVTLEDVLEIVRIEKPKGVIVQYGGQTPLKLARALEAAGVPVIGTSPDAIDRAEDRERFQHAVERLKLKQPANATVTAIEMAVEKAKEIGYPLVVRPSYVLGGRAMEIVYDEADLRRYFQTAVSVSNDAPVLLDHFLDDAVEVDVDAICDGEMVLIGGIMEHIEQAGVHSGDSACSLPAYTLSQEIQDVMRQQVQKLAFELQVRGLMNVQFAVKNNEVYLIEVNPRAARTVPFVSKATGVPLAKVAARVMAGKSLAEQGVTKEVIPPYYSVKEVVLPFNKFPGVDPLLGPEMRSTGEVMGVGRTFAEAFAKAQLGSNSTMKKHGRALLSVREGDKERVVDLAAKLLKQGFELDATHGTAIVLGEAGINPRLVNKVHEGRPHIQDRIKNGEYTYIINTTSGRRAIEDSRVIRRSALQYKVHYDTTLNGGFATAMALNADATEKVISVQEMHAQIK
>CP033401.1|AYQ02431.1|2722639_2723788_-|carbamoyl-phosphate-synthase-small-subunit
MIKSALLVLEDGTQFHGRAIGATGSAVGEVVFNTSMTGYQEILTDPSYSRQIVTLTYPHIGNVGTNDADEESSQVHAQGLVIRDLPLIASNFRNTEDLSSYLKRHNIVAIADIDTRKLTRLLREKGAQNGCIIAGDNPDAALALEKARAFPGLNGMDLAKEVTTAEAYSWTQGSWTLTGGLPEAKKEDELPFHVVAYDFGAKRNILRMLVDRGCRLTIVPAQTSAEDVLKMNPDGIFLSNGPGDPAPCDYAITAIQKFLETDIPVFGICLGHQLLALASGAKTVKMKFGHHGGNHPVKDVEKNVVMITAQNHGFAVDEATLPANLRVTHKSLFDGTLQGIHRTDKPAFSFQGHPEASPGPHDAAPLFDHFIELIEQYRKTAK
>CP033401.1|AYQ02432.1|2724243_2725065_-|4-hydroxy-tetrahydrodipicolinate-reductase
MHDANIRVAIAGAGGRMGRQLIQAALALEGVQLGAALEREGSSLLGSDAGELAGAGKTGVTVQSSLDAVKDDFDVFIDFTRPEGTLNHLAFCRQHGKGMVIGTTGFDEAGKQAIRDAAADIAIVFAANFSVGVNVMLKLLEKAAKVMGDYTDIEIIEAHHRHKVDAPSGTALAMGEAIAHALDKDLKDCAVYSREGHTGERVPGTIGFATVRAGDIVGEHTAMFADIGERLEITHKASSRMTFANGAVRSALWLSGKEGGLFDMRDVLDLNSL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_7

4174124-4174263

Orphan

Consensus_repeat	Method
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP033401_7

>merge|CP033401|7|4174124-4174263|CRISPRCasFinder
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCAACAGCAGTCGGATGCGGCGTAAACACCTTATCTGACCTACGTTTTGTGTCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA

>CP033401|7|6|4174124-4174263|CRISPRCasFinder
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA	ACAGCAGTCGGATGCGGCGTAAACACCTTATCTGACCTACGT
TTTGTGTCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ03696.1\|4171677_4172196_-\|glutamine-amidotransferase	unknown	unknown	gnl\|CDD\|153228
CP033401.1\|AYQ03692.1\|4169893_4170418_+\|SCP2-domain-containing-protein	unknown	unknown	gnl\|CDD\|225696
CP033401.1\|AYQ03706.1\|4183452_4184208_-\|galactosamine-6-phosphate-isomerase	unknown	unknown	gnl\|CDD\|182064
CP033401.1\|AYQ03703.1\|4177925_4178786_+\|rRNA-(cytidine-2'-O-)-methyltransferase	unknown	unknown	gnl\|CDD\|184956
CP033401.1\|AYQ03693.1\|4170411_4170915_+\|N-acetyltransferase	unknown	unknown	gnl\|CDD\|225695
CP033401.1\|AYQ03700.1\|4174861_4175452_-\|DnaA-initiator-associating-protein-DiaA	unknown	unknown	gnl\|CDD\|182811
CP033401.1\|AYQ03698.1\|4173031_4174072_+\|permease	unknown	unknown	gnl\|CDD\|223773
CP033401.1\|AYQ03707.1\|4184208_4185000_-\|PTS-N-acetylgalactosamine-transporter-subunit-IID	unknown	unknown	gnl\|CDD\|182115
CP033401.1\|AYQ03691.1\|4168689_4169685_-\|collagenase	unknown	unknown	gnl\|CDD\|223896
CP033401.1\|AYQ03701.1\|4175471_4175867_-\|YraN-family-protein	unknown	unknown	gnl\|CDD\|129354
CP033401.1\|AYQ03699.1\|4174276_4174852_-\|osmotically-inducible-protein-OsmY	unknown	unknown	gnl\|CDD\|182907
CP033401.1\|AYQ03708.1\|4184989_4185793_-\|N-acetylgalactosamine-permease-IIC-component-1	unknown	unknown	gnl\|CDD\|236621
CP033401.1\|AYQ03697.1\|4172323_4172959_+\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187560
CP033401.1\|AYQ03694.1\|4170901_4171204_-\|GIY-YIG-nuclease-family-protein	unknown	unknown	gnl\|CDD\|178979
CP033401.1\|AYQ03702.1\|4175824_4177861_-\|penicillin-binding-protein-activator	unknown	unknown	gnl\|CDD\|225649
CP033401.1\|AYQ03704.1\|4178828_4179920_-\|fimbrial-protein	unknown	unknown	gnl\|CDD\|366088
CP033401.1\|AYQ03690.1\|4167802_4168681_-\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|237968
CP033401.1\|AYQ03705.1\|4179930_4182303_-\|fimbrial-biogenesis-outer-membrane-usher-protein	unknown	unknown	gnl\|CDD\|225729
CP033401.1\|AYQ03695.1\|4171254_4171698_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|235127
CP033401.1\|AYQ03689.1\|4166589_4167597_-\|LLM-class-flavin-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182505

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ03696.1\|4171677_4172196_-\|glutamine-amidotransferase	gnl\|CDD\|153228	cd03134, GATase1_PfpI_like, A type 1 glutamine amidotransferase (GATase1)-like domain found in PfpI from Pyrococcus furiosus. A type 1 glutamine amidotransferase (GATase1)-like domain found in PfpI from Pyrococcus furiosus. This group includes proteins similar to PfpI from P. furiosus. and PH1704 from Pyrococcus horikoshii. These enzymes are ATP-independent intracellular proteases and may hydrolyze small peptides to provide a nutritional source. Only Cys of the catalytic triad typical of GATase1 domains is conserved in this group. This Cys residue is found in the sharp turn between a beta strand and an alpha helix termed the nucleophile elbow. For PH1704, it is believed that this Cys together with a different His in one monomer and Glu (from an adjacent monomer) forms a different catalytic triad from the typical GATase1domain. PfpI is homooligomeric. Protease activity is only found for oligomeric forms of PH1704.	6.06977e-86
CP033401.1\|AYQ03692.1\|4169893_4170418_+\|SCP2-domain-containing-protein	gnl\|CDD\|225696	COG3154, COG3154, Putative lipid carrier protein [Lipid metabolism].	8.79126e-85
CP033401.1\|AYQ03706.1\|4183452_4184208_-\|galactosamine-6-phosphate-isomerase	gnl\|CDD\|182064	PRK09762, PRK09762, galactosamine-6-phosphate isomerase; Provisional.	1.51027e-147
CP033401.1\|AYQ03703.1\|4177925_4178786_+\|rRNA-(cytidine-2'-O-)-methyltransferase	gnl\|CDD\|184956	PRK14994, PRK14994, SAM-dependent 16S ribosomal RNA C1402 ribose 2'-O-methyltransferase; Provisional.	0
CP033401.1\|AYQ03693.1\|4170411_4170915_+\|N-acetyltransferase	gnl\|CDD\|225695	COG3153, COG3153, Predicted acetyltransferase [General function prediction only].	1.31299e-64
CP033401.1\|AYQ03700.1\|4174861_4175452_-\|DnaA-initiator-associating-protein-DiaA	gnl\|CDD\|182811	PRK10886, PRK10886, DnaA initiator-associating protein DiaA; Provisional.	5.61903e-143
CP033401.1\|AYQ03698.1\|4173031_4174072_+\|permease	gnl\|CDD\|223773	COG0701, COG0701, Predicted permeases [General function prediction only].	4.11883e-63
CP033401.1\|AYQ03707.1\|4184208_4185000_-\|PTS-N-acetylgalactosamine-transporter-subunit-IID	gnl\|CDD\|182115	PRK09855, PRK09855, PTS N-acetylgalactosamine transporter subunit IID.	5.05026e-179
CP033401.1\|AYQ03691.1\|4168689_4169685_-\|collagenase	gnl\|CDD\|223896	COG0826, COG0826, Collagenase and related proteases [Posttranslational modification, protein turnover, chaperones].	4.87234e-118
CP033401.1\|AYQ03701.1\|4175471_4175867_-\|YraN-family-protein	gnl\|CDD\|129354	TIGR00252, UPF0102_protein_HI_1656, TIGR00252 family protein. the scores for Mycobacterium tuberculosis and Treponema pallidum are low considering the alignment [Hypothetical proteins, Conserved].	3.92681e-63
CP033401.1\|AYQ03699.1\|4174276_4174852_-\|osmotically-inducible-protein-OsmY	gnl\|CDD\|182907	PRK11023, PRK11023, divisome-associated lipoprotein YraP.	1.97056e-117
CP033401.1\|AYQ03708.1\|4184989_4185793_-\|N-acetylgalactosamine-permease-IIC-component-1	gnl\|CDD\|236621	PRK09757, PRK09757, PTS N-acetylgalactosamine transporter subunit IIC.	2.85176e-176
CP033401.1\|AYQ03697.1\|4172323_4172959_+\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187560	cd05250, CC3_like_SDR_a, CC3(TIP30)-like, atypical (a) SDRs. Atypical SDRs in this subgroup include CC3 (also known as TIP30) which is implicated in tumor suppression. Atypical SDRs are distinct from classical SDRs. Members of this subgroup have a glycine rich NAD(P)-binding motif that resembles the extended SDRs, and have an active site triad of the SDRs (YXXXK and upstream Ser), although the upstream Asn of the usual SDR active site is substituted with Asp. For CC3, the Tyr of the triad is displaced compared to the usual SDRs and the protein is monomeric, both these observations suggest that the usual SDR catalytic activity is not present. NADP appears to serve an important role as a ligand, and may be important in the interaction with other macromolecules. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Atypical SDRs include biliverdin IX beta reductase (BVR-B,aka flavin reductase), NMRa (a negative transcriptional regulator of various fungi), progesterone 5-beta-reductase like proteins, phenylcoumaran benzylic ether and pinoresinol-lariciresinol reductases, phenylpropene synthases, eugenol synthase, triphenylmethane reductase, isoflavone reductases, and others. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. In addition to the Rossmann fold core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.89133e-65
CP033401.1\|AYQ03694.1\|4170901_4171204_-\|GIY-YIG-nuclease-family-protein	gnl\|CDD\|178979	PRK00329, PRK00329, GIY-YIG nuclease superfamily protein; Validated.	3.58629e-45
CP033401.1\|AYQ03702.1\|4175824_4177861_-\|penicillin-binding-protein-activator	gnl\|CDD\|225649	COG3107, LppC, Putative lipoprotein [General function prediction only].	6.33924e-141
CP033401.1\|AYQ03704.1\|4178828_4179920_-\|fimbrial-protein	gnl\|CDD\|366088	pfam00419, Fimbrial, Fimbrial protein.	3.34626e-21
CP033401.1\|AYQ03690.1\|4167802_4168681_-\|U32-family-peptidase	gnl\|CDD\|237968	PRK15447, PRK15447, putative protease; Provisional.	0
CP033401.1\|AYQ03705.1\|4179930_4182303_-\|fimbrial-biogenesis-outer-membrane-usher-protein	gnl\|CDD\|225729	COG3188, FimD, P pilus assembly protein, porin PapC [Cell motility and secretion / Intracellular trafficking and secretion].	0
CP033401.1\|AYQ03695.1\|4171254_4171698_+\|hypothetical-protein	gnl\|CDD\|235127	PRK03467, PRK03467, hypothetical protein; Provisional.	2.19601e-100
CP033401.1\|AYQ03689.1\|4166589_4167597_-\|LLM-class-flavin-dependent-oxidoreductase	gnl\|CDD\|182505	PRK10508, PRK10508, luciferase-like monooxygenase.	0

>CP033401.1|AYQ03698.1|4173031_4174072_+|permease
MTGQSSSQAATPIQWWKPALFFLVVIAGLWYVKWEPYYGKAFTAAETHSIGKSILAQADANPWQAALDYAMIYFLAVWKAAVLGVILGSLIQVLIPRDWLLRTLGQSRFRGTLLGTLFSLPGMMCTCCAAPVAAGMRRQQVSMGGALAFWMGNPVLNPATLVFMGFVLSWGFAAIRLVAGLVMVLLIATLVQKWVRETPQTQAPVEIDIPEAQGGFFSRWGRALWTLFWSTIPVYILAVLVLGAARVWLFPHADGTVDNSLMWVVAMAVAGCLFVIPTAAEIPIVQTMMLAGMGTAPALALLMTLPAVSLPSLIMLRKAFPAKALWLTGAMVAVSGVIVGGLALLF
>CP033401.1|AYQ03697.1|4172323_4172959_+|NAD-dependent-epimerase/dehydratase-family-protein
MSQVLITGATGLVGGHLLRMLINEPKVNAIAAPTRRPLGDMPGVFNPHDPQLTDALAQVTDPIDIVFCCLGTTRREAGSKEAFIHADYTLVVDTALTGRRLGAQHMLVVSAMGANAHSPFFYNRVKGEMEEALIAQNWPKLTIARPSMLLGDRSKQRMNETLFAPLFRLLPGNWKSIDARDVARVMLAESMRPEHEGVTILSSSELRKRAE
>CP033401.1|AYQ03696.1|4171677_4172196_-|glutamine-amidotransferase
MSKKIAVLITDEFEDSEFTSPADEFRKAGHEVITIEKQAGKTVKGKKGEASVTIDKSIDEVTPAEFDALLLPGGHSPDYLRGDNRFVTFTRDFVNSGKPVFAICHGPQLLISADVIRGRKLTAVKPIIIDVKNAGAEFYDQEVVVDKDQLVTSRTPDDLPAFNREALRLLGA
>CP033401.1|AYQ03695.1|4171254_4171698_+|hypothetical-protein
METLIAISRWLAKQHVVTWCVQQEGELWCANAFYLFDAQKVAFYILTEEKTRHAQMSGPQAAVAGTVNGQPKTVALIRGVQFKGEIRRLEGEESDLARKAYNRRFPVARMLSAPVWEIRLDEIKFTDNTLGFGKKMIWLRDSGTEQA
>CP033401.1|AYQ03694.1|4170901_4171204_-|GIY-YIG-nuclease-family-protein
MTPWFLYLIRTADNKLYTGITTDVERRYQQHQSGKGAKALRGKGELTLAFSAPVGDRSLALRAEYRVKQLTKRQKERLVAEGAGFAELLSSLQTPEIKSD
>CP033401.1|AYQ03693.1|4170411_4170915_+|N-acetyltransferase
MLIRVEIPIDAPGIDALLRRSFESDAEAKLVHDLREDGFLTLGLVATDDEGQVIGYVAFSPVDVQGEDLQWVGMAPLAVDEKYRGQGLARQLVYEGLDSLNEFGYAAVVTLGDPALYSRFGFELAAHHDLRCRWPGTESAFQVHRLADDALNGVTGLVEYHEHFNRF
>CP033401.1|AYQ03692.1|4169893_4170418_+|SCP2-domain-containing-protein
MLDKLRSRIVHLGPSLLSVPVKLTPFALKRQVLEQVLSWQFRQALDDGELEFLEGRWLSIHVRDIDLQWFTSVVNGKLVVSQNAQADVSFSADASDLLMIAARKQDPDTLFFQRRLVIEGDTELGLYVKNLMDAIELEQMPKALRMMLLQLADFVEAGMKNAPETKQTSVGEPC
>CP033401.1|AYQ03691.1|4168689_4169685_-|collagenase
MELLCPAGNLPALKAAIENGADAVYIGLKDDTNARHFAGLNFTEKKLQEAVSFVHQHRRKLHIAINTFAHPDGYARWQRAVDMAAQLGADALILADLAMLEYAAERYPHIERHVSVQASATNEEAINFYHRHFDVARVVLPRVLSIHQVKQLARVTPVPLEVFAFGSLCIMSEGRCYLSSYLTGESPNTVGACSPARFVRWQQTPQGLESRLNEVLIDRYQDGENAGYPTLCKGRYLVDGERYHALEEPTSLNTLELLPELMAANIASVKIEGRQRSPAYVSQVAKVWRQAIDRCKADPQNFVPQSAWMETLGSMSEGTQTTLGAYHRKWQ
>CP033401.1|AYQ03690.1|4167802_4168681_-|U32-family-peptidase
MKYSLGPVLWYWPKETLEEFYQQAATSSADVIYLGEAVCSKRRATKVGDWLEMAKSLAGSGKQIVLSTLALVQASSELGELKRYVENGEFLIEASDLGVVNMCAERKLPFVAGHALNCYNAVTLKILLKQGMMRWCMPVELSRDWLVNLLNQCDELGIRNQFEVEVLSYGHLPLAYSARCFTARSEDRPKDECETCCIKYPNGRNVLSQENQQVFVLNGIQTMSGYVYNLGNELASMQGLVDVVRLSPQGTDTFAMLDAFRANENGAAPLPLTANSDCNGYWRRLAGLELQA
>CP033401.1|AYQ03689.1|4166589_4167597_-|LLM-class-flavin-dependent-oxidoreductase
MTDKTIAFSLLDLAPIPEGSSAREAFSHSLDLARLAEKRGYHRYWLAEHHNMTGIASAATSVLIGYLAANTTTLHLGSGGVMLPNHSPLVIAEQFGTLNTLYPGRIDLGLGRAPGSDQRTMMALRRHMSGDIDNFPRDVAELVDWFDARDPNPNVRPVPGYGEKIPVWLLGSSLYSAQLAAQLGLPFAFASHFAPDMLFQALHLYRSNFKPSARLEKPYAMVCINIIAADSNRDAEFLFTSMQQAFVKLRRGETGQLPPPIQNMDQFWSPSEQYGVQQALSMSLVGDKAKVRHGLQSILRETDADEIMVNGQIFDHQARLHSFELAMDVKEELLG
>CP033401.1|AYQ03699.1|4174276_4174852_-|osmotically-inducible-protein-OsmY
MKALSPIAVLISALLLQGCVAAAVVGTAAVGTKAATDPRSVGTQVDDGTLEVRVNSALSKDEQIKKEARINVTAYQGKVLLVGQSPNAELSARAKQIAMGVDGANEVYNEIRQGQPIGLGEASNDTWITTKVRSQLLTSDLVKSSNVKVTTENGEVFLMGLVTEREAKAAADIASRVSGVKRVTTAFTFIK
>CP033401.1|AYQ03700.1|4174861_4175452_-|DnaA-initiator-associating-protein-DiaA
MQERIKACFTESIQTQIAAAEALPDAISRAAMTLVQSLLNGNKILCCGNGTSAANAQHFAASMINRFETERPSLPAIALNTDNVVLTAIANDRLHDEVYAKQVRALGHAGDVLLAISTRGNSRDIVKAVEAAVTRDMTIVALTGYDGGELAGLLGPQDVEIRIPSHRSARIQEMHMLTVNCLCDLIDNTLFPHQDD
>CP033401.1|AYQ03701.1|4175471_4175867_-|YraN-family-protein
MATVPTRSGSPRQLTTKQTGDAWEAQARRWLEGKGLRFIAANVNERGGEIDLIMREGRTTVFVEVRYRRSALYGGAAASVTRSKQHKLLQTARLWLARHNGSFDTVDCRFDVVAFTGNEVEWIKDAFNDHS
>CP033401.1|AYQ03702.1|4175824_4177861_-|penicillin-binding-protein-activator
MVPSTFSRLKAARCLPVVLAALIFAGCGTHTPDQSTAYMQGTAQADSAFYLQQMQQSSDDTRINWQLLAIRALVKEGKTGQAVELFNQLPQELNDSQRREKTLLAVEIKLAQKDFAGAQNLLAKITPADLEQNQQARYWQAKIDASQGRPSIDLLRALIAQEPLLGAKEKQQNIDATWQALSSMTQEQANTLVINADENILQGWLDLQRVWFDNRNDPDMMKAGIADWQKRYPNNPGAKMLPTQLVNVKAFKPASTNKIALLLPLNGQAAVFGRTIQQGFEAAKNIGTQPVAAQVAAAPAADVAEQPQPQTVDGVASPAQASVSDLTGEQPAAQPVPVSAPATSTAAVSAPANPSAELKIYDTSSQPLSQILSQVQQDGASIVVGPLLKNNVEELLKSNTPLNVLALNQPENIENRVNICYFALSPEDEARDAARHIRDQGKQAPLVLIPRSSLGDRVANAFAQEWQKLGGGTVLQQKFGSTSELRAGVNGGSGIALTGSPITPRATTDSGMTTNNPTLQTTPTDDQFTNNGGRVDAVYIVATPGEIAFIKPMIAMRNGSQSGATLYASSRSAQGTAGPDFRLEMEGLQYSEIPMLAGGNLPLMQQALSAVNNDYSLARMYAMGVDAWSLANHFSQMRQVQGFEINGNTGSLTANPDCVINRKLSWLQYQQGQVVPAS
>CP033401.1|AYQ03703.1|4177925_4178786_+|rRNA-(cytidine-2'-O-)-methyltransferase
MKQHQSADNSQGQLYIVPTPIGNLADITQRALEVLQAVDLIAAEDTRHTGLLLQHFGINARLFALHDHNEQQKAETLLAKLQEGQNIALVSDAGTPLINDPGYHLVRTCREAGIRVVPLPGPCAAITALSAAGLPSDRFCYEGFLPAKSKGRRDALKAIEAEPRTLIFYESTHRLLDSLEDIVAVLGESRYVVLARELTKTWETIHGAPVGELLAWVKEDENRRKGEMVLIVEGHKAQEEDLPADALRTLALLQAELPLKKAAALAAEIHGVKKNALYKYALEQQG
>CP033401.1|AYQ03704.1|4178828_4179920_-|fimbrial-protein
MKRAPLITGLLLISTSCAYASSGGCGADSTSGATNYSSVVDDVTVNQTDNVTGREFTSATLSSTNWQYACSCSAGKAVKLVYMVSPVLTTTGHQAGYYKLNDSLDIKTTLKANDIPGLVTDQTVSVNTRFTQIKSNTVYSAATQTGVCQGDTSRYGPVNIGANTTFTLYVTKPFLGSMTIPKTDIAVIKGAWVDGMGSPSTGDFHDLVKLSIQGNLTAPQSCKINQGDVIKVNFGFINGQKFTTRNAMPDGFTPVDFDITYDCGDTSKIKNSLQMRIDGTTGVVDQYNLVARRRSSDNAPDVGIRIENLGGGVANIPFQNGILPVDPSGHGTVNMRAWPVNLVGGELETGKFQGTATITVIVR
>CP033401.1|AYQ03705.1|4179930_4182303_-|fimbrial-biogenesis-outer-membrane-usher-protein
MLETTKSGMQTTDLSRFSKKYAQLPGTYQVDIWLNKKKVSQKKITFTANAEQLLQPQFTVEQLRELGIKVDEIPALAEKDDDSVINSLEQIIPGTAAEFDFNHQRLNLSIPQIALYRDARGYVSPSRWDDGIPTLFTNYSFTGSDNRYRQGNRSQRQYLNMQNGANFGPWRLRNYSTWTRNDQTSSWNTISSYLQRDIKALKSQLLLGESATSGSIFSSYTFTGVQLASDDNMLPNSQRGFAPTVRGIANSSAIVTIRQNGYVIYQSNVPAGAFEINDLYPSSNSGDLEVTIEESDGTQRRFIQPYSSLPMMQRPGHLKYSATAGRYRADANSDSKEPEFAEATAIYGLNNTFTLYSGLLGSEDYYALGIGIGGTLGALGALSMDINRADTQFDNQHSFHGYQWRTQYIKDIPETNTNIAVSYYRYTNDGYFSFDEANTRNWDYNSRQKSEIQFNISQTIFDGVSLYASGSQQDYWGNNEKNRNISVGVSGQQWGIGYSLNYQYSRYTDQNNDRALSLNLSIPLERWLPRSRVSYQMTSQKDRPTQHEMRLDGSLLDDGRLSYSLEQSLDDDNNHNSSVNASYRSPYGTFSAGYSYGNDSSQYNYGVTGGVVIHPHGVTLSQYLGNAFALIDANGASGVRIQNYPGIATDPFGYAVVPYLTTYQENRLSVDTTQLPDNVDLEQTTQFVVPNRGAMVAARFNANIGYRVLVTVSDRNGKPLPFGALASNDETGQQSIVDEGGILYLSGISSKSQSWTVRWGNQADQQCQFAFSTPDSEPTTSVLQGTAQCH
>CP033401.1|AYQ03706.1|4183452_4184208_-|galactosamine-6-phosphate-isomerase
MERGTASGGASLLKEFHPVQTLQQVENYTALSERASEYLLAVIRSKPDAVICLATGATPLLTYHYLVEKIHQQQVDVSQLTFVKLDEWVDLPLTMPGTCETFLQQHIVQPLGLREDQLISFRSEEINETECERVTNLIARKGGLDLCVLGLGKNGHLGLNEPGESLQPACHISQLDARTQQHEMLKTAGRPVTRGITLGLKDILNAREVLLLVTGEGKQDATERFLTAKVSTAIPASFLWLHSNFICLINT
>CP033401.1|AYQ03707.1|4184208_4185000_-|PTS-N-acetylgalactosamine-transporter-subunit-IID
MGSEISKKDITRLGFRSSLLQASFNYERMQAGGFTWAMLPILKKIYKDDKPGLSAAMKDNLEFINTHPNLVGFLMGLLISMEEKGENRDTIKGLKVALFGPIAGIGDAIFWFTLLPIMAGICSSFASQGNLLGPILFFAVYLLIFFLRVGWTHVGYSVGVKAIDKVRENSQMIARSATILGITVIGGLIASYVHINVVTSFAIDSTHSVALQQDFFDKVFPNILPMAYTLLMYYFLRVKKAHPVLLIGVTFVLSIVCSAFGIL
>CP033401.1|AYQ03708.1|4184989_4185793_-|N-acetylgalactosamine-permease-IIC-component-1
MHEITLLQGLSLAALVFVLGIDFWLEALFLFRPIIVCTLTGAILGDIQTGLITGGLTELAFAGLTPAGGVQPPNPIMAGLMTTVIAWSTGVDAKTAIGLGLPFSLLMQYVILFFYSAFSLFMTKADKCAKEADTAAFSRLNWTTMLIVASAYAVIAFLCTYLAQGAMQALVKAMPAWLTHGFEVAGGILPAVGFGLLLRVMFKAQYIPYLIAGFLFVCYIQVSNLLPVAVLGAGFAVYEFFNAKSRQQAQPQPVASKNEEEDYSNGI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_8

4218662-4218779

Orphan

Consensus_repeat	Method
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP033401_8

>merge|CP033401|8|4218662-4218779|CRISPRCasFinder
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGGGTGCTCAACTTGTTGATGTTGTTGTGTTTTGTACCTGATGCCGGATGCGATGCTGGCGCATCTTATCCGGCCTACGGG

>CP033401|8|7|4218662-4218779|CRISPRCasFinder
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGG	GTGCTCAACTTGTTGATGTTGTTGTGTTTTGTACCTGA
TGCCGGATGCGATGCTGGCGCATCTTATCCGGCCTACGGG

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ03744.1\|4223104_4223587_-\|DoxX-family-protein	unknown	unknown	gnl\|CDD\|225168
CP033401.1\|AYQ03733.1\|4212672_4213062_+\|enamine/imine-deaminase	unknown	unknown	gnl\|CDD\|105214
CP033401.1\|AYQ03736.1\|4215126_4216143_+\|IS5-like-element-IS5-family-transposase	unknown	unknown	gnl\|CDD\|225581
CP033401.1\|AYQ03729.1\|4206754_4207744_+\|serine/threonine-dehydratase	unknown	unknown	gnl\|CDD\|236317
CP033401.1\|AYQ03745.1\|4223682_4223982_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|372871
CP033401.1\|AYQ03739.1\|4219039_4219741_-\|pirin-like-protein-YhaK	unknown	unknown	gnl\|CDD\|224655
CP033401.1\|AYQ03728.1\|4205717_4206656_+\|transcriptional-regulator	unknown	unknown	gnl\|CDD\|182391
CP033401.1\|AYQ03742.1\|4221390_4221756_-\|DUF805-domain-containing-protein	unknown	unknown	gnl\|CDD\|225694
CP033401.1\|AYQ03730.1\|4207765_4209097_+\|threonine/serine-transporter-TdcC	unknown	unknown	gnl\|CDD\|184191
CP033401.1\|AYQ03731.1\|4209122_4210331_+\|propionate-kinase	unknown	unknown	gnl\|CDD\|183484
CP033401.1\|AYQ03738.1\|4218852_4219017_-\|hypothetical-protein	unknown	unknown	unknown
CP033401.1\|AYQ03734.1\|4213133_4214498_+\|L-serine-ammonia-lyase	unknown	unknown	gnl\|CDD\|185000
CP033401.1\|AYQ03737.1\|4217330_4218641_+\|serine-dehydratase-subunit-alpha-family-protein	unknown	unknown	gnl\|CDD\|226206
CP033401.1\|AYQ03735.1\|4214772_4215117_+\|transporter	unknown	unknown	gnl\|CDD\|273283
CP033401.1\|AYQ03746.1\|4223971_4224376_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227681
CP033401.1\|AYQ03740.1\|4219845_4220742_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176122
CP033401.1\|AYQ03732.1\|4210364_4212659_+\|PFL-like-enzyme-TdcE	unknown	unknown	gnl\|CDD\|153087
CP033401.1\|AYQ03743.1\|4222048_4223035_-\|glutathione-S-transferase-family-protein	unknown	unknown	gnl\|CDD\|223512
CP033401.1\|AYQ03741.1\|4220792_4221149_-\|DUF805-domain-containing-protein	unknown	unknown	gnl\|CDD\|225694
CP033401.1\|AYQ03747.1\|4224378_4224684_-\|DUF883-domain-containing-protein	unknown	unknown	gnl\|CDD\|226941

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ03744.1\|4223104_4223587_-\|DoxX-family-protein	gnl\|CDD\|225168	COG2259, COG2259, Predicted membrane protein [Function unknown].	1.8476e-29
CP033401.1\|AYQ03733.1\|4212672_4213062_+\|enamine/imine-deaminase	gnl\|CDD\|105214	PRK11401, PRK11401, enamine/imine deaminase.	1.34001e-81
CP033401.1\|AYQ03736.1\|4215126_4216143_+\|IS5-like-element-IS5-family-transposase	gnl\|CDD\|225581	COG3039, COG3039, Transposase and inactivated derivatives, IS5 family [DNA replication, recombination, and repair].	4.59842e-55
CP033401.1\|AYQ03729.1\|4206754_4207744_+\|serine/threonine-dehydratase	gnl\|CDD\|236317	PRK08638, PRK08638, bifunctional threonine ammonia-lyase/L-serine ammonia-lyase TdcB.	0
CP033401.1\|AYQ03745.1\|4223682_4223982_-\|hypothetical-protein	gnl\|CDD\|372871	pfam13997, YqjK, YqjK-like protein. The YqjK-like protein family includes the E. coli YqjK protein, which is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are approximately 100 amino acids in length. There is a single completely conserved residue R that may be functionally important.	6.11451e-20
CP033401.1\|AYQ03739.1\|4219039_4219741_-\|pirin-like-protein-YhaK	gnl\|CDD\|224655	COG1741, COG1741, Pirin-related protein [General function prediction only].	1.02982e-67
CP033401.1\|AYQ03728.1\|4205717_4206656_+\|transcriptional-regulator	gnl\|CDD\|182391	PRK10341, PRK10341, transcriptional regulator TdcA.	0
CP033401.1\|AYQ03742.1\|4221390_4221756_-\|DUF805-domain-containing-protein	gnl\|CDD\|225694	COG3152, COG3152, Predicted membrane protein [Function unknown].	3.68376e-42
CP033401.1\|AYQ03730.1\|4207765_4209097_+\|threonine/serine-transporter-TdcC	gnl\|CDD\|184191	PRK13629, PRK13629, threonine/serine transporter TdcC; Provisional.	0
CP033401.1\|AYQ03731.1\|4209122_4210331_+\|propionate-kinase	gnl\|CDD\|183484	PRK12379, PRK12379, propionate kinase.	0
CP033401.1\|AYQ03734.1\|4213133_4214498_+\|L-serine-ammonia-lyase	gnl\|CDD\|185000	PRK15040, PRK15040, L-serine ammonia-lyase.	0
CP033401.1\|AYQ03737.1\|4217330_4218641_+\|serine-dehydratase-subunit-alpha-family-protein	gnl\|CDD\|226206	COG3681, COG3681, L-cysteine desulfidase [Amino acid transport and metabolism].	0
CP033401.1\|AYQ03735.1\|4214772_4215117_+\|transporter	gnl\|CDD\|273283	TIGR00814, membrane_transport_protein_YhjV, serine transporter. The Hydroxy/Aromatic Amino Acid Permease (HAAAP) Family- serine/threonine subfamily (TC 2.A.42.2) The HAAAP family includes well characterized aromatic amino acid:H+ symport permeases and hydroxy amino acid permeases. This subfamily is specific for hydroxy amino acid transporters and includes the serine permease, SdaC, of E. coli, and the threonine permease, TdcC, of E. coli.//added GO terms, none avaialbelf or ser/thr specifically [SS 2/6/05] [Transport and binding proteins, Amino acids, peptides and amines].	4.8249e-32
CP033401.1\|AYQ03746.1\|4223971_4224376_-\|hypothetical-protein	gnl\|CDD\|227681	COG5393, COG5393, Predicted membrane protein [Function unknown].	2.73939e-60
CP033401.1\|AYQ03740.1\|4219845_4220742_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176122	cd08431, PBP2_HupR, The C-terminal substrate binding domain of LysR-type transcriptional regulator, HupR, which regulates expression of the heme uptake receptor HupA; contains the type 2 periplasmic binding fold. HupR, a member of the LysR family, activates hupA transcription under low-iron conditions in the presence of hemin. The expression of many iron-uptake genes, such as hupA, is regulated at the transcriptional level by iron and an iron-binding repressor protein called Fur (ferric uptake regulation). Under iron-abundant conditions with heme, the active Fur repressor protein represses transcription of the iron-uptake gene hupA, and prevents transcriptional activation via HupR. Under low-iron conditions with heme, the Fur repressor is inactive and transcription of the hupA is allowed. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	2.2986e-51
CP033401.1\|AYQ03732.1\|4210364_4212659_+\|PFL-like-enzyme-TdcE	gnl\|CDD\|153087	cd01678, PFL1, Pyruvate formate lyase 1. Pyruvate formate lyase catalyzes a key step in anaerobic glycolysis, the conversion of pyruvate and CoenzymeA to formate and acetylCoA. The PFL mechanism involves an unusual radical cleavage of pyruvate in which two cysteines and one glycine form radicals that are required for catalysis. PFL has a ten-stranded alpha/beta barrel domain that is structurally similar to those of all three ribonucleotide reductase (RNR) classes as well as benzylsuccinate synthase and B12-independent glycerol dehydratase.	0
CP033401.1\|AYQ03743.1\|4222048_4223035_-\|glutathione-S-transferase-family-protein	gnl\|CDD\|223512	COG0435, ECM4, Predicted glutathione S-transferase [Posttranslational modification, protein turnover, chaperones].	0
CP033401.1\|AYQ03741.1\|4220792_4221149_-\|DUF805-domain-containing-protein	gnl\|CDD\|225694	COG3152, COG3152, Predicted membrane protein [Function unknown].	1.64644e-35
CP033401.1\|AYQ03747.1\|4224378_4224684_-\|DUF883-domain-containing-protein	gnl\|CDD\|226941	COG4575, ElaB, Uncharacterized conserved protein [Function unknown].	1.46625e-41

>CP033401.1|AYQ03737.1|4217330_4218641_+|serine-dehydratase-subunit-alpha-family-protein
MFDSTLNPLWQRYILAVQEEVKPALGCTEPISLALAAAVAAAELEGPVERVEAWVSPNLMKNGLGVTVPGTGMVGLPIAAALGALGGNANAGLEVLKDATAQAIADAKALLAAGKVSVKIQEPCNEILFSRAKVWNGEKWACVTIVGGHTNIVHIETHNGVVFTQQACVAEGEQESPLTVLSRTTLAEILKFVNEVPFAAIRFILDSAKLNCALSQEGLSGKWGLHIGATLEKQCERGLLAKDLSSSIVIRTSAASDARMGGATLPAMSNSGSGNQGITATMPVVVVAEHFGADDERLARALMLSHLSAIYIHNQLPRLSALCAATTAAMGAAAGMAWLVDGRYETISMAISSMIGDVSGMICDGASNSCAMKVSTSASAAWKAVLMALDDTAVTGNEGIVAHDVEQSIANLCALASHSMQQTDRQIIEIMASKAR
>CP033401.1|AYQ03736.1|4215126_4216143_+|IS5-like-element-IS5-family-transposase
MFVIWSHGTGFIMSHQLTFADSEFSSKRRQTRKEIFLSRMEQILPWQNMVEVIEPFYPKAGNGRRPYPLETMLRIHCMQHWYNLSDGAMEDALYEIASMRLFARLSLDSALPDRTTIMNFRHLLEQHQLARQLFKTINRWLAEAGVMMTQGTLVDATIIEAPSSTKNKEQQRDPEMHQTKKGNQWHFGMKAHIGVDAKSGLTHSLVTTAANEHDLNQLGNLLHGEEQFVSADAGYQGAPQREELAEVDVDWLIAERPGKVRTLKQHPRKNKTAINIEYMKASIRAKVEHPFRIIKRQFGFVKARYKGLLKNDNQLAMLFTLANLFRADQMIRQWERSH
>CP033401.1|AYQ03735.1|4214772_4215117_+|transporter
MEIASNKGVIADASTPAGRAGMSESEWREAIKFDSTDTGWVIMSIGMAIGAGIVFLPVQVGLMGLWVFLLSSVIGYPAMYLFQRLFINTLAESPECKDYPSVISGYLGKVRTSP
>CP033401.1|AYQ03734.1|4213133_4214498_+|L-serine-ammonia-lyase
MISAFDIFKIGIGPSSSHTVGPMNAGKSFIDRLESSGLLTATSHIVVDLYGSLSLTGKGHATDVAIIMGLAGNSPQDVVIDEIPAFIELVTRSGRLPVASGAHIVDFPVAKNIIFHPEMLPRHENGMRITAWKGQEALLSKTYYSVGGGFIVEEEHFGLSHDVETSVPYDFHSAGELLKMCDYNGLSISGLMMHNELALRSKAEIDAGFARIWQVMHDGIERGMNTEGVLPGPLNVPRRAVALRRQLVSSDNISNDPMNVIDWINMYALAVSEENAAGGRVVTAPTNGACGIIPAVLAYYDKFRRPVNERSIARYFLAAGAIGALYKMNASISGAEVGCQGEIGVACSMAAAGLTELLGGSPAQVCNAAEIAMEHNLGLTCDPVAGQVQIPCIERNAINAVKAVNAARMAMRRTSAPRVSLDKVIETMYETGKDMNDKYRETSRGGLAIKVVCG
>CP033401.1|AYQ03733.1|4212672_4213062_+|enamine/imine-deaminase
MKKIIETQRAPGAIGPYVQGVDLGSMVFTSGQIPVCPQTGEIPADVQDQARLSLENVKAIVVAAGLSVGDIIKMTVFITDLNDFATINEVYKQFFDEHQATYPTRSYVQVARLPKDVKLEIEAIAVRSA
>CP033401.1|AYQ03732.1|4210364_4212659_+|PFL-like-enzyme-TdcE
MKVDIDTSDKLYADAWLGFKGTDWKNEINVRDFIQHNYTPYEGDESFLAEATPATTELWEKVMEGIRIENATHAPVDFDTNIATTITAHDAGYINQPLEKIVGLQTDAPLKRALHPFGGINMIKSSFHAYGREMDSEFEYLFTDLRKTHNQGVFDVYSPDMLRCRKSGVLTGLPDGYGRGRIIGDYRRVALYGISYLVRERELQFADLQSRLEKGEDLEATIRLREELAEHRHALLQIQEMAAKYGFDISRPAQNAQEAVQWLYFAYLAAVKSQNGGAMSLGRTASFLDIYIERDFKAGVLNEQQAQELIDHFIMKIRMVRFLRTPEFDSLFSGDPIWATEVIGGMGLDGRTLVTKNSFRYLHTLHTMGPAPEPNLTILWSEELPIAFKKYAAQVSIVTSSLQYENDDLMRTDFNSDDYAIACCVSPMVIGKQMQFFGARANLAKTLLYAINGGVDEKLKIQVGPKTAPLMDDVLDYDKVMDSLDHFMDWLAVQYISALNIIHYMHDKYSYEASLMALHDRDVYRTMACGIAGLSVATDSLSAIKYARVKPIRDENGLAVDFEIDGEYPQYGNNDERVDSIACDLVERFMKKIKALPTYRNAVPTQSILTITSNVVYGQKTGNTPDGRRAGTPFAPGANPMHGRDRKGAVASLTSVAKLPFTYAKDGISYTFSIVPAALGKEDPVRKTNLVGLLDGYFHHEADVEGGQHLNVNVMNREMLLDAIEHPEKYPNLTIRVSGYAVRFNALTREQQQDVISRTFTQAL
>CP033401.1|AYQ03731.1|4209122_4210331_+|propionate-kinase
MNEFPVVLVINCGSSSIKFSVLDASDCEVLMSGIADGINSENAFLSVNGGEPAPLAHHSYEGALKAIAFELEKRNLNDSVALIGHRIAHGGSIFTESAIITDEVIDNIRRVSPLAPLHNYANLSGIESAQQLFPGVTQVAVFDTSFHQTMAPEAYLYGLPWKYYEELGVRRYGFHGTSHRYVSQRAHSLLNLAEDDSGLVVAHLGNGASICAVRNGQSVDTSMGMTPLEGLMMGTRSGDVDFGAMSWVASQTNQSLGDLERVVNKESGLLGISGLSSDLRVLEKAWHEGHERAQLAIKTFVHRIARHIAGHAASLRRLDGIIFTGGIGENSSLIRRLVMEHLAVLGVEIDTEMNNRSNSCGERIVSSENARVICAVIPTNEEKMIALDAIHLGKVNAPAEFA
>CP033401.1|AYQ03730.1|4207765_4209097_+|threonine/serine-transporter-TdcC
MSTSDSIVSSQTKQSSWRKSDTTWTLGLFGTAIGAGVLFFPIRAGFGGLIPILLMLVLAYPIAFYCHRALARLCLSGSNPSGNITETVEEHFGKTGGVVITFLYFFAICPLLWIYGVTITNTFMTFWENQLGFAPLNRGFVALFLLLLMAFVIWFGKDLMVKVMSYLVWPFIASLVLISLSLIPYWNSAVIDQVDLGSLSLTGHDGILITVWLGISIMVFSFNFSPIVSSFVVSKREEYEKDFGRDFTERKCSQIISRASMLMVAVVMFFAFSCLFTLSPANMAEAKAQNIPVLSYLANHFASMTGTKTTFAITLEYAASIIALVAIFKSFFGHYLGTLEGLNGLILKFGYKGDKTKVSLGKLNTISMIFIMGSTWVVAYANPNILDLIEAMGAPIIASLLCLLPMYAIRKAPSLAKYRGRLDNVFVTVIGLLTILNIVYKLF
>CP033401.1|AYQ03729.1|4206754_4207744_+|serine/threonine-dehydratase
MHITYDLPVAIDDIIEAKQRLAGRIYKTGMPRSNYFSERCKGEIFLKFENMQRTGSFKIRGAFNKLSSLTDAEKRKGVVACSAGNHAQGVSLSCAMLGIDGKVVMPKGAPKSKVAATCDYSAEVVLHGDNFNDTIAKVSEIVEMEGRIFIPPYDDPKVIAGQGTIGLEIMEDLYDVDNVIVPIGGGGLIAGIAVAIKSINPTIRVIGVQSENVHGMAASFHSGEITTHRTTGTLADGCDVSRPGNLTYEIVRELVDDIVLVSEDEIRNSMIALIQRNKVVTEGAGALACAALLSGKLDQYIQNRKTVSIISGGNIDLSRVSQITGFVDA
>CP033401.1|AYQ03728.1|4205717_4206656_+|transcriptional-regulator
MSTILLPKTQHLVVFQEVIRSGSIGSAAKELGLTQPAVSKIINDIEDYFGVELVVRKNTGVTLTPAGQLLLSRSESITREMKNMVNEISGMSSEAVVEVSFGFPSLIGFTFMSGMINKFKEVFPKAQVSMYEAQLSSFLPAIRDGRLDFAIGTLSAEMKLQDLHVEPLFESEFVLVASKSRTCTGTTTLESLKNEQWVLPQTNMGYYSELLTTLQRNGISIENIVKTDSVVTIYNLVLNADFLTVIPCDMTSPFGSNQFITIPVEETLPVAQYAAVWSKNYRIKKAASVLVELAKEYSSYNGCRRRQLIEVG
>CP033401.1|AYQ03738.1|4218852_4219017_-|hypothetical-protein
MSKKSAKKRQPVKPVVAKEPARTAKNFGYEEMLSELEAIVADAETRLAEDEATA
>CP033401.1|AYQ03739.1|4219039_4219741_-|pirin-like-protein-YhaK
MITTRTARQCGQADYGWLQARYTFSFGHYFDPKLLGYASLRVLNQEVLAPGAAFQPRTYPKVDILNVILDGEAEYRDSEGNHVQASAGEALLLSTQPGVSYSEHNLSKDKPLTRMQLWLDACPQRENPLIQKLALNMGKQQLIASPEGTMGSLQLRQQVWLHHIVLDKGESANFQLHGPRAYLQSIHGKFHALTHHEEKAALTCGDGAFIRDEANITLVADSPLRALLIDLPV
>CP033401.1|AYQ03740.1|4219845_4220742_+|LysR-family-transcriptional-regulator
MAKERALTLEALRVMDAIDRRGSFAAAADELGRVPSALSYTMQKLEEELDVVLFDRSGHRTKFTNVGRMLLERGRVLLEAADKLTTDAEALARGWETHLTIVTEALVPTPAFFPLIDKLAAKANTQLAIITEVLAGAWERLEQGRADIVIAPDMHFRSSSEINSRKLYTLMNVYVAAPDHPIHQEPEPLSEVTRVKYRGIAVADTARERPVLTVQLLDKQPRLTVSTIEDKRQALLAGLGVATMPYPMVEKDIAEGRLRVVSPESTSEIDIIMAWRRDSMGEAKSWCLREIPKLFSGK
>CP033401.1|AYQ03741.1|4220792_4221149_-|DUF805-domain-containing-protein
MQWYLAVLKNYVGFSGRARRKEYWMFTLINAIVGAIINVIQLILGLEFPFLSLIYLAATIIPVIALCVRRLHDTDRSGAWALLYLVPIIGWLVLFVFACLEGNSGSNRYGNDPKFGSN
>CP033401.1|AYQ03742.1|4221390_4221756_-|DUF805-domain-containing-protein
MDWYLKVLKNYVGFRGRARRKEYWMFILVNIIFTFVLGLLDKMLGWQRAGGEGILTTIYGILVFLPWWAVQFRRLHDTDRSAWWALLFLIPFIGWLIIIVFNCQAGTPGENRFGPDPKLEP
>CP033401.1|AYQ03743.1|4222048_4223035_-|glutathione-S-transferase-family-protein
MGQLIDGVWHDTWYDTKSTGGKFQRSASAFRNWLTADGAPGPTGTGGFIAEKDRYHLYVSLACPWAHRTLIMRKLKGLEPFISVSVVNPLMLENGWTFDDSFPGATGDTLYQHEFLYQLYLHADPHYSGRVTVPVLWDKKNHTIVSNESAEIIRMFNTAFDALGAKAGDYYPPALQTKIDELNGWIYDTVNNGVYKAGFATSQQAYDEAVAKVFESLARLEQILGQHRYLTGNQLTEADIRLWTTLVRFDPVYVTHFKCDKHRISNYLNLYGFLRDIYQMPGIAETVNFDHIRNHYFRSHKTINPTGIISIGPWQDLDEPHGRDVRFG
>CP033401.1|AYQ03744.1|4223104_4223587_-|DoxX-family-protein
MILSIDSNDANTAPLHKKTISSLSGAVESMMKKLEDVGVLVARILMPILFITAGWGKITGYAGTQQYMEAMGVPGFMLPLVILLEFGGGLAILFGFLTRTTALFTAGFTLLTAFLFHSNFAEGVNSLMFMKNLTISGGFLLLAITGPGAYSIDRLLNKKW
>CP033401.1|AYQ03745.1|4223682_4223982_-|hypothetical-protein
MSSKVERERRKAQLLSQIQQQRLDLSASRREWLEATGAYDRRWNMLLSLRSWALVGSSVMAIWTIRHPNMLVRWARRGFGVWSAWRLVKTTLKQQQLRG
>CP033401.1|AYQ03746.1|4223971_4224376_-|hypothetical-protein
MADTHHAQGPGKSVLGIGQRIVSIMVEMVETRLRLAVVELEEEKANLFQLLLMLGLTMLFAAFGLMSLMVLIIWAVDPQYRLNAMIATTVVLLLLALIGGIWTLRKSRKSTLLRHTRHELANDRQLLEEESREQ
>CP033401.1|AYQ03747.1|4224378_4224684_-|DUF883-domain-containing-protein
MSKEHTTEHLRAELKSLSDTLEEVLSSSGEKSKEELSKIRSKAEQALKQSRYRLGETGDAIAKQTRVAAARADEYVRENPWTGVGIGAAIGVVLGVLLSRR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_9

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_9

4592112-4592567

Orphan

I-E

Consensus_repeat	Method
GAGTTCCCCGCGCCAGCGGGGATAAACCG	PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRT

7 spacers

The CRISPR arrays of CP033401_9

>merge|CP033401|9|4592112-4592567|PILER-CR,CRISPRCasFinder,CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCGTCCACGCTGTAACGGCCATCATTAAGTTTAGTGAGTTCCCCGCGCCAGCGGGGATAAACCGGAAGTAGGCCTGACAGTGATTGAACGCATACTGAGTTCCCCGCGCCAGCGGGGATAAACCGAGTTGGGGCGGCGCAATAACGAGACGATACGCGAGTTCCCCGCGCCAGCGGGGATAAACCGGGGAGTGGCACTTCTGGGGTAGCGGCGGCCCTGAGTTCCCCGCGCCAGCGGGGATAAACCGTCAACGCGCTCAGACGTTGCGTGAGTGAACCAGAGTTCCCCGCGCCAGCGGGGATAAACCGAAATATCCAGGGCTGGGCTGGAGGCAGACGGCGAGTTCCCCGCGCCAGCGGGGATAAACCGCCCGGAATGCATTCTGAAGGTTTGCTGTATATGAGTTCCCCGCGCCAGCGGGGATAAACCA

>CP033401|9|2|4592112-4592567|PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCCACGCTGTAACGGCCATCATTAAGTTTAGT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

>CP033401|9|8|4592112-4592567|CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCCACGCTGTAACGGCCATCATTAAGTTTAGT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

>CP033401|9|1|4592112-4592567|CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCCACGCTGTAACGGCCATCATTAAGTTTAGT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ04063.1\|4586852_4588490_+\|CTP-synthetase	unknown	unknown	gnl\|CDD\|235437
CP033401.1\|AYQ04071.1\|4597160_4598615_+\|FAD-binding-oxidoreductase	unknown	unknown	gnl\|CDD\|223354
CP033401.1\|AYQ04072.1\|4598708_4600046_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
CP033401.1\|AYQ04076.1\|4602399_4602660_-\|ferredoxin-family-protein	unknown	unknown	gnl\|CDD\|225289
CP033401.1\|AYQ04075.1\|4601807_4602383_-\|glycerol-3-phosphate-responsive-antiterminator	unknown	unknown	gnl\|CDD\|224865
CP033401.1\|AYQ04059.1\|4582867_4585102_+\|GTP-pyrophosphokinase	unknown	unknown	gnl\|CDD\|182797
CP033401.1\|AYQ04064.1\|4588577_4589876_+\|enolase	unknown	unknown	gnl\|CDD\|234617
CP033401.1\|AYQ04069.1\|4594709_4595987_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|349949
CP033401.1\|AYQ04065.1\|4589935_4590808_-\|YgcG-family-protein	unknown	unknown	gnl\|CDD\|224429
CP033401.1\|AYQ04067.1\|4591100_4591772_+\|7-carboxy-7-deazaguanine-synthase-QueE	unknown	unknown	gnl\|CDD\|275126
CP033401.1\|AYQ04058.1\|4581518_4582820_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	unknown	unknown	gnl\|CDD\|237291
CP033401.1\|AYQ04070.1\|4596305_4597091_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|187605
CP033401.1\|AYQ04060.1\|4585179_4585428_+\|MazF-MazE-toxin-antitoxin-system-antitoxin-MazE	unknown	unknown	gnl\|CDD\|182082
CP033401.1\|AYQ04068.1\|4593204_4594683_-\|sugar-kinase	unknown	unknown	gnl\|CDD\|212662
CP033401.1\|AYQ04077.1\|4602650_4603922_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
CP033401.1\|AYQ04073.1\|4600023_4600803_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	unknown	unknown	gnl\|CDD\|224997
CP033401.1\|AYQ04062.1\|4585833_4586625_+\|nucleoside-triphosphate-pyrophosphohydrolase	unknown	unknown	gnl\|CDD\|236569
CP033401.1\|AYQ04061.1\|4585427_4585763_+\|mRNA-interferase-MazF	unknown	unknown	gnl\|CDD\|182138
CP033401.1\|AYQ04074.1\|4600799_4601660_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|224936
CP033401.1\|AYQ04066.1\|4590821_4590962_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ04063.1\|4586852_4588490_+\|CTP-synthetase	gnl\|CDD\|235437	PRK05380, pyrG, CTP synthetase; Validated.	0
CP033401.1\|AYQ04071.1\|4597160_4598615_+\|FAD-binding-oxidoreductase	gnl\|CDD\|223354	COG0277, GlcD, FAD/FMN-containing dehydrogenases [Energy production and conversion].	1.25325e-82
CP033401.1\|AYQ04072.1\|4598708_4600046_+\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	3.74708e-50
CP033401.1\|AYQ04076.1\|4602399_4602660_-\|ferredoxin-family-protein	gnl\|CDD\|225289	COG2440, FixX, Ferredoxin-like protein [Energy production and conversion].	3.6328e-41
CP033401.1\|AYQ04075.1\|4601807_4602383_-\|glycerol-3-phosphate-responsive-antiterminator	gnl\|CDD\|224865	COG1954, GlpP, Glycerol-3-phosphate responsive antiterminator (mRNA-binding) [Transcription].	5.83077e-88
CP033401.1\|AYQ04059.1\|4582867_4585102_+\|GTP-pyrophosphokinase	gnl\|CDD\|182797	PRK10872, relA, (p)ppGpp synthetase I/GTP pyrophosphokinase; Provisional.	0
CP033401.1\|AYQ04064.1\|4588577_4589876_+\|enolase	gnl\|CDD\|234617	PRK00077, eno, enolase; Provisional.	0
CP033401.1\|AYQ04069.1\|4594709_4595987_-\|MFS-transporter	gnl\|CDD\|349949	cd06174, MFS, Major Facilitator Superfamily. The Major Facilitator Superfamily (MFS) is a large and diverse group of secondary transporters that includes uniporters, symporters, and antiporters. MFS proteins facilitate the transport across cytoplasmic or internal membranes of a variety of substrates including ions, sugar phosphates, drugs, neurotransmitters, nucleosides, amino acids, and peptides. They do so using the electrochemical potential of the transported substrates. Uniporters transport a single substrate, while symporters and antiporters transport two substrates in the same or in opposite directions, respectively, across membranes. MFS proteins are typically 400 to 600 amino acids in length, and the majority contain 12 transmembrane alpha helices (TMs) connected by hydrophilic loops. The N- and C-terminal halves of these proteins display weak similarity and may be the result of a gene duplication/fusion event. Based on kinetic studies and the structures of a few bacterial superfamily members, GlpT (glycerol-3-phosphate transporter), LacY (lactose permease), and EmrD (multidrug transporter), MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement. Bacterial members function primarily for nutrient uptake, and as drug-efflux pumps to confer antibiotic resistance. Some MFS proteins have medical significance in humans such as the glucose transporter Glut4, which is impaired in type II diabetes, and glucose-6-phosphate transporter (G6PT), which causes glycogen storage disease when mutated.	5.26475e-29
CP033401.1\|AYQ04065.1\|4589935_4590808_-\|YgcG-family-protein	gnl\|CDD\|224429	COG1512, COG1512, Beta-propeller domains of methanol dehydrogenase type [General function prediction only].	4.46208e-100
CP033401.1\|AYQ04067.1\|4591100_4591772_+\|7-carboxy-7-deazaguanine-synthase-QueE	gnl\|CDD\|275126	TIGR04322, organic_radical_activating_enzyme, putative 7-cyano-7-deazaguanosine (preQ0) biosynthesis protein QueE. Members of this radical SAM domain protein family appear to be the E. coli form of the queuosine biosynthesis protein QueE. QueE is involved in making preQ0 (7-cyano-7-deazaquanine), a precursor of both the bacterial/eukaryotic modified tRNA base queuosine and the archaeal modified base archaeosine. Members occur in species that lack known forms of QueE but usually are not found in queuosine biosynthesis operons. Members of this family tend to form bi-directional best hit matches to members of known (TIGR03365) and putative (TIGR03963) QueE families from other lineages.	3.23739e-155
CP033401.1\|AYQ04058.1\|4581518_4582820_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	gnl\|CDD\|237291	PRK13168, rumA, 23S rRNA (uracil(1939)-C(5))-methyltransferase RlmD.	0
CP033401.1\|AYQ04070.1\|4596305_4597091_+\|SDR-family-oxidoreductase	gnl\|CDD\|187605	cd05347, Ga5DH-like_SDR_c, gluconate 5-dehydrogenase (Ga5DH)-like, classical (c) SDRs. Ga5DH catalyzes the NADP-dependent conversion of carbon source D-gluconate and 5-keto-D-gluconate. This SDR subgroup has a classical Gly-rich NAD(P)-binding motif and a conserved active site tetrad pattern. However, it has been proposed that Arg104 (Streptococcus suis Ga5DH numbering), as well as an active site Ca2+, play a critical role in catalysis. In addition to Ga5DHs this subgroup contains Erwinia chrysanthemi KduD which is involved in pectin degradation, and is a putative 2,5-diketo-3-deoxygluconate dehydrogenase. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase (15-PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, 15-PGDH numbering) and/or an Asn (Asn-107,15-PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	1.14687e-138
CP033401.1\|AYQ04060.1\|4585179_4585428_+\|MazF-MazE-toxin-antitoxin-system-antitoxin-MazE	gnl\|CDD\|182082	PRK09798, PRK09798, MazF-MazE toxin-antitoxin system antitoxin MazE.	6.19513e-48
CP033401.1\|AYQ04068.1\|4593204_4594683_-\|sugar-kinase	gnl\|CDD\|212662	cd07779, FGGY_ygcE_like, uncharacterized ygcE-like proteins. This subfamily consists of uncharacterized hypothetical bacterial proteins with similarity to Escherichia coli sugar kinase ygcE , whose functional roles are not yet clear. Escherichia coli ygcE is recognized by this model, but is not present in the alignment as it contains a deletion relative to other members of the group. These proteins belong to the FGGY family of carbohydrate kinases, the monomers of which contain two large domains, which are separated by a deep cleft that forms the active site. This model includes both the N-terminal domain, which adopts a ribonuclease H-like fold, and the structurally related C-terminal domain.	9.76816e-108
CP033401.1\|AYQ04077.1\|4602650_4603922_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	2.82789e-125
CP033401.1\|AYQ04073.1\|4600023_4600803_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	gnl\|CDD\|224997	COG2086, FixA, Electron transfer flavoprotein, beta subunit [Energy production and conversion].	7.46503e-62
CP033401.1\|AYQ04062.1\|4585833_4586625_+\|nucleoside-triphosphate-pyrophosphohydrolase	gnl\|CDD\|236569	PRK09562, mazG, nucleoside triphosphate pyrophosphohydrolase; Reviewed.	8.97718e-160
CP033401.1\|AYQ04061.1\|4585427_4585763_+\|mRNA-interferase-MazF	gnl\|CDD\|182138	PRK09907, PRK09907, endoribonuclease MazF.	1.17475e-74
CP033401.1\|AYQ04074.1\|4600799_4601660_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|224936	COG2025, FixB, Electron transfer flavoprotein, alpha subunit [Energy production and conversion].	1.47186e-88

>CP033401.1|AYQ04067.1|4591100_4591772_+|7-carboxy-7-deazaguanine-synthase-QueE
MQYPINEMFQTLQGEGYFTGVPAIFIRLQGCPVGCAWCDTKHTWEKLEDREVSLFSILAKTKESDKWGAASSEDLLAVISRQGYTARHVVITGGEPCIHDLLPLTDLLEKNGFSCQIETSGTHEVRCTPNTWVTVSPKLNMRGGYEVLSQALERANEIKHPVGRVRDIEALDELLATLTDDKPRVIALQPISQKDDATRLCIETCIARNWRLSMQTHKYLNIA
>CP033401.1|AYQ04066.1|4590821_4590962_-|hypothetical-protein
MSEENKENGFNHVKTFTKIIFIFSVLVFNDNESKITDAAVNLFIQI
>CP033401.1|AYQ04065.1|4589935_4590808_-|YgcG-family-protein
MRYFILMFTFVCSFVAAQPTIVPQLQQQVTDLTSSLNSQEKKELTHKLESIFNNTQVQIAVLIVPTTKDETIEQYATRVFDNWRLGDAKRNDGILIIVAWSDRTVRIKVGYGLEEKVTDALAGDIIRSNMIPAFKQQKLAQGLELAINALNNQLTSQHQYPTNPSESESASSSDHYYFAIFWVFAVMFFPFWFFHQCSNFCRACKSGVCISAIYLLDLFLFSDKIFSIAVFSFFFTFTIFMVFTCLCVLQKRASGRSYHSDNSGSAGGSDSGGFSGGGGSSGGGGASGRW
>CP033401.1|AYQ04064.1|4588577_4589876_+|enolase
MSKIVKIIGREIIDSRGNPTVEAEVHLEGGFVGMAAAPSGASTGSREALELRDGDKSRFLGKGVTKAVAAVNGPIAQALIGKDAKDQAGIDKIMIDLDGTENKSKFGANAILAVSLANAKAAAAAKGMPLYEHIAELNGTPGKYSMPVPMMNIINGGEHADNNVDIQEFMIQPVGAKTVKEAIRMGSEVFHHLAKVLKAKGMNTAVGDEGGYAPNLGSNAEALAVIAEAVKAAGYELGKDITLAMDCAASEFYKDGKYVLAGEGNKAFTSEEFTHFLEELTKQYPIVSIEDGLDESDWDGFAYQTKVLGDKIQLVGDDLFVTNTKILKEGIEKGIANSILIKFNQIGSLTETLAAIKMAKDAGYTAVISHRSGETEDATIADLAVGTAAGQIKTGSMSRSDRVAKYNQLIRIEEALGEKAPYNGRKEIKGQA
>CP033401.1|AYQ04063.1|4586852_4588490_+|CTP-synthetase
MTTNYIFVTGGVVSSLGKGIAAASLAAILEARGLNVTIMKLDPYINVDPGTMSPIQHGEVFVTEDGAETDLDLGHYERFIRTKMSRRNNFTTGRIYSDVLRKERRGDYLGATVQVIPHITNAIKERVLEGGEGHDVVLVEIGGTVGDIESLPFLEAIRQMAVEIGREHTLFMHLTLVPYMAASGEVKTKPTQHSVKELLSIGIQPDILICRSDRAVPANERAKIALFCNVPEKAVISLKDVDSIYKIPGLLKSQGLDDYICKRFSLNCPEANLSEWEQVIFEEANPVSEVTIGMVGKYIELPDAYKSVIEALKHGGLKNRVSVNIKLIDSQDVETRGVEILKGLDAILVPGGFGYRGVEGMITTARFARENNIPYLGICLGMQVALIDYARHVANMENANSTEFVPDCKYPVVALITEWRDENGNVEVRSEKSDLGGTMRLGAQQCQLVDDSLVRQLYNAPTIVERHRHRYEVNNMLLKQIEDAGLRVAGRSGDDQLVEIIEVPNHPWFVACQFHPEFTSTPRDGHPLFAGFVKAASEFQKRQAK
>CP033401.1|AYQ04062.1|4585833_4586625_+|nucleoside-triphosphate-pyrophosphohydrolase
MNQIDRLLTIMQRLRDPENGCPWDKEQTFATIAPYTLEETYEVLDAIAREDFDDLRGELGDLLFQVVFYAQMAQEEGRFDFNDICAAISDKLERRHPHVFADSSAENSSEVLARWEQIKTEERAQKAQHSALDDIPRSLPALMRAQKIQKRCANVGFDWTTLGPVVDKVYEEIDEVMYEARQAVVDQAKLEEEMGDLLFATVNLARHLGTKAEIALQKANEKFERRFREVERIVAARGLEMTGVDLETMEEVWQQVKRQEIDL
>CP033401.1|AYQ04061.1|4585427_4585763_+|mRNA-interferase-MazF
MVSRYVPDMGDLIWVDFDPTKGSEQAGHRPAVVLSPFMYNNKTGMCLCVPCTTQSKGYPFEVVLSGQERDGVALADQVKSIAWRARGATKKGTVAPEELQLIKAKINVLIG
>CP033401.1|AYQ04060.1|4585179_4585428_+|MazF-MazE-toxin-antitoxin-system-antitoxin-MazE
MIHSSVKRWGNSPAVRIPATLMQALNLNIDDEVKIDLVDGKLIIEPVRKEPVFTLAELVNDITPENLHENIDWGEPKDKEVW
>CP033401.1|AYQ04059.1|4582867_4585102_+|GTP-pyrophosphokinase
MVAVRSAHINKAGEFDPEKWIASLGITSQKSCECLAETWAYCLQQTQGHPDASLLLWRGVEMVEILSTLSMDIDTLRAALLFPLADANVVSEDVLRESVGKSVVNLIHGVRDMAAIRQLKATHTDSVSSEQVDNVRRMLLAMVDDFRCVVIKLAERIAHLREVKDAPEDERVLAAKECTNIYAPLANRLGIGQLKWELEDYCFRYLHPTEYKRIAKLLHERRLDREHYIEEFVGHLRAEMKAEGVKAEVYGRPKHIYSIWRKMQKKNLAFDELFDVRAVRIVAERLQDCYAALGIVHTHYRHLPDEFDDYVANPKPNGYQSIHTVVLGPGGKTVEIQIRTKQMHEDAELGVAAHWKYKEGAAAGGARSGHEDRIAWLRKLIAWQEEMADSGEMLDEVRSQVFDDRVYVFTPKGDVVDLPAGSTPLDFAYHIHSDVGHRCIGAKIGGRIVPFTYQLQMGDQIEIITQKQPNPSRDWLNPNLGYVTTSRGRSKIHAWFRKQDRDKNILAGRQILDDELEHLGISLKEAEKHLLPRYNFNDVDELLAAIGGGDIRLNQMVNFLQSQFNKPSAEEQDAAALKQLQQKSYTPQNRSKDNGRVVVEGVGNLMHHIARCCQPIPGDEIVGFITQGRGISVHRADCEQLAELRSHAPERIVDAVWGESYSAGYSLVVRVVANDRSGLLRDITTILANEKVNVLGVASRSDTKQQLATIDMTIEIYNLQVLGRVLGKLNQVPDVIDARRLHGS
>CP033401.1|AYQ04058.1|4581518_4582820_+|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD
MAQFYSAKRRTTTRQIITVSVNDLDSFGQGVARHNGKTLFIPGLLPQENAEVTVTEDKKQYARAKVVRRLSDSPERETPRCPHFGVCGGCQQQHASVDLQQRSKSAALARLMKHDVSEVIADVPWGYRRRARLSLNYLPKTQQLQMGFRKAGSSDIVDVKQCPILAPQLEALLPKVRACLGSLQAMRHLGHVELVQATSGTLMILRHTAPLSSADREKLERFSHSEGLDLYLAPDSEILETVSGEMPWYDSNGLRLTFSPRDFIQVNAGVNQKMVARALEWLDVQPEDRVLDLFCGMGNFTLPLATQAASVVGVEGVPALVEKGQQNARLNGLQNVTFYHENLEEDVTKQPWAKNGFDKVLLDPARAGAAGVMQQIIKLEPIRIVYVSCNPATLARDSEALLKAGYTIARLAMLDMFPHTGHLESMVLFSRVK
>CP033401.1|AYQ04068.1|4593204_4594683_-|sugar-kinase
MSKKYIIGIDGGSQSTKVVMYDLEGNVVCEGKGLLQPMHTPDADTAEHPDDDLWASLCFAGHDLMSQFAGNKEDIVGIGLGSIRCCRALLKADGTPAAPLISWQDARVTRPYEHTNPDVAYVTSFSGYLTHRLTGEFKDNIANYFGQWPVDYKSWAWSEDAAVMDKFNIPRHMLFDVQMPGTVLGHITPQAALATHFPAGLPVVCTTSDKPVEALGAGLLDDETAVISLGTYIALMMNGKALPKDPVAYWPIMSSIPQTLLYEGYGIRKGMWTVSWLRDMLGESLIQDAKAQDLSPEDLLNKKASCVPPGCNGLMTVLDWLTNPWEPYKRGIMIGFDSSMDYAWIYRSILESVALTLKNNYDNMCNEMNYFAKHVIITGGGSNSDLFMQIFADVFNLPARRNAINGCASLGAAINTAVGLGLYPDYATAVDKMVRVKDIFMPVESNAKRYDAMNKGIFKDLTKHTDVILKKSYEVMHGELGNADSIQSWSNA
>CP033401.1|AYQ04069.1|4594709_4595987_-|MFS-transporter
MQHNSYRRWITLAIISFSGGVSFDLAYLRYIYQIPMAKFMGFSNTEIGLIMSTFGIAAIILYAPSGVIADKFSHRKMITSAMIITGLLGLLMATYPPLWVMLCIQVAFAITTILMLWSVSIKAASLLGDHSEQGKIMGWMEGLRGVGVMSLAVFTMWVFSRFAPDDSTSLKTVIIIYSVVYILLGILCWFFVSDNNNLRSANNEEKQSFQLSDILAVLRISTTWYCSMVIFGVFTIYAILSYSTNYLTEMYGMSLVAASYMGIVINKIFRALCGPLGGIITTYSKVKSPTRVIQILSIIGLLALTALLVTNSNPQSVAMGIGLILLLGFTCYASRGLYWACPGEARTPSYIMGTTVGICSVIGFLPDVFVYPIIGHWQDTLPAAEAYRNMWLMGMAALGMVIVFIFLLFQKIRTADSAPAMASSK
>CP033401.1|AYQ04070.1|4596305_4597091_+|SDR-family-oxidoreductase
MSIESLNAFSMDFFSLKGKTAIVTGGNSGLGQAFAMALAKAGANIFIPSFVKDNGETKEMIEKQGVEVDFMQVDITAEGAPQKIIAASCERFGTVDILVNNAGICKLNKVLDFGRADWDPMIDVNLTAAFELSYEAAKIMIPQKSGKIINICSLFSYLGGQWSPAYSATKHALAGFTKAYCDELGQYNIQVNGIAPGYYATDITLATRSNPETNQRVLDHIPANRWGDTQDLMGAAVFLASPASNYVNGHLLVVDGGYLVR
>CP033401.1|AYQ04071.1|4597160_4598615_+|FAD-binding-oxidoreductase
MSLSRAAIVDQLKEIVGADRVITDETVLKKNSIDRFRKFPDIHGIYTLPIPAAVVKLGSTEQVSRVLNFMNAHKINGVPRTGASATEGGLETVVENSVVLDGSAMNQIINIDIENMQATAQCGVPLEVLENALREKGYTTGHSPQSKPLAQMGGLVATRSIGQFSTLYGAIEDMVVGLEAVLADGTVTRIKNVPRRAAGPDIRHIIIGNEGALCYITEVTVKIFKFTPENNLFYGYILEDMKTGFNILREVMVEGYRPSIARLYDAEDGTQHFTHFADGKCVLIFMAEGNPRIAKATGEGIAEIVARYPQCQRVDSKLIETWFNNLNWGPDKVAAERVQILKTGNMGFTTEVSGCWSCIHEIYESVINRIRTEFPHADDITMLGGHSSHSYQNGTNMYFVYDYNVVDCKPEEEIDKYHNPLNKIICEETIRLGGSMVHHHGIGKHRVHWSKLEHGSAWALLEGLKKQFDPNGIMNTGTIYPIEK
>CP033401.1|AYQ04072.1|4598708_4600046_+|MFS-transporter
MNTSPVRMDDLPLNRFHCRIAALTFGAHLTDGYVLGVIGYAIIQLTPAMQLTPFMAGMIGGSALLGLFLGSLVLGWISDHIGRQKIFTFSFLLITLASFLQFFATTPEHLIGLRILIGIGLGGDYSVGHTLLAEFSPRRHRGILLGAFSVVWTVGYVLASIAGHHFISENPEAWRWLLASAALPALLITLLRWGTPESPRWLLRQGRFAEAHAIVHRYFGPHVLLGDEVVTATHKHIKTLFSSRYWRRTAFNSVFFVCLVIPWFVIYTWLPTIAQTIGLEDALTASLMLNALLIVGALLGLVLTHLLAHRKFLLGSFLLLAATLVVMACLPSGSSLTLLLFVLFSTTISAVSNLVGILPAESFPTDIRSLGVGFATAMSRLGAAVSTGLLPWVLAQWGMQVTLLLLATVLLVGFVVTWLWAPETKALPLVAAGNVGGANEHSVSV
>CP033401.1|AYQ04073.1|4600023_4600803_+|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein
MNILLAFKAEPDAGMLAEKEWQAAAQGKSGPDISLLRSLLGADEQAAAALLLAQRKNGTPMSLTALSMGDERALHWLRYLMALGFEEAVLLETAADLRFAPEFVARHIAEWQHQNPLDLIITGCQSSEGQNGQTPFLLAEMLGWPCFTQVERFTLDALFITLEQRTEHGLRCCRVRLPAVIAVRQCGEVALPVPGMRQRMAAGKAEIIRKTVAAEMPAMQCLQLARAEQRRGATLIDGQTVAEKAQKLWRDYLRQRMQP
>CP033401.1|AYQ04074.1|4600799_4601660_+|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MNIAIVTINQENAAIASWLAAQDFSGCTLAHWQIEPQPVVAEQVLDALVEQWQRTPADVVLFPPGTFGDELSTRLAWRLHGASICQVTSLDIPTVSVRKSHWGNALTATLQTEKRPLCLSLARQAGAAKNATLPSGMQQLIIVPGALPDWLVSTEDLKNVTRDPLAEARRVLVVGQGGEADNQEIAMLAEKLGAEVGYSRARVMNGGVDAEKVIGISGHLLAPEVCIVVGASGAAALMAGVRNSKFVVAINHDASAAVFSQADVGVVDDWKVVLEALVTNIHADCQ
>CP033401.1|AYQ04075.1|4601807_4602383_-|glycerol-3-phosphate-responsive-antiterminator
MPLLHLLRQNPVIAAVKDNASLQLAIDSECQFISVLYGNICTISNIVKKIKNAGKYAFIHVDLLEGASNKEVVIQFLKLVTEADGIISTKASMLKAARAEGFFCIHRLFIVDSISFHNIDKQVAQSNPDCIEILPGCMPKVLGWVTEKIRQPLIAGGLVCDEEDARNAINAGVVALSTTNTGVWTLAKKLL
>CP033401.1|AYQ04076.1|4602399_4602660_-|ferredoxin-family-protein
MSVARNLWRVADAPHIVPADSVERQTAERLISACPAGLFSLTPEGDLRIDYRSCLECGTCRLLCDESTLQQWRYPPSGFGITYRFG
>CP033401.1|AYQ04077.1|4602650_4603922_-|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERCITHESLSLLTPDGATTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGGICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP033401_10

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP033401_10

4614952-4615530

Unclear

I-E

Consensus_repeat	Method
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	CRISPRCasFinder
GTGTTCCCCGCGCCAGCGGGGATAAACCG	PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CRT

9 spacers

cas2,cas1,cas6e,cas5

The CRISPR arrays of CP033401_10

>merge|CP033401|10|4614952-4615530|CRISPRCasFinder,PILER-CR,CRT
TGTGTTCCCCGCGCCAGCGGGGATAAACCGTTGCCCGCGCAATTCCGGGAGCATCCGCAATTGTGTTCCCCGCGCCAGCGGGGATAAACCGACGGACAAAATATATATTGATTTGCGAATTATGTGTTCCCCGCGCCAGCGGGGATAAACCGGTAAAGAAACTGCCGACAAATCCCTGTTCGTTGTGTTCCCCGCGCCAGCGGGGATAAACCGCCCGTCACCGACGCGCAGTGGCGCTACCGTGAGTGTTCCCCGCGCCAGCGGGGATAAACCGGGATCTAACGCGCTGTAAAAATTCCGTGCTTTGTGTTCCCCGCGCCAGCGGGGATAAACCATGCGGATTACCGGCAAAACATGGGAGCAAACCGTGTTCCCCGCGCCAGCGGGGATAAACCGCCGAACGGCTGGCGAAGCAGGTGGCTGGCGTAGTGTTCCCCGCGCCAGCGGGGATAAACCGGTTTACCGCCCCGCAGAGGCGCTGGCAGATCCGTGTTCCCCGCGCCAGCGGGGATAAACCGGGATGACCTGTCGCTAAAACTCGCCGCGTACAGTGTTCCCCGCGCCAGCGGGGATAAACCG

>CP033401|10|9|4614952-4615530|CRISPRCasFinder
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAAT
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTA
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGT
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGTCACCGACGCGCAGTGGCGCTACCGTG
AGTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATCTAACGCGCTGTAAAAATTCCGTGCTT
TGTGTTCCCCGCGCCAGCGGGGATAAACCA	TGCGGATTACCGGCAAAACATGGGAGCAAAC
CGTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGT
AGTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATC
CGTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTAC
AGTGTTCCCCGCGCCAGCGGGGATAAACCG

>CP033401|10|3|4614953-4615530|PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAATT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTAT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGTT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGTCACCGACGCGCAGTGGCGCTACCGTGA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATCTAACGCGCTGTAAAAATTCCGTGCTTT
GTGTTCCCCGCGCCAGCGGGGATAAACCA	TGCGGATTACCGGCAAAACATGGGAGCAAACC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGTA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATCC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTACA
GTGTTCCCCGCGCCAGCGGGGATAAACCG

>CP033401|10|2|4614953-4615530|CRT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAATT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTAT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGTT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGTCACCGACGCGCAGTGGCGCTACCGTGA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATCTAACGCGCTGTAAAAATTCCGTGCTTT
GTGTTCCCCGCGCCAGCGGGGATAAACCA	TGCGGATTACCGGCAAAACATGGGAGCAAACC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGTA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATCC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTACA
GTGTTCCCCGCGCCAGCGGGGATAAACCG

Protein	Signature genes	Signature genes Name	Protein_function
CP033401.1\|AYQ04089.1\|4617810_4619238_+\|sulfate-adenylyltransferase	unknown	unknown	gnl\|CDD\|235349
CP033401.1\|AYQ04094.1\|4621449_4621929_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	unknown	unknown	gnl\|CDD\|178851
CP033401.1\|AYQ04095.1\|4621925_4622975_+\|tRNA-pseudouridine(13)-synthase-TruD	unknown	unknown	gnl\|CDD\|234884
CP033401.1\|AYQ04079.1\|4604680_4606480_+\|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit	unknown	unknown	gnl\|CDD\|182862
CP033401.1\|AYQ04088.1\|4616900_4617809_+\|sulfate-adenylyltransferase-subunit-2	unknown	unknown	gnl\|CDD\|235375
CP033401.1\|AYQ04078.1\|4603999_4604365_-\|6-carboxytetrahydropterin-synthase-QueD	unknown	unknown	gnl\|CDD\|238264
CP033401.1\|AYQ04091.1\|4619892_4620216_+\|DUF3561-family-protein	unknown	unknown	gnl\|CDD\|371891
CP033401.1\|AYQ04090.1\|4619237_4619843_+\|adenylyl-sulfate-kinase	unknown	unknown	gnl\|CDD\|179661
CP033401.1\|AYQ04093.1\|4620739_4621450_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	unknown	unknown	gnl\|CDD\|234670
CP033401.1\|AYQ04087.1\|4615611_4616649_-\|aminopeptidase	unknown	unknown	gnl\|CDD\|182299
CP033401.1\|AYQ04080.1\|4606479_4608192_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	unknown	unknown	gnl\|CDD\|237402
CP033401.1\|AYQ04084.1\|4612995_4613646_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	cd09664_cas6e_CAS-I-E	gnl\|CDD\|273869
CP033401.1\|AYQ04081.1\|4608265_4609000_+\|phosphoadenosine-phosphosulfate-reductase	unknown	unknown	gnl\|CDD\|234997
CP033401.1\|AYQ04083.1\|4612267_4613014_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|187776
CP033401.1\|AYQ04086.1\|4614562_4614856_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	cd09648_cas2_CAS-I-E	gnl\|CDD\|236930
CP033401.1\|AYQ04077.1\|4602650_4603922_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
CP033401.1\|AYQ04082.1\|4609264_4609417_+\|type-I-toxin-antitoxin-system-Hok-family-toxin	unknown	unknown	gnl\|CDD\|366840
CP033401.1\|AYQ04096.1\|4622955_4623717_+\|5'/3'-nucleotidase-SurE	unknown	unknown	gnl\|CDD\|234732
CP033401.1\|AYQ04085.1\|4613642_4614566_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
CP033401.1\|AYQ04092.1\|4620409_4620721_+\|cell-division-protein-FtsB	unknown	unknown	gnl\|CDD\|179156

Protein	Function_ID	Function_description	E-value
CP033401.1\|AYQ04089.1\|4617810_4619238_+\|sulfate-adenylyltransferase	gnl\|CDD\|235349	PRK05124, cysN, sulfate adenylyltransferase subunit 1; Provisional.	0
CP033401.1\|AYQ04094.1\|4621449_4621929_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	gnl\|CDD\|178851	PRK00084, ispF, 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase; Reviewed.	3.39469e-104
CP033401.1\|AYQ04095.1\|4621925_4622975_+\|tRNA-pseudouridine(13)-synthase-TruD	gnl\|CDD\|234884	PRK00984, truD, tRNA pseudouridine synthase D; Reviewed.	0
CP033401.1\|AYQ04079.1\|4604680_4606480_+\|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit	gnl\|CDD\|182862	PRK10953, cysJ, NADPH-dependent assimilatory sulfite reductase flavoprotein subunit.	0
CP033401.1\|AYQ04088.1\|4616900_4617809_+\|sulfate-adenylyltransferase-subunit-2	gnl\|CDD\|235375	PRK05253, PRK05253, sulfate adenylyltransferase subunit CysD.	0
CP033401.1\|AYQ04078.1\|4603999_4604365_-\|6-carboxytetrahydropterin-synthase-QueD	gnl\|CDD\|238264	cd00470, PTPS, 6-pyruvoyl tetrahydropterin synthase (PTPS). Folate derivatives are essential cofactors in the biosynthesis of purines, pyrimidines, and amino acids, as well as formyl-tRNA. Mammalian cells are able to utilize pre-formed folates after uptake by a carrier-mediated active transport system. Most microbes and plants lack this system and must synthesize folates de novo from guanosine triphosphate. One enzyme from this pathway is PTPS which catalyzes the conversion of dihydroneopterin triphosphate to 6-pyruvoyl tetrahydropterin. The functional enzyme is a hexamer of identical subunits.	9.8593e-60
CP033401.1\|AYQ04091.1\|4619892_4620216_+\|DUF3561-family-protein	gnl\|CDD\|371891	pfam12084, DUF3561, Protein of unknown function (DUF3561). This family of proteins is functionally uncharacterized. This protein is found in bacteria. Proteins in this family are about 110 amino acids in length.	1.22003e-52
CP033401.1\|AYQ04090.1\|4619237_4619843_+\|adenylyl-sulfate-kinase	gnl\|CDD\|179661	PRK03846, PRK03846, adenylylsulfate kinase; Provisional.	7.34447e-148
CP033401.1\|AYQ04093.1\|4620739_4621450_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	gnl\|CDD\|234670	PRK00155, ispD, D-ribitol-5-phosphate cytidylyltransferase.	3.26939e-121
CP033401.1\|AYQ04087.1\|4615611_4616649_-\|aminopeptidase	gnl\|CDD\|182299	PRK10199, PRK10199, alkaline phosphatase isozyme conversion aminopeptidase; Provisional.	0
CP033401.1\|AYQ04080.1\|4606479_4608192_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	gnl\|CDD\|237402	PRK13504, PRK13504, NADPH-dependent assimilatory sulfite reductase hemoprotein subunit.	0
CP033401.1\|AYQ04084.1\|4612995_4613646_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|273869	TIGR01907, CRISPR_system_Cascade_subunit_CasE, CRISPR-associated protein Cas6/Cse3/CasE, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model family, represented by CT1974 from Chlorobium tepidum, is found in the Ecoli subtype of CRISPR/Cas regions and is designated Cse3 (CRISPR/Cas Subtype Ecoli protein 3). The representative of this family from Thermus thermophilus HB8 (TTHB192) has been crystallized and found to have a structure consisting of two domains with opposing parallel beta-sheets known as a beta-sheet platform. This structure is similar to those found in the Sex-lethal protein and poly(A)-binding protein. This structure is consistent with an RNA-binding function.	1.0289e-91
CP033401.1\|AYQ04081.1\|4608265_4609000_+\|phosphoadenosine-phosphosulfate-reductase	gnl\|CDD\|234997	PRK02090, PRK02090, phosphoadenylyl-sulfate reductase.	1.33579e-136
CP033401.1\|AYQ04083.1\|4612267_4613014_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|187776	cd09645, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	5.83917e-49
CP033401.1\|AYQ04086.1\|4614562_4614856_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|236930	PRK11558, PRK11558, putative ssRNA endonuclease; Provisional.	2.35543e-65
CP033401.1\|AYQ04077.1\|4602650_4603922_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	2.82789e-125
CP033401.1\|AYQ04082.1\|4609264_4609417_+\|type-I-toxin-antitoxin-system-Hok-family-toxin	gnl\|CDD\|366840	pfam01848, HOK_GEF, Hok/gef family.	8.32243e-12
CP033401.1\|AYQ04096.1\|4622955_4623717_+\|5'/3'-nucleotidase-SurE	gnl\|CDD\|234732	PRK00346, surE, 5'(3')-nucleotidase/polyphosphatase; Provisional.	5.52694e-150
CP033401.1\|AYQ04085.1\|4613642_4614566_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	6.67486e-158
CP033401.1\|AYQ04092.1\|4620409_4620721_+\|cell-division-protein-FtsB	gnl\|CDD\|179156	PRK00888, ftsB, cell division protein FtsB; Reviewed.	5.55235e-62

>CP033401.1|AYQ04086.1|4614562_4614856_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MSMVVVVTENVPPRLRGRLAIWLLEVRAGVYVGDTSKRIREMIWQQITQLAGCGNVVMAWATNTESGFEFQTWGENRRIPVDLDGLRLVSFLPVDNQ
>CP033401.1|AYQ04085.1|4613642_4614566_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MTFVPLSPIPLKDRTSMIFLQYGQIDVLDGAFVLIDKTGIRTHIPVGSVACIMLEPGTRVSHAAVHLAATVGTLLVWVGEAGVRVYSSGQPGGARADKLLYQAKLALTEDLRLKVVRKMYELRFREPPPARRSVEQLRGIEGSRVRQTYALLAKQYGVKWNGRKYDPKDWEKGDVVNRCISAATSCLYGISEAAVLAAGYAPAIGFIHSGKPLSFVYDIADIIKFDSVVPKAFEIAARQPAEPDKEVRLACRDIFRSTKLTGKLIPLIEEVLAAGEIEPPQPAPDMLPPAIPEPETLGDSGHRGRGG
>CP033401.1|AYQ04084.1|4612995_4613646_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MYLSRITLHTGQLSPAQLLHLVDRGEYVMHQWLWDLFPGGKERQFLYRREELQGAFRFFVLSQERPAESDTFTIECRSFAPELRTGQQLCFNLRANPTICKSGKRHDLLMEAKRQVRGQAEGSDVWLHQQQAALDWLAAQGERSGFTLLDTSVDAYRQQQLRRENSRQLIQFSSVDYTGMLTVTDPGLFLQRLSQGYGKSRAFGCGLMLIKPGAEA
>CP033401.1|AYQ04083.1|4612267_4613014_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MSQYLIFQLHGPMASWGVDAPGEVRHTHELPSRSALLGLLAAGVGIRRDDTERLNAFNRHYSLVVCASRNPRWARDYHTIQMPKEVRKARYFSRREELSDPDLLSAIISRRDYYTDAWWMVAVATTADAPYSLEQLQDGLRHPVFPLYLGRKSHPLALPLAPLLLEGNACDALCNAYQQYQDHFHKLKVSLPKLQDECWWEGEHDGLVASKILRRRDVPLNRQQWLFGERTINQGPWLSKEEPCTSQE
>CP033401.1|AYQ04082.1|4609264_4609417_+|type-I-toxin-antitoxin-system-Hok-family-toxin
MLTKYALVAIIVLCCTVLGFTLMVGDSLCELSIRERGMEFKAVLAYESKK
>CP033401.1|AYQ04081.1|4608265_4609000_+|phosphoadenosine-phosphosulfate-reductase
MSKLDLNALNELPKVDRILALAETNAELEKLDAEGRVAWALDNLPGEYVLSSSFGIQAAVSLHLVNQIHPDIPVILTDTGYLFPETYRFIDELTDKLKLNLKVYRATESAAWQEARYGKLWEQGVEGIEKYNDINKVEPMNRALKELNAQTWFAGLRREQSGSRANLPVLAIQRGVFKVLPIIDWDNRTIYQYLQKHGLKYHPLWDEGYLSVGDTHTTRKWEPGMLEEETRFFGLKRECGLHEG
>CP033401.1|AYQ04080.1|4606479_4608192_+|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit
MSEKHPGPLVVEGKLTDAERMKLESNYLRGTIAEDLNDGLTGGFKGDNFLLIRFHGMYQQDDRDIRAERAEQKLEPRHAMLLRCRLPGGVITTKQWQAIDKFAGENTIYGSIRLTNRQTFQFHGILKKNVKPVHQMLHSVGLDALATANDMNRNVLCTSNPYESQLHAEAYEWAKKISEHLLPRTRAYAEIWLDQEKVATTDEEPILGQTYLPRKFKTTVVIPPQNDIDLHANDMNFVAIAENGKLVGFNLLVGGGLSIEHGNKKTYARTASEFGYLPLEHTLAVAEAVVTTQRDWGNRTDRKNAKTKYTLERVGVETFKAEVERRAGIKFEPIRPYEFTGRGDRIGWVKGIDDNWHLTLFIENGRILDYPGRPLKTGLLEIAKIHKGDFRITANQNLIIAGVPESEKAKIEKIAKESGLMNAVTPQRENSMACVSFPTCPLAMAEAERFLPSFIDNIDNLMAKHGVSDEHIVMRVTGCPNGCGRAMLAEVGLVGKAPGRYNLHLGGNRIGTRIPRMYKENITEPEILASLDELIGRWAKEREAGEGFGDFTVRAGIIRPVLDPARDLWD
>CP033401.1|AYQ04079.1|4604680_4606480_+|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit
MTTQVPPSALLPLNPEQLVRLQAATTDLTPTQLAWVSGYFWGVLNQQPAALAATPAPAAEMPGITIISASQTGNARRVAEALRDDLLAAKLNVKLVNAGDYKFKQIASEKLLIVVTSTQGEGEPPEEAVALHKFLFSKKAPKLENTAFAVFSLGDSSYEFFCQSGKDFDSKLAELGGERLLDRVDADVEYQAAASEWRARVVDALKSRAPVAAPSQSVATGAVNEIHTSPYSKDAPLVASLSVNQKITGRNSEKDVRHIEIDLGDSGLRYQPGDALGVWYQNDPALVKELVELLWLKGDEPVTVEGKTLPLNEALQWHFELTVNTANIVENYATLTRSETLLPLVGDKAKLQHYAATTPIVDMVRFSPAQLDAEALINLLRPLTPRLYSIASSQAEVENEVHVTVGVVRYDVEGRARAGGASSFLADRVEEEGEVRVFIEHNDNFRLPANPETPVIMIGPGTGIAPFRAFMQQRAADEAPGKNWLFFGNPHFTEDFLYQVEWQRYVKDGVLTRIDLAWSRDQKEKVYVQDKLREQGAELWRWINDGAHIYVCGDANRMAKDVEQALLEVIAEFGGMDTEAADEFLSELRVERRYQRDVY
>CP033401.1|AYQ04078.1|4603999_4604365_-|6-carboxytetrahydropterin-synthase-QueD
MMSTTLFKDFTFEAAHRLPHVPEGHKCGRLHGHSFMVRLEITGEVDPHTGWIIDFAELKAAFKPTYERLDHHYLNDIPGLENPTSEVLAKWIWDQVKPVVPLLSAVMVKETCTAGCIYRGE
>CP033401.1|AYQ04077.1|4602650_4603922_-|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERCITHESLSLLTPDGATTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGGICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL
>CP033401.1|AYQ04087.1|4615611_4616649_-|aminopeptidase
MFSALRHRTAALALGVCFILPVHASSPKPGDFANTQARHIATFFPGRMTGTPAEMLSADYIRQQFQQMGYRSDIRTFNSRYIYTARDNRKSWHNVTGSTVIAAHEGKAPQQIIIMAHLDTYAPLSDADADANLGGLTLQGMDDNAAGLGVMLELAERLKNTPTEYGIRFVATSGEEEGKLGAENLLKRMSDTEKKNTLLVINLDNLIVGDKLYFNSGVKTPEAVRKLTRDRALAIARSHGIAATTNPGLNKNYPKGTGCCNDAEIFDKAGIAVLSVEATNWNLGNKDGYQQRAKTAAFPAGNSWHDVRLDNQQHIDKALPGRIERRCRDVMRIMLPLVKELAKAS
>CP033401.1|AYQ04088.1|4616900_4617809_+|sulfate-adenylyltransferase-subunit-2
MDQIRLTHLRQLEAESIHIIREVAAEFSNPVMLYSIGKDSSVMLHLARKAFYPGTLPFPLLHVDTGWKFREMYEFRDRTAKAYGCELLVHKNPEGVAMGINPFVHGSAKHTDIMKTEGLKQALNKYGFDAAFGGARRDEEKSRAKERIYSFRDRFHRWDPKNQRPELWHNYNGQINKGESIRVFPLSNWTEQDIWQYIWLENIDIVPLYLAAERPVLERDGMLMMIDDNRIDLQPGEVIKKRMVRFRTLGCWPLTGAVESNAQTLPEIIEEMLVSTTSERQGRVIDRDQAGSMELKKRQGYF
>CP033401.1|AYQ04089.1|4617810_4619238_+|sulfate-adenylyltransferase
MNTALAQQIANEGGVEAWMIAQQHKSLLRFLTCGSVDDGKSTLIGRLLHDTRQIYEDQLSSLHNDSKRHGTQGEKLDLALLVDGLQAEREQGITIDVAYRYFSTEKRKFIIADTPGHEQYTRNMATGASTCELAILLIDARKGVLDQTRRHSFISTLLGIKHLVVAINKMDLVDYSEKTFTRIREDYLTFAGQLPGNLDIRFVPLSALEGDNVASQSESMAWYSGPTLLEVLETVEIQRVVDAQPMRFPVQYVNRPNLDFRGYAGTLASGRVEVGQRVKVLPSGVESNVARIVTFDGDREEAFAGEAITLVLTDEIDISRGDLLLAADEALPAVQSASVDVVWMAEQPLSPGQSYDIKIAGKKTRARVDGIRYQVDINNLTQREVENLPLNGIGLVDLTFDEPLVLDRYQQNPVTGGLIFIDRLSNVTVGAGMVHEPVSQATAAPSEFSAFELELNALVRRHFPHWGARDLLGDK
>CP033401.1|AYQ04090.1|4619237_4619843_+|adenylyl-sulfate-kinase
MALHDENVVWHSHPVTVQQRELHHGHRGVVLWFTGLSGSGKSTVAGALEEALHKLGVSTYLLDGDNVRHGLCSDLGFSDADRKENIRRVGEVANLMVEAGLVVLTAFISPHRAERQMVRERVGEGRFIEVFVDTPLAICEARDPKGLYKKARAGELRNFTGIDSVYEAPESAEIHLNGEQLVTNLVQQLLDLLRQNDIIRS
>CP033401.1|AYQ04091.1|4619892_4620216_+|DUF3561-family-protein
MRNSHNITLTNNDSLTEDEETTWSLPGAVVGFISWLFALAMPMLIYGSNTLFFFIYTWPFFLALMPVAVVVGIALHSLMDGKLRYSIVFTLVTVGIMFGALFMWLLG
>CP033401.1|AYQ04092.1|4620409_4620721_+|cell-division-protein-FtsB
MGKLTLLLLAILVWLQYSLWFGKNGIHDYTRVNDDVAAQQATNAKLKARNDQLFAEIDDLNGGQEALEERARNELSMTRPGETFYRLVPDASKRAQSAGQNNR
>CP033401.1|AYQ04093.1|4620739_4621450_+|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase
MATTHLDVCAVVPAAGFGRRMQTECPKQYLSIGNQTILEHSVHALLAHPRVKRVVIAISPGDSRFAQLPLANHPQITVVDGGDERADSVLAGLKAAGDAQWVLVHDAARPCLHQDDLARLLALSETSRTGGILAAPVRDTMKRAEPGKNAIAHTVDRNGLWHALTPQFFPRELLHDCLTRALNEGATITDEASALEYCGFHPQLVEGRADNIKVTRPEDLALAEFYLTRTIHQENT
>CP033401.1|AYQ04094.1|4621449_4621929_+|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase
MRIGHGFDVHAFGGEGPIIIGGVRIPYERGLLAHSDGDVALHALTDALLGAAALGDIGKLFPDTDPAFKGADSRELLREAWRRIQAKGYTLGNVDVTIIAQAPKMLPHIPQMRVFIAEDLGCHMDDVNVKATTTEKLGFTGRGEGIACEAVALLIKATK
>CP033401.1|AYQ04095.1|4621925_4622975_+|tRNA-pseudouridine(13)-synthase-TruD
MIEFDNLTYLHGKPQGTGLLKANPEDFVVVEDLGFEPDGEGEHILVRILKNGCNTRFVADALAKFLKIHAREVSFAGQKDKHAVTEQWLCARVPGKEMPDLSAFQLEGCQVLEYARHKRKLRLGALKGNAFTLVLREVSNRDDVEQRLIDICVKGVPNYFGAQRFGIGGSNLQGAQRWAQTNTPVRDRNKRSFWLSAARSALFNQIVAERLKKADVNQVVDGDALQLAGRGSWFVATTEELAELQRRVNDKELMITAALPGSGEWGTQREALAFEQAAVAAETELQALLVREKVEAARRAMLLYPQQLSWNWWDDVTVEIRFWLPAGSFATSVVRELINTTGDYAHIAE
>CP033401.1|AYQ04096.1|4622955_4623717_+|5'/3'-nucleotidase-SurE
MRILLSNDDGVHAPGIQTLAKALREFADVQVVAPDRNRSGASNSLTLESSLRTFTFENGDIAVQMGTPTDCVYLGVNALMRPRPDIVVSGINAGPNLGDDVIYSGTVAAAMEGRHLGFPALAVSLDGHKHYDTAAAVICSILRALCKEPLRTGRILNINVPDLPLDQIKGIRVTRCGTRHPADQVIPQQDPRGNTLYWIGPPGGKCDAGPGTDFAAVDEGYVSITPLHVDLTAHSAQDVVSDWLNSVGVGTQW

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
CP033401_3	3.1\|1680692\|40\|CP033401\|CRISPRCasFinder	1680692-1680731	40	NZ_CP041417	Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence	47951-47990	0	1.0
CP033401_6	6.1\|2711110\|42\|CP033401\|PILER-CR	2711110-2711151	42	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	141085-141126	0	1.0
CP033401_6	6.2\|2711169\|40\|CP033401\|PILER-CR	2711169-2711208	40	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	141028-141067	1	0.975
CP033401_2	2.1\|976060\|38\|CP033401\|CRISPRCasFinder	976060-976097	38	NZ_CP043437	Enterobacter sp. LU1 plasmid unnamed	113727-113764	2	0.947
CP033401_5	5.1\|2497699\|48\|CP033401\|CRISPRCasFinder	2497699-2497746	48	NZ_CP053606	Escherichia coli strain NEB_Turbo plasmid F', complete sequence	4089-4136	3	0.938
CP033401_5	5.1\|2497699\|48\|CP033401\|CRISPRCasFinder	2497699-2497746	48	NZ_CP053608	Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence	4088-4135	3	0.938
CP033401_5	5.1\|2497699\|48\|CP033401\|CRISPRCasFinder	2497699-2497746	48	NZ_CP014271	Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence	4088-4135	3	0.938
CP033401_5	5.1\|2497699\|48\|CP033401\|CRISPRCasFinder	2497699-2497746	48	NZ_CP014273	Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence	4088-4135	3	0.938
CP033401_7	7.1\|4174173\|42\|CP033401\|CRISPRCasFinder	4174173-4174214	42	NZ_CP010208	Escherichia coli strain M11 plasmid B, complete sequence	30214-30255	7	0.833
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_MG299151	Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence	51276-51307	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_KY471628	Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence	45716-45747	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_MG299131	Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence	51276-51307	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_KY471629	Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence	45716-45747	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_MG299133	Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence	51276-51307	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_MG299128	Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence	51276-51307	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_MG299147	Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence	51276-51307	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NC_018995	Escherichia coli plasmid pHUSEC41-1, complete sequence	29015-29046	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_CP053235	Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence	78292-78323	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_CP005999	Escherichia coli B7A plasmid pEB1, complete sequence	39563-39594	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	KU932021	Escherichia coli plasmid pEC3I, complete sequence	51902-51933	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_CP024154	Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence	18560-18591	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NC_011754	Escherichia coli ED1a plasmid pECOED, complete sequence	49240-49271	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_CP015141	Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence	81434-81465	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_LR213460	Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3	28916-28947	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_MH287044	Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence	36182-36213	7	0.781
CP033401_9	9.6\|4592446\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592446-4592477	32	NZ_MH618673	Escherichia coli strain 838B plasmid p838B-R, complete sequence	32230-32261	7	0.781
CP033401_10	10.1\|4614982\|31\|CP033401\|CRISPRCasFinder	4614982-4615012	31	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	62682-62712	7	0.774
CP033401_10	10.1\|4614982\|31\|CP033401\|CRISPRCasFinder	4614982-4615012	31	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1222106-1222136	7	0.774
CP033401_10	10.1\|4614982\|31\|CP033401\|CRISPRCasFinder	4614982-4615012	31	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2467672-2467702	7	0.774
CP033401_10	10.4\|4615165\|31\|CP033401\|CRISPRCasFinder	4615165-4615195	31	NZ_CP034185	Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence	17977-18007	7	0.774
CP033401_10	10.7\|4615348\|31\|CP033401\|CRISPRCasFinder	4615348-4615378	31	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	530641-530671	7	0.774
CP033401_7	7.1\|4174173\|42\|CP033401\|CRISPRCasFinder	4174173-4174214	42	NZ_CP048307	Escherichia coli strain 9 plasmid p009_C, complete sequence	24899-24940	8	0.81
CP033401_9	9.5\|4592385\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592385-4592416	32	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1417960-1417991	8	0.75
CP033401_10	10.4\|4615165\|31\|CP033401\|CRISPRCasFinder	4615165-4615195	31	NZ_CP017753	Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence	97498-97528	8	0.742
CP033401_10	10.7\|4615348\|31\|CP033401\|CRISPRCasFinder	4615348-4615378	31	NZ_CP036297	Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence	14953-14983	8	0.742
CP033401_10	10.7\|4615348\|31\|CP033401\|CRISPRCasFinder	4615348-4615378	31	NZ_CP036288	Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence	14983-15013	8	0.742
CP033401_10	10.7\|4615348\|31\|CP033401\|CRISPRCasFinder	4615348-4615378	31	NZ_CP015882	Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence	3454-3484	8	0.742
CP033401_10	10.7\|4615348\|31\|CP033401\|CRISPRCasFinder	4615348-4615378	31	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	148992-149022	8	0.742
CP033401_10	10.10\|4614982\|32\|CP033401\|PILER-CR,CRT	4614982-4615013	32	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	62682-62713	8	0.75
CP033401_10	10.10\|4614982\|32\|CP033401\|PILER-CR,CRT	4614982-4615013	32	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1222106-1222137	8	0.75
CP033401_10	10.10\|4614982\|32\|CP033401\|PILER-CR,CRT	4614982-4615013	32	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2467671-2467702	8	0.75
CP033401_10	10.10\|4614982\|32\|CP033401\|PILER-CR,CRT	4614982-4615013	32	NC_008759	Polaromonas naphthalenivorans CJ2 plasmid pPNAP03, complete sequence	12670-12701	8	0.75
CP033401_10	10.13\|4615165\|32\|CP033401\|PILER-CR,CRT	4615165-4615196	32	NZ_CP034185	Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence	17977-18008	8	0.75
CP033401_10	10.13\|4615165\|32\|CP033401\|PILER-CR,CRT	4615165-4615196	32	NZ_CP017753	Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence	97497-97528	8	0.75
CP033401_10	10.16\|4615348\|32\|CP033401\|PILER-CR,CRT	4615348-4615379	32	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	148991-149022	8	0.75
CP033401_10	10.16\|4615348\|32\|CP033401\|PILER-CR,CRT	4615348-4615379	32	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	530640-530671	8	0.75
CP033401_10	10.17\|4615409\|32\|CP033401\|PILER-CR,CRT	4615409-4615440	32	NZ_CP006991	Rhizobium sp. IE4771 plasmid pRetIE4771e, complete sequence	532343-532374	8	0.75
CP033401_7	7.1\|4174173\|42\|CP033401\|CRISPRCasFinder	4174173-4174214	42	NZ_CP048307	Escherichia coli strain 9 plasmid p009_C, complete sequence	24786-24827	9	0.786
CP033401_10	10.1\|4614982\|31\|CP033401\|CRISPRCasFinder	4614982-4615012	31	NC_011987	Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence	86182-86212	9	0.71
CP033401_10	10.2\|4615043\|31\|CP033401\|CRISPRCasFinder	4615043-4615073	31	CP011075	Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence	244686-244716	9	0.71
CP033401_10	10.2\|4615043\|31\|CP033401\|CRISPRCasFinder	4615043-4615073	31	GU075905	Prochlorococcus phage P-HM2, complete genome	78536-78566	9	0.71
CP033401_10	10.4\|4615165\|31\|CP033401\|CRISPRCasFinder	4615165-4615195	31	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	405875-405905	9	0.71
CP033401_10	10.4\|4615165\|31\|CP033401\|CRISPRCasFinder	4615165-4615195	31	NZ_AP022593	Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence	2248363-2248393	9	0.71
CP033401_10	10.8\|4615409\|31\|CP033401\|CRISPRCasFinder	4615409-4615439	31	NZ_CP040723	Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence	35740-35770	9	0.71
CP033401_10	10.13\|4615165\|32\|CP033401\|PILER-CR,CRT	4615165-4615196	32	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	405875-405906	9	0.719
CP033401_10	10.16\|4615348\|32\|CP033401\|PILER-CR,CRT	4615348-4615379	32	NZ_CP036297	Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence	14953-14984	9	0.719
CP033401_10	10.16\|4615348\|32\|CP033401\|PILER-CR,CRT	4615348-4615379	32	NZ_CP036288	Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence	14983-15014	9	0.719
CP033401_10	10.16\|4615348\|32\|CP033401\|PILER-CR,CRT	4615348-4615379	32	NZ_CP015882	Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence	3454-3485	9	0.719
CP033401_10	10.17\|4615409\|32\|CP033401\|PILER-CR,CRT	4615409-4615440	32	NZ_CP040723	Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence	35740-35771	9	0.719
CP033401_9	9.1\|4592141\|32\|CP033401\|PILER-CR,CRISPRCasFinder,CRT	4592141-4592172	32	NZ_CP030933	Enterococcus gilvus strain CR1 plasmid pCR1A, complete sequence	51062-51093	10	0.688
CP033401_10	10.10\|4614982\|32\|CP033401\|PILER-CR,CRT	4614982-4615013	32	NC_011987	Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence	86181-86212	10	0.688
CP033401_10	10.11\|4615043\|32\|CP033401\|PILER-CR,CRT	4615043-4615074	32	CP011075	Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence	244686-244717	10	0.688
CP033401_10	10.11\|4615043\|32\|CP033401\|PILER-CR,CRT	4615043-4615074	32	GU075905	Prochlorococcus phage P-HM2, complete genome	78536-78567	10	0.688
CP033401_10	10.13\|4615165\|32\|CP033401\|PILER-CR,CRT	4615165-4615196	32	NZ_AP022593	Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence	2248362-2248393	10	0.688

1. spacer 3.1|1680692|40|CP033401|CRISPRCasFinder matches to NZ_CP041417 (Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence) position: , mismatch: 0, identity: 1.0

gcgctgcgggtcattcttgaaattacccccgctgtgctgt	CRISPR spacer
gcgctgcgggtcattcttgaaattacccccgctgtgctgt	Protospacer
****************************************

2. spacer 6.1|2711110|42|CP033401|PILER-CR matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 0, identity: 1.0

tgtcacacgcagataaatccaactttcaatattgttaagttc	CRISPR spacer
tgtcacacgcagataaatccaactttcaatattgttaagttc	Protospacer
******************************************

3. spacer 6.2|2711169|40|CP033401|PILER-CR matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 1, identity: 0.975

catggcgtagcaaaaagaaattttcaatattgctttatgg	CRISPR spacer
catggcgtagaaaaaagaaattttcaatattgctttatgg	Protospacer
********** *****************************

4. spacer 2.1|976060|38|CP033401|CRISPRCasFinder matches to NZ_CP043437 (Enterobacter sp. LU1 plasmid unnamed) position: , mismatch: 2, identity: 0.947

cggacgcaggatggtgcgttcaattggactcgaaccaa	CRISPR spacer
cagacgcagaatggtgcgttcaattggactcgaaccaa	Protospacer
*.*******.****************************

5. spacer 5.1|2497699|48|CP033401|CRISPRCasFinder matches to NZ_CP053606 (Escherichia coli strain NEB_Turbo plasmid F', complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

6. spacer 5.1|2497699|48|CP033401|CRISPRCasFinder matches to NZ_CP053608 (Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

7. spacer 5.1|2497699|48|CP033401|CRISPRCasFinder matches to NZ_CP014271 (Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

8. spacer 5.1|2497699|48|CP033401|CRISPRCasFinder matches to NZ_CP014273 (Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

9. spacer 7.1|4174173|42|CP033401|CRISPRCasFinder matches to NZ_CP010208 (Escherichia coli strain M11 plasmid B, complete sequence) position: , mismatch: 7, identity: 0.833

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
acaaatgccggatgcggcgtaaacgccttatctggcctacgc	Protospacer
***.  *.****************.*********.******.

10. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299151 (Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

11. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_KY471628 (Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

12. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299131 (Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

13. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_KY471629 (Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

14. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299133 (Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

15. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299128 (Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

16. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299147 (Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

17. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NC_018995 (Escherichia coli plasmid pHUSEC41-1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

18. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP053235 (Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

19. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP005999 (Escherichia coli B7A plasmid pEB1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

20. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to KU932021 (Escherichia coli plasmid pEC3I, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

21. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024154 (Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

22. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NC_011754 (Escherichia coli ED1a plasmid pECOED, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

23. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP015141 (Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

24. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LR213460 (Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

25. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MH287044 (Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

26. spacer 9.6|4592446|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MH618673 (Escherichia coli strain 838B plasmid p838B-R, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

27. spacer 10.1|4614982|31|CP033401|CRISPRCasFinder matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
tccctatcgcaatgccggcagcatccgcaat	Protospacer
*. *.  ****** **** ************

28. spacer 10.1|4614982|31|CP033401|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatc	Protospacer
**** ************ ***** *  ** .

29. spacer 10.1|4614982|31|CP033401|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatc	Protospacer
**** ************ ***** *  ** .

30. spacer 10.4|4615165|31|CP033401|CRISPRCasFinder matches to NZ_CP034185 (Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.774

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
agcgtcaccgacgcgcagggccgctaccaac	Protospacer
  **************** * *******.

31. spacer 10.7|4615348|31|CP033401|CRISPRCasFinder matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.774

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
ccgaacaggtggcgaagcaggtgatgggcca	Protospacer
******.* **************.. ***

32. spacer 7.1|4174173|42|CP033401|CRISPRCasFinder matches to NZ_CP048307 (Escherichia coli strain 9 plasmid p009_C, complete sequence) position: , mismatch: 8, identity: 0.81

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
attgatgtcggatgcggcgtaaacgccttatccgacctacaa	Protospacer
*. *  ******************.*******.*******.

33. spacer 9.5|4592385|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.75

tcaacgcgctcagacgttgcgtgagtgaacca	CRISPR spacer
acaacgcggtcggacgttgcgtgattaccccg	Protospacer
 ******* **.************ *.  **.

34. spacer 10.4|4615165|31|CP033401|CRISPRCasFinder matches to NZ_CP017753 (Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.742

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
gacgtcaccgacgcgcagtcgcgcttcttca	Protospacer
  ***************** ***** *. ..

35. spacer 10.7|4615348|31|CP033401|CRISPRCasFinder matches to NZ_CP036297 (Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgt	Protospacer
   ..*.******** ********** ****

36. spacer 10.7|4615348|31|CP033401|CRISPRCasFinder matches to NZ_CP036288 (Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgt	Protospacer
   ..*.******** ********** ****

37. spacer 10.7|4615348|31|CP033401|CRISPRCasFinder matches to NZ_CP015882 (Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
ttgcgcagctggcgcagcaggtggctgccga	Protospacer
..* .*.******* ************ **

38. spacer 10.7|4615348|31|CP033401|CRISPRCasFinder matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
gggtacggctggcgaaggaggcggctgcgga	Protospacer
  * ************* ***.*****  *

39. spacer 10.10|4614982|32|CP033401|PILER-CR,CRT matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
tccctatcgcaatgccggcagcatccgcaatc	Protospacer
*. *.  ****** **** ************.

40. spacer 10.10|4614982|32|CP033401|PILER-CR,CRT matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatca	Protospacer
**** ************ ***** *  ** .

41. spacer 10.10|4614982|32|CP033401|PILER-CR,CRT matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatca	Protospacer
**** ************ ***** *  ** .

42. spacer 10.10|4614982|32|CP033401|PILER-CR,CRT matches to NC_008759 (Polaromonas naphthalenivorans CJ2 plasmid pPNAP03, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcg-----caattccgggagcatccgcaatt	CRISPR spacer
-----cgtgaaactcatttccgggagcatccgcattt	Protospacer
     **.*     ** ***************** **

43. spacer 10.13|4615165|32|CP033401|PILER-CR,CRT matches to NZ_CP034185 (Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
agcgtcaccgacgcgcagggccgctaccaact	Protospacer
  **************** * *******.

44. spacer 10.13|4615165|32|CP033401|PILER-CR,CRT matches to NZ_CP017753 (Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
gacgtcaccgacgcgcagtcgcgcttcttcaa	Protospacer
  ***************** ***** *. ..*

45. spacer 10.16|4615348|32|CP033401|PILER-CR,CRT matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
gggtacggctggcgaaggaggcggctgcggaa	Protospacer
  * ************* ***.*****  * *

46. spacer 10.16|4615348|32|CP033401|PILER-CR,CRT matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.75

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
ccgaacaggtggcgaagcaggtgatgggccag	Protospacer
******.* **************.. ***  .

47. spacer 10.17|4615409|32|CP033401|PILER-CR,CRT matches to NZ_CP006991 (Rhizobium sp. IE4771 plasmid pRetIE4771e, complete sequence) position: , mismatch: 8, identity: 0.75

gtttaccgccccgcagaggcgctggcagatcc	CRISPR spacer
catcatcctcccgcagatgcgctggccgatcc	Protospacer
  *.*.* .******** ******** *****

48. spacer 7.1|4174173|42|CP033401|CRISPRCasFinder matches to NZ_CP048307 (Escherichia coli strain 9 plasmid p009_C, complete sequence) position: , mismatch: 9, identity: 0.786

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
gttgatgtcggatgcggcgtaaacgccttatccgacctacaa	Protospacer
.. *  ******************.*******.*******.

49. spacer 10.1|4614982|31|CP033401|CRISPRCasFinder matches to NC_011987 (Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence) position: , mismatch: 9, identity: 0.71

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
gctaccgcgcaattcgaggagcatccgctgg	Protospacer
 .  *********** .*********** .

50. spacer 10.2|4615043|31|CP033401|CRISPRCasFinder matches to CP011075 (Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.71

acggacaaaatatatattgatttgcgaatta	CRISPR spacer
tgaggcaaaatatagattgatttccgaaaat	Protospacer
  .*.********* ******** ****

51. spacer 10.2|4615043|31|CP033401|CRISPRCasFinder matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 9, identity: 0.71

acggacaaaatatatattgatttgcgaatta	CRISPR spacer
acggaaaaattatatattgattttacttctg	Protospacer
***** *** *************     .*.

52. spacer 10.4|4615165|31|CP033401|CRISPRCasFinder matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.71

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
gacgtcactgacgcgcagtcgcgcttcttca	Protospacer
  ******.********** ***** *. ..

53. spacer 10.4|4615165|31|CP033401|CRISPRCasFinder matches to NZ_AP022593 (Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence) position: , mismatch: 9, identity: 0.71

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
gacatcaccgacgcccagtggcgcgacgtcc	Protospacer
  *.********** ********* **  .

54. spacer 10.8|4615409|31|CP033401|CRISPRCasFinder matches to NZ_CP040723 (Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.71

gtttaccgccccgcagaggcgctggcagatc	CRISPR spacer
cgagaccgcctcgccgaggcgctggcagcga	Protospacer
    ******.*** *************

55. spacer 10.13|4615165|32|CP033401|PILER-CR,CRT matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.719

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
gacgtcactgacgcgcagtcgcgcttcttcaa	Protospacer
  ******.********** ***** *. ..*

56. spacer 10.16|4615348|32|CP033401|PILER-CR,CRT matches to NZ_CP036297 (Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgtg	Protospacer
   ..*.******** ********** ****.

57. spacer 10.16|4615348|32|CP033401|PILER-CR,CRT matches to NZ_CP036288 (Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgtg	Protospacer
   ..*.******** ********** ****.

58. spacer 10.16|4615348|32|CP033401|PILER-CR,CRT matches to NZ_CP015882 (Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
ttgcgcagctggcgcagcaggtggctgccgag	Protospacer
..* .*.******* ************ ** .

59. spacer 10.17|4615409|32|CP033401|PILER-CR,CRT matches to NZ_CP040723 (Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.719

gtttaccgccccgcagaggcgctggcagatcc	CRISPR spacer
cgagaccgcctcgccgaggcgctggcagcgac	Protospacer
    ******.*** *************   *

60. spacer 9.1|4592141|32|CP033401|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP030933 (Enterococcus gilvus strain CR1 plasmid pCR1A, complete sequence) position: , mismatch: 10, identity: 0.688

tccacgctgtaacggccatcattaagtttagt	CRISPR spacer
ccgctgctgtgacgcccatcattaagttactc	Protospacer
.*  .*****.*** *************   .

61. spacer 10.10|4614982|32|CP033401|PILER-CR,CRT matches to NC_011987 (Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence) position: , mismatch: 10, identity: 0.688

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
gctaccgcgcaattcgaggagcatccgctggg	Protospacer
 .  *********** .*********** .

62. spacer 10.11|4615043|32|CP033401|PILER-CR,CRT matches to CP011075 (Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

acggacaaaatatatattgatttgcgaattat	CRISPR spacer
tgaggcaaaatatagattgatttccgaaaata	Protospacer
  .*.********* ******** ****

63. spacer 10.11|4615043|32|CP033401|PILER-CR,CRT matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 10, identity: 0.688

acggacaaaatatatattgatttgcgaattat	CRISPR spacer
acggaaaaattatatattgattttacttctgg	Protospacer
***** *** *************     .*.

64. spacer 10.13|4615165|32|CP033401|PILER-CR,CRT matches to NZ_AP022593 (Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence) position: , mismatch: 10, identity: 0.688

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
gacatcaccgacgcccagtggcgcgacgtccc	Protospacer
  *.********** ********* **  .

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

499447 : 508889

Enterobacteria_phage(85.71%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AYQ00480.1\|499447_500374_+	ABC transporter ATP-binding protein	G3M9Y6	Bacillus_virus	1.7e-23	30.8
AYQ00481.1\|500378_501110_+	ABC transporter permease	NA	NA	NA	NA
AYQ00482.1\|501090_501198_-	protein YohO	NA	NA	NA	NA
AYQ00483.1\|501257_501989_-	transcriptional regulator	Q9EYF2	Enterobacteria_phage	9.7e-112	99.5
AYQ00484.1\|502210_503896_+	sensor histidine kinase	Q9EYF3	Enterobacteria_phage	2.5e-304	99.6
AYQ00485.1\|503892_504612_+	DNA-binding response regulator	NA	NA	NA	NA
AYQ00486.1\|504658_505129_+	DUF1456 family protein	Q9EYF4	Enterobacteria_phage	1.8e-82	100.0
AYQ00487.1\|505169_505631_-	DUF1307 domain-containing protein	Q9EYF5	Enterobacteria_phage	1.9e-76	100.0
AYQ00488.1\|505755_507756_-	hypothetical protein	Q9EYF6	Enterobacteria_phage	0.0e+00	96.3
AYQ00489.1\|507752_508889_-	VWA domain-containing protein	Q9EYF7	Enterobacteria_phage	3.2e-162	97.4

DBSCAN-SWA_2

1470551 : 1481329

Enterobacteria_phage(40.0%)

integrase

attL 1468524:1468547|attR 1480032:1480055

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1468524:1468547	attL	NA	NA	NA	NA
AYQ01339.1\|1470551_1472507_-	AAA family ATPase	K4I1H4	Acidithiobacillus_phage	7.5e-26	28.6
AYQ01340.1\|1474871_1475411_-	regulator	M9NZI6	Enterobacteria_phage	7.5e-61	65.6
AYQ01341.1\|1475593_1475905_+	recombinase	A0A0N7KZJ3	Stx2-converting_phage	2.4e-43	100.0
AYQ01342.1\|1475901_1476582_+	exonuclease	A0A0P0ZCD4	Stx2-converting_phage	5.1e-131	98.7
AYQ01343.1\|1476578_1476737_+	DUF1317 family protein	M1FJ61	Enterobacteria_phage	6.4e-21	88.5
AYQ01344.1\|1476733_1477798_+	DGQHR domain-containing protein	T1SBJ4	Salmonella_phage	1.7e-133	64.8
AYQ01345.1\|1477951_1478170_+	TraR/DksA family transcriptional regulator	M1FQT7	Enterobacteria_phage	3.2e-34	94.4
AYQ01346.1\|1478217_1478457_+	DUF4222 domain-containing protein	M1FPC8	Enterobacteria_phage	3.9e-38	94.9
AYQ01347.1\|1478596_1478833_+	excisionase	NA	NA	NA	NA
AYQ01348.1\|1478822_1479965_+\|integrase	integrase	O21929	Phage_21	8.1e-206	99.7
AYQ01349.1\|1480078_1481329_-	NADP-dependent isocitrate dehydrogenase	Q77Z09	Phage_21	3.8e-23	100.0
1480032:1480055	attR	NA	NA	NA	NA

DBSCAN-SWA_3

1610136 : 1654789

Stx2-converting_phage(33.33%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AYQ01473.1\|1610136_1610595_-\|transposase	IS200/IS605 family transposase	I4AZI8	Saccharomonospora_phage	5.5e-12	31.5
AYQ01474.1\|1611323_1612469_-	class C beta-lactamase CMY-2	NA	NA	NA	NA
AYQ01475.1\|1612792_1614055_-\|transposase	IS1380 family transposase ISEc9	A0A1B0VDR3	Salmonella_phage	1.3e-39	100.0
AYQ01476.1\|1614320_1615649_-\|transposase	IS4-like element IS4 family transposase	NA	NA	NA	NA
AYQ01477.1\|1615880_1616060_-	hypothetical protein	NA	NA	NA	NA
AYQ01478.1\|1616022_1616199_-	DUF3927 domain-containing protein	NA	NA	NA	NA
AYQ01479.1\|1616442_1617225_-	AAA family ATPase	A0A2L1IVB6	Escherichia_phage	1.7e-138	99.2
AYQ01480.1\|1618257_1618401_-	chemotaxis protein	NA	NA	NA	NA
AYQ01481.1\|1618954_1620493_-\|transposase	IS66-like element ISEc8 family transposase	A0A0P0ZBS5	Stx2-converting_phage	2.1e-297	99.2
AYQ01482.1\|1620542_1620890_-	IS66 family insertion sequence hypothetical protein	A0A0P0ZBY2	Stx2-converting_phage	1.1e-60	99.1
AYQ04273.1\|1620886_1621267_-	IS66 family insertion sequence hypothetical protein	A0A0P0ZBP6	Stx2-converting_phage	1.2e-65	99.2
AYQ01483.1\|1621721_1622735_-	DUF4432 domain-containing protein	NA	NA	NA	NA
AYQ01484.1\|1622746_1624063_-	L-fucose:H+ symporter permease	NA	NA	NA	NA
AYQ01485.1\|1624090_1625011_-	ribokinase	NA	NA	NA	NA
AYQ01486.1\|1625316_1626099_+	DeoR family transcriptional regulator	NA	NA	NA	NA
AYQ01487.1\|1626100_1626199_-	acetolactate synthase	NA	NA	NA	NA
AYQ04274.1\|1626326_1626527_-	hypothetical protein	NA	NA	NA	NA
AYQ01488.1\|1626811_1628040_-\|transposase	IS3 family transposase	Q9ZXG3	Shigella_phage	2.7e-170	96.0
AYQ01489.1\|1628216_1628456_+	hypothetical protein	NA	NA	NA	NA
AYQ01490.1\|1628642_1629278_+	galactonate dehydratase	NA	NA	NA	NA
AYQ01491.1\|1629359_1629797_+	hypothetical protein	NA	NA	NA	NA
AYQ01492.1\|1629859_1630684_-	DeoR family transcriptional regulator	NA	NA	NA	NA
AYQ04275.1\|1630932_1631271_+	aldolase	NA	NA	NA	NA
AYQ01493.1\|1631384_1632956_+	PTS maltose transporter subunit IICB	NA	NA	NA	NA
AYQ01494.1\|1632967_1634143_+	putative C-S lyase	NA	NA	NA	NA
AYQ01495.1\|1634156_1636046_+	enterotoxin	NA	NA	NA	NA
AYQ04276.1\|1636214_1636421_-	methyltransferase	NA	NA	NA	NA
AYQ01496.1\|1636525_1637962_-	hypothetical protein	NA	NA	NA	NA
AYQ04277.1\|1637958_1642917_-	nuclease	NA	NA	NA	NA
AYQ01497.1\|1643591_1644155_-	inovirus Gp2 family protein	NA	NA	NA	NA
AYQ01498.1\|1644975_1646409_-	DUF3987 domain-containing protein	NA	NA	NA	NA
AYQ01499.1\|1646627_1646825_-	DUF3987 domain-containing protein	NA	NA	NA	NA
AYQ01500.1\|1647069_1647366_-	AlpA family transcriptional regulator	NA	NA	NA	NA
AYQ01501.1\|1648477_1650295_+	hypothetical protein	NA	NA	NA	NA
AYQ01502.1\|1650481_1651684_-	DUF4102 domain-containing protein	A0A1B0VMI6	Pseudomonas_phage	2.9e-44	34.4
AYQ01503.1\|1652050_1653037_-	hypothetical protein	NA	NA	NA	NA
AYQ01504.1\|1653033_1653525_-	ACP S-malonyltransferase	NA	NA	NA	NA
AYQ01505.1\|1653627_1654789_+\|transposase	IS3-like element IS3 family transposase	A0A0P0I4A4	Acinetobacter_phage	3.1e-51	40.6

DBSCAN-SWA_4

1868468 : 1878562

Salmonella_phage(90.0%)

transposase,integrase

attL 1868138:1868151|attR 1878604:1878617

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1868138:1868151	attL	NA	NA	NA	NA
AYQ04285.1\|1868468_1868657_-	hypothetical protein	A0A1S6L006	Salmonella_phage	2.0e-24	95.2
AYQ01682.1\|1868815_1871209_-	replication endonuclease	E5G6L9	Salmonella_phage	0.0e+00	93.7
AYQ01683.1\|1871205_1872063_-	DNA adenine methylase	E5G6L8	Salmonella_phage	9.5e-159	95.8
AYQ01684.1\|1872059_1872287_-	TraR/DksA family transcriptional regulator	E5G6L7	Salmonella_phage	7.8e-36	98.7
AYQ01685.1\|1872286_1872520_-	DUF2732 family protein	E5G6L6	Salmonella_phage	1.9e-32	97.4
AYQ01686.1\|1872587_1872929_-	hypothetical protein	E5G6L5	Salmonella_phage	1.7e-55	98.2
AYQ01687.1\|1873046_1873343_-	DUF2724 domain-containing protein	E5G6L4	Salmonella_phage	1.9e-21	88.5
AYQ01688.1\|1873350_1873860_-	phage regulatory CII family protein	E5G6L3	Salmonella_phage	1.3e-86	98.2
AYQ01689.1\|1873892_1874114_-	regulator	NA	NA	NA	NA
AYQ01690.1\|1874259_1875138_+	phage repressor protein CI	A0A1S6KZZ7	Salmonella_phage	1.7e-30	39.4
AYQ01691.1\|1875149_1876094_+	hypothetical protein	NA	NA	NA	NA
AYQ01692.1\|1876214_1877435_+\|transposase	ISL3-like element ISKox3 family transposase	NA	NA	NA	NA
AYQ01693.1\|1877509_1878562_+\|integrase	site-specific integrase	A0A218M4I3	Erwinia_phage	1.4e-106	57.0
1878604:1878617	attR	NA	NA	NA	NA

DBSCAN-SWA_5

1958145 : 1985349

Enterobacteria_phage(47.06%)

lysis,tail,integrase,capsid,terminase

attL 1960061:1960075|attR 1985423:1985437

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AYQ01762.1\|1958145_1959435_+	adenosylmethionine--8-amino-7-oxononanoate transaminase	A0A1V0SKB7	Klosneuvirus	3.4e-19	27.1
AYQ01763.1\|1959493_1959970_+	kinase inhibitor	NA	NA	NA	NA
1960061:1960075	attL	NA	NA	NA	NA
AYQ01764.1\|1960715_1962047_+	GGDEF domain-containing protein	A0A127AWB9	Bacillus_phage	1.4e-20	37.1
AYQ01765.1\|1962120_1962297_-\|tail	phage tail protein	K7PMH7	Enterobacteria_phage	9.4e-21	84.5
AYQ01766.1\|1962446_1963115_+	class I SAM-dependent methyltransferase	NA	NA	NA	NA
AYQ01767.1\|1963059_1963197_-\|capsid	nucleocapsid protein	NA	NA	NA	NA
AYQ01768.1\|1964005_1964566_-\|terminase	terminase small subunit	A0A0K2FIG2	Enterobacteria_phage	4.9e-87	98.8
AYQ01769.1\|1964954_1965188_+	DUF3950 domain-containing protein	A0A0K2FIR8	Escherichia_phage	7.3e-21	94.4
AYQ01770.1\|1965244_1965655_+	DUF1398 domain-containing protein	C6ZCX4	Enterobacteria_phage	1.3e-52	76.3
AYQ01771.1\|1966006_1966159_-	hypothetical protein	K7PKL2	Enterobacteria_phage	3.1e-20	96.0
AYQ01772.1\|1966187_1966394_-	hypothetical protein	H6WRZ6	Salmonella_phage	5.3e-31	98.5
AYQ01773.1\|1966610_1967108_-	lysozyme	A0A1B5FP97	Escherichia_phage	1.6e-89	97.0
AYQ01774.1\|1967107_1967323_-\|lysis	lysis protein S	A5LH82	Enterobacteria_phage	1.2e-33	98.6
AYQ01775.1\|1967510_1968098_-	helix-turn-helix domain-containing protein	NA	NA	NA	NA
AYQ01776.1\|1968106_1968241_-	AraC family transcriptional regulator	NA	NA	NA	NA
AYQ01777.1\|1968592_1969552_-	DUF523 and DUF1722 domain-containing protein	NA	NA	NA	NA
AYQ01778.1\|1969744_1970269_+	hypothetical protein	A0A1W6JNX6	Morganella_phage	1.1e-48	54.1
AYQ01779.1\|1970424_1970802_-	antitermination protein	Q777W5	Enterobacteria_phage	7.3e-55	84.2
AYQ01780.1\|1970887_1971028_-	YlcG family protein	K7PHH3	Enterobacteria_phage	5.5e-08	67.4
AYQ01781.1\|1971024_1971387_-	crossover junction endodeoxyribonuclease RusA	K7PM48	Enterobacteria_phage	1.5e-60	97.4
AYQ01782.1\|1971383_1971674_-	DUF1364 domain-containing protein	K7PGZ6	Enterobacteria_phage	4.8e-46	91.7
AYQ01783.1\|1971666_1971837_-	hypothetical protein	K7P7K0	Enterobacteria_phage	2.4e-13	69.8
AYQ01784.1\|1971836_1972292_-	hypothetical protein	I6PD71	Cronobacter_phage	5.9e-59	66.2
AYQ01785.1\|1972288_1972390_-	hypothetical protein	NA	NA	NA	NA
AYQ01786.1\|1972482_1972935_-	hypothetical protein	NA	NA	NA	NA
AYQ01787.1\|1972931_1973492_-	UDP-N-acetylglucosamine acyltransferase	NA	NA	NA	NA
AYQ01788.1\|1973748_1973940_+	hypothetical protein	NA	NA	NA	NA
AYQ01789.1\|1973976_1974270_-	protein ren	A0A0N6WES4	Escherichia_phage	1.1e-42	95.7
AYQ01790.1\|1974266_1974968_-	Replication protein P	K7P6G2	Enterobacteria_phage	3.8e-129	99.6
AYQ04291.1\|1974964_1975894_-	Replication protein O	A0A0M5M7Y1	Salmonella_phage	1.2e-109	63.4
AYQ01791.1\|1975980_1976520_-	regulator	M9NZI6	Enterobacteria_phage	2.0e-61	66.1
AYQ01792.1\|1976589_1976820_-	helix-turn-helix domain-containing protein	A0A2H4FNF3	Salmonella_phage	1.5e-21	68.0
AYQ04292.1\|1976924_1977614_+	helix-turn-helix transcriptional regulator	Q76H56	Enterobacteria_phage	2.8e-92	75.0
AYQ01793.1\|1977736_1978486_+	hypothetical protein	NA	NA	NA	NA
AYQ01794.1\|1978482_1979310_+	DUF3037 domain-containing protein	NA	NA	NA	NA
AYQ01795.1\|1979818_1980025_+	cell division inhibitor protein	K7P6H3	Enterobacteria_phage	3.2e-28	85.3
AYQ01796.1\|1980100_1980397_+	host-nuclease inhibitor protein Gam	A0A1I9LJN1	Stx_converting_phage	1.6e-49	100.0
AYQ01797.1\|1980402_1981188_+	phage recombination protein Bet	A0A1I9LJN0	Stx_converting_phage	6.3e-149	100.0
AYQ01798.1\|1981184_1981865_+	exonuclease	A0A0P0ZCD4	Stx2-converting_phage	3.0e-131	98.7
AYQ01799.1\|1981861_1982044_+	DUF1317 family protein	A0A0N7CHV0	Escherichia_phage	2.2e-28	98.3
AYQ01800.1\|1982016_1982208_+	DUF1382 family protein	A0A0P0ZC67	Stx2-converting_phage	2.8e-26	98.4
AYQ01801.1\|1982218_1982500_+	cell division protein ZapA	A0A0P0ZE02	Stx2-converting_phage	2.5e-47	100.0
AYQ01802.1\|1982598_1982820_+	TraR/DksA family transcriptional regulator	A0A0N7C211	Escherichia_phage	1.4e-34	97.3
AYQ01803.1\|1983030_1983633_-	hypothetical protein	NA	NA	NA	NA
AYQ01804.1\|1983757_1983943_-	hypothetical protein	NA	NA	NA	NA
AYQ01805.1\|1983875_1984043_+	hypothetical protein	A5VWB7	Enterobacteria_phage	2.9e-27	98.2
AYQ01806.1\|1984082_1984301_+	excisionase	Q77WA4	Escherichia_phage	3.7e-35	100.0
AYQ01807.1\|1984278_1985349_+\|integrase	integrase	Q9MCR4	Enterobacteria_phage	1.9e-201	99.7
1985423:1985437	attR	NA	NA	NA	NA

DBSCAN-SWA_6

2472839 : 2488527

Shigella_phage(33.33%)

tail,integrase

attL 2469943:2470002|attR 2484612:2484671

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
2469943:2470002	attL	NA	NA	NA	NA
AYQ02226.1\|2472839_2473613_+	hypothetical protein	G9IA57	Pseudomonas_phage	4.1e-36	37.7
AYQ04305.1\|2473682_2473811_-\|tail	phage tail protein	K7PMH7	Enterobacteria_phage	1.7e-11	84.6
AYQ02227.1\|2473865_2477009_-	GntR family transcriptional regulator	K7PGT9	Enterobacteria_phage	9.3e-260	57.4
AYQ02228.1\|2476998_2477178_-	DUF4222 domain-containing protein	S5M7S5	Escherichia_phage	7.8e-15	68.5
AYQ04306.1\|2477353_2477911_-	protein YmfL	S5FXP0	Shigella_phage	1.5e-96	96.2
AYQ02229.1\|2477948_2478149_-	cell division protein	NA	NA	NA	NA
AYQ02230.1\|2478246_2478873_+	LexA family transcriptional regulator	K7PM82	Enterobacteria_phage	2.5e-47	48.8
AYQ04307.1\|2479103_2479601_-	hypothetical protein	NA	NA	NA	NA
AYQ02231.1\|2480094_2480457_+	hypothetical protein	Q8SBF8	Shigella_phage	8.6e-61	100.0
AYQ02232.1\|2480522_2481347_+	DUF2303 family protein	U5P439	Shigella_phage	6.0e-150	99.6
AYQ02233.1\|2481474_2482011_+	HD family hydrolase	S5MW55	Escherichia_phage	2.0e-98	98.3
AYQ02234.1\|2482001_2482880_+	hypothetical protein	A0A2R2Z314	Escherichia_phage	5.3e-165	92.4
AYQ02235.1\|2482876_2483221_+	DNA-binding protein	U5P0J0	Shigella_phage	2.0e-30	80.7
AYQ02236.1\|2483447_2484611_+\|integrase	integrase	U5P434	Shigella_phage	2.4e-229	100.0
AYQ02237.1\|2484815_2486069_-	glutamate-5-semialdehyde dehydrogenase	A0A1X9I5D4	Streptococcus_phage	1.7e-95	47.0
2484612:2484671	attR	NA	NA	NA	NA
AYQ02238.1\|2486080_2487184_-	glutamate 5-kinase	A0A1X9I5D0	Streptococcus_phage	1.1e-61	40.4
AYQ02239.1\|2487471_2488527_+	phosphoporin PhoE	Q1MVN1	Enterobacteria_phage	7.7e-118	60.9

DBSCAN-SWA_7

2874406 : 2880965

uncultured_Caudovirales_phage(16.67%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AYQ02563.1\|2874406_2875363_+	iron-dicitrate ABC transporter permease FecD	A0A2H4IY97	uncultured_Caudovirales_phage	1.1e-17	26.1
AYQ02564.1\|2875363_2876131_+	iron-dicitrate ABC transporter ATP-binding subunit	G3M9Y6	Bacillus_virus	5.4e-12	24.3
AYQ02565.1\|2876688_2876946_-	hypothetical protein	NA	NA	NA	NA
AYQ02566.1\|2877997_2879149_+\|transposase	IS30-like element IS30 family transposase	W5R8L2	Staphylococcus_phage	2.6e-42	36.0
AYQ02567.1\|2879068_2879419_-\|transposase	transposase	Q716C1	Shigella_phage	8.9e-39	97.7
AYQ02568.1\|2879519_2880092_+	hypothetical protein	Q858R9	Enterobacteria_phage	2.2e-71	69.0
AYQ02569.1\|2880140_2880965_-	hypothetical protein	L7TR00	Rhizobium_phage	3.0e-16	35.5

DBSCAN-SWA_8

3297668 : 3316187

Escherichia_virus(30.0%)

tail,lysis,integrase

attL 3297511:3297557|attR 3313399:3313445

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
3297511:3297557	attL	NA	NA	NA	NA
AYQ04335.1\|3297668_3297923_-	DNA-binding transcriptional regulator	M1SNR2	Escherichia_phage	1.3e-44	100.0
AYQ02920.1\|3299134_3300034_-	hypothetical protein	Q7Y4D2	Escherichia_virus	4.0e-168	99.7
AYQ02921.1\|3300249_3300777_-\|tail	tail fiber assembly protein	A0A0C4UR05	Shigella_phage	5.1e-86	88.6
AYQ02922.1\|3300778_3301780_-\|tail	phage tail protein	A0A0C4UQV0	Shigella_phage	1.2e-176	91.7
AYQ02923.1\|3302303_3303089_+	hypothetical protein	NA	NA	NA	NA
AYQ02924.1\|3303160_3303613_-	phage virion morphogenesis protein	A0A0F7LBV9	Escherichia_phage	5.3e-76	98.7
AYQ02925.1\|3303605_3304073_-\|tail	phage tail protein	Q7Y4E0	Escherichia_virus	1.9e-81	98.7
AYQ02926.1\|3304035_3304209_-\|lysis	phage lysis protein	Q7Y4E1	Escherichia_virus	2.3e-24	96.5
AYQ02927.1\|3304180_3304606_-\|lysis	LysB family phage lysis regulatory protein	Q858W0	Yersinia_virus	5.5e-67	98.6
AYQ02928.1\|3304593_3305019_-	protein lysA	A0A0F7LBP4	Escherichia_phage	3.4e-56	92.9
AYQ02929.1\|3306308_3307382_+	hypothetical protein	Q7Y4B3	Escherichia_virus	1.2e-203	100.0
AYQ02930.1\|3307374_3308412_+	hypothetical protein	Q7Y4B4	Escherichia_virus	4.6e-200	100.0
AYQ02931.1\|3308408_3309347_-	DNA cytosine methyltransferase	Q7Y4B5	Escherichia_virus	3.1e-187	100.0
AYQ02932.1\|3309589_3309796_-	hypothetical protein	Q2P9X3	Enterobacteria_phage	2.4e-31	97.0
AYQ02933.1\|3309795_3310248_-	DUF3850 domain-containing protein	Q2P9X4	Enterobacteria_phage	1.4e-79	96.7
AYQ02934.1\|3310844_3311345_-	replication protein B	M1SV55	Escherichia_phage	2.6e-92	100.0
AYQ02935.1\|3311514_3311787_-	hypothetical protein	Q1JS44	Enterobacteria_phage	1.5e-46	100.0
AYQ02936.1\|3311939_3312233_+	helix-turn-helix domain-containing protein	Q1JS45	Enterobacteria_phage	1.0e-48	100.0
AYQ02937.1\|3312302_3313283_+\|integrase	integrase	U5N0A8	Enterobacteria_phage	2.3e-185	99.7
AYQ04336.1\|3313468_3313969_-	periplasmic protein CpxP	NA	NA	NA	NA
3313399:3313445	attR	NA	NA	NA	NA
AYQ02938.1\|3314118_3314817_+	DNA-binding response regulator	Q6XM27	Feldmannia_irregularis_virus	5.3e-06	30.3
AYQ02939.1\|3314813_3316187_+	two-component sensor histidine kinase	W8CYF6	Bacillus_phage	3.8e-16	25.9

DBSCAN-SWA_9

4622955 : 4636138

Escherichia_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AYQ04096.1\|4622955_4623717_+	5'/3'-nucleotidase SurE	A0A1B1ITZ2	uncultured_Mediterranean_phage	2.0e-59	48.0
AYQ04097.1\|4623710_4624337_+	protein-L-isoaspartate O-methyltransferase	A0A1B1IU40	uncultured_Mediterranean_phage	5.7e-36	49.7
AYQ04098.1\|4624476_4625616_+	murein hydrolase activator NlpD	D7RWE0	Brochothrix_phage	1.7e-06	35.6
AYQ04099.1\|4625678_4626671_+	RNA polymerase sigma factor RpoS	G8CLC7	Synechococcus_phage	6.1e-32	37.6
AYQ04100.1\|4626764_4628129_-	GntP family transporter	NA	NA	NA	NA
AYQ04101.1\|4628217_4628994_-	HPr family phosphocarrier protein	NA	NA	NA	NA
AYQ04102.1\|4628998_4629637_-	aldolase	A0A077SK32	Escherichia_phage	1.4e-82	75.0
AYQ04103.1\|4629633_4630896_-	3-oxo-tetronate kinase	A0A077SLJ7	Escherichia_phage	1.3e-135	61.4
AYQ04104.1\|4630892_4631801_-	NAD(P)-dependent oxidoreductase	A0A077SLF7	Escherichia_phage	3.0e-118	76.9
AYQ04105.1\|4631996_4632764_+	DeoR/GlpR transcriptional regulator	A0A077SK06	Escherichia_phage	3.3e-70	56.7
AYQ04106.1\|4632814_4633471_-	protein-serine/threonine phosphatase	A0A222YWF0	Escherichia_phage	8.0e-49	46.3
AYQ04107.1\|4633576_4636138_-	DNA mismatch repair protein MutS	E3T5Q7	Cafeteria_roenbergensis_virus	1.7e-30	20.6

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

2. CP033400

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

13932 : 53228

Escherichia_phage(53.33%)

protease,integrase,transposase

attL 9584:9643|attR 27116:27675

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
9584:9643	attL	NA	NA	NA	NA
AYP99986.1\|13932_14946_+\|integrase	class 1 integron integrase IntI1	A0A1P8DJJ6	Virus_Rctr41k	1.0e-71	45.5
AYP99987.1\|15192_15402_+	hypothetical protein	NA	NA	NA	NA
AYP99988.1\|15347_16052_-\|transposase	IS6 family transposase IS15DIV	A0A077SL39	Escherichia_phage	1.8e-139	100.0
AYP99989.1\|16191_16956_+\|transposase	IS6-like element IS6100 family transposase	A0A077SL39	Escherichia_phage	4.3e-86	65.7
AYP99990.1\|17146_17503_-	hypothetical protein	NA	NA	NA	NA
AYP99991.1\|17448_18033_-	TetR/AcrR family transcriptional regulator	NA	NA	NA	NA
AYP99992.1\|18032_19271_-	MFS transporter	NA	NA	NA	NA
AYP99993.1\|19267_20173_-	Mph(A) family macrolide 2'-phosphotransferase	NA	NA	NA	NA
AYP99994.1\|20294_20999_-\|transposase	IS6 family transposase IS15DIV	A0A077SL39	Escherichia_phage	1.8e-139	100.0
AYP99995.1\|21035_22163_-	DUF3883 domain-containing protein	NA	NA	NA	NA
AYP99996.1\|22213_22459_-	hypothetical protein	NA	NA	NA	NA
AYP99997.1\|22464_22656_+	hypothetical protein	NA	NA	NA	NA
AYP99998.1\|23137_23680_-	tunicamycin resistance protein	NA	NA	NA	NA
AYP99999.1\|23692_24553_-	aminoglycoside N-acetyltransferase AAC(3)-IId	NA	NA	NA	NA
AYQ00001.1\|25767_26634_+\|transposase	IS4 family transposase	A4KWT9	Enterobacteria_phage	1.3e-163	100.0
AYQ00002.1\|26667_27372_-\|transposase	IS6 family transposase IS15DI	A0A077SL39	Escherichia_phage	1.2e-138	99.6
AYQ00003.1\|27809_28670_+	class A broad-spectrum beta-lactamase TEM-1	Q1MVP3	Enterobacteria_phage	4.6e-161	100.0
27116:27675	attR	NA	NA	NA	NA
AYQ00004.1\|28819_29245_+\|transposase	IS91 family transposase	NA	NA	NA	NA
AYQ00005.1\|29256_29961_+\|transposase	IS6 family transposase IS15DIV	A0A077SL39	Escherichia_phage	1.8e-139	100.0
AYQ00006.1\|30021_30858_-	aminoglycoside O-phosphotransferase APH(6)-Id	NA	NA	NA	NA
AYQ00007.1\|30857_31661_-	aminoglycoside O-phosphotransferase APH(3'')-Ib	NA	NA	NA	NA
AYQ00008.1\|31721_32537_-	sulfonamide-resistant dihydropteroate synthase Sul2	A0A0B5J4J5	Pandoravirus	3.5e-09	27.6
AYQ00009.1\|32844_33696_-	replication protein	NA	NA	NA	NA
AYQ00010.1\|34451_35156_-\|transposase	IS6 family transposase IS15DIV	A0A077SL39	Escherichia_phage	1.8e-139	100.0
AYQ00011.1\|36115_36757_-	MBL fold metallo-hydrolase	NA	NA	NA	NA
AYQ00012.1\|37329_37890_+	recombinase family protein	A0A1B0V7I5	Salmonella_phage	4.0e-49	86.2
AYQ00013.1\|40510_41371_-	class A broad-spectrum beta-lactamase TEM-1	Q1MVP3	Enterobacteria_phage	4.6e-161	100.0
AYQ00014.1\|41879_42584_+\|transposase	IS6 family transposase IS15DIV	A0A077SL39	Escherichia_phage	1.8e-139	100.0
AYQ00059.1\|43215_44046_-	oxacillin-hydrolyzing class D beta-lactamase OXA-1	NA	NA	NA	NA
AYQ00060.1\|44176_44731_-	fluoroquinolone-acetylating aminoglycoside 6'-N-acetyltransferase AAC(6')-Ib-cr5	NA	NA	NA	NA
AYQ00015.1\|44874_45579_-\|transposase	IS6 family transposase IS15DIV	A0A077SL39	Escherichia_phage	1.8e-139	100.0
AYQ00016.1\|48123_48456_-	mRNA interferase PemK	NA	NA	NA	NA
AYQ00017.1\|48457_48715_-	antitoxin PemI	NA	NA	NA	NA
AYQ00018.1\|48807_49461_-\|protease	CPBP family intramembrane metalloprotease	NA	NA	NA	NA
AYQ00019.1\|50400_51258_-	incFII family plasmid replication initiator RepA	NA	NA	NA	NA
AYQ00061.1\|51250_51325_-	RepA leader peptide Tap	NA	NA	NA	NA
AYQ00020.1\|51408_51546_+	replication protein RepA	NA	NA	NA	NA
AYQ00021.1\|51686_53228_+\|transposase	IS21-like element ISEc12 family transposase	K4I413	Acidithiobacillus_phage	1.7e-129	46.4

DBSCAN-SWA_2

83090 : 90520

Escherichia_phage(57.14%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AYQ00051.1\|83090_86207_-	HsdR family type I site-specific deoxyribonuclease	A0A220A398	Liberibacter_phage	2.9e-27	24.0
AYQ00052.1\|86328_87612_-	restriction endonuclease subunit S	F2Y1N5	Organic_Lake_phycodnavirus	2.2e-10	26.5
AYQ00065.1\|87608_89165_-	type I restriction-modification system subunit M	A0A2H4PQP4	Staphylococcus_phage	7.1e-104	42.5
AYQ00053.1\|89347_89569_+	type II toxin-antitoxin system Phd/YefM family antitoxin	A0A222YXU1	Escherichia_phage	6.7e-32	100.0
AYQ00054.1\|89568_89949_+	type II toxin-antitoxin system death-on-curing family toxin	A0A077SK56	Escherichia_phage	1.1e-63	100.0
AYQ00055.1\|89953_90133_+	PdcA protein	Q71TH5	Escherichia_phage	3.5e-23	96.6
AYQ00056.1\|90160_90520_+	pdcB	A0A077SLM1	Escherichia_phage	5.0e-45	98.9

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. CP033401

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. CP033400

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection