CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP043998	Clostridium diolis strain DSM 15410 chromosome, complete genome	8 crisprs	DEDDh,RT,cas3,csa3,DinG,WYL,cas6,csm2gr11,csm3gr7,csx10gr5,cas10,csx1	0	6	9	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP043998_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_1

350180-350262

Orphan

Consensus_repeat	Method
AGTAGGTGGAGAAATTACACCTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP043998_1

>merge|NZ_CP043998|1|350180-350262|CRISPRCasFinder
AGTAGGTGGAGAAATTACACCTAGTGTAAAAAATGCACCTAGTGGAGAAATCACTCCATCAGTAGGTGGAGAAATTACACCTA

>NZ_CP043998|1|1|350180-350262|CRISPRCasFinder
AGTAGGTGGAGAAATTACACCTA	GTGTAAAAAATGCACCTAGTGGAGAAATCACTCCATC
AGTAGGTGGAGAAATTACACCTA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_011967679.1\|342849_343326_+\|type-II-secretion-system-protein	unknown	unknown	gnl\|CDD\|225076
NZ_CP043998.1\|WP_039771194.1\|349245_349458_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|197775
NZ_CP043998.1\|WP_069187759.1\|355066_355390_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_167514402.1\|354711_354873_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039771183.1\|353926_354106_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_167514401.1\|352637_352781_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039771187.1\|352167_352479_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_017209826.1\|338626_340117_+\|4Fe-4S-dicluster-domain-containing-protein	unknown	unknown	gnl\|CDD\|274983
NZ_CP043998.1\|WP_023976022.1\|345327_346860_+\|glutamine-hydrolyzing-GMP-synthase	unknown	unknown	gnl\|CDD\|234614
NZ_CP043998.1\|WP_011967680.1\|343682_345140_+\|IMP-dehydrogenase	unknown	unknown	gnl\|CDD\|235507
NZ_CP043998.1\|WP_167514400.1\|351913_352072_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039771196.1\|346906_348070_-\|site-specific-integrase	unknown	unknown	gnl\|CDD\|271189
NZ_CP043998.1\|WP_084670531.1\|354399_354633_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|369825
NZ_CP043998.1\|WP_011967678.1\|340899_342525_+\|chaperonin-GroEL	unknown	unknown	gnl\|CDD\|234573
NZ_CP043998.1\|WP_008427174.1\|340523_340808_+\|co-chaperone-GroES	unknown	unknown	gnl\|CDD\|178988
NZ_CP043998.1\|WP_084670533.1\|355617_356298_+\|ORF6N-domain-containing-protein	unknown	unknown	gnl\|CDD\|378443
NZ_CP043998.1\|WP_051144814.1\|348121_349111_-\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|238045
NZ_CP043998.1\|WP_039771185.1\|352836_353730_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039771192.1\|349587_349791_+\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|378935
NZ_CP043998.1\|WP_039771189.1\|350610_351903_+\|DNA-helicase	unknown	unknown	gnl\|CDD\|274672

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_011967679.1\|342849_343326_+\|type-II-secretion-system-protein	gnl\|CDD\|225076	COG2165, PulG, Type II secretory pathway, pseudopilin PulG [Cell motility and secretion / Intracellular trafficking and secretion].	2.67308e-14
NZ_CP043998.1\|WP_039771194.1\|349245_349458_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|197775	smart00530, HTH_XRE, Helix-turn-helix XRE-family like proteins.	3.01426e-05
NZ_CP043998.1\|WP_017209826.1\|338626_340117_+\|4Fe-4S-dicluster-domain-containing-protein	gnl\|CDD\|274983	TIGR04105, hypothetical_protein, [FeFe] hydrogenase, group B1/B3. See for descriptions of different groups.	0
NZ_CP043998.1\|WP_023976022.1\|345327_346860_+\|glutamine-hydrolyzing-GMP-synthase	gnl\|CDD\|234614	PRK00074, guaA, GMP synthase; Reviewed.	0
NZ_CP043998.1\|WP_011967680.1\|343682_345140_+\|IMP-dehydrogenase	gnl\|CDD\|235507	PRK05567, PRK05567, inosine 5'-monophosphate dehydrogenase; Reviewed.	0
NZ_CP043998.1\|WP_084670533.1\|355617_356298_+\|ORF6N-domain-containing-protein	gnl\|CDD\|378443	pfam10543, ORF6N, ORF6N domain. This domain was identified by Iyer and colleagues.	9.94514e-14
NZ_CP043998.1\|WP_039771196.1\|346906_348070_-\|site-specific-integrase	gnl\|CDD\|271189	cd01189, INT_ICEBs1_C_like, C-terminal catalytic domain of integrases from bacterial phages and conjugate transposons. This family of tyrosine based site-specific integrases is has origins in bacterial phages and conjugate transposons. One member is the integrase from Bacillus subtilis conjugative transposon ICEBs1. ICEBs1 can be excised and transfered to various recipients in response to DNA damage or high concentrations of potential mating partners. The family belongs to the superfamily of DNA breaking-rejoining enzymes, which share the same fold in their catalytic domain and the overall reaction mechanism. The catalytic domain contains six conserved active site residues. Their overall reaction mechanism involves cleavage of a single strand of a DNA duplex by nucleophilic attack of a conserved tyrosine to give a 3' phosphotyrosyl protein-DNA adduct. In the second rejoining step, a terminal 5' hydroxyl attacks the covalent adduct to release the enzyme and generate duplex DNA.	9.91355e-44
NZ_CP043998.1\|WP_084670531.1\|354399_354633_+\|hypothetical-protein	gnl\|CDD\|369825	pfam08346, AntA, AntA/AntB antirepressor. In E. coli the two proteins AntA and AntB have 62% amino acid identities near their N termini. AntA appears to be encoded by a truncated and divergent copy of AntB. The two proteins are homologous to putative antirepressors found in numerous bacteriophages, such as the hypothetical antirepressor protein encoded by the gene LO142 of the bacteriophage 933W.	2.67567e-14
NZ_CP043998.1\|WP_011967678.1\|340899_342525_+\|chaperonin-GroEL	gnl\|CDD\|234573	PRK00013, groEL, chaperonin GroEL; Reviewed.	0
NZ_CP043998.1\|WP_008427174.1\|340523_340808_+\|co-chaperone-GroES	gnl\|CDD\|178988	PRK00364, groES, co-chaperonin GroES; Reviewed.	9.94035e-48
NZ_CP043998.1\|WP_051144814.1\|348121_349111_-\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	7.65463e-15
NZ_CP043998.1\|WP_039771192.1\|349587_349791_+\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|378935	pfam12728, HTH_17, Helix-turn-helix domain. This domain is a DNA-binding helix-turn-helix domain.	0.000268717
NZ_CP043998.1\|WP_039771189.1\|350610_351903_+\|DNA-helicase	gnl\|CDD\|274672	TIGR03600, phage_DnaB, phage replicative helicase, DnaB family, HK022 subfamily. Members of this family are phage (or prophage-region) homologs of the bacterial homohexameric replicative helicase DnaB. Some phage may rely on host DnaB, while others encode their own verions. This model describes the largest phage-specific clade among the close homologs of DnaB, but there are, or course, other DnaB homologs from phage that fall outside the scope of this model. [Mobile and extrachromosomal element functions, Prophage functions].	4.93443e-101

>NZ_CP043998.1|WP_039771192.1|349587_349791_+|helix-turn-helix-domain-containing-protein
MNKEKADYPIVLQTKDVMEIMGCSSTTAAQYIKIASAKLKEQGKIPPVDVVKNLRIPRDQFYFIYGI
>NZ_CP043998.1|WP_039771194.1|349245_349458_+|helix-turn-helix-transcriptional-regulator
MLKLDVKKLLLLQAKACLNTNELAKRASMPRTTITNIVHRKRNATPKSIGLLAKALGVDVSELLLNEKDN
>NZ_CP043998.1|WP_051144814.1|348121_349111_-|helix-turn-helix-domain-containing-protein
MPLSDKLKRIRKYRNLTQKELAEISEVTRESIGNYERGDRTPPADILKKIALALNVSVDALTSDDSFSSEVYSRAMQIAFKLASNSDEILRLLGNYADYNTLVAFNGESISRLPISSIKGLLRFIAANSLVEFNKIYEDLIKTDIYNLDSEFEDYCQQMYTKLNNPLNYINSDNKKFLESQGYIKDGHLSVDAIKLDKSNQKIKGVQIGNQITFLPESFDEIKNSVDKAFPILNAEVNFLSNPKLEMVFGYSYNDLAVAGYDNLLIMAIEKVIETTLSDIKEHEKNGDLFDGVSSWISKESPVYEILKETRKKNSDAINTLKKDSEDNN
>NZ_CP043998.1|WP_039771196.1|346906_348070_-|site-specific-integrase
MANENIKTDKKTGLYYFDVSLGFDPATGKRRRTTRRGFKKKKDAEQAYNDLKNQYYDGVLTYNQSTKFKNFIDEYLKWYKTQVRKTTFDNRASSIKKNIIEIFGEYKLEQITPIIVQKWQQQLLDNGKDQNYVRSLHIALSQILERAVNLDVIKTNPAKKAGNVKRKRKEVEFWTEDELNKVLDTMKLDDTLQYFGYVMIKFLFYTGLRFSEMQALQWSDFDDINKSISITKDLDYRNQNDWDFDDTKNSTSNRLVVLDDDTFDMLLKWQEYQKTLFEVKKDTFIFSYDNGIPTNKHFPGHVLTRHSKLADIKRIKPHALRHSHASFLISLDVNIIAIAKRLGHKDVQEVLKTYGHLYPKHQFDVAENINTHIQNKKSGVKLESNSN
>NZ_CP043998.1|WP_023976022.1|345327_346860_+|glutamine-hydrolyzing-GMP-synthase
MKRDLVLVVDFGGQYNQLIARRVRECGVYCEIIPYDYTIEKIKAKNPKGIIFTGGPNSVYGEDTPTVEKEVFELGVPVLGICYGDQLMAHLLGGKVATAPVREYGKTNVKLDKSSKLFEGIETDGIAWMSHTDYIEEAPKGFKVIATTEVCPVAAMENEEKRLYGVQFHAEVEHTQFGQKMLENFIHNICGLENSWSMGSFAEEKIKEIKELVGDKKVLCALSGGVDSSVAAMIVHKAIGHNLTCIFVDHGLLRKDEGDTVERVFKKEFDMNIKRVNVSDRFLGKLAGVSDPETKRKIIGEEFIRVFEEEAKKLGQIDYLVQGTIYPDIVESGTKTSATIKSHHNVGGLPEDMQFELIEPLRELFKDEVRAVGEELGIPHKLVWRQPFPGPGLAIRVLGEITEEKLEIVREADAIFREEIANANLDESIWQYFACLPNIRSVGVMGDERTYSHTIALRAVTSSDAMTSEWARIPYEILDLVSRRIVNEVKGVNRIVYDITSKPPATIEWE
>NZ_CP043998.1|WP_011967680.1|343682_345140_+|IMP-dehydrogenase
MGKIIKTAYTFDDVLLVPNKSDILPREVSTKTKITKTIELNIPLMSAGMDTVTESKMAIAVAREGGIGIIHKNMTIEEQAKEVDRVKRQENGVITDPIFLSQDHLIQDAENLMAQYRISGVPITTQDGKLIGIITNRDIIFETNYQRKISEVMTKDNLITASENTTVEEAKEILKKHKVEKLPLVDSEGRLKGLITMKDIEKVRKFPNAAKDKKGRLLCGAAVGVTGNMMERVDALVKAQVDVITLDTAHGHSKGVLDAVSQIKKVYPDLQVIAGNVATAEATEDLIKAGADCVKVGIGPGSICTTRVVAGVGVPQLTAVMDCAEVGKKYGVPIIADGGLKYSGDIVKALAAGASAAMMGSLFAGCEEAPGEMEIYQGRSYKVYRGMGSLAAMECGSKDRYFQEGNKKLVPEGVEGRVAYKGFVSDTIFQLLGGIKSGMGYLGAKNFEILYETANFVVQTASGQRESHPHDINITKEAPNYSVGQ
>NZ_CP043998.1|WP_011967679.1|342849_343326_+|type-II-secretion-system-protein
MISLYIKCKFRFKDSMSKKRFCKKRKREAFTLIEMIAVIAIIGILAVAILPKVNGYINEAKKVKVVDQCRKVIMAVESYNLKNDSPLSESTSVSSAISNKGISKYLDGVEFGNLNTSSTSLKNCYDVVNGAEFDFTENTDILNPTTIDNGSTKDDVKK
>NZ_CP043998.1|WP_011967678.1|340899_342525_+|chaperonin-GroEL
MAKMLKFGEDARRSMQIGVDKLADTVKVTLGPKGRNVVLDKKFGAPLITNDGVSIAREIELEDPYENMGAQLVKEVATKTNDVAGDGTTTATLLAQAIIREGLKNVTAGANPILIRTGIKMAVDKAVEEIQKISKQVDGKEDIARVAAISAADEEVGKLIADAMEKVGNEGVITIEESKSMGTELDVVEGMQFDRGYVSPYMATDTEKMEAVLENPYILITDKKISNIQEILPVLEQIVQSGKKLLIIAEDIEGEAMATLVVNKLRGTFTCVAVKAPGFGDRRKEMLQDIATLTGGTVIAEELGRELKDVTIDMLGTADSVKVSKENTVIVNGKGDSNAIKERINQIKAQIEETSSEFDKEKLQERLAKLAGGVAVIKVGAATETELKEKKLRIEDALAATKAAVEEGIVAGGGTAYVNVINEVAKLTSDVADTQIGINIIVKSLEEPVRQIATNAGVEGSVIIEKVKNSEPGIGYDALHGEYINMIKGGIVDPTKVTRSALQNAASVASTFLTTEAAVADIPAKETPMPGAPGMGMDGMY
>NZ_CP043998.1|WP_008427174.1|340523_340808_+|co-chaperone-GroES
MNIKPLGERVVIKKLEAEEKTKSGIVLTGTAKERPQEAEVVAVGPGAVVDGNRVAMEVKVGDKVLYSKYAGTEVKVDGEEYTILKQDDILAIVE
>NZ_CP043998.1|WP_017209826.1|338626_340117_+|4Fe-4S-dicluster-domain-containing-protein
MFQFENQLLALKHEVLTRVAVLAKENNISKEEIEKIPYAMIVGEEPKYRDSVERERNVVLERAKLAAGFKPTGKHGQDLVDIEEEKQILYVIKEACDRCPTKKFQVTDACRNCIAHKCQSACNFGAITYVDGRAYIDPDKCKECGMCKKACPYDAVAEDMRPCKKSCPTGALSYNAEDLSAEITESKCVNCGACMSACPFGAIEDKSSLVKVINRLMDKEEKIYAVVAPAITGQFGPKTTYGQVKNAIKALGFEDMVEAACGADAVTVHESNEFVERMENGDSYMTNSCCPGFLSYIEKMMPDQANKISGTVSPMVATGRYIKSKDKDAKVIFIGPCTAKKSEVLIESIKDAIDYALTFEELVALFDAFGVDPTTCEDIVVDGASIFGRNFAVGGGLTAAIENYVQEKGVNIDFKPVKISGGVEIKKTMTMAKVGKLQGNFIEGMMCEGGCINGAAKIVSVMKAKAPFTKLNQQTSTKSVLANTTLDEYNEINLER
>NZ_CP043998.1|WP_039771189.1|350610_351903_+|DNA-helicase
MQELDKVIESEREVLGNIIKDNSLLLKAIDALKEDDFYSGPHQLLYKTMKELYKQDNNFDAVILLNKLKDKIKENLITVTEISNISLCGIKSTFKSHLEAVIESSRQRKISKLMQNVANSEKSSEDKINYIQDELIKMNVETEEDKILTTKDLMRMAADKVQEAYETKGGITGVPTGINILDNATNGLERQDMIVLAARPSIGKTAIVLKILENIQGNALLVQLDMGLKAIGCRMLATDTNMENGRISRGRLDDDEWIEFTKSLNRLAQKDNLFFYSPSSATIGKIRTKAKQLKIKHGLDVIILDHIGKLKPEIKGSKYEQASDNSNKIKQVARELEVAFVALSQLSRAVEQRPDKHPILADLRDSGSIEEDADTIGMLYREGYYTAREKGERIRSDTLEVSFQKVRNGRLGTVKFHYDLETQKLLPLNE
>NZ_CP043998.1|WP_167514400.1|351913_352072_+|hypothetical-protein
MCEYKVIAIIKNIEKEYSNSSTPKELRITIGEILISKIKLGQSKNKKSDNHE
>NZ_CP043998.1|WP_039771187.1|352167_352479_+|hypothetical-protein
MRMEELRKLINNIIGNEFDHISEFKEKEDFDSNDTIKELSEKVNDVLDKLNELLPDQQDLIGELDDLYSNYCTNACKYYFREGVAAGTTNLKFLEETKIMHLV
>NZ_CP043998.1|WP_167514401.1|352637_352781_+|hypothetical-protein
MVKLQISYKTDEEKTKIIEILSAAAIVKKISRPRKSGQYYRVYLDIE
>NZ_CP043998.1|WP_039771185.1|352836_353730_+|hypothetical-protein
MERGKRKEINKLLDKLLKMELEGLRKRFMPYKRRPFLDCKVIIALDCKYKSNNALGYYINTQKDKMQHRYIHKIFITGASVENYFKASQYKKHKQFYKRCAIDELRRVIRHELMHAFVYEEFDSWYWSDIKNINSDYSPIFLSCLYWGGGSTGHNYAYKFLESELYSKIEKCFKYDHVRTILLNYMFEFERIVGNINRNQNEHNVMGLKISFNDKGAGFKKLSYIKAYVKYKEDGEFKKGVTQTMTLGIGFLVTPPKLLENYKRIFDNGAIANAHIEEVLYVDKEENFKNPVIIFEK
>NZ_CP043998.1|WP_039771183.1|353926_354106_+|hypothetical-protein
MIYFPDQEEPITLTREEYPDLPFKKVYIRNPHKVREGLAKYYEYMIEKFGDGRISISRK
>NZ_CP043998.1|WP_084670531.1|354399_354633_+|hypothetical-protein
MIRKKVSNGGPQRKRRTTAKKLYDFLELNPTHYSKWIKRNILENDFAIENEDYEVLAIECENPQGGRPSQDYKLSAI
>NZ_CP043998.1|WP_167514402.1|354711_354873_+|hypothetical-protein
MEEDFVYDGVTMKCLNPEAIPIFKKNLAKLILKLSKIDIDEEASETNFSHYED
>NZ_CP043998.1|WP_069187759.1|355066_355390_+|hypothetical-protein
MEKTLITRKGLCERWGLSYNTICNYESNGTLTRNPNFESPMYYMEEIIKIESLSEPNPLSPMERRSLENKVRDLKRMVDLLQEQLTKYTMINTESVSLLSIVQKCIK
>NZ_CP043998.1|WP_084670533.1|355617_356298_+|ORF6N-domain-containing-protein
MKNLIKINNHVLQIKEFNNQRVVTFKDIDLLHDRIEGTAKSNFYENKKHFIENEDYFIIPKSLKCEIPTLKVPNRGITVLTESGYLMLVKSLQDDLAWKVQRELVNNYFRIKNFVNVQKSINEIKVQLETQFNEMVQVKINEIESKCSNYYRPSSLEKSNISRYIKQRLGILKADEEYESVKQRVLLKLGANKWEDVPIETLKDSLNIIDESIRVVKLDRPQQYSM

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043998_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_2

1316154-1316268

Orphan

Consensus_repeat	Method
CTGCAATTAGGATCTTTTCACCTATAAAAAGAG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP043998_2

>merge|NZ_CP043998|2|1316154-1316268|CRISPRCasFinder
CTGCAATTAGGATCTTTTCACCTATAAAAAGAGTAGCTATGCACTAATGAAAAGAGCAGCTACGCTGCAATACGGAACTTTTCTGCAATTAGGATCTTTTCGCCTATAAAAAGAG

>NZ_CP043998|2|2|1316154-1316268|CRISPRCasFinder
CTGCAATTAGGATCTTTTCACCTATAAAAAGAG	TAGCTATGCACTAATGAAAAGAGCAGCTACGCTGCAATACGGAACTTTT
CTGCAATTAGGATCTTTTCGCCTATAAAAAGAG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_011968448.1\|1320530_1320995_+\|transcriptional-repressor	unknown	unknown	gnl\|CDD\|223806
NZ_CP043998.1\|WP_023973364.1\|1313069_1313366_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|185594
NZ_CP043998.1\|WP_011968452.1\|1326897_1327542_+\|O-methyltransferase	unknown	unknown	gnl\|CDD\|226607
NZ_CP043998.1\|WP_011968446.1\|1319548_1319965_+\|Holliday-junction-resolvase-RuvX	unknown	unknown	gnl\|CDD\|234639
NZ_CP043998.1\|WP_039772328.1\|1316406_1319046_+\|alanine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234701
NZ_CP043998.1\|WP_011968453.1\|1327548_1328769_+\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|223896
NZ_CP043998.1\|WP_011968441.1\|1311591_1312668_+\|tRNA-2-thiouridine(34)-synthase-MnmA	unknown	unknown	gnl\|CDD\|234664
NZ_CP043998.1\|WP_039772330.1\|1314451_1315480_+\|AI-2E-family-transporter	unknown	unknown	gnl\|CDD\|223701
NZ_CP043998.1\|WP_039773935.1\|1305123_1306440_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_017210790.1\|1320166_1320445_+\|DUF1292-domain-containing-protein	unknown	unknown	gnl\|CDD\|184235
NZ_CP043998.1\|WP_011968443.1\|1313970_1314471_+\|photosystem-reaction-center-subunit-H	unknown	unknown	gnl\|CDD\|226398
NZ_CP043998.1\|WP_039772325.1\|1321358_1323026_+\|ribonuclease-J	unknown	unknown	gnl\|CDD\|223668
NZ_CP043998.1\|WP_039773936.1\|1306539_1307559_+\|N-acetylmuramoyl-L-alanine-amidase-family-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_039772333.1\|1309959_1311141_+\|cysteine-desulfurase-NifS	unknown	unknown	gnl\|CDD\|132443
NZ_CP043998.1\|WP_011968440.1\|1311142_1311580_+\|Fe-S-cluster-assembly-scaffold-protein-NifU	unknown	unknown	gnl\|CDD\|132460
NZ_CP043998.1\|WP_039772335.1\|1309504_1309957_+\|Rrf2-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|273242
NZ_CP043998.1\|WP_039772323.1\|1323425_1325252_+\|translational-GTPase-TypA	unknown	unknown	gnl\|CDD\|224138
NZ_CP043998.1\|WP_039772321.1\|1325360_1326386_+\|endolytic-transglycosylase-MltG	unknown	unknown	gnl\|CDD\|376862
NZ_CP043998.1\|WP_077868349.1\|1308137_1309382_+\|replication-associated-recombination-protein-A	unknown	unknown	gnl\|CDD\|237355
NZ_CP043998.1\|WP_008424959.1\|1319182_1319440_+\|IreB-family-regulatory-phosphoprotein	unknown	unknown	gnl\|CDD\|180108

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_011968448.1\|1320530_1320995_+\|transcriptional-repressor	gnl\|CDD\|223806	COG0735, Fur, Fe2+/Zn2+ uptake regulation proteins [Inorganic ion transport and metabolism].	4.85301e-46
NZ_CP043998.1\|WP_023973364.1\|1313069_1313366_+\|hypothetical-protein	gnl\|CDD\|185594	PTZ00395, PTZ00395, Sec24-related protein; Provisional.	0.000705818
NZ_CP043998.1\|WP_011968452.1\|1326897_1327542_+\|O-methyltransferase	gnl\|CDD\|226607	COG4122, COG4122, Predicted O-methyltransferase [General function prediction only].	5.28281e-72
NZ_CP043998.1\|WP_011968446.1\|1319548_1319965_+\|Holliday-junction-resolvase-RuvX	gnl\|CDD\|234639	PRK00109, PRK00109, Holliday junction resolvase RuvX.	1.02983e-63
NZ_CP043998.1\|WP_039772328.1\|1316406_1319046_+\|alanine--tRNA-ligase	gnl\|CDD\|234701	PRK00252, alaS, alanyl-tRNA synthetase; Reviewed.	0
NZ_CP043998.1\|WP_011968453.1\|1327548_1328769_+\|U32-family-peptidase	gnl\|CDD\|223896	COG0826, COG0826, Collagenase and related proteases [Posttranslational modification, protein turnover, chaperones].	1.61535e-150
NZ_CP043998.1\|WP_011968441.1\|1311591_1312668_+\|tRNA-2-thiouridine(34)-synthase-MnmA	gnl\|CDD\|234664	PRK00143, mnmA, tRNA-specific 2-thiouridylase MnmA; Reviewed.	0
NZ_CP043998.1\|WP_039772330.1\|1314451_1315480_+\|AI-2E-family-transporter	gnl\|CDD\|223701	COG0628, yhhT, Predicted permease, member of the PurR regulon [General function prediction only].	2.39569e-46
NZ_CP043998.1\|WP_017210790.1\|1320166_1320445_+\|DUF1292-domain-containing-protein	gnl\|CDD\|184235	PRK13678, PRK13678, hypothetical protein; Provisional.	3.82132e-07
NZ_CP043998.1\|WP_011968443.1\|1313970_1314471_+\|photosystem-reaction-center-subunit-H	gnl\|CDD\|226398	COG3881, COG3881, PRC-barrel domain containing protein [General function prediction only].	5.34276e-11
NZ_CP043998.1\|WP_039772325.1\|1321358_1323026_+\|ribonuclease-J	gnl\|CDD\|223668	COG0595, COG0595, mRNA degradation ribonucleases J1/J2 (metallo-beta-lactamase superfamily) [Translation, ribosomal structure and biogenesis; Replication, recombination and repair].	0
NZ_CP043998.1\|WP_039773936.1\|1306539_1307559_+\|N-acetylmuramoyl-L-alanine-amidase-family-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	1.1034e-39
NZ_CP043998.1\|WP_039772333.1\|1309959_1311141_+\|cysteine-desulfurase-NifS	gnl\|CDD\|132443	TIGR03402, Cysteine_desulfurase_NifS, cysteine desulfurase NifS. Members of this protein family are NifS, one of several related families of cysteine desulfurase involved in iron-sulfur (FeS) cluster biosynthesis. NifS is part of the NIF system, usually associated with other nif genes involved in nitrogenase expression and nitrogen fixation. The protein family is given a fairly broad interpretation here. It includes a clade nearly always found in extended nitrogen fixation genomic regions, plus a second clade more closely related to the first than to IscS and also part of NifS-like/NifU-like systems. This model does not extend to a more distantly clade found in the epsilon proteobacteria such as Helicobacter pylori, also named NifS in the literature, built instead in TIGR03403.	0
NZ_CP043998.1\|WP_011968440.1\|1311142_1311580_+\|Fe-S-cluster-assembly-scaffold-protein-NifU	gnl\|CDD\|132460	TIGR03419, NifU_clost, FeS cluster assembly scaffold protein NifU, Clostridium type. NifU and NifS form a pair of iron-sulfur (FeS) cluster biosynthesis proteins much simpler than the ISC and SUF systems. Members of this protein family are a distinct group of NifU-like proteins, found always to a NifS-like protein and restricted to species that lack a SUF system. Typically, NIF systems service a smaller number of FeS-containing proteins than do ISC or SUF. Members of this particular branch typically are found, almost half the time, near the mnmA gene, involved in the carboxymethylaminomethyl modification of U34 in some tRNAs (see GenProp0704). While other NifU proteins are associated with nitrogen fixation, this family is not. [Biosynthesis of cofactors, prosthetic groups, and carriers, Other].	1.36453e-84
NZ_CP043998.1\|WP_039772335.1\|1309504_1309957_+\|Rrf2-family-transcriptional-regulator	gnl\|CDD\|273242	TIGR00738, Putative_HTH-type_transcriptional_regulator, Rrf2 family protein. This model represents a superfamily of probable transcriptional regulators. One member, RRF2 of Desulfovibrio vulgaris is an apparent regulatory protein experimentally (MEDLINE:97293189). The N-terminal region appears related to the DNA-binding biotin repressor region of the BirA bifunctional according to results after three rounds of PSI-BLAST with a fairly high stringency. [Unknown function, General].	4.8336e-49
NZ_CP043998.1\|WP_039772323.1\|1323425_1325252_+\|translational-GTPase-TypA	gnl\|CDD\|224138	COG1217, TypA, Predicted membrane GTPase involved in stress response [Signal transduction mechanisms].	0
NZ_CP043998.1\|WP_039772321.1\|1325360_1326386_+\|endolytic-transglycosylase-MltG	gnl\|CDD\|376862	pfam02618, YceG, YceG-like family. This family of proteins is found in bacteria. Proteins in this family are typically between 332 and 389 amino acids in length. This family was previously incorrectly annotated and names as aminodeoxychorismate lyase. The structure of YceG was solved by X-ray crystallography.	1.52499e-102
NZ_CP043998.1\|WP_077868349.1\|1308137_1309382_+\|replication-associated-recombination-protein-A	gnl\|CDD\|237355	PRK13342, PRK13342, recombination factor protein RarA; Reviewed.	0
NZ_CP043998.1\|WP_008424959.1\|1319182_1319440_+\|IreB-family-regulatory-phosphoprotein	gnl\|CDD\|180108	PRK05473, IreB-like, IreB family regulatory phosphoprotein. IreB (EF1202) was characterized in Enterococcus faecalis as a small protein, well-conserved in the Firmicutes. It belongs to a system that includes the Ser/Thr protein kinase IreK, and phosphatase IreP, undergoes phosphorylation on threonine residues, and is involved in regulating cephalosporin resistance. This family was previously named DUF965 by Pfam model pfam06135.	3.26869e-48

>NZ_CP043998.1|WP_039772330.1|1314451_1315480_+|AI-2E-family-transporter
MQLRKHKKAILLGITLLCFICLILAYIFNKSINSIINIIVASFILAYTLTPIRDGFEAKFRISKKISSIVVILIIIGIITACIIVIVPTLFNEISNISNIFDNVSNLLEGMLKKNNLDDFSTTNVIYNEILEKGNAFWTNFSENAVENLMSIGDNAMSLAIIPIMVYYFLCDGNKIYSKMLLLLPTSKRGLTKKILSDIDRVLTRYITSQLMLSGLIGGLTLILLLLLKVKFPLWISILNAILNIIPYFGPIFGAVPAVIVALLDSPIKAFWVIVGMFIIQQLEGDILSPKITGDSTEMHPFVIIILLLIGDKFGGFVGMVLVVPIAVIIKVLYDDINYYLF
>NZ_CP043998.1|WP_011968443.1|1313970_1314471_+|photosystem-reaction-center-subunit-H
MFKTRDFYFKKVYNIKGKKIGIIEDLYIDFFWGKIVGFKVSNSHLFSKNNYIDMEDVIDIGEDVIIENIKKGEGLTFKEIKYMEVIDTLGNVKGVLEDIIIDIQDYSIKAIVISSGLVDKMIKGKQIILLNRCILGEEYILYTGNEGVMFKTLPHNMDRHNAIKKA
>NZ_CP043998.1|WP_023973364.1|1313069_1313366_+|hypothetical-protein
MDIFKALKRYDEHGFNSKGFHKNGTKYDEYGFGKRGMHRNGTYYNEEGYDREGYDKKGYDRNGFNSAGFDKEGYNKNGYNILGYDRGGEYLEVRYKWK
>NZ_CP043998.1|WP_011968441.1|1311591_1312668_+|tRNA-2-thiouridine(34)-synthase-MnmA
MKKKVLVGMSGGVDSSVAAYLLKQQGYDVIGATMQIWQHDEEFEEREGGCCSLSAVDDARRVCDKLDIPFYVLNFRDYFKEKVIDKFVQEYIDGKTPNPCIECNKHLKFDELLRRARGIGADYVATGHYAKIEKRDDRYLLIRSDDDRKDQTYALYNFTQDQLEHTLMPCGDYEKTKIREIAKEIGLAVHNKKDSEEICFISDNNHGKYISEAEPNRVKPGNFVDKSGNILGKHKGIVYYTIGQRKGLGLSLGRPVFVTNINAKTNEVVLGSEDDIFKTELIATDVNFIPFDKLEKEIEVTAKIRYSARPAEATLIPLPNGRVKVIFKEKQRAITKGQSVVFYDDEIVVGGGIIESII
>NZ_CP043998.1|WP_011968440.1|1311142_1311580_+|Fe-S-cluster-assembly-scaffold-protein-NifU
MIYSEKVMEHFQNPRNVGEIVDANGVGEVGNAKCGDIMKIYLKVEDNIIKDVKFKTFGCGSAIASSSMATELIKGKTLDEAWELTNKAVAEALDGLPPVKMHCSVLAEEAIHKAINDYRAKNGLEVIPMEEHSDEDLHAAVHGEE
>NZ_CP043998.1|WP_039772333.1|1309959_1311141_+|cysteine-desulfurase-NifS
MKNVYMDYSATTYVKPEVLEEMLPYFTEKFGNPSSFYGISRETKRAIDKAREQIAEALNCLPDEVYFTGGGSEADNWAIKGIASAHKNKGNHIITTKIEHHAVLHTCEYLEKNGFDVTYLDVDEEGFINLDDLRNAITDKTILVSIMFANNEIGTIQPIKEIGEICREKKVFFHTDAVQAVGNVPVDVKEMNIDMLSLAGHKIYGPKGIGVLYIKKGIKIDNLIHGGAQEKNRRAGTENIASIVGLGKALELATNNLEEHMKRLTALREKLIAGLLEVPYTKLNGPRGDKRLPGNVNVCFRFIEGESILLSLDFKGVCASSGSACTSGSLDPSHVLLAIGLPHEIAHGSLRLSMGEGSTEEDVDYVLEVVPPIIERLRNMSPLWDDFLKKGEN
>NZ_CP043998.1|WP_039772335.1|1309504_1309957_+|Rrf2-family-transcriptional-regulator
MKLSTKGRYGVRAMVDLASNYGGAPVSIKTISKRENLSEYYLEQLFSPLRRANMIRSIRGAQGGYVLCKPPKDITVGDIMTILEGPVEIADCIDGVECDSSDCCATKAVWEKIKRSIDDVMNSITLQDILDDYETIKNNKNNIKIVDRSE
>NZ_CP043998.1|WP_077868349.1|1308137_1309382_+|replication-associated-recombination-protein-A
MRPLADLMRPNKLEDFVGQQHILGQGKPLYNLIAGKNICNCIFYGPPGTGKTTLANIMANYVDKKFYKLNATVASVKDIQDITNNIDSLLNYNGVVLYIDELQHFNKKQQQALLEFIEDGRITLIASTTENPYFVIHKAIISRCNIFSFKPLTTGDIIVGLKRSIQKLIDEGIEIEYSDEALEYIGEISQGDYRKAYNILELAVNSQVKQVRVISSEYIESLGQSSMRADSSGDEFYNLLSALQKSIRGSDPNAAVHYLARLIKGGNLTAIIRRISVIAAEDIGLAFPNALSVVNSGIELSLKVGLPEARIILSEIVVYLATLPKSNSAYLAIDSAMSDLENINFGDVPMHLKDAHYSGAANLGVGGYKYPHDYPNHYVKQSYLPQELLGKIYYNEQNNKYEESLRKYWAEIKK
>NZ_CP043998.1|WP_039773936.1|1306539_1307559_+|N-acetylmuramoyl-L-alanine-amidase-family-protein
MKSLKLKKLVAVALVGLTVAALSPIGASAEWKQDSNGWWNTEGNSYSTGWRSINGNWYYFDSTGYMKTGWANDGGTWYYMQPSGEMKTGWINDGATWYYADPSGAMKTGWVNDSGTWYYLQSSGAMKTGWINDGGAWYFASASGAMQTGVVEVNGKVYYLAPNGAMATGNVTINGAVYTFAASGEATGDKIPTPTVAFSGNGAKVTPSTTGGNTGSTGSNGSSGGGGSNHSSGGSTTTFQGDINSKYADYAKVTINKNASDAKATFTVSFNKAADSTTGGDKDYVTQDILVTNANGTDEGIEYNNGEYTAPLGSIVYSTARVYRDGQVGYVTTKQTITK
>NZ_CP043998.1|WP_039773935.1|1305123_1306440_+|hypothetical-protein
MKNSSIKNVVLEILLMASIMLAVLSVFFKYVLLNEATYLNIFNESGTYRELKDYIYEKIDKVLSSKGINIDIKESIITEDDVKKEADNVVHELLEYLKTGENNVKPMDTSIYKQRVSDMLDSIMDNMIKPTSSDLSFNDKFQIENMGYTKSISQVNGISYIKPALKDGQGNIKVEQLMSKSEAEAKVKEILRQKGLTEEEAIEKATKKGITEEQALKMLKDYGITIDDYESGESNSSTEPENSNDDVTKSQDSNNQRSKEEASSSLNNEGQNAANNIQDGKNPKSKLDSIKGKLGDEASKSIDKEVEKMNFNKIIESNKVHKLALITSTIYKLFWLFIIMPIIIIGILIKVNANGLDSSLKYIGTAFFIAGLILVIVSSSIYHLKIYENINAIPVYLKDTVYNIAGYSLVGLVKYGATALATGILLFIPGVWKRVLNK
>NZ_CP043998.1|WP_039772328.1|1316406_1319046_+|alanine--tRNA-ligase
MKFMKTNDLREAYLKFFESKDHLRMDSFSLVPKNDKSLLLINAGMAPLKPYFTGLQEPPKRRITTCQKCIRTGDIENVGITSRHGTFFEMLGNFSFADYFKKEIIPWAWEFITEVLELPKDRLYVTIYLDDDEAYEYWTTLTDVDKTHIFRLGKEDNFWEHGAGPCGPCTEIHFNRSEEIPTNADEFVKLADEDKIIEFWNLVFTQFDGDGKGNYEKLANTNIDTGMGLERLATIMQEKNSIFEIDTLENILSEVAKLANVKYGENQKTDISLRLITDHIRSITFMISDDVMPSNEGRGYVLRRLLRRAARHGKTLGIKEAFLCNLCDTVIRDSSEAYPELNSKKEYIKKVIKIEEDKFRETLDSGMEILNGFISELKAKNEKVLSGVDGFKLYDTFGFPMELTKEILEDEGLALDEEAFHEEMKVQRERARSARKVSNYMGTDVKTLDIIPGEIETVFDGYDNDTLNAEVKVLIEGEDFTDAITEGNKAIIVTDVTPLYAEMGGQIGDTGVIFNDGFKANVLDTKKNIGGKIVHFVEVVSGELKVGDTVTIEVDKVRRENIKKNHTATHLLDKALTEVLGSHVHQAGSYVSNDRLRFDFSHFEAMTEEEISRVEDLVNEAITSVTPVVTEVMDLQEAKNSGAIGIFDDKYADKVRVVSAGEYSKELCGGTHIDNTGKIGLFKIISESGIAAGTRRIEAVIGKEAYKIVNEKKDLLKEISTKLKCSEKELLAKLDQQVKELKEKDKEITALKSKFASMGIDDIVSSSRNVKDINVISYELKDVDSDTLRDVCEKVRDKAPNSIVLLMSANAGKVIICAMATKDAVAKGAHCGKLIKEISSMLGGGGGGRPDMAQAGGKMPEKIQEAIEESYKIVETLAK
>NZ_CP043998.1|WP_008424959.1|1319182_1319440_+|IreB-family-regulatory-phosphoprotein
MSNNIEHTMQFDLSKNKEALTKTILTEVYNSLQEKGYNPINQLVGYLISGDPTYITNYNGARALVRKLERDDILEEVIKSYLEIK
>NZ_CP043998.1|WP_011968446.1|1319548_1319965_+|Holliday-junction-resolvase-RuvX
MRILGLDLGSKTIGVAVSDPLGFTAQGLTTVRRTNKEKDIAEIKKFCDEYDAKVIVIGLPKNMNGTIGPSGEIAMAFGKVIEEELNVEVKFWDERLTTVAAHKAMLEADLSRNKRKKIVDKVASTYILQGYLDMISRK
>NZ_CP043998.1|WP_017210790.1|1320166_1320445_+|DUF1292-domain-containing-protein
MDKEAKYVYIPDQEGNDVKFEVVIYFEIEKLKGQYIIATPAFEETDEAYAFKIFKDEDGSDIFIALEDDDEEFEMVLETYETLMNEDGLIEE
>NZ_CP043998.1|WP_011968448.1|1320530_1320995_+|transcriptional-repressor
MDASNLIDMNALKEDLKKKGYKLTPQRRSIVDTIIENEGQHLTAEEIYDSVKKSCPEIGLATVYRTILLLEELGVISRLDLNDGCSRYEIVHSNETHRHHHLICNICHKVLEVQDDLLEDLESGIEKQYKFKILDHSLKFFGVCDECQKKLSDE
>NZ_CP043998.1|WP_039772325.1|1321358_1323026_+|ribonuclease-J
MKNERAKIKIIPLGGINEIGKNITAIEYKEDIIIIDCGLKFPDDDMFGIDIVIPDVSYLIKNSEKIKGIFLTHGHEDHIGALPYVLRQLNVPVYGTKLTLGIVETKLKEHGLLASTELVRVKPKDIIKLDSVSVEFIKTNHSIADSVAIAVHTPLGVVLHTGDFKIDYTPIDGEMMDFGRLAELGRKGVLVLMADSTNVERPGYTMTEKVVGETFLRLFSKAKGRLIVATFASNVHRIQQIITAAEAYEKKVAVSGRSMENIVQVAIELGYLTVGKDVLVPVDQISKYPNEKIVVITTGSQGEPMSALARMAASEHRKINVIPGDTVIISATPIPGNEKFVSKVINQLFKKGAQVIYDSQEKIHVSGHACQEELKLMQALVKPKFFVPVHGEYRHLKKHGELAMEVGLSEKNLLIPENGDVIEVARNYIKKNGTVVSGQVFVDGLGVGDVGNIVLRDRKHLSQDGILTIVVTIEKQTGRVVSGPDIISRGFVYVRESEGLMDEAREIVKSVLKTCEEKQITDWATLKSKMRDQLREYLYEKTKRKPMILPIIMEF
>NZ_CP043998.1|WP_039772323.1|1323425_1325252_+|translational-GTPase-TypA
MELIKREDIRNIAIIAHVDHGKTTLVDALLKQSHTFRANEKVEERVMDSNDLEKERGITILSKNTAVIYNDIKINIVDTPGHADFGGEVERVLKMVDSVLLVVDSYEGPMPQTKFVLKKSLELGLKPIVIINKIDKPNARPTDVIDEVFDLFVELGANDEQLDFQIIYASAREGFAKYNVDDQNNDMTPIFDTILKYVAPPEGYMDEPLQMLVSTLDTNAFVGKIAIGKIHRGTVKRNQTVALLKNDGSSANYKITSIFTYKGLKREEAEEASMGDIVAVSGVIDANIGDTIADSSSPEALPFLEIDEPTLNMNFMVNDSPFAGQEGEFVTSRHLRDRLMKELETNVSLRVKELTPDCFEVSGRGELHLSVLIETMRREGYEFQVSKANVIFREVDGHKEEPIEYLTIDVPEEFMGPVMEKLGPRKAEMVNMTSAVNGYTRLEFTVPARGLIGFRSELMTDTKGNGIMNHVFHSYEKYKGDIPGRSRGSIVSFEAGDSIAYGLYSAQERGQLFIGAGVPVYGGMIVGVSARAEDLEINVCKMKKLTNTRSSGADDALKLTPPVEMSLEQCLEFINADELVEVTPKNIRMRKRVLDSAERRRMISRNKK
>NZ_CP043998.1|WP_039772321.1|1325360_1326386_+|endolytic-transglycosylase-MltG
MNKYKSFRKLILLIILFLFVITLTFVISYSSTIRKPLKSTEDSIIIEVKQGEGFYDILDKLDKENKLTNKLLIKVNQAIDKRKVNLTEGIYEINTNSSLEELIKSLENKDGDKDLVKLTIPEGYSIEDIAKSVEDKGICSKDEFIKDVKDYKLPSFVKNNNKKRYNLEGYLYPDTYLIEKGSNANDVIKSMLDRFEDVLKQAEDETKVEISDEDVEKIVTIASMIEREARVPGDRPLISSVIYNRLEKDMKLQIDAAVIYALGYHVDVVLNKHLEVDSPYNVYKYKGLPVGPIANPGLDCIKAALLPEKTDYLYYIMKDDGSHYFTNNYEDFLNKKKELGY
>NZ_CP043998.1|WP_011968452.1|1326897_1327542_+|O-methyltransferase
MSEITYDYMEEYIRSLIPEREGTLKEIEAFARANGVPIVQKETGVFLEFMTSMKKPKRILELGTAIGFSSILMYQAAGTEPEIVTIERDEKMIELANINLKKFNLDHKIKIEEGDCLEILEKLNEPFDLIFMDAGKGHYNHFLPHCLRLLNPDGVIVADNVLFRGMVASQELVKRRKITIVKRMRTYLELVTQDENLITSVIPMGDGIAVTKRR
>NZ_CP043998.1|WP_011968453.1|1327548_1328769_+|U32-family-peptidase
MIRPEILAPAGNLDKLKIAIDFGADAVYLGGSKLNLRAFADNFTNEQLKEGVEYAHDRNRKVYVTMNVFPHNADLGGVEDYIKELYETGVDAIIASDPAIISAAREVAPNLEIHLSTQANNVNWRAAKFWYEQGVKRIVMARELSLTEIKEMRDNLPEECEIEAFVHGSMCISYSGRCLISNYMVGRDANRGACAQACRFKYHLVEEKRPNEFYPVVEDENGTYIMNSKDLCMIEHIDDVIKAGVYSLKIEGRMKSLYYVAAVVKSYRQAVDAYMKDPDNYKFDPKWMENLNKVSHRVYHTGFYYGQSGEQVYEDSAYIRHADIIGIVRAYDEETKIATIEQKNKVLNGDTVEVLRPEGDNFEVVLHDMTEENGTPIESANRAKMIYKVRVDIPLKEKDLIVKDKE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043998_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_3

3575113-3575534

TypeIII

II-B

Consensus_repeat	Method
ATTCAAATACATCTCATGTTGAAGTTAATC	CRISPRCasFinder

6 spacers

cas3,cas6,csm2gr11,csm3gr7,csx10gr5,cas10,csx1

The CRISPR arrays of NZ_CP043998_3

>merge|NZ_CP043998|3|3575113-3575534|CRISPRCasFinder
ATTTAAATACATCTTATGTTAAAGTTAATCAATTCAAGTCCAAGATGGAGAAAAGCAAAAAACTAAGTTTAAATACATCATATGTTAATGTTAATCGTGGTTAAACTTTCAAAACTTTGCTAAATGGTTTGAAATTAAATACATCTCATGTTGAAATTAATCCATATCTTAGAAACGAAGCTGAACTCACTCAGACATTTAAATACATCTCATGTTGAAGTTAATCGTAGGTGACAACAGTACAGGCAAGTCAGAAATCGGATTTAAATACATCATGTGTTAAAGTTAATCATGAAAACGTAGTAATAGCTGATGCACAATATGCATTTAAATACATCCCATGTTAATGTTAATCAGTTTGGTTAAACGAATCTTCTAACGATATATACGTATTTAAATACATCCCATGTTAATGTTAATCT

>NZ_CP043998|3|3|3575113-3575534|CRISPRCasFinder
ATTTAAATACATCTTATGTTAAAGTTAATC	AATTCAAGTCCAAGATGGAGAAAAGCAAAAAACTAA
GTTTAAATACATCATATGTTAATGTTAATC	GTGGTTAAACTTTCAAAACTTTGCTAAATGGTTTGA
AATTAAATACATCTCATGTTGAAATTAATC	CATATCTTAGAAACGAAGCTGAACTCACTCAGAC
ATTTAAATACATCTCATGTTGAAGTTAATC	GTAGGTGACAACAGTACAGGCAAGTCAGAAATCGG
ATTTAAATACATCATGTGTTAAAGTTAATC	ATGAAAACGTAGTAATAGCTGATGCACAATATGC
ATTTAAATACATCCCATGTTAATGTTAATC	AGTTTGGTTAAACGAATCTTCTAACGATATATACGT
ATTTAAATACATCCCATGTTAATGTTAATCT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_039773617.1\|3564160_3564469_+\|cupin-domain-containing-protein	unknown	unknown	gnl\|CDD\|369571
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	gnl\|CDD\|187863
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	cas10	mkCas0133_cas10_CAS-III	gnl\|CDD\|274208
NZ_CP043998.1\|WP_017212361.1\|3568118_3568394_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|235562
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187814
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	csm3gr7	cd09726_csm3gr7_CAS-III-D	gnl\|CDD\|187857
NZ_CP043998.1\|WP_039773603.1\|3581088_3581481_-\|hypothetical-protein	csm2gr11	mkCas0079_csm2gr11_CAS-III-D	unknown
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NZ_CP043998.1\|WP_039773607.1\|3578080_3578611_-\|hypothetical-protein	csm2gr11	mkCas0077_csm2gr11_CAS-III-D	unknown
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	csx10gr5	cd09700_csx10gr5_CAS-III-D	gnl\|CDD\|131722
NZ_CP043998.1\|WP_039773614.1\|3565140_3565767_-\|glutamine-amidotransferase	unknown	unknown	gnl\|CDD\|153234
NZ_CP043998.1\|WP_039773612.1\|3568632_3569739_-\|MBL-fold-metallo-hydrolase	unknown	unknown	gnl\|CDD\|293841
NZ_CP043998.1\|WP_039773609.1\|3571942_3574606_-\|DEAD/DEAH-box-helicase	cas3	mkCas0139_cas3_CAS-I	gnl\|CDD\|274800
NZ_CP043998.1\|WP_017212360.1\|3566539_3567583_+\|galactose-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|380481
NZ_CP043998.1\|WP_023974991.1\|3563600_3563936_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224647
NZ_CP043998.1\|WP_012059328.1\|3565818_3566001_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	csm3gr7	cls000253_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|274902
NZ_CP043998.1\|WP_039773611.1\|3569857_3571933_-\|ATP-dependent-helicase	unknown	unknown	gnl\|CDD\|223288
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187814
NZ_CP043998.1\|WP_039773615.1\|3564562_3564985_+\|membrane-protein	unknown	unknown	unknown

Protein	Cas_name	Cas_description	E-value	Identity	Coverage
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	csx10gr5	cd09700_csx10gr5_CAS-III-D	5e-19	63.6	0.0
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	5.5e-64	211.3	4.4
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	cas10	mkCas0133_cas10_CAS-III	2.1e-57	189.7	0.9
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	2e-55	182.3	0.2
NZ_CP043998.1\|WP_039773609.1\|3571942_3574606_-\|DEAD/DEAH-box-helicase	cas3	mkCas0139_cas3_CAS-I	1.4e-15	51.1	0.0
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	2.9e-41	136.0	0.0
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	csm3gr7	cd09726_csm3gr7_CAS-III-D	2.3e-20	68.5	2.8
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	csm3gr7	cls000253_csm3gr7_CAS-III-A:CAS-III-D	5.8e-38	125.9	1.1
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	7.8e-22	73.3	6.9
NZ_CP043998.1\|WP_039773607.1\|3578080_3578611_-\|hypothetical-protein	csm2gr11	mkCas0077_csm2gr11_CAS-III-D	1.6e-11	39.4	14.0
NZ_CP043998.1\|WP_039773603.1\|3581088_3581481_-\|hypothetical-protein	csm2gr11	mkCas0079_csm2gr11_CAS-III-D	7.6e-44	143.6	7.0

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_039773617.1\|3564160_3564469_+\|cupin-domain-containing-protein	gnl\|CDD\|369571	pfam07883, Cupin_2, Cupin domain. This family represents the conserved barrel domain of the 'cupin' superfamily ('cupa' is the Latin term for a small barrel).	1.03952e-15
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	gnl\|CDD\|187863	cd09732, Csx1_III-U, CRISPR/Cas system-associated protein Csx1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Protein of this family often fused to HTH domain; Some proteins could have an additional fusion with RecB-family nuclease domain; Core domain appears to have a Rossmann-like fold; loosely associated with CRISPR/Cas systems; also known as TM1812 family.	1.44358e-54
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	gnl\|CDD\|274208	TIGR02577, thermophile-specific_DNA_repair_system, CRISPR-associated protein Cas10/Cmr2, subtype III-B. This model represent a Crm2 family of the CRISPR-associated RAMP module, a set of six genes recurring found together in prokaryotic genomes. This gene cluster is found only in species with CRISPR repeats, usually near the repeats themselves. Because most of the six (but not this family) contain RAMP domains, and because its appearance in a genome appears to depend on other CRISPR-associated Cas genes, the set is designated the CRISPR RAMP module. This protein, typified by TM1794 from Thermotoga maritima, is designated Crm2, for CRISPR RAMP Module protein 2.	3.28911e-11
NZ_CP043998.1\|WP_017212361.1\|3568118_3568394_-\|hypothetical-protein	gnl\|CDD\|235562	PRK05687, fliH, flagellar assembly protein FliH.	0.000228856
NZ_CP043998.1\|WP_039773612.1\|3568632_3569739_-\|MBL-fold-metallo-hydrolase	gnl\|CDD\|293841	cd16283, RomA-like_MBL-fold, Enterobacter cloacae RomA and related proteins; MBL-fold metallo hydrolase domain. Derepression of the romA-ramA locus results in a multidrug-resistance phenotype. Members of this subgroup belong to the MBL-fold metallo-hydrolase superfamily which is comprised mainly of hydrolytic enzymes which carry out a variety of biological functions. The class B metal beta-lactamases (MBLs) from which this fold was named are only a small fraction of the activities which are included in this superfamily. Activities carried out by superfamily members include class B beta-lactamases, hydroxyacylglutathione hydrolases, AHL (acyl homoserine lactone) lactonases, persulfide dioxygenases, flavodiiron proteins, cleavage and polyadenylation specificity factors such as the Int9 and Int11 subunits of Integrator, Sdsa1-like and AtsA-like arylsulfatases, 5'-exonucleases human SNM1A and yeast Pso2p, ribonuclease J and ribonuclease Z, cyclic nucleotide phosphodiesterases, insecticide hydrolases, and proteins required for natural transformation competence. Classical members of the superfamily are di-, or less commonly mono-, zinc-ion-dependent hydrolases, however the diversity of biological roles is reflected in variations in the active site metallo-chemistry.	1.09659e-64
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	gnl\|CDD\|187857	cd09726, RAMP_I_III, CRISPR/Cas system-associated RAMP superfamily protein. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily proteins.	5.88002e-13
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	2.89617e-16
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	gnl\|CDD\|131722	TIGR02674, cas_cyan_RAMP_2, CRISPR-associated RAMP protein, Csx10 family. CRISPR is a widespread repeat family in prokaryotes. At least 45 different protein families occur in prokaryotes only when these repeats are present. This family, a minor CRISPR-associated protein family, seems largely restricted to the Cyanobacteria. It belongs to the RAMP superfamily (pfam03787).	1.2386e-15
NZ_CP043998.1\|WP_039773614.1\|3565140_3565767_-\|glutamine-amidotransferase	gnl\|CDD\|153234	cd03140, GATase1_PfpI_3, Type 1 glutamine amidotransferase (GATase1)-like domain found in a subgroup of proteins similar to PfpI from Pyrococcus furiosus. Type 1 glutamine amidotransferase (GATase1)-like domain found in a subgroup of proteins similar to PfpI from Pyrococcus furiosus. PfpI is an ATP-independent intracellular proteases which may hydrolyze small peptides to provide a nutritional source. Only Cys of the catalytic triad typical of GATase1 domains is conserved in this group. This Cys residue is found in the sharp turn between a beta strand and an alpha helix termed the nucleophile elbow.	2.2725e-74
NZ_CP043998.1\|WP_017212360.1\|3566539_3567583_+\|galactose-ABC-transporter-substrate-binding-protein	gnl\|CDD\|380481	cd01539, PBP1_GGBP, periplasmic glucose/galactose-binding protein (GGBP) involved in chemotaxis towards, and active transport of, glucose and galactose in various bacterial species. Periplasmic glucose/galactose-binding protein (GGBP) involved in chemotaxis towards, and active transport of, glucose and galactose in various bacterial species. GGBP is a member of the pentose/hexose sugar-binding protein family of the type 1 periplasmic binding protein superfamily which consists of two alpha/beta globular domains connected by a three-stranded hinge. This Venus flytrap-like domain undergoes transition from an open to a closed conformational state upon ligand binding. Moreover, the periplasmic GGBP is homologous to the ligand-binding domain of eukaryotic receptors such as glutamate receptor (GluR) and DNA-binding transcriptional repressors such as LacI and GalR.	2.77836e-100
NZ_CP043998.1\|WP_039773609.1\|3571942_3574606_-\|DEAD/DEAH-box-helicase	gnl\|CDD\|274800	TIGR03817, DECH_helic, helicase/secretion neighborhood putative DEAH-box helicase. A conserved gene neighborhood widely spread in the Actinobacteria contains this uncharacterized DEAH-box family helicase encoded convergently towards an operon of genes for protein homologous to type II secretion and pilus formation proteins. The context suggests that this helicase may play a role in conjugal transfer of DNA.	2.2908e-168
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	gnl\|CDD\|187814	cd09683, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	4.20897e-41
NZ_CP043998.1\|WP_023974991.1\|3563600_3563936_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|224647	COG1733, COG1733, Predicted transcriptional regulators [Transcription].	9.45036e-42
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	gnl\|CDD\|274902	TIGR03986, CRISPR-associated_protein, CRISPR-associated protein. Members of this protein family, part of the larger RAMP family, are found exclusively in species with CRISPR systems, in local contexts containing other RAMP (Repeat-Associated Mystery Proteins).	3.08939e-15
NZ_CP043998.1\|WP_039773611.1\|3569857_3571933_-\|ATP-dependent-helicase	gnl\|CDD\|223288	COG0210, UvrD, Superfamily I DNA and RNA helicases [DNA replication, recombination, and repair].	6.16791e-91
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	gnl\|CDD\|187814	cd09683, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	4.35081e-50

>NZ_CP043998.1|WP_039773609.1|3571942_3574606_-|DEAD/DEAH-box-helicase
MNISDLIIYNKTMPKREAAYVDYPSNLSEELCGYLSQNGIDKLYSHQAEMFEKAMDRNNIVITTSTASGKTLSFLLPVIQEILSNPLARAIFIYPTKALASDQYRAILPYLEYFGSNRISAGVYDGDTPVNERSRIRKNANIILTNPEMINAAFLPNHSKFGFDFIFSNLKYIVIDELHTYRGAFGSHLANVFRRLGRVCRYYNSSPQYLCSSATIANSVELAEEICGYKFLEVCRDGSPAPKKNYKLVQPPKIMGHDKKYYGQVQSTSVAADLIPDLVENDNSFIAFAKSRRNVEVVLKEARDKLETENFFGASLKDKISGYRGGYTPLERKEIENKMITGVLRGLVSTNALELGIDIGKIDTTVIVGYPGTRASFWQQSGRAGRNGKESTNYLILDNLPFDQYIAINPDWLFESGSENAVIDKNNLLIELAHIRAAAAEIPLTLDDISIFPDLGETIPVLIRASELTNQSGKFAWCGNSFPAGDFSLRNIDKARYKLINKDNNKEITEMDEMQAFREIHNGAIYMHDGVQYQVVKLDLESRTAFAIPFNGNYYTMPGGTTNIRIIQGSKDMEYERTKVTFGDVNVDEIVYMYKKLQFHNHQNLGFEQLEKPLSKDYDTESTWIKIPDNVVTVYRRLLQESQNGNFIRNNHFEGICYAIKNAAMMATMTEQEDIGVVMSNNAIEISQNYDSEVYMFIYDKYVGGLGYSEKVFDLTANIIENAIKMVGGCTCDNGCAACIGDYQLNKAMVLWGLKNLLEEIEAPKDIKLAQYAPATFIKKAFKFNELQKKWKEFCEYMQENGDAFAKFLSTISKVEIDNRTLILVLNNAFYREWVMEESNKKSIINIISFHTDAPMGIELSVRLEDIDEDRNNVKSKLQRRYEDLTE
>NZ_CP043998.1|WP_039773611.1|3569857_3571933_-|ATP-dependent-helicase
MHYEKELKRLNEYQREAVLDESNACVVNANVGSGKTTVLISKIVYLHYAKNISYKDMIVLTFTNKAANEIKERLMVSDESIKAEELEGFGTFHSVALHLLKEVLPIEKIRYEKDFLVIEPDEELDIALQIIQEEKLKIKYKNRLKKRLEQAMIIEKEEEKISPYDDDIFKLVELLKEEKIKQNKMSFSDILQNANLLLGEHKIEPKWIIIDEVQDSDKIQLDFIDKLEGENTKLFAVGDPNQVIYSWRGSSLNVVYTLKHKYNAKELSLPINYRSSNAILEAARCFQQNGSRLMGDRETENKIIVKNHYNPFNEACYLADKIKEIHKSGVPYKEIAIFYRLQNQSQVFEDVFLKNDIPFEVSMKKTISDSPVLNWMIKLFRFCVNPNDFSSAIYVLSNKEYGEKMTEKTARKIVKEQNIIKSELLEKMHEFLNKCSEIKLAEEIYNYFEFDKYIKPTSATYIDDKEAINALLNIIIEYVKEKQMTFLDGLREFINSSALYGVNILKKDISSDIDSVKLMTLHASKGLEFSYVFITGVNYGLIPLHTRDMEEEEEQRLFFVGITRAKDYLELSYYTNPDYQKAAPGESRYIHMIPEKLIQNDKVKSNNVNLQELKKQIQEAKAQGKKEEVSVTEKVELPVVEEINETLIKQVNHKKYGTGKVLKEDDMMIEVEFENYGVKEFIKAFSELESL
>NZ_CP043998.1|WP_039773612.1|3568632_3569739_-|MBL-fold-metallo-hydrolase
MIIYIFSFIILLCVGITAFIKLNPAFGGKPTKEQQEFYKNLDNYVNGKFVNETPTGLGMSASDILSMLKDSIAGAENRKPHGEIPVESIDWEKIKSEKDSLTWLGHSSFLLSIDNKKLLIDPILSTIASPVSFAGSKKYKYSENILDIIDKIPPIDAIFISHDHYDHLDYKSIVKLSSKVSHFFVPLGVSSHLMRWGISKEKITELNWWDEMNYQGLTIALTPSRHFSKRGIFGSDATLWGGYAIIGKNINLYYSGDGGYDSHFKKIGEKYGPFDITLIEGAQYDRRWFWAHMKPEEAVHAHLDVKGRNMMLMHWSAFTLAYHGWKEPIERALKEAKKSEISLIAPKIGKTVLLDSNINVPFSSWWDF
>NZ_CP043998.1|WP_017212361.1|3568118_3568394_-|hypothetical-protein
MGYKDYEMYLESEEVEFDSTKKCGCEDEEKDKKGCYKRNYPTGAALEEAYRAGRKDGYKEGYCEGYDKGSKDGCKQIKEKIAGCIDKIECC
>NZ_CP043998.1|WP_017212360.1|3566539_3567583_+|galactose-ABC-transporter-substrate-binding-protein
MWILKKVLAMLLLMNITVKFTEISTFYSLNLNNKNTTNIAVLLYKFDPFMSSLKQSLEAIQKDNSDKIKFTFFDGKNNIALQNETIDSISKNDFDLILANLADTSENFVEDIIFNVRSKNLPIVFLDIDPKVVYKVSKYYDKAAFILANSDLAGTVQGKILVNLWNSNKSSLDKNNDNTLQYVLLHGQAKDPVTIDRTKYAISTISNSGINTEQLALVNANWLKSLSKDSIESLFLRYDGRIEAIISNNDAMAIGAVEALQKYGYNKGEKSKNIAIVGIDGLPEAKSLIDKGFMAGTVIQDPKVLAEVFYNVGMNLVNNLSPIENTNYNVVDGEIIVPFPYEEYIKK
>NZ_CP043998.1|WP_012059328.1|3565818_3566001_-|hypothetical-protein
MVIKDKELDINLINSVEKYLKLNYSELYDKNDLGAVFDEAKKDDELKLKIFNSIRRFIMN
>NZ_CP043998.1|WP_039773614.1|3565140_3565767_-|glutamine-amidotransferase
MKNTVYLYVFDTMADWEIGYLIAEINSGRYYKKGLMPLKVVTVGITKAPITTMGGLTILPEIELEECSTHDTAALILPGGNTWTEAIHAPIIRMAEKYLEKGIVVGAICGATIGLAMGGVLDKRDHTSNDLGYLKMVCPNYDGEVYYKQECVVNDGSLITASGIAPLEFALHTLKILDVFSPQTLDSWYNLYKTQESKYFFELMNSIQ
>NZ_CP043998.1|WP_039773615.1|3564562_3564985_+|membrane-protein
MYYISMIITVLATVIYNISQKSINQSTNPFISMIVTYITAIIFSILALIILPIDRNIISSLKQLNWASYVLGISALGLEIGYLYIYRSGWNIAVAPLFVSIISTIILIVVGIFVYKTKLSPMNALGICLSIVGLILMNKK
>NZ_CP043998.1|WP_039773617.1|3564160_3564469_+|cupin-domain-containing-protein
MKILNINDTTEKIKRKALFTEGTMDSGILFYEPGETMTPHKHSDLDEIFYVISGKGIITINGKDFSIKENDVMLSPHEESHGFTNNGDEKLVILQIKNTIMK
>NZ_CP043998.1|WP_023974991.1|3563600_3563936_-|helix-turn-helix-transcriptional-regulator
MTCGKLCPIEETVKLIGHKWKVLILRNLHDDGTQRFNQLENGINGISQKMLTQQLRQMEADGLIIRKVYPEVPPRVEYSLSELGKSLKPVLDSMNIWGENYINANKHLYED
>NZ_CP043998.1|WP_039773608.1|3575738_3576431_-|CRISPR-associated-endoribonuclease-Cas6
MKVFEILLKVYLLEDIELNDSQNKILKLIDKTLGQDERTLELHNKNDFKNYCFNSFYPLEKDGIYKEGNIYTITIRTVDKYLATYLNNKLANSYTYSIKGLKADLRIIPIKKLKKIYSITPLVIKNDDGYWKNLISFEDFERRLKENLIKKHNNIFQEKINEDFKLYDSIELKNNKPIGTPYKDKTLLGDKISIDISEDDISQDLAYMALGVGMGEMNARGFGFMGYRWV
>NZ_CP043998.1|WP_039773607.1|3578080_3578611_-|hypothetical-protein
MDIERKKELLLLVDSIAKDIRNDNCGNYTPKIINAIEIAKKYNDMKKFGVVLEKLKSTTFGGNSEKEGYANFVDNIVNKREYKINTLNFEELEFVFSWVGRIIKTKKSNENYDNKNNNFHDRNKNNNYHDRNSNKFNKSNINKYSKEKTKSYYSTKSDSNEGLSSMAEQLMKWKSK
>NZ_CP043998.1|WP_051144941.1|3578627_3579497_-|hypothetical-protein
MSKPYNFIPLLKTKHTERDDKKCILKGRIDLEIKVLNAMHISEDSYDMNEEEILYKKFYTIGGKYSVPGTSLKGMIRNLAEMVSNSCISPTKDEQRILPNGKEKSCSVAQRCIICDVFGAMGKKSKVKVSDFLYEENSGIVNILGLPVLRTPNVKVSSIYLNEGVLKGYKIYNHGIESILKKGNYNCECLMKNATFKGYILYEDLDEEELKLLCYSIGLAGDFNHKLGYGKPAYYGSIEMTTKDDKYVQYAKDYIADCPDDIKKNIDLLSNIYSFKNAKKTPDYEGIEY
>NZ_CP043998.1|WP_051144940.1|3579480_3580281_-|CRISPR-associated-RAMP-protein
MFGKLKNEAILTFDIVTQSPLYIREGTDNSLDPSAVDGKYMTTYKDGKLEPFIPGTSLKGAFRSRAERVLRNNGACDIINRHECIPNNKLKPRTGQERYKKSCPICRLFGSNVIKSRVSFSDAYVFNEYKVGQRTCVAIDRITGSAKGSALYSFEYIEDAVFKEKIALQNFEPYQIKLLLYLIEEMNEGFLTLGGLTSKGFGCVKAENLELKIKQYGKDDLSSKNYEFKDYYNAKNVKGFDEISKLVSYVDFTKLKRDGDIDEQTI
>NZ_CP043998.1|WP_039773605.1|3580280_3581072_-|CRISPR-associated-RAMP-protein
MYLLDRFENKYIIKGILKAESPIHIGTGTVDFSPTAVDTPVIRDENNNPFIPGSSLKGVLRSFMERLLCSGIFNEYKSCNILDKDSGKKMELCISDKEVKEIKEKYKNDSNKEEKIASDIYKKECDVCKLFGGDYFASKLNILDARLISDKAYVQIRDGIAIDRDTLTVNDGAKFGFECVAAGTEFNFEMTVDNLDDNHKDLLKIILNFLQEGEMKVGGKTSAGLGNVKLISKSAYCITKENMREYFINGINDDNKSLLEVSL
>NZ_CP043998.1|WP_039773603.1|3581088_3581481_-|hypothetical-protein
MEKVNYKKEIIGMVEELGKDKEFWNRINQSRDYRNKEGKLGSSNIRSVATVCQNADCYEEIRLYIEYKIGKGNGWDDTLSNKKKFGQAVIDNMDKIYEMAGRDDKETLKIVSLYFGYLFWKKTAIEKGNL
>NZ_CP043998.1|WP_039773602.1|3581486_3582665_-|hypothetical-protein
MKVLLDFKSPLLIGSKKHSSNFIESDDVLKGSVVRAAFAKVILDNCCERNEADVKEVNGEKKMNWVYFRDKAGCLQCCFNNICKEFSNVRFSYFYPKGTEIIPQTSMVCKTDKNHGFIDLLVDDTSKGCTKCEGGSRVEFTSGLRTTDENKKPYSVIKSFTTKNKINPYSKTSADGMLYSIETVSCTPIKEDSDNEDESKLLFEGSIEGISENDLILFKRVRVGGDITTGLGKCVVSKLDSLKNEIEFKQIEKFSIDYKARNKNKGFIDKESNYISIKFIGDCILNFDFDGDVYLDTDELKKLWRKPLELEEDIKIEKIYTEVINYRGYDNSSISEDKREEAMTLISKGTVMVFSSKKSLRDLYSYFQVKQKCGFGLENENGFGDFEIYLGR
>NZ_CP043998.1|WP_039773600.1|3582664_3583174_-|hypothetical-protein
MSIEIYKVTIKTETPFNISSGTQDSGFIKDVSIKDANGKPYISGSTIKGKIRENYRMIQGEEKTKELFGDGGYRPSKIIVDNFYLTENEYSSNIRYGNAIDRYRKVTLDKALYSKEVISGTFHGEIEVNYNGDDSMKENLYLAIKMITSIGGSKSTGLGKVNIDIEEVV
>NZ_CP043998.1|WP_051144939.1|3583189_3584932_-|hypothetical-protein
MNDDNRGYKSQLYPSNDVYLSNKDIDSKEKRWMYKVNNEEFVPSEYDAEKMYCLISKLKGIDKETNELKKMFSSKDNDEVKDFLRDIYLSLSKGNKNSEKLGWASELKVDVVKGSIYKIKKYFLENNNLKDIRGGSILIDYLNNEVVIETLSKSGFSEENIVYCGGGNIFIVVPSGEGKQICKYLEQAFGNIALTAMNAFESITISLYEFAFDFKHISGVLSEKLEERKKLRLYKVNPDNDLKSINIKGKSINFSEYEEAVELKGSGVVCKLCDIRDAKYLIEESDGLASVCPSCLRKHLSGKAKSIFYDEFKEQTQVELKYNNIKSIDDISDDIAVIYGDGNNMGKIVMEIQNVFEMMYFSRKTDTITKRSVYEAINETMGEDAKFEVIALGGDDIFIIVPAKDSFNITTKIIDKFDKGFNNEITMSIGIVISKSNTPIASLFSIAQQKLKSAKAIIKKSKDIKEGSVDIIELLGNMHINLNHKGVFPVTNSRLKLMLKEMEEFKIKNRASAQLHKISYAQKNMIEEEFELFYYYHESKKKNKDESIDQLIKRIYGKSKERAQPYKIRWDDLILIWKMV
>NZ_CP043998.1|WP_039773596.1|3584962_3586660_-|TIGR02221-family-CRISPR-associated-protein
MSKKLFTFLGTTDYKPTVYYFNDDSVSEDNYEKLKTPYVQLSLCKKLGYDTELIVFLTPEAREANWISKDKKEGLQEILKKEGINAKAVDIKSGKDVNELWDNFNTIFEEFDKETDVYVDITYSLRSIPIIFMSLLSYARAVKKINIKGIYYGAFEVSETINIDNEELKLAPIFDLTFFNRIQDWANGTEKFLTTGDSRLLSDEILSVKNSVKEIFKTGTIDERNEARLMESIAKSLKAYSEDLFSCRGKKIVTDCKRLKDELNKIKKITISDFTPFSKIIDQLIDKFMPYTGEVINDSIYAIEQGREFRLLQQSYTMLQETLITYLTIGIGLDYKEKKQRKIAEDIMKEFYYRDESNCKLSEEEELFKAKSDEKIMVKIGQLYKEISDYRNDINHNGFSSGMHYSTFENNLYVFIEKFKEIVNNSYETNAEENLHKSAVSILSHKLLKSQEEELNRDWKVKRIVTLPEELRNEWSNINPNVEIEDDFNLVYKLKTFILENTNQEDYVIVQGEWGMTFTIVNMCFELNRVPIYATTERKTKETVKDGQVHSEKVFEHIRFRKYRI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043998_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_4

3576519-3577887

TypeIII

II-B

Consensus_repeat	Method
ATTCAAATACATCTCATGTTGAAGTTAATC	CRISPRCasFinder
NTTTAAATACATCNNATGTTAAAGTTAATC	CRT
ATTCAAATACATCTCATGTTGAAGTTAATC	CRISPRCasFinder
ATTCAAATACATCTCATGTTGAAGTTAATC	PILER-CR

20 spacers

cas6,cas3,csm2gr11,csm3gr7,csx10gr5,cas10,csx1

The CRISPR arrays of NZ_CP043998_4

>merge|NZ_CP043998|4|3576519-3577887|CRISPRCasFinder,CRT,CRISPRCasFinder,PILER-CR
TGTTGAATACATCTAATGTTAAAGTTAATCTTTAATTCACAAGGAAACAGGGACAGTTATTAAATAATTTAAATACATCCCATGTTAAAGTTAATAACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGAGTTTAAATACATCTTATGATAAAGTTAATTCCATTTCCAAAAAAGACAACTCAGAAAGTTCATGTTTAAATACATTATATATTAAAGTTGACCATAGTTGCTGATCAAATCTTTGATGCCGACGGAAAATTTCAATACACCCTATGTTAAGGTTAATCATACGAAGCAATATATAAGTACAAAGTAGAAATAACATTTTAATACATCTCATGTTAAAGTTAATCGTATTGCTGCATTAGCACATAAAGTAACTCAACAATAATTTAAATACATCTTATGTTAAAGTTAATCCCCAATAATCTGTCAATATGCGATATACAAAATTAATTTAAATACATCCATGTTATAGTTAATCGACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGATTTAAATACATCCCATGTTAATGTTAATCCCAGCAATAGCATATATTGAAAAATACTATAACGCATTTAAATACATCTTATGCTAAAGTTAATCCAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGTATCTAAATACATCCTATGTTAATATTAATCACAATCTTATTATAAAATAGCAATATAATTTGCAAAGATTAAACACATCTCATGTTAAGGTTAATCGCAATGGCTAGACATAAAGAACAAAAGATATTCACGTTTAAATACATAACATGTTAAAGTTTATCGTGTGGGTATAATAATTATGGTCAATTAGTATTAGGGTTTAAATACATCTCATGTTAATGTTAATCATATAATGATCCTAACTTTCAACCTAGTCCTTACGTATTCAAATACATCTCATGTTAAAGTTAATCAAATAGAGCTTGATAAGTATGGACATTTCTTCTTATTTAAATACATCCCATGTTAATATTAATCATTCGTTGGATACCATATCATTGATGCAGACGGAAAATTTAAATACATCTCATGCTAAAGTTAATCAATGATTAAATATTTGATAAAATAATAATGTAAGGAAATTCAAATACATCTCATGTTGAAGTTAATCTGATGACTTCGAAATAATATATGATTCTGAATTTACATTCAAATACATCTCATGTTGAAGTTAATCATTTGCAAAGATAATATATGAAATGGCTAACAAGTTATTCAAATACATCTCATGTTGAAGTTAATCCAGGCAGTAATATGGATGCATTATTAGCAAAAATGGAATTCAAATACATCTCATGTTGAAGTTAATC

>NZ_CP043998|4|4|3576519-3576944|CRISPRCasFinder
TGTTGAATACATCTAATGTTAAAGTTAATC	TTTAATTCACAAGGAAACAGGGACAGTTATTAAATA
ATTTAAATACATCCCATGTTAAAGTTAATA	ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGA
GTTTAAATACATCTTATGATAAAGTTAATT	CCATTTCCAAAAAAGACAACTCAGAAAGTTCAT
GTTTAAATACATTATATATTAAAGTTGACC	ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAA
ATTTCAATACACCCTATGTTAAGGTTAATC	ATACGAAGCAATATATAAGTACAAAGTAGAAATAAC
ATTTTAATACATCTCATGTTAAAGTTAATC	GTATTGCTGCATTAGCACATAAAGTAACTCAACAATA
ATTTAAATACATCTTATGTTAAAGTTAATCCCCAATAATCTGTCAATATGCGATATACAAAATTAATTTAAATACATCCATGTTATAGTTAATCGACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGATTTAAATACATCCCATGTTAATGTTAATC	CCAGCAATAGCATATATTGAAAAATACTATAACGC
ATTTAAATACATCTTATGCTAAAGTTAATC	CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGT
ATCTAAATACATCCTATGTTAATATTAATC	ACAATCTTATTATAAAATAGCAATATAATTTGCAAA
GATTAAACACATCTCATGTTAAGGTTAATC	GCAATGGCTAGACATAAAGAACAAAAGATATTCAC
GTTTAAATACATAACATGTTAAAGTTTATC	GTGTGGGTATAATAATTATGGTCAATTAGTATTAGG
GTTTAAATACATCTCATGTTAATGTTAATC	ATATAATGATCCTAACTTTCAACCTAGTCCTTACGT
ATTCAAATACATCTCATGTTAAAGTTAATC	AAATAGAGCTTGATAAGTATGGACATTTCTTCTT
ATTTAAATACATCCCATGTTAATATTAATC	ATTCGTTGGATACCATATCATTGATGCAGACGGAAA
ATTTAAATACATCTCATGCTAAAGTTAATC	AATGATTAAATATTTGATAAAATAATAATGTAAGGAA
ATTCAAATACATCTCATGTTGAAGTTAATC	TGATGACTTCGAAATAATATATGATTCTGAATTTAC
ATTCAAATACATCTCATGTTGAAGTTAATC	ATTTGCAAAGATAATATATGAAATGGCTAACAAGTT
ATTCAAATACATCTCATGTTGAAGTTAATC	CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGA


>NZ_CP043998|4|1|3576520-3577887|CRT
GTTGAATACATCTAATGTTAAAGTTAATC	TTTAATTCACAAGGAAACAGGGACAGTTATTAAATAA
TTTAAATACATCCCATGTTAAAGTTAATA	ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGAG
TTTAAATACATCTTATGATAAAGTTAATT	CCATTTCCAAAAAAGACAACTCAGAAAGTTCATG
TTTAAATACATTATATATTAAAGTTGACC	ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAAA
TTTCAATACACCCTATGTTAAGGTTAATC	ATACGAAGCAATATATAAGTACAAAGTAGAAATAACA
TTTTAATACATCTCATGTTAAAGTTAATC	GTATTGCTGCATTAGCACATAAAGTAACTCAACAATAA
TTTAAATACATCTTATGTTAAAGTTAATC	CCCAATAATCTGTCAATATGCGATATACAAAATTA
ATTTAAATACATCCATGTTATAGTTAATC	GACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGA
TTTAAATACATCCCATGTTAATGTTAATC	CCAGCAATAGCATATATTGAAAAATACTATAACGCA
TTTAAATACATCTTATGCTAAAGTTAATC	CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGTA
TCTAAATACATCCTATGTTAATATTAATC	ACAATCTTATTATAAAATAGCAATATAATTTGCAAAG
ATTAAACACATCTCATGTTAAGGTTAATC	GCAATGGCTAGACATAAAGAACAAAAGATATTCACG
TTTAAATACATAACATGTTAAAGTTTATC	GTGTGGGTATAATAATTATGGTCAATTAGTATTAGGG
TTTAAATACATCTCATGTTAATGTTAATC	ATATAATGATCCTAACTTTCAACCTAGTCCTTACGTA
TTCAAATACATCTCATGTTAAAGTTAATC	AAATAGAGCTTGATAAGTATGGACATTTCTTCTTA
TTTAAATACATCCCATGTTAATATTAATC	ATTCGTTGGATACCATATCATTGATGCAGACGGAAAA
TTTAAATACATCTCATGCTAAAGTTAATC	AATGATTAAATATTTGATAAAATAATAATGTAAGGAAA
TTCAAATACATCTCATGTTGAAGTTAATC	TGATGACTTCGAAATAATATATGATTCTGAATTTACA
TTCAAATACATCTCATGTTGAAGTTAATC	ATTTGCAAAGATAATATATGAAATGGCTAACAAGTTA
TTCAAATACATCTCATGTTGAAGTTAATC	CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGAA
TTCAAATACATCTCATGTTGAAGTTAATC

>NZ_CP043998|4|5|3577045-3577887|CRISPRCasFinder
	TTTAATTCACAAGGAAACAGGGACAGTTATTAAATA
ATTTAAATACATCCCATGTTAAAGTTAATA	ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGA
GTTTAAATACATCTTATGATAAAGTTAATT	CCATTTCCAAAAAAGACAACTCAGAAAGTTCAT
GTTTAAATACATTATATATTAAAGTTGACC	ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAA
ATTTCAATACACCCTATGTTAAGGTTAATC	ATACGAAGCAATATATAAGTACAAAGTAGAAATAAC
ATTTTAATACATCTCATGTTAAAGTTAATC	GTATTGCTGCATTAGCACATAAAGTAACTCAACAATA
ATTTAAATACATCTTATGTTAAAGTTAATCCCCAATAATCTGTCAATATGCGATATACAAAATTAATTTAAATACATCCATGTTATAGTTAATCGACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGATTTAAATACATCCCATGTTAATGTTAATC	CCAGCAATAGCATATATTGAAAAATACTATAACGC
ATTTAAATACATCTTATGCTAAAGTTAATC	CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGT
ATCTAAATACATCCTATGTTAATATTAATC	ACAATCTTATTATAAAATAGCAATATAATTTGCAAA
GATTAAACACATCTCATGTTAAGGTTAATC	GCAATGGCTAGACATAAAGAACAAAAGATATTCAC
GTTTAAATACATAACATGTTAAAGTTTATC	GTGTGGGTATAATAATTATGGTCAATTAGTATTAGG
GTTTAAATACATCTCATGTTAATGTTAATC	ATATAATGATCCTAACTTTCAACCTAGTCCTTACGT
ATTCAAATACATCTCATGTTAAAGTTAATC	AAATAGAGCTTGATAAGTATGGACATTTCTTCTT
ATTTAAATACATCCCATGTTAATATTAATC	ATTCGTTGGATACCATATCATTGATGCAGACGGAAA
ATTTAAATACATCTCATGCTAAAGTTAATC	AATGATTAAATATTTGATAAAATAATAATGTAAGGAA
ATTCAAATACATCTCATGTTGAAGTTAATC	TGATGACTTCGAAATAATATATGATTCTGAATTTAC
ATTCAAATACATCTCATGTTGAAGTTAATC	ATTTGCAAAGATAATATATGAAATGGCTAACAAGTT
ATTCAAATACATCTCATGTTGAAGTTAATC	CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGA
ATTCAAATACATCTCATGTTGAAGTTAATC

>NZ_CP043998|4|1|3577659-3577887|PILER-CR
ATTCAAATACATCTCATGTTGAAGTTAATC	TGATGACTTCGAAATAATATATGATTCTGAATTTAC
ATTCAAATACATCTCATGTTGAAGTTAATC	ATTTGCAAAGATAATATATGAAATGGCTAACAAGTT
ATTCAAATACATCTCATGTTGAAGTTAATC	CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGA
ATTCAAATACATCTCATGTTGAAGTTAATC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	gnl\|CDD\|187863
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	cas10	mkCas0133_cas10_CAS-III	gnl\|CDD\|274208
NZ_CP043998.1\|WP_017212361.1\|3568118_3568394_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|235562
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187814
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	csm3gr7	cd09726_csm3gr7_CAS-III-D	gnl\|CDD\|187857
NZ_CP043998.1\|WP_039773603.1\|3581088_3581481_-\|hypothetical-protein	csm2gr11	mkCas0079_csm2gr11_CAS-III-D	unknown
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NZ_CP043998.1\|WP_039773607.1\|3578080_3578611_-\|hypothetical-protein	csm2gr11	mkCas0077_csm2gr11_CAS-III-D	unknown
NZ_CP043998.1\|WP_039773595.1\|3588010_3588583_+\|sigma-70-family-RNA-polymerase-sigma-factor	unknown	unknown	gnl\|CDD\|274357
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	csx10gr5	cd09700_csx10gr5_CAS-III-D	gnl\|CDD\|131722
NZ_CP043998.1\|WP_039773614.1\|3565140_3565767_-\|glutamine-amidotransferase	unknown	unknown	gnl\|CDD\|153234
NZ_CP043998.1\|WP_039773612.1\|3568632_3569739_-\|MBL-fold-metallo-hydrolase	unknown	unknown	gnl\|CDD\|293841
NZ_CP043998.1\|WP_039773609.1\|3571942_3574606_-\|DEAD/DEAH-box-helicase	cas3	mkCas0139_cas3_CAS-I	gnl\|CDD\|274800
NZ_CP043998.1\|WP_017212360.1\|3566539_3567583_+\|galactose-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|380481
NZ_CP043998.1\|WP_039773617.1\|3564160_3564469_+\|cupin-domain-containing-protein	unknown	unknown	gnl\|CDD\|369571
NZ_CP043998.1\|WP_012059328.1\|3565818_3566001_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	csm3gr7	cls000253_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|274902
NZ_CP043998.1\|WP_039773611.1\|3569857_3571933_-\|ATP-dependent-helicase	unknown	unknown	gnl\|CDD\|223288
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187814
NZ_CP043998.1\|WP_039773615.1\|3564562_3564985_+\|membrane-protein	unknown	unknown	unknown

Protein	Cas_name	Cas_description	E-value	Identity	Coverage
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	csx10gr5	cd09700_csx10gr5_CAS-III-D	5e-19	63.6	0.0
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	5.5e-64	211.3	4.4
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	cas10	mkCas0133_cas10_CAS-III	2.1e-57	189.7	0.9
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	2e-55	182.3	0.2
NZ_CP043998.1\|WP_039773609.1\|3571942_3574606_-\|DEAD/DEAH-box-helicase	cas3	mkCas0139_cas3_CAS-I	1.4e-15	51.1	0.0
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	2.9e-41	136.0	0.0
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	csm3gr7	cd09726_csm3gr7_CAS-III-D	2.3e-20	68.5	2.8
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	csm3gr7	cls000253_csm3gr7_CAS-III-A:CAS-III-D	5.8e-38	125.9	1.1
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	7.8e-22	73.3	6.9
NZ_CP043998.1\|WP_039773607.1\|3578080_3578611_-\|hypothetical-protein	csm2gr11	mkCas0077_csm2gr11_CAS-III-D	1.6e-11	39.4	14.0
NZ_CP043998.1\|WP_039773603.1\|3581088_3581481_-\|hypothetical-protein	csm2gr11	mkCas0079_csm2gr11_CAS-III-D	7.6e-44	143.6	7.0

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	gnl\|CDD\|187863	cd09732, Csx1_III-U, CRISPR/Cas system-associated protein Csx1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Protein of this family often fused to HTH domain; Some proteins could have an additional fusion with RecB-family nuclease domain; Core domain appears to have a Rossmann-like fold; loosely associated with CRISPR/Cas systems; also known as TM1812 family.	1.44358e-54
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	gnl\|CDD\|274208	TIGR02577, thermophile-specific_DNA_repair_system, CRISPR-associated protein Cas10/Cmr2, subtype III-B. This model represent a Crm2 family of the CRISPR-associated RAMP module, a set of six genes recurring found together in prokaryotic genomes. This gene cluster is found only in species with CRISPR repeats, usually near the repeats themselves. Because most of the six (but not this family) contain RAMP domains, and because its appearance in a genome appears to depend on other CRISPR-associated Cas genes, the set is designated the CRISPR RAMP module. This protein, typified by TM1794 from Thermotoga maritima, is designated Crm2, for CRISPR RAMP Module protein 2.	3.28911e-11
NZ_CP043998.1\|WP_017212361.1\|3568118_3568394_-\|hypothetical-protein	gnl\|CDD\|235562	PRK05687, fliH, flagellar assembly protein FliH.	0.000228856
NZ_CP043998.1\|WP_039773612.1\|3568632_3569739_-\|MBL-fold-metallo-hydrolase	gnl\|CDD\|293841	cd16283, RomA-like_MBL-fold, Enterobacter cloacae RomA and related proteins; MBL-fold metallo hydrolase domain. Derepression of the romA-ramA locus results in a multidrug-resistance phenotype. Members of this subgroup belong to the MBL-fold metallo-hydrolase superfamily which is comprised mainly of hydrolytic enzymes which carry out a variety of biological functions. The class B metal beta-lactamases (MBLs) from which this fold was named are only a small fraction of the activities which are included in this superfamily. Activities carried out by superfamily members include class B beta-lactamases, hydroxyacylglutathione hydrolases, AHL (acyl homoserine lactone) lactonases, persulfide dioxygenases, flavodiiron proteins, cleavage and polyadenylation specificity factors such as the Int9 and Int11 subunits of Integrator, Sdsa1-like and AtsA-like arylsulfatases, 5'-exonucleases human SNM1A and yeast Pso2p, ribonuclease J and ribonuclease Z, cyclic nucleotide phosphodiesterases, insecticide hydrolases, and proteins required for natural transformation competence. Classical members of the superfamily are di-, or less commonly mono-, zinc-ion-dependent hydrolases, however the diversity of biological roles is reflected in variations in the active site metallo-chemistry.	1.09659e-64
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	gnl\|CDD\|187857	cd09726, RAMP_I_III, CRISPR/Cas system-associated RAMP superfamily protein. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily proteins.	5.88002e-13
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	2.89617e-16
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	gnl\|CDD\|131722	TIGR02674, cas_cyan_RAMP_2, CRISPR-associated RAMP protein, Csx10 family. CRISPR is a widespread repeat family in prokaryotes. At least 45 different protein families occur in prokaryotes only when these repeats are present. This family, a minor CRISPR-associated protein family, seems largely restricted to the Cyanobacteria. It belongs to the RAMP superfamily (pfam03787).	1.2386e-15
NZ_CP043998.1\|WP_039773595.1\|3588010_3588583_+\|sigma-70-family-RNA-polymerase-sigma-factor	gnl\|CDD\|274357	TIGR02937, RNA_polymerase_sigma_factor, RNA polymerase sigma factor, sigma-70 family. This model encompasses all varieties of the sigma-70 type sigma factors including the ECF subfamily. A number of sigma factors have names with a different number than 70 (i.e. sigma-38), but in fact, all except for the Sigma-54 family (TIGR02395) are included within this family. Several Pfam models hit segments of these sequences including Sigma-70 region 2 (pfam04542) and Sigma-70, region 4 (pfam04545), but not always above their respective trusted cutoffs.	3.73793e-15
NZ_CP043998.1\|WP_039773614.1\|3565140_3565767_-\|glutamine-amidotransferase	gnl\|CDD\|153234	cd03140, GATase1_PfpI_3, Type 1 glutamine amidotransferase (GATase1)-like domain found in a subgroup of proteins similar to PfpI from Pyrococcus furiosus. Type 1 glutamine amidotransferase (GATase1)-like domain found in a subgroup of proteins similar to PfpI from Pyrococcus furiosus. PfpI is an ATP-independent intracellular proteases which may hydrolyze small peptides to provide a nutritional source. Only Cys of the catalytic triad typical of GATase1 domains is conserved in this group. This Cys residue is found in the sharp turn between a beta strand and an alpha helix termed the nucleophile elbow.	2.2725e-74
NZ_CP043998.1\|WP_017212360.1\|3566539_3567583_+\|galactose-ABC-transporter-substrate-binding-protein	gnl\|CDD\|380481	cd01539, PBP1_GGBP, periplasmic glucose/galactose-binding protein (GGBP) involved in chemotaxis towards, and active transport of, glucose and galactose in various bacterial species. Periplasmic glucose/galactose-binding protein (GGBP) involved in chemotaxis towards, and active transport of, glucose and galactose in various bacterial species. GGBP is a member of the pentose/hexose sugar-binding protein family of the type 1 periplasmic binding protein superfamily which consists of two alpha/beta globular domains connected by a three-stranded hinge. This Venus flytrap-like domain undergoes transition from an open to a closed conformational state upon ligand binding. Moreover, the periplasmic GGBP is homologous to the ligand-binding domain of eukaryotic receptors such as glutamate receptor (GluR) and DNA-binding transcriptional repressors such as LacI and GalR.	2.77836e-100
NZ_CP043998.1\|WP_039773609.1\|3571942_3574606_-\|DEAD/DEAH-box-helicase	gnl\|CDD\|274800	TIGR03817, DECH_helic, helicase/secretion neighborhood putative DEAH-box helicase. A conserved gene neighborhood widely spread in the Actinobacteria contains this uncharacterized DEAH-box family helicase encoded convergently towards an operon of genes for protein homologous to type II secretion and pilus formation proteins. The context suggests that this helicase may play a role in conjugal transfer of DNA.	2.2908e-168
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	gnl\|CDD\|187814	cd09683, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	4.20897e-41
NZ_CP043998.1\|WP_039773617.1\|3564160_3564469_+\|cupin-domain-containing-protein	gnl\|CDD\|369571	pfam07883, Cupin_2, Cupin domain. This family represents the conserved barrel domain of the 'cupin' superfamily ('cupa' is the Latin term for a small barrel).	1.03952e-15
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	gnl\|CDD\|274902	TIGR03986, CRISPR-associated_protein, CRISPR-associated protein. Members of this protein family, part of the larger RAMP family, are found exclusively in species with CRISPR systems, in local contexts containing other RAMP (Repeat-Associated Mystery Proteins).	3.08939e-15
NZ_CP043998.1\|WP_039773611.1\|3569857_3571933_-\|ATP-dependent-helicase	gnl\|CDD\|223288	COG0210, UvrD, Superfamily I DNA and RNA helicases [DNA replication, recombination, and repair].	6.16791e-91
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	gnl\|CDD\|187814	cd09683, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	4.35081e-50

>NZ_CP043998.1|WP_039773608.1|3575738_3576431_-|CRISPR-associated-endoribonuclease-Cas6
MKVFEILLKVYLLEDIELNDSQNKILKLIDKTLGQDERTLELHNKNDFKNYCFNSFYPLEKDGIYKEGNIYTITIRTVDKYLATYLNNKLANSYTYSIKGLKADLRIIPIKKLKKIYSITPLVIKNDDGYWKNLISFEDFERRLKENLIKKHNNIFQEKINEDFKLYDSIELKNNKPIGTPYKDKTLLGDKISIDISEDDISQDLAYMALGVGMGEMNARGFGFMGYRWV
>NZ_CP043998.1|WP_039773609.1|3571942_3574606_-|DEAD/DEAH-box-helicase
MNISDLIIYNKTMPKREAAYVDYPSNLSEELCGYLSQNGIDKLYSHQAEMFEKAMDRNNIVITTSTASGKTLSFLLPVIQEILSNPLARAIFIYPTKALASDQYRAILPYLEYFGSNRISAGVYDGDTPVNERSRIRKNANIILTNPEMINAAFLPNHSKFGFDFIFSNLKYIVIDELHTYRGAFGSHLANVFRRLGRVCRYYNSSPQYLCSSATIANSVELAEEICGYKFLEVCRDGSPAPKKNYKLVQPPKIMGHDKKYYGQVQSTSVAADLIPDLVENDNSFIAFAKSRRNVEVVLKEARDKLETENFFGASLKDKISGYRGGYTPLERKEIENKMITGVLRGLVSTNALELGIDIGKIDTTVIVGYPGTRASFWQQSGRAGRNGKESTNYLILDNLPFDQYIAINPDWLFESGSENAVIDKNNLLIELAHIRAAAAEIPLTLDDISIFPDLGETIPVLIRASELTNQSGKFAWCGNSFPAGDFSLRNIDKARYKLINKDNNKEITEMDEMQAFREIHNGAIYMHDGVQYQVVKLDLESRTAFAIPFNGNYYTMPGGTTNIRIIQGSKDMEYERTKVTFGDVNVDEIVYMYKKLQFHNHQNLGFEQLEKPLSKDYDTESTWIKIPDNVVTVYRRLLQESQNGNFIRNNHFEGICYAIKNAAMMATMTEQEDIGVVMSNNAIEISQNYDSEVYMFIYDKYVGGLGYSEKVFDLTANIIENAIKMVGGCTCDNGCAACIGDYQLNKAMVLWGLKNLLEEIEAPKDIKLAQYAPATFIKKAFKFNELQKKWKEFCEYMQENGDAFAKFLSTISKVEIDNRTLILVLNNAFYREWVMEESNKKSIINIISFHTDAPMGIELSVRLEDIDEDRNNVKSKLQRRYEDLTE
>NZ_CP043998.1|WP_039773611.1|3569857_3571933_-|ATP-dependent-helicase
MHYEKELKRLNEYQREAVLDESNACVVNANVGSGKTTVLISKIVYLHYAKNISYKDMIVLTFTNKAANEIKERLMVSDESIKAEELEGFGTFHSVALHLLKEVLPIEKIRYEKDFLVIEPDEELDIALQIIQEEKLKIKYKNRLKKRLEQAMIIEKEEEKISPYDDDIFKLVELLKEEKIKQNKMSFSDILQNANLLLGEHKIEPKWIIIDEVQDSDKIQLDFIDKLEGENTKLFAVGDPNQVIYSWRGSSLNVVYTLKHKYNAKELSLPINYRSSNAILEAARCFQQNGSRLMGDRETENKIIVKNHYNPFNEACYLADKIKEIHKSGVPYKEIAIFYRLQNQSQVFEDVFLKNDIPFEVSMKKTISDSPVLNWMIKLFRFCVNPNDFSSAIYVLSNKEYGEKMTEKTARKIVKEQNIIKSELLEKMHEFLNKCSEIKLAEEIYNYFEFDKYIKPTSATYIDDKEAINALLNIIIEYVKEKQMTFLDGLREFINSSALYGVNILKKDISSDIDSVKLMTLHASKGLEFSYVFITGVNYGLIPLHTRDMEEEEEQRLFFVGITRAKDYLELSYYTNPDYQKAAPGESRYIHMIPEKLIQNDKVKSNNVNLQELKKQIQEAKAQGKKEEVSVTEKVELPVVEEINETLIKQVNHKKYGTGKVLKEDDMMIEVEFENYGVKEFIKAFSELESL
>NZ_CP043998.1|WP_039773612.1|3568632_3569739_-|MBL-fold-metallo-hydrolase
MIIYIFSFIILLCVGITAFIKLNPAFGGKPTKEQQEFYKNLDNYVNGKFVNETPTGLGMSASDILSMLKDSIAGAENRKPHGEIPVESIDWEKIKSEKDSLTWLGHSSFLLSIDNKKLLIDPILSTIASPVSFAGSKKYKYSENILDIIDKIPPIDAIFISHDHYDHLDYKSIVKLSSKVSHFFVPLGVSSHLMRWGISKEKITELNWWDEMNYQGLTIALTPSRHFSKRGIFGSDATLWGGYAIIGKNINLYYSGDGGYDSHFKKIGEKYGPFDITLIEGAQYDRRWFWAHMKPEEAVHAHLDVKGRNMMLMHWSAFTLAYHGWKEPIERALKEAKKSEISLIAPKIGKTVLLDSNINVPFSSWWDF
>NZ_CP043998.1|WP_017212361.1|3568118_3568394_-|hypothetical-protein
MGYKDYEMYLESEEVEFDSTKKCGCEDEEKDKKGCYKRNYPTGAALEEAYRAGRKDGYKEGYCEGYDKGSKDGCKQIKEKIAGCIDKIECC
>NZ_CP043998.1|WP_017212360.1|3566539_3567583_+|galactose-ABC-transporter-substrate-binding-protein
MWILKKVLAMLLLMNITVKFTEISTFYSLNLNNKNTTNIAVLLYKFDPFMSSLKQSLEAIQKDNSDKIKFTFFDGKNNIALQNETIDSISKNDFDLILANLADTSENFVEDIIFNVRSKNLPIVFLDIDPKVVYKVSKYYDKAAFILANSDLAGTVQGKILVNLWNSNKSSLDKNNDNTLQYVLLHGQAKDPVTIDRTKYAISTISNSGINTEQLALVNANWLKSLSKDSIESLFLRYDGRIEAIISNNDAMAIGAVEALQKYGYNKGEKSKNIAIVGIDGLPEAKSLIDKGFMAGTVIQDPKVLAEVFYNVGMNLVNNLSPIENTNYNVVDGEIIVPFPYEEYIKK
>NZ_CP043998.1|WP_012059328.1|3565818_3566001_-|hypothetical-protein
MVIKDKELDINLINSVEKYLKLNYSELYDKNDLGAVFDEAKKDDELKLKIFNSIRRFIMN
>NZ_CP043998.1|WP_039773614.1|3565140_3565767_-|glutamine-amidotransferase
MKNTVYLYVFDTMADWEIGYLIAEINSGRYYKKGLMPLKVVTVGITKAPITTMGGLTILPEIELEECSTHDTAALILPGGNTWTEAIHAPIIRMAEKYLEKGIVVGAICGATIGLAMGGVLDKRDHTSNDLGYLKMVCPNYDGEVYYKQECVVNDGSLITASGIAPLEFALHTLKILDVFSPQTLDSWYNLYKTQESKYFFELMNSIQ
>NZ_CP043998.1|WP_039773615.1|3564562_3564985_+|membrane-protein
MYYISMIITVLATVIYNISQKSINQSTNPFISMIVTYITAIIFSILALIILPIDRNIISSLKQLNWASYVLGISALGLEIGYLYIYRSGWNIAVAPLFVSIISTIILIVVGIFVYKTKLSPMNALGICLSIVGLILMNKK
>NZ_CP043998.1|WP_039773617.1|3564160_3564469_+|cupin-domain-containing-protein
MKILNINDTTEKIKRKALFTEGTMDSGILFYEPGETMTPHKHSDLDEIFYVISGKGIITINGKDFSIKENDVMLSPHEESHGFTNNGDEKLVILQIKNTIMK
>NZ_CP043998.1|WP_039773607.1|3578080_3578611_-|hypothetical-protein
MDIERKKELLLLVDSIAKDIRNDNCGNYTPKIINAIEIAKKYNDMKKFGVVLEKLKSTTFGGNSEKEGYANFVDNIVNKREYKINTLNFEELEFVFSWVGRIIKTKKSNENYDNKNNNFHDRNKNNNYHDRNSNKFNKSNINKYSKEKTKSYYSTKSDSNEGLSSMAEQLMKWKSK
>NZ_CP043998.1|WP_051144941.1|3578627_3579497_-|hypothetical-protein
MSKPYNFIPLLKTKHTERDDKKCILKGRIDLEIKVLNAMHISEDSYDMNEEEILYKKFYTIGGKYSVPGTSLKGMIRNLAEMVSNSCISPTKDEQRILPNGKEKSCSVAQRCIICDVFGAMGKKSKVKVSDFLYEENSGIVNILGLPVLRTPNVKVSSIYLNEGVLKGYKIYNHGIESILKKGNYNCECLMKNATFKGYILYEDLDEEELKLLCYSIGLAGDFNHKLGYGKPAYYGSIEMTTKDDKYVQYAKDYIADCPDDIKKNIDLLSNIYSFKNAKKTPDYEGIEY
>NZ_CP043998.1|WP_051144940.1|3579480_3580281_-|CRISPR-associated-RAMP-protein
MFGKLKNEAILTFDIVTQSPLYIREGTDNSLDPSAVDGKYMTTYKDGKLEPFIPGTSLKGAFRSRAERVLRNNGACDIINRHECIPNNKLKPRTGQERYKKSCPICRLFGSNVIKSRVSFSDAYVFNEYKVGQRTCVAIDRITGSAKGSALYSFEYIEDAVFKEKIALQNFEPYQIKLLLYLIEEMNEGFLTLGGLTSKGFGCVKAENLELKIKQYGKDDLSSKNYEFKDYYNAKNVKGFDEISKLVSYVDFTKLKRDGDIDEQTI
>NZ_CP043998.1|WP_039773605.1|3580280_3581072_-|CRISPR-associated-RAMP-protein
MYLLDRFENKYIIKGILKAESPIHIGTGTVDFSPTAVDTPVIRDENNNPFIPGSSLKGVLRSFMERLLCSGIFNEYKSCNILDKDSGKKMELCISDKEVKEIKEKYKNDSNKEEKIASDIYKKECDVCKLFGGDYFASKLNILDARLISDKAYVQIRDGIAIDRDTLTVNDGAKFGFECVAAGTEFNFEMTVDNLDDNHKDLLKIILNFLQEGEMKVGGKTSAGLGNVKLISKSAYCITKENMREYFINGINDDNKSLLEVSL
>NZ_CP043998.1|WP_039773603.1|3581088_3581481_-|hypothetical-protein
MEKVNYKKEIIGMVEELGKDKEFWNRINQSRDYRNKEGKLGSSNIRSVATVCQNADCYEEIRLYIEYKIGKGNGWDDTLSNKKKFGQAVIDNMDKIYEMAGRDDKETLKIVSLYFGYLFWKKTAIEKGNL
>NZ_CP043998.1|WP_039773602.1|3581486_3582665_-|hypothetical-protein
MKVLLDFKSPLLIGSKKHSSNFIESDDVLKGSVVRAAFAKVILDNCCERNEADVKEVNGEKKMNWVYFRDKAGCLQCCFNNICKEFSNVRFSYFYPKGTEIIPQTSMVCKTDKNHGFIDLLVDDTSKGCTKCEGGSRVEFTSGLRTTDENKKPYSVIKSFTTKNKINPYSKTSADGMLYSIETVSCTPIKEDSDNEDESKLLFEGSIEGISENDLILFKRVRVGGDITTGLGKCVVSKLDSLKNEIEFKQIEKFSIDYKARNKNKGFIDKESNYISIKFIGDCILNFDFDGDVYLDTDELKKLWRKPLELEEDIKIEKIYTEVINYRGYDNSSISEDKREEAMTLISKGTVMVFSSKKSLRDLYSYFQVKQKCGFGLENENGFGDFEIYLGR
>NZ_CP043998.1|WP_039773600.1|3582664_3583174_-|hypothetical-protein
MSIEIYKVTIKTETPFNISSGTQDSGFIKDVSIKDANGKPYISGSTIKGKIRENYRMIQGEEKTKELFGDGGYRPSKIIVDNFYLTENEYSSNIRYGNAIDRYRKVTLDKALYSKEVISGTFHGEIEVNYNGDDSMKENLYLAIKMITSIGGSKSTGLGKVNIDIEEVV
>NZ_CP043998.1|WP_051144939.1|3583189_3584932_-|hypothetical-protein
MNDDNRGYKSQLYPSNDVYLSNKDIDSKEKRWMYKVNNEEFVPSEYDAEKMYCLISKLKGIDKETNELKKMFSSKDNDEVKDFLRDIYLSLSKGNKNSEKLGWASELKVDVVKGSIYKIKKYFLENNNLKDIRGGSILIDYLNNEVVIETLSKSGFSEENIVYCGGGNIFIVVPSGEGKQICKYLEQAFGNIALTAMNAFESITISLYEFAFDFKHISGVLSEKLEERKKLRLYKVNPDNDLKSINIKGKSINFSEYEEAVELKGSGVVCKLCDIRDAKYLIEESDGLASVCPSCLRKHLSGKAKSIFYDEFKEQTQVELKYNNIKSIDDISDDIAVIYGDGNNMGKIVMEIQNVFEMMYFSRKTDTITKRSVYEAINETMGEDAKFEVIALGGDDIFIIVPAKDSFNITTKIIDKFDKGFNNEITMSIGIVISKSNTPIASLFSIAQQKLKSAKAIIKKSKDIKEGSVDIIELLGNMHINLNHKGVFPVTNSRLKLMLKEMEEFKIKNRASAQLHKISYAQKNMIEEEFELFYYYHESKKKNKDESIDQLIKRIYGKSKERAQPYKIRWDDLILIWKMV
>NZ_CP043998.1|WP_039773596.1|3584962_3586660_-|TIGR02221-family-CRISPR-associated-protein
MSKKLFTFLGTTDYKPTVYYFNDDSVSEDNYEKLKTPYVQLSLCKKLGYDTELIVFLTPEAREANWISKDKKEGLQEILKKEGINAKAVDIKSGKDVNELWDNFNTIFEEFDKETDVYVDITYSLRSIPIIFMSLLSYARAVKKINIKGIYYGAFEVSETINIDNEELKLAPIFDLTFFNRIQDWANGTEKFLTTGDSRLLSDEILSVKNSVKEIFKTGTIDERNEARLMESIAKSLKAYSEDLFSCRGKKIVTDCKRLKDELNKIKKITISDFTPFSKIIDQLIDKFMPYTGEVINDSIYAIEQGREFRLLQQSYTMLQETLITYLTIGIGLDYKEKKQRKIAEDIMKEFYYRDESNCKLSEEEELFKAKSDEKIMVKIGQLYKEISDYRNDINHNGFSSGMHYSTFENNLYVFIEKFKEIVNNSYETNAEENLHKSAVSILSHKLLKSQEEELNRDWKVKRIVTLPEELRNEWSNINPNVEIEDDFNLVYKLKTFILENTNQEDYVIVQGEWGMTFTIVNMCFELNRVPIYATTERKTKETVKDGQVHSEKVFEHIRFRKYRI
>NZ_CP043998.1|WP_039773595.1|3588010_3588583_+|sigma-70-family-RNA-polymerase-sigma-factor
MDFNYIETLVTRCKDNDERAKEKLAEEFGQLIYNISKRTFIDGYNSYDIIQECYQSLFKSISMYNLDKHRFVAYATNAIKNNMNDLIKRIKTRSSTEGNNALSLHDNFEKDIPSQEISPETSLCEMCDYEDLRLALKNLTKDEKELIDFVFFKNYTVLDYAHIKNMCYSTAIVRKKNILRKIHNNISFYY

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043998_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_5

3586855-3587474

TypeIII

II-B

Consensus_repeat	Method
ATTTAAATACATCTCATGTTAATCTTAAAC	CRISPRCasFinder
ATTTAAATACATCTCATGTTAATCTTAAAC	CRT
ATTTAAATACATCTCATGTTAATCTTAAAC	PILER-CR

9 spacers

csx1,cas10,csm3gr7,csx10gr5,csm2gr11,cas6

The CRISPR arrays of NZ_CP043998_5

>merge|NZ_CP043998|5|3586855-3587474|CRISPRCasFinder,CRT,PILER-CR
GTATTATTACATCTCATGTTAATATTAAACTTCAAGATGGACGCATTCCCAGACTATACTAAGTTATTTAAATACATCTCATGTTAATATTAAACAGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAAATTTAAATACATCTCATGTTAATCTTAAACGTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTTATTTAAATACATCTCATGTTAATCTTAAACAAAGATTTTGAGATAAGAAAAGACGATTCAGATTAATTTAAATACATCTCATGTTAATCTTAAACTCTTTATCTTTATTTATTCCGTAAGTGGTCCTATATTTAAATACATCTCATGTTAATCTTAAACAATAGATTATACAACATCAGTCGCATATAATTACAAATTTAAATACATCTCATGTTAATCTTAAACTTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGAATTTAAATACATCTCATGTTAATCTTAAACGTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTTATTTAAATACATCTCATGTTAATCTTAAACCACATACCGTAAGAGTTACCACGTATTTTTTTATAATTTAAATACATCTCATGTTAATCTTAAAC

>NZ_CP043998|5|6|3586855-3587474|CRISPRCasFinder
GTATTATTACATCTCATGTTAATATTAAAC	TTCAAGATGGACGCATTCCCAGACTATACTAAGTT
ATTTAAATACATCTCATGTTAATATTAAAC	AGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAA
ATTTAAATACATCTCATGTTAATCTTAAAC	GTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTT
ATTTAAATACATCTCATGTTAATCTTAAAC	AAAGATTTTGAGATAAGAAAAGACGATTCAGATTA
ATTTAAATACATCTCATGTTAATCTTAAAC	TCTTTATCTTTATTTATTCCGTAAGTGGTCCTAT
ATTTAAATACATCTCATGTTAATCTTAAAC	AATAGATTATACAACATCAGTCGCATATAATTACAA
ATTTAAATACATCTCATGTTAATCTTAAAC	TTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGA
ATTTAAATACATCTCATGTTAATCTTAAAC	GTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTT
ATTTAAATACATCTCATGTTAATCTTAAAC	CACATACCGTAAGAGTTACCACGTATTTTTTTATA
ATTTAAATACATCTCATGTTAATCTTAAAC

>NZ_CP043998|5|2|3586855-3587474|CRT
GTATTATTACATCTCATGTTAATATTAAAC	TTCAAGATGGACGCATTCCCAGACTATACTAAGTT
ATTTAAATACATCTCATGTTAATATTAAAC	AGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAA
ATTTAAATACATCTCATGTTAATCTTAAAC	GTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTT
ATTTAAATACATCTCATGTTAATCTTAAAC	AAAGATTTTGAGATAAGAAAAGACGATTCAGATTA
ATTTAAATACATCTCATGTTAATCTTAAAC	TCTTTATCTTTATTTATTCCGTAAGTGGTCCTAT
ATTTAAATACATCTCATGTTAATCTTAAAC	AATAGATTATACAACATCAGTCGCATATAATTACAA
ATTTAAATACATCTCATGTTAATCTTAAAC	TTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGA
ATTTAAATACATCTCATGTTAATCTTAAAC	GTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTT
ATTTAAATACATCTCATGTTAATCTTAAAC	CACATACCGTAAGAGTTACCACGTATTTTTTTATA
ATTTAAATACATCTCATGTTAATCTTAAAC

>NZ_CP043998|5|2|3586920-3587474|PILER-CR
ATTTAAATACATCTCATGTTAATATTAAAC	AGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAA
ATTTAAATACATCTCATGTTAATCTTAAAC	GTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTT
ATTTAAATACATCTCATGTTAATCTTAAAC	AAAGATTTTGAGATAAGAAAAGACGATTCAGATTA
ATTTAAATACATCTCATGTTAATCTTAAAC	TCTTTATCTTTATTTATTCCGTAAGTGGTCCTAT
ATTTAAATACATCTCATGTTAATCTTAAAC	AATAGATTATACAACATCAGTCGCATATAATTACAA
ATTTAAATACATCTCATGTTAATCTTAAAC	TTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGA
ATTTAAATACATCTCATGTTAATCTTAAAC	GTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTT
ATTTAAATACATCTCATGTTAATCTTAAAC	CACATACCGTAAGAGTTACCACGTATTTTTTTATA
ATTTAAATACATCTCATGTTAATCTTAAAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	gnl\|CDD\|187863
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	cas10	mkCas0133_cas10_CAS-III	gnl\|CDD\|274208
NZ_CP043998.1\|WP_012059351.1\|3595316_3595925_-\|histidine-phosphatase-family-protein	unknown	unknown	gnl\|CDD\|223483
NZ_CP043998.1\|WP_039773603.1\|3581088_3581481_-\|hypothetical-protein	csm2gr11	mkCas0079_csm2gr11_CAS-III-D	unknown
NZ_CP043998.1\|WP_039773646.1\|3594500_3594929_-\|Rrf2-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224870
NZ_CP043998.1\|WP_039773594.1\|3589037_3590429_-\|MATE-family-efflux-transporter	unknown	unknown	gnl\|CDD\|240548
NZ_CP043998.1\|WP_167514417.1\|3595005_3595146_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	csm3gr7	cd09726_csm3gr7_CAS-III-D	gnl\|CDD\|187857
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NZ_CP043998.1\|WP_039773607.1\|3578080_3578611_-\|hypothetical-protein	csm2gr11	mkCas0077_csm2gr11_CAS-III-D	unknown
NZ_CP043998.1\|WP_039773595.1\|3588010_3588583_+\|sigma-70-family-RNA-polymerase-sigma-factor	unknown	unknown	gnl\|CDD\|274357
NZ_CP043998.1\|WP_039773590.1\|3593290_3594286_-\|NADH:flavin-oxidoreductase	unknown	unknown	gnl\|CDD\|239201
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	csx10gr5	cd09700_csx10gr5_CAS-III-D	gnl\|CDD\|131722
NZ_CP043998.1\|WP_039773589.1\|3596060_3597893_-\|PAS-domain-containing-sensor-histidine-kinase	unknown	unknown	gnl\|CDD\|223715
NZ_CP043998.1\|WP_039773592.1\|3592556_3593063_-\|nitroreductase	unknown	unknown	gnl\|CDD\|380330
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187814
NZ_CP043998.1\|WP_012059349.1\|3592185_3592386_+\|YvrJ-family-protein	unknown	unknown	gnl\|CDD\|378969
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	csm3gr7	cls000253_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|274902
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	csm3gr7	cd09683_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187814
NZ_CP043998.1\|WP_039773593.1\|3590487_3591363_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_039773596.1\|3584962_3586660_-\|TIGR02221-family-CRISPR-associated-protein	gnl\|CDD\|187863	cd09732, Csx1_III-U, CRISPR/Cas system-associated protein Csx1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Protein of this family often fused to HTH domain; Some proteins could have an additional fusion with RecB-family nuclease domain; Core domain appears to have a Rossmann-like fold; loosely associated with CRISPR/Cas systems; also known as TM1812 family.	1.44358e-54
NZ_CP043998.1\|WP_051144939.1\|3583189_3584932_-\|hypothetical-protein	gnl\|CDD\|274208	TIGR02577, thermophile-specific_DNA_repair_system, CRISPR-associated protein Cas10/Cmr2, subtype III-B. This model represent a Crm2 family of the CRISPR-associated RAMP module, a set of six genes recurring found together in prokaryotic genomes. This gene cluster is found only in species with CRISPR repeats, usually near the repeats themselves. Because most of the six (but not this family) contain RAMP domains, and because its appearance in a genome appears to depend on other CRISPR-associated Cas genes, the set is designated the CRISPR RAMP module. This protein, typified by TM1794 from Thermotoga maritima, is designated Crm2, for CRISPR RAMP Module protein 2.	3.28911e-11
NZ_CP043998.1\|WP_012059351.1\|3595316_3595925_-\|histidine-phosphatase-family-protein	gnl\|CDD\|223483	COG0406, phoE, Broad specificity phosphatase PhoE and related phosphatases [General function prediction only].	4.26784e-34
NZ_CP043998.1\|WP_039773646.1\|3594500_3594929_-\|Rrf2-family-transcriptional-regulator	gnl\|CDD\|224870	COG1959, COG1959, Predicted transcriptional regulator [Transcription].	1.43475e-25
NZ_CP043998.1\|WP_039773594.1\|3589037_3590429_-\|MATE-family-efflux-transporter	gnl\|CDD\|240548	cd13143, MATE_MepA_like, Subfamily of the multidrug and toxic compound extrusion (MATE)-like proteins similar to Streptococcus aureus MepA. The integral membrane proteins from the MATE family are involved in exporting metabolites across the cell membrane and are responsible for multidrug resistance (MDR) in many bacteria and animals. This subfamily includes Streptococcus aureus MepA and Vibrio vulnificus VmrA and functions most likely as a multidrug efflux pump.	1.83411e-118
NZ_CP043998.1\|WP_039773589.1\|3596060_3597893_-\|PAS-domain-containing-sensor-histidine-kinase	gnl\|CDD\|223715	COG0642, BaeS, Signal transduction histidine kinase [Signal transduction mechanisms].	4.66638e-47
NZ_CP043998.1\|WP_039773600.1\|3582664_3583174_-\|hypothetical-protein	gnl\|CDD\|187857	cd09726, RAMP_I_III, CRISPR/Cas system-associated RAMP superfamily protein. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily proteins.	5.88002e-13
NZ_CP043998.1\|WP_039773608.1\|3575738_3576431_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	2.89617e-16
NZ_CP043998.1\|WP_039773602.1\|3581486_3582665_-\|hypothetical-protein	gnl\|CDD\|131722	TIGR02674, cas_cyan_RAMP_2, CRISPR-associated RAMP protein, Csx10 family. CRISPR is a widespread repeat family in prokaryotes. At least 45 different protein families occur in prokaryotes only when these repeats are present. This family, a minor CRISPR-associated protein family, seems largely restricted to the Cyanobacteria. It belongs to the RAMP superfamily (pfam03787).	1.2386e-15
NZ_CP043998.1\|WP_039773595.1\|3588010_3588583_+\|sigma-70-family-RNA-polymerase-sigma-factor	gnl\|CDD\|274357	TIGR02937, RNA_polymerase_sigma_factor, RNA polymerase sigma factor, sigma-70 family. This model encompasses all varieties of the sigma-70 type sigma factors including the ECF subfamily. A number of sigma factors have names with a different number than 70 (i.e. sigma-38), but in fact, all except for the Sigma-54 family (TIGR02395) are included within this family. Several Pfam models hit segments of these sequences including Sigma-70 region 2 (pfam04542) and Sigma-70, region 4 (pfam04545), but not always above their respective trusted cutoffs.	3.73793e-15
NZ_CP043998.1\|WP_039773590.1\|3593290_3594286_-\|NADH:flavin-oxidoreductase	gnl\|CDD\|239201	cd02803, OYE_like_FMN_family, Old yellow enzyme (OYE)-like FMN binding domain. OYE was the first flavin-dependent enzyme identified, however its true physiological role remains elusive to this day. Each monomer of OYE contains FMN as a non-covalently bound cofactor, uses NADPH as a reducing agent with oxygens, quinones, and alpha,beta-unsaturated aldehydes and ketones, and can act as electron acceptors in the catalytic reaction. Members of OYE family include trimethylamine dehydrogenase, 2,4-dienoyl-CoA reductase, enoate reductase, pentaerythriol tetranitrate reductase, xenobiotic reductase, and morphinone reductase.	9.07269e-112
NZ_CP043998.1\|WP_039773592.1\|3592556_3593063_-\|nitroreductase	gnl\|CDD\|380330	cd20609, nitroreductase, nitroreductase family protein. A subfamily of the nitroreductase family containing uncharacterized proteins. Nitroreductase catalyzes the reduction of nitroaromatic compounds such as nitrotoluenes, nitrofurans and nitroimidazoles. This process requires NAD(P)H as electron donor in an obligatory two-electron transfer and uses FMN as cofactor. The enzyme is typically a homodimer.often found to be homodimers.	1.1679e-82
NZ_CP043998.1\|WP_051144940.1\|3579480_3580281_-\|CRISPR-associated-RAMP-protein	gnl\|CDD\|187814	cd09683, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	4.20897e-41
NZ_CP043998.1\|WP_012059349.1\|3592185_3592386_+\|YvrJ-family-protein	gnl\|CDD\|378969	pfam12841, YvrJ, YvrJ protein family. This family of short proteins are related to B. subtilis YvrJ protein. None of the members of this family have been functionally characterized.	1.20735e-10
NZ_CP043998.1\|WP_051144941.1\|3578627_3579497_-\|hypothetical-protein	gnl\|CDD\|274902	TIGR03986, CRISPR-associated_protein, CRISPR-associated protein. Members of this protein family, part of the larger RAMP family, are found exclusively in species with CRISPR systems, in local contexts containing other RAMP (Repeat-Associated Mystery Proteins).	3.08939e-15
NZ_CP043998.1\|WP_039773605.1\|3580280_3581072_-\|CRISPR-associated-RAMP-protein	gnl\|CDD\|187814	cd09683, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	4.35081e-50
NZ_CP043998.1\|WP_039773593.1\|3590487_3591363_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	3.9451e-30

>NZ_CP043998.1|WP_039773596.1|3584962_3586660_-|TIGR02221-family-CRISPR-associated-protein
MSKKLFTFLGTTDYKPTVYYFNDDSVSEDNYEKLKTPYVQLSLCKKLGYDTELIVFLTPEAREANWISKDKKEGLQEILKKEGINAKAVDIKSGKDVNELWDNFNTIFEEFDKETDVYVDITYSLRSIPIIFMSLLSYARAVKKINIKGIYYGAFEVSETINIDNEELKLAPIFDLTFFNRIQDWANGTEKFLTTGDSRLLSDEILSVKNSVKEIFKTGTIDERNEARLMESIAKSLKAYSEDLFSCRGKKIVTDCKRLKDELNKIKKITISDFTPFSKIIDQLIDKFMPYTGEVINDSIYAIEQGREFRLLQQSYTMLQETLITYLTIGIGLDYKEKKQRKIAEDIMKEFYYRDESNCKLSEEEELFKAKSDEKIMVKIGQLYKEISDYRNDINHNGFSSGMHYSTFENNLYVFIEKFKEIVNNSYETNAEENLHKSAVSILSHKLLKSQEEELNRDWKVKRIVTLPEELRNEWSNINPNVEIEDDFNLVYKLKTFILENTNQEDYVIVQGEWGMTFTIVNMCFELNRVPIYATTERKTKETVKDGQVHSEKVFEHIRFRKYRI
>NZ_CP043998.1|WP_051144939.1|3583189_3584932_-|hypothetical-protein
MNDDNRGYKSQLYPSNDVYLSNKDIDSKEKRWMYKVNNEEFVPSEYDAEKMYCLISKLKGIDKETNELKKMFSSKDNDEVKDFLRDIYLSLSKGNKNSEKLGWASELKVDVVKGSIYKIKKYFLENNNLKDIRGGSILIDYLNNEVVIETLSKSGFSEENIVYCGGGNIFIVVPSGEGKQICKYLEQAFGNIALTAMNAFESITISLYEFAFDFKHISGVLSEKLEERKKLRLYKVNPDNDLKSINIKGKSINFSEYEEAVELKGSGVVCKLCDIRDAKYLIEESDGLASVCPSCLRKHLSGKAKSIFYDEFKEQTQVELKYNNIKSIDDISDDIAVIYGDGNNMGKIVMEIQNVFEMMYFSRKTDTITKRSVYEAINETMGEDAKFEVIALGGDDIFIIVPAKDSFNITTKIIDKFDKGFNNEITMSIGIVISKSNTPIASLFSIAQQKLKSAKAIIKKSKDIKEGSVDIIELLGNMHINLNHKGVFPVTNSRLKLMLKEMEEFKIKNRASAQLHKISYAQKNMIEEEFELFYYYHESKKKNKDESIDQLIKRIYGKSKERAQPYKIRWDDLILIWKMV
>NZ_CP043998.1|WP_039773600.1|3582664_3583174_-|hypothetical-protein
MSIEIYKVTIKTETPFNISSGTQDSGFIKDVSIKDANGKPYISGSTIKGKIRENYRMIQGEEKTKELFGDGGYRPSKIIVDNFYLTENEYSSNIRYGNAIDRYRKVTLDKALYSKEVISGTFHGEIEVNYNGDDSMKENLYLAIKMITSIGGSKSTGLGKVNIDIEEVV
>NZ_CP043998.1|WP_039773602.1|3581486_3582665_-|hypothetical-protein
MKVLLDFKSPLLIGSKKHSSNFIESDDVLKGSVVRAAFAKVILDNCCERNEADVKEVNGEKKMNWVYFRDKAGCLQCCFNNICKEFSNVRFSYFYPKGTEIIPQTSMVCKTDKNHGFIDLLVDDTSKGCTKCEGGSRVEFTSGLRTTDENKKPYSVIKSFTTKNKINPYSKTSADGMLYSIETVSCTPIKEDSDNEDESKLLFEGSIEGISENDLILFKRVRVGGDITTGLGKCVVSKLDSLKNEIEFKQIEKFSIDYKARNKNKGFIDKESNYISIKFIGDCILNFDFDGDVYLDTDELKKLWRKPLELEEDIKIEKIYTEVINYRGYDNSSISEDKREEAMTLISKGTVMVFSSKKSLRDLYSYFQVKQKCGFGLENENGFGDFEIYLGR
>NZ_CP043998.1|WP_039773603.1|3581088_3581481_-|hypothetical-protein
MEKVNYKKEIIGMVEELGKDKEFWNRINQSRDYRNKEGKLGSSNIRSVATVCQNADCYEEIRLYIEYKIGKGNGWDDTLSNKKKFGQAVIDNMDKIYEMAGRDDKETLKIVSLYFGYLFWKKTAIEKGNL
>NZ_CP043998.1|WP_039773605.1|3580280_3581072_-|CRISPR-associated-RAMP-protein
MYLLDRFENKYIIKGILKAESPIHIGTGTVDFSPTAVDTPVIRDENNNPFIPGSSLKGVLRSFMERLLCSGIFNEYKSCNILDKDSGKKMELCISDKEVKEIKEKYKNDSNKEEKIASDIYKKECDVCKLFGGDYFASKLNILDARLISDKAYVQIRDGIAIDRDTLTVNDGAKFGFECVAAGTEFNFEMTVDNLDDNHKDLLKIILNFLQEGEMKVGGKTSAGLGNVKLISKSAYCITKENMREYFINGINDDNKSLLEVSL
>NZ_CP043998.1|WP_051144940.1|3579480_3580281_-|CRISPR-associated-RAMP-protein
MFGKLKNEAILTFDIVTQSPLYIREGTDNSLDPSAVDGKYMTTYKDGKLEPFIPGTSLKGAFRSRAERVLRNNGACDIINRHECIPNNKLKPRTGQERYKKSCPICRLFGSNVIKSRVSFSDAYVFNEYKVGQRTCVAIDRITGSAKGSALYSFEYIEDAVFKEKIALQNFEPYQIKLLLYLIEEMNEGFLTLGGLTSKGFGCVKAENLELKIKQYGKDDLSSKNYEFKDYYNAKNVKGFDEISKLVSYVDFTKLKRDGDIDEQTI
>NZ_CP043998.1|WP_051144941.1|3578627_3579497_-|hypothetical-protein
MSKPYNFIPLLKTKHTERDDKKCILKGRIDLEIKVLNAMHISEDSYDMNEEEILYKKFYTIGGKYSVPGTSLKGMIRNLAEMVSNSCISPTKDEQRILPNGKEKSCSVAQRCIICDVFGAMGKKSKVKVSDFLYEENSGIVNILGLPVLRTPNVKVSSIYLNEGVLKGYKIYNHGIESILKKGNYNCECLMKNATFKGYILYEDLDEEELKLLCYSIGLAGDFNHKLGYGKPAYYGSIEMTTKDDKYVQYAKDYIADCPDDIKKNIDLLSNIYSFKNAKKTPDYEGIEY
>NZ_CP043998.1|WP_039773607.1|3578080_3578611_-|hypothetical-protein
MDIERKKELLLLVDSIAKDIRNDNCGNYTPKIINAIEIAKKYNDMKKFGVVLEKLKSTTFGGNSEKEGYANFVDNIVNKREYKINTLNFEELEFVFSWVGRIIKTKKSNENYDNKNNNFHDRNKNNNYHDRNSNKFNKSNINKYSKEKTKSYYSTKSDSNEGLSSMAEQLMKWKSK
>NZ_CP043998.1|WP_039773608.1|3575738_3576431_-|CRISPR-associated-endoribonuclease-Cas6
MKVFEILLKVYLLEDIELNDSQNKILKLIDKTLGQDERTLELHNKNDFKNYCFNSFYPLEKDGIYKEGNIYTITIRTVDKYLATYLNNKLANSYTYSIKGLKADLRIIPIKKLKKIYSITPLVIKNDDGYWKNLISFEDFERRLKENLIKKHNNIFQEKINEDFKLYDSIELKNNKPIGTPYKDKTLLGDKISIDISEDDISQDLAYMALGVGMGEMNARGFGFMGYRWV
>NZ_CP043998.1|WP_039773595.1|3588010_3588583_+|sigma-70-family-RNA-polymerase-sigma-factor
MDFNYIETLVTRCKDNDERAKEKLAEEFGQLIYNISKRTFIDGYNSYDIIQECYQSLFKSISMYNLDKHRFVAYATNAIKNNMNDLIKRIKTRSSTEGNNALSLHDNFEKDIPSQEISPETSLCEMCDYEDLRLALKNLTKDEKELIDFVFFKNYTVLDYAHIKNMCYSTAIVRKKNILRKIHNNISFYY
>NZ_CP043998.1|WP_039773594.1|3589037_3590429_-|MATE-family-efflux-transporter
MTELENFILEGSIKKLLFKFSIPAISVFLANVLYNIIDAIFIGNQPNGSLGIAALTIVFPIQQIILALSQMIGVGIASITSRSLGAGDKLRAEKAVGTALTSSVLLGILIMVIGLVFIRPMLYIFGSLENILPYAVTFFRITLYCSVFFVFSIVANSIIQSEGHANIAMISMIIGPVINIPLDYILVTRLQYGIKGAAIATDISQIICFVFLLVYICLNSKILGVKVKNLTIDIKLLKEAISLGLSTFMTQLAYGILAIVLNNSLKIYGGSDLYVSAIGIYNRVFGFITITMYGIRQALQPIIGFNYGAKKFDRVKQSLKLAILASVIISLAFLIIIIGFTNKIAGAFTSDNGLIALTVPILRVMIFMSPLVGVQVIASSFFQYIGKPKPALFLSIMKPFIFLIPLMLIIPIFLKITGIFVSVPLADFLAAMISLIFIYREIKKMNKLNLIEGENKNSHFKLC
>NZ_CP043998.1|WP_039773593.1|3590487_3591363_-|AraC-family-transcriptional-regulator
MNTKNYVLDAIEYLEKHLLEGVSLEQLAKQFNFSKFHYARLFKAVLGENIGDYQMKRRLTIAAMSLLETRDSILNIAIMCGYSSQESFTRMFKAYFGITPKDYRDNKIEYLNLYKYSITQEDIERVMSYGTATEYEIIHKNSFEITGLLYHGDNKKHDVARIFNQTAQKVQLDKIYNQIDGVYGVDFCKNEEVRSYEFDFIAGIDSRYFSQIDRKDAELVHKYIPENDYAVYSLTNIIEKIQIQIQRNWFSLLNDELYVPCDNYAYEFYPNGFVPNQKNIDAYLFIPITAR
>NZ_CP043998.1|WP_012059349.1|3592185_3592386_+|YvrJ-family-protein
MQVTDLINLMVNNGFAIAVAAYLLIRLERQIDNLSSSINRLNTIISAKLGVAIDTDSPNDDSHNVA
>NZ_CP043998.1|WP_039773592.1|3592556_3593063_-|nitroreductase
MDFLELAKKRYSARKYDGKKVEDDKLGKILEAARVAPSGSNKQPVKLLILKDEEGLEKVSKAARIYGAPLIIVACGDHNIAGVIPFNNKSVVDIDTSIATDHMMMEATSLGLDSVWICSFDPEVIRREFNLPHNIEPINVLAIGYAVGEPASPNRHDKTRKSLDDLLL
>NZ_CP043998.1|WP_039773590.1|3593290_3594286_-|NADH:flavin-oxidoreductase
MRTLFDKTVINRMEIKNRFIRSATQELMAHEDGHLNDRLYELYENLAKGGVGLIITSGAYITADSKSMPGQIGFYNDNFIEEYQKLTDIIHGHESKVLLQVNYATKNGQNLKTDDVSLEDIGAIISAFGDAAARAEKAGFDGVEIHAAHGFLLSQFLSSRTNMRTDQYGGTLENNARIIIEIYNAIRSRTSKDFVVFLKVNSFDEIDSEKAFEDCQYICSQLSDSGIDGIEISGEGEASDYKESIYRDYAAKISASNNNIPIILVCKNRTPDTMVQILNSTGVEYFALSRPLIRQPDLVNLWMKDLNEVPKCISCSKCMQPNGTSCIFNKD
>NZ_CP043998.1|WP_039773646.1|3594500_3594929_-|Rrf2-family-transcriptional-regulator
MQISSRFTVAIHILAALEISNDVCTSEVIAGSIQNNPVVVRRIIGMLKKAELVDVNSGGGGAYLLKPVEDITLFDVYKAVDVVEDEKLFQIHENTNQECIIGANIQDVLMLMLPKAQSAMEEVLKSYTMADIVAGILEKKLN
>NZ_CP043998.1|WP_167514417.1|3595005_3595146_-|hypothetical-protein
MCEHYYIDEDEGQEVRSLCFKTGKGYNASNGVIADLKNTILKYNLE
>NZ_CP043998.1|WP_012059351.1|3595316_3595925_-|histidine-phosphatase-family-protein
MKNVITIQHTQSIHHTNGMVGSWTDWDLSEVGIQQANNIGKNLSNQLSDKKYVLYSSDLLRAKHTAEIVGRHLGVAPIFVAELRERNLGKCVGKSVQWLRDNIEVQEKSIDDKMFSDAESRRDEWNRLLPFFNELMTNKYENVIIVSHGDLLSVFNTMWLGMDIEMLNKSEIFGLAGGVSFMQETADGKRLIKRISDMSYIK
>NZ_CP043998.1|WP_039773589.1|3596060_3597893_-|PAS-domain-containing-sensor-histidine-kinase
MGNYVRSHNNKLKEMVCFIKIAIIVFVSIIIHMNLPKYWSSLYIHENTKFNIYIVSFSSLIIGINFIMCLIITGIVLQKRILLKNSWLIDNIIFTFIISIPIYLSKAHQSECKYLFLLLIIYSIIQYGSKCGIVTSIFSSGVILGADLLYAPLENGVNIYFQKDLIMCGVFILVAWILGYYVNIEAENNKKKDETLNTLSNEKKEMESLLLNNKICYDMLFENSLNSIIVHTNGEVIYANASATKLLGLKGENFYNHYLSEVNKDIKKKYSSISHNKLVKITSEESILNSDGEFIPVINTSSFFTYKGKPSVLTFLRDITSEKKVESLQEDIEKNLKLLNESREFNNLIMDFFTNMSHELKTPVNVIYSAVQTVDVYFGNYNLENMKKCKLYFKTMKQNCLRLIRIINNFLDVTKLNSDSGFIRIKKRNGNIVNIIEEITQSVASYVNDKDITLIFDTNVEEKIMGFDHDMMERIMLNLISNALKYSHSKGNIYVEFIDKQTSVNVKVRDEGDGIPKDKLNFIFERFGKVDNTLSRKCEGTGIGLYLVKSFVEMHGGKISVSSVEGQGSEFIIELPVELIKNEEEEDKILFKTNIEKIQIEFSDIYSLQS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043998_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_6

4626935-4627031

Orphan

Consensus_repeat	Method
CCATACTTGTATGGTAGTTATATTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP043998_6

>merge|NZ_CP043998|6|4626935-4627031|CRISPRCasFinder
CCATACTTGTATGGTAGTTATATTTATATTTTATCATAAGTATTTTAAAAAATCTATTACTAATCGATACTGCCATACTTGTATGGTAGTTATGTTT

>NZ_CP043998|6|7|4626935-4627031|CRISPRCasFinder
CCATACTTGTATGGTAGTTATATTT	ATATTTTATCATAAGTATTTTAAAAAATCTATTACTAATCGATACTG
CCATACTTGTATGGTAGTTATGTTT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_012060237.1\|4619177_4619600_-\|HIT-family-protein	unknown	unknown	gnl\|CDD\|223611
NZ_CP043998.1\|WP_023973088.1\|4633865_4634021_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182117
NZ_CP043998.1\|WP_012060250.1\|4635330_4635642_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_012060236.1\|4617731_4618289_-\|methyltransferase-domain-containing-protein	unknown	unknown	gnl\|CDD\|226472
NZ_CP043998.1\|WP_039771602.1\|4629011_4630187_+\|extracellular-solute-binding-protein	unknown	unknown	gnl\|CDD\|226618
NZ_CP043998.1\|WP_039771598.1\|4633134_4633578_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|379326
NZ_CP043998.1\|WP_012060242.1\|4626232_4626904_-\|GntR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224715
NZ_CP043998.1\|WP_039771826.1\|4612063_4613761_-\|methyl-accepting-chemotaxis-protein	unknown	unknown	gnl\|CDD\|223910
NZ_CP043998.1\|WP_017209073.1\|4635725_4635917_-\|PspC-domain-containing-protein	unknown	unknown	gnl\|CDD\|377200
NZ_CP043998.1\|WP_039771828.1\|4613843_4615307_-\|sugar-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|380478
NZ_CP043998.1\|WP_012060239.1\|4621428_4622841_-\|glucuronate-isomerase	unknown	unknown	gnl\|CDD\|376859
NZ_CP043998.1\|WP_012060246.1\|4632700_4632997_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_023973084.1\|4624980_4626042_-\|mannonate-dehydratase	unknown	unknown	gnl\|CDD\|235172
NZ_CP043998.1\|WP_039771603.1\|4627250_4628930_+\|chemotaxis-protein	unknown	unknown	gnl\|CDD\|214599
NZ_CP043998.1\|WP_039771600.1\|4630266_4632129_-\|APC-family-permease	unknown	unknown	gnl\|CDD\|223605
NZ_CP043998.1\|WP_039771596.1\|4636323_4638039_-\|dihydroxy-acid-dehydratase	unknown	unknown	gnl\|CDD\|376416
NZ_CP043998.1\|WP_039771604.1\|4623253_4624867_-\|mannitol-dehydrogenase-family-protein	unknown	unknown	gnl\|CDD\|223324
NZ_CP043998.1\|WP_154862475.1\|4615808_4617380_+\|IS1182-family-transposase	unknown	unknown	gnl\|CDD\|372705
NZ_CP043998.1\|WP_023973089.1\|4634173_4635235_-\|iron-containing-alcohol-dehydrogenase-family-protein	unknown	unknown	gnl\|CDD\|341453
NZ_CP043998.1\|WP_039771605.1\|4619884_4621390_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|225121

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_012060237.1\|4619177_4619600_-\|HIT-family-protein	gnl\|CDD\|223611	COG0537, Hit, Diadenosine tetraphosphate (Ap4A) hydrolase and other HIT family hydrolases [Nucleotide transport and metabolism / Carbohydrate transport and metabolism / General function prediction only].	8.84206e-16
NZ_CP043998.1\|WP_023973088.1\|4633865_4634021_-\|hypothetical-protein	gnl\|CDD\|182117	PRK09857, PRK09857, recombination-promoting nuclease RpnA.	0.000507074
NZ_CP043998.1\|WP_012060236.1\|4617731_4618289_-\|methyltransferase-domain-containing-protein	gnl\|CDD\|226472	COG3963, COG3963, Phospholipid N-methyltransferase [Lipid metabolism].	4.28401e-52
NZ_CP043998.1\|WP_039771602.1\|4629011_4630187_+\|extracellular-solute-binding-protein	gnl\|CDD\|226618	COG4134, COG4134, ABC-type uncharacterized transport system, periplasmic component [General function prediction only].	3.70364e-46
NZ_CP043998.1\|WP_039771598.1\|4633134_4633578_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|379326	pfam13673, Acetyltransf_10, Acetyltransferase (GNAT) domain. This family contains proteins with N-acetyltransferase functions such as Elp3-related proteins.	1.17172e-08
NZ_CP043998.1\|WP_012060242.1\|4626232_4626904_-\|GntR-family-transcriptional-regulator	gnl\|CDD\|224715	COG1802, GntR, Transcriptional regulators [Transcription].	2.29977e-50
NZ_CP043998.1\|WP_039771826.1\|4612063_4613761_-\|methyl-accepting-chemotaxis-protein	gnl\|CDD\|223910	COG0840, Tar, Methyl-accepting chemotaxis protein [Cell motility and secretion / Signal transduction mechanisms].	9.56532e-43
NZ_CP043998.1\|WP_017209073.1\|4635725_4635917_-\|PspC-domain-containing-protein	gnl\|CDD\|377200	pfam04024, PspC, PspC domain. This family includes Phage shock protein C (PspC) that is thought to be a transcriptional regulator. The presumed domain is 60 amino acid residues in length.	2.96494e-23
NZ_CP043998.1\|WP_039771828.1\|4613843_4615307_-\|sugar-ABC-transporter-substrate-binding-protein	gnl\|CDD\|380478	cd01536, PBP1_ABC_sugar_binding-like, periplasmic sugar-binding domain of active transport systems that are members of the type 1 periplasmic binding protein (PBP1) superfamily. Periplasmic sugar-binding domain of active transport systems that are members of the type 1 periplasmic binding protein (PBP1) superfamily. The members of this family function as the primary receptors for chemotaxis and transport of many sugar based solutes in bacteria and archaea. The sugar binding domain is also homologous to the ligand-binding domain of eukaryotic receptors such as glutamate receptor (GluR) and DNA-binding transcriptional repressors such as LacI and GalR. Moreover, this periplasmic binding domain, also known as Venus flytrap domain, undergoes transition from an open to a closed conformational state upon the binding of ligands such as lactose, ribose, fructose, xylose, arabinose, galactose/glucose, and other sugars. This family also includes the periplasmic binding domain of autoinducer-2 (AI-2) receptors such as LsrB and LuxP which are highly homologous to periplasmic pentose/hexose sugar-binding proteins.	5.72852e-57
NZ_CP043998.1\|WP_012060239.1\|4621428_4622841_-\|glucuronate-isomerase	gnl\|CDD\|376859	pfam02614, UxaC, Glucuronate isomerase. This is a family of Glucuronate isomerases also known as D-glucuronate isomerase, uronic isomerase, uronate isomerase, or uronic acid isomerase, EC:5.3.1.12. This enzyme catalyzes the reactions: D-glucuronate <=> D-fructuronate and D-galacturonate <=> D-tagaturonate. It is not however clear where the experimental evidence for this functional assignment came from and thus this family has no literature reference.	0
NZ_CP043998.1\|WP_023973084.1\|4624980_4626042_-\|mannonate-dehydratase	gnl\|CDD\|235172	PRK03906, PRK03906, mannonate dehydratase; Provisional.	0
NZ_CP043998.1\|WP_039771603.1\|4627250_4628930_+\|chemotaxis-protein	gnl\|CDD\|214599	smart00283, MA, Methyl-accepting chemotaxis-like domains (chemotaxis sensory transducer). Thought to undergo reversible methylation in response to attractants or repellants during bacterial chemotaxis.	8.49269e-47
NZ_CP043998.1\|WP_039771600.1\|4630266_4632129_-\|APC-family-permease	gnl\|CDD\|223605	COG0531, PotE, Amino acid transporters [Amino acid transport and metabolism].	1.31621e-27
NZ_CP043998.1\|WP_039771596.1\|4636323_4638039_-\|dihydroxy-acid-dehydratase	gnl\|CDD\|376416	pfam00920, ILVD_EDD, Dehydratase family.	0
NZ_CP043998.1\|WP_039771604.1\|4623253_4624867_-\|mannitol-dehydrogenase-family-protein	gnl\|CDD\|223324	COG0246, MtlD, Mannitol-1-phosphate/altronate dehydrogenases [Carbohydrate transport and metabolism].	9.84076e-117
NZ_CP043998.1\|WP_154862475.1\|4615808_4617380_+\|IS1182-family-transposase	gnl\|CDD\|372705	pfam13751, DDE_Tnp_1_6, Transposase DDE domain. Transposase proteins are necessary for efficient DNA transposition. This domain is a member of the DDE superfamily, which contain three carboxylate residues that are believed to be responsible for coordinating metal ions needed for catalysis.	5.32538e-38
NZ_CP043998.1\|WP_023973089.1\|4634173_4635235_-\|iron-containing-alcohol-dehydrogenase-family-protein	gnl\|CDD\|341453	cd08174, G1PDH-like, Glycerol-1-phosphate dehydrogenase-like. These glycerol-1-phosphate dehydrogenase-like proteins have not been characterized. The protein sequences have high similarity with that of glycerol-1-phosphate dehydrogenase (G1PDH) which plays a role in the synthesis of phosphoglycerolipids in Gram-positive bacterial species. It catalyzes the reversibly reduction of dihydroxyacetone phosphate (DHAP) to glycerol-1-phosphate (G1P) in a NADH-dependent manner. Its activity requires Ni++ ion.	2.52043e-157
NZ_CP043998.1\|WP_039771605.1\|4619884_4621390_-\|MFS-transporter	gnl\|CDD\|225121	COG2211, MelB, Na+/melibiose symporter and related transporters [Carbohydrate transport and metabolism].	5.17655e-95

>NZ_CP043998.1|WP_012060242.1|4626232_4626904_-|GntR-family-transcriptional-regulator
MALEVNKNTTSKTIYYKLRDEIINLYLEPGTSISEKELSEKYSVSRTPVREALVRLAQEGLVNIYPQKGTVVSLIDLSAVEEGRFLREHLERAVVKEACKEFSQENVLALEMNLKLQKMYIENNDYKKLFEADEEFHKIIFEGSNKKRVWNSINDGSTEFQRIRMLRLVTNSSWDNIYLQHKEIFNAIKNKSPEIAEDFMKEHLNMVTFDKNKIKEKYPNYFK
>NZ_CP043998.1|WP_023973084.1|4624980_4626042_-|mannonate-dehydratase
MKMGFRWYGEGNDTVTLEQIKQIPGVGGIVWALHDMAAGEEWPMEKILEVKKSADKYGFNMDVVESVNVHEDIKLGLPTRDKYIENYKKTIEKLAKVGVKVICYNFMPVFDWLRTDLFKKAEDGSTALFYEKAKIKDIDPMELVNKIASNPDLTMPGWEPERLKNLSQLFEAYKNVTEEDLWNNLKYFLEQIIPVAEINDIKMAVHPDDPPWPIFGLPRIVKNRDDLARLLKLVDNPYNCLTLCSGAIGSDPNNNVPAMIREFGNRIAFAHIRNVKIYENGDFIETSHRTCDGSLDICDIVKAYHEVGFTGYVRPDHGRHIWNEQCRPGYGLYDRALGIMYLWGIWDSLERNK
>NZ_CP043998.1|WP_039771604.1|4623253_4624867_-|mannitol-dehydrogenase-family-protein
MNNAKIVLSKESIKNSDLWEKAGIEIPKFDYDKMSASTKENPTWVHFGAGNIFRGFIAILQQELLNTGKAKSGIVAVEGYDYEIIDEIYSPYDNLSLLVIMKPDGSLDKKVVGSIGESLAGDYSREEDWNRLKEIFSNPSLQIASFTITEKGYSVKNLSQQDTTDGLEHPVSIIAKVASLAYVRYQNGQLPIAFVSMDNCSKNGEKLHNAMETMIKNWVENGLVDKGFLEYINDTKKVSFPWSMIDKITPRPSQSVKNTLEAVGFDSTKIVTTSKNTYIAPFVNAEGPQYLVIEDNFPNGRMPLEEAGVFLTNRETVERVETMKVTTCLNPLHTSLAVFGCLLGFDLIADEMKDPALKKLVEKIGYEEGMPVVVNPGILNPEDFIKEVVEVRLPNPYIPDTPQRIASDTSQKVGIRFGETIKAYSKREDLDAKELKYIPLVIAGWCRYLMGLDDNGNVMELSPDPLLDELRKYVADIKLGSKESVESSLKSILINEEIFGVNLYTIGLGEKIEGYFNELISGAGAVRATLEKYLDCK
>NZ_CP043998.1|WP_012060239.1|4621428_4622841_-|glucuronate-isomerase
MKNFMDENFLLSNQTAIDLYHNYAKNLPIIDYHCHIDPKEIYENKKFSNITEAWLYGDHYKWRAMRSNGIDEKCITGDGSDYDKFLAWSQTIPMAIGNPLYHWTHLELQRFFGIYEPLDEDTAPEIWKRANELLNGEGFNVRDLIIKSNVETICTTDDPIDTLEYHIKIKEDASFNVNVLPTLRPDKGIEINLDGFVSWVKDLEKVSEVSINNYDEFLKALDSRIRFFHSVGCRIADHGIDGVVVYADSSKEEAEAIFAKALEGKSISIDEEKKYKTYTLRHVFKLYHELGWTMQLHIAALRSNNTKMLEKIGVNTGFDSINDESIAYPLSRLLDSVDRENSLPKTILYTLNPKDNYVLGTMIGNFQGDGIPGKMQFGAAWWFNDNKDGMIEQMKALGNLGLLGRFVGMLTDSRSFLSYTRHEYFRRIACNLIGEWVENGEVPKNDKLLKRIVQGICYSNAKEYFGFDEK
>NZ_CP043998.1|WP_039771605.1|4619884_4621390_-|MFS-transporter
MSNNNRKITIARGVGYGLVDLMGGGAFTIIGAFLLFFYTTFAGLTPIEGASIIAIARIVDAVASLFIGSISDNFYKTKLGKLFGRRRFFLLIGAPLMADYVLLWVTGRSYAFYLVTYLLFEIIAAMVLIPWETLPAEMTKDFTDRTKLSASRMFISATGTFLATFVPGRLIAFFGDKSPQAYFINGLVFAIIYAICILISHKVTWERDLTPEMEQELLNGSTSKSFGEQLMTIVKVAGDYVSTFKIRAFRQHLAIYICSFTAKDLFNSVFIYFCVFNLGVSSTTAANVLSLSIIGIPVTILGGFLMIKVGPGNLYKMAYSIMIVCLLAFYGLYVGNLGSNIVLLFVIGTIYQVGRSLLEFTPWNVFPFIPDVDEMVTRQRREGLFAAVMTFTRKSSVAIATFVIGVVLQESGFVKGQATQSPQVVSTIATLLAVGCISLLVIALICAATFKLNKRTHGILVDEVERLKNNGSKEEVTSETKTIVENLTGYKYENVWKETVV
>NZ_CP043998.1|WP_012060237.1|4619177_4619600_-|HIT-family-protein
MSNKNNCLYCDKDEKLDNLMIEICKLEVSTLYLFKEQSHKGRCIVAYDKHVKELFELDDKELELYMKDVTRAAAMIKKTFSPDKINYGAYSDTLPHLHFHLVPKYKDGYSWGGVFEMNPQKKYLSDEEYVKRINLIKENL
>NZ_CP043998.1|WP_012060236.1|4617731_4618289_-|methyltransferase-domain-containing-protein
MWIKFLMEYFKSPRTVGAVAPSSKKLAEKMAHDIDFDHAKCIVEYGPGTGVFTDRLMKKIKDHTMLMLVEYNEEFCRELEEKYGEYNNVVIVNDSAENVDKYLKEYNIKEVDYVVSGLPFASLPKNMSNSILKKTKDILKKNGLFITFQYTLLKKGYIGSYFEDISLERVVLNIPPAYVLKCQNT
>NZ_CP043998.1|WP_154862475.1|4615808_4617380_+|IS1182-family-transposase
MNDDFQLILPLNLENLIPSDDSVRLLSHVLEGLDYTKLYKAYSSVGRKPAVEPKIMFKIISYAYSQNIYSSRKIEKACKRDINFKWLLQCYKAPDHATISRFRKDYISNEVIEDLFYQQVNYLANQNEILFENAFIDGTKIEANANRYTFVWKKTILKNEEKMFDKILVLLENINLGELKKFTVQKETLIDDIDKILQWLEYEKKKRNIEFVHGIGKRKTKIQKWTEQLSEYKEREEKYNLSKKIFSKRNSYSKTDPDATFMHMKDDHMRNSQLKPAYNVQIAVESEYVTGVGIFDDRNDIATLIPMLNNMKEKIGRKYLNIIADSGYESEENYLFLESNKQTPYIKPQTYEKWKKRSFKNDISKRENMKYDAESDFYICHNNRKLIPTSIIYRKSASGYKSEVTVYECENCDNCDYKVKCTKAKGNRKMQVSKTFVEKREISYKNITTEFGTKLRMNRSIQVEGAFGVLKSDYEFNRFLTRGKNSVQTEFILLCFGYNINKLHSKIQNEKTQNHLHELKPTA
>NZ_CP043998.1|WP_039771828.1|4613843_4615307_-|sugar-ABC-transporter-substrate-binding-protein
MEILNFRLRKLSCIVLIILVGSILSACSQVGKVIVDNEPKEDRQKDYIEEVPTQTVTNEKSVDLAPLYDQVRNLKGQEALDFFESLKSKGLSDSDILEFFINLPLSDANKEITDIYKNEKFETYMSTYPTGKPFGNYKWTNGDGTKIKGAFSELDLKLPFSNYVALKSGPVGDLNKKYRIGVAIHGFDQPWNVSLADAAQWEAERHPNVEVDVKDAQWDNDRMADIIDSFVLQKVDGILTWPMVESETTIAPVKRAIEAGIPVVSVDRMTGLEETTSRVTGNFPANGAQCGMYLIWKLAKEGSLNANVVLLRKPSGSTADANRTGHFLKVLSYFPDIHILKSYHDEDNTAEALANMQLALNEYPSIDVVFGTGDHEAIAAYDASKNANRLNSRKDAKKMMFLSIDDSKKAITSVKDGLFEVNTPYTPLISDIGMRTLLNIITKNGSMPHDIITPNIPMVTKDGDTIFGLKTQTPDQWYEYTFGAPIK
>NZ_CP043998.1|WP_039771826.1|4612063_4613761_-|methyl-accepting-chemotaxis-protein
MKKISSVPGTIPLTIKSKLIISFSLIIFLVSAVGITSYMTMRSYLVQENIMIEKNVMANDIIILINSIPQDISKYILNPTADNKKIIDDKFININKNQEFIKDNVSGEKALKSFDAVSRMLESYSEENIKLFESKNATEMVEKNKLMNRFSKLIQNSMQEYMSVELDQQNKARADLAKKSNFTGVLIIVFIVSIGFLSIIFAIFFSIKLGKSLNKIVLLADDIANGNLQVEEYKVNSNDEVSLLASSFNEMTKNLRTMIKGIINNSKDLYESSTMIKDRAKESVKAVNQIAVSTQDAVDGSQYQFSEAKRTEEAVNRLIKMNSTIKEKSNNVLSSANKSLKIAEGGNEKVRSMLNQMNTIKEQVMNIQSVTGILKENSSQIETILDTISKITASTELLALNAAIEAARAGEYGKGFAVVSDEIRKLATSSATSTVEISKILTQIQNYINVLIKSMSIAVSEVMSGSEKVLEVEGAFKNIVESNNDVDGEIKNISDEILVMVNEINAIEKISKNICEISNKSLEGSTDISAIVEEQLATQEEFFASATTLANISSELANVVSKFRV
>NZ_CP043998.1|WP_039771603.1|4627250_4628930_+|chemotaxis-protein
MLKNIKIINSVILMVILSTVVSLSIAIIGYNNMKTINSNSSSMYTIALTRIIKTEEIRQTFLNIRLNVNRISISEFNDDDVAAIDNDYSAINKMVEDYENLSLSTIETNNLSEFKKDSSAYYEQIKNLEKGNKLYGIDLEKFNQLGVEMQLFLDNLVTYSSNTANALHNDNMSLYIRSTKIFFITFFIGFILQILVSSSIILVIRKSIKEIMSDLDNVAAGDFSFEINTNLKNEFGRMKKSLKVTISNISSMLEEVQNSANVVNIQATNLLGASDEMSSSAQEINAAVQEVANAATEQSSDLMNVKTSLDSFADSLDQITSSINDVNSNIHNISSMAEDSNSKLEFLFNSIKDVNESFDTVRNKVVQLDNHVEQVNNITTIINSIADQTDLLALNAAIESARAGEVGRGFSVVAEEIRKLAEQSKVSASNISGLITNINNEAQIAVKTTDLGKDSLNNQSVLIEDSIKSFALIFKAINTILPRVDNINKSIENINIEKDLIISKTLDISGVSEENAASSEEIAASVQQINSSFNDVATSAQTLSNLTTSMMNEVSKFKL
>NZ_CP043998.1|WP_039771602.1|4629011_4630187_+|extracellular-solute-binding-protein
MKNFKFLNVTLVIVLMTTILTGCGSKNVSKSTQPITLNIIDVSGSMQLVGDSIDQFKAANPDLIGDVVVKKSTALEVPSLLKAQILSEDMKTNLIFTGIDGLSTCIDRDVIENIMPAYGSRFPDLESNYSSGAKATYDLVKGYAITYVYSPSGPFFTYNPDTVQNIPKTPDELLAFAKANPGKFTYARPAGSGPGRIFLQGLPYILGDKDPKDPKTWDKTWAYLKELNQYIDYYPAKTGTTFTELKDGKRSIIASQLGWDMNQRIIGGIPQTYQGFVLNNTTLVADAQYMAIPKGLSDEQKNVVLKLMAWLMMPKMQAITYDSGYFYPGPSVKNVSLDMAPKESQDKIKPAIRQSYEDSINTLPNSTQLDTTKFMDALNMWDQLFGTKVKR
>NZ_CP043998.1|WP_039771600.1|4630266_4632129_-|APC-family-permease
MLTKFLDVLLGEPLSNEQGCNEKYNIPFGLAIMASDAISSVAYAAQEILFVLIVLGVAAYQWLTWTSFMIIGLLIILTISYIQIIRAYPQGGGAYKVANENIGKKSGLAAGAGLIISYILTVAVSASAGADAIISAFSNLTEYKVMFVLIIIIVLTILNLRGISESSKIFAIPTYIFIFSMAFMILYGLFKYFILNIHPEPMYSIPANTTENVSIFLILRAFSSGCSALTGVEAVSNSVPNFQEPSQKSAKTVMILLAALIFFIFGGTSVLAIFYTAVPIANGPTVVSQIAFAIFGNGIMYYIIQFSTAVILLMACNTAYTGFPMLMYIVGKDGFAPRQFTIRGKRLSFSFGIVALSCIACILVIVFKADTHRLIPLYAIGVFISFTLGQFGMVNHWRKEKGKGWVKRAIINGIGSVVTLLTTIIILIEKFSEGAFIVAILIPIIIVIQLRIKKHYDKVACGLSISQLNLKKVDLRKKYTHIVIVPIASLNKATIGALQYAQSVSDNVIALNISPDKEAMEKLKSRWSELDTDILLVAKYSPYRAVVTPLLKNIELIANSTAKDEKITVIVPQFVTNERFGEVLHNHTSFFIRETLLKNDNIIVSTYPYHLLDEDVKQSK
>NZ_CP043998.1|WP_012060246.1|4632700_4632997_+|hypothetical-protein
MAQNHICELCNRNVSSITKHHLIPLEKGGEKFKTLSLCSTCHRQIHALFTNRELATHYRSLESLKKDIKIVKFLKFIQNIPGDSYLDIKKSRHVRKSC
>NZ_CP043998.1|WP_039771598.1|4633134_4633578_-|GNAT-family-N-acetyltransferase
MNNITYEFINYKSKEFKEVSELRFKILFKPYNKIHKYDYDELDYSSIHLVALDEGTVVAYSRMTNYNMNGKMTNIVVSEKYVGKGIGIEMLKRHKIKAKEFGVICLYLNARLDTINFYKKAGFQCKGNIFISEKSGLALQPMYFKIN
>NZ_CP043998.1|WP_023973088.1|4633865_4634021_-|hypothetical-protein
MEKLRKGEHEKAMEKAKEMLDKGCGMGDIVEETKLSEENVMKAKRKWEDKS
>NZ_CP043998.1|WP_023973089.1|4634173_4635235_-|iron-containing-alcohol-dehydrogenase-family-protein
MKTSTHRIAIPSILEVGKGNINNVGNLIKKAMFKSVLICFGEGLEELFGDSICNSLKEANIDISRIETISDVNFEKISVKAFEISNDVEALIGVGGGKAIDAVKYMSFLRKLPFISIPTSTSNDGFSSAGASLLVNGKRMSLPAKTPYGIIVDIDVIKSAPEKFIYSGIGDLVSNITALYDWKFEEENGRIIIDDFATMISKKAVNSFIRTEFKNIKDDLFLKELVDSLILNGISMEIAGDSSPASGSEHLISHALDKFLEMPQLHGIQVGIATYIMAKVQDHRFERISKILKETNFFEHAKTLKMKKKDYKKAIDIAPSIKPNRYTYIHVDENRILAKKIIDEDEILNYILI
>NZ_CP043998.1|WP_012060250.1|4635330_4635642_-|hypothetical-protein
MDKVNSLIKNTPIHLTTNTIVLIIVAIIALYILIKAIAGIIRIAALIGVCWFILMSIQSTNLINIPIIREAYTTVEKIIPSKELWTEALDKADKINKVVNDLK
>NZ_CP043998.1|WP_017209073.1|4635725_4635917_-|PspC-domain-containing-protein
MEKRLYLSATDKKLAGVCGGIAEYFGLDSTLVRIGWAILIVCAGSGLLLYIICALIIPKQPLL
>NZ_CP043998.1|WP_039771596.1|4636323_4638039_-|dihydroxy-acid-dehydratase
MISQEVRKIAPEMDPLRRGMGWTTEDLSKPQIIVESTFGDSHPGSAHLLKFANRAVEGITQSGGKGARYFATDICDGMSQGHDGINYSLASRDTLTSLIEIHANATPFDGGVFISSCDKAVPSHLMSIGRLNIPAIMVTGGVMEAGPDLLTLEQIGAYSAMCQRGEISEEKLTFYKENACPSCGACSFMGTAATMQVMAEALGLMLPGSSLMPATCEDLEEVALKAGRQAVELAKMNLRPKDIVTIKSFENAILVHAAISGSTNSLLHLPAIAHEFGLYIDEETFDRIHKDAHYLLNIRPAGKWPAQYFYYAGGVPAIMEELKHLLHLDVMTVTGKTLGENLEELKTNGYYEKCNEYLEKVGLKKEDVIRPFNDAIGTNGSVSILKGNIAPEGAVVKHSAVPKEMHEAILKAKPFDSEEEAIDAVLRKIIRPGDAVIIRYEGPKGSGMPEMFYTTEAIASDEELSASIALITDGRFSGASKGPAIGHVSPEAAVGGPIALIEEDDLIEISIPNRVLQIVGIKGKKCSKEEVEKVFEERRKNWKPRKSKYESGILKIFSEHAVSPMKGGYMK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043998_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_7

5405178-5405383

Orphan

Consensus_repeat	Method
TGGTTGAATGATAATGGAACTTGGTA	CRISPRCasFinder

3 spacers

The CRISPR arrays of NZ_CP043998_7

>merge|NZ_CP043998|7|5405178-5405383|CRISPRCasFinder
TGGGTTAATGATTCCGGAACTTGGTACTATATTAAAGCAGATGGTATCATGGCTACTGGCTGGCTCAAAGATGGATCAACTTGGTATTTCTTAACTGGGTCAGGTGCCATGAAAACTGGCTGGTTGAATGATAATGGAACTTGGTATTACTTACAATCATCAGGTGCTATAAAGACTGGTTGGTTAAATGATAATGGAACTTGGTA

>NZ_CP043998|7|8|5405178-5405383|CRISPRCasFinder
TGGGTTAATGATTCCGGAACTTGGTA	CTATATTAAAGCAGATGGTATCATGGCTACTGGC
TGGCTCAAAGATGGATCAACTTGGTA	TTTCTTAACTGGGTCAGGTGCCATGAAAACTGGC
TGGTTGAATGATAATGGAACTTGGTA	TTACTTACAATCATCAGGTGCTATAAAGACTGGT
TGGTTAAATGATAATGGAACTTGGTA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_039770697.1\|5420237_5422469_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_039770696.1\|5422792_5424214_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_023976118.1\|5391124_5391904_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|200578
NZ_CP043998.1\|WP_051144798.1\|5393875_5396947_-\|glycosyltransferase	unknown	unknown	gnl\|CDD\|133055
NZ_CP043998.1\|WP_039770703.1\|5413960_5416066_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_039770705.1\|5409168_5410236_-\|bacteriocin	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_023974294.1\|5397338_5397623_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_023976119.1\|5391997_5392831_-\|NAD(P)-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|223528
NZ_CP043998.1\|WP_023974296.1\|5399143_5400739_-\|peptide-chain-release-factor-3	unknown	unknown	gnl\|CDD\|179105
NZ_CP043998.1\|WP_051144796.1\|5410327_5413645_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_023974295.1\|5398033_5398993_+\|DNRLRE-domain-containing-protein	unknown	unknown	gnl\|CDD\|366248
NZ_CP043998.1\|WP_039770713.1\|5401268_5403152_+\|N-acetylmuramoyl-L-alanine-amidase-family-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_039770702.1\|5416443_5418498_-\|diguanylate-cyclase	unknown	unknown	gnl\|CDD\|225116
NZ_CP043998.1\|WP_023976120.1\|5392848_5393808_-\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187566
NZ_CP043998.1\|WP_039770699.1\|5418673_5419981_-\|methyl-accepting-chemotaxis-protein	unknown	unknown	gnl\|CDD\|223910
NZ_CP043998.1\|WP_039770707.1\|5408004_5408877_-\|glycerophosphodiester-phosphodiesterase	unknown	unknown	gnl\|CDD\|176506
NZ_CP043998.1\|WP_039770709.1\|5405783_5407733_+\|N-acetylmuramoyl-L-alanine-amidase-family-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_023976115.1\|5388705_5390022_-\|nucleotide-sugar-dehydrogenase	unknown	unknown	gnl\|CDD\|223749
NZ_CP043998.1\|WP_017212092.1\|5424647_5426402_-\|N-acetylmuramoyl-L-alanine-amidase-family-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_051144797.1\|5390223_5391141_-\|UDP-3-O-(3-hydroxymyristoyl)glucosamine-N-acyltransferase	unknown	unknown	gnl\|CDD\|100043

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_039770697.1\|5420237_5422469_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	6.87124e-38
NZ_CP043998.1\|WP_039770696.1\|5422792_5424214_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	1.80654e-38
NZ_CP043998.1\|WP_023976118.1\|5391124_5391904_-\|hypothetical-protein	gnl\|CDD\|200578	cd10954, CE4_CtAXE_like, Catalytic NodB homology domain of Clostridium thermocellum acetylxylan esterase and its bacterial homologs. This family is represented by Clostridium thermocellum acetylxylan esterase (CtAXE, EC 3.1.1.72), a member of the carbohydrate esterase 4 (CE4) superfamily. CtAXE deacetylates O-acetylated xylan, a key component of plant cell walls. It shows no detectable activity on generic esterase substrates including para-nitrophenyl acetate. It is specific for sugar-based substrates and will precipitate acetylxylan, as a consequence of deacetylation. CtAXE is a monomeric protein containing a catalytic NodB homology domain with the same overall topology and a deformed (beta/alpha)8 barrel fold as other CE4 esterases. However, due to differences in the topography of the substrate-binding groove, the chemistry of the active center, and metal ion coordination, CtAXE has different metal ion preference and lacks activity on N-acetyl substrates. It is significantly activated by Co2+. Moreover, CtAXE displays distinctly different ligand coordination to the metal ion, utilizing an aspartate, a histidine, and four water molecules, as opposed to the conserved His-His-Asp zinc-binding triad of other CE4 esterases.	2.46754e-05
NZ_CP043998.1\|WP_051144798.1\|5393875_5396947_-\|glycosyltransferase	gnl\|CDD\|133055	cd06433, GT_2_WfgS_like, WfgS and WfeV are involved in O-antigen biosynthesis. Escherichia coli WfgS and Shigella dysenteriae WfeV are glycosyltransferase 2 family enzymes involved in O-antigen biosynthesis. GT-2 enzymes have GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.	1.12338e-24
NZ_CP043998.1\|WP_039770703.1\|5413960_5416066_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	3.93465e-36
NZ_CP043998.1\|WP_039770705.1\|5409168_5410236_-\|bacteriocin	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	1.09236e-15
NZ_CP043998.1\|WP_023976119.1\|5391997_5392831_-\|NAD(P)-dependent-oxidoreductase	gnl\|CDD\|223528	COG0451, WcaG, Nucleoside-diphosphate-sugar epimerases [Cell envelope biogenesis, outer membrane / Carbohydrate transport and metabolism].	1.49213e-39
NZ_CP043998.1\|WP_023974296.1\|5399143_5400739_-\|peptide-chain-release-factor-3	gnl\|CDD\|179105	PRK00741, prfC, peptide chain release factor 3; Provisional.	0
NZ_CP043998.1\|WP_051144796.1\|5410327_5413645_-\|hypothetical-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	4.36729e-20
NZ_CP043998.1\|WP_023974295.1\|5398033_5398993_+\|DNRLRE-domain-containing-protein	gnl\|CDD\|366248	pfam00688, TGFb_propeptide, TGF-beta propeptide. This propeptide is known as latency associated peptide (LAP) in TGF-beta. LAP is a homodimer which is disulfide linked to TGF-beta binding protein.	2.09382e-05
NZ_CP043998.1\|WP_039770713.1\|5401268_5403152_+\|N-acetylmuramoyl-L-alanine-amidase-family-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	5.17279e-30
NZ_CP043998.1\|WP_039770702.1\|5416443_5418498_-\|diguanylate-cyclase	gnl\|CDD\|225116	COG2206, COG2206, c-di-GMP phosphodiesterase class II (HD-GYP domain) [Signal transduction mechanisms].	9.85897e-54
NZ_CP043998.1\|WP_023976120.1\|5392848_5393808_-\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187566	cd05256, UDP_AE_SDR_e, UDP-N-acetylglucosamine 4-epimerase, extended (e) SDRs. This subgroup contains UDP-N-acetylglucosamine 4-epimerase of Pseudomonas aeruginosa, WbpP, an extended SDR, that catalyzes the NAD+ dependent conversion of UDP-GlcNAc and UDPGalNA to UDP-Glc and UDP-Gal. This subgroup has the characteristic active site tetrad and NAD-binding motif of the extended SDRs. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	3.86501e-75
NZ_CP043998.1\|WP_039770699.1\|5418673_5419981_-\|methyl-accepting-chemotaxis-protein	gnl\|CDD\|223910	COG0840, Tar, Methyl-accepting chemotaxis protein [Cell motility and secretion / Signal transduction mechanisms].	1.84077e-39
NZ_CP043998.1\|WP_039770707.1\|5408004_5408877_-\|glycerophosphodiester-phosphodiesterase	gnl\|CDD\|176506	cd08563, GDPD_TtGDE_like, Glycerophosphodiester phosphodiesterase domain of Thermoanaerobacter tengcongensis and similar proteins. This subfamily corresponds to the glycerophosphodiester phosphodiesterase domain (GDPD) present in Thermoanaerobacter tengcongensis glycerophosphodiester phosphodiesterase (TtGDE, EC 3.1.4.46) and its uncharacterized homologs. Members in this family show high sequence similarity to Escherichia coli GP-GDE, which catalyzes the degradation of glycerophosphodiesters to produce sn-glycerol-3-phosphate (G3P) and the corresponding alcohols. Despite the fact that most of GDPD family members exist as the monomer, TtGDE can function as a dimeric unit. Its catalytic mechanism is based on the general base-acid catalysis, which is similar to that of phosphoinositide-specific phospholipases C (PI-PLCs, EC 3.1.4.11). A divalent metal cation is required for the enzyme activity of TtGDE.	1.54162e-92
NZ_CP043998.1\|WP_039770709.1\|5405783_5407733_+\|N-acetylmuramoyl-L-alanine-amidase-family-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	2.90746e-38
NZ_CP043998.1\|WP_023976115.1\|5388705_5390022_-\|nucleotide-sugar-dehydrogenase	gnl\|CDD\|223749	COG0677, WecC, UDP-N-acetyl-D-mannosaminuronate dehydrogenase [Cell envelope biogenesis, outer membrane].	0
NZ_CP043998.1\|WP_017212092.1\|5424647_5426402_-\|N-acetylmuramoyl-L-alanine-amidase-family-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	7.74148e-28
NZ_CP043998.1\|WP_051144797.1\|5390223_5391141_-\|UDP-3-O-(3-hydroxymyristoyl)glucosamine-N-acyltransferase	gnl\|CDD\|100043	cd03352, LbH_LpxD, UDP-3-O-acyl-glucosamine N-acyltransferase (LpxD): The enzyme catalyzes the transfer of 3-hydroxymyristic acid or 3-hydroxy-arachidic acid, depending on the organism, from the acyl carrier protein (ACP) to UDP-3-O-acyl-glucosamine to produce UDP-2,3-diacyl-GlcNAc. This constitutes the third step in the lipid A biosynthetic pathway in Gram-negative bacteria. LpxD is a homotrimer, with each subunit consisting of a novel combination of an N-terminal uridine-binding domain, a core lipid-binding left-handed parallel beta helix (LbH) domain, and a C-terminal alpha-helical extension. The LbH domain contains 9 turns, each containing three imperfect tandem repeats of a hexapeptide repeat motif (X-[STAV]-X-[LIV]-[GAED]-X).	2.6558e-68

>NZ_CP043998.1|WP_039770713.1|5401268_5403152_+|N-acetylmuramoyl-L-alanine-amidase-family-protein
MFKRANKITSLLIAAASVMSLVPAYAADVKKIDSDDGTVYNAVAYKDGKFFVDGEINDDEEAYYVSDGKFNKLEDIDSGDDADLFGEKYLDINDGDYTVDLDKGSITDDDTKGDTADDASADLRKKIKDDTDDRYDEDFANNIIDENKDDTEDLTKLNILPGAKYKSPWYYTQYKAADKAVNDNVNGLKGTDASKQFFNVYTDTKGGYIDADYNLGKVKVTTTADGASTKTETIENTNDKYDAAGKDDALTASVSQDKILTQDDDYIYRLATIKVNVTTDAAATARISEINGVELNPENANDKPQIFKVENDGRTVSFKAIQKISKAQDSDDVDGAKYAKTVTTYALSDEDGKNLDAKDLFLNTDGTINEDTKFTVANGKLIAYNTEMNEYKKVVVRAYSLKTKGGYYYADEEDESKEDCEVSSQDDKTSAVQTDVDGNLWRLDGGYIYKFDNTDDWDKVYKVDGSFDELSVYDKDNIAAWSEDDDVYSLIGGKSSDDDNNTNPPTTTSGWVQAADGTWTYNKEDGTKATGWLNLNGVWYYLNTDGVMATGWLNLNGVWYYLNPSGAMATSWLNLNGTWYYLNSSGAMATGWLNDNGTWYYLNTSGAMLSNTTVDGYVLGSNGAWIR
>NZ_CP043998.1|WP_023974296.1|5399143_5400739_-|peptide-chain-release-factor-3
MADYIKEIEKRRTFAIISHPDAGKTTLTEKFLLYGGAIRLAGSVKARKASKHAVSDWMEIEKQRGISVTSSVMQFNYNNHCINILDTPGHQDFSEDTYRTLMAADSAVMVVDAAKGIEDQTRKLFHVASLREMPIFTFINKMDREAKDPFQLLDDIENELGIKTYPMNWPIGSGKEFKGVYERDNNRIIAFNGGNHGQNEVEAIEGSPDDPKFREILGDALHDKLMEDIELLDIAGDELDLDVVRRGELTPVFFGSALTNFGVEPFLEHFLEMTTSPLARNSSGGTIDPFDDNFSAFVFKIQANMNKAHRDRIAFMRICSGKFNKGEDVYHMQGGKKIKLAQPQQFMAQDREIVEEAYAGDIIGVFDPGIFSIGDTLCAPSKKFKFEGIPTFAPEHFARVRPVDTMKRKQFIKGVSQIAQEGAIQVFKEIHIGMEEIIVGVVGVLQFEVLEYRLNSEYNVDVKMDRLDYRYVRWIENKDVNMDSLNLTSDTKKVKDFKDRNLLIFQNDWGISWALEHNKGLILSGVGKSED
>NZ_CP043998.1|WP_023974295.1|5398033_5398993_+|DNRLRE-domain-containing-protein
MNSITIPAIKSLSITNKYSDKSLNGDKIIVGTDGNYNYYSYLFWDISSIPTNATVYNAKLTLFKTDNFYYDTSKKFSISPLYEYFSTYTTYNNSPNYDHYTVINFYPLTDNISVTIDITTIVSSWVKNSLKNKGIILYGRNEDIFTSFGSVKSSDNYLMPFIIVNYDPYSPNKCLKKECTNKYSKDCCKKKYNDEYFKDDCCEKYIKICKEELESILFKVCKEACGGNCNPFPSNTSITRTVRVTGTVAPTSVYYIVVDLQVTRASSGQVNHYYVSDEYDNSLNNTPLPIDKTYNIAVSPPIQSGDAEDVILYGSYKGF
>NZ_CP043998.1|WP_023974294.1|5397338_5397623_+|hypothetical-protein
MASFDTPQNSTIQTIYATGTIPAHNDAGFIEIQAVASRNGGHETFYKTFQVAASATRATAQVWAGAGNYQIIITPKLFGTQSVSSTTVINSFKH
>NZ_CP043998.1|WP_051144798.1|5393875_5396947_-|glycosyltransferase
MQSKDELINDTENLKENISCVVKDKMKLVFFVRLGLDSFLGDIIEGLSQEYEIKKIIATEYKQIEDGMQWADICWFEWCDELIAYGSKLELAREKKVICRLHSYEAFTDYINNVTWNSIDKLIVVGAHIKDFIVENFNIDEKIISVIPNGIDEKKWTYKERENGFNIAYVGYINYKKGPMLLLHTFKAIYDEDNRYKLYIAGVFQDNRDVLYYNQMVRELGLENNVIYEGWQNDLDKWLEDKNYILCTSVLESQNMSVMQAMCKGIKPIIHNFVGAKKIYGKEYLWNTIKDAVNMICSDEYKSIEYRKFIEDNYLLEQQITKIRLVITKINLEKEKFKLLDEPLVTVGIINYNYSEFLDKSIESVLKQNYKNIEIIITDDSSSDDSVEKIKSYENKYENINAIYHASNSGNAYRGIEEIIKYARGKYFMFLSSDDFLSDSNVIKMYVSELLLDSSIDYVFGNISVYNDNNTENIRWTYRNYTDDEIISETFNRKGSGVVPFSVGLYKKEFFDRNKITLFEDKNNKVAGDTLNTLAYLKYGWKIKYINYDAVSYRHHNNNMTYDLENRIKSIISVMEYIVENFSETKYLINVDWSNLNEKNKESTKNYLIGVNYYNTYIMYLSGNGMPWKCNLDFDIEQIKVYLQPLINIIEKYMKKSLTYGDLYCNEINKILNEIKPYKLDIKVNKNDKEYMQQVQIIDKGEELRGSLLEKYKNKYKRHDKKILIYSVINGFWKYSFLSWKQVLNYMGIKADVIYEVNQKLNYEDYDIYINLADKIYIDNSFANKSIERIKNKIGIASKQDNDDLDLINIQKCKDFNYKFLISPFHEETYISYFKNLTSSNINIESVPFGFNPLIYYPENTKKIYDYFFVGTNSYLKYKETEKYLIPILNKYKNGILRGSGWGNINVELNPDNSKFFYNRSKINLNYHLDIQKKMKNEVNERTFIIGACGGFQIVDNPKLIYELYTKDDIAIANDEYEYAEMFKYYLNKPLERYEKAYNSLVKTYENKYSLFDRLEKILQLIL
>NZ_CP043998.1|WP_023976120.1|5392848_5393808_-|NAD-dependent-epimerase/dehydratase-family-protein
MISNKKVLLTGGAGFIGTKLCERLSSNNELLIYDNLKRNSIKNTNLLNKDNIKLVKGDILNFNFLKHTIDEFKPNIVIHLAAIAGIDTVIKNPVSTMKVNMIGTYNILEALKDQKIERFIDFSTSEIFGSYAYKVDEAHTSNLAPVGEARWTYSVSKLAGEHLAYSFYKEYGLPIVTIRPFNIYGDGQVGEGAIHQFVVRAIKNEQIQIHGDGDQIRSWCFIDDFINGVMLCLNNQKAIGHSFNIGNPRGTITISMLARLIKTIANSDSEIVYVPKNYVDVELRIPNIEKAKKILRFNPRYDLDEGLEKTIEWYREKIK
>NZ_CP043998.1|WP_023976119.1|5391997_5392831_-|NAD(P)-dependent-oxidoreductase
MNRNIIITGGTGFVGSNLINAFKKKEYVSYNLGRNKNKFCKNIYWDLRDDMQNIKLPLDVDTIIHCAAIVGDCNANVREYIDVNVGATLELLEYGRKVGIKQFIYISTGGVYGFNDNPSKESDKCDPHGMYSLSKYFSEKICMEYMDRMKIAIIRVFFPYGKDQRGRLIPNLINSILKGEKVILNNEGKPLINPINIMDLCNIISGIVDKRLEGIFNACGNEIVSIKELCQKISDKFVIKNVQYEFNDKKCKNLLGNNKRIMDDLHYSIKAKLLDGM
>NZ_CP043998.1|WP_023976118.1|5391124_5391904_-|hypothetical-protein
MDFFSYSNYKIILNKMKAIKEIYNFKSINNSIKNGYILRHDVDIDIEKAYALSTIENDMNVTSTYFILVTSDLYNILSYKNKMLVRRMFLNGFEIGLHFDPSIYDYMSLSQLEKQMKKECSIIEDIIGEKVSSISLHNPSIHNKYPIFKEYKNTYSKEFFNPELYLSDSCKDFRGKNVFEFIKKGENNLLQVLFHPIHFSENEETYVESFNKIIELKINNFDRYYTCINKTYKNEIKENTLLSCFKDYIKENNKHEEKI
>NZ_CP043998.1|WP_051144797.1|5390223_5391141_-|UDP-3-O-(3-hydroxymyristoyl)glucosamine-N-acyltransferase
MKKKFEFNCKLLKNIIEYGKQNINETVIYSVSTLKDPKDNTLIFGNALNEESIKKLKKVKNSLIILNTKDSYFSSDSSYLLYVDRPREEYAKVLDFILKLQPKDNRKHILIDGYYKGESSIIGKNTVIEPLVFIDNDVKIGDNCIIKTGAKIRRNVIIGNNCIIKENAVIGDDGFGVERDEDGTTYKIPHLGGVKICNNVEVGALSCICQGTIEPTVIEEYVKIDDCVFIAHNCFIDRGTLIIANAEISGSVHIGANSWIAPNSCIRDGTTVGDNTLVGIGAVVVNNIDSNVVVAGNPAKLYNNS
>NZ_CP043998.1|WP_023976115.1|5388705_5390022_-|nucleotide-sugar-dehydrogenase
MLDKDNLIYKINNKTATVGIVGLGYVGLPLAVEFAKSGYRVLGFDIQQKKVNMINNCENYISDVVNEELKFVIENRRLKASNEIKFLKDTDVILICVPTPLDKYQQPDISYVKESTESVGKYLHEGMLVILESTTYPGTTEELVLPTLEKMSGLKCEKDFYLAFSPERVDPGNSIYHTANTAKVVGGVGRDSTEIAAALYRKVLNSEIFEVSTPRVAEMEKILENTYRNINIGLINEMAVICNKMNINIWEVIEAAKTKPYGFQAFYPGPGLGGHCIPLDPYYLTWKAREYDYHTRLIETSGEINNFMPQYIVQRSATILNKFNKALNKANILILGIAYKSDIGDYRESPALKIIENFQKQGSEVKFYDPYISSYMYKGEEHYGIKLTQEVLRNADLVIITTAHKKYNYSFIQENSIFIFDTRNATKNVQNKDNIELL
>NZ_CP043998.1|WP_039770709.1|5405783_5407733_+|N-acetylmuramoyl-L-alanine-amidase-family-protein
MIRGMGKVTSLLVAAATVASLVPFSGVNAAEIKRISADDGTIYNAIAYKDGRAYIDGEINDDEEAYYLANGKFNKLEDVDSGDDAVLFGEKYLDISDGDYTVDLDKGTVTDDDIKGDTEDDAAAALRKKIKDDTDDRYNETEANTIKDSNHGDLFDLIPGAKYNKVWYYTQYKAAQKSIDKNVNGLNGLDAAHQIFNVFTDEKGNYIDADYNLGKVKVTTTASSASGTTLTKTDTIENTNDAYDAADGIINGTNISGSDKLSASVVQDRVLAQDKDYIYRLATVKVTITTGAAATISEINGVKIDPNNSNDIFKVENNGQVVSFKAIQKISKTQASGDVDDAKYAKTVTTYALSDKDGKKLDAEELFINTSGNIVTTTNYTVAGGKLIAYNSEINNNDKVTVRAYTLKSSSGFYYADEEDQSKEDCENSKNQGAAVQTDVDGNLWRLDGGYIYKFDNTDDWDKVYRVDGSFDEFSVYDKDNIVAWSQDDDVYSVIGGKQSNSDPDDTPVVKTGWVQATDGTWTYNKEDGTKATGWLNLNGTWYYLKADGVMATGWLNLNGTWYYLNSSGAMATGWLNLNGTWYYLNQSGAMATGWANVNGTWYFLNGSGAMQTGWLNDNGTWYYLYSNGAMAANTVINGYRLSASGAWV
>NZ_CP043998.1|WP_039770707.1|5408004_5408877_-|glycerophosphodiester-phosphodiesterase
MKILNIAHRGYSGKFDENTMLAFKKAIEYNADGIEADVQLSKDGVPIILHDETLDRTTNGHGFVKDYTLDELKIFRTKSVPEIQLLKNDSLQEMAHLKLNMTTERNYEEGKQVGSYKVGKYTMEEAEYFQNRGGEEIPTLRELLELVADSDLKVLNLELKNSVIEYKGLEKKVLSMIDEYNLRDKVIISSFNHTSLVKVRKLENNKKITLGALTETILVNVPKYLKAISVDCYHPHFSSILNEEYIKEIKDAGIKVNPYTVNSLVDMKKVIMVGVDSIITNEVELLNTLL
>NZ_CP043998.1|WP_039770705.1|5409168_5410236_-|bacteriocin
MKYEYLRKSIAVSLAISSLITVVPVKSLAAWIENYDGSWSYADMYGYANGGWKQINGIWYYFDSYGLMRTGWILDNGEWYYTDLSGVMQTGVIQIEGKIYIFSENGAMQKGTSIINGRIYNLDDSGACIGNDYPIPTKSFDYYGNNTLPYVPNQIIDEDSKMSKDIPTDPSKEVKKQYKVKFKDPEAEDDDDELLRTKTVDEDTMLTLYKPVKNGYTFIEWNTNSDGDGTSYEYDDRIKITKDITLYSQWKKNENTSDETTIKVDNIVVLGPVSGTTEMSSITTKGGSLQMSKKVYPTNSDNQKVKWLVVNEDGSATISDTGKLIAVSNGKVIVKAVATDGSGVIGTKEIKISGQ
>NZ_CP043998.1|WP_051144796.1|5410327_5413645_-|hypothetical-protein
MKWKFINKIISAITISMTLFTLIPLRASAEWVNDYQGNFYYMQDNQKVTGWKRIDGQIYYFDGNGKMQTGWIKAGSSWYFLQNDGALKTGWINYNKKWYYADSSGVIQTGIVNISGKVYIFDDNGAIKTNNTVINGEFYTIGSDGEVVGTKMPTPEKEYDDSGNCIQVLKNTDNKVITSPTDSKFNEVIEDKTESDDNPNEGRSFKVLLKDSDGSELKTKTVKYGKSFDLYKPTKDGRVFAGWNAKSNGSGKSYDADDSIKVEEDIILYAQWKEDTSVYVEDINIKGNSNVTVNKSVTMTAEVSPSNVTNADVTWSVSDETGKATIDSNGVLTGVSAGTVMVKATAKDGSDVSGTKEVTVTNTDVVVPVSKVTVSGQAGESTITTDGGTLQMKASVSPEDATNQAVTWEVQNNTGSASIDSSTGLLKAISNGTVTVKATSNNNVVGSMTVTISGQSTKILVTDMEITTTKTDFAITEDGGTLQLNLNITPTTATNKSVKWSIKSGEDKATINSSTGLLKAVTNTNGTPVTVQAEALDGSGVVATKDVTISGQKIKVSKITIDGPDSVTGTGKVTMDKTVLPKDATNGAVIWSVENNTGSATIDANTGELTPKSNGKVTVKATAADGSGISDTIEVTISGIDNNIPATKINIATKDGAALSITEDDGTLGLIASLLPSYSTTTSEAVNWEVISGSDGGSAKIEGGTVGSSINIRGVTNGTVTVKASVINADGTTAIGSATVRIAGQITNVTDIIISPDEAPEVVVGGTLQMSASVDPNNATYKIVNWSVSNGTGTATITSSGLLTGVSSGDVKVIATADNGKGISKYITVKVIPQVKVTKITVNAPDGSGNEITDGGTLQMTASFEPTGATSKSVTWSVTPGTGKATIDSNGLVTSVSNGTVTVNATATDGSKVVGSLPITISGKVGTITVAGTGNISTIVIPNGILQMLATVGPTDAVNKAITWSVTPVTGKATIDSNGILTAVSNGTVTVNAAATDGSGIVGQSVVTINAASGITINQSSNTVAVGNTAKLTSVISPTSVTGKKVIWSISNIDGTNTDLATINSTGDLTADLTALKQGSVNIKATLDDGSGISVTKTIIINPNS
>NZ_CP043998.1|WP_039770703.1|5413960_5416066_-|cell-wall-binding-protein
MIRRINKILALVLIGTSIIATIPNSVFSTPVKAETNDISKIILNPQTNNIALSGIDIGSMVPDGDTLIGMAENTTINPQLENGVKLMFSSKGAKSIDNEECGKLSYNLSGSLVDEISAQVYEVLKDPITNAVVSKAESATGGTIPEETLKNVIEPIVEKNLQAALPSAIKSRFQNIPIYQYTGKNNSGDVIAQAFVVKGLVGSIVNTVVGNGAYCVNTYSANVRNASYSSIDIVPSLTFNPAVGTTAYSKVINLDNGSKVIGDGMSINVIDSVNNKVYVINNPIYNMLKAKRGDSDKINKDLNIIDFNGVTNLSGSLSFPLDIDGTKFSILSLSLTKNGDITANKSYKYAVVVGDYEKNLLDKMIDGVNLGNVGDKIKGMIKSGTYNMIPDINTQIGGLIDKGKNEFDKTIDGISDGINDINDSLDDLTDALKDKNNDVDDAWDKVFDRYDNDKGWGKHDGYIYYYDKDGVSLKGVQKINGKIYYFNRIDGAMETGWQIVDGKKCYFDKKKGCELFNQWVQDGDDWYYVGEDGAVKKMEWVNYNGKYYYLKADGKMVKDWFKVDEYWYYFNNDGSMSTSIWKSSNEKWYYLKDNGQAASDWLNLGSNWYYFKNTSGEMQIGWFRANGNWYYSNDDGSMKTGWIYSKNNWYYLDEGTGVMKKNEWVVIDGKNYYFNINGEMVTGSRYIDGTKYVFGSDGTLY
>NZ_CP043998.1|WP_039770702.1|5416443_5418498_-|diguanylate-cyclase
MSIKYKTLLIGFFSISLVIGATILIFHLSYFGYINKDQEQHIKRDFDVIDYILKSEEEDMEAVLIDWGQWDDTYNFINTKKQEYIKSNLQSNTLNNLNLKSMIFLNSNKDIIYSKENDIQSELSRNIMNKLMISSKNFDKTGSGKIGLISLQGKVYLVGILPITPSDKHEESNGFLIMTREIDKKLVKYVEKVSSVSFNLSEAFQDKYKRDKDLSYIYLDDSIISYNKNNFEAYKTIKDINGEDSIEITIVDTNHSDEQINYFLRSFIFKFLCLIVIVIVFYTLSFDRYIFKRITKLTKFIEKVGKTKDMTLTIDINGKDEINKLANEVNRMLERINSANDEILFLSYTDKLTHLRNRAYMEKLFESLDNSKDISYHIIIGDLNGLKLTNDALGHSEGDKLLHIVGKILKENCASDDIISRWGGDEFVILVKNKNREYITNLIDRIREKCESEAEFHFKISIAWGSAGSDEEGSNTEAIMGLAEKRMYRNKLMENKSARSAAINSLLMTLHEKHSETEEHTIRIKNLSVKLGKSIGLPKEKLDELELLSSLHDIGKIGIPEHILMKPSKLTDEEWKIMKTHCDIGYRIALSTPELAHIASKILAHHERYDGTGYPNKLKGEEIPLLSRIINIVDSYDVMSHKRVYKDAFSKDYIIEELKRCSGTQFDPHLVKKFIDLLERDGDL
>NZ_CP043998.1|WP_039770699.1|5418673_5419981_-|methyl-accepting-chemotaxis-protein
MNKEKKNVSLKVKLQVSYVIMSILVFISGIVNFKQLSDIKNGIANGDTLARDITTTVVVCIISIIAAIFAGFYMHKNIISRLNTLQKFAMKLASYDFSEGVEITKYDEIGATARELNIAQENVKNLISTILNEACNMSGLSQELSANVEEVSAKLDEVDNSSKNINVIMTETSATAEEIAASIEEVNSSMESLANKAADGSTNAEKIKRRAEKVKEDSKIAITNTTQIREQKEKDIIKAIEDARVVEEVKVMAGAIADIAEQTNLLALNAAIEAARAGESGKGFAVVAEEIRKLAEESSQTVFTIQDTISKIQDAVKNLSDNSNDILNFMSSEVDKQLQDYAKIGEKYSNDGDFVSSMSEELVSMAQEVEATVEQINEALQSTAADVQKSSVNSEKIQSEIETSSSAISQVANAATQQAQIAMHLTELVQKFKLK
>NZ_CP043998.1|WP_039770697.1|5420237_5422469_-|cell-wall-binding-protein
MSAKKINLNKITSYLLIFTVFFTLMQTVNLQKASATDETQIKGLQFHIGDVNGKTKNIDGNEKDGYVCEFLPIGQNFTLVADSGYSIVSVQSSSSFMNVKPVANSSGGNDYVVNTITDYSDFTLTVVMKDSSGKQVTYPIRMKFEADSSLSFQSLRVTLDGKITYNLFFTQTDANGNYHISDINSDVKMAKVQLFDNNNTPMNFSTNGGSSAAEATVNLTGGDNVISIGVTTQNISRQYKLIITKKGEAKLQSLVPSAGTLSPAFNSNTYDYTVQVPTTQTTIAFTPIAVDNSSTIKVNGVTVKSGSKSQSIKLDEGENDVEVILTTKDGDTSTYNIKVTRTALFRSSQLTGLTLTSGTLTPAFNKGIYEYSGTVDNSVTSIGVTPTAEDVNATITVNGKKVPSGATSPYISLDEGGNTINVKVTDSKGNSNTYVLNITRRYPKDNVNLASLSVTDGTMSPKFDPETYLYSVKVARNIEKVRVMYTSQNDKAKIKINGKEYTNGQSDYIKLDIGANLVVVEVTAEDGKTTTTYKLSVIRGDIEGTNQWVLVGGNWTFYNAAGMQIKNQWVKYDNQWYFLDINGYMQTGWIQDSGNWYYLNKDGIMQTGWFYDKGYWYYLEANGAMRVNTWATYDGKWYYFNNFGEMQTAWAQYKGKWYLMDDHGVMQKGWVTYDRNKYYLNDDGSMRTGWLYNGKSWYYLDDSGIMITGWKNINGKNYYFDAGGVMKTGMLFLDGQWINLNNA
>NZ_CP043998.1|WP_039770696.1|5422792_5424214_-|cell-wall-binding-protein
MSKMVRRIILTFFIIYSVSFLQTSSLNLLMTKVYAEQDNPSLKDIYLSDGGNLDFSEDKYSYVTDVGNDIDQVLIKAKPYDLLDTVKVDGEIVTRDDSYRKVVPLVKGKNKIEIEVLDNRSDATSTYNVYIYKGGKDAVYLKDININDSNIGFDKNTNFYNIELDEGTDIMELQATPDDGNYSMTANGKQLSNDSIKVKFNGIGKYTINLGVKDDDTQRIGNYTLNMYLGIPVTPNVKDTINAVIKPNQWVIVNGRWRYNDTAGKCLKNTWYYDNKYKSYFYFNSRGNMQTGWMEDDDKWYYLEANGEMQTGWLYYKNEWYFLDNNGVMKTGWIKDNDKWYFLKDDGTMATGWITSNGTWYFMERNGSMRTGWIYYGKQWYYLDQSGAMNTGWVNENNQWYFLNADGSMKAGEWVYWKNNWYYLNYAGNMRCGWLYKDDKYYYFNEDGAMRTSPVEIDGYIYNFNNDGSVNFG
>NZ_CP043998.1|WP_017212092.1|5424647_5426402_-|N-acetylmuramoyl-L-alanine-amidase-family-protein
MIKRMTKATSLLVAAAAIISIVPAHAADYTKIDSQEGTIYNAVAYKDGKFYVDGEVNDKDEAAYYLADGKYNNLSDIDSGADTDIYGSKYLDVQDGDYFVDLDNGSVTDESIKENAEDDAASALRKNLKKDNDKRYVSTEAETIQDLAGAEIAGNKFSAPWYKFQYTKDNATNGTNTKLNVYTDAQGNYIDADYNLGSIKVTTTAASGTTNKTATISNTDDTYDAAGETVKDQLSASVDSDNAKVIGQDANNIYRIAKVTVTVKNGSTIAKINGIDVSVDTKTFDTTVSGSVSFSVIQKISKAQASGNVDGAKYAKSVTTYIVSDEDGKNEAFTYDNYTVANGKLVGYTANGTNVKTATGTLSSKNGYYYVDLGDEASEDVQVNGSKSAVDTDADGNLWRLDAGYIYEWNNDEDWTKVYKVDGSFDQMSVYNKDNIVAWSKEDDVYSVIGGKGTTTPTDPTPVVNKGWVKTDAGWTFYNTDGTQVKGQWVNDGGVWYYIKADGTMATGWIQDGSTWYYLQSSGAMKTGWLNDNGTWYYLQSSGAMSTGWLNDNGTWYFLNSSGAMLANTTVDGYKLGASGAWIK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043998_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043998_8

5490319-5490465

Orphan

Consensus_repeat	Method
CATAGCACCTGATCCATTTAAGTAGTA	CRISPRCasFinder

2 spacers

The CRISPR arrays of NZ_CP043998_8

>merge|NZ_CP043998|8|5490319-5490465|CRISPRCasFinder
CATAGCACCTGATCCATTTAAGTAGTAGAAAGTTCCGTTATCATTTAACCAACCAGTTTGCATAGCACCTGATCCGTTTAAGTAGTACCAAGTTGCTCCATCTTGAATCCAACCTGTAGCCATTGTACCATCAGCTTTTAAGTAGTA

>NZ_CP043998|8|9|5490319-5490465|CRISPRCasFinder
CATAGCACCTGATCCATTTAAGTAGTA	GAAAGTTCCGTTATCATTTAACCAACCAGTTTG
CATAGCACCTGATCCGTTTAAGTAGTA	CCAAGTTGCTCCATCTTGAATCCAACCTGTAGC
CATTGTACCATCAGCTTTTAAGTAGTA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043998.1\|WP_039770680.1\|5487317_5489150_+\|O-antigen-ligase-family-protein	unknown	unknown	gnl\|CDD\|377422
NZ_CP043998.1\|WP_155715590.1\|5504351_5504495_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_017212057.1\|5474869_5475838_-\|glycosyltransferase-family-2-protein	unknown	unknown	gnl\|CDD\|133030
NZ_CP043998.1\|WP_039773671.1\|5503444_5503666_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039770684.1\|5484059_5485139_-\|NTP-transferase-domain-containing-protein	unknown	unknown	gnl\|CDD\|223906
NZ_CP043998.1\|WP_039773667.1\|5501205_5502933_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_039770682.1\|5485580_5487011_+\|undecaprenyl-phosphate-glucose-phosphotransferase	unknown	unknown	gnl\|CDD\|274396
NZ_CP043998.1\|WP_039770674.1\|5494274_5495519_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_039770672.1\|5495569_5497111_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_039770670.1\|5497341_5498616_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_017212052.1\|5481939_5483175_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|213187
NZ_CP043998.1\|WP_039773673.1\|5504054_5504306_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039773669.1\|5503166_5503424_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_017212051.1\|5483176_5483950_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|224596
NZ_CP043998.1\|WP_012060918.1\|5498780_5500082_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_017212054.1\|5479447_5480500_-\|glycosyltransferase-family-4-protein	unknown	unknown	gnl\|CDD\|340831
NZ_CP043998.1\|WP_039770676.1\|5492912_5494130_-\|cell-wall-binding-protein	unknown	unknown	gnl\|CDD\|227588
NZ_CP043998.1\|WP_017212056.1\|5475864_5477928_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043998.1\|WP_039770688.1\|5478019_5479303_-\|glycosyltransferase	unknown	unknown	gnl\|CDD\|223515
NZ_CP043998.1\|WP_039770686.1\|5480512_5481919_-\|methyltransferase-domain-containing-protein	unknown	unknown	gnl\|CDD\|369777

Protein	Function_ID	Function_description	E-value
NZ_CP043998.1\|WP_039770680.1\|5487317_5489150_+\|O-antigen-ligase-family-protein	gnl\|CDD\|377422	pfam04932, Wzy_C, O-Antigen ligase. This group of bacterial proteins is involved in the synthesis of O-antigen, a lipopolysaccharide found in the outer membrane in gram-negative bacteria. This family includes O-antigen ligases such as E. coli RfaL.	7.64724e-07
NZ_CP043998.1\|WP_017212057.1\|5474869_5475838_-\|glycosyltransferase-family-2-protein	gnl\|CDD\|133030	cd04187, DPM1_like_bac, Bacterial DPM1_like enzymes are related to eukaryotic DPM1. A family of bacterial enzymes related to eukaryotic DPM1; Although the mechanism of eukaryotic enzyme is well studied, the mechanism of the bacterial enzymes is not well understood. The eukaryotic DPM1 is the catalytic subunit of eukaryotic Dolichol-phosphate mannose (DPM) synthase. DPM synthase is required for synthesis of the glycosylphosphatidylinositol (GPI) anchor, N-glycan precursor, protein O-mannose, and C-mannose. The enzyme has three subunits, DPM1, DPM2 and DPM3. DPM is synthesized from dolichol phosphate and GDP-Man on the cytosolic surface of the ER membrane by DPM synthase and then is flipped onto the luminal side and used as a donor substrate. This protein family belongs to Glycosyltransferase 2 superfamily.	4.60159e-79
NZ_CP043998.1\|WP_039770670.1\|5497341_5498616_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	4.58429e-20
NZ_CP043998.1\|WP_039773667.1\|5501205_5502933_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	1.8867e-27
NZ_CP043998.1\|WP_039770682.1\|5485580_5487011_+\|undecaprenyl-phosphate-glucose-phosphotransferase	gnl\|CDD\|274396	TIGR03023, Sugar_transferase., Undecaprenyl-phosphate glucose phosphotransferase. This family of proteins encompasses the E. coli WcaJ protein involved in colanic acid biosynthesis, the Methylobacillus EpsB protein involved in methanolan biosynthesis, as well as the GumD protein involved in the biosynthesis of xanthan. All of these are closely related to the well-characterized WbaP (formerly RfbP) protein, which is the first enzyme in O-antigen biosynthesis in Salmonella typhimurium. The enzyme transfers galactose from UDP-galactose (NOTE: not glucose) to a polyprenyl carrier (utilizing the highly conserved C-terminal sugar transferase domain, pfam02397) a reaction which takes place at the cytoplasmic face of the inner membrane. The N-terminal hydrophobic domain is then believed to facilitate the "flippase" function of transferring the liposaccharide unit from the cytoplasmic face to the periplasmic face of the inner membrane. Most of these genes are found within large operons dedicated to the production of complex exopolysaccharides such as the enterobacterial O-antigen. Colanic acid biosynthesis utilizes a glucose-undecaprenyl carrier, knockout of EpsB abolishes incorporation of UDP-glucose into the lipid phase, and the C-terminal portion of GumD has been shown to be responsible for the glucosyl-1-transferase activity.	3.30483e-170
NZ_CP043998.1\|WP_039770674.1\|5494274_5495519_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	5.82444e-23
NZ_CP043998.1\|WP_039770672.1\|5495569_5497111_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	2.09964e-25
NZ_CP043998.1\|WP_039770684.1\|5484059_5485139_-\|NTP-transferase-domain-containing-protein	gnl\|CDD\|223906	COG0836, {ManC}, Mannose-1-phosphate guanylyltransferase [Cell envelope biogenesis, outer membrane].	2.91432e-163
NZ_CP043998.1\|WP_017212051.1\|5483176_5483950_-\|ABC-transporter-permease	gnl\|CDD\|224596	COG1682, TagG, ABC-type polysaccharide/polyol phosphate export systems, permease component [Carbohydrate transport and metabolism / Cell envelope biogenesis, outer membrane].	1.1144e-57
NZ_CP043998.1\|WP_012060918.1\|5498780_5500082_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	1.23049e-27
NZ_CP043998.1\|WP_017212054.1\|5479447_5480500_-\|glycosyltransferase-family-4-protein	gnl\|CDD\|340831	cd03801, GT4_PimA-like, phosphatidyl-myo-inositol mannosyltransferase. This family is most closely related to the GT4 family of glycosyltransferases and named after PimA in Propionibacterium freudenreichii, which is involved in the biosynthesis of phosphatidyl-myo-inositol mannosides (PIM) which are early precursors in the biosynthesis of lipomannans (LM) and lipoarabinomannans (LAM), and catalyzes the addition of a mannosyl residue from GDP-D-mannose (GDP-Man) to the position 2 of the carrier lipid phosphatidyl-myo-inositol (PI) to generate a phosphatidyl-myo-inositol bearing an alpha-1,2-linked mannose residue (PIM1). Glycosyltransferases catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. The acceptor molecule can be a lipid, a protein, a heterocyclic compound, or another carbohydrate residue. This group of glycosyltransferases is most closely related to the previously defined glycosyltransferase family 1 (GT1). The members of this family may transfer UDP, ADP, GDP, or CMP linked sugars. The diverse enzymatic activities among members of this family reflect a wide range of biological functions. The protein structure available for this family has the GTB topology, one of the two protein topologies observed for nucleotide-sugar-dependent glycosyltransferases. GTB proteins have distinct N- and C- terminal domains each containing a typical Rossmann fold. The two domains have high structural homology despite minimal sequence homology. The large cleft that separates the two domains includes the catalytic center and permits a high degree of flexibility. The members of this family are found mainly in certain bacteria and archaea.	1.79603e-39
NZ_CP043998.1\|WP_039770676.1\|5492912_5494130_-\|cell-wall-binding-protein	gnl\|CDD\|227588	COG5263, COG5263, FOG: Glucan-binding domain (YG repeat) [General function prediction only].	1.78294e-20
NZ_CP043998.1\|WP_017212052.1\|5481939_5483175_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|213187	cd03220, ABC_KpsT_Wzt, ATP-binding cassette component of polysaccharide transport system. The KpsT/Wzt ABC transporter subfamily is involved in extracellular polysaccharide export. Among the variety of membrane-linked or extracellular polysaccharides excreted by bacteria, only capsular polysaccharides, lipopolysaccharides, and teichoic acids have been shown to be exported by ABC transporters. A typical system is made of a conserved integral membrane and an ABC. In addition to these proteins, capsular polysaccharide exporter systems require two 'accessory' proteins to perform their function: a periplasmic (E.coli) or a lipid-anchored outer membrane protein called OMA (Neisseria meningitidis and Haemophilus influenza) and a cytoplasmic membrane protein MPA2.	2.08357e-107
NZ_CP043998.1\|WP_039770688.1\|5478019_5479303_-\|glycosyltransferase	gnl\|CDD\|223515	COG0438, RfaG, Glycosyltransferase [Cell envelope biogenesis, outer membrane].	2.15505e-15
NZ_CP043998.1\|WP_039770686.1\|5480512_5481919_-\|methyltransferase-domain-containing-protein	gnl\|CDD\|369777	pfam08241, Methyltransf_11, Methyltransferase domain. Members of this family are SAM dependent methyltransferases.	1.53576e-09

>NZ_CP043998.1|WP_039770680.1|5487317_5489150_+|O-antigen-ligase-family-protein
MTNSRNNSNEKSFNFFLPIAFILSIVPIIVRVAAVKLDENAIKIWGVTVKADLFSQRKALLLMIFSVILIITCVIFFKKIFSRKDKLVNYILIACGVFTLFTFLSAIFSKYRQVSFWGIFDRAEGFITIACYIILFLYSLYTFKTTNNYKYIITPLLILVFINSFLGLFQYIGQDLIKTSLGASIAGASSNSGIDLLNEKGTIYGTLASYNYMGSFVSIALPILFCYTIFEDDVMYKILSFIGTLLSFWLLFGSTARSGIVGVLGALIFGIIIFYKPLIKRWKGLLIGVVTLIILLVGANFASKGSLFKRIPSLASDAFSIFKDTSDLDYTNYTPVKDIKYIDSTTEVVLPNDTLRITYESGNPVFKNSNGEVVPYALNGKVLSTDSEAFKNITFAFGKLDKKSVISDSLLLNINNQPTFLFKLNDNKVFHLIDMSTKNYIDLQTPETFGFKGKEKLGSSRGYIWSRSLPLIKNTMILGTGPDTFVFDFPQGDLIGKYYAYDTPNIVVDKAHNLYLQIAINYGVIALLGFIAMLLIYIIDSIKLYALKNTFEDKNQMLGAISCLGIIGYLFAGIFNDSVVGVAPIFWILFGVGIAINFMNRENLRKKSNK
>NZ_CP043998.1|WP_039770682.1|5485580_5487011_+|undecaprenyl-phosphate-glucose-phosphotransferase
MIKENQNLLNKINAASDVAILFISMTLAYLIRFYIFSTDTQYIKLITYIQFSVIIVPIYLIVFNFFNLYHSFRTTVFIKECSQVIKANTIITTLLLSLLFAFKLVHDISRWVIIIFYFVNIILIIAKRFLLRRTLAKIRSKGLNLKHVIIVGAGDVADEYLKVIKSNRNFGYSYSGYIANTSNSEGKKLGNYSDLYEVLDRYKPDEVVCALDISDAKYIENIVSDCEKSGTKISIIPFCYKYIPSQPYIDQIGSIPLINIRRIPLDNFGNAFIKRALDIVGSLSLIICTSPIMLVTALIIKLTSNGPIIFKQKRVGLNKSLFTMYKFRSMKVNSNEETGWSTNNDPRKTRFGSFIRKFSIDELPQFFNVLKGDMSLVGPRPELPYFVDNFKDEIPLYMVKHQVKPGITGLAQVNGFRGDTSIKKRIEFDIQYIENWTILMDITILFRTAFKGFKNNEKIIIKNDALTENNDLDLKL
>NZ_CP043998.1|WP_039770684.1|5484059_5485139_-|NTP-transferase-domain-containing-protein
MKITAVVMAGGKGERFWPKSRKSLPKQFLSLTDDGKTMIQLTIERLKSLVDIDDVYIVTNKDYKNLVLEQIEGIPEENILLEPVAKNTAPCIGLAAMHIKKKYEDAVMIVLPSDHLIKYNEIYIDTLKAAIEVAKEDENLITIGITPSYPETGYGYINFGRDEEDIKRSNIYRVKRFVEKPNLETAKEYLSSGRYLWNSGMFVWKSSTILNNFRSLLSETYEGLEKIYETIGSEEEAYILEREFSKFESESIDYGIMERAGNIYTIPGSFGWDDVGSWLALERINRTNEDGNVIKGNVITINSKKSIIQGQDKLIAAIGVEDLIVVDTEDALLIASKDSTQEVKKVIENLKICNRNEYL
>NZ_CP043998.1|WP_017212051.1|5483176_5483950_-|ABC-transporter-permease
MNSLKELYNYREMLFSLVRKDLRTRYKGSVLGFLWTFLNPLLQLCVYTIVFSVILRSDVPKYYIHLFVALVPWLFFATSIQGSSASIIGSKDLIKKIYFPRIIIPISVVNAAFMNMLFTMIVVFFALIFSGIGFSWYILLLPIIMILEYLLALGLSFIFSALDVYFRDLEHILGIVIMVWMYLTPVLYGIDMIPDNFKPIFKINPMTPIVVAFRDILYYKQMPDFSNMWIILAWSIALIVIGYVVFEKLQKKFAEEL
>NZ_CP043998.1|WP_017212052.1|5481939_5483175_-|ABC-transporter-ATP-binding-protein
MEVIKIDNVYKSFKIYYDKGSTLKEKILFKNRNKHEIHKVLNGVSLNVEKGEVVGLVGENGSGKSTLLKLMTKIIYPDKGSIEIKGKISSLLELGAGFHPDMTGRENIYTNASIFGLTKKEIDDRIERIIDFSELGDFIDNPVRTYSSGMYMRLAFSVAINVDAEVLLVDEILAVGDASFQAKCFNKMQEIKNDGTTIVIVSHDLNSIEKLCDKAVWIDEGYKKLEGTPHDVIAEYLDKIMNKNVESKLQHETELEEDSEDKENEQKFENRTGNRDVEVRLVKIIECDSNEEKYIFKPEDSVKIIIEYVRKNDELLESVVGFGIMRKDGVNCYGTNTYIDNASKVKLNKSGIIEIFLEKIELLEGEYTLDIAFHDEYGKPYDYIRKIKEFSVYSSIKDSGIFRLKHEFRVK
>NZ_CP043998.1|WP_039770686.1|5480512_5481919_-|methyltransferase-domain-containing-protein
MDYSDDIYRKIKLRKEAEENINYKNNKNSNIDNGKSILNELEENVILINSLWNIDYDFQIRSHRKIIGRLLVFGKKVTRKLLKWYVRDTGIEQNKFNAYIVKAMNSTWDYINELNNINGKMSQEINTVYDNNKNLKREIELIQVKNKNLEIRNKDLEIRNKDLEIRNKDLEIRNKELDALIKLTEDNINNKIGILEERFNNSLNHYKEDITYLRYRMKYLINNKENSEKNNSNLIDSINSEIKERIIDDEIDYFDFENKFRGSESNVVEKQQIYLQYFNSTNKVILDIGCGRGEFLTMLSQNNIPCKGVDAYPEFVDYCKDKGLDVVLDDAISYLNTLEDNSLGGVFIGQVVEHLETSYVIRLFNLCRQKLCNGGKIIAETQNPETLGIFGDSFYVDPSHKKPIHPLQLTYIAESAGFKKVNRLYLNEFEEKIPYPIGIENDEDVNAAVDRLNKLLYGPRDYSIIGEK
>NZ_CP043998.1|WP_017212054.1|5479447_5480500_-|glycosyltransferase-family-4-protein
MKKKKVLVCSAKTPFMYGGAEIHAENLRYNLEARGFDTELINLPFKWYPNERLITECLTWNMIDLTEANGEKIDLVIPLKFPSYFVRHENKVTWLMHQYRPIYDLYGTKYSDFDLNNGFHRKIRDQVIKIDEKALLESKKIFANSKNVSNRLYKYNKIQSEPLYHPPKNIGKYFTEKSRNYILSVGRLDPLKRVDIIIKALKFCDKNISAIIAGTGGMEKDLRKLAEKEGVSDRVKFTGFVTDEELIKLYAEALAVMFPPVDEDYGYITIESFLSKKPVLTASDSGGSLEFVVDNRNGFICDTAEEFGEKINFLYKNKRIAEDMGIEGYEAVKGISWDNVIDRLTESIRY
>NZ_CP043998.1|WP_039770688.1|5478019_5479303_-|glycosyltransferase
MKIAFVTPLSPEKTGIADFCEEILPLMKDYFQIDLFSSHNNPSNKIISENFKVYKYEKLEDENIRNQYDMIVYQIGNNVECHGKIYELALKYKGIVELHDISIEGLIWGMTLKNNNRDKYLDIVEYCHGKEARRRAEGAFNGECIPLWDEPLRFPLNKKLIDSAEAVIVHSDLGFQIVKGTRNNLNIAKIYHHTNDIYNNYDELKEIYKKELGMGNELIISSFGFATRTKRIPQILEALSKVKEQGCKFKYIVAGKVEEEINIKDLVDKFGLRDNIEITGYLSLEELKKYMLATDICLSLRYPSHGESSGIFHRILGMGKLAVITDEGTFSEYPNKVCLKISMENETENIKNAIIDIINGKINMKEYERNAMEYAKSNFDIKENVLMYKSFIENPYDNNLYDPLDIISDYLYKLGIVEKDLINSLKF
>NZ_CP043998.1|WP_017212056.1|5475864_5477928_-|hypothetical-protein
MFNKEDSNKRIVFALGCLLGALVFIWFYGIRVLDVTYDSWLMEGGDLSQHYIGWQFFRNSSWSFPFIGLIDGLIYPYKVSVIYMDTIPGLSIIFKILSPILPQTFQYFGIWGILCFMLQGGIGALIIRKFTAQYIICIASSMLFLLSPIMIYRLFGHASLAGHWLILLSIYIILNKSKFRDIKKSIGAWSIIVFLCVNVHMYFLAITMLLLLCYLAIDYFENKSIARVISVLGSSIFIALITLFILGAFYGSADYETVGLGFYSANINALFNPQGYSRYLFNLPTATEGQYEGLAYIGLGVIIALIVALYFDIENVLKIKNEKISIFIKNNYIKFVIFITMIIFFIIALSPQVSLNGKMLLNIPYPKIIIKFLNVFRSTGRFMWPICYFIVIYAIRKILNISVKKQAIIFILICVIIQMSDLSNTRNDRYDRFSHNIEYNSEIKSPLWDKLIKNNYKHIAFMKYTVQNDKSLWSLCKYAADNNLTMNDGYVSRKDSKAVNAIKDEYLQQLESGICRDDTIYVFGNDQNILESLKDYPLSYYNLDGIIVGIKEKFTDMNDYREEHEEKLKQGINILPKEDKYMNYGRDTDKGRILNPQGRSFGPYSEIAQGTYNVVIEGENLNKIVKYDLCYKQGEKTINLQEIERNNEKIVFTFNLETDIQDLECRVVNGNDENVILTKIVINKIVQ
>NZ_CP043998.1|WP_017212057.1|5474869_5475838_-|glycosyltransferase-family-2-protein
MGKYDGERIVDIIIPCFNESEVLDIYFIETKKIVSEIYGYEFNFIFVDDGSKDSTVDILKKYAKENECVKYISFSRNFGKESAMYAGLKNSVGDYVLIMDADMQNPPTLIEKMLKAVSEEGYDCCSANRTRNGDPALRTYFSRKFYSLINKISEVDMPDGAGDFRMMSRKMVNAIVAMGEVQRFSKGIFSWVGFKTKWIYFENVERAAGQTKWSFWKLFKYALDGITAFSTFPLRIASFVGCIVSASSFIYLIYIIMKTIISGKDIPGYASTITLILFIGGIIILSCGILGEYISKIYMEVKNRPIYIVRETNIDQPKNDYR
>NZ_CP043998.1|WP_039770676.1|5492912_5494130_-|cell-wall-binding-protein
MNRNLKKIIAIILAVNTISTIAPVANLSLLTTKAYAANKITNLTVEDSNGDNMSLYSESDCTDKHRVDSDDVQPGKTYYTRKTSADEINIDADGVDSDNIRVFEETSSDTEGKDIGEDVDLSSGTNVITVRVYNGDPGTVKYSDNSYVNEYKIRVKYSESNDDDDEDSDNVYLSSITLMGGNIDFSKKVYTYDVQVPEDLSKITIRARPDCDSGKYDDYKVKINGVKVDKDDKFKDDVSLNKGKNVIDIKVEDDDDNERVYTLNITRGKDNSNNNSKSSEQAEVTKTSQWVQVDGKWQYKDSTGNSVKNTWVQNYFVQADGNMATGWLNNNGKWYYLGDDGARKTGWQLVNGNWYYLDSQGTMQVGWIKDISNGKYYYLNNDGSMAYSTTVGEYKLGSDGAWYNR
>NZ_CP043998.1|WP_039770674.1|5494274_5495519_-|cell-wall-binding-protein
MNKNIKRVIAIVLAIGTISATTPVSKINLLTTRAYASTTNDESTLDSLSLDDSDGNNVKLYDDNDYKNRVKENDVHEDETYYAKTSSKTVSVDISGPDDNFVRVFRDSSDSTKGKEVGDDIQLTDKSVVTDLIIKVYGKDLDGETVRNNEHDDDEYNLLNTYEVKVRHVDEADSDKTDFDDIYLERLSIAGSTINLSNSITKYTYNVDSNVNQVAIKATPENDNYDVTIDGEDADYDDNYKRTVNLEKGQNIIKVEIEHNNKDRVYTLIINRGNVSSSNTNNGSTNTNTNTGSKDVKANQWVQTNGIWQYNDAEGKVVKNSWIQNYYLNADGNMVTGWLNLNGTWYYFGTDGAKKVGWQQSSGKWYYLDSEGRMQTGWVKDRNGKYYYLNSDGSMAYNTKIGVYRLGADGAWIK
>NZ_CP043998.1|WP_039770672.1|5495569_5497111_-|cell-wall-binding-protein
MKKNMIKIVSIALALGIVSAAAPATNINVLTTKAFAATDNDDDYLDRLELNDEDGNNIKLYSDSDYSSKVNASDVEEGETYYAKTSSDTVSIKIDGPDEDYVRVFNGTSSSSKGKEVGEDVDLSDDSSTTTLTIKVYGKEPDDNMRYKDNDDYNVLSTYRIKVENANYSQSKNKDNIYLERLSVNNNKVELSKSESTYTYNVASDVKRVTIKATPEDDDYDVTIDNKNVQSADNYKKEVDLDEGTNEFEIELEDGDKDRVYTLIINRGNPSSNGTSSQDTAETEHQDSIYLDKLSIDGRLFSLSQSQVNYSSNVPSDVNKVTIKAEPEKDFYTVKVNGDEVFEDDDYKTTVNLKDGENKIKVDVKNENSDEERVYTLTVIRGSVTSTQNNNGSSAANQWVQVNGIWKYNDASGNFVKNTWVGNYYLLDNGNMATGWLNYNGSWYYLGSDGARKTGWQLVDGAWYYLDSQGKIQTGWIKDSNGKYYYLNSNGAMAYNTTVGGYKLGYDGAWIQK
>NZ_CP043998.1|WP_039770670.1|5497341_5498616_-|cell-wall-binding-protein
MNKNLKKIVAIALAIGAISAVAPATNINFLTTKAYASSDDDSNDETELESLQLLTESGSKIKLYESSSYDSDDKVDADDVEAGEKYFAKTSSDTINIDIDGPSSKYVRVFKGTSDSTKGKKISSDISLDKDSTTTLTVRVYDEEPDDDVRYEDDDYSSEYTIKVKCTADSSDSDDEDSSDSSDDYDDIYLDRLSVDGQSISLSKSKVEYTYNVSSDTDEVTIKATPEDEDYDVTIDGDSVDDDDKYKSDVDLKKGENKIKIELEDGDDERVYTLIINRGGTSSTTGSTTNTASGSPSSATDVVATVTNKWVQVGGNWQYKDATGNTVKNTWVQNYFVQADGNMATGWLNYSGKWYYLGSDGARKTGWQQAGGKWYYLDSEGAMQTGWVRDLGSGKYYYLNSDGSMAYNTMIGKYKLGSDGAWIN
>NZ_CP043998.1|WP_012060918.1|5498780_5500082_-|cell-wall-binding-protein
MHKKIKYIIAATLVVAAVSGFAPSNNFLLGSVEAYASTYNDASNGELKSLDLTWGSGSKIKLLDSYSGDEVDLSSDTDYYVQLKGVSDFNVAAEVKGSGYVVKMFTSSSRSEKGEDVGQDVNIGSGYKDIYLRTYKSEEAYKEAYNDGDVSDCEKTYIIHARKESSTSEAEEDREYAYLDGIYLSDGSVDFSKNKTSYDVNVGEDVDKLTVRANPDDDDDYIEINGNSVYEDDNFEKTVNLDKGNNTITIYVEHEDEDTTYTLNVYRGKSANKTDSSNGQNFAIQTQEGSLNAWQRVDGKWRYVDGTGSVLKNKWWFDKDTGKNYYLGQDGFRTTGWFSDNNNWYYFNENGEMQTGWVNTNKNWYYLNKSGAMQMGWLEDSTGNWYYLDGSGAMETGWIEDSNGKWYYLDSTGKMIKDSAIGAYKLGTDGELE
>NZ_CP043998.1|WP_039773667.1|5501205_5502933_-|cell-wall-binding-protein
MNKNIKRIIAITVAVNTISTISPTTLNTYFVGAKPVYASSYSPDDEQLKTLKIKSLDGETLDLRDGYNGDTVKLSDETEYYTKLTDNSDGIKITADAEGDDYVVKIFTSDAENATAYDPGDEILLGKGDTTLYIRTYKSKSEFNKVKNNVSNCKEEYTLNVRKTKESSYEDDSQDSIYLDKIDLSKGNIDFLKGKTSYDIKVDENVDSMWIKAIPESNSDRVRVDGSLVDSSDNYKKTVSLDKGKNEIKIKVTDSKDNQRTYTLNVTRGDDSDNEDDIYLDHITLSEGDIDFSKDDNSYNVDLDESVSKITIGAEPEDSDYSVTIDGDEVRSSDDYEKKVSLDKGKNVIKVNVEDELNDKKRTYTLTINRGKEADDSKDNNTGDTSDKKSQWVQTDDGWKYYDENGKVLKSSWLYDKDQKVYCYLDKDGLRVTGWHKDNEKWYLLDSKGAMLTGWQKDNEKWYLLGSDGAMLTGWHKETVDDQKKNTDASTNSGDNDTKKVDNWYYLNQDGSMRTGWLSDGGKWYFFNADGTMQKGWLIDYNSKYYLTEDGSMATGTRTINGKEYKFNNSGALIL
>NZ_CP043998.1|WP_039773669.1|5503166_5503424_+|hypothetical-protein
MSKERTPYNPTPGDYDVEKLSGTRLESSNRQEGRDNIAPTRSLNPLSTDGPNKNITSSTSSKPHPVTGPVAMNYEDAFEYKNHNI
>NZ_CP043998.1|WP_039773671.1|5503444_5503666_+|hypothetical-protein
MSKEKMSSNENEKYYSEEELTDSHPSDPNDSELKKIKSMYLPDSKADHAPSEKSIENANGLEHPEPVKPKSLI
>NZ_CP043998.1|WP_039773673.1|5504054_5504306_+|hypothetical-protein
MSQSKIPFSINPGDDYPMEEYSKENSSKSRASDSKNVRKTADSGERNAKSLNNANISRTNLDTELIDLNADGDSDESKYSDLI
>NZ_CP043998.1|WP_155715590.1|5504351_5504495_+|hypothetical-protein
MSKGKYPYVPTPEDVPAPDLSYIFSPESKNSGNKNDNENTDSQKRNS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP043998_3	3.2\|3575209\|36\|NZ_CP043998\|CRISPRCasFinder	3575209-3575244	36	NC_020843	Vibrio phage 11895-B1 genomic sequence	105305-105340	7	0.806
NZ_CP043998_8	8.1\|5490346\|33\|NZ_CP043998\|CRISPRCasFinder	5490346-5490378	33	MT446411	UNVERIFIED: Escherichia virus TH40, complete genome	28967-28999	7	0.788
NZ_CP043998_8	8.1\|5490346\|33\|NZ_CP043998\|CRISPRCasFinder	5490346-5490378	33	MT446412	UNVERIFIED: Escherichia virus TH41, complete genome	156610-156642	7	0.788
NZ_CP043998_8	8.1\|5490346\|33\|NZ_CP043998\|CRISPRCasFinder	5490346-5490378	33	MT446392	UNVERIFIED: Escherichia virus TH15, complete genome	21954-21986	7	0.788
NZ_CP043998_3	3.4\|3575339\|35\|NZ_CP043998\|CRISPRCasFinder	3575339-3575373	35	MF417921	Uncultured Caudovirales phage clone 10F_5, partial genome	37187-37221	9	0.743
NZ_CP043998_3	3.4\|3575339\|35\|NZ_CP043998\|CRISPRCasFinder	3575339-3575373	35	MF417895	Uncultured Caudovirales phage clone 10AX_1, partial genome	5840-5874	9	0.743
NZ_CP043998_3	3.4\|3575339\|35\|NZ_CP043998\|CRISPRCasFinder	3575339-3575373	35	MF417965	Uncultured Caudovirales phage clone 3S_17, partial genome	489-523	9	0.743
NZ_CP043998_3	3.4\|3575339\|35\|NZ_CP043998\|CRISPRCasFinder	3575339-3575373	35	CP016969	Staphylococcus epidermidis strain DAR1907 plasmid unnamed1, complete sequence	18984-19018	9	0.743
NZ_CP043998_3	3.4\|3575339\|35\|NZ_CP043998\|CRISPRCasFinder	3575339-3575373	35	MF417901	Uncultured Caudovirales phage clone 9S_1, partial genome	1262-1296	9	0.743
NZ_CP043998_3	3.5\|3575404\|34\|NZ_CP043998\|CRISPRCasFinder	3575404-3575437	34	NZ_AP017969	Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-1, complete sequence	77894-77927	10	0.706
NZ_CP043998_7	7.1\|5405204\|34\|NZ_CP043998\|CRISPRCasFinder	5405204-5405237	34	JX486088	Lactobacillus phage ATCC 8014-B2, complete genome	10237-10270	10	0.706
NZ_CP043998_7	7.3\|5405324\|34\|NZ_CP043998\|CRISPRCasFinder	5405324-5405357	34	GU075905	Prochlorococcus phage P-HM2, complete genome	11901-11934	10	0.706

1. spacer 3.2|3575209|36|NZ_CP043998|CRISPRCasFinder matches to NC_020843 (Vibrio phage 11895-B1 genomic sequence) position: , mismatch: 7, identity: 0.806

gtggttaaactttcaaaactttgctaaatggtttga	CRISPR spacer
ttggcacaactttcaaaactttactgaatggtttta	Protospacer
 ***.  ***************.**.******** *

2. spacer 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder matches to MT446411 (UNVERIFIED: Escherichia virus TH40, complete genome) position: , mismatch: 7, identity: 0.788

gaaagttccgttatcatttaaccaaccagtttg	CRISPR spacer
aaaagttccgttttcagttaaccaaccagaagc	Protospacer
.*********** *** ************

3. spacer 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder matches to MT446412 (UNVERIFIED: Escherichia virus TH41, complete genome) position: , mismatch: 7, identity: 0.788

gaaagttccgttatcatttaaccaaccagtttg	CRISPR spacer
aaaagttccgttttcagttaaccaaccagaagc	Protospacer
.*********** *** ************

4. spacer 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder matches to MT446392 (UNVERIFIED: Escherichia virus TH15, complete genome) position: , mismatch: 7, identity: 0.788

gaaagttccgttatcatttaaccaaccagtttg	CRISPR spacer
aaaagttccgttttcagttaaccaaccagaggc	Protospacer
.*********** *** ************

5. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417921 (Uncultured Caudovirales phage clone 10F_5, partial genome) position: , mismatch: 9, identity: 0.743

gtaggtgacaacagtacaggcaagtcagaaatcgg	CRISPR spacer
caacaagacaacattacaggcaagtcggaaattga	Protospacer
  * . ******* ************.*****.*.

6. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417895 (Uncultured Caudovirales phage clone 10AX_1, partial genome) position: , mismatch: 9, identity: 0.743

gtaggtgacaacagtacaggcaagtcagaaatcgg	CRISPR spacer
caacaagacaacattacaggcaagtcggaaattga	Protospacer
  * . ******* ************.*****.*.

7. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417965 (Uncultured Caudovirales phage clone 3S_17, partial genome) position: , mismatch: 9, identity: 0.743

gtaggtgacaacagtacaggcaagtcagaaatcgg	CRISPR spacer
caacaagacaacattacaggcaagtcggaaattga	Protospacer
  * . ******* ************.*****.*.

8. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to CP016969 (Staphylococcus epidermidis strain DAR1907 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.743

gtaggtgacaacagtacaggcaagtcagaaatcgg	CRISPR spacer
caacaagacaacattacaggcaagtcggaaattga	Protospacer
  * . ******* ************.*****.*.

9. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417901 (Uncultured Caudovirales phage clone 9S_1, partial genome) position: , mismatch: 9, identity: 0.743

gtaggtgacaacagtacaggcaagtcagaaatcgg	CRISPR spacer
caacaagacaacattacaggcaagtcggaaattga	Protospacer
  * . ******* ************.*****.*.

10. spacer 3.5|3575404|34|NZ_CP043998|CRISPRCasFinder matches to NZ_AP017969 (Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-1, complete sequence) position: , mismatch: 10, identity: 0.706

atgaaaacgtagtaatagctgatgcacaatatgc	CRISPR spacer
gtaatggagtagtaatagatgattcacaatataa	Protospacer
.*.* .. ********** **** ********.

11. spacer 7.1|5405204|34|NZ_CP043998|CRISPRCasFinder matches to JX486088 (Lactobacillus phage ATCC 8014-B2, complete genome) position: , mismatch: 10, identity: 0.706

ctatattaaagcagatggtatcatggctactggc	CRISPR spacer
cggtattacagcagatggtattatggcaaactat	Protospacer
* .***** ************.***** * . ..

12. spacer 7.3|5405324|34|NZ_CP043998|CRISPRCasFinder matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 10, identity: 0.706

ttacttacaatcatcaggtgctataaagactggt	CRISPR spacer
agaaacaaaatcatcaggtgctgttaagactgca	Protospacer
  *  .* **************.* *******

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

432223 : 485474

Clostridium_phage(16.67%)

coat,protease,tRNA

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_039771777.1\|432223_433243_+\|tRNA	tRNA (adenosine(37)-N6)-threonylcarbamoyltransferase complex transferase subunit TsaD	A0A0R6PI74	Moraxella_phage	1.0e-66	41.9
WP_023974832.1\|433252_434254_+	alpha/beta hydrolase	NA	NA	NA	NA
WP_039771779.1\|434519_435749_+\|protease	trypsin-like serine protease	A0A1B1IT49	uncultured_Mediterranean_phage	5.2e-17	26.7
WP_011967729.1\|435948_436257_+	PTS lactose/cellobiose transporter subunit IIA	NA	NA	NA	NA
WP_039771782.1\|436269_437424_+	carbohydrate ABC transporter substrate-binding protein	NA	NA	NA	NA
WP_023974834.1\|437580_438699_-	glycosyltransferase family 4 protein	NA	NA	NA	NA
WP_039771784.1\|438827_439844_+\|coat	CotS family spore coat protein	NA	NA	NA	NA
WP_039771785.1\|439845_440652_+\|coat	spore coat protein	NA	NA	NA	NA
WP_023974836.1\|440707_441763_+\|coat	CotS family spore coat protein	NA	NA	NA	NA
WP_039771787.1\|442082_443204_-	glycosyltransferase family 4 protein	A0A1X9SJR9	Sulfolobus_islandicus_rod-shaped_virus	1.9e-05	27.9
WP_011967736.1\|443312_444311_+\|coat	CotS family spore coat protein	NA	NA	NA	NA
WP_011967737.1\|444473_445334_+	sporulation peptidase YabG	NA	NA	NA	NA
WP_011967738.1\|445572_446112_+	glutathione peroxidase	NA	NA	NA	NA
WP_011967739.1\|446727_446970_+	hypothetical protein	NA	NA	NA	NA
WP_039771790.1\|447424_448987_+	DUF3794 domain-containing protein	S6BFI4	Thermus_phage	2.0e-05	59.5
WP_011967741.1\|449316_450162_+	cyanophycinase	NA	NA	NA	NA
WP_039771792.1\|450133_452776_+	cyanophycin synthetase	NA	NA	NA	NA
WP_023974839.1\|452924_453767_+	4-(cytidine 5'-diphospho)-2-C-methyl-D-erythritol kinase	NA	NA	NA	NA
WP_011967744.1\|453830_454568_+	stage II sporulation protein R	NA	NA	NA	NA
WP_011967745.1\|454699_455116_+	DUF1934 domain-containing protein	NA	NA	NA	NA
WP_023974841.1\|455221_455530_+	hypothetical protein	NA	NA	NA	NA
WP_039773938.1\|455694_457305_+	CTP synthase	A0A1J0FA14	Only_Syngen_Nebraska_virus	6.8e-150	51.2
WP_039772945.1\|457613_459056_+	transcription termination factor Rho	NA	NA	NA	NA
WP_039772942.1\|459097_460204_-	galactosyldiacylglycerol synthase	NA	NA	NA	NA
WP_023974844.1\|460417_460627_-	50S ribosomal protein L31	NA	NA	NA	NA
WP_017209894.1\|460816_461401_+	thymidine kinase	A0A249XXF6	Clostridium_phage	6.7e-55	55.3
WP_039772940.1\|461426_463187_+	peptide chain release factor N(5)-glutamine methyltransferase	A0A0K2CP67	Brevibacillus_phage	1.2e-06	28.1
WP_011967753.1\|463322_464405_+	peptide chain release factor 1	NA	NA	NA	NA
WP_011967754.1\|464470_465058_+	hypothetical protein	NA	NA	NA	NA
WP_017209891.1\|465113_466163_+	threonylcarbamoyl-AMP synthase	S4VW33	Pandoravirus	3.3e-44	35.4
WP_023974847.1\|466213_466663_+	ribose 5-phosphate isomerase B	NA	NA	NA	NA
WP_039772938.1\|466973_467603_+	uracil phosphoribosyltransferase	NA	NA	NA	NA
WP_011967758.1\|467684_468179_+	cytidine deaminase	A0A2H5BMD7	Streptomyces_phage	3.0e-16	39.4
WP_023974848.1\|468458_469607_+	UDP-N-acetylglucosamine 2-epimerase (non-hydrolyzing)	A0A1V0SAG5	Catovirus	2.0e-26	27.0
WP_023974849.1\|469728_470910_+	acetyl-CoA C-acetyltransferase	NA	NA	NA	NA
WP_023974850.1\|471629_471995_+	hypothetical protein	NA	NA	NA	NA
WP_077723628.1\|471987_472677_+	F0F1 ATP synthase subunit A	NA	NA	NA	NA
WP_017209887.1\|472731_472947_+	ATP synthase F0 subunit C	NA	NA	NA	NA
WP_023974852.1\|472999_473479_+	F0F1 ATP synthase subunit B	NA	NA	NA	NA
WP_011967764.1\|473481_474021_+	F0F1 ATP synthase subunit delta	NA	NA	NA	NA
WP_011967765.1\|474031_475546_+	F0F1 ATP synthase subunit alpha	NA	NA	NA	NA
WP_011967766.1\|475587_476439_+	F0F1 ATP synthase subunit gamma	NA	NA	NA	NA
WP_011967767.1\|476453_477845_+	F0F1 ATP synthase subunit beta	NA	NA	NA	NA
WP_011967768.1\|477860_478268_+	ATP synthase F1 subunit epsilon	NA	NA	NA	NA
WP_011967769.1\|478482_479133_+	hypothetical protein	NA	NA	NA	NA
WP_023974853.1\|479294_480557_+	UDP-N-acetylglucosamine 1-carboxyvinyltransferase	NA	NA	NA	NA
WP_011967771.1\|481157_482216_+	stage II sporulation protein D	Q2XU88	Pseudomonas_phage	3.0e-37	35.1
WP_023974854.1\|482656_483394_+	M23 family metallopeptidase	NA	NA	NA	NA
WP_011967773.1\|483501_483756_+	sporulation transcriptional regulator SpoIIID	M9Q261	Clostridium_phage	5.7e-19	56.4
WP_011967774.1\|483835_484870_+	rod shape-determining protein	NA	NA	NA	NA
WP_023974855.1\|484937_485474_-\|protease	spore protease YyaC	NA	NA	NA	NA

DBSCAN-SWA_2

1052501 : 1058123

Clostridium_phage(88.89%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_154862475.1\|1052501_1054073_+\|transposase	IS1182 family transposase	Q9MBP7	Staphylococcus_prophage	4.3e-64	34.0
WP_039773926.1\|1054473_1054809_-	helix-turn-helix transcriptional regulator	A0A1L2BY72	Clostridium_phage	5.4e-41	73.9
WP_039773924.1\|1054961_1055174_+	helix-turn-helix domain-containing protein	A0A1L2BY74	Clostridium_phage	1.2e-17	64.3
WP_039773923.1\|1055212_1055644_+	helix-turn-helix transcriptional regulator	A0A1L2BY71	Clostridium_phage	2.4e-65	88.1
WP_167514407.1\|1055700_1055865_+	hypothetical protein	A0A1L2BY76	Clostridium_phage	1.6e-19	88.9
WP_084670618.1\|1055900_1056200_+	hypothetical protein	A0A1L2BY79	Clostridium_phage	1.3e-22	77.8
WP_011968234.1\|1056290_1056473_+	hypothetical protein	A0A1L2BY78	Clostridium_phage	3.3e-21	86.4
WP_039773922.1\|1056520_1057354_+	helix-turn-helix domain-containing protein	A0A1L2BY83	Clostridium_phage	2.2e-67	55.5
WP_039773921.1\|1057346_1058123_+	hypothetical protein	A0A1L2BY85	Clostridium_phage	1.4e-71	56.3

DBSCAN-SWA_3

1063839 : 1072426

Paenibacillus_phage(33.33%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_084670616.1\|1063839_1064190_-\|transposase	IS3 family transposase	A0A0C5AEA5	Paenibacillus_phage	3.6e-24	59.6
WP_039773913.1\|1064202_1065681_-	group II intron reverse transcriptase/maturase	A0A0U4J920	Pseudomonas_phage	1.2e-111	48.9
WP_084670614.1\|1066206_1066821_-\|transposase	IS3 family transposase	A0A0C5AEA5	Paenibacillus_phage	1.1e-26	49.0
WP_023973955.1\|1066922_1067081_-	helix-turn-helix domain-containing protein	A0A0C5AJ29	Paenibacillus_phage	6.9e-07	60.0
WP_023973953.1\|1067407_1067581_+	hypothetical protein	S6B9W8	Thermus_phage	6.4e-06	59.5
WP_023973952.1\|1067773_1068628_+	YitT family protein	NA	NA	NA	NA
WP_039773912.1\|1068731_1068968_+	hemolysin XhlA family protein	Q0SPG4	Clostridium_phage	1.1e-11	44.7
WP_039773911.1\|1068983_1069379_+	hypothetical protein	M9Q2G0	Clostridium_phage	3.7e-25	56.1
WP_039773910.1\|1069448_1070234_+	glycoside hydrolase	Q0SPG7	Clostridium_phage	1.2e-35	42.9
WP_039773909.1\|1070697_1071120_-	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_011968276.1\|1071147_1071624_+	ABC transporter substrate-binding protein	NA	NA	NA	NA
WP_017209855.1\|1071658_1072426_+	ABC transporter ATP-binding protein	G3M9Y6	Bacillus_virus	3.2e-33	38.3

DBSCAN-SWA_4

1217928 : 1228156

Cyanophage(28.57%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_039770444.1\|1217928_1221675_+	phosphoribosylformylglycinamidine synthase	A6N228	Microbacterium_phage	1.3e-29	24.6
WP_017210869.1\|1222104_1222584_+	5-(carboxyamino)imidazole ribonucleotide mutase	A0A2P0VNU7	Tetraselmis_virus	5.9e-25	42.4
WP_011968398.1\|1222583_1223291_+	phosphoribosylaminoimidazolesuccinocarboxamide synthase	M4SM18	Cyanophage	2.4e-46	43.8
WP_039770442.1\|1223548_1224964_+	amidophosphoribosyltransferase	A0A0M3SGR2	Mollivirus	7.8e-57	33.5
WP_011968400.1\|1225033_1226035_+	phosphoribosylformylglycinamidine cyclo-ligase	A0A1D7SQF5	Cyanophage	2.2e-66	44.5
WP_039770439.1\|1226022_1226634_+	phosphoribosylglycinamide formyltransferase	R9S626	Prochlorococcus_phage	1.0e-21	36.2
WP_039770437.1\|1226647_1228156_+	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase	E3SNU8	Prochlorococcus_phage	2.0e-34	45.0

DBSCAN-SWA_5

2472234 : 2476717

Clostridium_virus(16.67%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012058440.1\|2472234_2472594_-	helix-turn-helix transcriptional regulator	B6SBW8	Clostridium_virus	1.0e-13	40.4
WP_023975159.1\|2472912_2473110_+	DUF739 family protein	A0A0A7RTP5	Clostridium_phage	1.2e-08	53.3
WP_023975158.1\|2473599_2474961_+	replisome organizer region-containing protein	A8ASN4	Listeria_phage	1.1e-28	51.7
WP_031275900.1\|2475010_2475637_+	ATP-binding protein	A0A0K2CPA5	Brevibacillus_phage	3.6e-30	39.5
WP_012058444.1\|2475750_2475993_+	AbrB/MazE/SpoVT family DNA-binding domain-containing protein	A0A2I7SC16	Paenibacillus_phage	2.7e-10	48.6
WP_023975156.1\|2476408_2476717_-	thioredoxin	A0A1J0GW78	Streptomyces_phage	7.4e-13	44.9

DBSCAN-SWA_6

3634003 : 3642401

Clostridium_phage(28.57%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_039773558.1\|3634003_3634246_-	AbrB/MazE/SpoVT family DNA-binding domain-containing protein	A0A2I7SC16	Paenibacillus_phage	2.6e-13	48.6
WP_154861642.1\|3635019_3635820_-	ATP-binding protein	Q0H276	Geobacillus_phage	8.1e-35	41.2
WP_039773556.1\|3636939_3637710_-	DNA recombination protein RecT	A0A0A7RW37	Clostridium_phage	2.6e-67	52.4
WP_039773554.1\|3637769_3638684_-	hypothetical protein	A0A0A7RWR9	Clostridium_phage	2.1e-103	57.0
WP_023973792.1\|3639033_3639246_-	hypothetical protein	NA	NA	NA	NA
WP_051144914.1\|3639463_3639976_+	helix-turn-helix transcriptional regulator	Q786F1	Bacillus_phage	7.5e-10	34.6
WP_031275648.1\|3640152_3640596_+	ImmA/IrrE family metallo-endopeptidase	Q9T201	Bacillus_phage	7.2e-17	38.9
WP_039773552.1\|3640658_3640946_+	hypothetical protein	NA	NA	NA	NA
WP_039773551.1\|3640971_3641166_+	hypothetical protein	NA	NA	NA	NA
WP_039773550.1\|3641561_3642401_-	N-acetylmuramoyl-L-alanine amidase	A0A067ZJB6	Vibrio_phage	5.3e-05	27.5

DBSCAN-SWA_7

3843747 : 3856287

Clostridium_phage(81.82%)

terminase,plate,tail

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_039769254.1\|3843747_3843981_-	hemolysin XhlA family protein	A0A0A7S0T7	Clostridium_phage	2.1e-15	50.6
WP_039769252.1\|3844143_3844341_-	hypothetical protein	NA	NA	NA	NA
WP_039769249.1\|3844342_3844792_-	hypothetical protein	NA	NA	NA	NA
WP_039769245.1\|3845937_3846720_-	hypothetical protein	NA	NA	NA	NA
WP_039769242.1\|3846737_3847391_-\|tail	phage tail protein	A0A0A7RTP0	Clostridium_phage	4.2e-50	57.6
WP_039769239.1\|3847392_3848097_-	YmfQ family protein	A0A2H4J1P4	uncultured_Caudovirales_phage	8.1e-31	37.5
WP_039769237.1\|3848089_3849196_-\|plate	baseplate J/gp47 family protein	A0A0A7RUN3	Clostridium_phage	7.2e-50	35.9
WP_039769234.1\|3849188_3849629_-	DUF2634 domain-containing protein	A0A0A7S0E2	Clostridium_phage	4.6e-24	45.5
WP_012059569.1\|3849621_3849945_-	DUF2577 domain-containing protein	NA	NA	NA	NA
WP_039769231.1\|3849944_3850949_-	hypothetical protein	A0A0A7RTP6	Clostridium_phage	1.0e-58	37.3
WP_039769229.1\|3850945_3851425_-	hypothetical protein	A0A090DBR9	Clostridium_phage	9.1e-18	33.3
WP_069187745.1\|3851438_3853643_-	hypothetical protein	A0A142KC22	Gordonia_phage	4.8e-29	34.6
WP_039769227.1\|3853848_3854253_-	XkdN-like protein	A0A0A7RTP2	Clostridium_phage	2.2e-28	49.2
WP_012059574.1\|3854721_3855153_-\|tail	phage tail tube protein	A0A0A7RVT1	Clostridium_phage	3.8e-39	58.1
WP_039769225.1\|3855165_3856287_-\|terminase	terminase	A0A0A7S0D2	Clostridium_phage	2.7e-84	46.5

DBSCAN-SWA_8

4312655 : 4321845

Paenibacillus_phage(33.33%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_051144954.1\|4312655_4314254_+	sensor histidine kinase	Q9EYF3	Enterobacteria_phage	3.8e-52	29.5
WP_039773735.1\|4314258_4314981_+	response regulator transcription factor	A0A2R2ZGH8	Clostridioides_phage	3.5e-13	25.7
WP_039773734.1\|4315154_4316381_+	OFA family MFS transporter	NA	NA	NA	NA
WP_011968065.1\|4316669_4317350_+	helix-turn-helix domain-containing protein	A0A0C5AJ29	Paenibacillus_phage	7.3e-53	49.1
WP_167514426.1\|4317652_4318162_+\|transposase	IS3 family transposase	A0A0C5AEA5	Paenibacillus_phage	1.8e-51	56.7
WP_039768479.1\|4318310_4319729_-	sigma-54-dependent Fis family transcriptional regulator	Q6XM27	Feldmannia_irregularis_virus	5.3e-05	25.5
WP_031276040.1\|4319874_4321845_-	methyl-accepting chemotaxis protein	A0A2H4J162	uncultured_Caudovirales_phage	5.3e-11	52.6

DBSCAN-SWA_9

5638421 : 5647906

Clostridium_phage(37.5%)

integrase

attL 5639017:5639032|attR 5655959:5655974

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_084670569.1\|5638421_5639138_-	hypothetical protein	A0A1L2BY85	Clostridium_phage	7.2e-59	54.1
5639017:5639032	attL	NA	NA	NA	NA
WP_009168792.1\|5639272_5639497_+	DUF1659 domain-containing protein	NA	NA	NA	NA
WP_009168791.1\|5639540_5639759_+	DUF2922 domain-containing protein	NA	NA	NA	NA
WP_039773051.1\|5640668_5641061_-	hypothetical protein	NA	NA	NA	NA
WP_039773053.1\|5641062_5641305_-	AbrB/MazE/SpoVT family DNA-binding domain-containing protein	A0A2I7SC16	Paenibacillus_phage	9.9e-13	52.7
WP_039773055.1\|5641417_5642044_-	ATP-binding protein	A0A0K2CPA5	Brevibacillus_phage	2.3e-29	39.0
WP_039773057.1\|5642093_5643383_-	phage replisome organizer	V5UQV4	Oenococcus_phage	1.4e-25	50.9
WP_051144884.1\|5643524_5643755_-	hypothetical protein	NA	NA	NA	NA
WP_008423918.1\|5643773_5643995_-	helix-turn-helix domain-containing protein	A0A2I7SCU5	Paenibacillus_phage	5.5e-10	51.5
WP_039773062.1\|5644111_5644336_-	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_039773064.1\|5644588_5644963_+	helix-turn-helix transcriptional regulator	A0A090D830	Clostridium_phage	2.0e-12	37.3
WP_023975313.1\|5645158_5645335_+	hypothetical protein	NA	NA	NA	NA
WP_039773065.1\|5645318_5646476_+\|integrase	site-specific integrase	A0A0A8WIF9	Clostridium_phage	7.9e-108	51.7
WP_039773066.1\|5646541_5647906_-	23S rRNA (uracil(1939)-C(5))-methyltransferase RlmD	A0A2K5B251	Erysipelothrix_phage	2.2e-101	41.9
5655959:5655974	attR	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP043998

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection