CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number
CP026103	Paraburkholderia caribensis strain DSM 13236 chromosome 3, complete sequence	1 crisprs	csa3,cas3	0	1	0
CP026102	Paraburkholderia caribensis strain DSM 13236 chromosome 2, complete sequence	4 crisprs	csa3,DinG,cas3,WYL	3	2	0
CP026104	Paraburkholderia caribensis strain DSM 13236 chromosome 4, complete sequence	0 crisprs	NA	0	0	0
CP026101	Paraburkholderia caribensis strain DSM 13236 chromosome 1, complete sequence	3 crisprs	WYL,RT,DEDDh,csa3,DinG,cas3,PD-DExK,c2c9_V-U4,cas14j	0	3	3

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: CP026103_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026103_1

1312920-1313005

Orphan

Consensus_repeat	Method
GCTAACGTCACGCGGATGCCAGCG	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026103_1

>merge|CP026103|1|1312920-1313005|CRISPRCasFinder
GCTAACGTCACGCGGATGCCAGCGAAAAGGCCGATAACACCGAACGGCGACGCGTGAAGCACGCTAACGTAACGCGGATGCCAGCG

>CP026103|1|1|1312920-1313005|CRISPRCasFinder
GCTAACGTCACGCGGATGCCAGCG	AAAAGGCCGATAACACCGAACGGCGACGCGTGAAGCAC
GCTAACGTAACGCGGATGCCAGCG

Protein	Signature genes	Signature genes Name	Protein_function
CP026103.1\|AUT57106.1\|1321260_1321686_+\|glyoxalase	unknown	unknown	gnl\|CDD\|319906
CP026103.1\|AUT57098.1\|1313187_1313574_-\|DUF3331-domain-containing-protein	unknown	unknown	gnl\|CDD\|288644
CP026103.1\|AUT57105.1\|1320034_1320946_-\|PilZ-domain-containing-protein	unknown	unknown	gnl\|CDD\|377796
CP026103.1\|AUT57090.1\|1300251_1302117_-\|transcriptional-regulator	unknown	unknown	gnl\|CDD\|226418
CP026103.1\|AUT57092.1\|1302527_1304273_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|223566
CP026103.1\|AUT57107.1\|1321855_1322803_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176114
CP026103.1\|AUT57089.1\|1299297_1300218_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176122
CP026103.1\|AUT57097.1\|1310925_1311915_+\|cytochrome-d-ubiquinol-oxidase-subunit-II	unknown	unknown	gnl\|CDD\|376764
CP026103.1\|AUT57095.1\|1307144_1309502_+\|formate-dehydrogenase	unknown	unknown	gnl\|CDD\|273765
CP026103.1\|AUT57099.1\|1313644_1314610_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
CP026103.1\|AUT57103.1\|1318882_1319263_-\|response-regulator	unknown	unknown	gnl\|CDD\|226932
CP026103.1\|AUT57101.1\|1315691_1316366_-\|DNA-binding-response-regulator	unknown	unknown	gnl\|CDD\|226932
CP026103.1\|AUT57100.1\|1314740_1314938_-\|hypothetical-protein	unknown	unknown	unknown
CP026103.1\|AUT57104.1\|1319558_1319846_+\|DNA-binding-protein	unknown	unknown	gnl\|CDD\|225468
CP026103.1\|AUT57741.1\|1306521_1306869_+\|hypothetical-protein	unknown	unknown	unknown
CP026103.1\|AUT57094.1\|1305547_1306522_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|223656
CP026103.1\|AUT57102.1\|1316355_1318557_-\|PAS-domain-S-box-protein	unknown	unknown	gnl\|CDD\|340397
CP026103.1\|AUT57096.1\|1309494_1310895_+\|cytochrome-ubiquinol-oxidase-subunit-I	unknown	unknown	gnl\|CDD\|376587
CP026103.1\|AUT57093.1\|1304316_1304958_-\|HD-domain-containing-protein	unknown	unknown	gnl\|CDD\|188314
CP026103.1\|AUT57091.1\|1302261_1302531_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
CP026103.1\|AUT57106.1\|1321260_1321686_+\|glyoxalase	gnl\|CDD\|319906	cd07242, VOC_BsYqjT, vicinal oxygen chelate (VOC) family protein similar to Bacillus subtilis YqjT. The vicinal oxygen chelate (VOC) superfamily is composed of structurally related proteins with paired beta.alpha.beta.beta.beta motifs that provide a metal coordination environment with two or three open or readily accessible coordination sites to promote direct electrophilic participation of the metal ion in catalysis. VOC domain is found in a variety of structurally related metalloproteins, including the bleomycin resistance protein, glyoxalase I, and type I ring-cleaving dioxygenases. A bound metal ion is required for protein activities for the members of this superfamily. A variety of metal ions have been found in the catalytic centers of these proteins including Fe(II), Mn(II), Zn(II), Ni(II) and Mg(II). The protein superfamily contains members with or without domain swapping. The proteins of this family share three conserved metal binding amino acids with the type I extradiol dioxygenases, which shows no domain swapping.	7.56588e-14
CP026103.1\|AUT57098.1\|1313187_1313574_-\|DUF3331-domain-containing-protein	gnl\|CDD\|288644	pfam11811, DUF3331, Domain of unknown function (DUF3331). This family of proteins are functionally uncharacterized. This family is only found in bacteria. Proteins in this family vary in length from 96 to 160 amino acids.	2.17638e-31
CP026103.1\|AUT57105.1\|1320034_1320946_-\|PilZ-domain-containing-protein	gnl\|CDD\|377796	pfam07238, PilZ, PilZ domain. PilZ is a c-di-GMP binding domain which is found C terminal to pfam07317. Proteins which contain PilZ are known to interact with the flagellar switch-complex proteins FliG and FliM. This interaction results in a reduction of torque generation and induces CCW motor bias. This domain forms a beta barrel structure.	2.7478e-05
CP026103.1\|AUT57090.1\|1300251_1302117_-\|transcriptional-regulator	gnl\|CDD\|226418	COG3903, COG3903, Predicted ATPase [General function prediction only].	2.75385e-58
CP026103.1\|AUT57092.1\|1302527_1304273_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|223566	COG0492, TrxB, Thioredoxin reductase [Posttranslational modification, protein turnover, chaperones].	2.83103e-69
CP026103.1\|AUT57089.1\|1299297_1300218_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176122	cd08431, PBP2_HupR, The C-terminal substrate binding domain of LysR-type transcriptional regulator, HupR, which regulates expression of the heme uptake receptor HupA; contains the type 2 periplasmic binding fold. HupR, a member of the LysR family, activates hupA transcription under low-iron conditions in the presence of hemin. The expression of many iron-uptake genes, such as hupA, is regulated at the transcriptional level by iron and an iron-binding repressor protein called Fur (ferric uptake regulation). Under iron-abundant conditions with heme, the active Fur repressor protein represses transcription of the iron-uptake gene hupA, and prevents transcriptional activation via HupR. Under low-iron conditions with heme, the Fur repressor is inactive and transcription of the hupA is allowed. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	1.30411e-69
CP026103.1\|AUT57097.1\|1310925_1311915_+\|cytochrome-d-ubiquinol-oxidase-subunit-II	gnl\|CDD\|376764	pfam02322, Cyt_bd_oxida_II, Cytochrome bd terminal oxidase subunit II. This family consists of cytochrome bd type terminal oxidases that catalyze quinol-dependent, Na+-independent oxygen uptake. Members of this family are integral membrane proteins and contain a protohaem IX centre B558. One member of the family, Klebsiella pneumoniae CydB, is implicated in having an important role in micro-aerobic nitrogen fixation in the enteric bacterium Klebsiella pneumoniae. The family forms an integral functional unit with subunit I, family Bac_Ubq_Cox, pfam01654.	8.09424e-73
CP026103.1\|AUT57095.1\|1307144_1309502_+\|formate-dehydrogenase	gnl\|CDD\|273765	TIGR01701, Hypothetical_protein_Rv2900c/MT2968/Mb2924c., oxidoreductase alpha (molybdopterin) subunit. This model represents a well-defined clade of oxidoreductase alpha subunits most closely related to a group of formate dehydrogenases including the E. coli FdhH protein (TIGR01591). These alpha subunits contain a molybdopterin cofactor and generally associate with two other subunits which contain iron-sulfur clusters and cytochromes. The particular subunits with which this enzyme interacts and the substrate which is reduced is unknown at this time. In Ralstonia, the gene is associated with the cbb operon, but is not essential for CO2 fixation.	0
CP026103.1\|AUT57099.1\|1313644_1314610_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	2.75674e-28
CP026103.1\|AUT57103.1\|1318882_1319263_-\|response-regulator	gnl\|CDD\|226932	COG4566, TtrR, Response regulator [Signal transduction mechanisms].	5.98143e-28
CP026103.1\|AUT57101.1\|1315691_1316366_-\|DNA-binding-response-regulator	gnl\|CDD\|226932	COG4566, TtrR, Response regulator [Signal transduction mechanisms].	1.33012e-84
CP026103.1\|AUT57104.1\|1319558_1319846_+\|DNA-binding-protein	gnl\|CDD\|225468	COG2916, Hns, DNA-binding protein H-NS [General function prediction only].	3.03707e-07
CP026103.1\|AUT57107.1\|1321855_1322803_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176114	cd08422, PBP2_CrgA_like, The C-terminal substrate binding domain of LysR-type transcriptional regulator CrgA and its related homologs, contains the type 2 periplasmic binding domain. This CD includes the substrate binding domain of LysR-type transcriptional regulator (LTTR) CrgA and its related homologs. The LTTRs are acting as both auto-repressors and activators of target promoters, controlling operons involved in a wide variety of cellular processes such as amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to name a few. In contrast to the tetrameric form of other LTTRs, CrgA from Neisseria meningitides assembles into an octameric ring, which can bind up to four 63-bp DNA oligonucleotides. Phylogenetic cluster analysis further showed that the CrgA-like regulators form a subclass of the LTTRs that function as octamers. The CrgA is an auto-repressor of its own gene and activates the expression of the mdaB gene which coding for an NADPH-quinone reductase and that its action is increased by MBL (alpha-methylene-gamma-butyrolactone), an inducer of NADPH-quinone oxidoreductase. The structural topology of this substrate-binding domain is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	3.84636e-37
CP026103.1\|AUT57094.1\|1305547_1306522_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|223656	COG0583, LysR, Transcriptional regulator [Transcription].	6.0623e-45
CP026103.1\|AUT57102.1\|1316355_1318557_-\|PAS-domain-S-box-protein	gnl\|CDD\|340397	cd16920, HATPase_TmoS-FixL-DctS-like, Histidine kinase-like ATPase domain of two-component sensor histidine kinases similar to Rhizobium meliloti FixL, and Rhodobacter capsulatus DctS; includes hybrid sensor histidine kinase similar to Pseudomonas mendocina TmoS. This family includes the histidine kinase-like ATPase (HATPase) domains of various histidine kinases (HKs) of two-component signal transduction systems (TCSs), such as Pseudomonas mendocina TmoS HK of the TmoS-TmoT TCS, which controls the expression of the toluene-4-monooxygenase pathway, Rhizobium meliloti FixL HK of the FixL-FixJ TCS, which regulates the expression of the genes related to nitrogen fixation in the root nodule in response to O(2) levels, and Rhodobacter capsulatus DctS of the DctS-DctR TCS, which controls synthesis of the high-affinity C4-dicarboxylate transport system. Proteins having this HATPase domain also contain a histidine kinase dimerization and phosphoacceptor domain (HisKA) and PAS sensor domain(s); many are hybrid sensor histidine kinases as they also contain a REC signal receiver domain.	1.79177e-42
CP026103.1\|AUT57096.1\|1309494_1310895_+\|cytochrome-ubiquinol-oxidase-subunit-I	gnl\|CDD\|376587	pfam01654, Cyt_bd_oxida_I, Cytochrome bd terminal oxidase subunit I. This family are the alternative oxidases found in many bacteria which oxidize ubiquinol and reduce oxygen as part of the electron transport chain. This family is the subunit I of the oxidase E. coli has two copies of the oxidase, bo and bd', both of which are represented here In some nitrogen fixing bacteria, e.g. Klebsiella pneumoniae this oxidase is responsible for removing oxygen in microaerobic conditions, making the oxidase required for nitrogen fixation. This subunit binds a single b-haem, through ligands at His186 and Met393 (using SW:P11026 numbering). In addition His19 is a ligand for the haem b found in subunit II.	0
CP026103.1\|AUT57093.1\|1304316_1304958_-\|HD-domain-containing-protein	gnl\|CDD\|188314	TIGR03401, Uncharacterized_protein_YFL061W/YNL335W, HD domain protein, cyanamide hydratase family. Members of this protein family are known, so far, in the Ascomycota, a branch of the Fungi, and contain an HD domain (pfam01966), found typically in various metal-dependent phosphohydrolases. The only characterized member of this family, from the soil fungus Myrothecium verrucaria, is cyanamide hydratase (EC 4.2.1.69), a zinc-containing homohexamer that adds water to the fertilizer cyanamide (NCNH2), a nitrile compound, to produce urea (NH2-CO-NH2). Homologs are likely to be nitrile hydratases.	6.19599e-08

>CP026103.1|AUT57097.1|1310925_1311915_+|cytochrome-d-ubiquinol-oxidase-subunit-II
MDSSTHSLLAYVWFGLLGLMLVFYVVTDGFDLGVGILSLLRSRREDRDVMVESIGHVWDANETWLVVLGGGLFGAFPLAYAQLMQDLYLPIMALIAGLIMRGAAIEFRHSVEHGPLWDKVFGIGSLVAALAQGVVLGKIVTGLVPGEMSQGFVVVAAIGVVAGYALLGATYLVKKTVGMIEQWSRRLALLSAVLTVAAALLLTIATWFFSDVGLERWSQPGVMHVLIALGLAAALAFAFIMASLYMGASRGPFRGAVTLFIVSFAGLAVSLFPDFVPGKLGIVEAASDSHTLAFMLAGIGLIFPVMIGYNLYQYYIFRGKVVGEAHAGE
>CP026103.1|AUT57096.1|1309494_1310895_+|cytochrome-ubiquinol-oxidase-subunit-I
MLDHVANLSRAQFAMTAIFHILWPILTISLSAFLVLVEALWIKTGDVMYYRQARFWSKLLVLNFAVGVVSGIPMEFQFGTNWAGFSQYSGQFIGNILGFEGAMAFMLEAGFVGVMLLGWGRVPRGVHLFATGMVALGSSISAFWIMVANSWMQTPAGYAVVDGKIEVTNYLAAIFNPDMVWGVSHMWVAAIETGMFVIAGISAYNLFRKRHPEFFARSFKIALTVLVIAAPLQVWLGDSSGVSVFETQPAKGAAIEGHWHTNAPGTGASWSLLAWPDKQAQRNDWSLEVPGMLSVLGTHSLHGQVKGLTDFKPEDQPPMIPLLYYAFRVMAGIGFCFMLLAFWTVYALRKARGSLDALLARRKLLLAWVLCIPLPYVAVEAGWIVREVGRQPWVVYGLLRTSQAASTVAPSSVSLSMAMFFAFYVVLLVTFFVLARRWLRTGPDLTSVPPAIVTARAASTKSISGY
>CP026103.1|AUT57095.1|1307144_1309502_+|formate-dehydrogenase
MGKKKVIRIYSDPAGGWGALKATGEALTLQGIPVSGAKTLLHMNQPQGFDCPGCAWPDPKHTSSFEFCENGAKAVAWEATVNRCTPEFFAAHSVSELTAWDDYDLEMAGRLTHPMVYDASTDRYAPISWDDAFALVGRHLNALDHPDQADFYTSGRASNEAAFLYQLFVREFGSNNFPDCSNMCHEATSVGLPQSIGVGKGTVLLEDFEHADAIFIFGQNPGTNSPRMMSDLHSASRRGAKIVSFNPFRERALERFASPQNPVEMATLGYTPISTFLYQVKVGGDVAVLKGMMKAIVEADDAALAADKPRILDIEFIQGHTHGIDALLDDLRATSWDAIERHSGLSRADIENAANIYMQADNAILVYGMGITQHHRGTENVQQIANLALLRGNVGREGAGICPVRGHSNVQGNRTVGITEKPNKGLIEGIERAFGFRPPANHGNDVIATLEAMMRGDAKVFIGLGGNFAAAIPDWVRMQEAIRKLNLTVHIATKLNRSHLVHGKEALILPCLGRTEIDIQAGGPQSITVEDSMSMVHASAGRNEPASPHLMSEPAIVAGIARATLGEKSRVPWEQMVANYDHIRDAIEIVFPIFQAYNERIRVPGGFHLTSNARERVWDTPTGRANFLVFKGLDENPWHDDPDALWLTTMRSHDQYNTTLYSHSDRYRGVFGQRDVVFMNQHELHKRGLHPGERVDIVALSTDGIERVIRSFKVVEYSLPDGCCGAYYPEVNPLVPLYAFDPQSRTPSYKSVPVKIGRAAAVGPDSATRAIVMQAASHAGENSHA
>CP026103.1|AUT57741.1|1306521_1306869_+|hypothetical-protein
MRTIAFPFFRPSYAIAACSVALAATCAYQAPGVMQAILVVGANAQLPLERLAAEAGKPTPVSATDVSSPWKEHVPARARPAMLKLGSFGEPVRERHTHRGMGGYQRSVTDYKYWT
>CP026103.1|AUT57094.1|1305547_1306522_+|LysR-family-transcriptional-regulator
MDKILSMRIFSRVVESGSFSAVADHMNCSTGSVSRAVSSLEDHLHARLLQRTTRKVSLTEPGERYYRKCKKILADLEDAEAEAGDAHTSARGTLRIHCVTDLGLAQLTHSILEYRKRFPSVAVQVKFLPRMANLLEDDVDVSIVAAPALPDSRNVCKLIGHCERVLVASPAFLQTHRVETANDLDEHALTPMPFRVEPNGHPVKLSLVKPAGQSTGPEGARQFAINDTEATRIATLAGAGVAALPVHCVIDDLRNGRLLQLFPESRLQNTSVFAVYSSRHHIDAKIKTFIDFMTSHLKEALDTRVLTGHQPQTFSHVARVMENA
>CP026103.1|AUT57093.1|1304316_1304958_-|HD-domain-containing-protein
MNKNVAGVDIPDGVLARAAFEHVRGIEPELLLHHALRVFLFAALIGCKEALAFDMELLYVSALFHNAGLNERYAHSPNRFEIDSANAAREFLRCHRADESATAQVWTAIALHTTPGIPEHMPPLVALLSAGVQMDVRGARYHEFIAQQRNDIVQAFPRERGFKTKLIEAYARGMEHRPETTFGTVNADVLDRWDPDYRRLNFCGLVLGSEWPH
>CP026103.1|AUT57092.1|1302527_1304273_-|FAD-dependent-oxidoreductase
MNTPAINPPDLLSAQPDAGAPDLAMPYSSLEFRQHQMFPRLSAAQIASLRRFAQPMSFRAGELIFETGRIALGLFVLLHGRVRISSRDSFGRSTLVTEHDDGHFMAEMAQLSGKPALIDGVALTDCDTLVVSPDKLRALIVADAQLGEHIMRALILRRLGLIEQGLGPIIVGNGDDARLVRLQGFLRRNAYPATVIDARHDAEAATLLAGITTGPDDFPLVFCPNGSVLRAPDEAQLASCLGLVPTFERSHVYDVAIVGAGPAGLAAAVYAATEGLSVAVFDQRAPGGQAGASSRIENYLGFPTGISGQALAARAFQQALKFGAHLAIPGKVTCVDSEDGIHGLTLLDGQRVNARTVVVASGAAYRKPGIAGFDRFEGSGIYYWASPIEAKLVKGQDIVLIGGGNSAGQATVFLANFARSIRVLIRGADLNASMSKYLIDRIGSLPNVSLCTRCTLQALEGDEAGLTHVRVRREDEGDETIETRHLFLFIGADPKTDWLMSSGVELDSHGFVVTGFARRSQTPGGSGIHYPLETSLPGMFAVGDVRSESTKRVASAVGDGAAVVSQIHAYLAHCHAAAQNS
>CP026103.1|AUT57091.1|1302261_1302531_+|hypothetical-protein
MHGWKNPNDPFKKFEVVARASIAKVPYEVRIEAKACWRCAARAALAYPTQRWVSCNWIAAAGAISPDVTRTATCTRAQRVRRIAAASRG
>CP026103.1|AUT57090.1|1300251_1302117_-|transcriptional-regulator
MTRVGPLDIDLTRREARVDGMTVRIGNRAFDILELLIEAQGGLVSKETILERVWPDSVVGDNNLQVHMSALRKLLGDSRDLIKTIAGRGYRLVGSGACVQHEAGASLHDAPHGLVQSAVPNNLPACGSVLVGRDEATAHVSTVLRNARHVTLVGSGGIGKTRVAIEVARRLLEHAPGGVYFVSLGSASDMSCVLAMMASVIGVPPESGCSTRERIVEAIGGRRMLIVLDGCEHVIDGAAQLANHLLNACPHLRVLSTSREPLRIPSETLYWVPALDVPEPNDDTPRVRRCSAVSLFLIRARAIDARFATDDASLHVTGMVCRRLDGIPLAIELAAARAALLGIDTLAAHLDDRFGMLTGGTRTALPRHQTLKATLDWSHALLDEAERKTLRRVGIFADRFPLEAAVAVASDHETRELDVVAAMAALVEKSLVVASTGPGIASFRLLETTRMYARQKLDDNGERRVVALNHARYLSTVIDSNARAAGQCGGERWRSGMPALLDEVRAALGWVLSEDGDAALRETLPANAVFLFYELSLIDECCTWARRALAAIAPADESAHALPRQRARLRLLAALGAALVRVRGPNPETHAIWNEVLASAIASGDRPHADAGSRLISATPL
>CP026103.1|AUT57089.1|1299297_1300218_+|LysR-family-transcriptional-regulator
MNLSFEVLQALDAIDRTGTFAAAAEELHKVPSSLTYLVQKLEVDLGVKLFERTGRRAKLTHAGRVIVEEGRRLLEAARELELKAKRIEHGWESELRVAIDEIIPFDLIWPHVTEFYKLNLGTRLLLSKETLGGTWDALITRRADLVVGAAGEPPPIANLVAKPIGSLQHAFVMAPGHPLASAAEPLTMDAVARHRAVAISDTSRKLTPRTIALAANQEVLTVPTLETKLAAQIRGLGIGTVPECIAAGPLNRGQLVRKEVSGMRSVTHFYLAWRDDEAGKALRWWVDQLDRPDLIDDVAHRLVAMS
>CP026103.1|AUT57098.1|1313187_1313574_-|DUF3331-domain-containing-protein
MLANANVMDPWTQTIGLLGTASRLMAVAEAAAQPRHKTRSADEPVGAQVTLIDRPTPSTATIAWRDSTRGCFGDQVWRMARARMPGFCAMSGQAIRPGDAVYKPNPRPTPVNGDAMILASVLRDAATL
>CP026103.1|AUT57099.1|1313644_1314610_-|AraC-family-transcriptional-regulator
MTTTMLDLHAPLADVVSRRQASPIVAEQQWRRMTASASAHDAATQRDNVVVMRWTHNGDAPLEVSNEGSADDHCIGLNLKCAAMTFDHAGRRLVHGRLTAGAVQVTAPAVPTKAVFASSADVLHLFVSQQVLAECYQDLFQHSRDTGIVLDDPELIRDPVLERLGQALAVSQSNDAALGKMFTDSVSLAIVSHIVARHFAGATRRSREAAPLPQWRMNRVIEFVDAHLAEPIGLADIAASAGLTRMHFAAQFRRATGVRPHEYLLRRRVEHAQHLLVTSKHNVMDVALSCGFRSQAHFTTVFKKFVGETPHRWKEKTNDAR
>CP026103.1|AUT57100.1|1314740_1314938_-|hypothetical-protein
MPARRQTHEPNRRCAKAKRGCQRSGQNTPNQTKPNQTKPNQTKPNQTKPQPAPRPRRRPLNLHIG
>CP026103.1|AUT57101.1|1315691_1316366_-|DNA-binding-response-regulator
MSSDEMNDPNQSIVYVVDDDDSMRAAVTMLLRSVGLRVEAFASAQEFLSLDKPDIPSCLILDVRLKGQSGLAVQEQIAAGNVHVPIIFMTAHGDIAMSVKAMKAGAMDFLAKPFRDQDMLDAVATALAKDEERRKSERSVSDLRKRYESLTPREREVMAFVASGLMNKQIAAEMNLSEITVKIHRGQAMKKMESRSLADFVLKAEALGVKSLEGGASARTQRGV
>CP026103.1|AUT57102.1|1316355_1318557_-|PAS-domain-S-box-protein
MMFRQAAGMTSARDARVLFSLAGIVGVIVFVIDALTPLDIAIAVLYVVVVMLVASTGLRHATIATACACAALTVIAFLMSHDENYSGGSIARGIVSLLAIGTTSFLSLRNQANTARLQEQIQLLNLTHDAIVAYDMSDRITFWNQGAEELYGWTAEQAIGQRIHELTRTSSSIPVHELRDEVVRKGRWEGELERVRSDGSSVIVSSRFALWRDDKGRPRAILATNNDITMRKRMEAELQRQQEDLRATIDAIPGMVWSSSRDGELSYINRRWNELGITLTGGSGDVWTSIVHPDDWPAMHAAWRGAIATGKPFENVARIRQSNGSYRWMHIGADPLRDQNGQILRWYGVNTDIEERKQAEQALERSEAFLSDAQRLSRTGSIATRLPAGAMWWSDETYRIFEYSPDYTPGMELILARTHPDDLALVREAYESGRSGAPYVDVEHRLQMPDGRIKYVHYVAHLAVPQSASIEYVGALMDVTERHLAQDALDRSTAELAHVTRVTMLGELAASIAHEVTQPLAAIVTAGDAATRWLNRAKPDLGEVGQSISQMVRDAKRASDVIRQIRSMAQKRDPSQAVLDLNGIVRESIELVRRELDAARVELEASYAEPPPLVCGDRVQLQQVVINLVMNGVQAMAGITGQARRMCIATSRVDGHYGQVAVEDSGTGISEENVGRLFNAFFTTKADGMGMGLSICRSIVEAHGGRIWAESEEGRGATMQFVLPIDKGTCDEQ
>CP026103.1|AUT57103.1|1318882_1319263_-|response-regulator
MHNHPIASVIDDDESVRTAMSSLVRSLDWDVRLYASAEAFLASDVDQVACIISDVQMPGMSGLDMYRHLLDKGVTQPIIFISAFASDAVRRQALDLGAMCVLTKPVDGAEVSRCLARLEPDGSQGE
>CP026103.1|AUT57104.1|1319558_1319846_+|DNA-binding-protein
MHRLFANEENNVSAVIEHLEGEARERLIVWLKRRMQECNITLEALQHALQQDIDEAKRVRYRDASGNTWTGDGEHPEWLRRAVAAGQSVDHFLCE
>CP026103.1|AUT57105.1|1320034_1320946_-|PilZ-domain-containing-protein
MPLVPLSQREVTIGVPLPFSVYTADGRLLMARGHIIHSAAQCERLFVQGPFRQPFPGERREDARPEDADITPPSAGRARRGHEDQTLVGPFPVSGCIPEDFVITLANGPAISSRTRFVGALDDVSLLLAGAGVDPAFAPGEAVEGQFIAGRYRHAFESEVVGRHTSPFDVLYLRYPTEVRSRALRRHVRVGIDVTARLSQNDRPMAGTEVRAVDLSAAGVGLLVNANSNSLAPGEHFKLSLPLARAGRVRTAPLNCIARNRRTKDGETLVGAEFGNTSGDVRALVKEYVLDVLTGAVPPERHA
>CP026103.1|AUT57106.1|1321260_1321686_+|glyoxalase
MTTQALTSGIDHVGLAVRDLNLTRDFFVECLQWKQVGEKPDYPAAFVSDGHVMLTLWQVTNQANLVAFDRKTNVGLHHLALRVGSEEALSEIFRRVSQWPGVKVEFAPENLGAGPKRHTMIYEPGGIRLEFDFDPRLKAAG
>CP026103.1|AUT57107.1|1321855_1322803_+|LysR-family-transcriptional-regulator
MDQLYMLRAFVSAAQHQSFSKAAASLGVTTGSISKAIAKLETSIQTRVLHRTTRSVTLTEEAQSYYLSCCRLLEELDEANRRIMREREVDSGKLRLVIHPMLVSETFSQFLSSYRAVAPNVNLVVSVDEGAVNLYDGQFDMAMLPPHQVEQSAVIRRTLFKSSRSLVASADYLAQRGTPHRAADLAGHFLLLPSQSRQRSTNYVQVIENGQPVQVIPMSSMDGNDVLLRAAALAGAGIAELPEAMAREDVAMGKLVPVLPGCSISDSEVEICLFYSHRELLPARFRTFVDFCTEFFRLNSARRRAPLPDAQAQAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
CP026103_1	1.1\|1312944\|38\|CP026103\|CRISPRCasFinder	1312944-1312981	38	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	768027-768064	0	1.0
CP026103_1	1.1\|1312944\|38\|CP026103\|CRISPRCasFinder	1312944-1312981	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	508524-508561	3	0.921
CP026103_1	1.1\|1312944\|38\|CP026103\|CRISPRCasFinder	1312944-1312981	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1036100-1036137	5	0.868

1. spacer 1.1|1312944|38|CP026103|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 0, identity: 1.0

aaaaggccgataacaccgaacggcgacgcgtgaagcac	CRISPR spacer
aaaaggccgataacaccgaacggcgacgcgtgaagcac	Protospacer
**************************************

2. spacer 1.1|1312944|38|CP026103|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 3, identity: 0.921

aaaaggccgataacaccgaacggcgacgcgtgaagcac	CRISPR spacer
caaaggccgataacaccgaacggcgacgcgtgaagcga	Protospacer
 ***********************************.

3. spacer 1.1|1312944|38|CP026103|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

--aaaaggccgataacaccgaacggcgacgcgtgaagcac	CRISPR spacer
ccaaaacacca--aacaccgaacggcgacgcgtgaagcac	Protospacer
  **** .**.  ***************************

Prophage detection

Region	Region Position	Protein_number	Hit_taxonomy	Key_proteins	Att_site	Prophage annotation

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: CP026101_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026101_1

2302363-2302452

Orphan

Consensus_repeat	Method
GCTAACGAATCGCGGATGCCAGCGAA	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026101_1

>merge|CP026101|1|2302363-2302452|CRISPRCasFinder
GCTAACGAATCGCGGATGCCAGCGAAGAAAAAACCAAAACCCCGAACAGCGACGCGTGAAGCGAGCTAACGCATCGCGGATGCCAGCGAA

>CP026101|1|1|2302363-2302452|CRISPRCasFinder
GCTAACGAATCGCGGATGCCAGCGAA	GAAAAAACCAAAACCCCGAACAGCGACGCGTGAAGCGA
GCTAACGCATCGCGGATGCCAGCGAA

Protein	Signature genes	Signature genes Name	Protein_function
CP026101.1\|AUT52180.1\|2297828_2297990_+\|DUF1328-domain-containing-protein	unknown	unknown	gnl\|CDD\|227774
CP026101.1\|AUT52181.1\|2298072_2298276_-\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT52188.1\|2308336_2308609_+\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT52184.1\|2302465_2305189_-\|alpha-ketoglutarate-dehydrogenase	unknown	unknown	gnl\|CDD\|237267
CP026101.1\|AUT52185.1\|2305347_2305887_+\|Lrp/AsnC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224439
CP026101.1\|AUT52179.1\|2297187_2297679_-\|DUF523-domain-containing-protein	unknown	unknown	gnl\|CDD\|377367
CP026101.1\|AUT52178.1\|2296512_2297163_+\|lysine-transporter-LysE	unknown	unknown	gnl\|CDD\|273358
CP026101.1\|AUT52192.1\|2311872_2313237_-\|serine--pyruvate-aminotransferase	unknown	unknown	gnl\|CDD\|224942
CP026101.1\|AUT52191.1\|2309932_2310220_-\|PAAR-domain-containing-protein	unknown	unknown	gnl\|CDD\|269829
CP026101.1\|AUT53461.1\|2298495_2299167_-\|TetR/AcrR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224228
CP026101.1\|AUT52176.1\|2292232_2295106_-\|sugar-ABC-transporter	unknown	unknown	gnl\|CDD\|200548
CP026101.1\|AUT52190.1\|2309152_2309920_+\|SGNH/GDSL-hydrolase-family-protein	unknown	unknown	gnl\|CDD\|238141
CP026101.1\|AUT52182.1\|2299334_2300231_-\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|237907
CP026101.1\|AUT52183.1\|2300293_2301226_+\|EamA-family-transporter	unknown	unknown	gnl\|CDD\|227339
CP026101.1\|AUT52186.1\|2305913_2307548_-\|AMP-dependent-synthetase	unknown	unknown	gnl\|CDD\|341275
CP026101.1\|AUT52187.1\|2307632_2308163_-\|MgtC/SapB-family-protein	unknown	unknown	gnl\|CDD\|224204
CP026101.1\|AUT52189.1\|2308654_2309026_-\|DUF2591-domain-containing-protein	unknown	unknown	gnl\|CDD\|378491
CP026101.1\|AUT53463.1\|2310478_2311834_-\|malate-permease	unknown	unknown	gnl\|CDD\|377030
CP026101.1\|AUT53462.1\|2301308_2301695_+\|DUF4440-domain-containing-protein	unknown	unknown	gnl\|CDD\|226769
CP026101.1\|AUT52177.1\|2295608_2296424_+\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117

Protein	Function_ID	Function_description	E-value
CP026101.1\|AUT52180.1\|2297828_2297990_+\|DUF1328-domain-containing-protein	gnl\|CDD\|227774	COG5487, COG5487, Small integral membrane protein [Function unknown].	0.00648885
CP026101.1\|AUT52178.1\|2296512_2297163_+\|lysine-transporter-LysE	gnl\|CDD\|273358	TIGR00949, Uncharacterized_membrane_protein_YahN, The Resistance to Homoserine/Threonine (RhtB) Family protein. [Transport and binding proteins, Amino acids, peptides and amines].	1.39637e-22
CP026101.1\|AUT52192.1\|2311872_2313237_-\|serine--pyruvate-aminotransferase	gnl\|CDD\|224942	COG2031, AtoE, Short chain fatty acids transporter [Lipid metabolism].	7.95578e-109
CP026101.1\|AUT52185.1\|2305347_2305887_+\|Lrp/AsnC-family-transcriptional-regulator	gnl\|CDD\|224439	COG1522, Lrp, Transcriptional regulators [Transcription].	1.68736e-48
CP026101.1\|AUT52179.1\|2297187_2297679_-\|DUF523-domain-containing-protein	gnl\|CDD\|377367	pfam04463, DUF523, Protein of unknown function (DUF523). Family of uncharacterized bacterial proteins.	2.26146e-57
CP026101.1\|AUT53461.1\|2298495_2299167_-\|TetR/AcrR-family-transcriptional-regulator	gnl\|CDD\|224228	COG1309, AcrR, Transcriptional regulator [Transcription].	6.14045e-12
CP026101.1\|AUT52191.1\|2309932_2310220_-\|PAAR-domain-containing-protein	gnl\|CDD\|269829	cd14744, PAAR_CT_2, proline-alanine-alanine-arginine (PAAR) domain with uncharacterized C-terminal extension. This domain is found in the PAAR (proline-alanine-alanine-arginine) repeat family of mostly beta- and gamma-proteobacteria, and forms a sharp conical extension on the VgrG spike, a trimeric protein complex of the bacterial type VI secretion system (T6SS). Most members contain C-terminal domain extensions corresponding to several uncharacterized domains such as S-type pyocin, DUF2235, DUF2345 and cytotoxic proteins. However, these terminal domains are exposed to solution, and do not distort the binding site of VgrG. The pointed tip of the PAAR domain is stabilized by a zinc atom positioned close to the cone's vertex and is likely to be important for its integrity during penetration of the target cell envelope. VgrG proteins are orthologous to the central baseplate spikes of bacteriophages with contractile tails, and genes encoding proteins with PAAR motifs have been frequently found immediately downstream from vgrG-like genes.	4.00609e-23
CP026101.1\|AUT52184.1\|2302465_2305189_-\|alpha-ketoglutarate-dehydrogenase	gnl\|CDD\|237267	PRK13012, PRK13012, 2-oxoacid dehydrogenase subunit E1; Provisional.	0
CP026101.1\|AUT52176.1\|2292232_2295106_-\|sugar-ABC-transporter	gnl\|CDD\|200548	cd10922, CE4_PelA_like_C, C-terminal Putative NodB-like catalytic domain of PelA-like uncharacterized hypothetical proteins found in bacteria. This family is represented by a protein PelA of unknown function that is encoded by a gene in the pelA-G gene cluster for pellicle production and biofilm formation in Pseudomonas aeruginosa. PelA and most of the family members contain a domain of unknown function, DUF297, in the N-terminus and a C-terminal domain that shows high sequence similarity to the catalytic domain of the six-stranded barrel rhizobial NodB-like proteins, which remove N-linked or O-linked acetyl groups from cell wall polysaccharides and belong to the larger carbohydrate esterase 4 (CE4) superfamily.	5.06774e-117
CP026101.1\|AUT52190.1\|2309152_2309920_+\|SGNH/GDSL-hydrolase-family-protein	gnl\|CDD\|238141	cd00229, SGNH_hydrolase, SGNH_hydrolase, or GDSL_hydrolase, is a diverse family of lipases and esterases. The tertiary fold of the enzyme is substantially different from that of the alpha/beta hydrolase family and unique among all known hydrolases; its active site closely resembles the typical Ser-His-Asp(Glu) triad from other serine hydrolases, but may lack the carboxlic acid.	7.01505e-17
CP026101.1\|AUT52182.1\|2299334_2300231_-\|LysR-family-transcriptional-regulator	gnl\|CDD\|237907	PRK15092, PRK15092, DNA-binding transcriptional repressor LrhA; Provisional.	6.676e-48
CP026101.1\|AUT52183.1\|2300293_2301226_+\|EamA-family-transporter	gnl\|CDD\|227339	COG5006, rhtA, Threonine/homoserine efflux transporter [Amino acid transport and metabolism].	8.15534e-58
CP026101.1\|AUT52186.1\|2305913_2307548_-\|AMP-dependent-synthetase	gnl\|CDD\|341275	cd05971, MACS_like_3, Uncharacterized subfamily of medium-chain acyl-CoA synthetase (MACS). MACS catalyzes the two-step activation of medium chain fatty acids (containing 4-12 carbons). The carboxylate substrate first reacts with ATP to form an acyl-adenylate intermediate, which then reacts with CoA to produce an acyl-CoA ester. MACS enzymes are localized to mitochondria.	0
CP026101.1\|AUT52187.1\|2307632_2308163_-\|MgtC/SapB-family-protein	gnl\|CDD\|224204	COG1285, SapB, Uncharacterized membrane protein [Function unknown].	3.42921e-41
CP026101.1\|AUT52189.1\|2308654_2309026_-\|DUF2591-domain-containing-protein	gnl\|CDD\|378491	pfam10765, DUF2591, Protein of unknown function (DUF2591). This bacterial family of proteins has no known function.	1.34035e-27
CP026101.1\|AUT53463.1\|2310478_2311834_-\|malate-permease	gnl\|CDD\|377030	pfam03390, 2HCT, 2-hydroxycarboxylate transporter family. The 2-hydroxycarboxylate transporter family is a family of secondary transporters found exclusively in the bacterial kingdom. They function in the metabolism of the di- and tricarboxylates malate and citrate, mostly in fermentative pathways involving decarboxylation of malate or oxaloacetate.	8.88668e-166
CP026101.1\|AUT53462.1\|2301308_2301695_+\|DUF4440-domain-containing-protein	gnl\|CDD\|226769	COG4319, COG4319, Ketosteroid isomerase homolog [Function unknown].	1.14654e-23
CP026101.1\|AUT52177.1\|2295608_2296424_+\|AraC-family-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	1.40763e-28

>CP026101.1|AUT53462.1|2301308_2301695_+|DUF4440-domain-containing-protein
MTDDERAIRELIDTWLAASKAGETATVMSLMTDDAVFMVPGQKPFGKAAFGVAAEGQKNVDIDGKSEILELQVLGDWAFLRSQLEVTITLKDGSAPPVRHAGNTLTILRKETDGRWLVARDANLLVKG
>CP026101.1|AUT52183.1|2300293_2301226_+|EamA-family-transporter
MMGLSVVRPFKSMKNSTLAEPIAFDTAPVSSAPKLHVGMAALLGVLSMSCVQFGAALSAPTMAAFGAFSTTWLRLAWAALILALVVRPKLRSYSRAHWLAAGVLGVAMAGMTLCFFSAIERIPLGLAVAIDFLGPLAVATLGVRRLRALLWPLLAVAGVLLLAHDRSGWIGEPVGMLLAAGAACGWGSYIVLMKKTGALFDGLEGLSVSLIAAALVATPFGLVEHGLHIAPMQLAATAGLAVLVPLLPYALEMIALRHMPAASFGILMSVEPAIGAAAGFIVLHQPMTALQLAGTLFVVSASVGVIVTSK
>CP026101.1|AUT52182.1|2299334_2300231_-|LysR-family-transcriptional-regulator
MRDFDSSLLRAFVTVAETGAVSAAAVRLARTQAAVSMQLRRLEDDIGQRLLERSPRGVRLTDAGHRLLPYAHAILGAGEDARRALEVGDVAGTVRLGMLEDVAVGRLPRALRRFSAAHPQVALEIVVDASAALSQRLNEGALDVLVGDPAMVDATPLVTWTQPLFWVGARGYLADPQSPLPLVAFGGACLWQQQVMTALRRAGIAWRVVCTSTSLPAVQSAVEAGLGVSVLLDGNIRYDTMRVLGAADGLPEPPAADLGLFVRQAAGAQEAAVDALRTFLCEALDLDFIERTSRAPRR
>CP026101.1|AUT53461.1|2298495_2299167_-|TetR/AcrR-family-transcriptional-regulator
MPTTHPSRRQPKQARAEFALDSILEAAARTLESHGKAGLTTQRVADTAGFSIGAIYQYFPNKEGLVEALASRELERLTAMMKEALTQPAPFGTGLNARRMMRATAAFIGDRPRLYSILRAEWADAAPDTAIGEGMRRYFELIAGTLNRENPDLGKRIACDEARFVLFRAISGVLLATALERPHYFGTDAFEDEMVRLILGFLNYDLDPDIPRLAPEGGSFTSA
>CP026101.1|AUT52181.1|2298072_2298276_-|hypothetical-protein
MNHHQLESALDHLEHILARISGTDHLPLSYWRKRVDDVTAAARIPAQKNRARRLDEALSALESRAGA
>CP026101.1|AUT52180.1|2297828_2297990_+|DUF1328-domain-containing-protein
MLRYAAIFFVIAIIAAVFGFGGIAAGAAEIAKVLFFIFIVIFLVTLLMGVIRR
>CP026101.1|AUT52179.1|2297187_2297679_-|DUF523-domain-containing-protein
MKRILVSACLAGLPVRYDGSAKTLASMLLQTWRDEGRLVVVCPEVAAGFATPRRPAEIQLRRNGHDVLDGTARIRDNAGADVTALFIDGARHALQQALAHDCRYALLADGSPSCGSSFIHDGTFSRVAHEAVGVTAALLERHGIRVFAPDGIDELAASINVDG
>CP026101.1|AUT52178.1|2296512_2297163_+|lysine-transporter-LysE
MGLSLQQFAMVAGAHLLALLSPGPDFFLIARSALLRGWRKTGAVCFGIACANGVFIVLAVGGFAALHRHGIAFALVQAAGCAYLFYLGVLMLRHARAASIAAHVQDDSPASNTGAWPTRFAMGFASAILNPKNALFYASLFALLAARDAPFSAQIVYGVWMFAAVFGWDLLVAMGVGHPAVVARFTRHGAAIERVTGVVLLAIATSVLTMLAREWL
>CP026101.1|AUT52177.1|2295608_2296424_+|AraC-family-transcriptional-regulator
MNDQRYWCDPQLPFVESRRASHSRACYVPHTHETLSIGAVDSGHSNYACGGDRARLGPGSLVLIPAMRVHSCNPDAQSEWSYQMLHLDVAWASAVLRENGSADADTVLACPSINQNREAYLRYCALNRLLFSNADSGEKEAALILFVGERSWLGEARDLPPVPRIAGERLARITGLLHDAYGERLPIAQLAQMAGMSRYAFIRAFRAATGMSPHAYQLDLRINAARRLLRHGRALTAIAHELGFADQAHFQRAFKERVAMTPGAYRRAAVS
>CP026101.1|AUT52176.1|2292232_2295106_-|sugar-ABC-transporter
MPVGIQSIFEARQALDGVMQGDKPRMVRTTMAQPRALVRALTLVRMVALTSTAALALHGVAAHAQTQAQAQAPASTQLHAQASGGAQAPRVNLAFFYGSRVPVGELQAFDAVVIDPASGFDPAAHPLRHTVWLARTHADAAQATPDAFVAAQIETLWQRGYRGFLLDTPTAIAAVDAIRAAHPDARLVIGGDAALQAALPHAKALYAVIGPSLVRDAASGNVAAGERDARSAAAQQFTQTTGVPVVSIETCPADDRACARATAAQVLAAGVTPYVTNASLNAVGIGAIEVLPRKVLIVQDSDEDLPLDETPGVRDLATPLNYLGYDVEYANVHEPLPEGITPDRYAGVVAWLQGDETPNSGAWRAWVDARLAAHVPMVFLGQFGFDAAEDEGRALDLQAVAGPFADKIEVVSRDPMVGFEVDPKLGTRDLTGVQVGSASRSLLRVKSGEATLDQIAITPWGGFAMSPYTVVSLNGIGQERWAIQPIAFLREALRLQPMPSPSVTTENGRRLFMSHVDGDGFASRAEFPGADYSGEALFQQIFTRYKVPMTLSVIEGEVGPKGLYPQISPRLEEIARKMFALPYVAIGTHTYSHPFEWENVDAKTGERIDRGGGDTAFSLNIPNYTFNIDREVTGSIDYINSRLAPPGKKTTILQWPGNCEPPAIVVRKVYAAGVDNVNGGDTVITKSANSWTNIAPIGVLKGPGAYQVYAPNQDENVYTNDWLGPFYGFTRVLETFDMTDKPLRFKPIDIYYHMYSGTKVASLRALDQIFAAVLKQPVLPVHMTDYAHKVLDWRSFAVARTVQSEASNAKSSDWIVRGNGEVRELHWPLTSSPDLRASRGVTGYAAGPDGTYIHIADGAARVSFDPAGALSKADALPYIAEANGFVRDFKRDGKNMSFEFGSYYQPFVKLANAQTCSATVAGRAVPLQRDGAYVRFDTPALNALEAHYQPVEIRCER
>CP026101.1|AUT52184.1|2302465_2305189_-|alpha-ketoglutarate-dehydrogenase
MTDLSSGARPVLALTQARIDSDPQETAEWLAALDGVVQHVGLERAQYLFDRLAAHALGNGVATARANVTPYANTISVDQQPPYPGDLDTEEKLAAALRWNALAMVVRANRAYGELGGHIASYASAADLFEVGFNHFFRAASQSPGGHGGDLVYFQPHSSPGVYARAFLEGFLDETHLEHYRREIAGPGLCSYPHPWLMPDFWQFPTGSMGIGPINSIYQARFMRYLQNRGLQKTEGRKVWGFFGDGEMDEPESIGALSLAAREGLDNLVFVINCNLQRLDGPVRSNGRIIDELEAQFTGAGWNVIKVVWGSDWDGLFARDRTGALLRAFAHTVDGQFQTFSANDGAYNRERFFGQNPELAALAAHLSNDDIDRLRRGGHDVRKLHAAYDRALKHIGQPTVILAKTMKGFGMGAIGQGRMTTHQQKKLDVEQLKAFRDRFRLPLSDSDVEQLKFYKPAENSPEMQYLHARRAALGGYLPRRRKAASQTPTVPALSSWGQFALDANGKEMSTTMAIVRMLGSLLKDASLGPRVVPVVADEARTFGMANLFRQVGIYSPLGQLYEPEDMGSMLYYREDTGGQILEEGISEAGAVSSWIAAATSYSVHDLPMLPFYIYYSMFGFQRIGDLIWAAADQRARGFLIGATAGKTTLGGEGLQHQDGTSHLAASTVPNCRAYDPAFAYEVAMIVDEGMQEMIGRQRDVFYYLTVTNENYAQPSLPADSVDRVREGVLKGMYALDVASLETAQVQLLGSGAILGEVQAAARMLKDDWNIDAAVWSVTSFTELHRDGVASERAERLFGDHGTGTPYVTSALAASRGPVIAATDYVRAVPELIRAFVSRRYVTLGTDGFGRSDTRAALRAFFEVDRASIVIAALKALAEEGAVARGVVEEALARYGCHRDGRAAPWER
>CP026101.1|AUT52185.1|2305347_2305887_+|Lrp/AsnC-family-transcriptional-regulator
MSSEARPAARRLDRIDIAILQQLQQNARITNAELARAVNLSPTPCFNRVRALEKLGLFRQQVTLLDAGALGLRINVFIQVSLEKQVEDALRRFEQEVGERPEVMECYLMTGDADYLLRVVVPDMQSLERFIVQWLTKIPGVSNIRSSFALKQVRYKTALPLPVAGLTLPTEDDTPREWA
>CP026101.1|AUT52186.1|2305913_2307548_-|AMP-dependent-synthetase
MLPAADTYDGLVAAFEWRIPPQYNIGIDACDKWADGSGRLALICETRDGQATRYSFDQLKSLSDRFANALRRSGVKKGDRVGIFLAQSVETALAHLAVYKCGAIAVPLFALFGPDALQYRLSDSGAVALVTDLGGAQKIASVRASLPELRSIFCVDAEHADTALQVESFWSALDESPAAFDAEPTAADDPAVIIYTSGTTGKPKGALHAHRVLLGHLPGVEMPQAFFPNDARLMWTPADWAWIGGLFDVLLPSWHHGVAVLARRFEKFDGEAAFDLMQRHAVTHTFLPPTALKMMRAVEHPERWKLSLRAVASGGESLGAELIEWGRRALGVTINEFYGQTECNVVVSSCATLFDPCFGSIGKVVPGHRVAIVDDAGHTVPRGEPGNIAIHAPDPVMFLGYWRNESATRDKFRGDWLLTGDMGLMDADGFIRFVGRDDDVITSAGYRIGPAPIEDCLLRHPAVRMAAVVGAPDAQRTEIVTAFVVLNPGYQASDALVQTLQLHVKTHLAAHEYPRAIHFVDALPMTATGKVIRRELRERVTPPR
>CP026101.1|AUT52187.1|2307632_2308163_-|MgtC/SapB-family-protein
MGGWWHEVWLTMAREFSDLNDVKAITQVVMRLGLALLLGGALGFEREMAGRDAGLRTHMLVATGSALFVLVPLQAGFSQDNMSRVLQGLVSGIGFLGAGAIIKLSAQREVRGLTTAASLWLAAGVGVAAGLGREATAILSTVIALAILGGVRMIKPLVPPYTHDVPAQDESSKRVE
>CP026101.1|AUT52188.1|2308336_2308609_+|hypothetical-protein
MKKCILLAGIGVLAACTAVSGVDRKQNGYLSVTSRGRISLISWNSVRNAGIKHAKAYCREQNKELHTVEIHTNGVRSAGTQSVEVVFECI
>CP026101.1|AUT52189.1|2308654_2309026_-|DUF2591-domain-containing-protein
MRVSELEGALLDYWVARADNLPKPRVDDGFCWIEEPACDGDPAGALEAAFAPSTDWAQCGPIIERARIHLVPAAAGDRASWTGSVPAGASTIEQVGESPLIAAMRAFVASRFGDTVADEAGTH
>CP026101.1|AUT52190.1|2309152_2309920_+|SGNH/GDSL-hydrolase-family-protein
MTFDYRQASPCAKPSPRRSHALAAVLLGIAALQADAAAGRTRAAATADRPVIIDAQGDSTMFGYQTSDGFNKSWQTPDNPPALLQAALQARFGPRVIVQNNGVPGATLVDREKGINGYSQPYAQWAATSPAHIVIVNFALNDADNHVKEPPSAFRAHLMRFIEESQGAGRIVVLEEPNPVDYSVNKRIVPRYVAVVDEMAKHYRLALIRQYAYIGAMHDWRSLLIDGVHPTDALYRLKAERQRAVVAPIVAKLVE
>CP026101.1|AUT52191.1|2309932_2310220_-|PAAR-domain-containing-protein
MKRYLILNGDKTTVSGTVQAVSSTIQLEGRDVAHEGDNVICPACNTTGKIRCDGPREVMTAPDGRHAALSDDLCICKCEPPPKLVASQQTFSVGE
>CP026101.1|AUT53463.1|2310478_2311834_-|malate-permease
MKSSTQAALSATSSGRTQAPHAVVEWWWRVFDLRIGSLPLPVYVLMLGVLGAMAAKGKLAADLPTGIALVAVGGFTCAELAKRIPWIRHIGATSIFAAFIPSMLVYYKLMPEPVVKAVTTFTKTSNFLYLFIAAIIVGSVLSMDRQMLIKGFVRIFVPVAAGSVAAALVGTAVGTALGLDARHALFMVVVPIMAGGVGEGALPLSAGYAQIMGVEQGPLFAQVLSAVMLGNIAAICCAGLLSYLGTRRPEWTGNGRLTRAGDSDDDIAQRPASFEFDVGSVAAAGSTAIAFYLLGVLSHQLFGWPAPVVMLVLVVAAQLFQLVSPRVRGGARFMYGFFSTAVTYPLMFAISVAMTPWGEIVTAFHWVNIVTAVSTVLTLTVTGFFVGRLVGMYPVEAAIVNATHSGLGGTGDVAILTAANRMELMPFAQIATRIGGALTVMAALGVFAYWK
>CP026101.1|AUT52192.1|2311872_2313237_-|serine--pyruvate-aminotransferase
MKSTVAPTSVRKTRFTEATIGLFERTIPDPFVLAILITAIVAVLSAMFAPHASLGKLVGGWYKGFFDILTFAFQITLVLVTGHAFAHAPIVQRVFKSLVSVARTPVQAATLTFVLVAVASFCNWGLGLVVSALLAREVAKRMRVDFAWIVAAGFSGWVVWASGISSSIALAQSTPGSAMNVVQKITGEVLPFSATVFTGFNLVPTIAMLLAMPFVLAWLKPRDEDAVLLDTQKHPDAAPREKPTGKLSFARWIEYSWLGSAFIGATGIALLVLAQSEHIAFSGVNAVIFVMFIAGVILHGYPLAYADAVKNAARQTGSMMLQYPLYGGIMGMMDATGLPNVISHFFIAISNAHTLPFWSYVCSLIVTFFIPSGGGHWAVQGPFVVPAAVALHASVPATTMAVAMGEQVSNMMQPFWAAPVVAMAGIGVQRVLGFTVMTFIVGALVYGAALLLLV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP026101_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026101_2

3300489-3300572

Orphan

Consensus_repeat	Method
GGCGACGCTTGAAGCGAGCTAAC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026101_2

>merge|CP026101|2|3300489-3300572|CRISPRCasFinder
GGCGACGCTTGAAGCGAGCTAACGAATCGCGGATGCCAGCGAAAAAACCAAAACACCGAACGGCGACGCCTGAAGCGAGCTAAC

>CP026101|2|2|3300489-3300572|CRISPRCasFinder
GGCGACGCTTGAAGCGAGCTAAC	GAATCGCGGATGCCAGCGAAAAAACCAAAACACCGAAC
GGCGACGCCTGAAGCGAGCTAAC

Protein	Signature genes	Signature genes Name	Protein_function
CP026101.1\|AUT52965.1\|3301624_3302311_-\|flagellar-biosynthesis-protein-FlgH	unknown	unknown	gnl\|CDD\|376732
CP026101.1\|AUT52962.1\|3298658_3299156_+\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT53549.1\|3303121_3303331_-\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT52971.1\|3307546_3308818_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
CP026101.1\|AUT52969.1\|3304637_3306017_+\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|236531
CP026101.1\|AUT52956.1\|3291042_3291864_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224052
CP026101.1\|AUT52955.1\|3290278_3291046_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|223838
CP026101.1\|AUT52968.1\|3303958_3304696_+\|two-component-system-response-regulator-OmpR	unknown	unknown	gnl\|CDD\|181883
CP026101.1\|AUT52972.1\|3308826_3310095_+\|D-amino-acid-dehydrogenase	unknown	unknown	gnl\|CDD\|234819
CP026101.1\|AUT52963.1\|3299209_3299794_+\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT52970.1\|3306226_3307291_-\|protein-tyrosine-phosphatase	unknown	unknown	gnl\|CDD\|379135
CP026101.1\|AUT52966.1\|3302365_3303091_-\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT52958.1\|3293068_3293893_-\|thiazole-synthase	unknown	unknown	gnl\|CDD\|234687
CP026101.1\|AUT52961.1\|3297688_3298462_+\|KR-domain-containing-protein	unknown	unknown	gnl\|CDD\|235546
CP026101.1\|AUT52960.1\|3294160_3295300_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|274092
CP026101.1\|AUT52964.1\|3300777_3301524_+\|DNA-binding-response-regulator	unknown	unknown	gnl\|CDD\|181883
CP026101.1\|AUT52957.1\|3291950_3293072_-\|thiamine-phosphate-synthase	unknown	unknown	gnl\|CDD\|237041
CP026101.1\|AUT52967.1\|3303347_3303551_-\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT53548.1\|3295958_3297692_+\|ABC-transporter-ATP-binding-protein/permease	unknown	unknown	gnl\|CDD\|226646
CP026101.1\|AUT52959.1\|3293952_3294150_-\|thiamine-biosynthesis-protein-ThiS	unknown	unknown	gnl\|CDD\|180768

Protein	Function_ID	Function_description	E-value
CP026101.1\|AUT52965.1\|3301624_3302311_-\|flagellar-biosynthesis-protein-FlgH	gnl\|CDD\|376732	pfam02107, FlgH, Flagellar L-ring protein.	2.79471e-56
CP026101.1\|AUT52971.1\|3307546_3308818_+\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	7.30055e-135
CP026101.1\|AUT52969.1\|3304637_3306017_+\|HAMP-domain-containing-protein	gnl\|CDD\|236531	PRK09467, envZ, osmolarity sensor protein; Provisional.	4.49582e-57
CP026101.1\|AUT52968.1\|3303958_3304696_+\|two-component-system-response-regulator-OmpR	gnl\|CDD\|181883	PRK09468, ompR, osmolarity response regulator; Provisional.	1.26994e-84
CP026101.1\|AUT52955.1\|3290278_3291046_-\|ABC-transporter-permease	gnl\|CDD\|223838	COG0767, Ttg2B, ABC-type transport system involved in resistance to organic solvents, permease component [Secondary metabolites biosynthesis, transport, and catabolism].	1.16757e-86
CP026101.1\|AUT52956.1\|3291042_3291864_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224052	COG1127, Ttg2A, ABC-type transport system involved in resistance to organic solvents, ATPase component [Secondary metabolites biosynthesis, transport, and catabolism].	2.22895e-136
CP026101.1\|AUT52972.1\|3308826_3310095_+\|D-amino-acid-dehydrogenase	gnl\|CDD\|234819	PRK00711, PRK00711, D-amino acid dehydrogenase.	0
CP026101.1\|AUT52970.1\|3306226_3307291_-\|protein-tyrosine-phosphatase	gnl\|CDD\|379135	pfam13350, Y_phosphatase3, Tyrosine phosphatase family. This family is closely related to the pfam00102 and pfam00782 families.	1.76062e-72
CP026101.1\|AUT52958.1\|3293068_3293893_-\|thiazole-synthase	gnl\|CDD\|234687	PRK00208, thiG, thiazole synthase; Reviewed.	6.17115e-155
CP026101.1\|AUT52961.1\|3297688_3298462_+\|KR-domain-containing-protein	gnl\|CDD\|235546	PRK05653, fabG, 3-oxoacyl-ACP reductase FabG.	3.85656e-46
CP026101.1\|AUT52960.1\|3294160_3295300_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|274092	TIGR02352, Glycine_oxidase, glycine oxidase ThiO. This family consists of the homotetrameric, FAD-dependent glycine oxidase ThiO, from species such as Bacillus subtilis that use glycine in thiamine biosynthesis. In general, members of this family will not be found in species such as E. coli that instead use tyrosine and the ThiH protein. [Biosynthesis of cofactors, prosthetic groups, and carriers, Thiamine].	9.78244e-63
CP026101.1\|AUT52964.1\|3300777_3301524_+\|DNA-binding-response-regulator	gnl\|CDD\|181883	PRK09468, ompR, osmolarity response regulator; Provisional.	1.88872e-91
CP026101.1\|AUT52959.1\|3293952_3294150_-\|thiamine-biosynthesis-protein-ThiS	gnl\|CDD\|180768	PRK06944, PRK06944, sulfur carrier protein ThiS; Provisional.	1.49465e-29
CP026101.1\|AUT53548.1\|3295958_3297692_+\|ABC-transporter-ATP-binding-protein/permease	gnl\|CDD\|226646	COG4178, COG4178, ABC-type uncharacterized transport system, permease and ATPase components [General function prediction only].	0
CP026101.1\|AUT52957.1\|3291950_3293072_-\|thiamine-phosphate-synthase	gnl\|CDD\|237041	PRK12290, thiE, thiamine phosphate synthase.	1.21655e-89

>CP026101.1|AUT52963.1|3299209_3299794_+|hypothetical-protein
MIVTSFAHVLRFLLAACCLMSLGGCAWTLITAADATGSVIQAGYAIASNYSSPTFINGRRAKISAVCIEVNQLVSVGDFVPALQLALDKRGIRSDVYNPGTSPAGCEARLVYNASVDYGRRSFSDEPTQYLSMIDLTLIQHGRILVTARYQTGGLGVDRYSSASVKLDGLIGKMVVDQIAELQPESIQTSSIGK
>CP026101.1|AUT52962.1|3298658_3299156_+|hypothetical-protein
MSFDRRLPSLSRLSLRLTQAGRDAALTATAALLFATAANAAQITPVKQAEPADVCPALSHIVSSADFKKLRDEPAATLPGVDPIDDCRANAHSYDCRWRAHWEADGFVNDPLEEIGADIAACFPNVVHDINTPTRQHFIVKTADRRVSVTASVQGQNELRLRIAR
>CP026101.1|AUT52961.1|3297688_3298462_+|KR-domain-containing-protein
MSDASFESVVLVTGAGSGIGAALARRIAAPRVALMLHARGADDASRARLDQVAATCAASGATCATVLADLAERGASEHAVHQTLARFGALDQIVANAGHAQRQTIGTLDFDALAESFAAMPAAFAALVKRAAPALETSKRGRVVAVSSFVAHRYRADSAFAGTAAAKAALESLAKTAAAELAQHGVTVNCVAPGYTRKDRGPSAENAPAWARAAEATPLGQVAEPDDVAALIAFLLSDSARHITGQVIHVDGGLTLG
>CP026101.1|AUT53548.1|3295958_3297692_+|ABC-transporter-ATP-binding-protein/permease
MIDNSKNPADITAWGLIKPYWVSEDRWKARGLLALVIAMNMTMVAANVWFNSWQRTFFDAIQQYNYPVFKYSLLQFTVIALALILLGSYRTYFRQMLEFRWRQWLTNRYLNDWLGDRAYYRIERDNLADNPDQRVSADLQGLASASLNLSLGLLSTTVTLFSFIVILWNLSGAFAFHMFGTEFSIPGYMVWAALIYAAVGSWVTHKVNHPLVSINYQQQRVEADFRFSLIRIRENADQIALYQGERSEEQQLKGVFSHIRENWRLIMRFTRRFNIVVISYSQLAIVFPYIAAAPKYFSKSISFGMYQQVTGAFGTVSDSFSWFINNYDSLAEWRATVNRLREFHRVMRSQHLHESVVEGTAHGGINVHVTDTDSIEVTNLRLQRPNGEPMANVGSFTIAPKTRWLVRGPSGAGKSTLMRTLAGLWPFGEGTIEKPADAKLLFIPQRSYLPIGTLKAALCYPSEASAYSDEACRDVLTVCRLPELAERLGESAHWERSLSPGEQQRLAAARALLQQPDFLFLDEATSALDPENESIIYNALIERLPNAAIVSVAHRKTLEAFHDHTLFIERAVEREAA
>CP026101.1|AUT52960.1|3294160_3295300_-|FAD-dependent-oxidoreductase
MRTSAQPDFAVIGGGLCGRLVAWQLAGEGHRVALYERGDAAGSQAAAWVAAAMLAPLAEAASAELLITRLGAASLETWPTLLAQLPEPVFFQRNGSLIVWHHSDRAEAPLFERRLRANAPAELLDGGLVALAGAQVGAAEPALAGRFTQGWLLPHEGQLDNRQVLSALAAGLAQRGVETHWNTSVDDGALPPAKVTIDCRGLGAKPVMPTLRGIRGEVARVHAPGIDLTRPVRLLHPRYPLYIAPKQDDLYVIGATEVEGEDMSPVSVRSALELLSAAFSVHPGFGEARILELNSQCRPTLPDHRPVLLWDGASTLRVNGLYRHGYMIVPEVAGEAVRLASALLDGRVADSDGFADWQRNARWSELFRLDREPAVTLNV
>CP026101.1|AUT52959.1|3293952_3294150_-|thiamine-biosynthesis-protein-ThiS
MDIQINQKPLSLPEGATVADALSAYGARPPFAVALNGNFVARGQHAARALQAGDKLDVVHPVAGG
>CP026101.1|AUT52958.1|3293068_3293893_-|thiazole-synthase
MNSHANAPADALTLYGETFQSRVLLGTSRYPSLQSLSDSIAASKPGMVTVALRRQMSEGGAEAGFFDLLKRHGVPLLPNTAGCQTVSEAVTTAHMAREVFDTDWIKLELIGDDYTLQPDPVGLIEAAAQLVKDGFKVLPYCTEDLVIGRRLLDAGCEALMPWGAPIGTGKGVVNPYGLRVLRERLPDVPLIVDAGLGVPSHACQVMEWGFDGVLLNTAVSQATHPETMARAFAMGVEAGREAYLAGPMAERETAHASTPVVGMPFWHQDGSAAA
>CP026101.1|AUT52957.1|3291950_3293072_-|thiamine-phosphate-synthase
MTETLKLAGRDLFWPPADELTEAAERIRAHLGDWPPTHVDWRICLTPPDDANGGDLIVFTDLKQSSAQHVEQIARWQTQGAGVIEAAEGRAVLHLGGVRYQLEGHLAEDWIAALAAFLDCGFDPHDALVLALAWRDGDETRSDDAWPCDMSHFPRVAGLPDAPAQAFAACPDALGLYAVLPTAEWVERVAGFGVKTLQLRRKTAEPEELKREIARSVAAGREHGACVFINDHWQAAIDAGAYGVHLGQEDVHTADLHALSKAGVRLGLSTHGYYEMLTALHFRPSYIALGAVFPTTTKVMPTAPQGLARLARYVKLLDGVVPLVAIGGISGDVLPQVLATGVKSAAVVRAITEAADPASAAATLQKAFLQQKV
>CP026101.1|AUT52956.1|3291042_3291864_-|ABC-transporter-ATP-binding-protein
MPSSSETLLELRDVDFGYGERLVLSNLNLRFKRGQVVAVMGGSGCGKTTVLRLIGGLVRAQRGQVMFHGQDIGAQTRDGLYALRRKMGMLFQFGALFTDMSVFENVAFALREHTDLPEELIRDLVLMKLNAVGLRGARDLAPSEISGGMARRVALARAIALDPELMMYDEPFAGLDPISLGITANLIRALNTALGATSILVTHDVPESFAIADYVYFLANGGVLAEGTPAELRASTDPTVRQFIDGTPDGPFKFHYPSNTPLAADFGIGGGRA
>CP026101.1|AUT52955.1|3290278_3291046_-|ABC-transporter-permease
MISFIGRSVICGLGQTGYATRMFLRLVLEFFPLLRRPRLVTKQIHFVGNYSLVIIAVSGLFVGFVLGLQGYYTLNRYGSEQALGLLVALSLVRELGPVVTALLFAGRAGTSLTAEIGLMKAGEQLTAMEMMAVDPLKVVVAPRMWAGIISMPILAAIFSAVGVLGGYVVGVLMIGVDAGAFWSQMQGGVDAYRDVGNGVIKSIVFGFAVTFIALYQGYEAKPTPEGVSRATTKTVVYASLAVLGLDFLLTALMFS
>CP026101.1|AUT52964.1|3300777_3301524_+|DNA-binding-response-regulator
MNSSIMVVDDDPVVRDIVRDYLQGRGFTVSVLENGMALQQALQHERPALVVLDIMMPELDGISALRALRLAGDNIPVILLTARADVIDRVIGLELGADDYLGKPFDPSELVARIRSVLRRRESAAPSAPENRAPYRFGRFEVNFPARELRRDGERIALRSSEFAMLKVFVSHAMTVLTRAQLLEKLHGGTDTHRNRSLDVSIWRLRRLIEVDPSEPRYVQTVWGKGYVFVPDGEIGAAERYDAPVANL
>CP026101.1|AUT52965.1|3301624_3302311_-|flagellar-biosynthesis-protein-FlgH
MNAMHMPRAAAVLTSAAVFYALAGCGSTKDSIVDTPMLPPLSTAPLNVNTQGAIFQAGTGILLYETPRAQHIGDVLTIRLSESYTGSNSTNAQASRASDITAEAADKSTGTAARLARLFNIGSASTTFKGQGSIADTSGMTGTLAVTVIGTMPTGNLVVSGEKLISMGGNRDRLRLSGIVNPKDIESGNYVASSKVANARIEQAGQGMLADSTTLGWLQRMFMSVLTF
>CP026101.1|AUT52966.1|3302365_3303091_-|hypothetical-protein
MQLTSIGRALTACAVAMCCALMPFAASAQNMLPPQQAAALRMSAIGAKKRAADKPFAFRGIPLGITLDEFRAVSRVRATPLGSVPVCETDNVAGSLGMRLKTSQSLTIACQWAHRVADGWEVSRAVVDGAPADEHVLRFVRVDGQSGFRLYEISFVIDEITADDLRDAFEDRYGAPRTATQVSSPTAGQLPVYIWENDVSSITLCLLPATHNATLIYLLKDPDAYMKSVVRQWQASSPDAG
>CP026101.1|AUT53549.1|3303121_3303331_-|hypothetical-protein
MPRSRFYTHVRRAATRLAMWSAVGAAVLPLDGCAVAALPCRLTSATLKILPVVGHVAATPFDACAAAID
>CP026101.1|AUT52967.1|3303347_3303551_-|hypothetical-protein
MTVQNNHFTTQLQSIARPSAAEKPSARGASTTAAATATGDKTGDKAGAAQTSGSPVGMVGNHVNTTA
>CP026101.1|AUT52968.1|3303958_3304696_+|two-component-system-response-regulator-OmpR
MNPQVLIVDDDPVVRDLLCRFLQSNGYDASVLHDGTHLQRRLERERPSVVVLDIMMPNTDGLRALTALRAAGDDIPVIFVTARGTVADRIIGLSLGADDYLTKPFDPRELLARIQTVLRRRGPATTSAPEARKRYRFGPFELDFATRTLSRDDTRVTLRDSEFALLKIFVNNPYKVLSRVLIHDLVHRDDLPFRDRSLDVPIWRLRRVIENDPSNPCYVQTVRGKGYVFVPDADPNGAPFAADPA
>CP026101.1|AUT52969.1|3304637_3306017_+|HAMP-domain-containing-protein
MCSSPTRTPTARPSPPIPRDARVTRIRNPLNTLFGRMALLSSAVLFAIQAGWFVLVVMQPPHHEVDGYARGILLALQAANGEPVNGADVAPALRVHLVPTWNMPATVHLEPPTRRPFVELTRHLRASLPVGTEIAVDDTHMPRLWVRFPRKSMWVVIPVDVPPRPRFVIESISMLLAALLLSLLAVWQMQRPLTRVAHAARAFGAGSRPEPVSEQGPRELRDLIGSFNDMMRRLNEAGDDQAVMLAGVAHDLKAPLTRLKLRASVLADENERAGLIRDVDSLTNIVQQFLEFAGQSAESGPMTEVDAFLREQFSSTDGNEGDEADSGDEAEAPLFRLDLQAGSRFTLPRTLLDRLVTNLVDNAFEHGAPPVEIATSRDEQQWLIDVRDHGPGIPEDRIAAAMKPFVRLDAARGGEGHCGLGLAIVVRLAHHRGGKCTVENHPEGGLHVRVALPVAMPEA
>CP026101.1|AUT52970.1|3306226_3307291_-|protein-tyrosine-phosphatase
MRLITLSIGSSNLHVTRVRLSHPRVALAPHLVDTTMTSSAKADISLAAAHDLYALPTVPAPSHARAQRASRRRFLKSTAGALLLSGMGSTLLTACGGNNAGSDQAPTPRLASLENFRDVGGTAAGYPTVDGRVVRRNAFYRSNALTQSAADAAVLDSLGIAAVCDLRTPGEIERASDALPANAAYVKINVTGREDVITPMLDNEASAVSSMERAQRLYVTDAVQRAAFGSLLSQLASTAGPQLIHSSAGKDRAGWAAALLLSIANVPFDIIMQDYLLSNTYMANAISARVEARRQQSGDLAASAEKPLASVQSSFLQASFDQVQSSYGTMSGYLTRGLGLTQSTVDTLRERLVL
>CP026101.1|AUT52971.1|3307546_3308818_+|MFS-transporter
MASFQWFTELSTRERRTLYAGFGGYAVDAFDFMIYSFLIPTLIATWGMSKSEAGMIATSSLISSAIGGWLAGILADRYGRIRVLQWTIATFALFTCLSGFTHNFWQLLTTRTLQGIGFGGEWSVVTIMMAETIRSPQHRAKAVGTVQSSWSFGWGAAAILYWAFFALLPEEYAWRACFWIGIVPALWIIYIRRNVSDPDIYLATRRARDNGFDTSHFLQIFSAAHLKTTILGSALCSGMLGGYYAITTWLPTYLKTVRHLSVFNTSGYLVVLIVGSFIGYIVGAILSDRIGRRASFVLFAIGSFVLGMIYTMLPITDGAMLLLGFPLGIVVQGIFAGVGAYLSELYPNAIRGSGQGFCYNLGRGVGSFFPILVGTLSQTMTLVKAIGIVAGSGYLLVVVAALALPETKGKSLAAESAESAEHV
>CP026101.1|AUT52972.1|3308826_3310095_+|D-amino-acid-dehydrogenase
MRTIVLGGGIIGVATAFYLRERGCDVTVIERESDVALATSFGNAGVIAPGYVTPWAAPGMPFKILKYLFKPASPLIFRPTFDLAQWRWIARWLRECDLARFRVNKQRMQRIAYYSRECLREFRGHHPFEYGRSQGYLQLFRTAFDVELAQPALAVLRDAGISHREVSAAECAEIEPGLRWARQAPLSGLYLPDDEAGDCARFTRELRAICEAHGVRFRFDTRVTALDVRGRSVHGVHVESAAGSETLVANAVVVAAGVDSADLLAPLGVKVPLYPVKGYSATLQIVDDEKSPRAALMDESLKTAITRFGPNLRVAGTAELGNRQTTLREQALQTLMKVLDDWFPHATAPSSAQFWVGRRPMTPDGAPLLGPSGIDGLWINLGHGSTGWAMSLGSGRVVADLITQREPEIDLDGLTLGRYRGS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP026101_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026101_3

3310901-3310984

Orphan

Consensus_repeat	Method
GTTAGCTCGCTTCACGCGTCGCC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026101_3

>merge|CP026101|3|3310901-3310984|CRISPRCasFinder
GTTAGCTCGCTTCACGCGTCGCCGTTTGGTGGTTTGGCCTTTGCGCTGGCATCCGCGAATTGTTAGCTCGCTTCACGCGTCGCC

>CP026101|3|3|3310901-3310984|CRISPRCasFinder
GTTAGCTCGCTTCACGCGTCGCC	GTTTGGTGGTTTGGCCTTTGCGCTGGCATCCGCGAATT
GTTAGCTCGCTTCACGCGTCGCC

Protein	Signature genes	Signature genes Name	Protein_function
CP026101.1\|AUT52979.1\|3321678_3322062_+\|DUF883-domain-containing-protein	unknown	unknown	gnl\|CDD\|377576
CP026101.1\|AUT53549.1\|3303121_3303331_-\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT52980.1\|3322251_3323472_-\|deoxyguanosinetriphosphate-triphosphohydrolase	unknown	unknown	gnl\|CDD\|234934
CP026101.1\|AUT52982.1\|3324628_3325180_-\|shikimate-kinase	unknown	unknown	gnl\|CDD\|234654
CP026101.1\|AUT52977.1\|3319728_3320436_-\|transposase	unknown	unknown	gnl\|CDD\|376616
CP026101.1\|AUT52974.1\|3311025_3312465_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376980
CP026101.1\|AUT52965.1\|3301624_3302311_-\|flagellar-biosynthesis-protein-FlgH	unknown	unknown	gnl\|CDD\|376732
CP026101.1\|AUT52976.1\|3314714_3319418_-\|glutamate-synthase-subunit-alpha	unknown	unknown	gnl\|CDD\|236968
CP026101.1\|AUT52981.1\|3323529_3324612_-\|3-dehydroquinate-synthase	unknown	unknown	gnl\|CDD\|234565
CP026101.1\|AUT52971.1\|3307546_3308818_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
CP026101.1\|AUT52969.1\|3304637_3306017_+\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|236531
CP026101.1\|AUT52968.1\|3303958_3304696_+\|two-component-system-response-regulator-OmpR	unknown	unknown	gnl\|CDD\|181883
CP026101.1\|AUT52973.1\|3310133_3310751_-\|RNA-2',3'-cyclic-phosphodiesterase	unknown	unknown	gnl\|CDD\|224431
CP026101.1\|AUT52983.1\|3325317_3326901_-\|type-IV-pilus-secretin-PilQ	unknown	unknown	gnl\|CDD\|274173
CP026101.1\|AUT52970.1\|3306226_3307291_-\|protein-tyrosine-phosphatase	unknown	unknown	gnl\|CDD\|379135
CP026101.1\|AUT52978.1\|3320623_3321346_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|225589
CP026101.1\|AUT52972.1\|3308826_3310095_+\|D-amino-acid-dehydrogenase	unknown	unknown	gnl\|CDD\|234819
CP026101.1\|AUT52975.1\|3313146_3314613_-\|glutamate-synthase-subunit-beta	unknown	unknown	gnl\|CDD\|237213
CP026101.1\|AUT52966.1\|3302365_3303091_-\|hypothetical-protein	unknown	unknown	unknown
CP026101.1\|AUT52967.1\|3303347_3303551_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
CP026101.1\|AUT52965.1\|3301624_3302311_-\|flagellar-biosynthesis-protein-FlgH	gnl\|CDD\|376732	pfam02107, FlgH, Flagellar L-ring protein.	2.79471e-56
CP026101.1\|AUT52982.1\|3324628_3325180_-\|shikimate-kinase	gnl\|CDD\|234654	PRK00131, aroK, shikimate kinase; Reviewed.	6.45925e-94
CP026101.1\|AUT52977.1\|3319728_3320436_-\|transposase	gnl\|CDD\|376616	pfam01797, Y1_Tnp, Transposase IS200 like. Transposases are needed for efficient transposition of the insertion sequence or transposon DNA. This family includes transposases for IS200 from E. coli.	1.64312e-09
CP026101.1\|AUT52974.1\|3311025_3312465_-\|hypothetical-protein	gnl\|CDD\|376980	pfam03050, DDE_Tnp_IS66, Transposase IS66 family. Transposase proteins are necessary for efficient DNA transposition. This family includes IS66 from Agrobacterium tumefaciens.	9.83495e-59
CP026101.1\|AUT52979.1\|3321678_3322062_+\|DUF883-domain-containing-protein	gnl\|CDD\|377576	pfam05957, DUF883, Bacterial protein of unknown function (DUF883). This family consists of several hypothetical bacterial proteins of unknown function.	7.37003e-21
CP026101.1\|AUT52976.1\|3314714_3319418_-\|glutamate-synthase-subunit-alpha	gnl\|CDD\|236968	PRK11750, gltB, glutamate synthase subunit alpha; Provisional.	0
CP026101.1\|AUT52981.1\|3323529_3324612_-\|3-dehydroquinate-synthase	gnl\|CDD\|234565	PRK00002, aroB, 3-dehydroquinate synthase; Reviewed.	0
CP026101.1\|AUT52969.1\|3304637_3306017_+\|HAMP-domain-containing-protein	gnl\|CDD\|236531	PRK09467, envZ, osmolarity sensor protein; Provisional.	4.49582e-57
CP026101.1\|AUT52968.1\|3303958_3304696_+\|two-component-system-response-regulator-OmpR	gnl\|CDD\|181883	PRK09468, ompR, osmolarity response regulator; Provisional.	1.26994e-84
CP026101.1\|AUT52973.1\|3310133_3310751_-\|RNA-2',3'-cyclic-phosphodiesterase	gnl\|CDD\|224431	COG1514, LigT, 2'-5' RNA ligase [Translation, ribosomal structure and biogenesis].	1.28636e-24
CP026101.1\|AUT52983.1\|3325317_3326901_-\|type-IV-pilus-secretin-PilQ	gnl\|CDD\|274173	TIGR02515, Putative_DNA_transport_protein_HofQ, type IV pilus secretin (or competence protein) PilQ. A number of proteins homologous to PilQ are involved in type IV pilus formation, competence for transformation, type III secretion, and type II secretion (also called the main terminal branch of the general secretion pathway). Members of this family include PilQ itself, which is a component of the type IV pilus structure, from a number of species. In Haemophilus influenzae, the member of this family is associated with competence for transformation with exogenous DNA rather than with formation of a type IV pilus; the surface structure required for competence may be considered an unusual, incomplete type IV pilus structure. [Cell envelope, Surface structures].	1.76422e-148
CP026101.1\|AUT52970.1\|3306226_3307291_-\|protein-tyrosine-phosphatase	gnl\|CDD\|379135	pfam13350, Y_phosphatase3, Tyrosine phosphatase family. This family is closely related to the pfam00102 and pfam00782 families.	1.76062e-72
CP026101.1\|AUT52978.1\|3320623_3321346_+\|hypothetical-protein	gnl\|CDD\|225589	COG3047, OmpW, Outer membrane protein W [Cell envelope biogenesis, outer membrane].	3.55914e-45
CP026101.1\|AUT52972.1\|3308826_3310095_+\|D-amino-acid-dehydrogenase	gnl\|CDD\|234819	PRK00711, PRK00711, D-amino acid dehydrogenase.	0
CP026101.1\|AUT52980.1\|3322251_3323472_-\|deoxyguanosinetriphosphate-triphosphohydrolase	gnl\|CDD\|234934	PRK01286, PRK01286, deoxyguanosinetriphosphate triphosphohydrolase-like protein; Provisional.	0
CP026101.1\|AUT52971.1\|3307546_3308818_+\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	7.30055e-135
CP026101.1\|AUT52975.1\|3313146_3314613_-\|glutamate-synthase-subunit-beta	gnl\|CDD\|237213	PRK12810, gltD, glutamate synthase subunit beta; Reviewed.	0

>CP026101.1|AUT52973.1|3310133_3310751_-|RNA-2',3'-cyclic-phosphodiesterase
MQRTDPHPDQKESAGSASDPNLEATTNPHDYQRCFIALVPDTATRDALSSIDIPTTARRVPYEQLHLTVTFIGVLPQEKAAPLIESLTHETVSLKRTPITKIEHWPRASHPRLTVATLAMSDEFVALDWRVRSSMIALGLPVDARTFRPHVTLARYRQDAAAVGPAMDLQHELIACFDSLTLYSSTLARTGARYRSLASVPVVYG
>CP026101.1|AUT52972.1|3308826_3310095_+|D-amino-acid-dehydrogenase
MRTIVLGGGIIGVATAFYLRERGCDVTVIERESDVALATSFGNAGVIAPGYVTPWAAPGMPFKILKYLFKPASPLIFRPTFDLAQWRWIARWLRECDLARFRVNKQRMQRIAYYSRECLREFRGHHPFEYGRSQGYLQLFRTAFDVELAQPALAVLRDAGISHREVSAAECAEIEPGLRWARQAPLSGLYLPDDEAGDCARFTRELRAICEAHGVRFRFDTRVTALDVRGRSVHGVHVESAAGSETLVANAVVVAAGVDSADLLAPLGVKVPLYPVKGYSATLQIVDDEKSPRAALMDESLKTAITRFGPNLRVAGTAELGNRQTTLREQALQTLMKVLDDWFPHATAPSSAQFWVGRRPMTPDGAPLLGPSGIDGLWINLGHGSTGWAMSLGSGRVVADLITQREPEIDLDGLTLGRYRGS
>CP026101.1|AUT52971.1|3307546_3308818_+|MFS-transporter
MASFQWFTELSTRERRTLYAGFGGYAVDAFDFMIYSFLIPTLIATWGMSKSEAGMIATSSLISSAIGGWLAGILADRYGRIRVLQWTIATFALFTCLSGFTHNFWQLLTTRTLQGIGFGGEWSVVTIMMAETIRSPQHRAKAVGTVQSSWSFGWGAAAILYWAFFALLPEEYAWRACFWIGIVPALWIIYIRRNVSDPDIYLATRRARDNGFDTSHFLQIFSAAHLKTTILGSALCSGMLGGYYAITTWLPTYLKTVRHLSVFNTSGYLVVLIVGSFIGYIVGAILSDRIGRRASFVLFAIGSFVLGMIYTMLPITDGAMLLLGFPLGIVVQGIFAGVGAYLSELYPNAIRGSGQGFCYNLGRGVGSFFPILVGTLSQTMTLVKAIGIVAGSGYLLVVVAALALPETKGKSLAAESAESAEHV
>CP026101.1|AUT52970.1|3306226_3307291_-|protein-tyrosine-phosphatase
MRLITLSIGSSNLHVTRVRLSHPRVALAPHLVDTTMTSSAKADISLAAAHDLYALPTVPAPSHARAQRASRRRFLKSTAGALLLSGMGSTLLTACGGNNAGSDQAPTPRLASLENFRDVGGTAAGYPTVDGRVVRRNAFYRSNALTQSAADAAVLDSLGIAAVCDLRTPGEIERASDALPANAAYVKINVTGREDVITPMLDNEASAVSSMERAQRLYVTDAVQRAAFGSLLSQLASTAGPQLIHSSAGKDRAGWAAALLLSIANVPFDIIMQDYLLSNTYMANAISARVEARRQQSGDLAASAEKPLASVQSSFLQASFDQVQSSYGTMSGYLTRGLGLTQSTVDTLRERLVL
>CP026101.1|AUT52969.1|3304637_3306017_+|HAMP-domain-containing-protein
MCSSPTRTPTARPSPPIPRDARVTRIRNPLNTLFGRMALLSSAVLFAIQAGWFVLVVMQPPHHEVDGYARGILLALQAANGEPVNGADVAPALRVHLVPTWNMPATVHLEPPTRRPFVELTRHLRASLPVGTEIAVDDTHMPRLWVRFPRKSMWVVIPVDVPPRPRFVIESISMLLAALLLSLLAVWQMQRPLTRVAHAARAFGAGSRPEPVSEQGPRELRDLIGSFNDMMRRLNEAGDDQAVMLAGVAHDLKAPLTRLKLRASVLADENERAGLIRDVDSLTNIVQQFLEFAGQSAESGPMTEVDAFLREQFSSTDGNEGDEADSGDEAEAPLFRLDLQAGSRFTLPRTLLDRLVTNLVDNAFEHGAPPVEIATSRDEQQWLIDVRDHGPGIPEDRIAAAMKPFVRLDAARGGEGHCGLGLAIVVRLAHHRGGKCTVENHPEGGLHVRVALPVAMPEA
>CP026101.1|AUT52968.1|3303958_3304696_+|two-component-system-response-regulator-OmpR
MNPQVLIVDDDPVVRDLLCRFLQSNGYDASVLHDGTHLQRRLERERPSVVVLDIMMPNTDGLRALTALRAAGDDIPVIFVTARGTVADRIIGLSLGADDYLTKPFDPRELLARIQTVLRRRGPATTSAPEARKRYRFGPFELDFATRTLSRDDTRVTLRDSEFALLKIFVNNPYKVLSRVLIHDLVHRDDLPFRDRSLDVPIWRLRRVIENDPSNPCYVQTVRGKGYVFVPDADPNGAPFAADPA
>CP026101.1|AUT52967.1|3303347_3303551_-|hypothetical-protein
MTVQNNHFTTQLQSIARPSAAEKPSARGASTTAAATATGDKTGDKAGAAQTSGSPVGMVGNHVNTTA
>CP026101.1|AUT53549.1|3303121_3303331_-|hypothetical-protein
MPRSRFYTHVRRAATRLAMWSAVGAAVLPLDGCAVAALPCRLTSATLKILPVVGHVAATPFDACAAAID
>CP026101.1|AUT52966.1|3302365_3303091_-|hypothetical-protein
MQLTSIGRALTACAVAMCCALMPFAASAQNMLPPQQAAALRMSAIGAKKRAADKPFAFRGIPLGITLDEFRAVSRVRATPLGSVPVCETDNVAGSLGMRLKTSQSLTIACQWAHRVADGWEVSRAVVDGAPADEHVLRFVRVDGQSGFRLYEISFVIDEITADDLRDAFEDRYGAPRTATQVSSPTAGQLPVYIWENDVSSITLCLLPATHNATLIYLLKDPDAYMKSVVRQWQASSPDAG
>CP026101.1|AUT52965.1|3301624_3302311_-|flagellar-biosynthesis-protein-FlgH
MNAMHMPRAAAVLTSAAVFYALAGCGSTKDSIVDTPMLPPLSTAPLNVNTQGAIFQAGTGILLYETPRAQHIGDVLTIRLSESYTGSNSTNAQASRASDITAEAADKSTGTAARLARLFNIGSASTTFKGQGSIADTSGMTGTLAVTVIGTMPTGNLVVSGEKLISMGGNRDRLRLSGIVNPKDIESGNYVASSKVANARIEQAGQGMLADSTTLGWLQRMFMSVLTF
>CP026101.1|AUT52974.1|3311025_3312465_-|hypothetical-protein
MCIVRGMTKMPDIKELTPEQKDALIIDLVRRLNELEAKLEKNSHNSSKPPSSDGPKRKPKSLRNTSDARPGAQPGHKGKTLKRVAQADHIEIHPVARVCDKCGNRIAAASVAVLPEGRQVIDLPPTRFEVTEHRVQIAQCRCCGKQHSGAFPKGVSQAVQYGPQIRAAAVYLTQYQQLPVARTAQALEDLFGLHVSTGTVQHSIDQAAQLLAPCVDQIQQALRGQPVVHFDESCMRVGRESHWLHVASTHALSWYGAHSKRGSQALDSFGILPGFTGVAVHDGWRPYAGYECEHALCNAHHLRELVFVLESTQQPWAQQMIDLLRQAKREVELSRASGNNMLSPARQRYYTRRSRALIARARKLNPQQAREPLRQERRGRIRQSFTCNLLTRLHKYADEVWRFIADHRVPFDNNQAERDIRMPKLKQKISGCFRSESGMEAFCTIRSYLATLRKQNRSLINALALGFAGFVVSPLVTAE
>CP026101.1|AUT52975.1|3313146_3314613_-|glutamate-synthase-subunit-beta
MGKATGFLEFERRHEAYEAPLTRVKHYKEFVSALTDDEAKIQGARCMDCGIPFCNNGCPVNNIIPDFNDLVFRQDWKNAIDVLHSTNNFPEFTGRICPAPCEAACTLGINDDPVGIKSIEHAIIDKAWAEGWVAPQPPKHKTGKKVAVVGSGPAGLAAAQQLARVGHDVTVFEKNDRVGGLLRYGIPDFKLEKWLIDRRMRQMEAEGVTFRANVFVGKDPLPAHIGNTAKETITPEELKDQFDAVILTGGSETPRDLPVPGRELAGIHYAMEFLPQQNKVNAGDKVADQLLAKGKHVVVIGGGDTGSDCVGTSNRHGAKGVTQFELLPQPPEEENKPLVWPYWPVKLRTSSSHEEGCERDWAVATKRFEGKNGKVEKLIAARVEWKDGKMVEVPDSQFEMKADLVLLAMGFTQPVSPVLEAFGVDKDARGNVRASTEGDKAYYTSVEKVFTAGDMRRGQSLVVWAIREGRQCARSVDAYLMGHSELPR
>CP026101.1|AUT52976.1|3314714_3319418_-|glutamate-synthase-subunit-alpha
MNDHQQPLSTVPAAQGLYDPANEHDACGVGFVAHIKGKKSHEIIQQGLKILENLDHRGAVGADPLMGDGAGILIQIPDSFYREEMAKQGVTLPPEGEYGVGMIFLPKEHASRLACEQELERTVKAEGQVVLGWRDVPADHTMPISPTVKASEPLIRQIFIGRGKDIMVTDALERKLYVIRKTASHRIQALKLKHGKEYFVPSMSARTVVYKGLLLAGQVGVYYRDLQDERVVSALALVHQRFSTNTFPAWELAHPYRMIAHNGEINTVKGNVNWLNARTGAIASHVLGDDLPKLWPLIYPGQSDTASFDNCLELLVMAGYPLVHAVMMMIPEAWEQHTLMDDNRRAFYEYHAAMMEPWDGPAAIAFTDGRQIGATLDRNGLRPARYIVTDDDLVIMASEAGTLPIPESKIVKKWRLQPGKMFLIDMEHGRIIDDKELKDNLANAKPYKSWIDAVRIKLDEIEPNAEDVVTERREAAALLDRQQAFGYTQEDLKFLMAPMAQAGEEAVGSMGNDSPLAVMSNKNKTLYHYFKQLFAQVTNPPIDPIRENMVMSLVSFVGPKPNLLDTNNINPPMRLEVSQPVLDFKDIAKIRAIDQYTGGKFSSYELNICYPVSWGKEGIEARLASLCAEAVDAVKSGYNMLIVSDRKTDRDNVAIPALLATSAIHSHLVQQGLRTSTGLVVETGSARETHHFALLAGFGAEAVHPYLAMETLAQMAAGMKGDLSAEKAVYNFTKAIGKGLHKVMSKMGISTYMSYTGAQIFEAVGLAEDLVNKYFKGTASKVGGIGLFEVAEEAIRLHRDAFGDNPVLANMLDAGGEYAYRVRGEDHMWTPDAIAKLQHSARSNSYQTYKEYAHLINDQTKRHMTFRGLFEFKVDPSKAIPLDEVESAKEIVKRFATGAMSLGSISTEAHATLAVAMNRIGGKSNTGEGGEDENRYRNELRGIPIKNGDTMKSILGDEVVTDIPLKEGDSLRSKIKQVASGRFGVTAEYLASADQIQIKMAQGAKPGEGGQLPGHKVSEYIGKLRYSVPGVGLISPPPHHDIYSIEDLAQLIHDLKNANPAASISVKLVSEVGVGTVAAGVAKAKADHVVIAGHDGGTGASPLSSVKHAGTPWELGLAETQQTLVLNQLRGRIRVQADGQMKTGRDVVIGALLGADEFGFATAPLVVEGCIMMRKCHLNTCPVGVATQDPVLRAKFQGQPEHVVNFFFFIAEEVREIMAQLGVRKFDDLIGHSEYLDMKKGIEHWKAKGLDFSRVFYQPDVPASVARMHVDSQDHGLDRALDHTLIEKAKAAIEKGEHVSFIQPVRNVNRTVGAMLSGTIAKKYGHDGLPDDAIHIQLKGTAGQSFGAFLAKGITLDLVGDGNDYVGKGLSGGRIIIRPTNDFRGKSEENIICGNTVMYGAIEGESFFRGVAGERFCVRNSGATAVVEGTGDHGCEYMTGGTVVVLGETGRNFAAGMSGGLAYVYDVDGTFAAKCNKSMVALEPVLQQAEQERTVDKALWHMGQTDEALLKGLIERHFQFTGSPRAKALLENWDASRRQFVKVFPTEYKRALGEMGAKKAAKEVLAA
>CP026101.1|AUT52977.1|3319728_3320436_-|transposase
MARLARLYVPDQPQHVILRGLDQQPAFVDDQDYELFIDCLKAASRDHHLSVHAYALMPGAVQLLVTPTDESSLPKAMQAVGRRYVAHFNRRYSRRGTLWEGRYRATVIEGEKYFLLASRVVEMSPVRNQLVSTPEDYRWSSYRHHIGLTLDSLITDHRLYWSLGNTPFERQRAYRELCEQPLDEREASQLQQATLKGWVLGSDSYREWAARAANRRVSPLPRGRPRKVRETPQTQ
>CP026101.1|AUT52978.1|3320623_3321346_+|hypothetical-protein
MKLKQALGVAALACITTTAHAQSAGSFFVTTGWFHLAPQSSSDPLRETNVNGTPVNITVPNTGATLGSGDTIGFTGGYFVTDHIATEFVIGVPPQFDLHGSGAFQQYGKLGSAKQWSPTLLFKYYFNQPQAKFRPYLGLGVSRVSFTDEHITNGAFEANVLHGPTTVTTDSSWEPVFNAGFTYAFTDHWFAGFSISYLPLSTTAKLNTQAQTPIGTVNVQSETKIRLNPIVTYVNLGYRF
>CP026101.1|AUT52979.1|3321678_3322062_+|DUF883-domain-containing-protein
MTALPNTRDALGESWTTAGRRARRIARHSRHAAEDIASELRTLMTELENTLGDGTQADAAVLRTQMRKRLDEARTRLNDTRDAMRERAEAAIHDADDYVHENPWRTIAIVGGVALIAGALLARGGSR
>CP026101.1|AUT52980.1|3322251_3323472_-|deoxyguanosinetriphosphate-triphosphohydrolase
MSEIRSDPLSESLDAASVTPVTGVVSLPTIAALEAHLAPYAAHSSQSRGRRHHEAPPSARTEFQRDRDRIVHSTAFRRLEYKTQVFVNHEGDLFRTRLTHSLEVAQIARSVARNLRVNEDLVEAISLAHDLGHTPFGHAGQDALNECMRDYGGFEHNLQSLAVVDDLEEHYGAFDGLNLCFETREGILKHCSRENARRLGELGERFLQGRQPSIEAQIANLADEIAYNNHDVDDGLRSGLLTIEQLAEVELWHTHYDAARRDYPQIEGRRLIHETVRRIINTLIVDLIDTTTRNIAQHAPASLDDVRRAPPLVAHSDAVAAQATQLKRFLFKNLYRHYRVMRMANKAQRVIAGLFDAFIDDPRLLPPAYQTPDAAKQPRLIAHYIAGMTDRYASKEYQRLFIVDGD
>CP026101.1|AUT52981.1|3323529_3324612_-|3-dehydroquinate-synthase
MITVNVELGERAYPIHIGADLIGRSELFTPHIRGASVTIVTNTTVDPLYGDTLRKALAPLGKDVTTVVLPDGEAHKNWETLNLIFDALLGARADRKTTLIALGGGVIGDMTGFAAACYMRGVPFIQVPTTLLSQVDSSVGGKTGINHPLGKNMIGAFYQPQAVIADIGALRTLPPRELAAGVAEVIKTGAIADATFFDWIEANIEALNRREPEALAEAVKRSCEIKASVVAADEREGGLRAILNFGHTFGHAIEAGLGYGEWLHGEAVGCGMVMAADLSVRLGHLDEAARKRLVAVIEAAHLPVQAPTLGAARYVDLMRVDKKAEAGEIKFILLKRFGDTLITRAPDEAVLQTLDASVGT
>CP026101.1|AUT52982.1|3324628_3325180_-|shikimate-kinase
MQPRDAHANVFFVGLMGAGKTTVGRAVARRLDRPFFDSDHEIEARTGARIPVIFELEGESGFRDREAQVIAELTGRESIVLATGGGAVLRPENRDALRAHGIVVYLRANPHDLWLRTRRDKNRPLLQTEDPKGRLEALYEVRDPLYRECAHFVIETGRPSVNGLVNMVLMQLEMAGVAKPATS
>CP026101.1|AUT52983.1|3325317_3326901_-|type-IV-pilus-secretin-PilQ
MMRLNVMRSMLACAAFVAMAARASLPPLPADMPFDEALTPAGMPPLPRVVTTDVANPFTPDATDEAGAAGRETDPARDAAQPPSAARVETEPKRQDEARTEPLEGPPVPLPPAARLSTNASPSIPADSPITLHFQHAELGAVLGAFAKFTGLNIVASDKARGAVTLHLDNVPWRAAFDTLLDVNGLAMEQRSNVIWVAPLSELAARERQRFEAHARAAELEPLASRTFELHYAHAEELRKLLTASGNQRVLSKRGAAMADPRTNLLFVTDLDARLAQIAELIASLDRPTRQVLIEARIVEAEKGFSRNLGVKLSMLATNEDGKAIGVVGGKEGAIYDLSARPISGFDAATAGFTLFAAQATRLVNIELSALEAEGLGRIVSSPRVVTADRMKAIVEQGTELPYQAKVGQGVSGVQFRRASLKLEVEPQITPDGRVVLDLDVAKDSVGEQTASGPAINTKHVQTRVEVEDGGTVSIGGIYESDDRDDVTRVPLLGKIPLLGALFRHRAHRDLTSELVVFITPRVVQTN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
CP026101_2	2.1\|3300512\|38\|CP026101\|CRISPRCasFinder	3300512-3300549	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	63884-63921	2	0.947
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1036124-1036161	2	0.947
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1551786-1551823	3	0.921
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	214984-215021	3	0.921
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1271522-1271559	4	0.895
CP026101_1	1.1\|2302389\|38\|CP026101\|CRISPRCasFinder	2302389-2302426	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1036168-1036205	5	0.868
CP026101_2	2.1\|3300512\|38\|CP026101\|CRISPRCasFinder	3300512-3300549	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1317562-1317599	5	0.868
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1313541-1313578	5	0.868
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1313683-1313720	5	0.868
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	290848-290885	5	0.868
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1316845-1316882	5	0.868
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2554516-2554553	5	0.868
CP026101_2	2.1\|3300512\|38\|CP026101\|CRISPRCasFinder	3300512-3300549	38	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	2002081-2002118	7	0.816
CP026101_1	1.1\|2302389\|38\|CP026101\|CRISPRCasFinder	2302389-2302426	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	508524-508561	8	0.789
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	535790-535827	8	0.789
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	271225-271262	8	0.789
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	515006-515043	8	0.789
CP026101_2	2.1\|3300512\|38\|CP026101\|CRISPRCasFinder	3300512-3300549	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1313714-1313751	9	0.763
CP026101_3	3.1\|3310924\|38\|CP026101\|CRISPRCasFinder	3310924-3310961	38	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	289790-289827	9	0.763

1. spacer 2.1|3300512|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 2, identity: 0.947

gaatcgcggatgccagcgaaaaaaccaaaac-accgaac	CRISPR spacer
gaatcgcggatgccagcgaaaacaccaaaacaaccgaa-	Protospacer
********************** ******** ******

2. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 2, identity: 0.947

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gtttggtgttttggtctttgcgctggcatccgcgaatt	Protospacer
******** *****.***********************

3. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 3, identity: 0.921

gtttggtggtt-tggcctttgcgctggcatccgcgaatt	CRISPR spacer
-tctggttgttatggcctttgcgctggcatccgcgaatt	Protospacer
 *.**** *** ***************************

4. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 3, identity: 0.921

-gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
cgtttgggcgttt-gcctttgcgctggcatccgcgaatt	Protospacer
 ******  **** *************************

5. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 4, identity: 0.895

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gtttggttgttttgcctttgcgctggcatccgcgtttt	Protospacer
******* **** *********************  **

6. spacer 1.1|2302389|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

gaaaaaaccaaaaccccgaacagcgacgcgtgaagcga	CRISPR spacer
gcaaagaccaaaaccccgaacggcgacgcgtgaagcac	Protospacer
* ***.***************.**************.

7. spacer 2.1|3300512|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

gaatcgcggatgccagcgaaaaaaccaaaacaccgaac	CRISPR spacer
atagcgcggatgccagcgaaaaagcaaaaacaccgaac	Protospacer
. * *******************.* ************

8. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gtttggtgttttggcctttgcgctggcatccgcgctgg	Protospacer
******** *************************

9. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gtttggtgttttggcctttgcgctggcatccgcgctgg	Protospacer
******** *************************

10. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
ttttggtgttttggtctttgcgctggcatccgcgattc	Protospacer
 ******* *****.******************** *.

11. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gttcggtgttttggcctttgcgctggcatccgcgtttc	Protospacer
***.**** *************************  *.

12. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.868

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gtttggtgggttcgcctttgcgctggcatccgcgtgat	Protospacer
********* ** ********************* . *

13. spacer 2.1|3300512|38|CP026101|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 7, identity: 0.816

gaatcgcggatgccagcgaaaaaaccaaaacaccgaac	CRISPR spacer
gcatcgcggatgccagcgaaaaagccaaagcaaaccac	Protospacer
* *********************.*****.**    **

14. spacer 1.1|2302389|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.789

gaaaaaaccaaaaccccgaacagcgacgcgtgaagcga	CRISPR spacer
caaaggccgataacaccgaacggcgacgcgtgaagcga	Protospacer
 ***.. * * *** ******.****************

15. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.789

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
tccggcttgttttgcttttgcgctggcatccgcgaatt	Protospacer
 .. * * **** **.**********************

16. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.789

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gcgtcgggcgtttgactttgcgctggcatccgcgaatt	Protospacer
*. * * *  ** * ***********************

17. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.789

gtttggtggtttggcctttgcgctggcatccgcgaatt	CRISPR spacer
gcgttgggcgtttgactttgcgctggcatccgcgaatt	Protospacer
*. * * *  ** * ***********************

18. spacer 2.1|3300512|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.763

gaatcgcggatgccagcgaaaaaaccaaaacaccgaac	CRISPR spacer
aaatcgcggatgccagcgaaaaagcaaacgcccagcgc	Protospacer
.**********************.* ** .* * * .*

19. spacer 3.1|3310924|38|CP026101|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.763

gtttggtggt-----ttggcctttgcgctggcatccgcgaatt	CRISPR spacer
-----gcggccgcggtttgcgtttgcgctggcatccgcgaatt	Protospacer
     *.**.     ** ** **********************

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1978755 : 1998675

Pseudomonas_phage(11.11%)

portal,terminase,tail

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AUT51945.1\|1978755_1983855_-\|tail	phage tail tape measure protein	A0A0S4L7E6	Pseudomonas_phage	2.2e-29	27.9
AUT51946.1\|1983888_1984281_-	hypothetical protein	NA	NA	NA	NA
AUT51947.1\|1984277_1984610_-	hypothetical protein	NA	NA	NA	NA
AUT51948.1\|1984693_1985626_-	hypothetical protein	A0A2I5ARB3	Synechococcus_phage	2.5e-56	41.0
AUT51949.1\|1985683_1986115_-	hypothetical protein	NA	NA	NA	NA
AUT51950.1\|1986111_1986423_-	hypothetical protein	NA	NA	NA	NA
AUT51951.1\|1986419_1986749_-	DUF2190 domain-containing protein	NA	NA	NA	NA
AUT51952.1\|1986829_1988923_-	peptidase U35	A0A076G7Y9	Pseudoalteromonas_phage	4.7e-66	33.4
AUT51953.1\|1988988_1990452_-\|portal	phage portal protein	B7SYD6	Stenotrophomonas_phage	1.5e-79	38.2
AUT51954.1\|1990453_1990657_-	hypothetical protein	A0A219YA34	Aeromonas_phage	5.8e-06	53.8
AUT51955.1\|1990659_1991049_-	hypothetical protein	G8GWD9	Rhodobacter_phage	2.0e-15	38.0
AUT53435.1\|1991045_1993115_-\|terminase	phage terminase large subunit family protein	A0A2H4JIC6	uncultured_Caudovirales_phage	7.1e-99	37.5
AUT51956.1\|1993062_1993710_-	hypothetical protein	NA	NA	NA	NA
AUT51957.1\|1993902_1994658_-	hypothetical protein	A0A291AUT0	Sinorhizobium_phage	6.0e-24	37.1
AUT53436.1\|1994913_1995663_-	hypothetical protein	NA	NA	NA	NA
AUT51958.1\|1995945_1998675_-	virulence protein E	A0A2D1GN57	Marinobacter_phage	1.3e-89	45.5

DBSCAN-SWA_2

2535972 : 2550195

Achromobacter_phage(30.0%)

portal,tail

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AUT52372.1\|2535972_2539113_-\|tail	phage tail protein	A0A0B5A1N2	Achromobacter_phage	1.7e-160	43.7
AUT52373.1\|2539123_2539513_-	hypothetical protein	A0A0G3EYJ9	Achromobacter_phage	1.1e-32	52.0
AUT52374.1\|2539509_2540049_-	DUF1833 domain-containing protein	A0A0B5A6T7	Achromobacter_phage	9.3e-35	47.1
AUT52375.1\|2540048_2540546_-	hypothetical protein	B5WZT5	Pseudomonas_phage	3.1e-16	41.4
AUT52376.1\|2540545_2543377_-\|tail	tail tape measure protein	A0A0U5KRL2	unidentified_phage	7.5e-27	29.9
AUT53483.1\|2543428_2543734_-	hypothetical protein	A0A1B0VMG9	Pseudomonas_phage	3.0e-06	36.8
AUT52377.1\|2543805_2544144_-	hypothetical protein	NA	NA	NA	NA
AUT52378.1\|2544204_2545125_-	hypothetical protein	G8GWF3	Rhodobacter_phage	8.4e-52	39.5
AUT52379.1\|2545211_2545637_-	hypothetical protein	NA	NA	NA	NA
AUT52380.1\|2545633_2545894_-	hypothetical protein	NA	NA	NA	NA
AUT52381.1\|2545931_2546276_-	DUF2190 domain-containing protein	NA	NA	NA	NA
AUT52382.1\|2546349_2548443_-	peptidase U35	A0A076G7Y9	Pseudoalteromonas_phage	3.7e-63	30.3
AUT52383.1\|2548508_2549990_-\|portal	phage portal protein	B7SYD6	Stenotrophomonas_phage	3.6e-73	37.3
AUT52384.1\|2549991_2550195_-	hypothetical protein	A0A2H4EUL1	Aeromonas_phage	8.3e-05	41.9

DBSCAN-SWA_3

2972190 : 2984996

Pandoravirus(25.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AUT52691.1\|2972190_2973258_-	phosphoribosylformylglycinamidine cyclo-ligase	Q58MH8	Prochlorococcus_phage	5.3e-74	46.2
AUT52692.1\|2973355_2974432_+	AI-2E family transporter	NA	NA	NA	NA
AUT52693.1\|2974475_2975258_+	DnaA regulatory inactivator Hda	NA	NA	NA	NA
AUT52694.1\|2975250_2975937_+	HAD-IB family hydrolase	NA	NA	NA	NA
AUT52695.1\|2975933_2977556_+	polynucleotide adenylyltransferase PcnB	A0A172Q0J1	Acinetobacter_phage	1.0e-15	30.3
AUT52696.1\|2977604_2978168_+	2-amino-4-hydroxy-6- hydroxymethyldihydropteridine diphosphokinase	S4VNV0	Pandoravirus	3.2e-14	40.1
AUT53529.1\|2978179_2978860_+	deoxynucleoside kinase	A0A0C5K8U0	Enterococcus_phage	5.1e-06	28.0
AUT52697.1\|2978901_2979717_+	3-methyl-2-oxobutanoate hydroxymethyltransferase	A0A0N7HVJ8	Ostreococcus_lucimarinus_virus	1.7e-35	30.2
AUT52698.1\|2979753_2981634_-	aminodeoxychorismate synthase, component I	S4VNU7	Pandoravirus	4.1e-53	34.1
AUT52699.1\|2981658_2982792_-	molecular chaperone DnaJ	E3T4P7	Cafeteria_roenbergensis_virus	4.8e-25	36.9
AUT52700.1\|2983046_2984996_-	molecular chaperone DnaK	A0A1V0SH73	Hokovirus	7.7e-148	48.8

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

3. CP026102

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: CP026102_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026102_1

235430-235534

Orphan

Consensus_repeat	Method
GGCGACGCGTGAAGCACGCTAACGCATCGCGGATGCCAGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026102_1

>merge|CP026102|1|235430-235534|CRISPRCasFinder
GGCGACGCGTGAAGCACGCTAACGCATCGCGGATGCCAGCGAAAGCAAAGGCCGAAACACCGAACGGCGACGCCTGAAGCACGCTAACGCATCGCGGATGCCAGC

>CP026102|1|1|235430-235534|CRISPRCasFinder
GGCGACGCGTGAAGCACGCTAACGCATCGCGGATGCCAGC	GAAAGCAAAGGCCGAAACACCGAAC
GGCGACGCCTGAAGCACGCTAACGCATCGCGGATGCCAGC

Protein	Signature genes	Signature genes Name	Protein_function
CP026102.1\|AUT53750.1\|234196_235336_+\|IS481-family-transposase	unknown	unknown	gnl\|CDD\|366234
CP026102.1\|AUT53747.1\|229800_231558_+\|FAD-binding-protein	unknown	unknown	gnl\|CDD\|237224
CP026102.1\|AUT53749.1\|231977_233342_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|273327
CP026102.1\|AUT53751.1\|235586_236354_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224049
CP026102.1\|AUT53746.1\|227897_228791_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|131350
CP026102.1\|AUT53760.1\|245442_245931_-\|GAF-domain-containing-protein	unknown	unknown	gnl\|CDD\|224867
CP026102.1\|AUT53744.1\|226137_226494_-\|transporter	unknown	unknown	gnl\|CDD\|335963
CP026102.1\|AUT53742.1\|223352_225653_+\|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit	unknown	unknown	gnl\|CDD\|224446
CP026102.1\|AUT53743.1\|225646_226108_+\|isoquinoline-1-oxidoreductase	unknown	unknown	gnl\|CDD\|224991
CP026102.1\|AUT53754.1\|238206_239277_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|223674
CP026102.1\|AUT53759.1\|244407_245352_-\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176114
CP026102.1\|AUT55821.1\|228936_229767_+\|SDR-family-NAD(P)-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|212491
CP026102.1\|AUT53745.1\|226713_227886_+\|4-hydroxybenzoate-3-monooxygenase	unknown	unknown	gnl\|CDD\|236198
CP026102.1\|AUT53752.1\|236350_237232_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|223521
CP026102.1\|AUT53758.1\|242864_244328_+\|catalase	unknown	unknown	gnl\|CDD\|163712
CP026102.1\|AUT53755.1\|239290_240898_-\|ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|173877
CP026102.1\|AUT53748.1\|231569_231908_+\|NIPSNAP-family-protein	unknown	unknown	gnl\|CDD\|311781
CP026102.1\|AUT53756.1\|240951_241518_-\|D-alanyl-D-alanine-dipeptidase	unknown	unknown	gnl\|CDD\|236662
CP026102.1\|AUT53753.1\|237233_238148_-\|D-ala-D-ala-transporter-subunit	unknown	unknown	gnl\|CDD\|224094
CP026102.1\|AUT53757.1\|241523_242417_-\|MurR/RpiR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224651

Protein	Function_ID	Function_description	E-value
CP026102.1\|AUT53750.1\|234196_235336_+\|IS481-family-transposase	gnl\|CDD\|366234	pfam00665, rve, Integrase core domain. Integrase mediates integration of a DNA copy of the viral genome into the host chromosome. Integrase is composed of three domains. The amino-terminal domain is a zinc binding domain pfam02022. This domain is the central catalytic domain. The carboxyl terminal domain that is a non-specific DNA binding domain pfam00552. The catalytic domain acts as an endonuclease when two nucleotides are removed from the 3' ends of the blunt-ended viral DNA made by reverse transcription. This domain also catalyzes the DNA strand transfer reaction of the 3' ends of the viral DNA to the 5' ends of the integration site.	1.159e-26
CP026102.1\|AUT53747.1\|229800_231558_+\|FAD-binding-protein	gnl\|CDD\|237224	PRK12842, PRK12842, putative succinate dehydrogenase; Reviewed.	0
CP026102.1\|AUT53749.1\|231977_233342_+\|MFS-transporter	gnl\|CDD\|273327	TIGR00895, transport_protein, benzoate transport. [Transport and binding proteins, Carbohydrates, organic alcohols, and acids].	6.74106e-108
CP026102.1\|AUT53751.1\|235586_236354_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224049	COG1124, DppF, ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component [Amino acid transport and metabolism / Inorganic ion transport and metabolism].	2.63297e-102
CP026102.1\|AUT53746.1\|227897_228791_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|131350	TIGR02297, AraC-type_DNA-binding_domain-containing_protein, 4-hydroxyphenylacetate catabolism regulatory protein HpaA. This putative transcriptional regulator, which contains both the substrate-binding, dimerization domain (pfam02311) and the helix-turn-helix DNA-binding domain (pfam00165) of the AraC famil, is located proximal to genes of the 4-hydroxyphenylacetate catabolism pathway.	1.65914e-44
CP026102.1\|AUT53760.1\|245442_245931_-\|GAF-domain-containing-protein	gnl\|CDD\|224867	COG1956, COG1956, GAF domain-containing protein [Signal transduction mechanisms].	4.05727e-81
CP026102.1\|AUT53744.1\|226137_226494_-\|transporter	gnl\|CDD\|335963	pfam04972, BON, BON domain. This domain is found in a family of osmotic shock protection proteins. It is also found in some Secretins and a group of potential haemolysins. Its likely function is attachment to phospholipid membranes.	7.80669e-12
CP026102.1\|AUT53742.1\|223352_225653_+\|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit	gnl\|CDD\|224446	COG1529, CoxL, Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs [Energy production and conversion].	8.64596e-87
CP026102.1\|AUT53743.1\|225646_226108_+\|isoquinoline-1-oxidoreductase	gnl\|CDD\|224991	COG2080, CoxS, Aerobic-type carbon monoxide dehydrogenase, small subunit CoxS/CutS homologs [Energy production and conversion].	6.51983e-58
CP026102.1\|AUT53754.1\|238206_239277_-\|ABC-transporter-permease	gnl\|CDD\|223674	COG0601, DppB, ABC-type dipeptide/oligopeptide/nickel transport systems, permease components [Amino acid transport and metabolism / Inorganic ion transport and metabolism].	5.55396e-112
CP026102.1\|AUT53759.1\|244407_245352_-\|LysR-family-transcriptional-regulator	gnl\|CDD\|176114	cd08422, PBP2_CrgA_like, The C-terminal substrate binding domain of LysR-type transcriptional regulator CrgA and its related homologs, contains the type 2 periplasmic binding domain. This CD includes the substrate binding domain of LysR-type transcriptional regulator (LTTR) CrgA and its related homologs. The LTTRs are acting as both auto-repressors and activators of target promoters, controlling operons involved in a wide variety of cellular processes such as amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to name a few. In contrast to the tetrameric form of other LTTRs, CrgA from Neisseria meningitides assembles into an octameric ring, which can bind up to four 63-bp DNA oligonucleotides. Phylogenetic cluster analysis further showed that the CrgA-like regulators form a subclass of the LTTRs that function as octamers. The CrgA is an auto-repressor of its own gene and activates the expression of the mdaB gene which coding for an NADPH-quinone reductase and that its action is increased by MBL (alpha-methylene-gamma-butyrolactone), an inducer of NADPH-quinone oxidoreductase. The structural topology of this substrate-binding domain is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	1.40619e-61
CP026102.1\|AUT55821.1\|228936_229767_+\|SDR-family-NAD(P)-dependent-oxidoreductase	gnl\|CDD\|212491	cd05233, SDR_c, classical (c) SDRs. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human prostaglandin dehydrogenase (PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, PGDH numbering) and/or an Asn (Asn-107, PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	2.53432e-73
CP026102.1\|AUT53745.1\|226713_227886_+\|4-hydroxybenzoate-3-monooxygenase	gnl\|CDD\|236198	PRK08243, PRK08243, 4-hydroxybenzoate 3-monooxygenase; Validated.	0
CP026102.1\|AUT53752.1\|236350_237232_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|223521	COG0444, DppD, ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component [Amino acid transport and metabolism / Inorganic ion transport and metabolism].	4.5298e-123
CP026102.1\|AUT53758.1\|242864_244328_+\|catalase	gnl\|CDD\|163712	cd08156, catalase_clade_3, Clade 3 of the heme-binding enzyme catalase. Catalase is a ubiquitous enzyme found in both prokaryotes and eukaryotes, which is involved in the protection of cells from the toxic effects of peroxides. It catalyzes the conversion of hydrogen peroxide to water and molecular oxygen. Catalases also utilize hydrogen peroxide to oxidize various substrates such as alcohol or phenols. Clade 3 catalases are the most abundant subfamily and are found in all three kingdoms of life; they have a relatively small subunit size of 43 to 75 kDa, and bind a protoheme IX (heme b) group buried deep inside the structure. Clade 3 catalases also bind NADPH as a second redox-active cofactor. They form tetramers, and in eukaryotic cells, catalases are located in peroxisomes.	0
CP026102.1\|AUT53755.1\|239290_240898_-\|ABC-transporter-substrate-binding-protein	gnl\|CDD\|173877	cd08512, PBP2_NikA_DppA_OppA_like_7, The substrate-binding component of an uncharacterized ABC-type nickel/dipeptide/oligopeptide-like import system contains the type 2 periplasmic binding fold. This CD represents the substrate-binding domain of an uncharacterized ATP-binding cassette (ABC) type nickel/dipeptide/oligopeptide-like transporter. The oligopeptide-binding protein OppA and the dipeptide-binding protein DppA show significant sequence similarity to NikA, the initial nickel receptor. The DppA binds dipeptides and some tripeptides and is involved in chemotaxis toward dipeptides, whereas the OppA binds peptides of a wide range of lengths (2-35 amino acid residues) and plays a role in recycling of cell wall peptides, which precludes any involvement in chemotaxis. Most of other periplasmic binding proteins are comprised of only two globular subdomains corresponding to domains I and III of the dipeptide/oligopeptide binding proteins. The structural topology of these domains is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis. Besides transport proteins, the PBP2 superfamily includes the ligand-binding domains from ionotropic glutamate receptors, LysR-type transcriptional regulators, and unorthodox sensor proteins involved in signal transduction.	0
CP026102.1\|AUT53748.1\|231569_231908_+\|NIPSNAP-family-protein	gnl\|CDD\|311781	pfam07978, NIPSNAP, NIPSNAP. Members of this family include many hypothetical proteins. It also includes members of the NIPSNAP family which have putative roles in vesicular transport. This domain is often found in duplicate.	5.83584e-29
CP026102.1\|AUT53756.1\|240951_241518_-\|D-alanyl-D-alanine-dipeptidase	gnl\|CDD\|236662	PRK10178, PRK10178, D-alanyl-D-alanine dipeptidase; Provisional.	4.50296e-126
CP026102.1\|AUT53753.1\|237233_238148_-\|D-ala-D-ala-transporter-subunit	gnl\|CDD\|224094	COG1173, DppC, ABC-type dipeptide/oligopeptide/nickel transport systems, permease components [Amino acid transport and metabolism / Inorganic ion transport and metabolism].	1.49084e-108
CP026102.1\|AUT53757.1\|241523_242417_-\|MurR/RpiR-family-transcriptional-regulator	gnl\|CDD\|224651	COG1737, RpiR, Transcriptional regulators [Transcription].	2.26524e-20

>CP026102.1|AUT53750.1|234196_235336_+|IS481-family-transposase
MPWDVKDIMNRREDFVREAATQALAFSELCRKYTITRQTGYKWLARHRAEGIKGLADRSRRPHHSPKRSAQTIEARVLEMRQAHGWGGRKIAQRLRDLGETQIPAPATITEILRRHGLIDEQASRQRQHWQRFEHEYPNSLWQMDFKGDFPTLESGRCAPLTVIDDHSRYNVVLSACSRTTTQVVQEALERAFRCYGLPSCINTDNGAPWGSPSAPGQLTELAVWLIRLGIHVSYSRPYHPQTNGKDERFHRSLKAEVLQRHAFTTHEHVQRELDRWRQVYNTERPHEALGMAVPLTRYACSLRRMPGRLPEPEYRCGDAVLRVNSSGVVRVRGEKLKLSIALKGLQVAARPSEDEDGVIDIWFAHQRVAKLDLKAAKP
>CP026102.1|AUT53749.1|231977_233342_+|MFS-transporter
MQQPKHTVDVQDFIDSQRFSPFQWTILVLCFLVVAADGFDTAAVGFIAPSLVQDWGVARSALGPVMSAALVGLGIGALGAGPLADRIGRKTVLVLSVFFFGLWSLAAARADSIESLTALRFMTGLGLGAAMPNAVTLMSEYAPARIRAVAVNAMFCGFSCGLAIGGVASAWLIPHFGWHSVLVAGGVGPIVLTLVLIMLLPESAQFMVTRRRGDARIAKVLSRIAKDVRFGECRFVTGEPVAEHRGSALRVVLSSRFRFGTLMLWLAYFMGLLIYYLLTNWLPTLFKDTGFSGQNAALMTSLFPLGGVLGNLSVGWLMDRFRANRVIACTYVVAAVLVMLVGRGLGHQVWLGLLIFLTGTVVTSAVTSMSALAASFYPTQGRATGVAWMLGVGRIGGVAGALVGAALMGLGWQFGSVFSLLAVPAMIAAVGVFAVAARVRESGVGAVELTPAVE
>CP026102.1|AUT53748.1|231569_231908_+|NIPSNAP-family-protein
MSSGKPFIDHRIYTIRPRGMAEFIEVFDRLAMPIQLKYLGAPVGFYMSDIGALNQVVHLWGYESIGDYDQRRTARDADPEWPAYLQASAHLIVGQESRIIRRVEFRTLTALR
>CP026102.1|AUT53747.1|229800_231558_+|FAD-binding-protein
MNSNTHSPAPLTCDVLVIGSGAGGLSTAITARKHGLDVVVIEKEAYFGGTTAFSGGVLWIPGNRHARANGVSDTREAAKTYMRNETGAFYDGAAVDAFLDTGSQMLDFFERETEVKFVPTLYPDYHPNVGGGVDIGRSVVAAPFDARGLGDDIARLRPPLKTITFIGMMFNSSNADLKHFFNATRSIKSAAYVAKRLASHLKDLALYRRGVQITSGNALAARLAKTALSLGIPIHTNTAAQELMVSDKRVTGAIVKGPQGEMRIAARRGVVLACGGFSHDVARIAQAYPHVKRGGEHCSPVPKGNTGDGARMAESVGARVPIRYPQPAAWMPVSRVPMRDGTFGVFPHLLDRYKPGIIGVTRKGKRFTNEANSYHDVGAAMIEACRDEKDTAMWLICDHATIRKYGLGYAKPAPVPLGPLLRNGYLVKGRTLAELAQRAGIDAEALEATVRIYNEGATRGEDPEFGRGSTSFNRYLADPECKPNPCVAPIARGPYYALKVVMGDLGTFDGITTAVTGEVLDARGAVIDGLYAVGNDRASVMGGNYPGAGITLGPIMTFGYITGRRLAGISDNATSAQQRRQSETV
>CP026102.1|AUT55821.1|228936_229767_+|SDR-family-NAD(P)-dependent-oxidoreductase
MTKQNESEWLALNDKVCVVTGAAGGIGSAIAKVLGESGARLALLDREAGKCEDLAQTLGANGIEAFSFACDIGDARSVEAAAASVEAKLGAADVLVNNAGLLRPGGIEDIALDAWNAMLQVNLTGYMLCSQAFGRAMLRKGTGSIVHVASVAAHHPQTWSGAYSPGKAAVAMLSKQIAAEWGPRGVRSNAVCPGMIRTPLSASFYEQGDVEQRRSAMTASRRIGEPVDIADVVAFLASPRAGYVNGTELVVDGGLECMLMDLVPRPGFDAKANPAR
>CP026102.1|AUT53746.1|227897_228791_-|AraC-family-transcriptional-regulator
MRKIPNYDLYGESARPPWFDAFNFEWIPERSRPNDWHIAAHRHDALLQVLYIRSGSGHVVIESEKHVLAPPCIVVLPAQTVHAFVFSPEIDGLVITAAQRALESISKAVSPGLLPIFQRAAVIPVKASAGDDILMPLFTLLEQEYRGNARGHIAAGMSLMIALFVQVARLGDAAAMPATNAVADRRSGQIKRFRELVAAHFREHRTVEFYAEKLGITTAQLSRICRDELGHSPMSLVNEHLIREAQRDLVYSGLTIKQIAHALGFEDAAYFSRFFRKQTGATPKEFQAAAHTDLSLN
>CP026102.1|AUT53745.1|226713_227886_+|4-hydroxybenzoate-3-monooxygenase
MRTQVGIIGAGPAGLLLSHLLHLQGIDSVVLESRSREQIESTIRAGVLEQGTMDLLTETGVGERMKAEGALHHGFELAFEGKRRRIDLTDLTGKSITVYAQHEVIKDLVTARVAAQGALKFEVSDVSLHGTDGTAPSIRYRHRGEAHELQCDFIIGCDGSQGISRNAIPEALRRDYQRVYPFGWFGILVEAPPSSDELIYARHERGFALVSTRSPNVQRMYFQCDPKDTVDNWSDDRIWAEMHARVDSDEGHQVVEGKIFQKNIVGMRSFVSTTMQHGRLFLAGDAAHIVPPTGAKGLNLAVSDVRILSDALRAFYKEDRNDLLNSYSETALKRIWRAEHFSYWMTRMMHRLDDASPFEQQLQVAELEHVTTSRSAAISMAENYVGAVPV
>CP026102.1|AUT53744.1|226137_226494_-|transporter
MKIRNVLRLLAVVGCVTLTSNVYAQASDSMSMASTPSAPSKKATPADKKLGRDVRKALSKAPGFNVSNVFVKARGGAVVLSGSVPDGSQIPQATEVAKGVAGVTSVSNKLTLYSHGNN
>CP026102.1|AUT53743.1|225646_226108_+|isoquinoline-1-oxidoreductase
MLKLNINGKTVEVHSDPATPLLWVLRCELKMTGTKFGCGVGVCGACTVHVGNEAKTSCQEKLSDIGTSRITTIEGLQGTQARALKEAWTHVDVVQCGYCQSAQLMAASALIRRNPTPSRKEIDCAMHGIICRCGTYPRIRQAILEATGQGKLT
>CP026102.1|AUT53742.1|223352_225653_+|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit
MLKRRTFLLGGVGLAGALVVGWSALPPRQRLVGSEALPVRPGEAALNGYVKIAADNTITVLMCRTEMGQGVHTGLAMLVAEELDANWADIRVANAPLDQIYNNVESVVGDLPFRPDDDSVVKELAVWLTRKLARDFGTVMTGGSSTINDLWRPMREAGACARTMLIAAAAERWSVKAADCRIEKGIVVHDAGHRASFGQLAMAATRQPLPRNPALKDPAAFRLIGKPLTRIEAASKLDGSAIFGIDVVPDGLLYASIKMCPTPGGTVRDFDGAAAAALPGVRKVLAVDAYNGGTGGVAVIADNVFIAMNALDMLTIHWNDGPTRGLTNAEVDRRLVQALDEGEGHAWYRHGDVEDALNRAAHTLKATYRAPYLAHAPLEPVNCTAQVKDGKATVWAATQVPAVARMHVARLLGIGTDDVDLQQQMPGGAFGRRLEVDFIAQSVAIAREAGGRPVQTLWSRQEDMQHDFYRPACLSRFRAGLDAQGQLIAWHNTSVSQSVVATWLARNYRIPDLGLNLDKTVSEGAFDQPYEMPNVWIGQRVVELPMPVGFFRSVGHSHQAFFIESFIDELAALARKDPVAFRASLLRRHPRHLAVLQKVASMSGWRAPAVWSEKGVRHARGVALHEAFGSVVGQVADVSLEAGNTVKIDHVYCAIDCGLPVNPNLIRQQVEGAIVFGLSAAFKEAITLADGAVIEGLYTQFDVVRMDECPDISVEIMPSKDHPQGVGESAVPPVAPAVANALFALTGTRSYALPLNMKLYSRGATC
>CP026102.1|AUT53751.1|235586_236354_-|ABC-transporter-ATP-binding-protein
MIDVDAVTVRFKTAAGAVDAVRNASFHVAQGEVFGLVGESGSGKSTILRALSGLTPIAQGTMRIAQHEQAARKRDVQMVFQDPYGSLHPRFTVDQTLREPLRISGIDRHEERIVNALREVGLNASFRFRYPHQLSGGQRQRVAIARALIVEPRVLLLDEPTSALDVSVQAEILNLLKRLHQERNLTMILVSHNLAVVGFLCSRVAIMRNGEIVEELDIGRVRAQQVESEYSRSLLLATGGYRRKAVEVIGVDASL
>CP026102.1|AUT53752.1|236350_237232_-|ABC-transporter-ATP-binding-protein
MSTHDTTRALCEIDDLRIAFRAHDGTMNEAVRGLSLTLNKGERLGIVGESGSGKSLTGRALLGLLPPAAHCTAKTMRFDGSDLLDMRADQRRKLCGQQMGMILQDPKYSLNPVMTVAQQMREAFALHEPKLGRRAMREKIIAALEAVHIRNPERVVDSYPHELSGGMGQRVMIAMMVSTGPRLLIADEPTSALDVLVSMQVLAVLDEMIAKHDTGLIFISHDLPLVMSFCDRVVVMYAGRVVETCAARDLVHAQHPYTRGLLAANPPLANPPDELPVLSRDPAWLNDVQGASA
>CP026102.1|AUT53753.1|237233_238148_-|D-ala-D-ala-transporter-subunit
MNTPRPTLKEWLLTDTPASRRQAALGLAYRRWRRFRGNPLSVFGFSILVLLVIVAIIGPWIAPHDPLRQVLSDRLLPPGSASHWLGTDQLGRDILSRIIYGSRLTLSIAILVVVVVVPIGLLIGTTAGFFGGWVDNVLMRVTDIALAFPKIVLALAFAAALGPGVFNAVIAISITAWPAYARLARAETLRLVQTDFIHVARLQGASNLRILLRYIVPLCSSSVIVRATLDMAGIILTVAGLGFLGLGAQPPSPEWGFMVASGRNVLLDSWWVATIPGFAILLVSLAFNLLGDGLRDVFDPRHGD
>CP026102.1|AUT53754.1|238206_239277_-|ABC-transporter-permease
MSTPITPIDQIRAASARSAGLRWTLRVLRWVLTLAITFTGLLAVTFVIGRKVPIDPVLAILGDRASASAYAAARIQLGLDKPLAEQFFIYVSAVLHGDLGVSLLTANPVIDDIKRVFPATLELATLSTIIGVLVGVPLGVIAAVRHNRWIDHVARFIGLIGSSVPVFWLGLMGLLLFYAKLHWVSGPGRLDPVFDGMVEPRTGSLLIDSLMAGEWDVFFNALSHIALPAAILGYYSVAYLSRMTRSFMLDQLNQEYITTARAKGLSERRVVWVHAFGNIAVPLLTVIALSYSFLLEGSVLTEIVFAWPGIGSYLTGALLNADMNAVLGSTLVIGITFIALNLLTDALYRVFDPRAR
>CP026102.1|AUT53755.1|239290_240898_-|ABC-transporter-substrate-binding-protein
MNLVLRNALAAVAVVSALTLTMTTTSTALAATPKDMLVIATTLDEFSTLDPGEVYELVPEEYVANTYDRLVRVDLKDPSKFNGDVAQSWTVSPDGLTFTFKIRPDLKFHSGNPLTADDVAWSIQRCVLLDKGAAAVLQGIGLTKDNALQNVKKIDDSTVSITTDQKYAPTFVLNVLGAWPASVLDKKLLLSHQKGNDFGNEWLRTNEAGSGAYKLVKWTANDSIILQKYDGYRMPLAMKRIVMRHVPEASSQRLLLENGDADVARNLSPDDLATLTKGNKVTVTSVPQATLLYLGLNVKNPNLAKPEVQEAMKWLIDYDGIQKNVTKNTFKVHQTFLPEGFLGALNSNPYHQDVAKAKALLAKAGLPNGFNVTMDVRSAYPYNEIAQAVQANLAQGGIKVEIIPGDNKQTLAKYRARQHDIYIGEWSADYIDPHSNAQGYAWNPDNSDKSSYKMLAWRNSWDIPDLTKETNAALAESSPGKRAQLYQAMQKEMLAKSPFVIMFQQVSQVAMRPGVSGLEVGPINDLVSYLHVKKQ
>CP026102.1|AUT53756.1|240951_241518_-|D-alanyl-D-alanine-dipeptidase
MTDTPQLIHITPETHGVELDLAYATADNFTGKPIYKEAHCLLLAPAEAGLRKAVELAASIGMKLRIFDAYRPPQAQQVLWDFLPDPTYIAELGRGSNHSRGTALDLTLIDSHGEALDMGTGFDAMVKESEHFHNGLPQHVQRNRLLLLGIMHAAGFTHIASEWWHYEIPGSRALPIIDNSESGPLKLM
>CP026102.1|AUT53757.1|241523_242417_-|MurR/RpiR-family-transcriptional-regulator
MSTAFAHTVEASFATLTPTAKRIASYMLANLERLGLETADQIAQQTGTSGISVGRFLRSVGYRNLDDLKRELRGAQSRPWFITDRLDAYRSERDDINDNGANGNAAGDAGDPSARSLDLELDAIRYVYQLAQGEIFARIAQRIAEADAVFILGIQSTRGISNAFYSYLEYLRPRVFYSDGMSGSYVDSLNSEFASPYLIVTDTRAYSRIARRYCEAATRRELPFALVTDLYCPWAREFPCDLIQVKTDVGQFWDSLAPLTCLFNLLLTSIVERLGPAIDQRVARNRELQRELDQFDL
>CP026102.1|AUT53758.1|242864_244328_+|catalase
MNKLTTAFGAPVVDNQNIQTAGPRGPALLQDVWFLEKLAHFDREVIPERRMHAKGSGAFGTFTVTHDISKYTRAKIFSQIGKKTELFARFSTVAGERGAADAERDIRGFAVKFYTDEGNWDLVGNNTPVFFLRDPLKFPDLNHAIKRDPRSGLRSAESNWDFWTQLPEALHQVTIVMSDRGIPKSFRHMHGFGSHTFSFINADKERFWVKFHLHTQQGIQNLSDAEATALVGADRESSHRDLYESIERNEFPKWTMYVQVMPEADASKTSYNPFDLTKIWPKKDYPLIEVGVMELNRNADNHFADVEQSAFNPANVVPGISFSPDKMLQGRLFSYGDAQRYRLGVNHSLIPVNAPRCPVHSYHRDGSMRVDGNMGGATPYNPNTRGEWLDQPDFSEPPLSIEGAADHWNHRTDDDYFSQPGNLFRLMSPEQQQALFDNTARALAGVSEPIRKLHIEHCTKADPAYGQGVAAALESAGTAGATPNRAL
>CP026102.1|AUT53759.1|244407_245352_-|LysR-family-transcriptional-regulator
MDLNDVRIFVSVVQTGSLMNAASRMGVPLATISRRIRALEKELNVQLLERSARGTRLTDAGARLYQHASLGVEILKDGEEAVVSDQAMLKGRLRISLPPAFDIWWDLLHDFQRRYPDIRLHVYTTERRVDLIEEGIDVALRVGAIAHEAMVARRMLSYRHVLVASPQLIERFGMPREPAALSRLPCALWNRAPNDANTWQLGKTTVEPHIVLTTNDYAQLRHRALNGEFVTEIPPFLAADSIRQGRLVPLLPAYPLPDQQVNLLYPSHRHPSAIVRTYLEFCQSRIAWFVDQCAIDWKSSSQDASAPDSLAQSK
>CP026102.1|AUT53760.1|245442_245931_-|GAF-domain-containing-protein
MFDATINTALPKAEFYRELASQARSLLEGESNQIANAANLSALIFHSLPELNWAGFYFALDGELVVGPFQGKPACVRIPMGRGVCGRAAETRETQVVPDVDAFPGHIACDSASRSEIVIPLQKASGELVGVLDIDSPVLARFDDEDRRGLEEVARIFVASLH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP026102_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026102_2

791753-791834

Orphan

Consensus_repeat	Method
CGCACAGGGGCGACGCCTGAAGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026102_2

>merge|CP026102|2|791753-791834|CRISPRCasFinder
CGCACAGGGGCGACGCCTGAAGCACGCTAACAATTCGCGGACGCCAGCGAAAAGGCAAACGCACAGGGGCGACGCCTAAAGC

>CP026102|2|2|791753-791834|CRISPRCasFinder
CGCACAGGGGCGACGCCTGAAGC	ACGCTAACAATTCGCGGACGCCAGCGAAAAGGCAAA
CGCACAGGGGCGACGCCTAAAGC

Protein	Signature genes	Signature genes Name	Protein_function
CP026102.1\|AUT54194.1\|778611_779199_-\|molybdopterin-guanine-dinucleotide-biosynthesis-protein-MobA	unknown	unknown	gnl\|CDD\|133025
CP026102.1\|AUT54195.1\|780453_781755_-\|guanine-permease	unknown	unknown	gnl\|CDD\|225161
CP026102.1\|AUT54200.1\|791938_792832_+\|3-hydroxyisobutyrate-dehydrogenase	unknown	unknown	gnl\|CDD\|130753
CP026102.1\|AUT54199.1\|789530_791060_+\|methylmalonate-semialdehyde-dehydrogenase-(CoA-acylating)	unknown	unknown	gnl\|CDD\|143404
CP026102.1\|AUT55882.1\|785201_786263_-\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|378890
CP026102.1\|AUT54198.1\|786528_787662_+\|acyl-CoA-dehydrogenase	unknown	unknown	gnl\|CDD\|173847
CP026102.1\|AUT54197.1\|782684_783464_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|259808
CP026102.1\|AUT54207.1\|803301_804081_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|378924
CP026102.1\|AUT54206.1\|802102_802873_+\|DNA-binding-response-regulator	unknown	unknown	gnl\|CDD\|223816
CP026102.1\|AUT54203.1\|796184_796721_+\|(2Fe-2S)-binding-protein	unknown	unknown	gnl\|CDD\|224991
CP026102.1\|AUT55884.1\|794810_795824_-\|hypothetical-protein	unknown	unknown	unknown
CP026102.1\|AUT55885.1\|800841_801780_-\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176117
CP026102.1\|AUT55881.1\|783460_785116_-\|serine-protease	unknown	unknown	gnl\|CDD\|223961
CP026102.1\|AUT55883.1\|787729_789436_+\|AMP-dependent-synthetase	unknown	unknown	gnl\|CDD\|341278
CP026102.1\|AUT54202.1\|793626_794796_+\|enoyl-CoA-hydratase/isomerase-family-protein	unknown	unknown	gnl\|CDD\|379770
CP026102.1\|AUT54204.1\|796730_797732_+\|xanthine-dehydrogenase-family-protein-subunit-M	unknown	unknown	gnl\|CDD\|224238
CP026102.1\|AUT54201.1\|792832_793630_+\|enoyl-CoA-hydratase	unknown	unknown	gnl\|CDD\|236373
CP026102.1\|AUT54193.1\|777646_778363_-\|PIG-L-family-deacetylase	unknown	unknown	gnl\|CDD\|376836
CP026102.1\|AUT54196.1\|782233_782485_-\|DUF4148-domain-containing-protein	unknown	unknown	gnl\|CDD\|379321
CP026102.1\|AUT54205.1\|797755_799990_+\|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit	unknown	unknown	gnl\|CDD\|224446

Protein	Function_ID	Function_description	E-value
CP026102.1\|AUT54194.1\|778611_779199_-\|molybdopterin-guanine-dinucleotide-biosynthesis-protein-MobA	gnl\|CDD\|133025	cd04182, GT_2_like_f, GT_2_like_f is a subfamily of the glycosyltransferase family 2 (GT-2) with unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.	2.00058e-54
CP026102.1\|AUT54195.1\|780453_781755_-\|guanine-permease	gnl\|CDD\|225161	COG2252, COG2252, Xanthine/uracil/vitamin C permease [Nucleotide transport and metabolism].	4.27916e-166
CP026102.1\|AUT54200.1\|791938_792832_+\|3-hydroxyisobutyrate-dehydrogenase	gnl\|CDD\|130753	TIGR01692, 3-hydroxyisobutyrate_dehydrogenase_mitochondrial, 3-hydroxyisobutyrate dehydrogenase. 3-hydroxyisobutyrate dehydrogenase is an enzyme that catalyzes the NAD+-dependent oxidation of 3-hydroxyisobutyrate to methylmalonate semialdehyde of the valine catabolism pathway. In Pseudomonas aeruginosa, 3-hydroxyisobutyrate dehydrogenase (mmsB) is co-induced with methylmalonate-semialdehyde dehydrogenase (mmsA) when grown on medium containing valine as the sole carbon source. The positive transcriptional regulator of this operon (mmsR) is located upstream of these genes and has been identified as a member of the XylS/AraC family of transcriptional regulators. 3-hydroxyisobutyrate dehydrogenase shares high sequence homology to the characterized 3-hydroxyisobutyrate dehydrogenase from rat liver with conservation of proposed NAD+ binding residues at the N-terminus (G-8,10,13,24 and D-31). This enzyme belongs to the 3-hydroxyacid dehydrogenase family, sharing a common evolutionary origin and enzymatic mechanism with 6-phosphogluconate. HIBADH exhibits sequence similarity to the NAD binding domain of 6-phosphogluconate dehydrogenase above trusted (pfam03446). [Energy metabolism, Amino acids and amines].	4.87137e-149
CP026102.1\|AUT54199.1\|789530_791060_+\|methylmalonate-semialdehyde-dehydrogenase-(CoA-acylating)	gnl\|CDD\|143404	cd07085, ALDH_F6_MMSDH, Methylmalonate semialdehyde dehydrogenase and ALDH family members 6A1 and 6B2. Methylmalonate semialdehyde dehydrogenase (MMSDH, EC=1.2.1.27) [acylating] from Bacillus subtilis is involved in valine metabolism and catalyses the NAD+- and CoA-dependent oxidation of methylmalonate semialdehyde into propionyl-CoA. Mitochondrial human MMSDH ALDH6A1 and Arabidopsis MMSDH ALDH6B2 are also present in this CD.	0
CP026102.1\|AUT55882.1\|785201_786263_-\|AraC-family-transcriptional-regulator	gnl\|CDD\|378890	pfam12625, Arabinose_bd, Arabinose-binding domain of AraC transcription regulator, N-term. AraC is a bacterial transcriptional regulatory protein with a DNA-binding domain at the C-terminus, HTH_AraC, pfam00165, and this dimerization domain which harbours the arabinose-binding pocket at the N-terminus. AraC positively and negatively regulates expression of the proteins required for the uptake and catabolism of the sugar L-arabinose 1,2,3].	4.38359e-36
CP026102.1\|AUT54198.1\|786528_787662_+\|acyl-CoA-dehydrogenase	gnl\|CDD\|173847	cd01158, SCAD_SBCAD, Short chain acyl-CoA dehydrogenases and eukaryotic short/branched chain acyl-CoA dehydrogenases. Short chain acyl-CoA dehydrogenase (SCAD). SCAD is a mitochondrial beta-oxidation enzyme. It catalyzes the alpha,beta dehydrogenation of the corresponding trans-enoyl-CoA by FAD, which becomes reduced. The reduced form of SCAD is reoxidized in the oxidative half-reaction by electron-transferring flavoprotein (ETF), from which the electrons are transferred to the mitochondrial respiratory chain coupled with ATP synthesis. This subgroup also contains the eukaryotic short/branched chain acyl-CoA dehydrogenase(SBCAD), the bacterial butyryl-CoA dehydorgenase(BCAD) and 2-methylbutyryl-CoA dehydrogenase, which is involved in isoleucine catabolism. These enzymes are homotetramers.	0
CP026102.1\|AUT54197.1\|782684_783464_-\|hypothetical-protein	gnl\|CDD\|259808	cd08826, SPFH_eoslipins_u1, Uncharacterized prokaryotic subgroup of the stomatin-like proteins (slipins) family; belonging to the SPFH (stomatin, prohibitin, flotillin, and HflK/C) superfamily. This model summarizes a subgroup of the stomatin-like protein family (SLPs or slipins) that is found in bacteria and archaebacteria. The conserved domain common to the SPFH superfamily has also been referred to as the Band 7 domain. Individual proteins of the SPFH superfamily may cluster to form membrane microdomains which may in turn recruit multiprotein complexes. Bacterial and archaebacterial SLPs remain uncharacterized. This subgroup contains PH1511 from the hyperthermophilic archaeon Pyrococcus horikoshi.	3.09316e-108
CP026102.1\|AUT54207.1\|803301_804081_-\|alpha/beta-hydrolase	gnl\|CDD\|378924	pfam12697, Abhydrolase_6, Alpha/beta hydrolase family. This family contains alpha/beta hydrolase enzymes of diverse specificity.	2.15298e-14
CP026102.1\|AUT54206.1\|802102_802873_+\|DNA-binding-response-regulator	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	2.81953e-71
CP026102.1\|AUT54203.1\|796184_796721_+\|(2Fe-2S)-binding-protein	gnl\|CDD\|224991	COG2080, CoxS, Aerobic-type carbon monoxide dehydrogenase, small subunit CoxS/CutS homologs [Energy production and conversion].	4.30745e-82
CP026102.1\|AUT55885.1\|800841_801780_-\|LysR-family-transcriptional-regulator	gnl\|CDD\|176117	cd08426, PBP2_LTTR_like_5, The C-terminal substrate binding domain of an uncharacterized LysR-type transcriptional regulator, contains the type 2 periplasmic binding fold. LysR-transcriptional regulators comprise the largest family of prokaryotic transcription factor. Homologs of some of LTTRs with similar domain organizations are also found in the archaea and eukaryotic organisms. The LTTRs are composed of two functional domains joined by a linker helix involved in oligomerization: an N-terminal HTH (helix-turn-helix) domain, which is responsible for the DNA-binding specificity, and a C-terminal substrate-binding domain, which is structurally homologous to the type 2 periplasmic binding proteins. As also observed in the periplasmic binding proteins, the C-terminal domain of the bacterial transcriptional repressor undergoes a conformational change upon substrate binding which in turn changes the DNA binding affinity of the repressor. The genes controlled by the LTTRs have diverse functional roles including amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to a name a few. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	5.28436e-36
CP026102.1\|AUT55881.1\|783460_785116_-\|serine-protease	gnl\|CDD\|223961	COG1030, NfeD, Membrane-bound serine protease (ClpP class) [Posttranslational modification, protein turnover, chaperones].	1.47603e-139
CP026102.1\|AUT55883.1\|787729_789436_+\|AMP-dependent-synthetase	gnl\|CDD\|341278	cd05974, MACS_like_1, Uncharacterized subfamily of medium-chain acyl-CoA synthetase (MACS). MACS catalyzes the two-step activation of medium chain fatty acids (containing 4-12 carbons). The carboxylate substrate first reacts with ATP to form an acyl-adenylate intermediate, which then reacts with CoA to produce an acyl-CoA ester. MACS enzymes are localized to mitochondria.	0
CP026102.1\|AUT54202.1\|793626_794796_+\|enoyl-CoA-hydratase/isomerase-family-protein	gnl\|CDD\|379770	pfam16113, ECH_2, Enoyl-CoA hydratase/isomerase. This family contains a diverse set of enzymes including: enoyl-CoA hydratase, napthoate synthase, carnitate racemase, 3-hydroxybutyryl-CoA dehydratase and dodecanoyl-CoA delta-isomerase. This family differs from pfam00378 in the structure of it's C-terminus.	4.44349e-150
CP026102.1\|AUT54204.1\|796730_797732_+\|xanthine-dehydrogenase-family-protein-subunit-M	gnl\|CDD\|224238	COG1319, CoxM, Aerobic-type carbon monoxide dehydrogenase, middle subunit CoxM/CutM homologs [Energy production and conversion].	6.5176e-70
CP026102.1\|AUT54201.1\|792832_793630_+\|enoyl-CoA-hydratase	gnl\|CDD\|236373	PRK09076, PRK09076, enoyl-CoA hydratase; Provisional.	6.97348e-174
CP026102.1\|AUT54193.1\|777646_778363_-\|PIG-L-family-deacetylase	gnl\|CDD\|376836	pfam02585, PIG-L, GlcNAc-PI de-N-acetylase. Members of this family are related to PIG-L an N-acetylglucosaminylphosphatidylinositol de-N-acetylase (EC:3.5.1.89) that catalyzes the second step in GPI biosynthesis.	0.000223011
CP026102.1\|AUT54196.1\|782233_782485_-\|DUF4148-domain-containing-protein	gnl\|CDD\|379321	pfam13663, DUF4148, Domain of unknown function (DUF4148).	6.18806e-10
CP026102.1\|AUT54205.1\|797755_799990_+\|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit	gnl\|CDD\|224446	COG1529, CoxL, Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs [Energy production and conversion].	7.54349e-178

>CP026102.1|AUT54199.1|789530_791060_+|methylmalonate-semialdehyde-dehydrogenase-(CoA-acylating)
MSAIPSTLADRKVDTVKLLINGEFVESSATEWRDIVNPATQEVLARVPFATKAEVDAAIRSAHAAFATWKNTPIGARMRIMLKYQALIREHMPRIAKTLTAEQGKTLPDAEGDIFRGLEVVEHACSIGTLQQGEFAENVAGSVDTYTLRQPIGVCAGITPFNFPAMIPLWMFPMAIVCGNTFVLKPSEQDPLSTMQLVELAIEAGVPKGVLNVVHGGKEVVDGLCTHDLVKAISFVGSTAVGTHVYNLGSQHGKRVQSMMGAKNHAVVLPDANREQTLNALVGAGFGAAGQRCMATSVVVLVGASKEWLPELVAKARTLKVNAGHEAGTDIGPVVSRSAKERILGLIEAGVKEGATLALDGRGVDVPGYEAGNFIGPTVFSDVSVEMDVYKTEIFGPVLCVMSVPTLDDAIALVNSNPMGNGVGLFTQSGAAARKFQSEIDVGQVGINIPIPVPVPFFSFTGSRGSKLGDLGPYGKQVVQFYTQTKTVTARWFDDVTVSDGVNTTISLR
>CP026102.1|AUT55883.1|787729_789436_+|AMP-dependent-synthetase
MTAAQSFFDARDLLLRHRTDYERAYREFRWPELGEFNWALDYFDVVAKGNDNPALWIVDDPAQEGLKLSYAQMSERSSRMANFLRGLGVARGDRLLLMLPNRVELWDVMLAAMKLGAIVLPATTQLSPDDVRDRVQIGGANFVVVDSAETGKFDALDTPLQRISVGAPREGWTDIAAAYAASPVFTPDGATRAADPMLLYFTSGTTSKPKLVEHTHESYPVGHLSTMYWIGLQPGDIHWNISSPGWAKHAWSCFFAPWNAQACVFVYNFARFAPKDTLDVLVRYQVTTLCAPPTVWRMLVQEPLASYPVKLREIVGAGEPLNPEIIERVRHAWNIVIRDGYGQTETTCQIGNPPGQPVVPGSMGRPLPGYRVELVDADDHPVTEGEIALPLGSRPLGLMTGYANNAKATEHAMRNGYYHTSDVAMRRDDGYLVYVGRSDDVFKSSDYRLSPFELESVLIEHEAIAEAAVVPSNDPLRLSVPKAFVTVRHGFEAGPELARDVFRFSREKLAPYKRIRRLQFSDLPKTISGKIRRVELRRRELERTAEPARLQDEYWEEDFPELRNGNGN
>CP026102.1|AUT54198.1|786528_787662_+|acyl-CoA-dehydrogenase
MDEFYTDEQRMIRDAARDFAVERLAPNAAQWDREGQLPADVVGQMGELGFLGMIVPPEWGGSYTDYIAYALALEEIAAGCAACATMMSVHNSVGCGPILNFGSDAQKDRYLADLATGKRIGAFCLTEPHAGSEANNIRTRAVLRDGQWVINGSKQFVTNGARASIAIVFAVTDPDAGKRGISAFIVPTDTPGFNVGRPESKLGIRASDTCPIALDDCAVPEANLLGAPGEGLRIALSNLEGGRIGIAAQAIGIARAAFDAARAYANERVQFGKALKEHQTIANMLADMATRLNAARLLVHHAARLRSAGRPCLSEASQAKLYASEMAEEICSKAIQIHGGYGYLEDYAVERHYRDARITQIYEGTSEVQRMVIARHV
>CP026102.1|AUT55882.1|785201_786263_-|AraC-family-transcriptional-regulator
MKTERGTISVSLVEETLALARARGVDVQPIVEAAGIAPQVLASAKSRVTPAQYGALWANIARTLDDEFFGQDAHAMKSGSFIAMTQMALTARNGGQALTRAVNFMRLVLDDMCAQIVTRDDRVRLQFAHRDGAPQPAMFAYATYFILVYGLVCWLVGRRIPLIEARFRCAEPPAAHEYRLMFCDDLSFGQSESYVDLAPDFLELPVVQTTKSIKPFLRDAPASFIIKYRNPGSLAARVRKTLRALPMPAWPGSDEMAQRLHVAEATMRRHLKQEGYTYQSIKDDLRRDIAISQLQRGGQSVADIAATLGFAEPSAFHRAFRKWTGMRPADYRAVNAHAAGAGISRRAERAESD
>CP026102.1|AUT55881.1|783460_785116_-|serine-protease
MGTYRLLPIRQAGSRRTPRRTRGAFVAAAPRAAWARTPRVIPGAAARLLQRAWLLVLAFCAAAAFAHSARAAQPPVTPGSVVVIPVAGAISPATADFIVRGLARAADDRAQLAVLQLDTPGGLDTSMRQIIKAILASPVPVATYIAPGGARAASAGTYITYASHIAAMAPGTNLGAASPVQLGIGGQDAPKPGQPPGLPGATPASGPAQKDNAASGALPLDSQSTELRKQLQDAQAYIRGLAQLRGRNVEWAERAVREAVSLSARDALEQKVVDLIARDIPDLLRQLDGRTYDTAAGAKHLTTAHAPVVTLEADWRSHFLAVITDPNVALILLMIGMYGLFFEFANPGFVLPGVAGAISLLLGLFALQLLPVNYVGLGLIFLGLAFLIAEAFLPTFGTLGFGGIVAFAIGALMLIDTDVPGYGVPLPMIAAVIVFSVLFIFGVSGMVLRSRRRPVVTGAEAMIGSVGVVLDDGLVADTAPGRADGSRDGPPDSLLHGEPDRVGWARVHGERWRVRSTSPLAAGHAVRVTGRRGLMLTVVPASNPSQEGEHT
>CP026102.1|AUT54197.1|782684_783464_-|hypothetical-protein
MIGFTFGFGSILILLAIVLIASAVRVFREYERGVVFMLGRFWKVKGPGLVLIIPVVQQVVRMDLRTVVFDVPPQDVITRDNVSVKVNAVVYFRVVDPERAVIQVARYFEATSQLSQTTLRAVLGKHELDELLSEREQLNTDIQRVLDAQTDAWGIKVSNVEIKHVDINETMIRAIARQAEAERERRAKVIHAEGELQASEKLLQAAQMLAQQPQAMTLRYLQTLTTIAADKNSTIVFPLPVDLLTAVIDRMSKPSQHMG
>CP026102.1|AUT54196.1|782233_782485_-|DUF4148-domain-containing-protein
MKLIPRMVLGALIGVAAVSSAFAQTSRVYDQNTPKTRAEVKADLVEWRKAGYDPLDWINYPANAIAAGRVVAQRRAQAQGTQQ
>CP026102.1|AUT54195.1|780453_781755_-|guanine-permease
MDSVKRYFGFDEAGTTLRVEVLAGVTTFLTMAYIIFVNPAILGDAGMPKDSVFVATCLVAALASLIMGFYANYPIACAPGMGLNAYFAYTVVKGMGFTWQAALGAVFISGCLFLIVTLFRVREVIVNGIPHSIRVAITGGIGLFLAIISLKTAGIVTGSPATLVTLGNLHDPHVVLAIIGFFVIVMLDVLRVRGAILIGIVGVTILSFFFGGNQFHGIVSMPPSISPTLFQLDVKAALSTGVLNVILVFFLVELFDATGTLMGVANRAGLLVHGKMHRLNRALLADSTAILAGSVLGTSSTTAYIESASGVQAGGRTGVTAITVAVLFLLALFFAPLAGVVPGYATAPALLYVSCLMLREMADLPWDDATEVVPAALTALMMPFTYSIANGVAFGFISYAGLKLLTGRARQVKLVVWVIAAVFLFRFFYLGAE
>CP026102.1|AUT54194.1|778611_779199_-|molybdopterin-guanine-dinucleotide-biosynthesis-protein-MobA
MAYASLATGVLLAAGYGSRFDPEGIHNKLLARLPDGTPVAFESAHRLLLVVPHVIAIVRPGSEMLARVLNDAGCHVIFSADAERGMGASLAAGIEASDDADGWIVALADMPRIATSSIEAVARAVDDGAPIVAPYYQGQRGHPVGFGIEHRDALLALDGDTGARALFATHPVKRIEVDDPGVLSDIDTPEDLRNV
>CP026102.1|AUT54193.1|777646_778363_-|PIG-L-family-deacetylase
MSETSPRLFIVSPHFDDAVFGCGALLAAHPDAAVCTVFAAPPAQDMRTDWDEKAGFASAYESVHARTLEDNDALAVLDAIPLRLPFRDAQYRDSPSIGQLAAALEEAIYGSTSNTLLMPLGLFHDDHGRVFEACCEILPRMSHLEWFAYEEAIYRPMPGLVQQRLVDLAGRGIVATPASPAAGHTLDRERQALLKREAVSAYESQLRAFGPHGYDDVYAEERYWRLTVDRQGARRARH
>CP026102.1|AUT54200.1|791938_792832_+|3-hydroxyisobutyrate-dehydrogenase
MKIGFIGLGNMGAPMALNLLKAGHTVTVFDLNPHAVQSLTEAGATAKRTPKEASTDVEYVITMLPAAAHVKAVLTGEEGILAGIAKNVTIIDSSTIDPASVKAFAALATQNGNTFVDAPVSGGTGGATAGTLTFMVGSTAETYEQVKPVLSAMGKNIVHCGETSTGQVAKICNNLVLGITMAGVSEAMALGEKLGIDPQVLGKIINTSTGRCWSSDTYNPFPGVIDTAPSTRGYTGGFGTDLMLKDLGLATDAAKLARQPVYLGALAQQLYQTMSTNGAGKLDFSAVIKLYRKDGDA
>CP026102.1|AUT54201.1|792832_793630_+|enoyl-CoA-hydratase
MIELDYAHDGSVALLTLKRPPANAFTPDGLLQLQHTIERLNGDAQVRAIVITGDGPKFFSAGADLNTFADGNKEIARQAASRFGSAFEALQNARPVVIAAINGYAMGGGLECALACDIRIAEQHAVMALPETAVGLLPCGCGTQTLPWLVGEGWAKRIVLTGERVDTATALRIGLVEEVVEKGAAREFALQMAARVAGLSPQAVTFSKDLIQQARNGVPRTAALAVERERFVDLFDGADQREGVNAFLEKRAPQWQGVQSKESQR
>CP026102.1|AUT54202.1|793626_794796_+|enoyl-CoA-hydratase/isomerase-family-protein
MNAVLNEASAHEPDVLFRVVNRVAIVTLNRPAALNALSHEMVRELAVLVERCRTDSEIVAIVLRGAGAKGFCAGGDVRALYGMRQRNETDWQQFFIDEYRLDYALHTFPKPVVALLDGIAMGGGMGLGQAARLRIVTERTKIAMPETRIGFLPDVGATRFLSVMPAEIELYVGLTGVTLTGAEALCFQLADLCVPSEWLDTFEERLLRIATADVAADELLRALRTVFEPPCNIVPHAGLGAFTQLILRHFDRRSGVERIVATLRQDLEREHVPQMGQREVRQWLQATYDALTSHSPTMLYVTRDALLRGRQMTLAECFRMELGIVTRAIEEGDFSEGVRAHLVDKDRKPRWAPATLAEVRPERVRHFLSSPWRTQAHPLADLGVEQALA
>CP026102.1|AUT55884.1|794810_795824_-|hypothetical-protein
MTVKNMKRKRRRRLKPLLLMGAACALLSARSASAQEIALYGGWLRGAGTNTYSWAIDYTEGFGRYLAGSITWLNEGHMPDHHRDGQAVQIWGRLPLAQNRFVIAVGVGPYRYFDTEAAEQGQGYSNTHGWGGLFSARATWYTSRRWTTSLQLNRVQVSNGPSTTAVLLGAGYQLDAPDEPGPRAWALPRTHDVTNNEVTVLVGQTILNSLESQTSIAESIEYRRGLTHWLDGTFGYLHEGGGLKARRDGLTAQLWLTRAFLDDQLTLGIGAGAYAAIHHGEDPDERSTGDGILSGLVSVSASYRFTQHWAARVTWNRVVTRYSRDTDVLMGGIGYRF
>CP026102.1|AUT54203.1|796184_796721_+|(2Fe-2S)-binding-protein
MPHTIARPEVTPPGDTPHAQPSSSVTIPVELNVNGTAYALALDPRTTLLDALREHLHLTGTKKGCDHGQCGACTVHVNGRRENACLSFAATHEGDTITTIEGIGEPDALHPMQAAFVECDGYQCGYCTSGQIMSAVALLDEAIGPDDADVREAMSGNLCRCGAYQNIVTAIQTVRGKR
>CP026102.1|AUT54204.1|796730_797732_+|xanthine-dehydrogenase-family-protein-subunit-M
MELFQLSRANDVRDAIVAGAASQTAQQGAQVRFLAGGTTLLDLMKLDVEKPARVVDIRRLPLDRVEVTDDGGVKIGALVRNADLALHPLIHEPYAVLSQALLAGASAQLRNMATTGGNLLQRTRCVYFRDTAMPCNKRAPGSGCAAITGFNRTMAILGTSDACIATNPSDMNVALAALGATVQIQGTKGARSVPIDDFYLLPGDTPERETVLEPGDLVTHVTLPPIPGSRSLYLKLRDRASYEFALASAAVVVNVVDGRITRARVALGGVGTKPWHAREAEAELAGAVPDAASFARAADAALANAKAQSQNGFKIELSRRCLIHALTQVMQSV
>CP026102.1|AUT54205.1|797755_799990_+|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit
MSTVSDSLLSVIGQPQSRVDGPLKVSGRAQYTSDIDLPDMLYAVPVCATIASGRVTSLEFAAAQAMPGVRVILHRGNIGRFYRISGNSMETGFVDEARPPFDDDVIRYYGQYVAAVVAETFEAASNAAAAVKVGYDRTAHDVSDELEAKGEPHVQSERGDAASAFEAGEVTLDETYVTPVETHNPIELHATVAQWDGEGYTFYETTQAVSNHQGTLMQMLGLPKEKVRVISRYLGSGFGGKLWMWPHSLLAAAASRHTGQPVKLVVSRKMMFQNVGHRPTTQQRMRLSADRSGKLTSLRHDYLNHTAMADDYEESCGEITPFLYSVPNLRVTSGLVRRNVGSPTAMRGPGAVPGLYALESAMNELARKLDIDPVEFRLRNEPKVDESTGLPFSSRHFVECLTTGAEKFGWAQRTAEVGSMTRDGLTLGWGVGACGWPGLRFSAEASVDLRADGTARVVCGTQDIGTGTYTILAQLVAGHTGIPLDKIEVVLGDTMLPVGPISGGSAATASVIPAVLQAARAATEMVLARAAAVDESPFKGVDKDSLAFGAGRVHRKTEAAEKGVPFAQILQAAKMHAASGKGSAQGGFDDPLKKHYSIYSYGAHFAEVTWQPETARLRVNRVVTVIDAGRILNPRAGRNQIEGAVVMGVGMALFEHTMYDAQSGAPINSNLADYIVASHADTPALDVTFLDYPDPVFNELGARGIAEIGLAGVAAAITDAVHHATGVRVRRLPVMIEDLLLGSM
>CP026102.1|AUT55885.1|800841_801780_-|LysR-family-transcriptional-regulator
MGLTTMRTINHQRLRYFYAVLTQGSIRGAADDMNTSPSVITRQIRLLEEELGVTLFERGARGARPTEPAAHLLEFWEGCQSQQEKLEDQLHAFRGLRHGRVQLAVSEGFVDTLTEEVLAPFCAKYPALTIEMSMLARDGIVEEVAESRAHIGLAYNPPPHPRLQCLASSVQRAVLLLRREHPLAMRKRAATIDDLRAFPLAMMPQTFGIGHAVKMLEIAEGMQIEPAMTTNSLAVLKRMVAVENFVTLIGEFAARREVASGELTTVPVDHPVLQSTHARLLVKTSRLLSPGPMELLDWIRRRLSVFGDGVHG
>CP026102.1|AUT54206.1|802102_802873_+|DNA-binding-response-regulator
MKKLEHVLIVDDDSETRELVAIHLQRNGMRVSRASSGREMRAALGRDTPDLIVLELRLPDTDGLSLCRELRAGEFHAIPVVMLSARHDEADRIVALELGADDYMSKPFAIRELLARIRAVLRRTNMLPPGMRVAEAATVLRFGEWRLDTAARRLLDPEGTVVALSGAEYRLLRVFLDHPNRVLTRDQLLNLTQGRHADLLDRSIDLLVSRVRQRLHDGVRDGRYIKTLRNEGYLFSATVMRVESDVAHAPAMTCIA
>CP026102.1|AUT54207.1|803301_804081_-|alpha/beta-hydrolase
MTRSFRAILAFATMLCGLFALQTADAATPADLKGTNIVLVHGAFADGSSWNRVIPLLEAYGLHVVPVQNPLSSLADDVAATKRVIDQQTGPVVLVGHSWGGVVISQAGNDDKVKSLVYVAAFAPDANQSIADITQGMKPPAWANELRKDSARYLTLSDKAVRDDFALDLPAGQQRIVAATQGPWFSGCANDKVTQAAWHEKPSYFVIPGRDKMIDPHLQAKMATQIHAQVTRVDASHVAMLSQPEAVANAIIAAARHAH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP026102_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026102_3

1048658-1048744

Orphan

Consensus_repeat	Method
ATCGCGGATGCCAGCGAAAAGGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026102_3

>merge|CP026102|3|1048658-1048744|CRISPRCasFinder
ATCGCGGATGCCAGCGAAAAGGCCATAACACCGAACGGCGACGACGCGTGAAGCAAGACAACAAATCGCGGATGCCAGCGCAAAGGC

>CP026102|3|3|1048658-1048744|CRISPRCasFinder
ATCGCGGATGCCAGCGAAAAGGC	CATAACACCGAACGGCGACGACGCGTGAAGCAAGACAACAA
ATCGCGGATGCCAGCGCAAAGGC

Protein	Signature genes	Signature genes Name	Protein_function
CP026102.1\|AUT54383.1\|1041286_1042447_+\|porin	unknown	unknown	gnl\|CDD\|238208
CP026102.1\|AUT54382.1\|1039523_1040921_+\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|273593
CP026102.1\|AUT54388.1\|1049860_1050160_-\|hypothetical-protein	unknown	unknown	unknown
CP026102.1\|AUT54392.1\|1053310_1055374_+\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|240085
CP026102.1\|AUT54393.1\|1055376_1057296_+\|DUF3483-domain-containing-protein	unknown	unknown	gnl\|CDD\|371832
CP026102.1\|AUT54390.1\|1051660_1052632_+\|membrane-dipeptidase	unknown	unknown	gnl\|CDD\|366534
CP026102.1\|AUT54384.1\|1044319_1044934_+\|hypothetical-protein	unknown	unknown	unknown
CP026102.1\|AUT54395.1\|1058474_1059254_+\|drug:proton-antiporter	unknown	unknown	gnl\|CDD\|224997
CP026102.1\|AUT54379.1\|1033966_1034920_-\|phenol-degradation-protein-meta	unknown	unknown	gnl\|CDD\|226763
CP026102.1\|AUT55915.1\|1042780_1043533_-\|MipA/OmpV-family-protein	unknown	unknown	gnl\|CDD\|377682
CP026102.1\|AUT54385.1\|1045049_1046471_+\|sensor-histidine-kinase	unknown	unknown	gnl\|CDD\|273593
CP026102.1\|AUT54391.1\|1052665_1053211_+\|4-vinyl-reductase	unknown	unknown	gnl\|CDD\|198057
CP026102.1\|AUT54389.1\|1050342_1051617_+\|serine-hydroxymethyltransferase	unknown	unknown	gnl\|CDD\|237280
CP026102.1\|AUT54380.1\|1035105_1036695_-\|hypothetical-protein	unknown	unknown	unknown
CP026102.1\|AUT54396.1\|1059295_1060576_+\|aromatic-ring-hydroxylating-dioxygenase-subunit-alpha	unknown	unknown	gnl\|CDD\|176893
CP026102.1\|AUT54386.1\|1046902_1047823_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227279
CP026102.1\|AUT55914.1\|1038398_1039082_+\|DNA-binding-response-regulator	unknown	unknown	gnl\|CDD\|130454
CP026102.1\|AUT54381.1\|1036857_1038108_-\|IS701-family-transposase	unknown	unknown	gnl\|CDD\|379252
CP026102.1\|AUT54394.1\|1057299_1058478_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|224936
CP026102.1\|AUT54387.1\|1048809_1049829_-\|GlxA-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|227311

Protein	Function_ID	Function_description	E-value
CP026102.1\|AUT54390.1\|1051660_1052632_+\|membrane-dipeptidase	gnl\|CDD\|366534	pfam01244, Peptidase_M19, Membrane dipeptidase (Peptidase family M19).	6.02876e-126
CP026102.1\|AUT54382.1\|1039523_1040921_+\|HAMP-domain-containing-protein	gnl\|CDD\|273593	TIGR01386, Probable_sensor_protein_PcoS, heavy metal sensor kinase. Members of this family contain a sensor histidine kinase domain (pfam00512) and a domain found in bacterial signal proteins (pfam00672). This group is separated phylogenetically from related proteins with similar architecture and contains a number of proteins associated with heavy metal resistance efflux systems for copper, silver, cadmium, and/or zinc.	1.38226e-128
CP026102.1\|AUT54389.1\|1050342_1051617_+\|serine-hydroxymethyltransferase	gnl\|CDD\|237280	PRK13034, PRK13034, serine hydroxymethyltransferase; Reviewed.	0
CP026102.1\|AUT54392.1\|1053310_1055374_+\|FAD-dependent-oxidoreductase	gnl\|CDD\|240085	cd04734, OYE_like_3_FMN, Old yellow enzyme (OYE)-related FMN binding domain, group 3. Each monomer of OYE contains FMN as a non-covalently bound cofactor, uses NADPH as a reducing agent with oxygens, quinones, and alpha,beta-unsaturated aldehydes and ketones, and can act as electron acceptors in the catalytic reaction. Other members of OYE family include trimethylamine dehydrogenase, 2,4-dienoyl-CoA reductase, enoate reductase, pentaerythriol tetranitrate reductase, xenobiotic reductase, and morphinone reductase. One member of this subgroup, the Sinorhizobium meliloti stachydrine utilization protein stcD, has been idenified as a putative N-methylproline demethylase.	0
CP026102.1\|AUT54383.1\|1041286_1042447_+\|porin	gnl\|CDD\|238208	cd00342, gram_neg_porins, Porins form aqueous channels for the diffusion of small hydrophillic molecules across the outer membrane. Individual 16-strand anti-parallel beta-barrels form a central pore, and trimerizes thru mainly hydrophobic interactions at the interface. Trimers are stabilized by hytrophillic clamping of Loop L2. Loop 3 bends into the pore, creating an elliptical constriction of about 7 x 11A, large enough to allow passage of a glucose molecule without steric hindrance. Removal of the C-terminal residue (usuallly F) destabilizes the trimer and removal of the 16th beta-sheet abolishes trimerization. Unlike typical membrane proteins, porins lack long hydrophobic stretches. Short turns are found at the smooth, periplasmic end, longer irregular loops are found at the rough, extracellular end. C-terminal residue forms salt bridge with N-terminus.	1.08598e-91
CP026102.1\|AUT54395.1\|1058474_1059254_+\|drug:proton-antiporter	gnl\|CDD\|224997	COG2086, FixA, Electron transfer flavoprotein, beta subunit [Energy production and conversion].	7.72469e-33
CP026102.1\|AUT54379.1\|1033966_1034920_-\|phenol-degradation-protein-meta	gnl\|CDD\|226763	COG4313, COG4313, Protein involved in meta-pathway of phenol degradation [Energy production and conversion].	1.92669e-41
CP026102.1\|AUT55915.1\|1042780_1043533_-\|MipA/OmpV-family-protein	gnl\|CDD\|377682	pfam06629, MipA, MltA-interacting protein MipA. This family consists of several bacterial MltA-interacting protein (MipA) like sequences. As well as interacting with the membrane-bound lytic transglycosylase MltA, MipA is known to bind to PBP1B, a bifunctional murein transglycosylase/transpeptidase. MipA is considered to be a structural protein mediating the assembly of MltA to PBP1B into a complex.	1.16767e-44
CP026102.1\|AUT54385.1\|1045049_1046471_+\|sensor-histidine-kinase	gnl\|CDD\|273593	TIGR01386, Probable_sensor_protein_PcoS, heavy metal sensor kinase. Members of this family contain a sensor histidine kinase domain (pfam00512) and a domain found in bacterial signal proteins (pfam00672). This group is separated phylogenetically from related proteins with similar architecture and contains a number of proteins associated with heavy metal resistance efflux systems for copper, silver, cadmium, and/or zinc.	6.25045e-140
CP026102.1\|AUT54391.1\|1052665_1053211_+\|4-vinyl-reductase	gnl\|CDD\|198057	smart00989, V4R, The V4R (vinyl 4 reductase) domain is a predicted small molecular binding domain, that may bind to hydrocarbons.	2.93776e-07
CP026102.1\|AUT54396.1\|1059295_1060576_+\|aromatic-ring-hydroxylating-dioxygenase-subunit-alpha	gnl\|CDD\|176893	cd08884, RHO_alpha_C_GbcA-like, C-terminal catalytic domain of GbcA (glycine betaine catabolism A) from Pseudomonas aeruginosa PAO1 and related aromatic ring hydroxylating dioxygenases. C-terminal catalytic domain of GbcA (glycine betaine catabolism A) from Pseudomonas aeruginosa PAO1 and related Rieske-type non-heme iron aromatic ring-hydroxylating oxygenases (RHOs, also known as aromatic ring hydroxylating dioxygenases). RHOs utilize non-heme Fe(II) to catalyze the addition of hydroxyl groups to the aromatic ring, an initial step in the oxidative degradation of aromatic compounds. RHOs are composed of either two or three protein components, and are comprised of an electron transport chain (ETC) and an oxygenase. The ETC transfers reducing equivalents from the electron donor to the oxygenase component, which in turn transfers electrons to the oxygen molecules. The oxygenase components are oligomers, either (alpha)n or (alpha)n(beta)n. The alpha subunits are the catalytic components and have an N-terminal domain, which binds a Rieske-like 2Fe-2S cluster, and a C-terminal domain which binds the non-heme Fe(II). The Fe(II) is co-ordinated by conserved His and Asp residues. GbcA is involved in glycine betaine (GB) catabolism in Pseudomonas aeruginosa; it may remove a methyl group from GB via a dioxygenase mechanism, producing dimethylglycine and formaldehyde. This subfamily belongs to the SRPBCC (START/RHO_alpha_C/PITP/Bet_v1/CoxG/CalC) domain superfamily of proteins that bind hydrophobic ligands. SRPBCC domains have a deep hydrophobic ligand-binding pocket.	6.34199e-102
CP026102.1\|AUT54393.1\|1055376_1057296_+\|DUF3483-domain-containing-protein	gnl\|CDD\|371832	pfam11982, DUF3483, Domain of unknown function (DUF3483). This presumed domain is functionally uncharacterized. This domain is found in bacteria. This domain is about 230 amino acids in length. This domain is found associated with pfam02754.	5.20733e-95
CP026102.1\|AUT54386.1\|1046902_1047823_+\|hypothetical-protein	gnl\|CDD\|227279	COG4943, COG4943, Predicted signal transduction protein containing sensor and EAL domains [Signal transduction mechanisms].	3.54425e-98
CP026102.1\|AUT55914.1\|1038398_1039082_+\|DNA-binding-response-regulator	gnl\|CDD\|130454	TIGR01387, Transcriptional_regulatory_protein_PcoR, heavy metal response regulator. Members of this family contain a response regulator receiver domain (pfam00072) and an associated transcriptional regulatory region (pfam00486). This group is separated phylogenetically from related proteins with similar architecture and contains a number of proteins associated with heavy metal resistance efflux systems for copper, silver, cadmium, and/or zinc. Most members encoded by genes adjacent to genes for encoding a member of the heavy metal sensor histidine kinase family (TIGRFAMs:TIGR01386), its partner in the two-component response regulator system. [Regulatory functions, DNA interactions].	1.31654e-107
CP026102.1\|AUT54381.1\|1036857_1038108_-\|IS701-family-transposase	gnl\|CDD\|379252	pfam13546, DDE_5, DDE superfamily endonuclease. This family of proteins are related to pfam00665 and are probably endonucleases of the DDE superfamily. Transposase proteins are necessary for efficient DNA transposition. This domain is a member of the DDE superfamily, which contain three carboxylate residues that are believed to be responsible for coordinating metal ions needed for catalysis. The catalytic activity of this enzyme involves DNA cleavage at a specific site followed by a strand transfer reaction.	3.68248e-66
CP026102.1\|AUT54394.1\|1057299_1058478_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|224936	COG2025, FixB, Electron transfer flavoprotein, alpha subunit [Energy production and conversion].	3.01826e-65
CP026102.1\|AUT54387.1\|1048809_1049829_-\|GlxA-family-transcriptional-regulator	gnl\|CDD\|227311	COG4977, COG4977, Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain [Transcription].	1.31684e-139

>CP026102.1|AUT54386.1|1046902_1047823_+|hypothetical-protein
MTRLSCLRHARAATGRHAMYSARQSHDFMISELALLEQLRLAIARKTLEVFYQPVIRLADNTCVGVESLLRWRLHGQDISPEIVVGLAEQHQLMGPLTDLVLHKSLDDLACVLSSDRSFRVSINVGSDDLRSVRFLDVLAQALKWTGVRASQVGIEATERGFMHPDATRSIIAALRWAGHPVYIDDFGTGYSCLSYLGTFHVDALKLDKAFVNPVENAHASSVVAPHIIAIAHDLGMEIVAEGIESAAQAEYLMRKGVQYGQGWYFAKAMPVVELLPWLAEHAQSVKRDERRRCARSPRLQLLRTP
>CP026102.1|AUT54385.1|1045049_1046471_+|sensor-histidine-kinase
MNNRFLPRTLGARLTALIFFSTSVILALSGAALYEALRSRMSLAASGHMQATLEALQADLANVRATSRISNHPHVWTDQMEGHQNMDMAIYDMAGRRLVSTRGFQPFALLGDLPPDRRNAAFDTRGARFRYITALARLAGDCVSVRVVVQYDKSENLASLRAHAWTIMLIEVVGVGIAAAFAYAITVFGLSPLRRFVSYAEEMSTCRLAQPLSGFDTSQELKELEHAFNGMLERLNDSFTRLGQFSSNLAHDMRTPLTNLQAAAQVALSLPRSTEEYRDVIESSVEEYQRLSGMIEDMLFLARSEKAHTLVKVCLLDAVVEAGRVAGYYETVASDAGVTIELSGRAEVRADLLLFQRALSNLLSNALAHAPRGSVIFVTCREEAGAAEIAVTDTGEGIGREHVDRIFERFYRIDPSRHNRGSGTGLGLAIVKSIMENHGGQCGVESCPGVRTTFWLRFPFADVNREAGSGDTS
>CP026102.1|AUT54384.1|1044319_1044934_+|hypothetical-protein
MIKATTLAVAVIVSMSVAPWASAQTAQPASGVQEQSALAARVQALLATAPPVEIKARIADIDRASRIITLHGPKGHDIDVAIGPQVENFNQLRVGDHVEVLYKNALLVSADKVADADKGIRKRVDSSVYQSTPSGYGAARQIEVQATVLDMNASKREVRLRGAYQAVTLVVGPDIDFKTLKVGDTVHAVFVSAYATRVTPISAH
>CP026102.1|AUT55915.1|1042780_1043533_-|MipA/OmpV-family-protein
MRYLHAAAALTIGAAMVISSRFAHSAEASLGAQVNVMPKYDGAASYRALPLPLFAYDNGLFFVSGLSAGIRYPIGAGISTGLIAQFDFGRDADDSSRLAGTNDISNTARVGAFVDWRRGKWHASLNALQATHSGYGLKVRLAGSYAALATPKNTVHLAVGATFGNGDYMNTYFGVTEQESLASQSRLAGYSPSGGIKGVDASVTWKHQLNPHWSTAAVLGVSSLVGDAADSPVVEHKAAIFGSVGLAYRF
>CP026102.1|AUT54383.1|1041286_1042447_+|porin
MKQQIVLACAVGAFAVSAHAQSSVTLYGSIDAGITYANNVSGKSVWQQGSGNLSNNYFGLRGAEELGGGLKAVFTVESGFDLNNGGFHNNDDIFNRQAFVGLKSDRYGAVTLGRQYDSTSEYLGPLSAAGAGFGNNLAGHPFDNDNLAQTYSTKNAVKYTSPNYAGVEFGGMYGFSNDANGFANGRTWSLGARYGTGPLSVAAGYTQSDNSGGLGGANSAASASQNISATLQRTYGLGATYAFGPAQVGLVWTHSQIDGLASLSSGGAALPGLTGMNLHLDNYEINGQYRLTPALAIVSSYTFTDGTVTGSNSGNSPKWHTFVLGTDYSLSKRTDVYLAGVYQHASGSLGYDANGNGIANVASINLLSPSSTNNQAAATIGLRHRF
>CP026102.1|AUT54382.1|1039523_1040921_+|HAMP-domain-containing-protein
MLRYLPASLRIRLTVLIAFYASIAFAVSGFVVYEAMMSRVEANATDKMEQLMSALQVHLVEVKSTDGITRDPDAWTEHVHGREYVAFAMFDVAGKELLSTRGFRNYPPVLDVQTPRNPVNLSTPTTALRYLVAIVPLNGRDSPAVRVAVQYDSSEEHELVRSNAEIIFIMGTIGILLAAISAYGVTMLGLSPLRRIVTRAEQMSIDGLGQPLPKLTSSTELLELGQAFNGMLARLDDSFTRLSEFSSDLAHDLRTPLTNLRAAAQVALAQSRAAPEYREVIESSVDEYERLSRMIDDMLFLARAERADLSLSICEFDAAAQARRVSGFYESLAQAADIAIDVRGQGIIHADLLLYQRAVSNLLANAIVYAPRNSTIDIECWEQPDAVVVLVSDRGPGIAPPNAERIFERFYRADPPQGKAISHGEGLGLAIVKSIMNLHHGACGVKSDPAVGTTFWLQFPVEKTH
>CP026102.1|AUT55914.1|1038398_1039082_+|DNA-binding-response-regulator
MRILIVEDEGKTGLYLRKGLTEAGYVADWVEDGISGQHQAETEDYDLLIVDVMLPGQDGWTLLHNLRRSKSTPVLFLTARDDVGDRIRGLELGADDYLAKPFDFVELTARVKSILRRARPQDSNTLRVSDLELDLTRRKATRQGRVILLTAKEFALLWLLMRREGEILPRAIIASQVWDMNFSSDTNVVDSAIRRLRSKLDDPFESKLIHTVRGMGYVLEVRSQATP
>CP026102.1|AUT54381.1|1036857_1038108_-|IS701-family-transposase
MSTSQRFDEYLEYLSQGFRHKHHIAGLRDYCTGLMRPLERKSTNAIAEDLQPARAAAMRQALHHFVARAPWCDDELLRQVARWVTPQMAGLSRSGWWIIGCNTFPKRGSQPVGVARQNHEASGRYDKCQIAVSVSLACESASLPIGWRLYLPRAWADDPIRRRKAGVPADVQFATRPKLALQQVEKLLAGGTPSRPVLADVSYGMDPEFRQGLIDLGLPYVLGVTSQARIWRPQAEALPSTGYRETGRLPSQTWRTADHYPISVRALAMEMPAHALQTISWREGNGNLRSSRFGVARVQHADSHACWARLQPLQWLLLKWPLGEPEPVRYWLSTLPEDTSINDLVAAAHYHWRTDRDHEELRQDFGLDHYSGRGWRGFHHHTTLCTASYGFNLGERLASERDLATRRLSIYPESGA
>CP026102.1|AUT54380.1|1035105_1036695_-|hypothetical-protein
MSKRFRLLAGIATLIPAFTLLAQDLPANPKPNPYLAAEKYAITHFDSSQSDSFPYAVPRGTFEVDLRKEKRIVAGPVNIMTLASTSPSYMWGVSSEGVTYIDVSNGGFKEVARIAAPGQKIISAQLHDRVLGQHFSNAAQVQKAVTDIYGLDWTRAVNGVYSVVDKDNGVYYNTADGFLTKFSLIDEKNPSAGIKVIKTIDMRSVIGPDAYLVGTGITYDGKLVVASNFTVSVLDRSLEGKARTIRLAPGEVVTNSFAIDDQNGIYIASNKIMHKLVWTGTRLSDDPADGAWTSPYDTGDQPPTIKLGNGTGSTPTLMGFGRDQDQLVVITDGANRMHLVAFWRNKIPTGWQTPAGAKSRRIAGQIAVTAGLTPLPKFIQTEQSVVVKGYGAFVVNNISQSGEKDKLVDVLALGPVNQPGHGTERFEWDPKAHRWQSVWTRGDVISISMVPSVSSASGIVFVNGYYKKTGWELTGLDWDTGKTVQRVEFGKDNLGNGAYAIIQYAPNGDLIFNSIGGPVRVHLKDPART
>CP026102.1|AUT54379.1|1033966_1034920_-|phenol-degradation-protein-meta
MHKRRLIQYMTDSLLAILCVAGMTQNSSATETGVGRPITGQQVTPYGGIVPPNSEWIVSWATIYYDGSLSASKKVSTGNQITGGLDYQVVYTIANLVKTWGVNLGGWNFASSIGVPVQYSNASSFNGLLRPDSATQFADLFFAPVIAGYRLSPTDYTALSLQIYAPTGAYNPDRIANAGQNTWTFTPGIAYTRLFPSNNLELTINYGVEFYTTNSATNYHNAAVSVLDVLALKRFRSGWSVGVVGGWIQQLGNDTGPTADLIGGAKGYSLGMGPTIGWAGKIGKTPVSANLRWVNEFSAKARPSGNAVQLSLSAAFE
>CP026102.1|AUT54387.1|1048809_1049829_-|GlxA-family-transcriptional-regulator
MSPDRTASLSHFAFMPLPNFTMIAFTNAIEVLRMANYLSGQTLYRWSIISPDGGPVSASNGLSVDTGPADCVGTPDIVFVCGGIDVQRVTTPEHQSTLRRFARAGVALGSLCTGTYALAKSGLLAGYACAIHWENMSALKEEFPDTRFLKELFVIDRDRVTCTGGVAPLDMMLNLIAARVGTPRVTQIAEQFIVEHVRDNSAQQRMPLVARLGSANKSLFEVIALMENNIEEPLSREELARLANMSQRQLQRLFREHLGMTPTHYYLTLRLRRARELLLQTDMSIMHITMACGFQSACHFSKSYRDAFGTAPTRERRKQVAPLAHAVISNSIGGVSVHA
>CP026102.1|AUT54388.1|1049860_1050160_-|hypothetical-protein
MQVRFGQVTESTGRAYPWCQCSKVMRFRDGALQRPAVICSCKEHRMGARQARGQCQHCTAPVRSRECTAATRLSSQGLAVWHACCAHSQNKKGRFPTRP
>CP026102.1|AUT54389.1|1050342_1051617_+|serine-hydroxymethyltransferase
MSNANPFFSQSLAERDAAVRKSVLKELERQQSQVELIASENIVSRAVLEAQGSVLTNKYAEGYPGKRYYGGCEFVDEVEALAIERIKKLFNADFANVQPHSGAQANGAVMLALAKPGDTILGMSLDAGGHLTHGAKPALSGKWFNAVQYGVDRETLRIDYDQVEKLAHEHKPSLIIAGFSAYPRVLDFARFRAIADSVGAKLMVDMAHIAGVIAAGRHPNPIEHAHVVTSTTHKTLRGPRGGFVLTNEEDIAKKINSAVFPGLQGGPLMHVIAGKAVAFGEALEDNFKTYIDNVLANAQALGEVLKEGGVDLVTGGTDNHLLLVDLRPKGLKGTQVEQALERAGITCNKNGIPFDTEKPTVTSGIRLGTPAGTTRGFGVAEFRDIGRLILEVFDALRTHPDGDAATEQRVRREIFALCERFPIY
>CP026102.1|AUT54390.1|1051660_1052632_+|membrane-dipeptidase
MSNLHDSSIIIDGLNISKFDRSVFEDMRKGGVTAVNCTVSVWEDFQKTIDNIAEMKQQIREYSEILTLVRTTDDILRAKKENKTGIIFGFQNSYAFEDNLGYIEVFKELGVNVVQLCYNTQNLVGTGCYEPDGGLSGYGREVIQEMNRVGIMVDLSHVGGKTSSDAIACSKKPVTYSHCCPSGLKEHPRNKSDEQLKEIADANGFVGVTMFAPFLKRGPDATVEDYLEAIDYVINVIGEDKVGIGTDFTQGYSTEFFDWITHDKGRYRRLTNFGKVVNPEGIRTIGEFPNLTAAMEKAGWSESRIKKVMGENWLRVFGEVWNV
>CP026102.1|AUT54391.1|1052665_1053211_+|4-vinyl-reductase
MQPQLPIDVDPNTGVWTTDALPMLYVPRHFFTNNHAAVEEALGVEAYAEILYKAGYKSAYYWCDKEAKQHGISGMAVFEHYLNRLSQRGWGLFKIIEADPATAHAKIELRYSSFVLQQPEKSGKLCYMFAGWFAGAMDWVNDTTEGGKKAPRSLSKEAQCAGEHSDHKHDHCVFEVSPLAA
>CP026102.1|AUT54392.1|1053310_1055374_+|FAD-dependent-oxidoreductase
MRYPNLFKPLTLNQLTLRNRIVSTAHAEVYAEPGGLPGDRYIRYYEEKAKGGVGLAVCGGSSPVSIDSPQGWWKSVNLSTDKIIDPLSRLAEAMHRHGAKIMIQATHMGRRSAFHGEHWPHLMTPSGVREPVHRGNAKIIEVEEIRRIISDFAAAAKRVKDAGMDGIEISAAHQHLIDQFWSPRTNFRTDEWGGSLENRLRFGVEVLQAVREAVGKDFCVGLRMCGDEFHEDGLDHEQLKEIAQAMSEKGLIDYIGVIGSGADTHNTLANCMPPMALPPEPFVHLAAGIKSVVKLPVMHAQSIRDAGQAERLLANGMVDLVGMTRAQIADPHMVIKIRDGREDEIKQCVGANYCIDRQYNGLDVLCVQNAATSREATMPHVIEKTRGPRRKVVVVGAGPAGLEAARVARSRGHDVVLFEKSDAVGGQIMLAAKAPQREQMAGIVRWFDMETKRLGVDRRLGVEADEKMILAEKPDIIVLATGGSSFTQQVPAWGVEEGLAVSSWDILSGKVEPKQNVLVYDGVSTHAGAGVADFISSRGSKVEIVTPDVKVADDVGGTTFPIFYRRLYAQGVIHTPNYWLDRVYEEDGKKIAVIRNEYTEEQEERAVDQVIIENGSTPNDALYWKLKPESVNRGQVDVHKLFAAEPQPSLSEELGNGRFLLFRVGDCISMHNIHGAIYDALRLCKDF
>CP026102.1|AUT54393.1|1055376_1057296_+|DUF3483-domain-containing-protein
MSPAFLITALLWVSVAGLAFAVAKRSAYWRLGRATAAGAFGWTNLLTIPKRYFVDLHHVVARDPYIAKTHVATAGGAIAAFALVFINYGLAIYSPWLDRLIFLAALIMLVGAVFVWRRRHAKDVPARLSRGPWNTLPWLLGSFALGLLLYTLLPASAMSGGLAIIFALLIAAGAFAMTFGAARGGPMKHALAGLLHLAFHPRQERFAAQGDVRREAVVPPTALKAPVLEQNEYGVGKPVEFRWNQLLSFDACVQCGKCEAACPAFAAGQPLNPKKLIQDLVTGMVGGTDAAYAGSPTPGIKVGQHGGEPQRPIISSLIEADTVWSCTTCRACVHECPMLIEHVDAIVDMRRNQTLVHGTVPGKGPEVLANLRETGTMGGYDKAARYDWSVDLSSPVAQPGKAVDVLLVAGEGAFDMRYQRTLRSLVKVLNKAGVNYAVLGAEETDTGDVARRLGDEATFQRMAKQMMGTLATLDFKRIVTADPHVMHSLRNEYRALGGRYDVLHHTTFLAELVASGKLSPKAIAAFNDKTITYHDPCYLGRYNGETEAPRQLLKTIGIKVVEMERHGKRGRCCGGGGGAPLTDIPGKQRIPDIRIADARSIGADVVAVGCPNCTAMLEGVVGPRPEVLDVAELVAAALE
>CP026102.1|AUT54394.1|1057299_1058478_+|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MTTTIKRIDPRRPFVITAAGLKRITLGAEHVAGAANDHTLHAGAHGHAAVKTLRTTQAPQRCLLVVAHSDRGGLDDHARQALAAAALIADAATQVALLVLGELKDDAAALGADKVIELPSFDRRTFAPEREVQAVAACVAQLAPAHIFIPDNATGDGDLGRRYAALAGASIATHVVQIDAKQVSSYAQAKQAYATRALPDVILLAAGAVDTRLPFIGAGERLELTAFAQTSDASSSVYRDLGIEEIDAAQVALEEADFIVSAGNGVTDVAAFEKLASTFGAAIGASRVAVDNGMFTRDKQIGATGKTVEASVYIAFGISGAVQHLQGIKDCRHVIAVNLDGSAPIVKRANLTIIGDTQSTIASLIDAIDQARSGRGAGAAPAVKQIVEGVAA
>CP026102.1|AUT54395.1|1058474_1059254_+|drug:proton-antiporter
MNGKLEKIAVLVSVGKHPVSGVARYSRNDAAALEIGRQLSNQHAARLDVLHAGDPGNPALEEYLALGAERVEVLTCGDNGDAVSLLAARLKGYDLVLTGTCAEGAFDSGMLPYRLADALGVPLAGTAVDVTIAGGRATVRQFLPKGVRRRVEVALPAVVAVHPLATVTPRYAYARLRAGTIAPQRVEAGADAEAAQWTLAPVARKPVRLAAAEKRTGHARMLSATTTESRGGSVVIEGTSVEKAQVILDYLREHQLIEY
>CP026102.1|AUT54396.1|1059295_1060576_+|aromatic-ring-hydroxylating-dioxygenase-subunit-alpha
MKVSADIRALVDRRKKGYSLEAPFYLSDEIFALDMDAIFRQHWIQVAVEPDVPEPGDYVTVELGNDSILIVRDDDMQVRAFHNVCRHRGARLCNEDKGSVGNIVCPYHSWTYNLSGELMFAEHMGEKFDRCKHSLKSVHVENLAGLIFVCLAEQPPVDFAVMRAAMEPYLLPHDLPNCKIAAQIDIIEKGNWKLTMENNRECYHCVANHPELTISLYEYGFGYQRSPANAEGMDAFERTCIERAKQWEEMDLPSVEIDRLSDVTGFRTQRLPLDRSGESQTLDAKVASKKLLGEFQQADLGGLSFWTQPNSWHHFMSDHIVTFSVIPLSAGETLVRTKWLVHKDAVEGVDYDVANLTAVWNATNDQDRALVEFSQRGASSSAYEPGPYSPYTEGLVEKFSDWYVQRLAAHVESPVAEQRTINIKAV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP026102_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP026102_4

2008212-2008295

Orphan

Consensus_repeat	Method
GTTTTGCGCTGGCATCCGCGGTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP026102_4

>merge|CP026102|4|2008212-2008295|CRISPRCasFinder
GTTTTGCGCTGGCATCCGCGGTTTGGTTTCGTGGTTTATGCTTCGCCGTTCGGTGTTCCGGGTTTTGCGCTGGCATCCGCGATT

>CP026102|4|4|2008212-2008295|CRISPRCasFinder
GTTTTGCGCTGGCATCCGCGGTT	TGGTTTCGTGGTTTATGCTTCGCCGTTCGGTGTTCCGG
GTTTTGCGCTGGCATCCGCGATT

Protein	Signature genes	Signature genes Name	Protein_function
CP026102.1\|AUT55120.1\|2010766_2011717_-\|AEC-family-transporter	unknown	unknown	gnl\|CDD\|223751
CP026102.1\|AUT55110.1\|1996040_1999040_-\|sarcosine-oxidase-subunit-alpha-family-protein	unknown	unknown	gnl\|CDD\|273584
CP026102.1\|AUT55116.1\|2005289_2006207_-\|ornithine-cyclodeaminase	unknown	unknown	gnl\|CDD\|235996
CP026102.1\|AUT55117.1\|2006229_2007237_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|368491
CP026102.1\|AUT55121.1\|2011824_2012775_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176106
CP026102.1\|AUT55122.1\|2012765_2013536_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|378192
CP026102.1\|AUT55109.1\|1995400_1996051_-\|sarcosine-oxidase-subunit-gamma	unknown	unknown	gnl\|CDD\|226949
CP026102.1\|AUT55123.1\|2014028_2014604_+\|histidine-phosphatase-family-protein	unknown	unknown	gnl\|CDD\|366010
CP026102.1\|AUT55112.1\|1999358_2000603_-\|sarcosine-oxidase-subunit-beta-family-protein	unknown	unknown	gnl\|CDD\|273585
CP026102.1\|AUT55113.1\|2000631_2002020_-\|L-serine-ammonia-lyase	unknown	unknown	gnl\|CDD\|273233
CP026102.1\|AUT55115.1\|2003587_2005072_-\|glucose-6-phosphate-dehydrogenase	unknown	unknown	gnl\|CDD\|235579
CP026102.1\|AUT55125.1\|2015231_2015450_+\|hypothetical-protein	unknown	unknown	unknown
CP026102.1\|AUT55119.1\|2009038_2010586_-\|methyl-accepting-chemotaxis-protein	unknown	unknown	gnl\|CDD\|185008
CP026102.1\|AUT55111.1\|1999036_1999336_-\|sarcosine-oxidase-subunit-delta	unknown	unknown	gnl\|CDD\|377276
CP026102.1\|AUT55126.1\|2015963_2016251_+\|hypothetical-protein	unknown	unknown	unknown
CP026102.1\|AUT55118.1\|2007433_2008171_+\|GntR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225097
CP026102.1\|AUT55124.1\|2014619_2015018_-\|hypothetical-protein	unknown	unknown	unknown
CP026102.1\|AUT55127.1\|2016382_2016646_+\|translation-initiation-factor-IF-1	unknown	unknown	gnl\|CDD\|237102
CP026102.1\|AUT55114.1\|2002389_2003475_+\|AraC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|227311
CP026102.1\|AUT56005.1\|2013557_2013782_-\|CbtB-domain-containing-protein	unknown	unknown	gnl\|CDD\|370526

Protein	Function_ID	Function_description	E-value
CP026102.1\|AUT55120.1\|2010766_2011717_-\|AEC-family-transporter	gnl\|CDD\|223751	COG0679, COG0679, Predicted permeases [General function prediction only].	1.42483e-46
CP026102.1\|AUT55110.1\|1996040_1999040_-\|sarcosine-oxidase-subunit-alpha-family-protein	gnl\|CDD\|273584	TIGR01372, sarcosine_oxidase_alpha_subunit, sarcosine oxidase, alpha subunit family, heterotetrameric form. This model describes the alpha subunit of a family of known and putative heterotetrameric sarcosine oxidases. Five operons of such oxidases are found in Mesorhizobium loti and three in Agrobacterium tumefaciens, a high enough copy number to suggest that not all members are share the same function. The model is designated as subfamily rather than equivalog for this reason.Sarcosine oxidase catalyzes the oxidative demethylation of sarcosine to glycine. The reaction converts tetrahydrofolate to 5,10-methylene-tetrahydrofolate. The enzyme is known in monomeric and heterotetrameric (alpha,beta,gamma,delta) forms [Energy metabolism, Amino acids and amines].	0
CP026102.1\|AUT55116.1\|2005289_2006207_-\|ornithine-cyclodeaminase	gnl\|CDD\|235996	PRK07340, PRK07340, delta(1)-pyrroline-2-carboxylate reductase family protein.	1.04803e-132
CP026102.1\|AUT55117.1\|2006229_2007237_-\|hypothetical-protein	gnl\|CDD\|368491	pfam05544, Pro_racemase, Proline racemase. This family consists of proline racemase (EC 5.1.1.4) proteins which catalyze the interconversion of L- and D-proline in bacteria. This family also contains several similar eukaryotic proteins including Trypanosoma cruzi PA45-A, a protein with B-cell mitogenic properties which has been characterized as a co-factor-independent proline racemase.	5.35039e-124
CP026102.1\|AUT55121.1\|2011824_2012775_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176106	cd08414, PBP2_LTTR_aromatics_like, The C-terminal substrate binding domain of LysR-type transcriptional regulators involved in the catabolism of aromatic compounds and that of other related regulators, contains type 2 periplasmic binding fold. This CD includes the C-terminal substrate binding domain of LTTRs involved in degradation of aromatic compounds, such as CbnR, BenM, CatM, ClcR and TfdR, as well as that of other transcriptional regulators clustered together in phylogenetic trees, including XapR, HcaR, MprR, IlvR, BudR, AlsR, LysR, and OccR. The structural topology of this substrate-binding domain is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis. Besides transport proteins, the PBP2 superfamily includes the substrate-binding domains from ionotropic glutamate receptors, LysR-like transcriptional regulators, and unorthodox sensor proteins involved in signal transduction.	3.90481e-61
CP026102.1\|AUT55122.1\|2012765_2013536_-\|hypothetical-protein	gnl\|CDD\|378192	pfam09490, CbtA, Probable cobalt transporter subunit (CbtA). This entry represents a family of proteins which have been proposed to act as cobalt transporters acting in concert with vitamin B12 biosynthesis systems. Evidence for this assignment includes 1) prediction of five transmembrane segments, 2) positional gene linkage with known B12 biosynthesis genes, 3) upstream proximity of B12 transcriptional regulatory sites, 4) the absence of other known cobalt import systems and 5) the obligate co-localization with a small protein (CbtB) having a single additional transmembrane segment and a C-terminal histidine-rich motif likely to be a metal-binding site.	3.39208e-67
CP026102.1\|AUT55109.1\|1995400_1996051_-\|sarcosine-oxidase-subunit-gamma	gnl\|CDD\|226949	COG4583, COG4583, Sarcosine oxidase gamma subunit [Amino acid transport and metabolism].	3.51776e-53
CP026102.1\|AUT55123.1\|2014028_2014604_+\|histidine-phosphatase-family-protein	gnl\|CDD\|366010	pfam00300, His_Phos_1, Histidine phosphatase superfamily (branch 1). The histidine phosphatase superfamily is so named because catalysis centers on a conserved His residue that is transiently phosphorylated during the catalytic cycle. Other conserved residues contribute to a 'phosphate pocket' and interact with the phospho group of substrate before, during and after its transfer to the His residue. Structure and sequence analyses show that different families contribute different additional residues to the 'phosphate pocket' and, more surprisingly, differ in the position, in sequence and in three dimensions, of a catalytically essential acidic residue. The superfamily may be divided into two main branches. The larger branch 1 contains a wide variety of catalytic functions, the best known being fructose 2,6-bisphosphatase (found in a bifunctional protein with 2-phosphofructokinase) and cofactor-dependent phosphoglycerate mutase. The latter is an unusual example of a mutase activity in the superfamily: the vast majority of members appear to be phosphatases. The bacterial regulatory protein phosphatase SixA is also in branch 1 and has a minimal, and possible ancestral-like structure, lacking the large domain insertions that contribute to binding of small molecules in branch 1 members.	8.83463e-25
CP026102.1\|AUT55112.1\|1999358_2000603_-\|sarcosine-oxidase-subunit-beta-family-protein	gnl\|CDD\|273585	TIGR01373, Sarcosine_oxidase_subunit_beta, sarcosine oxidase, beta subunit family, heterotetrameric form. This model describes the beta subunit of a family of known and putative heterotetrameric sarcosine oxidases. Five operons of such oxidases are found in Mesorhizobium loti and three in Agrobacterium tumefaciens, a high enough copy number to suggest that not all members are share the same function. The model is designated as subfamily rather than equivalog for this reason. Sarcosine oxidase catalyzes the oxidative demethylation of sarcosine to glycine. The reaction converts tetrahydrofolate to 5,10-methylene-tetrahydrofolate. The enzyme is known in monomeric and heterotetrameric (alpha,beta,gamma,delta) forms. [Energy metabolism, Amino acids and amines].	0
CP026102.1\|AUT55113.1\|2000631_2002020_-\|L-serine-ammonia-lyase	gnl\|CDD\|273233	TIGR00720, hypothetical_protein_NEICINOT_00681, L-serine dehydratase, iron-sulfur-dependent, single chain form. This enzyme is also called serine deaminase and L-serine dehydratase 1. L-serine ammonia-lyase converts serine into pyruvate in the gluconeogenesis pathway from serine. This enzyme is comprised of a single chain in Escherichia coli, Mycobacterium tuberculosis, and several other species, but has separate alpha and beta chains in Bacillus subtilis and related species. The beta and alpha chains are homologous to the N-terminal and C-terminal regions, respectively, but are rather deeply branched in a UPGMA tree. This enzyme requires iron and dithiothreitol for activation in vitro, and is a predicted 4Fe-4S protein. Escherichia coli Pseudomonas aeruginosa have two copies of this protein. [Energy metabolism, Amino acids and amines, Energy metabolism, Glycolysis/gluconeogenesis].	0
CP026102.1\|AUT55115.1\|2003587_2005072_-\|glucose-6-phosphate-dehydrogenase	gnl\|CDD\|235579	PRK05722, PRK05722, glucose-6-phosphate 1-dehydrogenase; Validated.	0
CP026102.1\|AUT55119.1\|2009038_2010586_-\|methyl-accepting-chemotaxis-protein	gnl\|CDD\|185008	PRK15048, PRK15048, methyl-accepting chemotaxis protein II; Provisional.	4.98848e-104
CP026102.1\|AUT55111.1\|1999036_1999336_-\|sarcosine-oxidase-subunit-delta	gnl\|CDD\|377276	pfam04267, SoxD, Sarcosine oxidase, delta subunit family. Sarcosine oxidase is a hetero-tetrameric enzyme that contains both covalently bound FMN and non-covalently bound FAD and NAD(+). This enzyme catalyzes the oxidative demethylation of sarcosine to yield glycine, H2O2, and 5,10-CH2-tetrahydrofolate (H4folate) in a reaction requiring H4folate and O2.	2.41059e-48
CP026102.1\|AUT55118.1\|2007433_2008171_+\|GntR-family-transcriptional-regulator	gnl\|CDD\|225097	COG2186, FadR, Transcriptional regulators [Transcription].	1.21283e-37
CP026102.1\|AUT55127.1\|2016382_2016646_+\|translation-initiation-factor-IF-1	gnl\|CDD\|237102	PRK12442, PRK12442, translation initiation factor IF-1; Reviewed.	3.55737e-50
CP026102.1\|AUT55114.1\|2002389_2003475_+\|AraC-family-transcriptional-regulator	gnl\|CDD\|227311	COG4977, COG4977, Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain [Transcription].	1.39242e-123
CP026102.1\|AUT56005.1\|2013557_2013782_-\|CbtB-domain-containing-protein	gnl\|CDD\|370526	pfam09489, CbtB, Probable cobalt transporter subunit (CbtB). This entry represents a family of proteins which have been proposed to act as cobalt transporters acting in concert with vitamin B12 biosynthesis systems. Evidence for this assignment includes 1) prediction of a single transmembrane segment and a C-terminal histidine-rich motif likely to be a metal-binding site, 2) positional gene linkage with known B12 biosynthesis genes, 3) upstream proximity of B12 transcriptional regulatory sites, 4) the absence of other known cobalt import systems and 5) the obligate co-localization with a protein (CbtA) predicted to have five additional transmembrane segments.	4.69124e-08

>CP026102.1|AUT55118.1|2007433_2008171_+|GntR-family-transcriptional-regulator
MASTSFALERAFRPKQIYEQVAERMRGEIRSGQFAPEARLPSERDLAARFGVGRPAVREALGALQNEGLVVTRRNSGTYVCADALQRLAAAPAAGEMPGDADFSPTSALDVRLILEPAIARRAAANAQRDELAEHYLAQMDSIDDVSDGVQRALWNDSDRLFHRQLAVMTGDALLVKIADEVAKAMDQPLWKRLKDDGIHDPGRIRLYVSEHRLIYEAIVDGDAEAAAFYVEQHIRRVRRDIAPK
>CP026102.1|AUT55117.1|2006229_2007237_-|hypothetical-protein
MKLNRMISTVEVHTGGEPFRIVTSGLPKMPGKTIVERRAWLKEHADHLRRALMLEPRGHADMYGGYLTDPVTEGADFGIIFVHNEGYSDHCGHGVIALATTAVSLGWVERTEPETRVGIDAPCGFIEAFVKWDGDHAGSVRFVNVPSFIWLRDVSVETPSFGTVRGDIAFGGAFYFYTSGEPFGLDVREDHVDRLIQFGAEVKRAANEAFKVQHPQIPEINHIYGTIIDNAPRHAGSTQANCCVFADREVDRSPTGSGTAGRVAQLYLRGQLRKDETLVNESIIGTVFRGRVLSETKLDRFDAVIPEIEGDAHICGFANWLVDERDPLTYGFLVR
>CP026102.1|AUT55116.1|2005289_2006207_-|ornithine-cyclodeaminase
MSSTPIFDAAGTARLIPFRALVDALKTAAADYAAGRVASPERLVVPLNDDGIMLSMPAAARDLAIHKLVNVCPRNGERALPTIHGQVMAFDPDTGKTLFILDGPTVTGRRTAAMSMLGIETLSRGAPNDILLIGTGTQAASHLRAIGELYPQARVRVLGTSAARAQAFCDAQRDTVRDLQALSGAAIPDSVDTVIALTTSRQAVYDEAPRAGRLVIGVGAFTPQMCEIGARTLAGSTLYADDLAGARHEAGDFIQAGIDWSTVTGIEGALASQPSFDTPIVFKTVGCAAWDLAAGRVARAALGAG
>CP026102.1|AUT55115.1|2003587_2005072_-|glucose-6-phosphate-dehydrogenase
MTTSTAPASPDRPLDMIIFGGAGDLSARKLLPALYMAHTHGNLPPETRILAIGRREWGRDDYLKWMDEQSRPFIESGAFDASAWDRFLSLFEYVRVDVDQAGDYERLAEASRPNALRVFYLSTSPELFTTICDNLSSHGLLDEHSRVVLEKPLGHDLASAQAINDSVGKHFSEHQIYRIDHYLGKETVQNLMVLRFGNAIFGPLWQAPYIRSVQITVAESVGVGTRAGFYDHTGAMRDMVQNHLLQLLCIVAMEPPVSLDADAVRDEKLKVLRSLRPMTAEDISRDTVRGQYTAGAVGGEPVKGYLEEANVPADSRAETFVALRAHINNWRWANVPFYLRTGKRMAKKLSEIVIEFADLPFSIMPNSPCGPRNCGNRLVIQLQPNESIQLQMLAKEPGSGMRTLPVNLNLDLEQAFTSRRAEAYERLLIDVVRGRLTHFMRRDELEAAWTWVDPIIEAWKRNGDKPRAYTAGTFGPGASTAMMARDNMVWSEES
>CP026102.1|AUT55114.1|2002389_2003475_+|AraC-family-transcriptional-regulator
MTIVDSLPLTSIDALPKERIRFGIVLLPNFTLTAFSGFVDMLRLSADEGDYSKPVRCSWSVIGDTLAPVRASCGIQITPWETFADAEPFDYVVVVGGLLHSGPQANDETLQFIRAAARGNTTLVGICTGVFALMRAGVLDEHRICVSWFHYWDFVERFPSVNPDALIADRLFVIDRRRITCSGGRASIDVAAAILLRHFETATVQKALRILLVGEMQKGNAPQPHPPGLEPATHPKVKRAILLMEQHVGRTLPLEELACKLDLSPRQLERLFKAETGKSPQAFAKQVRLRTAAWLLTSSDRTVADIASSCGFSDASHLGREFRKEFGMPPVMFREQRGGTPVEGDAAVAYEETFPGRVDVF
>CP026102.1|AUT55113.1|2000631_2002020_-|L-serine-ammonia-lyase
MNVSVFDLFKIGIGPSSSHTVGPMIAACRFASHIEDANLLAFVRRVKVELYGSLGATGKGHGTDKAVLLGLEGHLPDTIDPDLIEPRLADIRKGKRLALLGKHEIAFDEKEHIAFFRRLMSGTGSVVHPNGMRFQAFDENGQLLVEKEYYSVGGGFVVNREGDRVNGVRAGGEVPYPFRTGDDLMRVCRESGLSVAQVTFANECASRAPEDVREGLLTIWRTMAACVERGCKMHGELPGPMRVKRRAADLTVQLRTRSEESLRDPLSMLDWVNLYAMAVNEENAAGGRVVTAPTNGAAGVIPAVLHYYVKFVPGSNENGIVDFLLTAAAIGIIYKETASISGAEVGCQGEVGVACSMAAAALAAVMGGTPTQVENAAEIGMEHNLGMTCDPVGGLVQIPCIERNAMGAIKALNASRMALKGDGQHYVTLDNVIKTMRETGADMKTKYKETSRGGLAVNVIEC
>CP026102.1|AUT55112.1|1999358_2000603_-|sarcosine-oxidase-subunit-beta-family-protein
MSRYSIFSLFRNGLSYHENWERQWRSPEPKKEYDVVIVGGGGHGLATAYYLAKEHGVKNVAILEKGWIGGGNTARNTTIVRSNYLWDESAALYEKAMKLWEGLSQDLNYNVMFSQRGVLNLAHTLQDVRDTERRVNANRLNGVDAEFLTPEQIKEIEPTINLNSRYPVLGASIQRRAGVARHDAVAWGFARGADQAGVDIIQNCQVTGIRRDGGRVTGVDTVKGFIKAKKVAVVAAGNTTTLADMAGIRLPLESHPLQALVSEPIKPVVNSVIMSNAVHAYISQSDKGDLVIGAGVDQYTGFGQRGSFHIIEGTLQAIVEMFPVFSRVRMNRQWGGIVDVSPDACPIISKTDVKGLYFNCGWGTGGFKATPGSGWVFAHTIANDEPHPLNAAFSLDRFYTGHLIDEHGAAAVAH
>CP026102.1|AUT55111.1|1999036_1999336_-|sarcosine-oxidase-subunit-delta
MLTIECPWCGPRAESEFSCGGEADIARPLDTDKLTDKEWGDYLFMRKNPRGVHREQWLHTQGCRRWFMATRDTVSYEIQGYDTFKTGNTSADAQGGNKQ
>CP026102.1|AUT55110.1|1996040_1999040_-|sarcosine-oxidase-subunit-alpha-family-protein
MSQKNRLGAGGRINRAIPLTFTFNGRTYQGFQGDTLASALLANGVHFVARSFKYHRPRGIVTADVAEPNAVVQLERGAYTVPNARATEIELYQGLVATSVNAEPNLEHDRMAINQKFSRFMPAGFYYKTFMWPAKFWPKYEEKIREAAGLGKAPEVLDADRYDKCYAHCDVLVVGGGPTGLAAAHAAAVSGARVILVDDQRELGGSLLSSKTEIDGRAALSWVEKIEAELSRMADVTILSRSTAFGYQDHNLVTVTQRLTDHLPVSMRKGTRELLWKIRAKRVILATGAHERPIVFGNNDLPGVMMASAVSTYIHRFGVLPGRNAVVFTNNDAGYQCALDMKACGASVTVVDPRAQGNGALQAAARRHGVKIMNNAAVMTAHGKLRVTSVEVVAYANGKTGAKQADLPCDLVAMSGGYSPVLHLFAQSGGKAHWNDTKACFVPGKGMQPETSIGAAAGEFSLARGLRLAVDAGVEAVKSIGYAVTRVQVPQAAEVAESPLQPLWLVGSRTEAARGPKQFVDFQNDVSAADILLAAREGFESVEHVKRYTAMGFGTDQGKLGNINGMAILADALGKTIPETGTTTFRPNYTPVSFGTFAGRELGDLLDPIRKTAVHEWHVENGAMFEDVGNWKRPWYFPKSGEDLHAAVKRECLAVRNSVGILDASTLGKIDIQGPDAAKLLNWMYTNPWSKLEVGKCRYGLMLDENGMVFDDGVTVRLADQHFMMTTTTGGAARVLTWMERWLQTEWPDMKVRLASVTDHWATFAVVGPKSRKVVQKICSDIDFANEAFPFMSYRNGTVAGVKARVMRISFSGELAYEVNVPANMGRAVWEALMAAGAEFDITPYGTETMHVLRAEKGYIIVGQDTDGSITPHDLGMGGLVAKTKDFLGRRSLARSDTAKDGRKQFVGLLTDDPQLVLPEGSQIVAGPFQGETAPMLGHVTSSYYSPILNRSIALAVVKGGLNKMGQNVTIPLASGKQIAAKIASPVFYDTEGVRQHVE
>CP026102.1|AUT55109.1|1995400_1996051_-|sarcosine-oxidase-subunit-gamma
MWNEARNNAPGATSAVANRVAGQPWQESPLAGVGELVKKHAAAPSKKFHLREKAFCDLVNLRGDVSDAAFLGAVESVTGCRPPARPNTVVRGNGYDVLWLGPDEWLVRSQQPQAPVAEDKLVEALQGQFASAVDIGSGWTVLEVSGEKVRDVISRGCPLDLHPRVLAAGQCAQSHYFKASIVLVPIADDTYEIVVRRSFADYFVRIMLDAAEPLLS
>CP026102.1|AUT55119.1|2009038_2010586_-|methyl-accepting-chemotaxis-protein
MKSLTINARIATTIAFLGVLLIATGALGIFGMAKSNRAQRDGYEVNFASVVALGRSGTAMSRARFGLDWAMSNPHSPQLGEQLNRAKRLLGDADRAWAEFRALPKTPALQSLTDDLDAKRTAVLRDGIDQLIQAIGSGDTNWMDESRANHLIGLYSAMNASQGALEKYLDDAAQAAADHSSATFRTLLTACIASIAVGLGVAYLSWRALRRAIMSPMRDALGQFDAIASGELRTRVEIRSEDEMGTLLHGLATMQDKLGATITTVRKGSDSIAAATQQIAAGNLDLSQRTEEQAASLEQTAAAMDELTSTVQLNAENAQHASKLAEDASSMTAHGREAVGSLVETMHLIDAGSSKMTGIITAIEGIAFQTNILALNAAVEAARAGEEGRGFAVVAGEVRSLAQRSAAAAKEIGILIADSTSRVAHGAQIATGAGDTIRDIETAISRVAKIVGEIATASQQQSDGIKEVSLAVTQMDEVTQQNAALVEENAATAAALADEAKRLSELTAAFRVGVG
>CP026102.1|AUT55120.1|2010766_2011717_-|AEC-family-transporter
MLSTLEILLPVFALIFAGFFCRRRNLLGPTAASELNRFVVWLALPALLFDTMAHSTWHQLDQPAFIATFSIACAGVFVVVLLARLASGRHLADASVDAIAASYPNTGYIGFPLGLLAFGRASLTPTTIATIIVACVLFALAIVLIEIGLQTERTPHKLGAKVVWRLLRNPLIASPILGVLAASADVALPHSVETFLKLLSGAASPCALVSLGLFLAEKRTPAEQAAEPVTSFVLTAIKLIAQPALAWWIAARVFALPAPMVDMAVLLAALPTGTGPYMLAEFYEREAHITSQTILLSTLGSLVSLSLLLFYMHAPG
>CP026102.1|AUT55121.1|2011824_2012775_+|LysR-family-transcriptional-regulator
MLDVKPLRYFVTLAETRHFGRAAARLNLSQPPLSRQLAALEAALGVTLIERSPRSVTLTAAGERFYEDAKAILASIEQAARHARAAAAGDTGQLTVGFTMCAAYSVLPSYARAYGDAWPGVTLNLREVVSNDLAPQVLSGQIDAAIMFPGAQSKDLDTRAIFTEPLCVALSREHPLACAHQLKIAQLAREPFVMASEAVSPSLRATIVDHCAQGGFAPDVRFEVQLQQTVLSLVDEGVGIALVPESMRKAQLVGVVFRPLDDAPTISQMLVWSPSNRNPCLARFLEIAWKRRAERNGEESRASAHSGADAEKQRYR
>CP026102.1|AUT55122.1|2012765_2013536_-|hypothetical-protein
MVGKLLMRGMLAGIVAGLLTFAFARVAGEPLVDTAISFEEKMQTAHDHGDASGAHDHEEELVSRGTQAGLGLLTGVVAYGMAFGGLFALTFAYLHGRVGRLGARALSAWLAVGAYVAVVLVPTIKYPANPPSVGDPETIGMRTGLFFLMIVTSLVVAVFSMKVRKHLVSRLGVWNASIVGGIVFVAIIAAIQIALPTVNEVPEAFPAVVLWKFRFTALGMQAIMWATIGLLFGALVERSERIARASAASARNSAYL
>CP026102.1|AUT56005.1|2013557_2013782_-|CbtB-domain-containing-protein
MNDAVLDHAGQTDQPVITPIPLRELLPWILFGGLLMLLALYFVGAEQGATSLIPGMYVHEFVHDGRHLLGFPCH
>CP026102.1|AUT55123.1|2014028_2014604_+|histidine-phosphatase-family-protein
MRTRLLLISHPATAAQRKGTFPADDPLDTRAVEEATSFRASHAGLLNADAALSSPAACALDTARALGLAATIVPDLADADFGRWRGRRLLDVANEDTNALDTWTRDPSSAPHGGESFDALTLRVGGWLDAFEQRGTVIAVTHAGVIRAALMHVLQAPSARFARIEVPPLSVVELQRDQRGWTWWPAPDRRS
>CP026102.1|AUT55124.1|2014619_2015018_-|hypothetical-protein
MTIRAIAPLALWTVAQLAVAATGDASCGVLAGAGASGASSVSAASGFALRDGEPVDFIAGGKTVPGTLHVLKDGGIYRAYWQPQGRPERYVLANAGTDAVRLIATPAQGKPATDGMPGTTLNPQQVLSCPTL
>CP026102.1|AUT55125.1|2015231_2015450_+|hypothetical-protein
MATLEAFRSVLDDARTPEIIRNHIIDSLQYALRNHGQVFTSKEVEWLAKWDDARIPLAASRELQKRLTQTAD
>CP026102.1|AUT55126.1|2015963_2016251_+|hypothetical-protein
MTTQGIKTYKGYEIHPLIYPRRTANGVAHRNSIDSGYDASVRICRVGANAAADGRVFRLSYFRPFEGAGKARIACMEHAAQVIDGRVDGQTVSDL
>CP026102.1|AUT55127.1|2016382_2016646_+|translation-initiation-factor-IF-1
MAKEELLELDGIVDEVLPDSRYRVTLDNGVVVGAYASGRMRKNHIRILAGDRVTLELSVYDLTKGRINFRHKDERSSGPRSAPMRRR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity
CP026102_1	1.1\|235470\|25\|CP026102\|CRISPRCasFinder	235470-235494	25	CP026101.1	789622-789646	2	0.92
CP026102_1	1.1\|235470\|25\|CP026102\|CRISPRCasFinder	235470-235494	25	CP026101.1	2609896-2609920	2	0.92
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	CP026101.1	3236615-3236650	2	0.944
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	CP026102.1	355993-356028	1	0.972
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	CP026102.1	356637-356672	1	0.972
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	CP026102.1	2417525-2417560	2	0.944
CP026102_3	3.1\|1048681\|41\|CP026102\|CRISPRCasFinder	1048681-1048721	41	CP026102.1	2008947-2008987	2	0.951

1. spacer 1.1|235470|25|CP026102|CRISPRCasFinder matches to position: 789622-789646, mismatch: 2, identity: 0.92

gaaagcaaaggccgaaacaccgaac	CRISPR spacer
gaaagcaaagaccgacacaccgaac	Protospacer
**********.**** *********

2. spacer 1.1|235470|25|CP026102|CRISPRCasFinder matches to position: 2609896-2609920, mismatch: 2, identity: 0.92

gaaagcaaaggccgaaacaccgaac	CRISPR spacer
gaaagcaaaggccgacaccccgaac	Protospacer
*************** ** ******

3. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to position: 3236615-3236650, mismatch: 2, identity: 0.944

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaactcgcggatgccagcgaaaaggcaaa	Protospacer
**********.*******.*****************

4. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to position: 355993-356028, mismatch: 1, identity: 0.972

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggacgccagcgaagaggcaaa	Protospacer
****************************.*******

5. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to position: 356637-356672, mismatch: 1, identity: 0.972

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaaaggcaaa	Protospacer
******************.*****************

6. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to position: 2417525-2417560, mismatch: 2, identity: 0.944

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaaaagcaaa	Protospacer
******************.***********.*****

7. spacer 3.1|1048681|41|CP026102|CRISPRCasFinder matches to position: 2008947-2008987, mismatch: 2, identity: 0.951

cataacaccgaacggcgacgacgcgtgaagcaagacaacaa	CRISPR spacer
caaaacaccgaacggcgacgacgcgagaagcaagacaacaa	Protospacer
** ********************** ***************

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
CP026102_1	1.1\|235470\|25\|CP026102\|CRISPRCasFinder	235470-235494	25	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1856731-1856755	2	0.92
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	251067-251102	2	0.944
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1313582-1313617	2	0.944
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	514354-514389	3	0.917
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	427887-427922	3	0.917
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1856706-1856741	3	0.917
CP026102_1	1.1\|235470\|25\|CP026102\|CRISPRCasFinder	235470-235494	25	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1316845-1316869	4	0.84
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	360003-360038	4	0.889
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1551778-1551813	4	0.889
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	223-258	4	0.889
CP026102_1	1.1\|235470\|25\|CP026102\|CRISPRCasFinder	235470-235494	25	NZ_CP032828	Sphingomonas sp. YZ-8 plasmid unnamed1, complete sequence	305162-305186	5	0.8
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	271159-271194	5	0.861
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	123273-123308	5	0.861
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2242572-2242607	6	0.833
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2241930-2241965	6	0.833
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1036838-1036873	6	0.833
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1049514-1049549	6	0.833
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	82434-82469	6	0.833
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1622761-1622796	6	0.833
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2239817-2239852	7	0.806
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	526122-526157	7	0.806
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1314653-1314688	8	0.778
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	214994-215029	8	0.778
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	767357-767392	8	0.778
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	83079-83114	8	0.778
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	123918-123953	8	0.778
CP026102_2	2.1\|791776\|36\|CP026102\|CRISPRCasFinder	791776-791811	36	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1561890-1561925	8	0.778

1. spacer 1.1|235470|25|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 2, identity: 0.92

gaaagcaaaggccgaaacaccgaac	CRISPR spacer
gaaagcaaagcccaaaacaccgaac	Protospacer
********** **.***********

2. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 2, identity: 0.944

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
aggctaacaattcgcggatgccagcgaaaaggcaaa	Protospacer
* ****************.*****************

3. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 2, identity: 0.944

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaaaagcaaa	Protospacer
******************.***********.*****

4. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 3, identity: 0.917

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaaagacaag	Protospacer
******************.************.***.

5. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 3, identity: 0.917

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggacgccagcgcaaaagcata	Protospacer
************************** ***.*** *

6. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 3, identity: 0.917

acgctaacaattcgcggacgccagcgaaaaggcaaa--	CRISPR spacer
acgctaacaattcgcggatgccagcgaaa--gcaaagc	Protospacer
******************.**********  *****

7. spacer 1.1|235470|25|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 4, identity: 0.84

gaaagcaaaggccgaaacaccgaac	CRISPR spacer
cagcgcaaaggccaaaacaccgaac	Protospacer
 *. *********.***********

8. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 4, identity: 0.889

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
gagctaacaattcgcggatgccagcgaaaacgcaaa	Protospacer
. ****************.*********** *****

9. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 4, identity: 0.889

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgcaaaggccat	Protospacer
******************.******* ****** *

10. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 4, identity: 0.889

acgctaacaattcgcggacgccagcga-aaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgacaaaggccc-	Protospacer
******************.******** ******

11. spacer 1.1|235470|25|CP026102|CRISPRCasFinder matches to NZ_CP032828 (Sphingomonas sp. YZ-8 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.8

gaaagcaaaggccgaaacaccgaac	CRISPR spacer
tcgcgcaaaggccgaaacaccgatc	Protospacer
  . ******************* *

12. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.861

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgcaaagcaaac	Protospacer
******************.******* ****  **

13. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 5, identity: 0.861

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaagcgaaag	Protospacer
******************.**********. * **.

14. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 6, identity: 0.833

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgcaaacacgag	Protospacer
******************.******* *** .*.*.

15. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 6, identity: 0.833

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgcaaacacgag	Protospacer
******************.******* *** .*.*.

16. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 6, identity: 0.833

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
atgctaacaattcgcggatgccagcgcaaaaataaa	Protospacer
*.****************.******* ***...***

17. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 6, identity: 0.833

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaagcaaaag	Protospacer
******************.**********. . **.

18. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 6, identity: 0.833

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaagcaaaag	Protospacer
******************.**********. . **.

19. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 6, identity: 0.833

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaagcaaaag	Protospacer
******************.**********. . **.

20. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.806

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
acgctaacaattcgcggatgccagcgaaagcaaagg	Protospacer
******************.**********. . *..

21. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 7, identity: 0.806

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
aggctaacaattcgcggatgccagcgaaagaaccac	Protospacer
* ****************.**********...* *

22. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.778

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
gcgagggcaaatcgcggatgccagcgaaaaggcaga	Protospacer
.**  ..*** *******.***************.*

23. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.778

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
gcaaagccaattcgcggatgccagcgcaaaggcaaa	Protospacer
.*.  . ***********.******* *********

24. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.778

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
gagctaacaattcgcggatgccagcgaaagcaaata	Protospacer
. ****************.**********. . * *

25. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.778

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
tagctaacaaatcgcggatgccagcgaaaaccaaac	Protospacer
  ******** *******.***********   **

26. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.778

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
gcgctaacaattcgcggatgccagcaaaagcaaaag	Protospacer
.*****************.******.***. . **.

27. spacer 2.1|791776|36|CP026102|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.778

acgctaacaattcgcggacgccagcgaaaaggcaaa	CRISPR spacer
gagctaacaattcgcggatgccaacgaaagcgaaag	Protospacer
. ****************.****.*****. * **.

Prophage detection

Region	Region Position	Protein_number	Hit_taxonomy	Key_proteins	Att_site	Prophage annotation

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. CP026103

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. CP026101

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

3. CP026102

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection