CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_023036	Mycolicibacterium neoaurum VKM Ac-1815D, complete sequence	3 crisprs	WYL,cas3,csa3,cas4,DEDDh,DinG	0	1	2	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_023036_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_023036_1

1131556-1131638

Orphan

Consensus_repeat	Method
GTCCTCGACGAGCCGGAAGCCGA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_023036_1

>merge|NC_023036|1|1131556-1131638|CRISPRCasFinder
GTCCTCGACGAGCCGGAAGCCGAGGCTCCGACGGCCGAGGAGACCGCCGTCGACGCGCCCGTCCTCGACGAGCCGGAAGCCGA

>NC_023036|1|1|1131556-1131638|CRISPRCasFinder
GTCCTCGACGAGCCGGAAGCCGA	GGCTCCGACGGCCGAGGAGACCGCCGTCGACGCGCCC
GTCCTCGACGAGCCGGAAGCCGA

Protein	Signature genes	Signature genes Name	Protein_function
NC_023036.2\|WP_019513800.1\|1127555_1128731_+\|two-component-sensor-histidine-kinase	unknown	unknown	gnl\|CDD\|274368
NC_023036.2\|WP_019513802.1\|1129515_1130280_-\|hypothetical-protein	unknown	unknown	unknown
NC_023036.2\|WP_045546369.1\|1121263_1122550_+\|L,D-transpeptidase-family-protein	unknown	unknown	gnl\|CDD\|380079
NC_023036.2\|WP_019513799.1\|1126692_1127436_+\|phosphoglyceromutase	unknown	unknown	gnl\|CDD\|184519
NC_023036.2\|WP_019513814.1\|1140076_1140328_+\|glutaredoxin-family-protein	unknown	unknown	gnl\|CDD\|368604
NC_023036.2\|WP_019513812.1\|1138680_1139211_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|237473
NC_023036.2\|WP_110806960.1\|1123530_1124814_+\|ROK-family-protein	unknown	unknown	gnl\|CDD\|224851
NC_023036.2\|WP_023985266.1\|1135067_1135298_+\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|200128
NC_023036.2\|WP_023985267.1\|1136591_1137656_+\|acyltransferase-family-protein	unknown	unknown	gnl\|CDD\|153249
NC_023036.2\|WP_019513795.1\|1122546_1123305_-\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|226674
NC_023036.2\|WP_023985265.1\|1130353_1131334_+\|Ppx/GppA-family-phosphatase	unknown	unknown	gnl\|CDD\|223326
NC_023036.2\|WP_019513801.1\|1128812_1129499_+\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NC_023036.2\|WP_019513811.1\|1137772_1138618_+\|hypothetical-protein	unknown	unknown	unknown
NC_023036.2\|WP_019513806.1\|1133235_1134042_+\|thioesterase-family-protein	unknown	unknown	gnl\|CDD\|379298
NC_023036.2\|WP_019513798.1\|1126174_1126669_+\|YbjN-domain-containing-protein	unknown	unknown	gnl\|CDD\|371210
NC_023036.2\|WP_019513809.1\|1135498_1136566_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|187551
NC_023036.2\|WP_019513805.1\|1132393_1133239_+\|sugar-phosphate-isomerase/epimerase	unknown	unknown	gnl\|CDD\|224007
NC_023036.2\|WP_019513807.1\|1134078_1134930_+\|pyrroline-5-carboxylate-reductase	unknown	unknown	gnl\|CDD\|237008
NC_023036.2\|WP_003402602.1\|1135367_1135469_+\|AURKAIP1/COX24-domain-containing-protein	unknown	unknown	unknown
NC_023036.2\|WP_019513797.1\|1124858_1126178_+\|D-inositol-3-phosphate-glycosyltransferase	unknown	unknown	gnl\|CDD\|132490

Protein	Function_ID	Function_description	E-value
NC_023036.2\|WP_019513800.1\|1127555_1128731_+\|two-component-sensor-histidine-kinase	gnl\|CDD\|274368	TIGR02966, Phosphate_regulon_sensor_protein_PhoR, phosphate regulon sensor kinase PhoR. Members of this protein family are the regulatory histidine kinase PhoR associated with the phosphate ABC transporter in most Proteobacteria. Related proteins from Gram-positive organisms are not included in this model. The phoR gene usually is adjacent to the response regulator phoB gene (TIGR02154). [Signal transduction, Two-component systems].	1.72162e-69
NC_023036.2\|WP_019513809.1\|1135498_1136566_+\|SDR-family-oxidoreductase	gnl\|CDD\|187551	cd05240, UDP_G4E_3_SDR_e, UDP-glucose 4 epimerase (G4E), subgroup 3, extended (e) SDRs. Members of this bacterial subgroup are identified as possible sugar epimerases, such as UDP-glucose 4 epimerase. However, while the NAD(P)-binding motif is fairly well conserved, not all members retain the canonical active site tetrad of the extended SDRs. UDP-glucose 4 epimerase (aka UDP-galactose-4-epimerase), is a homodimeric extended SDR. It catalyzes the NAD-dependent conversion of UDP-galactose to UDP-glucose, the final step in Leloir galactose synthesis. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	7.01922e-89
NC_023036.2\|WP_045546369.1\|1121263_1122550_+\|L,D-transpeptidase-family-protein	gnl\|CDD\|380079	pfam17964, Big_10, Bacterial Ig domain. This entry represents a bacterial Ig-like domain found associated with transpeptidase domains.	8.93865e-72
NC_023036.2\|WP_019513799.1\|1126692_1127436_+\|phosphoglyceromutase	gnl\|CDD\|184519	PRK14120, gpmA, phosphoglyceromutase; Provisional.	0
NC_023036.2\|WP_019513812.1\|1138680_1139211_-\|hypothetical-protein	gnl\|CDD\|237473	PRK13692, PRK13692, (3R)-hydroxyacyl-ACP dehydratase subunit HadA; Provisional.	1.76915e-47
NC_023036.2\|WP_110806960.1\|1123530_1124814_+\|ROK-family-protein	gnl\|CDD\|224851	COG1940, NagC, Transcriptional regulator/sugar kinase [Transcription / Carbohydrate transport and metabolism].	1.77855e-32
NC_023036.2\|WP_023985266.1\|1135067_1135298_+\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|200128	TIGR01764, Probable_excisionase, DNA binding domain, excisionase family. An excisionase, or Xis protein, is a small protein that binds and promotes excisive recombination; it is not enzymatically active. This model represents a number of putative excisionases and related proteins from temperate phage, plasmids, and transposons, as well as DNA binding domains of other proteins, such as a DNA modification methylase. This model identifies mostly small proteins and N-terminal regions of large proteins, but some proteins appear to have two copies. This domain appears similar, in both sequence and predicted secondary structure (PSIPRED) to the MerR family of transcriptional regulators (pfam00376). [Unknown function, General].	2.72008e-17
NC_023036.2\|WP_023985267.1\|1136591_1137656_+\|acyltransferase-family-protein	gnl\|CDD\|153249	cd07987, LPLAT_MGAT-like, Lysophospholipid Acyltransferases (LPLATs) of Glycerophospholipid Biosynthesis: MGAT-like. Lysophospholipid acyltransferase (LPLAT) superfamily member: acyltransferases of de novo and remodeling pathways of glycerophospholipid biosynthesis which catalyze the incorporation of an acyl group from either acylCoAs or acyl-acyl carrier proteins (acylACPs) into acceptors such as glycerol 3-phosphate, dihydroxyacetone phosphate or lyso-phosphatidic acid. Included in this suubgroup are such LPLATs as 2-acylglycerol O-acyltransferase (MGAT), and similar proteins.	1.6507e-40
NC_023036.2\|WP_019513795.1\|1122546_1123305_-\|SDR-family-oxidoreductase	gnl\|CDD\|226674	COG4221, COG4221, Short-chain alcohol dehydrogenase of unknown specificity [General function prediction only].	3.97882e-81
NC_023036.2\|WP_023985265.1\|1130353_1131334_+\|Ppx/GppA-family-phosphatase	gnl\|CDD\|223326	COG0248, GppA, Exopolyphosphatase [Nucleotide transport and metabolism / Inorganic ion transport and metabolism].	1.10662e-96
NC_023036.2\|WP_019513801.1\|1128812_1129499_+\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	4.05166e-93
NC_023036.2\|WP_019513806.1\|1133235_1134042_+\|thioesterase-family-protein	gnl\|CDD\|379298	pfam13622, 4HBT_3, Thioesterase-like superfamily. This family contains a wide variety of enzymes, principally thioesterases. These enzymes are part of the Hotdog fold superfamily.	1.20466e-48
NC_023036.2\|WP_019513798.1\|1126174_1126669_+\|YbjN-domain-containing-protein	gnl\|CDD\|371210	pfam10722, YbjN, Putative bacterial sensory transduction regulator. YbjN is a putative sensory transduction regulator protein found in Proteobacteria. As it is a multi-copy suppressor of the coenzyme A-associated temperature sensitivity in temperature-sensitive mutant strains of Escherichia coli the suggestion is that it both helps CoA-A1 and possibly works as a general stabilizer for some other unstable proteins. This family was expanded to subsume other related families: DUF1790, DUF1821 and DUF2596.	3.77797e-17
NC_023036.2\|WP_019513805.1\|1132393_1133239_+\|sugar-phosphate-isomerase/epimerase	gnl\|CDD\|224007	COG1082, IolE, Sugar phosphate isomerases/epimerases [Carbohydrate transport and metabolism].	4.39452e-30
NC_023036.2\|WP_019513807.1\|1134078_1134930_+\|pyrroline-5-carboxylate-reductase	gnl\|CDD\|237008	PRK11880, PRK11880, pyrroline-5-carboxylate reductase; Reviewed.	3.45318e-97
NC_023036.2\|WP_019513814.1\|1140076_1140328_+\|glutaredoxin-family-protein	gnl\|CDD\|368604	pfam05768, DUF836, Glutaredoxin-like domain (DUF836). These proteins are related to the pfam00462 family.	5.61769e-18
NC_023036.2\|WP_019513797.1\|1124858_1126178_+\|D-inositol-3-phosphate-glycosyltransferase	gnl\|CDD\|132490	TIGR03449, mycothiol_MshA, D-inositol-3-phosphate glycosyltransferase. Members of this protein family, found exclusively in the Actinobacteria, are MshA, the glycosyltransferase of mycothiol biosynthesis. Mycothiol replaces glutathione in these species.	0

>NC_023036.2|WP_023985265.1|1130353_1131334_+|Ppx/GppA-family-phosphatase
MRLGVLDVGSNTVHLLVVDARRGGHPTPMSSTKAALRLAEAIDSTGKLTRKGADKLVSTVDEFAKIATSSGCSELMAFATSAVRDATNSEAVLARVQAEAGVSLRVLSGVDESRLTFLAVRRWYGWSAGRIINIDIGGGSLELSSGVDEEPDVALSLPLGAGRMTREWLAEDPPGRRRVAMLRDWLSTELSEAGSVIQSAGTPDLAVATSKTFRSLARLTGAAPSGAGPRVKRTLTASGLRQLIAFISRMTTADRAELEGVSAERAPQIVAGALVAEASMKALGVETVEICPWALREGLILRKLDSEADGTALVETIPATPEGKRR
>NC_023036.2|WP_019513802.1|1129515_1130280_-|hypothetical-protein
MGGEVDLDFAREWVEFYDPEDSNHVISADMTWLLSRWTCVFGTPACQGTVAGRPDDGCCSHGAFLSDDDDRAMLDDAVTKLTDEDWQFRSKGLGRKGYLEDDEYDGKPNQRTRKYKGACIFLNRPGFAGGIGCALHSKALKLGVEPLTMKPEVCWQLPIRRTQDWVTRPDGSEILKTVITEYDRRGWGEGGADLHWYCTGDPAAHVGAKPVWQSYAPELTELLGEKAYAELAAMCRRRGQLGLIAVHPATRAAE
>NC_023036.2|WP_019513801.1|1128812_1129499_+|response-regulator-transcription-factor
MTSVLIVEDEESLADPLAFLLRKEGFEATVVSDGPSALAEFERAGADIVLLDLMLPGMSGTDVCKQLRSRSSVPVIMVTARDSEIDKVVGLELGADDYVTKPYSARELIARIRAVLRRGADNDDAGIADGVLEAGPVRMDVERHVVSVNGEQITLPLKEFDLLEYLMRNSGRVLTRGQLIDRVWGADYVGDTKTLDVHVKRLRSKIESDPASPVHLVTVRGLGYKLEG
>NC_023036.2|WP_019513800.1|1127555_1128731_+|two-component-sensor-histidine-kinase
MSVGSALLLAAALTVLALGIGVAVGMVAMRRITARRTERDIEEGGGITVSQMLSHIAAMSPMGIVVVDTFRDVVYMNDQAIELGLVRDRLLDDRAWQAVQRCLATGADVDIDLSPRKRQKSGRSGLAVRGHVRLLVEGAHQFAVVFVGDQSEQARMEATRRDFVANVSHELKTPVGAMGVLAEAMMASTEDPDTVRRFAEKIIIESVRLADMIGELIELSRLQGAEPLPDLESVDVDDVVAEAVSRYKVAADSAHIKITTDAPTGFRVLGDERLLVTAIANLVSNAIAYSPDGSDVSISRRRRGDEIEIAVTDRGIGIARADQERVFERFFRVDKARSRATGGTGLGLAIVKHVAANHNGSIRLWSQPGTGSTFTLSIPAIPEGRSADDEE
>NC_023036.2|WP_019513799.1|1126692_1127436_+|phosphoglyceromutase
MPTLILLRHGESDWNQKNLFTGWVDVDLTDKGRAEAVRGGKLLAEQGVLPDVLYTSLLRRAITTANLALDAADRHWIPVHRDWRLNERHYGALQGLDKAATKEKYGEEQFMAWRRSYDTPPPPIEKGSEFSQDADPRYAGIPGGAPLTECLADVVERFVPYFEQAIVPDLKAGKTVLIAAHGNSLRALVKYLDGMSDADIVGLNIPTGIPLLYELDENLKPTVAGGKYLDPEAAAAGAAAVAAQGAK
>NC_023036.2|WP_019513798.1|1126174_1126669_+|YbjN-domain-containing-protein
MSVTRIIEETLAANDLEYTQHKGVKGGLPGLVVALPGERRLKTNTILSVGEHSVRVEAFVCRRPDENFESVYKFLLKRNRRLYGVAYTLDNLGDIYLVGWMANSSVTADEIDRVLGQVLEAVDSDFNTLLELGFRSSIQKEWEWRVARGESLKNLEAFEHLIED
>NC_023036.2|WP_019513797.1|1124858_1126178_+|D-inositol-3-phosphate-glycosyltransferase
MRVVPEPSGLTEARRVAVLSVHTSPLSQPGTGDAGGMNVYVLQTALELARRGVEVEIFTRATSSLDEPVVQVAPGVLVRNVVAGPFEGLDKNDLPTQLCAFTAGVLRAEATHEPGYYDIVHSHYWLSGQVGWLASDRWAVPLVHTAHTLAAVKNAALADGDTPEPVLRSVGEQQVVDEADRLIVNTEIEARQLVSLHHADPASIDVVHPGVDLSVFTPGSRRHARAALGLAEDDKVVAFVGRIQPLKAPDVLLRAAAKVADLRVLIAGGPSGSGMDTPNGLVRLAAELGMTDRVTFLPPQSRDELVGIYRAADMVAVPSYNESFGLVAVEAQACGTPVVAAAVGGLPVAVRDGVTGALVDGHDAGDWATALRSVLAGDADRLSAAAVAHAATFSWAHTVDGLMDSYGRAITDYRSRHPRSAAPTRRTGRRFALRRGVRA
>NC_023036.2|WP_110806960.1|1123530_1124814_+|ROK-family-protein
MVSTATVVRQTPAAHAKRALLARHHIVAPSLKVAEVAAASVFGAARQRGPIARDAIARVTGLSIATVNRQVTALLDAGVLRERADLAVSGAIGRPRIPVEVNHEPFLTLGLHIGAKTTSIVATDLFGRTLDVVETPTPRGSQSAALAALAGSASRYLSRWHRRRPLWVGVASGGVVDSTSGYLDHPRLGWAEAPVGPVLAETLGLPVSVASHVDAMAGAELLLAVRRPNTQAGTSLYVYARETVGYALSIGGRVHSPASGPGTIAALPVSSELLGGSGKLESTVSDEAVLTAARAQRIIPAEGPTSTMATLLRAARGGHEGARALLAERARVLGEAVALLRDMLNPDDLVVGGQAFTEYPEGMELVERAFADRSVLGARDIRVTAFGNRVQEAGAGVVSLGGLYADPIAAMRRAQQRRSEAAVLGAS
>NC_023036.2|WP_019513795.1|1122546_1123305_-|SDR-family-oxidoreductase
MTTSTDKRRVAVVTGASAGIGEATAKTLASLGFHVVCVARREAPIRALAAEIDGTAIVADVTDPAAVASLAERLDRVDVLVNNAGGARGLESVAEADIEHWRWMWESNVLGTLQVTKALLGKLIDSGDGLIVTVTSIAALETYDNGSGYTSAKHAQGVLHRTLRSELFGKPVRLTEVAPGMVKTDFSLNRFDGDEGRAEKVYAGVTPLVAEDIAEVIGFVASRPSHVDLDLIVVRPRDQVTGATGSRINRRT
>NC_023036.2|WP_045546369.1|1121263_1122550_+|L,D-transpeptidase-family-protein
MGLGGAGLLAACAGKPAGTSQAEESAAAKAPTVTLTPDDAATDITPTSPAGVVVSDGWFQKIALTNANGKVVAGKLNRDRTEFTVSEPLGYGAEYTWSGSVVGQDGQAVPVTGGFRTVNPQTTVNGQFQLSDGQTVGVAAPIILQFDAAIADEHRADVEKALKVTTTPAVEGSWAWLPDEAGGSRVHWRTKDYYPTGTTVHVDADLYGVKFGPQAYGAADSTLDFTIGRRQVVKAEASSHRIQVLDGAGAVIMDFPCSYGEGDLDRNVTRSGIHVVTEKYEDFYMTNPAAGYANVRERFAVRISNNGEFIHANPASSGAQGNSNVTNGCINLSLTDAEQYFQTAMYGDPVEVTGTRIDLSYADGDIWDWAVPWSEWQAMSALSKDSPPSGIPVTAPVTPSGAPTPSGTPTSTPTSTSTSTAAPTTAGR
>NC_023036.2|WP_019513805.1|1132393_1133239_+|sugar-phosphate-isomerase/epimerase
MRPAIKVGLSTASVYPLRTEAAFEHAARLGYDGVELMVWAEAVSQDIDAIEAMSQRYGIPVLSVHAPCLLISQRVWGANPIAKLERSVRAAEQLGAQTVVVHPPFRWQRRYAEGFSAQVAALEAGSDVLVAVENMFPFRADRFWGTGKPSIERMRRRGGDPGPAISAFAPSYDPLDGGHAHYTLDLSHSATAGTDALELARRMGDGLVHLHLCDGSGASTDEHLVPGRGNQPAAQICRQLATSDFTGHVILEVTTSGARNAAERDALLIESLQFAREHLLR
>NC_023036.2|WP_019513806.1|1133235_1134042_+|thioesterase-family-protein
MSVLFSDAMRLETAGDGVYTGALNEHWTIGPKVHGGAMLALCANAARTEIGVPGVEPIVVSGNFLWAPDPGPLQVFTDVRKRGRRISLVDVELRQGERVAVRAAITLGVPEDDTVPLLSTNPVVPLMTPEPPPGLEPIGPGHPMADVVHLAHGCDIRPSLTTMAPRSDGGPPVIEYWVRPRGAAPDVLFALLCGDVSAPVTFGVNRLGWAPTVQLTAFLRAVPVDGWLRVLCTTTQIGQEWFDEDHVVVDASGRIIVQSRQLALVPAS
>NC_023036.2|WP_019513807.1|1134078_1134930_+|pyrroline-5-carboxylate-reductase
MARIAIIGGGSIGEALLSGLLRAGRQVKDLVVAEKHPDRARQLSETHQVLVTSVADAVENASYVIVAVKPGDVSAVTAEIAEAVAKADNDSDETVFVSVAAGVSTIFFENKLPAGSPVVRVMPNAPMVVGGGVSAVAAGRFATPEQLKEVAAIFDTVGDVLTVTETQMDAVTAVSGSGPAYFFLMVEALVDAGVAAGLSREVSTELVVHTMAGSAAMLLDRRDSAPNGVMDTSATALRAIVTSPGGTTAAGLRELERGGLRSAVADAVQAAKTRSEQLGITSE
>NC_023036.2|WP_023985266.1|1135067_1135298_+|helix-turn-helix-domain-containing-protein
MTSMNGPSARDSAGDGQPKAQFLTVAEVASLMRVSKMTVYRLVHNGELPAVRVGRSFRVHAKAVHDLLETSYFDAG
>NC_023036.2|WP_003402602.1|1135367_1135469_+|AURKAIP1/COX24-domain-containing-protein
MGSVIKKRRKRMSKKKHRKLLRRTRVQRRKLGK
>NC_023036.2|WP_019513809.1|1135498_1136566_+|SDR-family-oxidoreductase
MDELGSEPKVVLVTGACRFLGGYLTARLAQNPAIDHVIAVDAIAPSKDLLRRMGRAEFVRADIRNPFIAKVIRNGNVDTVVHAAAASYAPRAGGRATLKELNVMGAIQLFAAAQKAPSVRRVVLKSTSEVYGSSSRDPVRFTEDGSARRPPTDGFARDSIDIEGYARGLARRRPDIAVTILRLANMIGPAMDTALSRFLAGPVVPTVLGRDARLQLLHEQDALGALERATVAGRPGTFNVGADGIIMMSQAIRRSGRVALPVPRSALAVVDSLRRATRYTELDREQLNYVSFGRVMDTARMRNDLGYIPKWTTAEAFDDYVRGRGLTPIIDPNWVRSVEGRAVALAQRCGGLGTT
>NC_023036.2|WP_023985267.1|1136591_1137656_+|acyltransferase-family-protein
MAGESKAKVIPLRANSGRSTAARRAAQRADGARRHPSLLSDSDERASAEEIAAVVREIDEHRNNGAAAAPEDVPNELSKAISAIADFATRRMTGDYTVDEFGFDPHLNDNVVLPLLRGLFRNWFRVEVSGIENLPLDGAALVVANHAGVLPFDGLMASVAVHDHHPRQRALRLLAADLVFDMPVVGQAARKAGHTVACSSDAHRLLAAGELTAVFPEGFKGLGKPFKDRYKLQRFGRGGFVSAALRAQVPIVPCSIVGSEEIYPKIGDITLLARLLGLPYFPVTPLFPLAGPLGLVPLPSKWHIKFGEPISTDGYDEGAADDPMITFELTDHVRETIQHTLYQLLANRRNTFLG
>NC_023036.2|WP_019513811.1|1137772_1138618_+|hypothetical-protein
MRIPFVGAEAVASGELTPFALRRRYRPIYRGIYVPAEHEVSLRDRIVGIGLAAPDAVIAGVAASALYGAKWVDADEPIEVVMGGRRTQQGLIVRNDTLQPDEIATISGVRVTTPARTAFDLARYHPRDWAVARLDALARARRFSVEQVATIAERHPRARGVTRLRTTLPFVDGGAESPKETWLRLLFIDAGLPRPTTQFVVYDEEGRYVRRIDMCWTEFKVGAEYDGQQHLTSRYDYVNDVKIGRVLRRLDWRIQHVIKEDRPAEIISEARTTLLSRGWRP
>NC_023036.2|WP_019513812.1|1138680_1139211_-|hypothetical-protein
MGIAEEIVGTHYRYPDYFEVGREKIREFATAVKDEHPAHHSEEGAAENGHDSLVASLTFIAVAGRRVQLEIFNQFDVPVNLERVLHRDQKLVFHRPIKAGDKLWFDSYLDSVIESHGAILTEVRAEVTDDDGNPVLTSVITILGEAEHEGEADEVTAQIAAARDASIARMVANQNS
>NC_023036.2|WP_019513814.1|1140076_1140328_+|glutaredoxin-family-protein
MDHQVLLLTRAGCGLCATAAATLDALAAELGMRWESVDVDIAAEGGQPALRAEYGDRLPVVLLDGVEHSYWEVDEAQLRKDLS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_023036_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_023036_2

4393025-4393128

Orphan

Consensus_repeat	Method
GACATCGGTCGACTCCCGCGTTCGCTC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_023036_2

>merge|NC_023036|2|4393025-4393128|CRISPRCasFinder
GACATCGGTCGACTCCCGCGTTCGCTCCGATCCTCGCTCGTCCCTCGCTGCGATCCTCACTCACGCCCGTCTCCCGCGACATCGGTCGACTCCCGCGTTCGCTC

>NC_023036|2|2|4393025-4393128|CRISPRCasFinder
GACATCGGTCGACTCCCGCGTTCGCTC	CGATCCTCGCTCGTCCCTCGCTGCGATCCTCACTCACGCCCGTCTCCCGC
GACATCGGTCGACTCCCGCGTTCGCTC

Protein	Signature genes	Signature genes Name	Protein_function
NC_023036.2\|WP_019510500.1\|4396738_4398379_-\|L-glutamate-gamma-semialdehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|143441
NC_023036.2\|WP_019510490.1\|4386735_4387956_+\|hypothetical-protein	unknown	unknown	unknown
NC_023036.2\|WP_031601636.1\|4388819_4390406_-\|ABC-F-family-ATP-binding-cassette-domain-containing-protein	unknown	unknown	gnl\|CDD\|223562
NC_023036.2\|WP_019510496.1\|4393199_4394600_-\|acyl-CoA-synthetase	unknown	unknown	gnl\|CDD\|236096
NC_023036.2\|WP_045546546.1\|4386120_4386711_-\|TIGR00730-family-Rossman-fold-protein	unknown	unknown	gnl\|CDD\|129813
NC_023036.2\|WP_019510499.1\|4395791_4396739_-\|proline-dehydrogenase	unknown	unknown	gnl\|CDD\|223580
NC_023036.2\|WP_019510485.1\|4382339_4383308_-\|glucosyl-3-phosphoglycerate-synthase	unknown	unknown	gnl\|CDD\|237556
NC_023036.2\|WP_019510488.1\|4384338_4386111_-\|long-chain-acyl-CoA-synthetase	unknown	unknown	gnl\|CDD\|236217
NC_023036.2\|WP_019510501.1\|4398463_4400017_+\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|379258
NC_023036.2\|WP_019510505.1\|4402560_4403118_+\|PadR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|378427
NC_023036.2\|WP_019510491.1\|4388024_4388807_+\|ESX-1-secretion-associated-protein	unknown	unknown	gnl\|CDD\|371259
NC_023036.2\|WP_019510497.1\|4394623_4395163_+\|NUDIX-hydrolase	unknown	unknown	gnl\|CDD\|239516
NC_023036.2\|WP_019510494.1\|4391616_4392561_+\|2,3,4,5-tetrahydropyridine-2,6-dicarboxylate-N-succinyltransferase	unknown	unknown	gnl\|CDD\|274635
NC_023036.2\|WP_019510487.1\|4383411_4384287_-\|dihydropteroate-synthase	unknown	unknown	gnl\|CDD\|273657
NC_023036.2\|WP_019510504.1\|4401976_4402297_-\|ferredoxin-family-protein	unknown	unknown	gnl\|CDD\|224069
NC_023036.2\|WP_031601638.1\|4400870_4401959_-\|succinyldiaminopimelate-transaminase	unknown	unknown	gnl\|CDD\|236119
NC_023036.2\|WP_023986127.1\|4400041_4400854_+\|endo-alpha-1,4-polygalactosaminidase	unknown	unknown	gnl\|CDD\|377061
NC_023036.2\|WP_019510493.1\|4390514_4391582_-\|succinyl-diaminopimelate-desuccinylase	unknown	unknown	gnl\|CDD\|237264
NC_023036.2\|WP_019510498.1\|4395284_4395779_+\|hypothetical-protein	unknown	unknown	unknown
NC_023036.2\|WP_023986126.1\|4381938_4382295_-\|DivIVA-domain-containing-protein	unknown	unknown	gnl\|CDD\|274639

Protein	Function_ID	Function_description	E-value
NC_023036.2\|WP_019510505.1\|4402560_4403118_+\|PadR-family-transcriptional-regulator	gnl\|CDD\|378427	pfam10400, Vir_act_alpha_C, Virulence activator alpha C-term. This structure is homo-dimeric, and the domain here is the C-terminal half of the structure, often associated with PadR upstream, (pfam03551), which is a transcriptional regulator.	6.94192e-21
NC_023036.2\|WP_031601636.1\|4388819_4390406_-\|ABC-F-family-ATP-binding-cassette-domain-containing-protein	gnl\|CDD\|223562	COG0488, Uup, ATPase components of ABC transporters with duplicated ATPase domains [General function prediction only].	7.7956e-116
NC_023036.2\|WP_019510496.1\|4393199_4394600_-\|acyl-CoA-synthetase	gnl\|CDD\|236096	PRK07787, PRK07787, acyl-CoA synthetase; Validated.	0
NC_023036.2\|WP_045546546.1\|4386120_4386711_-\|TIGR00730-family-Rossman-fold-protein	gnl\|CDD\|129813	TIGR00730, LOG_family_protein_YJL055W, TIGR00730 family protein. This model represents one branch of a subfamily of proteins of unknown function. Both PSI-BLAST and weak hits by this model show a low level of similarity to and suggest an evolutionary relationship of the subfamily to the DprA/Smf family of DNA-processing proteins involved in chromosomal transformation with foreign DNA. Both Aquifex aeolicus and Mycobacterium leprae have one member in each of two branches of this subfamily, suggesting that the branches may have distinct functions. [Hypothetical proteins, Conserved].	8.43138e-73
NC_023036.2\|WP_019510499.1\|4395791_4396739_-\|proline-dehydrogenase	gnl\|CDD\|223580	COG0506, PutA, Proline dehydrogenase [Amino acid transport and metabolism].	2.04488e-58
NC_023036.2\|WP_019510497.1\|4394623_4395163_+\|NUDIX-hydrolase	gnl\|CDD\|239516	cd03424, ADPRase_NUDT5, ADP-ribose pyrophosphatase (ADPRase) catalyzes the hydrolysis of ADP-ribose and a variety of additional ADP-sugar conjugates to AMP and ribose-5-phosphate. Like other members of the Nudix hydrolase superfamily, it requires a divalent cation, such as Mg2+, for its activity. It also contains a highly conserved 23-residue Nudix motif (GX5EX7REUXEEXGU, where U = I, L or V) which functions as a metal binding site/catalytic site. In addition to the Nudix motif, there are additional conserved amino acid residues, distal from the signature sequence, that correlate with substrate specificity. In humans, there are four distinct ADPRase activities, three putative cytosolic enzymes (ADPRase-I, -II, and -Mn) and a single mitochondrial enzyme (ADPRase-m). Human ADPRase-II is also referred to as NUDT5. It lacks the N-terminal target sequence unique to mitochondrial ADPRase. The different cytosolic types are distinguished by their specificities for substrate and specific requirement for metal ions. NUDT5 forms a homodimer.	2.89616e-32
NC_023036.2\|WP_019510488.1\|4384338_4386111_-\|long-chain-acyl-CoA-synthetase	gnl\|CDD\|236217	PRK08279, PRK08279, long-chain-acyl-CoA synthetase; Validated.	0
NC_023036.2\|WP_019510501.1\|4398463_4400017_+\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|379258	pfam13556, HTH_30, PucR C-terminal helix-turn-helix domain. This helix-turn-helix domain is often found at the C-terminus of PucR-like transcriptional regulators such as Bacillus subtilis pucR and is likely to be DNA-binding.	2.69848e-18
NC_023036.2\|WP_019510491.1\|4388024_4388807_+\|ESX-1-secretion-associated-protein	gnl\|CDD\|371259	pfam10824, T7SS_ESX_EspC, Excreted virulence factor EspC, type VII ESX diderm. T7SS_ESX-EspC is a family of exported virulence proteins from largely Acinetobacteria and a few Fimicutes, Gram-positive bacteria. It is exported in conjunction with EspA as an interacting pair.ED F8ADQ6.1/227-313; F8ADQ6.1/227-313;.	1.78884e-05
NC_023036.2\|WP_019510500.1\|4396738_4398379_-\|L-glutamate-gamma-semialdehyde-dehydrogenase	gnl\|CDD\|143441	cd07123, ALDH_F4-17_P5CDH, Delta(1)-pyrroline-5-carboxylate dehydrogenase, ALDH families 4 and 17. Delta(1)-pyrroline-5-carboxylate dehydrogenase (EC=1.5.1.12 ), families 4 and 17: a proline catabolic enzyme of the aldehyde dehydrogenase (ALDH) protein superfamily. Delta(1)-pyrroline-5-carboxylate dehydrogenase (P5CDH), also known as ALDH4A1 in humans, is a mitochondrial homodimer involved in proline degradation and catalyzes the NAD + -dependent conversion of P5C to glutamate. This is a necessary step in the pathway interconnecting the urea and tricarboxylic acid cycles. The preferred substrate is glutamic gamma-semialdehyde, other substrates include succinic, glutaric and adipic semialdehydes. Also included in this CD is the Aldh17 Drosophila melanogaster (Q9VUC0) P5CDH and similar sequences.	0
NC_023036.2\|WP_019510485.1\|4382339_4383308_-\|glucosyl-3-phosphoglycerate-synthase	gnl\|CDD\|237556	PRK13915, PRK13915, putative glucosyl-3-phosphoglycerate synthase; Provisional.	0
NC_023036.2\|WP_019510487.1\|4383411_4384287_-\|dihydropteroate-synthase	gnl\|CDD\|273657	TIGR01496, Dihydropteroate_synthase, dihydropteroate synthase. This model represents dihydropteroate synthase, the enzyme that catalyzes the second to last step in folic acid biosynthesis. The gene is usually designated folP (folic acid biosynthsis) or sul (sulfanilamide resistance). This model represents one branch of the family of pterin-binding enzymes (pfam00809) and of a cluster of dihydropteroate synthase and related enzymes (COG0294). Other members of pfam00809 and COG0294 are represented by model TIGR00284. [Biosynthesis of cofactors, prosthetic groups, and carriers, Folic acid].	3.03266e-104
NC_023036.2\|WP_019510504.1\|4401976_4402297_-\|ferredoxin-family-protein	gnl\|CDD\|224069	COG1146, COG1146, Ferredoxin [Energy production and conversion].	1.86728e-12
NC_023036.2\|WP_031601638.1\|4400870_4401959_-\|succinyldiaminopimelate-transaminase	gnl\|CDD\|236119	PRK07865, PRK07865, N-succinyldiaminopimelate aminotransferase; Reviewed.	0
NC_023036.2\|WP_023986127.1\|4400041_4400854_+\|endo-alpha-1,4-polygalactosaminidase	gnl\|CDD\|377061	pfam03537, Glyco_hydro_114, Glycoside-hydrolase family GH114. This family is recognized as a glycosyl-hydrolase family, number 114. It is endo-alpha-1,4-polygalactosaminidase, a rare enzyme. It is proposed to be TIM-barrel, the most common structure amongst the catalytic domains of glycosyl-hydrolases.	4.28526e-52
NC_023036.2\|WP_019510493.1\|4390514_4391582_-\|succinyl-diaminopimelate-desuccinylase	gnl\|CDD\|237264	PRK13007, PRK13007, succinyl-diaminopimelate desuccinylase; Reviewed.	0
NC_023036.2\|WP_023986126.1\|4381938_4382295_-\|DivIVA-domain-containing-protein	gnl\|CDD\|274639	TIGR03544, cell_division_initiation_protein_DivIVA, DivIVA domain. This model describes a domain found in Bacillus subtilis cell division initiation protein DivIVA, and homologs, toward the N-terminus. It is also found as a repeated domain in certain other proteins, including family TIGR03543.	3.8611e-09
NC_023036.2\|WP_019510494.1\|4391616_4392561_+\|2,3,4,5-tetrahydropyridine-2,6-dicarboxylate-N-succinyltransferase	gnl\|CDD\|274635	TIGR03535, DapD_actino, 2,3,4,5-tetrahydropyridine-2,6-dicarboxylate N-succinyltransferase. This enzyme is part of the diaminopimelate pathway of lysine biosynthesis. This model represents a clade of the enzyme specific to Actinobacteria. Alternate name: tetrahydrodipicolinate N-succinyltransferase.	0

>NC_023036.2|WP_019510494.1|4391616_4392561_+|2,3,4,5-tetrahydropyridine-2,6-dicarboxylate-N-succinyltransferase
MTAASGVGLATIAADGTVLDTWFPAPELTGDGSTGTVRLSVAELPESLGALTGPDADRDVEVVAVRTSIADLDDKPVDTYDAYLRLHLLSHRLTKPHEANLDGIFGLLANVVWTNFGPAAVEGFELVRAKLRNRGAVAVYGVDKFPRMVDYVLPAGVRIADADRVRLGAHLAPGTTVMHEGFVNFNAGTLGNSMVEGRISAGVVVDDGSDVGGGASIMGTLSGGGKEVISIGKRCLLGANAGVGISLGDDCVVEAGLYVTGGTKVTTGDGQTIKAKELSGSNNLLFRRNSVSGAVEVVKRDGTGITLNEALHAN
>NC_023036.2|WP_019510493.1|4390514_4391582_-|succinyl-diaminopimelate-desuccinylase
MGLDLRADPITLTAALVDIPSESRHEQRIADEIESALRAQAPHFEVIRSGNAVLARTNLGRSSRVLLAGHTDTVPAADNVPSRRDGDLMYGCGTSDMKSGDAVFLHLAATIAEPAHDLTLVMYDCEEIESSANGLGRIERDLPAWLAADVAILGEPSGGFIEAGCQGTIRVVATAAGTRAHSARSWLGDNAIHKLGAVLDRLSRYQARSVDIDGCVYREGLSAVRIDGGIAGNVIPDAASVTINFRFAPDRSVEQAVAHVHEVLAGLDVTCETTDAAAGALPGLANPAAAALVAAAGGQVRAKYGWTDVSRFAALGIAAVNYGPGDPNLAHKVDEHVDITAITATTETLRAYLTA
>NC_023036.2|WP_031601636.1|4388819_4390406_-|ABC-F-family-ATP-binding-cassette-domain-containing-protein
MSIVLSHLSFNWPDGTVVFDELSSAFGRGRTGLVAPNGAGKTTLLRLIAGELTPTAGSLTVDGVLGYLPQNLPFLARHTVSDVLGITAVLTALDALAAGDASEQVFAAIGDDWDIAERSRAQLDRLGLADLELDRPLSTLSGGQVVSLGLTAQLLRHPDVLLLDEPTNNLDIDARQRLYAALDDFGGCLLVVSHDRVLLDRMDGIAELRNGEVSHFGGGFTDYQIAVQSAQELAENNIRNAEQELKRQKQQMQQARERADKRASTAKRNLKDAGLPKIVAGKLKRDAQQSAAKADDVHARRIGDARSRLDDAERALREDDLVALDLPETEVAAGRVFFSGTGLSSRVFADIDLDIRGPERIALTGGNGAGKSTLLRIIAGDLEPGGGVVQRGDGRIAYLSQRLDLLEERATVADSLAVSAPGLSITRRRHLLAQFLFRGDRIDLPIAALSGGERLRATLACVLFAEPAPQLLLLDEPTNNLDLASVAQLESALNAYRGAFVVVSHDRTFLDNIGIQRWLRLADGVLAT
>NC_023036.2|WP_019510491.1|4388024_4388807_+|ESX-1-secretion-associated-protein
MTDQFSVQTDGVRNYAQTHSDVNSGLVGLPALDGTGLNNSHGAIAASVSTALGTALSGRGGAMGATSTSASTISDLLQQAARAYAGGDKEGGRRLRAAADALDGGQPGAGGAGAAGAAGAGGADAMGQMGQIMGQVGQQVGQLAQSVTAPLQGLAQGLQQVPQQIMQGVQQAVQAAGGAGASGAAGGAGVKLPSGDELKDAEKAVAEKADTAQETDRAERGETGERTEATDAQGGQDGSGRAPVEAPAPAQPAPTRPQVD
>NC_023036.2|WP_019510490.1|4386735_4387956_+|hypothetical-protein
MPDLVDAAAAALARGDLAVAEEQARSALADGTSLPALLILAQALAWQGRGTDADTVLARVDPAGLGDADLIAWALPRAANQFWMLDQPERATAFLRAIRGRLSSAVTIDALLCTFAMNAGSPQRALDIAESVLSCDHAEDRAVGWAAAAAGLSAARMGRFDQVDGLAARAGAAGHPGVLRFTSTYGQITARLLTGDIGAADDVADGLVCDTGPSRAIALVLRADIALARGVLDEAVEALREAAPALSTTGYSWGQLAWMLLAQAHAQQGRAVDAAKALSRAESRHGLKSMLFAPELALAKAWTAAARRDQPGAVRAAREAARAALRGGQHAVALRALHDAVRLGDTRAAEAVAGVSCECVFGRLTAEHAQALSSGDIAGLESVAARWDGLGWGAAARDAARQAGRS
>NC_023036.2|WP_045546546.1|4386120_4386711_-|TIGR00730-family-Rossman-fold-protein
MEPRRNRRYVLPVPETRPWAVCVYCASGPTHPELLKLAGEVGRSIADRGWTLVSGGGNVSAMGAVADGARQHNGATIGVIPKALVHRELADVDADELVVTDTMRERKQVMEERADAFIALPGGIGTLEEFFEAWTAGYLGMHDKPIIMLDPFGHYDGLLTWLRGLVATGYVSEGALDRLVVTADVETALSACSPNH
>NC_023036.2|WP_019510488.1|4384338_4386111_-|long-chain-acyl-CoA-synthetase
MSDDTTRTSVGLLEIATKLPGFLRDAPAIARGVLTGMSARPSAKTSIGKVFQERAAQYGDRVFLKFDDQQITYRKANETVNRYAAVLAAKGVGHGDVVGIMLRNSPDSVLLMLATVKCGATAGMLNYHQRGNVLAHSIGLLNAKAIIAESDLVEPITESGVQTTGLTTLEEMRQAATTAPTTNPATTAAVLAGDKAFYIFTSGTTGMPKASVMTHYRWLRALAGFGGLGLRLNSSDTLYCCLPLYHNNALTVSVGSVLNAGAALALGKSFSASRFWDDVIRFDATAFVYIGEICGYLLNQPPKPTDRAHKVRVIVGNGLRPAIWDQFVERFGIPRVCEFYAASEGNTAFVNVFNVSKSTGICPSPVAYVEYDLESGEPARGPDGRLRKVKRGQPGLLLSKVSSFQPFDGYTDKSASEKKLVRDAFKDGDVWFNTGDLMRAQGFGHAAFADRLGDTFRWKGENVATTEVEAAISADSQVEEATVFGVEVPGAGGRAGMVALQLKDGQEFDGAALAKSVYAHLPGYAVPLFVRLVKELAHTSTFKSQKVELRKQGYGEEVEDPLYVLAGKDEGYVPFYPEYVDEVVEGKRPK
>NC_023036.2|WP_019510487.1|4383411_4384287_-|dihydropteroate-synthase
MQRTFLGRPVAGDRALIMAIVNRTPDSFYDRGATFSDEAAKEATHRKIADGADIIDIGGVKAGPGQTVDADEEIARVVPFIEWLRGTYPDQLISVDTWRAAVAKQACAAGADLINDTWAGADPGLPEVAAEFDAGLVCSHTGGAVPRTRPFRVHYGVTERGVVDDVIAEVTAAAERAQAIGVARDRILIDPTHDFGKNTHHGLSLLRHVKDLVNTGWPVLMALSNKDFVGETLGVGLTERLEGTLAATALAAADGAAMFRVHEVGPTRRVLEMVASIQGSRPPTRTVRGLA
>NC_023036.2|WP_019510485.1|4382339_4383308_-|glucosyl-3-phosphoglycerate-synthase
MTLISELTPELTDIDKTDAVVGHPWFADHSFGRPAWTVEELIEAKRGRTISVVLPALNEEETVASVVETITPLLGNLVDELIVLDSGSTDDTEIRAVAAGARVISRETALPELAPRSGKGEVLWRSLAATTGDLVVFVDSDLIDPDPMFVPKLLGPLLTVDGVHLVKGFYRRPLKVSGSEDANGGGRVTELVARPLLAALRPELTCLLQPLGGEYAGTRELLTSVPFAPAYGVEIGLLVDTYNRYGLDGIAQVNLGVRTHRNRPLTELASMSRQVIATLLNRCGIEDSGMGLTQFFADGDDYTPRTSGVSLADRPPMNTLRP
>NC_023036.2|WP_023986126.1|4381938_4382295_-|DivIVA-domain-containing-protein
MTLILMYLVVLILVGAVLFAIGSVLFGRGEQLPPLPKATTATVLPASGVTGADVDAVKFTQTLRGYKTSEVDWVLDRLGAELESVRGELAALRAAYGVEDPTTFPAEHEAAHARSEQS
>NC_023036.2|WP_019510496.1|4393199_4394600_-|acyl-CoA-synthetase
MLLTSLDPAAVAAGHDLADAVRIDGVSLSRSDLVGAGTSVAERVARAQRVAILATPTATTVLAVVGCLIAGVPFVPVPPDVGATERAHLLSDSGAQAWLGELPAETEGLPHIPVRMHARSWHRYAEPAPQSTAIIMYTSGTTGLPKGVKISRQAIAADIDGLVQAWQWTAEDTLVHGLPLFHVHGLVLGLLGSLRIGNRFVHTGKPSPAGYAEARGSLYFGVPTVWSRIAADERAARALAGARLLVSGSAALPVPVFEELVRLTGHAPVERYGSTESLITLSTRADGERRPGWVGLPLDGVQTRLVDEDGALVPHDGETIGHLQLKGPTVFTGYLNREDATAEAFDPEGWFRTGDVAVIDADGMHRIVGRESVDLIKSGGYRIGAGEIETVLLGYPGIDEVAVVGLPDADLGQRIVAFVVGDVEPQQVIDFVAEQLSVHKRPREVRIVESLPRNAMGKVLKKELAK
>NC_023036.2|WP_019510497.1|4394623_4395163_+|NUDIX-hydrolase
MARIERLSSREVYRNNWMTVREDAIRRPDGSEGIYGVIDKPTYALVIARDSDRFHLVEQYRYPIGLRRWEFPQGTAPDLADLEPEELAARELREETGLRAESLVRLGMLDVAPGMSSQRGWVFLATGLHEGAHEREHEEQDMRSEWFTAAQIEEMIRGGAITDAQTIAAWAMVLLSERN
>NC_023036.2|WP_019510498.1|4395284_4395779_+|hypothetical-protein
MLVRRLCAALAALMVAGLFPAPSAGAAAQWWNGRYQVVSYASQKNGTSVAARQPEGDLTALYTFATACGTACVATVVDGPAPSNPTIPQPQRYTWSAGKWTFSYNWQWECFRGEGLPRLYSPAQSWVTYTPQPDGSLQGSWYTDILSGPCRGNVLIPAAAFPAP
>NC_023036.2|WP_019510499.1|4395791_4396739_-|proline-dehydrogenase
MSVFTRVARPAILAAGRRDGLRRTAQRLPITRAVVHRFVPGDTVQDAMASVADLRDSGRMVSIDHLGEDVDDIATAQATVRAYLGLLDALHARAETASAIRPLEISLKLSALGQALERDGEKVALENARVICERAAAAGVWVTVDAEEHTTTDSTLTIVRDLRADFGWVGTVLQAYLKRTPADCADLADSRIRLCKGAYDEPASVAHRDAGEVTESYLRCLRILMKGPGYPMVASHDPAIIERVPGLAAEYGRGNDDFEYQMLYGIRDDEQRRLAGGGGRVRVYVPFGSQWYGYFVRRLAERPANLMFFLRALRD
>NC_023036.2|WP_019510500.1|4396738_4398379_-|L-glutamate-gamma-semialdehyde-dehydrogenase
MNAITGIAQVPAPTNEPVHEYAPGSPERTRLTAALNELSGNAIDLPHVIAGVHRMGGGESIDVVQPHRHRARLGTMTNAGHAEAQAAIEAAEDAKAQWAHLPFEERAAVFLRAADLLAGPWREKIAAATMLGQSKTAYQAEIDAPCELVDFWRFNVAFAREILAQQPVSGPGVWNRTDHRPLEGFVYAITPFNFTAIAANLPTAPALMGNTVIWKPAPTQTFSAYLTMQLLEAAGLPPGVINLLTGDGQAVSEVVLADPRLAGIHFTGSTATFRHLWRQVGTHVERYRSYPRLVGETGGKDFVLAHSSARPDVLRTALIRGAFDYQGQKCSAASRAYVPRSVWQQMGDDLLSATEALRYGDVTDLSNYGGALIDARAYAKNTRALQRAKSTPGLTIAVGGEYDDSEGYFVRPTVLLADDPSDESFATEYFGPILAVHIYPDGEFDRILTVVDQTAPYALTGAVIADDRTAIVTAQDRLRHTAGNFYVNDKPTGAVVGQQPFGGGRASGTNDKAGSPLNLQRWTSPRSIKETFVPPTRHEYPHMGDL
>NC_023036.2|WP_019510501.1|4398463_4400017_+|helix-turn-helix-domain-containing-protein
MSGVRLGQLLLALDATLVSLVEAPRGLDLPVASAALLDREDIQLGVAPAFGSADVFFLLGIDHPDTIRWLDQHGRSPVAIFAKHPSPEVIRRATRAGIAVVAVEPRARWERLYRLVDHVFDHHGAGSAHDSGTDLFGLAQSIAERTRGMVSIEDAESHVLAYSASNEEADELRRLSILGRAGPPEHLAWIARRGIFDALHAKPDPVRVAERPELGLRPRLAIGIFAATGDTRRAPAFLGTIWLQQGDRPLAEDTEEVLRGAAVLAGRLITRLTAKPSGHAVLVQDMLGLTGDPPEIEAISRELGIPATGRAAVIGIDSTTEGTRLADVLALSASAFRPDAQVAAAGGRVYVLFPDAGKGLPSWVRSTVSALRTELGLELRAVTAAQLEGLAGAAAARAEVDRVLDSAARRPGSLAAITSPAEARTTVLLDEIVTMIAADGRLVDPRIRALRADEPVLAHTLTVYLDSFGDVASAAAALHVHPNTVRYRVRRIEGILGASLAEPDVRLLMTLSLRATA
>NC_023036.2|WP_023986127.1|4400041_4400854_+|endo-alpha-1,4-polygalactosaminidase
MARVRRLLAVAVSSLAVSTTVVGPHASAAPAALPPTTGGFDYQLGGASDVPALAVVVRDSTAQPLAGAYNICYLNGFQTQPGADWSGDRGSALLRDESGTPVADADWPDEYILDPSTPSQRTTILQVLTPGLNRCAANGFDAVEIDNLDTFTRFPAIERAGAMELARSYIALAHGRGLAIGQKNAAELAGIGRGQLGFDFAVTEECAAYDECNAYTGPYGPHVLQIEYVDNLPAPFAAVCAAPDRAPLTILRDRDLTPPGAAGHVYQQCP
>NC_023036.2|WP_031601638.1|4400870_4401959_-|succinyldiaminopimelate-transaminase
MSATLPVFPWDTLADVTAAAKAHPDGIVDLSVGTPVDEVAPVIRDALAQASGVPGYPTTAGTSALRSAIHAALARRFGITDIAAEAVLPVIGSKELIAWLPTLLGVGAEDTVVIPELAYPTYDVGARLAGAQVMAADSLTQIGPQVPALIYLNSPSNPTGKVLGADHLRKVVGWARERGVLVASDECYLGLAWDAEPLSVLHPSICGGDHTGLLAIHSLSKTSSLAGYRAGFVAGDPAVVTELLAVRKHAGMMVPGPVQAAMVAALTDDEHIAVQRERYARRRALLLPALLAAGFTVDHSEAGLYLWATRGEPCRQTLAWLAQRGILVAPGEFYGPAGAQHVRVALTATDERIAAAVQRLGQ
>NC_023036.2|WP_019510504.1|4401976_4402297_-|ferredoxin-family-protein
MTYVIAEPCVDVKDKACIEECPVDCIYEGGRMLYIHPDECVDCGACEPVCPVEAIYYEDDVPDQWSSYTQSNADFFSELGSPGGASKVGQTDNDPQAIKDLEPKGE
>NC_023036.2|WP_019510505.1|4402560_4403118_+|PadR-family-transcriptional-regulator
MALPHAILVSLCEQVGSGYELAHRFDRSIGYFWSASHQQIYRSLRTMESEGWVQVREVAQRGRPDKKVYSVTPAGRAELAHWIAAPLSGRGSTVADNRTRDLAVKIRGCGYGDIEAVRAQAVALRAERAALLDTYRGFEKRQFPDPARLTGAELHQYLVLRGGIRAEEGAIEWLSEVVSALGGVQ

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_023036_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_023036_3

4616428-4616510

Orphan

Consensus_repeat	Method
GGCAGCCAGGGCACCCCGTTGCCCGC	CRISPRCasFinder

1 spacers

csa3

The CRISPR arrays of NC_023036_3

>merge|NC_023036|3|4616428-4616510|CRISPRCasFinder
GGCAGCCAGGGCACCCCGTTGCCCGCCGGTGCCCCCGAGACCGCGCCGGCTCCCGCGGGCAGCCAGGGCACCCCGCTGCCCGC

>NC_023036|3|3|4616428-4616510|CRISPRCasFinder
GGCAGCCAGGGCACCCCGTTGCCCGC	CGGTGCCCCCGAGACCGCGCCGGCTCCCGCG
GGCAGCCAGGGCACCCCGCTGCCCGC

Protein	Signature genes	Signature genes Name	Protein_function
NC_023036.2\|WP_019511886.1\|4622062_4622998_+\|EfeM/EfeO-family-lipoprotein	unknown	unknown	gnl\|CDD\|271139
NC_023036.2\|WP_019511888.1\|4624299_4624839_+\|hypothetical-protein	unknown	unknown	unknown
NC_023036.2\|WP_019511881.1\|4617519_4618464_-\|Ppx/GppA-family-phosphatase	unknown	unknown	gnl\|CDD\|223326
NC_023036.2\|WP_023986189.1\|4619655_4620945_-\|phosphopyruvate-hydratase	unknown	unknown	gnl\|CDD\|234617
NC_023036.2\|WP_019510248.1\|4606728_4607280_+\|TIGR03086-family-protein	unknown	unknown	gnl\|CDD\|274424
NC_023036.2\|WP_019510252.1\|4611941_4612979_-\|iron-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|270261
NC_023036.2\|WP_019510245.1\|4603382_4604063_+\|response-regulator	unknown	unknown	gnl\|CDD\|182522
NC_023036.2\|WP_019510250.1\|4609328_4610399_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|226361
NC_023036.2\|WP_019511889.1\|4624946_4626416_+\|PepSY-domain-containing-protein	unknown	unknown	gnl\|CDD\|225723
NC_023036.2\|WP_023986190.1\|4622994_4624266_+\|Dyp-type-peroxidase	unknown	unknown	gnl\|CDD\|273606
NC_023036.2\|WP_045546381.1\|4613112_4615038_-\|cadmium-translocating-P-type-ATPase	unknown	unknown	gnl\|CDD\|319849
NC_023036.2\|WP_023986188.1\|4618938_4619646_-\|septum-formation-initiator-family-protein	unknown	unknown	gnl\|CDD\|225471
NC_023036.2\|WP_023986186.1\|4615108_4615462_+\|winged-helix-turn-helix-transcriptional-regulator	csa3	COG0640_csa3_CAS-I-A	gnl\|CDD\|238042
NC_023036.2\|WP_019511882.1\|4618454_4618946_-\|DUF501-domain-containing-protein	unknown	unknown	gnl\|CDD\|224424
NC_023036.2\|WP_019510251.1\|4610385_4611900_-\|iron-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|224099
NC_023036.2\|WP_031601662.1\|4621068_4621809_-\|lipoprotein	unknown	unknown	gnl\|CDD\|225501
NC_023036.2\|WP_019510247.1\|4605854_4606706_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|197666
NC_023036.2\|WP_081649901.1\|4607361_4609341_+\|propionyl-CoA-synthetase	unknown	unknown	gnl\|CDD\|341271
NC_023036.2\|WP_131701285.1\|4616830_4617487_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|181433
NC_023036.2\|WP_031601661.1\|4600851_4603386_+\|sensor-histidine-kinase-KdpD	unknown	unknown	gnl\|CDD\|225115

Protein	Function_ID	Function_description	E-value
NC_023036.2\|WP_019511886.1\|4622062_4622998_+\|EfeM/EfeO-family-lipoprotein	gnl\|CDD\|271139	cd14656, Imelysin-like_EfeO, EfeO is a component of the EfeUOB operon. This family includes the EfeO domain, an essential component of the EfeUOB operon which is highly conserved in bacteria. However, its biochemical function is unknown. EfeO contains an N-terminal cupredoxin (CUP)-like domain and C-terminal imelysin-like domain that may bind iron. Algp7, a member of EfeO family protein from Sphingomonas sp. A1, is found to bind alginate at neutral pH, but does not contain the CUP domain, thus having a role that does not seem to be related to iron uptake. Some members of this family are fused to an N-terminal putative EfeU ion permease domain. The imelysin-like domain of this family also contains the GxHxxE sequence motif and a highly conserved functional site, suggesting a similar role to other imelysin family proteins containing the same motif.	6.00522e-81
NC_023036.2\|WP_019511881.1\|4617519_4618464_-\|Ppx/GppA-family-phosphatase	gnl\|CDD\|223326	COG0248, GppA, Exopolyphosphatase [Nucleotide transport and metabolism / Inorganic ion transport and metabolism].	4.80899e-95
NC_023036.2\|WP_023986189.1\|4619655_4620945_-\|phosphopyruvate-hydratase	gnl\|CDD\|234617	PRK00077, eno, enolase; Provisional.	0
NC_023036.2\|WP_019510248.1\|4606728_4607280_+\|TIGR03086-family-protein	gnl\|CDD\|274424	TIGR03086, TIGR03086, TIGR03086 family protein. This family, like pfam07398 and TIGRFAMs family TIGR030834, belongs to the larger set of probable enzymes defined in family TIGR03083. Members are found primarily in the Actinobacteria (Mycobacterium, Streptomyces, etc.). The family is uncharacterized.	3.24592e-16
NC_023036.2\|WP_019510252.1\|4611941_4612979_-\|iron-ABC-transporter-substrate-binding-protein	gnl\|CDD\|270261	cd13543, PBP2_Fbp, Substrate binding domain of ferric iron transporter, a member of the type 2 periplasmic binding fold superfamily. The periplasmic iron binding protein plays an essential role in the iron uptake pathway of Gram-negative pathogenic bacteria from the Pasteurellaceae and Neisseriaceae families and is critical for survival of these pathogens within the host. This periplasmic protein (Fbp) has high affinities for ferric iron and serves as the primary receptor for transport. After binding iron with high affinity, Fbp interacts with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis. The ferric iron-binding proteins belong to the PBP2 superfamily of periplasmic binding proteins that differ in size and ligand specificity, but have similar tertiary structures consisting of two globular subdomains connected by a flexible hinge. They have been shown to bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap.	1.56433e-124
NC_023036.2\|WP_019510245.1\|4603382_4604063_+\|response-regulator	gnl\|CDD\|182522	PRK10529, PRK10529, DNA-binding transcriptional activator KdpE; Provisional.	4.82184e-86
NC_023036.2\|WP_019510250.1\|4609328_4610399_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|226361	COG3842, PotA, ABC-type spermidine/putrescine transport systems, ATPase components [Amino acid transport and metabolism].	4.11405e-112
NC_023036.2\|WP_019511889.1\|4624946_4626416_+\|PepSY-domain-containing-protein	gnl\|CDD\|225723	COG3182, PiuB, Uncharacterized iron-regulated membrane protein [Function unknown].	1.12839e-65
NC_023036.2\|WP_023986190.1\|4622994_4624266_+\|Dyp-type-peroxidase	gnl\|CDD\|273606	TIGR01412, Probable_deferrochelatase/peroxidase_EfeN, Tat-translocated enzyme. This model represents a small family of proteins with a typical Tat (twin-arginine translocation) signal sequence, suggesting that the family is exported in a folded state, perhaps with a bound redox cofactor. Members of this family show homology to Dyp, a dye-decolorizing peroxidase from Geotrichum candidum that lacks any typical heme-binding site.	2.169e-133
NC_023036.2\|WP_045546381.1\|4613112_4615038_-\|cadmium-translocating-P-type-ATPase	gnl\|CDD\|319849	cd07551, P-type_ATPase_HM_ZosA_PfeT-like, P-type heavy metal-transporting ATPase, similar to Bacillus subtilis ZosA/PfeT which transports copper, and perhaps zinc under oxidative stress, and perhaps ferrous iron. Bacillus subtilis ZosA/PfeT (previously known as YkvW) transports copper, it may also transport zinc under oxidative stress and may also be involved in ferrous iron efflux. ZosA/PfeT is expressed under the regulation of the peroxide-sensing repressor PerR. It is involved in competence development. Disruption of the zosA/pfeT gene results in low transformability. This subfamily belongs to the P-type ATPases, a large family of integral membrane transporters that are of critical importance in all kingdoms of life. They generate and maintain (electro-) chemical gradients across cellular membranes, by translocating cations, heavy metals and lipids, and are distinguished from other main classes of transport ATPases (F- , V- , and ABC- type) by the formation of a phosphorylated (P-) intermediate state in the catalytic cycle.	0
NC_023036.2\|WP_023986188.1\|4618938_4619646_-\|septum-formation-initiator-family-protein	gnl\|CDD\|225471	COG2919, COG2919, Septum formation initiator [Cell division and chromosome partitioning].	6.05417e-14
NC_023036.2\|WP_023986186.1\|4615108_4615462_+\|winged-helix-turn-helix-transcriptional-regulator	gnl\|CDD\|238042	cd00090, HTH_ARSR, Arsenical Resistance Operon Repressor and similar prokaryotic, metal regulated homodimeric repressors. ARSR subfamily of helix-turn-helix bacterial transcription regulatory proteins (winged helix topology). Includes several proteins that appear to dissociate from DNA in the presence of metal ions.	6.40582e-16
NC_023036.2\|WP_019511882.1\|4618454_4618946_-\|DUF501-domain-containing-protein	gnl\|CDD\|224424	COG1507, COG1507, Uncharacterized conserved protein [Function unknown].	1.80926e-83
NC_023036.2\|WP_019510251.1\|4610385_4611900_-\|iron-ABC-transporter-permease	gnl\|CDD\|224099	COG1178, ThiP, ABC-type Fe3+ transport system, permease component [Inorganic ion transport and metabolism].	1.85216e-74
NC_023036.2\|WP_031601662.1\|4621068_4621809_-\|lipoprotein	gnl\|CDD\|225501	COG2951, MltB, Membrane-bound lytic murein transglycosylase B [Cell envelope biogenesis, outer membrane].	2.60447e-48
NC_023036.2\|WP_019510247.1\|4605854_4606706_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|197666	smart00342, HTH_ARAC, helix_turn_helix, arabinose operon control protein.	1.70239e-21
NC_023036.2\|WP_081649901.1\|4607361_4609341_+\|propionyl-CoA-synthetase	gnl\|CDD\|341271	cd05967, PrpE, Propionyl-CoA synthetase (PrpE). EC 6.2.1.17: propanoate:CoA ligase (AMP-forming) or propionate#CoA ligase (PrpE) catalyzes the first step of the 2-methylcitric acid cycle for propionate catabolism. It activates propionate to propionyl-CoA in a two-step reaction, which proceeds through a propionyl-AMP intermediate and requires ATP and Mg2+. In Salmonella enterica, the PrpE protein is required for growth of Salmonella enterica on propionate and can substitute for the acetyl-CoA synthetase (Acs) enzyme during growth on acetate. PrpE can also activate acetate, 3HP, and butyrate to their corresponding CoA-thioesters, although with less efficiency.	0
NC_023036.2\|WP_131701285.1\|4616830_4617487_-\|hypothetical-protein	gnl\|CDD\|181433	PRK08455, fliL, flagellar basal body-associated protein FliL; Reviewed.	7.31081e-05
NC_023036.2\|WP_031601661.1\|4600851_4603386_+\|sensor-histidine-kinase-KdpD	gnl\|CDD\|225115	COG2205, KdpD, Osmosensitive K+ channel histidine kinase [Signal transduction mechanisms].	0

>NC_023036.2|WP_023986186.1|4615108_4615462_+|winged-helix-turn-helix-transcriptional-regulator
MGHGVEGRTPPVASLDAAAAVKVAETLQALASPNRLLILTRLRQAPCTVTELSGAVGMEQSAVSNQLRLLRALGLVAGDRAGRNIIYRLYDAHVAQLLDEAVYHIEHLRLGARDDTA
>NC_023036.2|WP_045546381.1|4613112_4615038_-|cadmium-translocating-P-type-ATPase
MIGVERVERSIGAQRRRTAWSLESVRWAVGALMFFLAGLILQLGGAPEMVWWTAYLACYLAGGWQSAVDGLTALRRRRLDVDLLMVLAALGAAAIGQVFDGALLIVIFATSGALEDVATRRTEDSVRALLDLAPERAVRVDRGVETEVPVSELRVGDRILVRPGERVSADATVIEGASDVDQAGITGEPLPVAVHVGDEIFAGTLNGTGALAAEVVRDPSDSVVARIVAMVGQASATKARTQLFIEKIEQRYSMVMVGATLALFTVPLLFGADLRSALLRAMTFMIVASPCALVLATMPPLLSAIATAGRHGVLVKSAVVMERLATVQAVAFDKTGTLTTGRPRVVGEPPETVLALAAAAEQLSEHPLGRAIVAAARERALPIAPVTRFRALPGRGVSALVGGRRVEVVSPAALGGPAPESVAALESAGATAVVVTVDGECAGVIGLRDTVRQSAADVVADLHRCTGRVPLLLTGDNRCAAARLGDELGMEVRAELLPDQKVAAVRARAERVLVVGDGVNDAPAMAAAHVSIAMGRSGSDVTLQTADAITVRDDLATIPAALALARRARRVVFANLVIAASFIAVLVVWDLFWHLPLPLGVAGHEGSTVIVALNGLRLLRDRAWFMAVRQSRGGAESRCRA
>NC_023036.2|WP_019510252.1|4611941_4612979_-|iron-ABC-transporter-substrate-binding-protein
MAAKATALAGAAALAVALTACGSDSGQSDGAQAGASDQLVVYSGRSEDLVGPLLERFTEATGIGVEVRYAGSGELAAQLITEGDASPADVFLSQDAGALGAVSAAGLFAPIEAETLAAVPAAYSAADGTWVGVSGRARVLTYNPELAPTVPDTIDGLLDPQWRGKIGYAPSNASWQSFVTGLRVLRGEQGAKDWLEAFAAQDPRAFEGNGPMRDAINSGELPMGLTNHYYLYELIDSTSADDVVAKNQYMAAGDPGGLVNVAGVGVLKSAPHAEQANEFAAYLVGTAAQEYFATETAEYPLVEGVTPSAALPPLAQLQPPAVDLSQLDDVETTQELLVETGLLTN
>NC_023036.2|WP_019510251.1|4610385_4611900_-|iron-ABC-transporter-permease
MTLVAAAAVVVAGLLLPLWYLAQRANERGLGFVVRELIQPRTAALVGRSALLVVVVTVACVVLGLGFAVLIRRTDIPARRALTIALTLPLAMPSYLLSYLWVSTVPGIAGFWGAALVLTLVSYPLIMMPTLAALARSDPAQEEVARSLGLNGFAVLCRVTLRQARAAIAAGALLVALYVLSDFGAVAAMRYEAFTWVIYGSYRSGFNPARAAVLSLVLLVLAVALVLAEHRARGRAAASRIGSGAPRPAPVNRLGRWTVLAWLPVAVVLTAALIVPFVALGDWLLAGGVRFDAQRWWSALGATVWLSGVAAVVCTAAALPLGVLAARYRTRTTRMLEGAAYLSHGLPSIVVAIAMVSVGVLLLRPIYQREPLLILAYAVLFVPLAVGSIRSAVEAAPIRLEEVARSLGRSPLAAFCTVTARGAAPAVAAGAALVLLTCMKELPVTLLLHPTGTSTLATQLWGHSFVSDYAAAAPYAAALFVFAAIPTAVLGLWSADIGTGDGRD
>NC_023036.2|WP_019510250.1|4609328_4610399_-|ABC-transporter-ATP-binding-protein
MAVTEPATGLPSGIRVEGVTKSFVERTVLDGIDLEVPNGHITAVLGPSGCGKTTLLRIIAGFEEPDRGAVSVGGVPVVGAGTGRRDGSVPAHRRRVGLMPQEGALFPQLSVGRNVTFGLPRARRSDTAIAEHWLGVVGLDGLADARPHQLSGGQQQRVALARALAAEPSVLLLDEPFAALDAGLRVRVREEIATILRATQTTALLVTHDQAEALSLADSVALLIAGRVAQHGPPAQLYDRPVNLEVARFVGGTVELDGDIRGGILTCALGTHRPEVAPADGPVTVVVRPERVHVVDPACGAQAVVSECRFYGAELGVHVVLGDGTALVLRLPATQSCSAGQRVGLAVDGPMLAYPR
>NC_023036.2|WP_081649901.1|4607361_4609341_+|propionyl-CoA-synthetase
MPISSEQAWGYTGPGRGFRPLQPRCNVTQITVLPMSGYRAIFDASISDPETFWADAAKAVTWTREPHRVLDDSNPPFYRWFPDGELNTCANALDRHIDERGDQAALIYDSPVTGTKRTYTYRELLEATARFAGVLKGLGVTKGDRVVIYMPMVPEAVIAMLACARLGAVHSVVFGGFAGHELATRIDDARPTVVVSASCGIEPTRTVEYKPMLDTALELAEHSTPKCVILQREQHPCELVAGRDIDWAEAMATAEPVDPVPVAATDPLYVLYTSGTTGKPKGIVRDNGGHAVALLWTMRNIYDLNPGEVFWAASDVGWVVGHSYIVYAPLLFGATTVLYEGKPVGTPDAGAFWRVAAEHKVKALFTAPTAIRAIKKEDPDARHLGDYDLSGLKYLFQAGERLDPGTYEWASDKLGIPIIDHWWQTETGWAIAADPMGIEQLPVKPGSATVPMPGYDVRVVRPDGSECDAGEEGSIVVKLPLPPGTLPTLWGEDDRFVSSYLRAFDGYYLTGDGGHIDSDGYLFVVGRTDDVINVAGHRMSTGSIEAVLATHPAVAECAVIGVADDLKGQVPRALVVLKSGFSADGLDTELVEAVRNDIGAVASFKLVDVVAALPKTRSGKILRKTMRGIADGKDEPVPSTIEDPSVLEALKQTLRPHLG
>NC_023036.2|WP_019510248.1|4606728_4607280_+|TIGR03086-family-protein
MTDSSVAETYAGLADGMAGVIASVTPQQWDAASACEGWSARDVVAHLIDTQREFFQRHEFPLPTRPDLADPVAAWSAHTAAIGEILADPRVPARTFDGHFGPTTIGETLLRFYGFDLIAHRWDIAAATDSRYRFTDGELDRLEEGIAAFGDALRMEGVCGPAVEVGPDADRQTRVLAVLGRHG
>NC_023036.2|WP_019510247.1|4605854_4606706_-|helix-turn-helix-transcriptional-regulator
MASGLDKPDRPDNTVADEPAHLLDPAHRAAIHIARPAAPTDLDGLVRRFWFPVWRVPAGQTFTQQVLQYPVCLMVITDTYARFYGPASGLAGTPLTGDGWAAGVMFEPAAGTLITGGSVSRWTDTHVDLADQLGAAGAALTEQIRSIMADDPAAPRAQSAAVDCYAAFLRRFGPVDELGRTVNDIVAHIEDNPDVSRVADVCAQFGISERSLQRLTRHRIGLSPKWLVRRRRIQDASWRLRTGATTVAAVAADLGYADEAHLSRDFRRVTGQTPGAFAARYAD
>NC_023036.2|WP_019510245.1|4603382_4604063_+|response-regulator
MTRVLVIDDEPQILRALRINLSVRGYEVHTAATGAEALRAAADHRPDVVILDLGLPDMSGIDVLAGLRGWLTVPVIVLSARTDSSDKVEALDAGADDYVTKPFGMDEFLARLRAAVRRASAAIEDDQPVIETSSFTVDLAAKKVTKSGTEVHLTPTEWGMLEMLVRHRGKLVGREELLKEVWGPAYAKETHYLRVYLAQLRRKLEVDPSRPKHLITEAGMGYRFQE
>NC_023036.2|WP_031601661.1|4600851_4603386_+|sensor-histidine-kinase-KdpD
MGDDGLVTDRPKRGELRIYLGAAPGVGKTYAMLGEAHRRLERGTDLVAAVVETHGRSKTAELLEGIEIIPPRLVEYRGATFGELDVDAVLARRPQVVLVDELAHTNTPGSANPKRWQDIEQLLAAGITVITTVNVQHLESLNDVVAQITGIEQQEKVPDEVVRAADQIELVDITPEALRRRLSHGNVYAPDRIDAALSNYFRRGNLTALRELALLWLADQVDAALAKYRSDNKITATWEARERVVVAVTGDKESETLVRRASRIASKSSAELMIVHVVRGDGLAGVSAPMMGTVRDLAASLGASVHTVVGDDVPAALLDFAREMNATQLVVGTSRRTRWARILDEGIGAAVVQNSGTIDVHMVTHEQTGRATARSGNRNWRQHAASWLAAVVVPTALAAVAVLWLDRYLGVSGESALFFVGVLAVALLGGVAPAALSAVLSGLLINYFLAEPRYTFTISEPDSAITIAVLLMVAVAVAALVDSAAKRAREARRASQEAELLAHFAGSVLRGADPTALLERVREVYSQTAVSLLRERDGETHVVACAGKQPCVDVDSADTAIEVGDDEFWLLMSGRKLPAKDRRVLGAVAKQAAGLVRQRELISEAGRAEAVARADELRRSLLSAVSHDLRTPLAAAKASVSSLRSSDIDFSPEDTAELLATVEESVDQLTALVGNLLDSSRLAAGVVKPELRRVYLEEAVQRALLGISRSSKDSGWDRVKVDVGDAVALADPGLLERVLVNVIDNALRYGGDNPVRVNAGRVGERVLITVADEGPGIPRGAEEQLFAPFQRLGDQDNSTGVGLGLSVASGFVTAMGGTISATDTPGGGLTVVIELAAPQEGPQP
>NC_023036.2|WP_131701285.1|4616830_4617487_-|hypothetical-protein
MSTWNSGGGPPPIVPRPPSRGGPNVALIAGVAAAVLAIGGGVAYFVLSPSDPDEPVGQQTSVSAQSGASEGATTEQDEGDNDRLMKVLPRGYPDGACKPVARLDGALATIACTVNKDPGGPMSATYSLLVDSAALKAAIDNLETTSTVVDCPGRIQSPGPWRHNASLHEVSGTLMCGIQNDNPMLAWTNFDDQMFAVVQGRPAGPTLDNLYAWWSTHS
>NC_023036.2|WP_019511881.1|4617519_4618464_-|Ppx/GppA-family-phosphatase
MGVKVGAIDCGTNSIRLLIAEGGSPGLVDVHREMRIVRLGQGVDATGEFAPEALARTETALADYVALMREHDVARVRMVATSAARDAGNRDEFFAMTARLLGTVSDGAVAEVISGTEEAELSFRGAVGELDSTGAPFIVVDLGGGSTELVLGDGAGVSASFSANIGCVRIKERCLPSDPPPAEEIEAARTVVRAALDEALRAVPVERARTWVGVAGTFTTLAALAHRLPVYDPAAIHLSRTGFGDLSTVCADLLAMTAQERLALGPMHEGRADVIAGGAIVVQELARVMADRAGIDKLVVSEHDILDGIALSIA
>NC_023036.2|WP_019511882.1|4618454_4618946_-|DUF501-domain-containing-protein
MVEQADLDAVARQLGREPRGVLEIAYRCPNGEPAVVKTAPKLPDGTPFPTLYYLTHPALTAAASRLESSGLMREMTERLAEDPEVAAAYRRAHESYLAERDAIESLGTDFTGGGMPDRVKCLHVVIAHSLAKGPGLNPFGDEALAVLAVEPGMAGILDRKVWA
>NC_023036.2|WP_023986188.1|4618938_4619646_-|septum-formation-initiator-family-protein
MPDAKRPDPRRRGPAPRPGKAGGAGRPRASSVRRDPKAREPKAIESSKSRQADGAAGFADDTGGPDTVAEAIRRSVAETADTHSEQRFGSAARRAAILAAVVCVLTLTIAGPVRTYFAQRTEMNQLKMVEAQLRSQIADLEQQKIKLADPVFIAAQARERLGFVMPGDIPYQVQLPPTAAVEPDTGPEAPTAINTDPWYTSLWHTIADQPHGITPAVPPAPPAPGGTPTPVPAGG
>NC_023036.2|WP_023986189.1|4619655_4620945_-|phosphopyruvate-hydratase
MPIIEQVGAREILDSRGNPTVEVEVALIDGTVARAAVPSGASTGEHEAVELRDGGPRYLGKGVEKAVEAVLDEIAPAVIGLSADDQRLVDQALLDLDGTPDKSRLGANAILGLSLAVARAAAESAGLPLFRYVGGPNAHILPVPMMNIINGGAHADTGVDVQEFMIAPIGAPTFKESLRWGAEVYHSLKSVLKKQGLSTGLGDEGGFAPDLPGTKAALDLIGTAIEGAGFKLGTDVALALDVAATEFHTEGKGYAFEKETRTAAQMAEFYAGLLDTYPLVSIEDPLSEDDWDGWVELTTAIGDRVQLVGDDLFVTNPERLEEGIDKGAANALLVKVNQIGTLTETLDAVALAHNSGYRTMMSHRSGETEDTTIADLAVAVGSGQIKTGAPARSERVAKYNQLLRIEEALGDAARYAGDLAFPRFAPASQ
>NC_023036.2|WP_031601662.1|4621068_4621809_-|lipoprotein
MTAFWRARWVRAALVLVAALLLLASSCSWHRGEHIPDGVPPPRGAAVPAIDTNAAGRPADQLRDWAAELAPKTGIPEQALQAYAYAARVAEVVNPKCNLAWPTLAGIGMVESHHGTYKGADIAPNGDVRPPIRGVQLDGTMGNMEILDTDQGLLDGDPTMDRAMGPMQFIPETWRLYGVDANNDGVISPDNFDDAALSAAGYLCWRGKDLSTPRGWMEALRAYNLSNQYARNVRDWATTYADASIS
>NC_023036.2|WP_019511886.1|4622062_4622998_+|EfeM/EfeO-family-lipoprotein
MKRHFAWQLPIAAIALVLSACSNGDSNSATDTSSGGATSGASTSSSAAAAPNPLTEKAAVEYKAYATAQIDELVGAVKVFTDAVRAGDLKAAQEAYAPSRAPWERIEPIAGLVEKIDGKIDARVDDFAGVDDPGFTGWHRLEYLLFEKNTTEGGAPFADQLDADIAELKAQFPAVEVKPVDVATGAAELIEEVSEGKITGEEDRYAKTDLWDFDANVQGARDAIGKLNPALVQADPALLGKIEAGINSVFDTLGPLRRGDGWVLFCTENDPYPSARCPEVTVTPDVIDTLKSELAGLSENLSQVSGVLKLQ
>NC_023036.2|WP_023986190.1|4622994_4624266_+|Dyp-type-peroxidase
MNRPRGISRRGFVAGALGAGAAVGAAGLAGCGQEPAAPPDAARFVEFEGAHQAGITALPIPEQGLIASFNVHAKNRAQLKSTLQELTDEIRGLMAGRPPEQRDPAYPPVDSGILGEHPPPDNLSIVVGVGASLFDGRFGLADRKPRELETMPFLANDRLDPKLSHGDISIIFESGHNDTMQFALRQLMRRTRSDLVLKWMIDGYARGIGAGKAATQDGIQATTPRNLLGFKDGTANLDVSDAAVMDRHVWVGPDDVGPGREPEWTVGGSYQAVRIIRNFVEFWDRTQLVEQEALIGRSKVSGAPLGMAGEFDDPDYADDPDGLRIKLNAHIRLANPRTPQTDENLILRRGFNYSRGFDGAGRLDQGLAFVAYQRSLQKGFLTVQERLKGEPLEEYIMPVGGGFFFVLPGVTGGDRFLGDTLVD
>NC_023036.2|WP_019511888.1|4624299_4624839_+|hypothetical-protein
MSTPTTHAHGVRAVLVGISAAATTVGAHAAAAGTVPHGAALIAALLVCATSGAAAGSLTVSGRYAGVIVPALALGAAQLLSHLVLTVAGGHHGDMGLTPSMIAAHAVAAVLLGFAIAAVEHLYRVCASVLCWLRLFATAHAPAPAHRARRRTDNVVAQSVLLAPGLGMRAPPRGAVATV
>NC_023036.2|WP_019511889.1|4624946_4626416_+|PepSY-domain-containing-protein
MTIPDDTVDIDPTDTTPPSTLAHRRSWRPFVVRLHFYAGILIAPFILIAATTGGLYAMAPTIERIIYADILTVTPAGQALPLAEQVAAAQQAFPALTVTGMRPPAAADASTRVEFADPALDPELLRSVFVDPYTGRVLGDEATWLGYLPVSTWLDGFHRHLQLGEPGRVYSELAASWLWVVALGGLALWLTKAAAQRRRGRPGRILRVDRSSSGRARTMNWHGATGVWLLAGLLFLSATGITWSTYAGEHVTELRSAMDWKRPVLDTTLHPAAAVADGHGDHGGHGEHQGHGQHGADAPGAPAGAIDYEAVLQAAATAGVHQPVELALPTEAGNGVRVAELDKPYRLTTNVAAVDPATNTVSSEIDYWRDYSVVAMLADWGIRGHMGLLFGLANQLILLGVAVALVAVIIGGYRMWWQRRPTRGSGWAVGRPPLRGTWKRLPPWAIGTIVVTAVAIGWFLPLLGLSLAGFVLVDALVGAAKARKENADA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NZ_CP027859	Streptomyces clavuligerus strain ATCC 27064 plasmid pCLA1, complete sequence	44037-44067	5	0.839
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NZ_LR594676	Variovorax sp. PBS-H4 plasmid 2	7664-7694	5	0.839
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NZ_CP032827	Sphingomonas sp. YZ-8 plasmid unnamed2, complete sequence	217701-217731	7	0.774
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NZ_CP026305	Streptomyces lunaelactis strain MM109 plasmid pSLUN1, complete sequence	19046-19076	7	0.774
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	MT521990	Microbacterium phage Bri160, complete genome	13515-13545	8	0.742
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NZ_AP022593	Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence	2326822-2326852	8	0.742
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NC_011368	Rhizobium leguminosarum bv. trifolii WSM2304 plasmid pRLG201, complete sequence	1168981-1169011	8	0.742
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NC_012811	Methylorubrum extorquens AM1 megaplasmid, complete sequence	405481-405511	9	0.71
NC_023036_3	3.1\|4616454\|31\|NC_023036\|CRISPRCasFinder	4616454-4616484	31	NC_010510	Methylobacterium radiotolerans JCM 2831 plasmid pMRAD01, complete sequence	92504-92534	9	0.71

1. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NZ_CP027859 (Streptomyces clavuligerus strain ATCC 27064 plasmid pCLA1, complete sequence) position: , mismatch: 5, identity: 0.839

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
caccgcccccgcgaccgcggcggctcccgcg	Protospacer
*. .******* ******* ***********

2. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NZ_LR594676 (Variovorax sp. PBS-H4 plasmid 2) position: , mismatch: 5, identity: 0.839

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
cgccgaccccgagactgcgccggttcccgcg	Protospacer
** .* *********.*******.*******

3. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NZ_CP032827 (Sphingomonas sp. YZ-8 plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.774

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
aggtgctcccgataccgcgccggctagccag	Protospacer
 *****.***** ************  *  *

4. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NZ_CP026305 (Streptomyces lunaelactis strain MM109 plasmid pSLUN1, complete sequence) position: , mismatch: 7, identity: 0.774

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
cggtgcctccgagaccgccccggagtacggg	Protospacer
*******.********** ****  . ** *

5. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to MT521990 (Microbacterium phage Bri160, complete genome) position: , mismatch: 8, identity: 0.742

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
cgagatccccgagaccgagccggcccccgac	Protospacer
**. ..*********** ******.****

6. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NZ_AP022593 (Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence) position: , mismatch: 8, identity: 0.742

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
gcacgcagccgagcccgcgctggctcccgcg	Protospacer
  ..**  ***** ******.**********

7. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NC_011368 (Rhizobium leguminosarum bv. trifolii WSM2304 plasmid pRLG201, complete sequence) position: , mismatch: 8, identity: 0.742

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
atgtttggccgcgaccgcgccggctgccgcg	Protospacer
  ** .  *** ************* *****

8. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NC_012811 (Methylorubrum extorquens AM1 megaplasmid, complete sequence) position: , mismatch: 9, identity: 0.71

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
accggctcccgagaccgcgccggcgccagga	Protospacer
    **.***************** ** * .

9. spacer 3.1|4616454|31|NC_023036|CRISPRCasFinder matches to NC_010510 (Methylobacterium radiotolerans JCM 2831 plasmid pMRAD01, complete sequence) position: , mismatch: 9, identity: 0.71

cggtgcccccgagaccgcgccggctcccgcg	CRISPR spacer
ctcgaacccccagaccgcgtcggctcccggc	Protospacer
*   . **** ********.*********

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

2150586 : 2157289

Escherichia_phage(16.67%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_019514550.1\|2150586_2151741_-	AAA family ATPase	A0A077SLJ9	Escherichia_phage	1.5e-58	38.8
WP_031601416.1\|2151734_2152763_-	DNA polymerase IV	I6RSM4	Salmonella_phage	4.2e-12	24.1
WP_019514552.1\|2152771_2153380_-	TetR/AcrR family transcriptional regulator	NA	NA	NA	NA
WP_019514553.1\|2153468_2154005_+	NAD(P)H-dependent oxidoreductase	A0A2P0ZL77	Lactobacillus_phage	4.3e-08	32.0
WP_019514554.1\|2154434_2154677_+	glutaredoxin-like protein NrdH	V5UN81	Mycobacterium_phage	3.2e-19	61.8
WP_019514555.1\|2154707_2155154_+	class Ib ribonucleoside-diphosphate reductase assembly flavoprotein NrdI	G3MBF1	Bacillus_virus	5.9e-11	35.0
WP_031601417.1\|2155120_2157289_+	class 1b ribonucleoside-diphosphate reductase subunit alpha	V9VI16	Lactococcus_phage	1.8e-206	50.9

DBSCAN-SWA_2

4030864 : 4081277

Streptomyces_phage(25.0%)

tRNA,transposase,integrase,protease

attL 4068674:4068690|attR 4081587:4081603

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_019513229.1\|4030864_4033516_-\|tRNA	valine--tRNA ligase	A0A1V0SK04	Klosneuvirus	2.5e-141	40.1
WP_019513228.1\|4033587_4034862_-	hypothetical protein	NA	NA	NA	NA
WP_019513227.1\|4034873_4036838_-	S9 family peptidase	NA	NA	NA	NA
WP_023986045.1\|4037678_4039010_+	ammonium transporter	NA	NA	NA	NA
WP_019513225.1\|4039010_4039229_+	hypothetical protein	NA	NA	NA	NA
WP_019513224.1\|4039294_4040272_-	DUF3445 domain-containing protein	NA	NA	NA	NA
WP_019513223.1\|4040280_4041216_-	oxidoreductase	NA	NA	NA	NA
WP_019513222.1\|4041212_4041746_-	hypothetical protein	NA	NA	NA	NA
WP_019513221.1\|4041858_4043013_+	NAD(P)-binding protein	NA	NA	NA	NA
WP_019513220.1\|4043029_4043539_-	transglycosylase family protein	A0A1J0GVU2	Streptomyces_phage	2.3e-27	54.4
WP_019513219.1\|4043751_4044075_-	transglycosylase family protein	A0A1J0GVU2	Streptomyces_phage	2.4e-30	68.0
WP_019513218.1\|4045114_4045684_-	molybdenum cofactor guanylyltransferase	NA	NA	NA	NA
WP_019513217.1\|4045693_4046773_-	2-oxoacid:ferredoxin oxidoreductase subunit beta	NA	NA	NA	NA
WP_019513216.1\|4046769_4048698_-	2-oxoacid:acceptor oxidoreductase subunit alpha	NA	NA	NA	NA
WP_023986048.1\|4049008_4049830_-	carbohydrate kinase	NA	NA	NA	NA
WP_019513214.1\|4049996_4050998_-	LacI family DNA-binding transcriptional regulator	NA	NA	NA	NA
WP_019513213.1\|4051184_4052204_+	Gfo/Idh/MocA family oxidoreductase	NA	NA	NA	NA
WP_023986049.1\|4052206_4053067_+	TIM barrel protein	NA	NA	NA	NA
WP_019513211.1\|4053131_4053605_-	polyketide cyclase	NA	NA	NA	NA
WP_019513210.1\|4053667_4054483_-	sugar ABC transporter ATP-binding protein	G9BWD6	Planktothrix_phage	4.4e-12	30.7
WP_019513209.1\|4054487_4055546_-	ABC transporter permease	NA	NA	NA	NA
WP_023986050.1\|4055566_4056589_-	substrate-binding domain-containing protein	NA	NA	NA	NA
WP_023986051.1\|4056765_4057497_-	GntR family transcriptional regulator	NA	NA	NA	NA
WP_019513206.1\|4057651_4058638_+	5-dehydro-2-deoxygluconokinase	NA	NA	NA	NA
WP_019513205.1\|4058630_4059512_+	hypothetical protein	NA	NA	NA	NA
WP_019513204.1\|4059511_4060381_+	5-deoxy-glucuronate isomerase	NA	NA	NA	NA
WP_023986052.1\|4060383_4062333_+	3D-(3,5/4)-trihydroxycyclohexane-1,2-dione acylhydrolase (decyclizing)	NA	NA	NA	NA
WP_019513202.1\|4062419_4064597_-	glutamine synthetase	NA	NA	NA	NA
WP_023985132.1\|4064948_4066172_+\|transposase	ISL3 family transposase	NA	NA	NA	NA
WP_019511803.1\|4066195_4067836_+	HNH endonuclease	NA	NA	NA	NA
WP_019511802.1\|4067837_4068755_-	LysR family transcriptional regulator	NA	NA	NA	NA
4068674:4068690	attL	NA	NA	NA	NA
WP_019511801.1\|4068838_4071157_+	FdhF/YdeP family oxidoreductase	NA	NA	NA	NA
WP_019511800.1\|4071149_4071998_+	formate dehydrogenase accessory sulfurtransferase FdhD	NA	NA	NA	NA
WP_019511799.1\|4072079_4073360_-\|protease	ATP-dependent Clp protease ATP-binding subunit ClpX	G3M9Z9	Bacillus_virus	1.5e-139	58.6
WP_019511798.1\|4073663_4073966_-	hypothetical protein	NA	NA	NA	NA
WP_019511797.1\|4074119_4074746_-\|protease	ATP-dependent Clp protease proteolytic subunit	NA	NA	NA	NA
WP_019511796.1\|4074742_4075342_-\|protease	ATP-dependent Clp protease proteolytic subunit	A0A223W000	Agrobacterium_phage	8.1e-40	49.1
WP_019511795.1\|4075452_4076958_-	trigger factor	NA	NA	NA	NA
WP_019511794.1\|4077360_4078530_-\|integrase	tyrosine-type recombinase/integrase	A0A1D8EX55	Mycobacterium_phage	7.7e-135	62.9
WP_023986053.1\|4078522_4079116_-	hypothetical protein	NA	NA	NA	NA
WP_019511792.1\|4079222_4079447_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_019511790.1\|4079586_4080213_+	hypothetical protein	NA	NA	NA	NA
WP_081650101.1\|4080362_4081277_+\|integrase	tyrosine-type recombinase/integrase	A0A2D1G8E2	Mycobacterium_phage	5.7e-77	52.6
4081587:4081603	attR	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_023036

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection