CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP016772	Candidatus Planktophila dulcis isolate MMS-IA-53 chromosome, complete genome	4 crisprs	DinG,WYL,cas4,DEDDh,cas3	0	0	3	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP016772_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016772_1

216822-216934

Orphan

Consensus_repeat	Method
AAGAAGTCTGTAGCGAAGAAGAAGAC	CRISPRCasFinder

2 spacers

The CRISPR arrays of NZ_CP016772_1

>merge|NZ_CP016772|1|216822-216934|CRISPRCasFinder
AAGAAGTCAACCGCGAAGAAGTCTCCTGCGAAGAAGACGACCGCTAAGAAGTCTGTAGCGAAGAAGAAGACAACCAAGAAGGTTGTGAAGAAAACTGCAGCGAAGAAGACCAC

>NZ_CP016772|1|1|216822-216934|CRISPRCasFinder
AAGAAGTCAACCGCGAAGAAGTCTCC	TGCGAAGAAGACGACCGCT
AAGAAGTCTGTAGCGAAGAAGAAGAC	AACCAAGAAGGTTGTG
AAGAAAACTGCAGCGAAGAAGACCAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016772.1\|WP_095692163.1\|225033_225360_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|181104
NZ_CP016772.1\|WP_095692164.1\|225524_226748_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|226669
NZ_CP016772.1\|WP_095692165.1\|226747_227497_-\|sugar-ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224053
NZ_CP016772.1\|WP_095692153.1\|212810_213227_+\|M67-family-metallopeptidase	unknown	unknown	gnl\|CDD\|163701
NZ_CP016772.1\|WP_095692161.1\|222410_223172_+\|bacteriorhodopsin	unknown	unknown	gnl\|CDD\|320370
NZ_CP016772.1\|WP_095675771.1\|219405_220251_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095675772.1\|220315_220963_-\|hemolysin-III-family-protein	unknown	unknown	gnl\|CDD\|273425
NZ_CP016772.1\|WP_095675767.1\|214524_215322_+\|glutamate-racemase	unknown	unknown	gnl\|CDD\|234851
NZ_CP016772.1\|WP_095692157.1\|216078_216696_+\|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase	unknown	unknown	gnl\|CDD\|234648
NZ_CP016772.1\|WP_095675763.1\|212195_212786_+\|DUF2017-domain-containing-protein	unknown	unknown	gnl\|CDD\|378185
NZ_CP016772.1\|WP_095692162.1\|223483_224797_-\|bifunctional-o-acetylhomoserine/o-acetylserine-sulfhydrylase	unknown	unknown	gnl\|CDD\|236105
NZ_CP016772.1\|WP_095692159.1\|217654_219400_-\|acyltransferase	unknown	unknown	gnl\|CDD\|224748
NZ_CP016772.1\|WP_095692151.1\|209838_210144_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095692156.1\|215352_216078_+\|ribonuclease-PH	unknown	unknown	gnl\|CDD\|178914
NZ_CP016772.1\|WP_095692152.1\|210136_211906_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|119353
NZ_CP016772.1\|WP_095676812.1\|211905_212199_+\|ATP-dependent-Clp-protease-adapter-ClpS	unknown	unknown	gnl\|CDD\|178809
NZ_CP016772.1\|WP_095692154.1\|213272_213545_+\|MoaD-family-protein	unknown	unknown	gnl\|CDD\|340594
NZ_CP016772.1\|WP_095692160.1\|220972_222184_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|340863
NZ_CP016772.1\|WP_095692949.1\|223265_223487_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095692155.1\|213547_214498_+\|cysteine-synthase	unknown	unknown	gnl\|CDD\|273463

Protein	Function_ID	Function_description	E-value
NZ_CP016772.1\|WP_095692163.1\|225033_225360_-\|hypothetical-protein	gnl\|CDD\|181104	PRK07758, PRK07758, hypothetical protein; Provisional.	9.75579e-10
NZ_CP016772.1\|WP_095692164.1\|225524_226748_-\|ABC-transporter-permease	gnl\|CDD\|226669	COG4214, XylH, ABC-type xylose transport system, permease component [Carbohydrate transport and metabolism].	2.48885e-83
NZ_CP016772.1\|WP_095692165.1\|226747_227497_-\|sugar-ABC-transporter-ATP-binding-protein	gnl\|CDD\|224053	COG1129, MglA, ABC-type sugar transport system, ATPase component [Carbohydrate transport and metabolism].	3.02166e-102
NZ_CP016772.1\|WP_095692153.1\|212810_213227_+\|M67-family-metallopeptidase	gnl\|CDD\|163701	cd08070, MPN_like, Mpr1p, Pad1p N-terminal (MPN) domains with catalytic isopeptidase activity (metal-binding). This family contains archaeal and bacterial MPN (also known as Mov34, PAD-1, JAMM, JAB, MPN+)-like domains. These domains contain the signature JAB1/MPN/Mov34 metalloenzyme (JAMM) motif, EXnHS/THX7SXXD, which is involved in zinc ion coordination and provides the active site for isopeptidase activity for the release of ubiquitin from ubiquitinated proteins (thus having deubiquitinating (DUB) activity) that are tagged for degradation. The JAMM proteins likely hydrolyze ubiquitin conjugates in a manner similar to thermolysin, in which the zinc-polarized aqua ligand serves as the nucleophile, compared with the classical DUBs that do so with a cysteine residue in the active site.	4.08117e-41
NZ_CP016772.1\|WP_095692161.1\|222410_223172_+\|bacteriorhodopsin	gnl\|CDD\|320370	cd15242, 7tm_Proteorhodopsin, green- and blue-light absorbing proteorhodopsins, member of the seven-transmembrane GPCR superfamily. This subgroup represents blue-light absorbing and green-light absorbing proteorhodopsins (PRs), which act as a light-driven proton pump that plays a major role in supplying light energy for phototropic marine microorganisms, by a mechanism similar to that of bacteriorhodopsin. PRs are found in most marine bacteria in surface waters, as well as in archaea and eukaryotes. They belong to the microbial rhodopsin family, also known as type 1 rhodopsins, comprising the light-driven inward chloride pump halorhodopsin (HR), the light-gated cation channel channelrhodopsin (ChR), the light-sensor activating transmembrane transducer protein sensory rhodopsin II (SRII), the light-sensor activating soluble transducer protein Anabaena sensory rhodopsin (ASR), and the other light-driven proton pumps such as bacteriorhodopsin (BR). They have been found in various single-celled microorganisms from all three domains of life, including halophile archaea, gamma-proteobacteria, cyanobacteria, fungi, and green algae. While microbial (type 1) and animal (type 2) rhodopsins have no sequence similarity with each other, they share a common architecture consisting of seven-transmembrane alpha-helices (TM) connected by extracellular loops and intracellular loops. Both types of rhodopsins consist of opsin and a covalently attached retinal (the aldehyde of vitamin A), a photoreactive chromophore, via a protonated Schiff base linkage to an amino group of lysine in the middle of the seventh transmembrane helix (TM7). Upon the absorption of light, microbial rhodopsins undergo light-induced photoisomerization of all-trans retinal into the 13-cis isomer, whereas the photoisomerization of 11-cis retinal to all-trans isomer occurs in the animal rhodopsins. While animal visual rhodopsins are activated by light to catalyze GDP/GTP exchange in the alpha subunit of the retinal G protein transducin (Gt), microbial rhodopsins do not activate G proteins, but instead can function as light-dependent ion pumps, cation channels, and sensors.	2.78238e-100
NZ_CP016772.1\|WP_095675772.1\|220315_220963_-\|hemolysin-III-family-protein	gnl\|CDD\|273425	TIGR01065, Hypothetical_UPF0073_protein_yqfA., channel protein, hemolysin III family. This family includes proteins from pathogenic and non-pathogenic bacteria, Homo sapiens and Drosophila. In Bacillus cereus, a pathogen, it has been show to function as a channel-forming cytolysin. The human protein is expressed preferentially in mature macrophages, consistent with a role cytolytic role.	1.82979e-45
NZ_CP016772.1\|WP_095675767.1\|214524_215322_+\|glutamate-racemase	gnl\|CDD\|234851	PRK00865, PRK00865, glutamate racemase; Provisional.	5.00829e-133
NZ_CP016772.1\|WP_095692157.1\|216078_216696_+\|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase	gnl\|CDD\|234648	PRK00120, PRK00120, dITP/XTP pyrophosphatase; Reviewed.	1.15563e-92
NZ_CP016772.1\|WP_095675763.1\|212195_212786_+\|DUF2017-domain-containing-protein	gnl\|CDD\|378185	pfam09438, DUF2017, Domain of unknown function (DUF2017). This is an alpha-helical domain found in gene neighborhoods that contain genes encoding ubiquitin, cysteine synthases and JAB peptidases.	2.66032e-51
NZ_CP016772.1\|WP_095692162.1\|223483_224797_-\|bifunctional-o-acetylhomoserine/o-acetylserine-sulfhydrylase	gnl\|CDD\|236105	PRK07812, PRK07812, O-acetylhomoserine aminocarboxypropyltransferase; Validated.	0
NZ_CP016772.1\|WP_095692159.1\|217654_219400_-\|acyltransferase	gnl\|CDD\|224748	COG1835, COG1835, Predicted acyltransferases [Lipid metabolism].	5.11015e-57
NZ_CP016772.1\|WP_095692156.1\|215352_216078_+\|ribonuclease-PH	gnl\|CDD\|178914	PRK00173, rph, ribonuclease PH; Reviewed.	1.93517e-167
NZ_CP016772.1\|WP_095692152.1\|210136_211906_+\|hypothetical-protein	gnl\|CDD\|119353	cd02874, GH18_CFLE_spore_hydrolase, Cortical fragment-lytic enzyme (CFLE) is a peptidoglycan hydrolase involved in bacterial endospore germination. CFLE is expressed as an inactive preprotein (called SleB) in the forespore compartment of sporulating cells. SleB translocates across the forespore inner membrane and is deposited as a mature enzyme in the cortex layer of the spore. As part of a sensory mechanism capable of initiating germination, CFLE degrades a spore-specific peptidoglycan constituent called muramic-acid delta-lactam that comprises the outer cortex. CFLE has a C-terminal glycosyl hydrolase family 18 (GH18) catalytic domain as well as two N-terminal LysM peptidoglycan-binding domains. In addition to SleB, this family includes YaaH, YdhD, and YvbX from Bacillus subtilis.	8.75201e-53
NZ_CP016772.1\|WP_095676812.1\|211905_212199_+\|ATP-dependent-Clp-protease-adapter-ClpS	gnl\|CDD\|178809	PRK00033, clpS, ATP-dependent Clp protease adaptor protein ClpS; Reviewed.	1.26779e-37
NZ_CP016772.1\|WP_095692154.1\|213272_213545_+\|MoaD-family-protein	gnl\|CDD\|340594	cd17074, Ubl_CysO_like, ubiquitin-like (Ubl) domain found in Mycobacterium tuberculosis CysO and similar proteins. CysO, also termed 9.5 kDa culture filtrate antigen cfp10A, together with CysM (Cysteine synthase M), forms a protein complex CysM-CysO that represents a new cysteine biosynthetic pathway in Mycobacterium tuberculosis. The replacement of the acetyl group of O-acetylserine by CysO thiocarboxylate to generate a protein-bound cysteine is catalyzed by CysM in a pyridoxal 5?-phosphate (PLP)-dependent manner. The family also includes QbsE that functions as the sulfide donor for the biosynthesis of thioquinolobactin in Pseudomonas fluorescens. A JAMM motif protein QbsD catalyzes removal of the carboxy-terminal dipeptide from QbsE. Both CysO and QbsE are similar to prokaryotic sulfur carrier proteins such as ThiS and MoaD, containing the beta-grasp ubiquitin-like fold.	1.29169e-41
NZ_CP016772.1\|WP_095692160.1\|220972_222184_-\|MFS-transporter	gnl\|CDD\|340863	cd06173, MFS_MefA_like, Macrolide efflux protein A and similar proteins of the Major Facilitator Superfamily of transporters. This family is composed of Streptococcus pyogenes macrolide efflux protein A (MefA) and similar transporters, many of which remain uncharacterized. Some members may be multidrug resistance (MDR) transporters, which are drug/H+ antiporters (DHAs) that mediate the efflux of a variety of drugs and toxic compounds, conferring resistance to these compounds. MefA confers resistance to 14-membered macrolides including erythromycin and to 15-membered macrolides. It functions as an efflux pump to regulate intracellular macrolide levels. The MefA-like family belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	2.44725e-50
NZ_CP016772.1\|WP_095692155.1\|213547_214498_+\|cysteine-synthase	gnl\|CDD\|273463	TIGR01136, Cysteine_synthase, cysteine synthase. This model discriminates cysteine synthases (EC 2.5.1.47) (both CysK and CysM) from cystathionine beta-synthase, a protein found primarily in eukaryotes and carrying a C-terminal CBS domain lacking from this protein. Bacterial proteins lacking the CBS domain but otherwise showing resemblamnce to cystathionine beta-synthases and considerable phylogenetic distance from known cysteine synthases were excluded from the seed and score below the trusted cutoff. [Amino acid biosynthesis, Serine family].	1.2887e-132

>NZ_CP016772.1|WP_095692157.1|216078_216696_+|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase
MSHKLLLATRNKGKIEEFRRILDAVAPGEIDLVGLDQFPELHDVVEDGATFEENALKKAREMSLAVGIPAIADDSGLCVDALKGDPGIFSARWAGSHGDDAANTAKVLQQLSDIPDEKRSAHFTCVAALYLPDGRSHCEEAHFDGWILRAPIGEHGFGYDPIFRPDGLELSSAQMSAEDKDAISHRGKSLRAIAPHVITLLKTLG
>NZ_CP016772.1|WP_095692156.1|215352_216078_+|ribonuclease-PH
MARNDGRTVDQLRDIKITRGWLDHAEGSVLVEFGKTRVLCVASFTPGVPRWLKDSGTGWVTSEYAMLPRATHTRSDRESVKGKLGGRTQEISRLVGRSLRGIVDMKELGENTIVIDCDVLQADGGTRTAAITGAYVALADAISWAQKQGHIKANAKPLADSVAAISVGIIDGVPMLDLCYEEDVRAETDMNVVCSGDGRFIEVQGTAEGAPFDRVLLDSLLDLAVAGCATLTELQKQALAK
>NZ_CP016772.1|WP_095675767.1|214524_215322_+|glutamate-racemase
MSNAPIGIFDSGVGGLTVARAILDQLPNESTLYIGDTARGPYGPRSLAEVRDFSLETLDFLVDQGVKALVIACNTASAAMLRDARERYSVPVIEVIQPAVRRAVAATRTGKVGVIGTRATIDSKAYLDAFAAAPQLKISSIACPLFVEYVERGETSGDAITKVAREYLQPMIDAEVDTLVLGCTHYPLLTGVISYVMGNDVSLVSSAEETAKDLYRVLVENSLLRGPSSTPASHKFLSTGDSKAFEVLARRFLGPEVGSVQHQVL
>NZ_CP016772.1|WP_095692155.1|213547_214498_+|cysteine-synthase
MARYDSLESSVGNTPLIGLPRLSPAPNVRLWAKMEDRNPTGSIKDRTAISMIEAAERDGLLKPGSTILEPTSGNTGISLAMASKVRGYKLICVMPENTSPERRQLLEMWGAEIISSPAAGGSNEAVRVAKEIAEKNPDYVFLYQYGNPANTEAHYKNTGPEIFTDLPTITHFVAGLGTTGTLMGAGRYLREQNPDIQIIAAEPRYGELVYGLRNIDEGFVPELYDATVLTRRFSVGAEDSVKRVRELLEVEGIFAGISTGAILHAAIAMGNEALRDGRDADIAFIVCDAGWKYLSTGIYGSQIAEATEGLDGTLWA
>NZ_CP016772.1|WP_095692154.1|213272_213545_+|MoaD-family-protein
MSIEVRIPTILRPYTKDQKSVEAAGATLSAVITDLDANYAGLGERLLENGALRRFINVYVNDEDVRFLGGLDAQLKDGDSITILPAVAGG
>NZ_CP016772.1|WP_095692153.1|212810_213227_+|M67-family-metallopeptidase
MTLEISQAFVDAILEQSRVEYPDECCGVILGPAGSGKALRHKPMINAAHSPTFYEFDPKDLLALYREADDNDEEIVVIYHSHTETEAYPSRTDIAYAGEPGAHYVLVSTRKEIAPATEFRSFRIVDGVVTEELVTISG
>NZ_CP016772.1|WP_095675763.1|212195_212786_+|DUF2017-domain-containing-protein
MTATEGFSRHGDHSYVATFADSEKEVLLNLCEQIIELLAERQDHGHEDPLAAMVGITSHDSPPEDEVLHRLLPNAYADEVDASEFRRYTESTLRQKKQAHAISMRIHLKSSDDGTIDLDHDNANAWLGGINDIRLALGVRLKVENNSHEELELLSPDDPLRGVYAVYTWLGWLQETLLSALIDDADEDEESQLGSS
>NZ_CP016772.1|WP_095676812.1|211905_212199_+|ATP-dependent-Clp-protease-adapter-ClpS
MVKTADKIEEEIRAIFSSDTPWVTVVWDDPVNLQTYVVYVFMELFGYSKARATELMLQVHNEGKAIVSTGSREEMEHDVARLHEYGLWATIQRGDQL
>NZ_CP016772.1|WP_095692152.1|210136_211906_+|hypothetical-protein
MVKTQRKFIGVVAVATLFLSLISTPISAADNPPRKIMTGWVPYYSMKTALPDVLNNIDLIKEVMPFWYTLKFDGKAKAAVVTDLYAPANPSVPISEPLTAMRNAGLSIIPTITDGTSKLVLAGLLKNPTSRTQVVSAIMNLVRANNYDGIDIDFEGFAFVDGNSTWTSTAPSWVAFIKELSIALRAEKKLLSVSTPYVLNPNEAQKGYFVYAWAAIASSIDKLRIMTYDYSVSKVGPMGPITWAERTVQYAVSVMPASKVFVGVPGYGRDWVTAVTGVCPANVVNSVKPGAKAATFVMRDAVALAATYGTVPRYDEKFGEMTFSYQKVYNGTTATGLATSCTASRTAWYQDARGWALRAALVTKYRIGGITAWTFGMEEPLAMESIRQVAKEIAPDQVAVTAAIDNSTIDYGNPITVTAAFTIKDKSPVVGVPVRIEGKSAGDTNWRTLATVTTGIDGKIEKAVLVGKSTAVRVYSDSTWERTEGASSEFPIVVNRLLVISAPGTAKSSVATVITGNIRPRIAGASVQLEKLVGKEWKPLDVAVLTDAQGNFSLNLSGQTRGVSSLRISVAADSLWSAVLSPIFNIIVR
>NZ_CP016772.1|WP_095692151.1|209838_210144_+|hypothetical-protein
MESLALIVSLMIGNILFSGPFALLLTLPRIRAISTGIPFLIFRRLAMGTAALTGIFLSVIFLFNDLQLIVKALSLLCIGTHLWAADREYGKFISSRLRRNG
>NZ_CP016772.1|WP_095692159.1|217654_219400_-|acyltransferase
MAASRGIQYIPAIDGLRAVAVIAVMFYHLGFTWIPGGFLGVDLFFVISGYVITRLLLDSIEQSGGLDLRGFYIARARRLLPALVFMLVSTTIAIGIWAPDAIKRLLIDTPFSLTGTMNWWLVARHQDYFESIGRPPLLQHTWSLAVEAQFYLVWPLILYFILKQFGKKHIPLASLAIAAASGITLLLVSFSLDASNASKVSHVYFGTDTHSIGLFLGAALAVSWIPQNFTKTVSRKAQDFIDGVGFLGFIGILAAFLLIDENQPTLYKIAFPLAGLCGAAIIMSVVHPASRFAPVLQNPIFLWIGERSYAIYLWHWVIFQVTRPSVDLAGKEWALYSLRILIVLALSDISLRYVELPIRRGVIQYWWKGLKYRTKKERSQQTRTFSIITVIVLLLASVVSVRAIGIANDQRQRLEDSLTATPTANTEVVKDGLWVTGDSVILGIRSKLGESHPISIMNARIGRQAPELLSVMLQDKKEAANVPVIFNLGNNNALTREQTVAIFEAVKDQPRIIVVNTAVPRPWREGNNSLIAEVASKYANVIIVDWNAISEGRPEYFAPDGVHLVPTGVDVYVAEILKHLD
>NZ_CP016772.1|WP_095675771.1|219405_220251_-|hypothetical-protein
MAEKNFRNWVGFREEADRAPVANPVDRIRELESQLADLKSRRDITGLSREEFEILATETAMAMIKSAQAREAKATAAADRVINETNRTAKDTLEGAENKARSILAGAESRGRKYISTAEAEASEIVRDAGREATAVANAKIAEADSAVDAKRRDAAALTTAARREAERVISEAADNVVEYRTWLSDIIAESERLYRSQATALSAAESAIAASREKLDSAFARLTKMQQVVDNSLNEDGTVKKSAPIRVESKRTRAAIAAPKKTSKAPAKKIAPKKKPAKRK
>NZ_CP016772.1|WP_095675772.1|220315_220963_-|hemolysin-III-family-protein
MSTEPIQSPPKLRGWFHLAATPLVIIASLVLFILSGESLKWAVALYSITAIMLFSVSAIYHRVPWIPRKKKIWRRWDHANINLLIAGSYTPFAVALLDDRDRNVLLAIVWTGALLGVALRVFWVNAPRFLYVANYLLLGWVAIIYTPQLYKEGGLWVILPIIIGGLLYSIGAIFYALKRPGRNAKYFGFHELFHIFVLAAWISQYLAVSFAIYRK
>NZ_CP016772.1|WP_095692160.1|220972_222184_-|MFS-transporter
MLTQLKDLKAYHGFTGLAISRFISNVGNGVSPIALAYGVLSLPGSTGKDLSIVMAARFVPLLAFMLFGGVLADRFQRNRLVGGSDMIGSFLAAVSAISLIAGFSSTWLLALMGALFGILNAIWWPAMSGVLPEILPKEKLQEGNAVIGLLTNFGYIVGTLGGGILVSTVGAGWGLLVDAISFFIAGVIVWYLPIIGKIKDKSPGIIHDLAVGWKEFISRSWVIAMVVAFALINMAFESMLSVLGPLNFSDPISGPKQWSYNLAGLSVGMLIGGIWVLKVKIGRPLFLAMILVSLSAVWDFALAFDVPMFFSVIAAVISGISLEVFMVTWNTSLQSHVPEESYSRVSSYDTLGSFGIAPLGIVIAGPLAMHFGVNTILIVTGVTTLIAAVASLLVPSVRNLRND
>NZ_CP016772.1|WP_095692161.1|222410_223172_+|bacteriorhodopsin
MSVTLDSNQWNLVYNIFSFGLISMLACTVYTLVSQSRVLPKYRNALVMSSMVTFIAGYHYFRIFNSFDEASEGMVVNVSGEQGAFNEAYRYVDWLLTVPLLLVEVIAVLALAKEVSKSLIMRLVPASAAMIALGYPGEITSDKNTAILYGVLSTIPFLYILYVLFVELGKSLERQPAGVAETIGRLRLLLIATWGVYPISYILGMNGDPTASSFVGVQVGYTIADVLAKCVFGLTILKIARMKSHAEGMAADH
>NZ_CP016772.1|WP_095692949.1|223265_223487_+|hypothetical-protein
MGGYLLLAVGLINLRYQTGKSDVLNHSLILIIPGAILLGLTFISAGKKWLNTKAATAMVIACGGLLLIYSFIN
>NZ_CP016772.1|WP_095692162.1|223483_224797_-|bifunctional-o-acetylhomoserine/o-acetylserine-sulfhydrylase
MTNNWSFETLQIHAGQTADPTTGARALPLYQTTAYQFRDTTHAANLFGLAELGNIYTRIMNPTQDAVEQRLAALEGGVAALLLASGSAATTFAVMNVAEAGDHIVSSPSLYGGTYNLFHYTLPKFGIEVTFVDDPNNPESWKKAVKPNTKAFFGETIANPKNEILDIKAIADVAHSVGVPLIVDNTVATPYLIKPIDFGADVVVHSATKFLSGHGNAVVGAIIDAGKFDYAQHQDRFPGFNKPDPSYHGLVFSQALGVGSAFGANLSYIFKIRLQLLRDIGAAVSPFNAWLLAQGLETLSLRMDRHIENAKAVATWLEAHPDVEKVNYAALKSSPWNALAAKYAPKGPGAVLSFELKGGVEAGKKFVESLKLFSHVANIGDVRSLVIHPATTTHSQLSPAEQLEAGVTPGLVRLSLGLENIQDIKADLEDGFTAARG
>NZ_CP016772.1|WP_095692163.1|225033_225360_-|hypothetical-protein
MAKQSPAKIKKLRGEAMRAAAARKAARAVSASTHSEVDLGAYAGVDGPWRELGLAAPARRALIDEGYYKLSDLRKVSLDAIKDLHGMGPNAIRILTTAMKKADLSFRK
>NZ_CP016772.1|WP_095692164.1|225524_226748_-|ABC-transporter-permease
MSTQATLEKETLKGATSNYLSRVKSGDIGSLPAVLGLISLIAVFGAMSEFFLTNRNFANLLTQAAPVMVIAMGLVFVLLLGEIDLSAGYASGVCGAVLVLLVTNEGWSWYTALGASIAVGALLGVLIGTLVSRLGIPSFVVTLAAFLAFQGVLLLLAGEGGTIPIADKTILAVENSNMTPMQGWILWAVSSAAYVLGGLRRINSRRKAGLVVELTQLWAMKTIALLIITGGAVYQLNQERGLSATNSTKGVPIVAPLILVILIAGTFLLSRTAFGRHIYAVGGNAEAARRAGINVKRVRTIAFVLCSALAAVAGMLFASRMNSISPSTGGSSTLLYAVGAAVIGGVSLFGGKGRMRDAILGGFVVAVIDNGMGLLGYGAGIQYLVTGAVLLVSAGVDAVSRRGALTN
>NZ_CP016772.1|WP_095692165.1|226747_227497_-|sugar-ABC-transporter-ATP-binding-protein
MSTPLLSLKGINKSFGPVHVLKDVNFDVYPGQVTALVGDNGAGKSTLIKCIAGIYTPESGEFLFEGKNVTIDGPRAATALGIEIVYQDLALCDNLDIVHNMFLGREEKKGITLNETSMESLARKTLDGLNVRTVKSIRQTVSSLSGGQRQTVAIARAVLWNSKVVVLDEPTAALGVAQTEQVLNLVRRLADKGLAVVLISHNLIDIFQVADNIAALYLGNMASQVKKSDVTTNQVIELITTGKSEGVTK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP016772_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016772_2

321039-321178

Orphan

Consensus_repeat	Method
GTTTGGTAGTAATCGGGACTTGGTTAATAACCAGGTCCCTTTTGCTTTCC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP016772_2

>merge|NZ_CP016772|2|321039-321178|CRISPRCasFinder
GTTTGGTAGTAATCGGGACTTGGTTAATAACCAGGTCCCTTTTGCTTTCCCGCACCGCTTAATTAAATATGCAATAATTGGACTCCGCTTGTTTGGTAGTAATCGGGACTTGGTTAATAACCAGGTCCCTTTTGCTTTCC

>NZ_CP016772|2|2|321039-321178|CRISPRCasFinder
GTTTGGTAGTAATCGGGACTTGGTTAATAACCAGGTCCCTTTTGCTTTCC	CGCACCGCTTAATTAAATATGCAATAATTGGACTCCGCTT
GTTTGGTAGTAATCGGGACTTGGTTAATAACCAGGTCCCTTTTGCTTTCC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016772.1\|WP_095692242.1\|325581_326658_-\|transaldolase-family-protein	unknown	unknown	gnl\|CDD\|376418
NZ_CP016772.1\|WP_095675841.1\|319823_320492_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095675851.1\|329501_330422_-\|5-deoxy-glucuronate-isomerase	unknown	unknown	gnl\|CDD\|377429
NZ_CP016772.1\|WP_095692245.1\|330430_331921_-\|CoA-acylating-methylmalonate-semialdehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|143404
NZ_CP016772.1\|WP_095692233.1\|317380_317992_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095692241.1\|324549_325572_-\|Gfo/Idh/MocA-family-oxidoreductase	unknown	unknown	gnl\|CDD\|223745
NZ_CP016772.1\|WP_095692238.1\|321465_321954_+\|SRPBCC-family-protein	unknown	unknown	gnl\|CDD\|176867
NZ_CP016772.1\|WP_190283231.1\|322601_323552_-\|DMT-family-transporter	unknown	unknown	gnl\|CDD\|223769
NZ_CP016772.1\|WP_095692235.1\|318448_318949_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095692232.1\|316826_317369_+\|DUF305-domain-containing-protein	unknown	unknown	gnl\|CDD\|367619
NZ_CP016772.1\|WP_095692231.1\|313525_316213_+\|pyruvate,-phosphate-dikinase	unknown	unknown	gnl\|CDD\|236446
NZ_CP016772.1\|WP_095692243.1\|326662_327577_-\|TIM-barrel-protein	unknown	unknown	gnl\|CDD\|275172
NZ_CP016772.1\|WP_095692234.1\|318001_318415_+\|Rieske-2Fe-2S-domain-containing-protein	unknown	unknown	gnl\|CDD\|223795
NZ_CP016772.1\|WP_095675846.1\|323505_324513_-\|Gfo/Idh/MocA-family-oxidoreductase	unknown	unknown	gnl\|CDD\|275173
NZ_CP016772.1\|WP_095692239.1\|322139_322463_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|226318
NZ_CP016772.1\|WP_095692230.1\|312719_313478_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|212491
NZ_CP016772.1\|WP_095692244.1\|327586_329500_-\|3D-(3,5/4)-trihydroxycyclohexane-1,2-dione-acylhydrolase-(decyclizing)	unknown	unknown	gnl\|CDD\|275170
NZ_CP016772.1\|WP_095692229.1\|311101_312730_+\|D-aminoacylase	unknown	unknown	gnl\|CDD\|238622
NZ_CP016772.1\|WP_095692236.1\|319164_319644_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095692237.1\|320500_320950_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_CP016772.1\|WP_095692242.1\|325581_326658_-\|transaldolase-family-protein	gnl\|CDD\|376418	pfam00923, TAL_FSA, Transaldolase/Fructose-6-phosphate aldolase. Transaldolase (TAL) is an enzyme of the pentose phosphate pathway (PPP) found almost ubiquitously in the three domains of life (Archaea, Bacteria, and Eukarya). TAL shares a high degree of structural similarity and sequence identity with fructose-6-phosphate aldolase (FSA). They both belong to the class I aldolase family. Their protein structures have been revealed.	5.50813e-35
NZ_CP016772.1\|WP_095675851.1\|329501_330422_-\|5-deoxy-glucuronate-isomerase	gnl\|CDD\|377429	pfam04962, KduI, KduI/IolB family. This family includes the 5-keto 4-deoxyuronate isomerase enzyme EC:5.3.1.17 that is involved in pectin degradation. This family aldo includes bacterial Myo-inositol catabolism (IolB) proteins. The Bacillus subtilis inositol operon (iolABCDEFGHIJ) is involved in myo-inositol catabolism. Glucose repression of the iol operon induced by inositol is exerted through catabolite repression mediated by CcpA and the iol induction system mediated by IolR. The exact function of IolB is unknown. Members of this family possess a Cupin like structure.	4.88381e-82
NZ_CP016772.1\|WP_095692245.1\|330430_331921_-\|CoA-acylating-methylmalonate-semialdehyde-dehydrogenase	gnl\|CDD\|143404	cd07085, ALDH_F6_MMSDH, Methylmalonate semialdehyde dehydrogenase and ALDH family members 6A1 and 6B2. Methylmalonate semialdehyde dehydrogenase (MMSDH, EC=1.2.1.27) [acylating] from Bacillus subtilis is involved in valine metabolism and catalyses the NAD+- and CoA-dependent oxidation of methylmalonate semialdehyde into propionyl-CoA. Mitochondrial human MMSDH ALDH6A1 and Arabidopsis MMSDH ALDH6B2 are also present in this CD.	0
NZ_CP016772.1\|WP_095692244.1\|327586_329500_-\|3D-(3,5/4)-trihydroxycyclohexane-1,2-dione-acylhydrolase-(decyclizing)	gnl\|CDD\|275170	TIGR04377, 3D-35/4-trihydroxycyclohexane-12-dione_hydrolase, 3,5/4-trihydroxycyclohexa-1,2-dione hydrolase. Members of this protein family, 3,5/4-trihydroxycyclohexa-1,2-dione hydrolase (iolD), represent one of eight enzymes in a pathway converting myo-inositol to acetyl-CoA. IolD hydrolyzes the cyclic molecule 3D-(3,5/4)-trihydroxycyclohexane-1,2-dione to yield 5-deoxy-D-glucuronic acid. TPP is a cofactor. [Energy metabolism, Sugars].	0
NZ_CP016772.1\|WP_095692238.1\|321465_321954_+\|SRPBCC-family-protein	gnl\|CDD\|176867	cd07825, SRPBCC_7, Ligand-binding SRPBCC domain of an uncharacterized subfamily of proteins. Uncharacterized group of the SRPBCC (START/RHO_alpha_C/PITP/Bet_v1/CoxG/CalC) domain superfamily. SRPBCC domains have a deep hydrophobic ligand-binding pocket and they bind diverse ligands. SRPBCC domains include the steroidogenic acute regulatory protein (StAR)-related lipid transfer (START) domains of mammalian STARD1-STARD15, the C-terminal catalytic domains of the alpha oxygenase subunit of Rieske-type non-heme iron aromatic ring-hydroxylating oxygenases (RHOs_alpha_C), Class I and II phosphatidylinositol transfer proteins (PITPs), Bet v 1 (the major pollen allergen of white birch, Betula verrucosa), CoxG, CalC, and related proteins. Other members of the superfamily include PYR/PYL/RCAR plant proteins, the aromatase/cyclase (ARO/CYC) domains of proteins such as Streptomyces glaucescens tetracenomycin, and the SRPBCC domains of Streptococcus mutans Smu.440 and related proteins.	4.88906e-39
NZ_CP016772.1\|WP_190283231.1\|322601_323552_-\|DMT-family-transporter	gnl\|CDD\|223769	COG0697, RhaT, Permeases of the drug/metabolite transporter (DMT) superfamily [Carbohydrate transport and metabolism / Amino acid transport and metabolism / General function prediction only].	3.16272e-10
NZ_CP016772.1\|WP_095692241.1\|324549_325572_-\|Gfo/Idh/MocA-family-oxidoreductase	gnl\|CDD\|223745	COG0673, MviM, Predicted dehydrogenases and related proteins [General function prediction only].	4.54973e-57
NZ_CP016772.1\|WP_095692232.1\|316826_317369_+\|DUF305-domain-containing-protein	gnl\|CDD\|367619	pfam03713, DUF305, Domain of unknown function (DUF305). Domain found in small family of bacterial secreted proteins with no known function. Also found in Paramecium bursaria chlorella virus 1. This domain is short and found in one or two copies. The domain has a conserved HH motif that may be functionally important. This domain belongs to the ferritin superfamily. It contains two sequence similar repeats each of which is composed of two alpha helices.	6.02266e-37
NZ_CP016772.1\|WP_095692231.1\|313525_316213_+\|pyruvate,-phosphate-dikinase	gnl\|CDD\|236446	PRK09279, PRK09279, pyruvate phosphate dikinase; Provisional.	0
NZ_CP016772.1\|WP_095692243.1\|326662_327577_-\|TIM-barrel-protein	gnl\|CDD\|275172	TIGR04379, myo-inositol_catabolism_protein, myo-inosose-2 dehydratase. Members of this family include the enzyme myo-inosose-2 dehydratase, product of the gene iolE, as found in inositol utilization cassettes in many species. [Energy metabolism, Sugars].	1.4736e-35
NZ_CP016772.1\|WP_095692234.1\|318001_318415_+\|Rieske-2Fe-2S-domain-containing-protein	gnl\|CDD\|223795	COG0723, QcrA, Rieske Fe-S protein [Energy production and conversion].	4.82239e-10
NZ_CP016772.1\|WP_095675846.1\|323505_324513_-\|Gfo/Idh/MocA-family-oxidoreductase	gnl\|CDD\|275173	TIGR04380, hypothetical_protein_HOLDEFILI_04020, inositol 2-dehydrogenase. All members of the seed alignment for this model are known or predicted inositol 2-dehydrogenase sequences co-clustered with other enzymes for catabolism of myo-inositol or closely related compounds. Inositol 2-dehydrogenase catalyzes the first step in inositol catabolism. Members of this family may vary somewhat in their ranges of acceptable substrates and some may act on analogs to myo-inositol rather than myo-inositol per se. [Energy metabolism, Sugars].	1.0527e-121
NZ_CP016772.1\|WP_095692230.1\|312719_313478_+\|SDR-family-oxidoreductase	gnl\|CDD\|212491	cd05233, SDR_c, classical (c) SDRs. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human prostaglandin dehydrogenase (PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, PGDH numbering) and/or an Asn (Asn-107, PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	1.46456e-60
NZ_CP016772.1\|WP_095692239.1\|322139_322463_+\|hypothetical-protein	gnl\|CDD\|226318	COG3795, COG3795, Uncharacterized protein conserved in bacteria [Function unknown].	6.38129e-09
NZ_CP016772.1\|WP_095692229.1\|311101_312730_+\|D-aminoacylase	gnl\|CDD\|238622	cd01297, D-aminoacylase, D-aminoacylases (N-acyl-D-Amino acid amidohydrolases) catalyze the hydrolysis of N-acyl-D-amino acids to produce the corresponding D-amino acids, which are used as intermediates in the synthesis of pesticides, bioactive peptides, and antibiotics.	1.59103e-88

>NZ_CP016772.1|WP_095692237.1|320500_320950_+|hypothetical-protein
MKFDIKQVFPENPSKFEGFRIIRLIAALYMSVMVARSCIHLFAPDGGAQSIAGIDTSVEGGDNIIAIFHQWGAIQLILAILLFVLFFRYPGLTPLILLTLTLDPVLRFVAGQQMSLTTTGTPPGEALNGVSLYLLLVLFLGSLWNKKPN
>NZ_CP016772.1|WP_095675841.1|319823_320492_+|hypothetical-protein
MKIKSVAISATAFVLLGGVLGVQQYISSQITSKVQREMPNASGISASVPLADVPSNLTSDLIKSADINIKSFALKESGTKTSLNISASSISKAKPTLVGSLEITATIPASTITKSSEFNDAQIVGNTLQVSAGAGGMGTAILIPKYSNSQLYFELQSVSILGNQIPASSLPSDLQNQIKSRSQRSLTPPKGLKVKSVSLSSKGLSVKMFGNNIQLGNLGSGL
>NZ_CP016772.1|WP_095692236.1|319164_319644_+|hypothetical-protein
MKRLKFGFIPVLLLLLASCSNDSQAMVEVNLAPVPYSIQVPAEIAKHLSVENMVTTTPNEFTNQAREAGAIAQVYINYREDDGTTHGFAGVYYFKKADFEKAGNPNEPPVYGSKVLEEKSMVLAIAGPQDSIFDPNSQDGKKSMALYTLVYDPRSFKSS
>NZ_CP016772.1|WP_095692235.1|318448_318949_+|hypothetical-protein
MRKFLIVTIVSTLIIIVTYFLPSGVWAEFGGLPAHPLIIHGVVVLLPLLAIFLLVGLFWKNLLKKLHLPLIGMLALSVVGVLAAKSSGYSLSAVVGLPRSHAQWGNYLVLLAIALVSSFVLFSYFSFYKKSKIASSSLGVLMAFLAVSAIGMTYVVGHSGAESVWK
>NZ_CP016772.1|WP_095692234.1|318001_318415_+|Rieske-2Fe-2S-domain-containing-protein
MEPISRRSFIAGVCAVVALGGSEVPAAANTSVKKLPGGRLSVDLKAVPALAKVGGATRIGSVKGVPVAIARTGTSKYIAFNLLCPHQKVTVTQNEKGWVCNAHGSEFESDGDLALGPATTGLARVPMKISKGLATIG
>NZ_CP016772.1|WP_095692233.1|317380_317992_+|hypothetical-protein
MRKVLVSIVTIIGLVVSSNVAFADSAKPGQSMTHMKTAAGVASTLEAAGVILYVQGGATSAVIGENVSAATSQVVFHIPVTANKAGVQHIGSNIIFFNTANNQYLTLKNPVIDLAKGVVSATVPQAGDAKVDILTITNASTAKPKITNDKKTKQRTTAYTGTTLVLAPGVAATIASVLGLPAGSLPDGLAFGTADVTLYSKLK
>NZ_CP016772.1|WP_095692232.1|316826_317369_+|DUF305-domain-containing-protein
MLKKIIVSLLAIGIILVPNSANASSHAKSLQNLGMSEIMFAQMMIPHHEQAISMSETALKKSRNQEILKLSRQIKTLQSSETSQLTYWLKATNSSMTMDHDMKMSGMLTVKEFASLKQLTGTQFDRTFLQLMIKHHQGALEMLDLISGSRNAEAKALAKAINSAQSKEISSMKLLLKKLK
>NZ_CP016772.1|WP_095692231.1|313525_316213_+|pyruvate,-phosphate-dikinase
MTTQFVYSFSEGSKELKDLLGGKGANLAEMMRIGIPVPPGFTITTEACKEFLALGVAPLELEIQITKALRELEDEMQKRLGDKKDPLLVSVRSGAKFSMPGMMETILNVGLNDESVQGLIKQTKNPRFAWDAYRRLIQMYGKTVLGIEGQKFANELDKAKKDQGVVDDHQLSVESLSKLVETFKNIVFQESGKNFPQDPREQMDQSMRAVFNSWNTDRAKLYRRRERIADDLGTAVNIGTMVFGNMGEDSGTGVCFTRDPATGELGAYGDYLQNAQGEDVVSGIRNTLSLEDLGRLHPDVFSELRGIMYNLETHYRDLCDIEFTIERGKLWILQTRVGKRTASAAFRIAMQLVDEHIITMDEALVRVNGGQLAQLMFPQFDMRNAPKAITKGMAASPGAAVGKAVFDSETATTWAENGERVILLRRETNPDDLGGMIAAVGILTSRGGKTSHAAVVARGMGKVAVCGAEELEVNENEKFAKVGSLRINEGDYISIDGSTGEVFNVEIPVEPSTIVRYLTDGIADASEGKEDGTRELIRSVDRLLRHADRRRKLRVRANADTDLDAAVARKFGAEGIGLCRTEHMFLGERRVLIERVILAKNNEHREEALAALLPLQREDFFNIFKEMDGHTTTIRLLDPPLHEFLPNLADLKVKSALARERNQVIEADERLLYEVEKMYESNPMLGLRGVRLGLVSPGLYELQVRAIAEAMADRIASGANPKVEIMIPLVGSHMELKITRLAAEEVIQEVARERKIELPIEIGTMIELPRAALTANRIGLVADFFSFGTNDLTQTTWGFSRDDVEAEFFAKYLELGVFTISPFETIDQSGVGELLIIATERGKSVNPNLHFGVCGEHGGDPESIHFFHKVGLDYVSCSPFRVPIARLEAGRAAVS
>NZ_CP016772.1|WP_095692230.1|312719_313478_+|SDR-family-oxidoreductase
MSNDLSSFSGQVVLIVGAASGIGRAAAQLITSREGTVVIADLDMAGLASLQKELGIKDKQVKSVNLGDQSSIQALITSVISDHSQIDALINTAGVVGPTNTKVEDVEWAAFERTVTINLFGTVWITQAILPHMKTRKYGRIAHVASIAGKEGNPGMHAYNTSKSGMIGFIKGVGKEVAAEGITINALAPAVIRTPMNADTSEETLKYMLGRIPMGRVGEPEEAAEMLAFMASKACSFTTGFTFDTSGGRATY
>NZ_CP016772.1|WP_095692229.1|311101_312730_+|D-aminoacylase
MTSNTFTIRGATVIDGSGSVGVKKDVVIVEGNIAEVGKLIKGNERGKIIDASDLTLTPGFIDMHSHSDLGVIADKAHLSKVTQGVTLEVVGQDGLSYVPSNEKVQAELRAQLYGWNGTLNDHDWNFNSVSQYLGEVDKGSAVNVAYLMPHGTIRMLVRGMNEGISSAEDIEKMQEILRTGMQEGAFGMSAGLTYVPAMYSDTHELIELCKVVREFGGYYAPHHRSYGAKIFESIAECIQISKESAVPLHLTHCHLSAPIYHGRANELLKLLDDASGQGIDISLDTYPYLAGSSYLHMMLPSWVQAGGIDQLRIRLREPEVQKKVIDALDHIGSDGNQGGVVNWDNIVIAGVEKAENKKYVGIAISKLALSQNKLASQLYIDLVLSEDFKASMVVFGGNEENVRTIMKDSRHTVGSDGILHGDRPHPRAYGTFARFLGHYSRDEQMFPLEGAVNRMTGRPAMRLGLQDRGFIREGYRADLVLFDNESIADRSTFESPRLPASGFEYVWINGIPTLEKGERTNLVPGKGIRKTALTNLGGKNVK
>NZ_CP016772.1|WP_095692238.1|321465_321954_+|SRPBCC-family-protein
MTSEKVRSEIFDTGNPKIKSARIIVEASPSTIFAILSNPKRHRDIDGSATVTANVSGPEALVLGSKFGMKMRLGITYWITNTVVEYKKDELIAWRHLGRWRWRYELTTLGNGSTQVTESFDGTYAPAVAQVWLNFRKAYPWTQLAVAKTLVRLKTVAESEGQ
>NZ_CP016772.1|WP_095692239.1|322139_322463_+|hypothetical-protein
MKFLISVIDDLSNSGTPAEMVAIDAFNDQLRTNGQWIFAWGLQAPETATVIDNRGGADSETGHPLFDSKEHYSGLWLIEAADAATAKKLAFEASKACNRKVELRPLH
>NZ_CP016772.1|WP_190283231.1|322601_323552_-|DMT-family-transporter
MNQLTPVNQSKLISSKYMAVALSKTQRSGLLFAFLGIFAFSLSLPFTKLALKSFDPFFTAFARPVIAAVIAIPLMMIAKVPMLPRNLWKPTAFTAAGAVFGWPILIALALQRTTSAHVSVIAAVMPLVTAIIAVIKHKKHPGLSFWVASSLGTVLLVAFSITRGGGTNADLKTDLLIIGAVIASSYCYVEGAALTSHMPGWQVISWVVVVSLPIALPAAAFVYAQTNADYSFHGDALFGLLAIGLSSMYLGFFAWYRGLRDFGVAHGSQVQQLQAIMTLGWSALLLGETVTLTMALSAIGIVLCVLWALSNVNRVK
>NZ_CP016772.1|WP_095675846.1|323505_324513_-|Gfo/Idh/MocA-family-oxidoreductase
MTQKLRIAIIGAGRIGYVHAGSVNDTPELELVYVVDPFEENAKKVTAAFGGKVSNDPSAVIASGEIDAVIIGSPTATHIPLLRECIAAGVHALCEKPIDLDVKNVEEFRALANSAKTNITLGFNRRQDPQYKALKAKVASGAIGTVEQVILTSRDPGPAPQGYIAVSGGIFRDMTIHDFDMARNFVPDIVEVTAFGANSFCDYIKEEGDFDNISVIMKGSNNELITVVNSRHAAFGYDQRAEIFGDKGMLQISNLSDTTVKSFTKDGTTAGEPFMDFFLERYADSYRNELKLFIEGIKTGKVLGSTYDDGRAALILADAAHESAHTGKSIKVNLK
>NZ_CP016772.1|WP_095692241.1|324549_325572_-|Gfo/Idh/MocA-family-oxidoreductase
MSALPKPHIFTAAESKPLRWGIFGAGWISEAMVKTAQLNSNQQFVAVASRTPGKAEAFAQKWNIDSFHNSYEELAARDDIDAIYLGTLPSDRLEVALVAINAGKHVLIEKPITMDYAEAQQIYAAAKAKKVLAMEAMWTRFLPQMDIARQLVTDGALGDVELVVSNFCQNNLGVTRLFTLGGGNPIIDMGIYPAALSQQFLGNPNEIHAFGKLHPNEIDEETHAFMRFANGSRSNFVLSARTTLPHWAGVSGSKGAITFGTPWFTPSSITFHESTFNGAQSTWVDDLGIPEHFGLIYQVHAFAQYVDQGLLEGPLYTHHDSLSNIKTVLEIGNLIGTRYK
>NZ_CP016772.1|WP_095692242.1|325581_326658_-|transaldolase-family-protein
MTQSPFLYMKENSPTVLWNDSADPKELKDALTWGIVGATCNPVIALTAIKADAPHWVSRIKEYAKSHPAATEDEIGWAMVKELSTNAAKLLEGEFEKYNGRNGRLSIQTDPRNFRNAKALAAQAVEFAQLAKNMIVKIPVTTEAISAFEEATYQGVSLNATVSFSVAQTVAVAEAIERGLKRREAEGLDISTMGPVCTIMVGRVDDWVKVSAEKIGAKVDPEILEWSGVAVFRNAHKIYQERGYRTRLLSAAFRNHMHWSEILGGDSVISPPYSWQVKINEMGITPNLNSVNEPIEARILDPLLENFPEFRKMYDVDGLAVEDFTNFGGTLRTLRGFLQSVNDLESFVRDVTVPNPDK
>NZ_CP016772.1|WP_095692243.1|326662_327577_-|TIM-barrel-protein
MTAQIRVGTAPDSWGVWFPSEPHQVPWDRFLDEVVEAGYHWIELGPYGYLPTDPKQLEDELGKRNLKMTAGTVFTGFHKEDESQWQRAWDQALAVANLVSKLGVEHLVVIPDLWRDDKTGQARESRTLSNEQWKRLAAGHNKLGKALLEEFGIHQQFHSHADSHIGTYQEVERYLQETDPKYSNLCLDTGHFAYYLGDNLKMMNAYPERIGYLHLKQVHPDILAETLKNDVPFGDAVAKGVMTEPGFEGVPKFAPIIERALEINPEIFAIIEQDMYGCPVDMPFPIAQRTREHILAATRAARVK
>NZ_CP016772.1|WP_095692244.1|327586_329500_-|3D-(3,5/4)-trihydroxycyclohexane-1,2-dione-acylhydrolase-(decyclizing)
MATRKMTVSQAVVEFLSHQYTVDGDHRERTIQGVFGIFGHGNVAGIGQALKQLSVENPSLMPYYQARNEQAMVHESSAFARMKRRRATFACTASVGPGATNMLTGAAVATTNHLPVLLLPSDTFANRASDPVLQQLEMPHDATLSVNDAFKPLSRFFDRVQRPEQLFSALMGAMRVLTDPVETGAVTICLPEDVQAEMIDVPEEFLADRDWHIRRPRAEAAQLAEVARVIASSKRPFIVAGGGVIYSDAHDALQTFVEQTKIPVGTSQAGVGSLNWDHPQLLGSVGATGTTAANRAAKEADLVIGIGTRYSDFTTSSRTAFQNPDVRFININIASFDAFKHGSAMPVVADARESLRELTALLATFATTSDYQSKYTKEKSEWDAVVDAAFVDQKRALPSQTEIIHAVQSASDATDTLICAAGSLPGDLHKLWRVRSPLGYHVEYAFSCMGYEIAAGLGAARAGATPIVMVGDGSYLMMHTEIVSAVAEGLKVIIVLIQNHGYASIGHLSESIGSERFGTQYRFKDQAGNNFESGEKLPVDLAANAASLGINVIDIKQTPSAIGDLHAAVMKAKQSSTSTLIHINSDPLLYSPDGEGWWDVPIAPISTLKSTQDAYAQYKDEISLQRPLLGNGTKDKK
>NZ_CP016772.1|WP_095675851.1|329501_330422_-|5-deoxy-glucuronate-isomerase
MSSADKWYFRHGELSRDGWDVFLDPQSPPVAGWKYTGLRIGTLTESKSLTLPADSNERIIFPLEGQEFLVEYTHDGNTSSQILHGRTSVFHGPADFIYLPINTSATISGVGRIAVGQTPATKVKAVRYVAKEDVSISLRGAGRETRQVHNLGMPETLDADRMIVCEVIVPAGNWSGSPSHKHDVYIPGKESELEEIYYFQSAVTRGAKTPPSSLPFGYFRGTSADSRPYDVNEEVHSGDVALVPYGWHGPAAAGPGYDLYFFNVMAGPDPDRAWNATDHPDQVWIRDSWQSQQSDPRLPYGSTERI
>NZ_CP016772.1|WP_095692245.1|330430_331921_-|CoA-acylating-methylmalonate-semialdehyde-dehydrogenase
MSTIVNHWINGAEFVSTSGRTSPVYDPALGIETKRVALANQAEIDAAIKAAMDAFPAWRDESLAKRQQIIFTFRELLNSRKGELAEIITSEHGKVLSDALGEITRGQEVVEFATGIPHLLKGFYSENVSNGVDVYSTRQPLGVVGIISPFNFPAMVPMWFFPIAIAAGNTVVIKPSEKDPSASMWVAKLWKEAGLPDGVFNVLNGDKESVDGLLNSPDVESISFVGSTPIAKYIYESASRTGKRVQALGGAKNHMLVLPDADLELVADSAINAGFGSAGERCMAISVVVAVEPVADKLIPKIVERMGKLRTGDGRRGCDMGPLVTREHRDKVASYIDIAEKDGATVVVDGRNPQVDGDANGFWLAPTLVDKVPTTSKVYTEEIFGPVLSIVRVKSYDEGVALINSGAFGNGTAIFTNDGGAARRFQNEIQVGMVGINVPIPVPVAYYSFGGWKQSLFGDTKAHGVEGVHFFTRGKAITSRWLDPSHGGINLGFPQN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP016772_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016772_3

935901-936000

Orphan

Consensus_repeat	Method
TGCAGCTTTCTTTGCGCGCTTAGGCGCA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP016772_3

>merge|NZ_CP016772|3|935901-936000|CRISPRCasFinder
TGCAGCTTTCTTTGCGCGCTTAGGCGCAACTGCATCAGTAGGTGCTGCTTGAAAGATCGGAACGGGGATTGCTGCAGCTTTCTTTGCGCGTTTAGGCGCA

>NZ_CP016772|3|3|935901-936000|CRISPRCasFinder
TGCAGCTTTCTTTGCGCGCTTAGGCGCA	ACTGCATCAGTAGGTGCTGCTTGAAAGATCGGAACGGGGATTGC
TGCAGCTTTCTTTGCGCGTTTAGGCGCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016772.1\|WP_095676412.1\|942123_942546_-\|nucleoside-diphosphate-kinase	unknown	unknown	gnl\|CDD\|179085
NZ_CP016772.1\|WP_095692658.1\|922287_924051_-\|acetolactate-synthase-large-subunit	unknown	unknown	gnl\|CDD\|236098
NZ_CP016772.1\|WP_095692668.1\|937459_939616_-\|penicillin-binding-protein-2	unknown	unknown	gnl\|CDD\|274573
NZ_CP016772.1\|WP_095692672.1\|946854_948153_-\|ATP-dependent-Clp-protease-ATP-binding-subunit-ClpX	unknown	unknown	gnl\|CDD\|235422
NZ_CP016772.1\|WP_095692662.1\|928943_929243_-\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatC	unknown	unknown	gnl\|CDD\|178810
NZ_CP016772.1\|WP_095692659.1\|924262_925936_-\|dihydroxy-acid-dehydratase	unknown	unknown	gnl\|CDD\|234861
NZ_CP016772.1\|WP_095692669.1\|942558_942894_-\|DUF4233-domain-containing-protein	unknown	unknown	gnl\|CDD\|379420
NZ_CP016772.1\|WP_095676410.1\|940136_941081_-\|rod-shape-determining-protein-MreC	unknown	unknown	gnl\|CDD\|237560
NZ_CP016772.1\|WP_095692670.1\|942893_944252_-\|bifunctional-folylpolyglutamate-synthase/dihydrofolate-synthase	unknown	unknown	gnl\|CDD\|223362
NZ_CP016772.1\|WP_095692671.1\|944252_946832_-\|valine--tRNA-ligase	unknown	unknown	gnl\|CDD\|235582
NZ_CP016772.1\|WP_095692665.1\|931645_933160_-\|GTPase-ObgE	unknown	unknown	gnl\|CDD\|237045
NZ_CP016772.1\|WP_095692661.1\|927450_928947_-\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatA	unknown	unknown	gnl\|CDD\|234572
NZ_CP016772.1\|WP_095692663.1\|929268_930537_-\|glutamate-5-semialdehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|234685
NZ_CP016772.1\|WP_095676409.1\|939612_940134_-\|rod-shape-determining-protein-MreD	unknown	unknown	gnl\|CDD\|274574
NZ_CP016772.1\|WP_095676404.1\|933255_933510_-\|50S-ribosomal-protein-L27	unknown	unknown	gnl\|CDD\|235464
NZ_CP016772.1\|WP_095692664.1\|930533_931649_-\|glutamate-5-kinase	unknown	unknown	gnl\|CDD\|235460
NZ_CP016772.1\|WP_190277152.1\|941091_942111_-\|rod-shape-determining-protein	unknown	unknown	gnl\|CDD\|237562
NZ_CP016772.1\|WP_095676405.1\|933529_933844_-\|50S-ribosomal-protein-L21	unknown	unknown	gnl\|CDD\|235510
NZ_CP016772.1\|WP_095692660.1\|925945_927451_-\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatB	unknown	unknown	gnl\|CDD\|235489
NZ_CP016772.1\|WP_095692667.1\|936302_937463_-\|rod-shape-determining-protein-RodA	unknown	unknown	gnl\|CDD\|274033

Protein	Function_ID	Function_description	E-value
NZ_CP016772.1\|WP_095676412.1\|942123_942546_-\|nucleoside-diphosphate-kinase	gnl\|CDD\|179085	PRK00668, ndk, mulitfunctional nucleoside diphosphate kinase/apyrimidinic endonuclease/3'-; Validated.	6.90307e-76
NZ_CP016772.1\|WP_095692658.1\|922287_924051_-\|acetolactate-synthase-large-subunit	gnl\|CDD\|236098	PRK07789, PRK07789, acetolactate synthase 1 catalytic subunit; Validated.	0
NZ_CP016772.1\|WP_095692668.1\|937459_939616_-\|penicillin-binding-protein-2	gnl\|CDD\|274573	TIGR03423, pbp2_mrdA, penicillin-binding protein 2. Members of this protein family are penicillin-binding protein 2 (PBP-2), a protein whose gene (designated pbpA or mrdA) generally is found next to the gene for RodA, a protein required for rod (bacillus) shape in many bacteria. PBP-2 acts as a transpeptidase for cell elongation (hence, rod-shape). [Cell envelope, Biosynthesis and degradation of murein sacculus and peptidoglycan].	2.7912e-162
NZ_CP016772.1\|WP_095692672.1\|946854_948153_-\|ATP-dependent-Clp-protease-ATP-binding-subunit-ClpX	gnl\|CDD\|235422	PRK05342, clpX, ATP-dependent Clp protease ATP-binding subunit ClpX.	0
NZ_CP016772.1\|WP_095692662.1\|928943_929243_-\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatC	gnl\|CDD\|178810	PRK00034, gatC, Asp-tRNA(Asn)/Glu-tRNA(Gln) amidotransferase subunit GatC.	6.26999e-29
NZ_CP016772.1\|WP_095692659.1\|924262_925936_-\|dihydroxy-acid-dehydratase	gnl\|CDD\|234861	PRK00911, PRK00911, dihydroxy-acid dehydratase; Provisional.	0
NZ_CP016772.1\|WP_095692669.1\|942558_942894_-\|DUF4233-domain-containing-protein	gnl\|CDD\|379420	pfam14017, DUF4233, Protein of unknown function (DUF4233). This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are typically between 122 and 147 amino acids in length. Proteins in this family are integral membrane proteins.	4.50323e-11
NZ_CP016772.1\|WP_095676410.1\|940136_941081_-\|rod-shape-determining-protein-MreC	gnl\|CDD\|237560	PRK13922, PRK13922, rod shape-determining protein MreC; Provisional.	5.20125e-58
NZ_CP016772.1\|WP_095692670.1\|942893_944252_-\|bifunctional-folylpolyglutamate-synthase/dihydrofolate-synthase	gnl\|CDD\|223362	COG0285, FolC, Folylpolyglutamate synthase [Coenzyme metabolism].	9.62212e-135
NZ_CP016772.1\|WP_095692671.1\|944252_946832_-\|valine--tRNA-ligase	gnl\|CDD\|235582	PRK05729, valS, valyl-tRNA synthetase; Reviewed.	0
NZ_CP016772.1\|WP_095692665.1\|931645_933160_-\|GTPase-ObgE	gnl\|CDD\|237045	PRK12296, obgE, GTPase CgtA; Reviewed.	0
NZ_CP016772.1\|WP_095692661.1\|927450_928947_-\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatA	gnl\|CDD\|234572	PRK00012, gatA, Asp-tRNA(Asn)/Glu-tRNA(Gln) amidotransferase subunit GatA.	0
NZ_CP016772.1\|WP_095692663.1\|929268_930537_-\|glutamate-5-semialdehyde-dehydrogenase	gnl\|CDD\|234685	PRK00197, proA, gamma-glutamyl phosphate reductase; Provisional.	0
NZ_CP016772.1\|WP_095676409.1\|939612_940134_-\|rod-shape-determining-protein-MreD	gnl\|CDD\|274574	TIGR03426, shape_MreD, rod shape-determining protein MreD. Members of this protein family are the MreD protein of bacterial cell shape determination. Most rod-shaped bacteria depend on MreB and RodA to achieve either a rod shape or some other non-spherical morphology such as coil or stalk formation. MreD is encoded in an operon with MreB, and often with RodA and PBP-2 as well. It is highly hydrophobic (therefore somewhat low-complexity) and highly divergent, and therefore sometimes tricky to discover by homology, but this model finds most examples. [Cell envelope, Biosynthesis and degradation of murein sacculus and peptidoglycan].	0.00279003
NZ_CP016772.1\|WP_095676404.1\|933255_933510_-\|50S-ribosomal-protein-L27	gnl\|CDD\|235464	PRK05435, rpmA, 50S ribosomal protein L27; Validated.	1.6448e-49
NZ_CP016772.1\|WP_095692664.1\|930533_931649_-\|glutamate-5-kinase	gnl\|CDD\|235460	PRK05429, PRK05429, gamma-glutamyl kinase; Provisional.	3.36509e-174
NZ_CP016772.1\|WP_190277152.1\|941091_942111_-\|rod-shape-determining-protein	gnl\|CDD\|237562	PRK13927, PRK13927, rod shape-determining protein MreB; Provisional.	0
NZ_CP016772.1\|WP_095676405.1\|933529_933844_-\|50S-ribosomal-protein-L21	gnl\|CDD\|235510	PRK05573, rplU, 50S ribosomal protein L21; Validated.	3.72493e-35
NZ_CP016772.1\|WP_095692660.1\|925945_927451_-\|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatB	gnl\|CDD\|235489	PRK05477, gatB, Asp-tRNA(Asn)/Glu-tRNA(Gln) amidotransferase subunit GatB.	0
NZ_CP016772.1\|WP_095692667.1\|936302_937463_-\|rod-shape-determining-protein-RodA	gnl\|CDD\|274033	TIGR02210, Rod_shape-determining_protein_RodA, rod shape-determining protein RodA. This protein is a member of the FtsW/RodA/SpoVE family (pfam01098). It is found only in species with rod (or spiral) shapes. In many species, mutation of rodA has been shown to correlate with loss of the normal rod shape. Note that RodA homologs are found, scoring below the cutoffs for this model, in a number of both rod-shaped and coccoid bacteria, including four proteins in Bacillus anthracis, for example. [Cell envelope, Biosynthesis and degradation of murein sacculus and peptidoglycan, Cellular processes, Cell division].	1.54013e-128

>NZ_CP016772.1|WP_095676405.1|933529_933844_-|50S-ribosomal-protein-L21
MYAIVKAGGRQEKVTVGETITVDRIDAAVGASVSFPALLVVDGANVTTDLKVLSSIKVTGEVIDEVKGPKIDILRYKNKTGHRRRQGFRAQHTRVKITAISGAK
>NZ_CP016772.1|WP_095676404.1|933255_933510_-|50S-ribosomal-protein-L27
MASKKGVSSTRNGRDSNPQYLGIKRFGGQEVNAGEILVRQRGTHFHPGKNVGRGKDDTLFALAAGVVEFGRARDRRVVNVVPAA
>NZ_CP016772.1|WP_095692665.1|931645_933160_-|GTPase-ObgE
MTTFIDSVTLFAAAGKGGDGCVSVKREKFKPLGGPDGGNGGRGGDIILVVDSSVTTLLDFHHSPHRKATSGHQGYGDRKDGVSGEDLILPVPNGTVIYDEDGEQIADLIGIGTTFLAARGGHGGLGNLALSSSKRRAPGFALLGEPGEERRLTLQLKSVADIALVGFPSAGKSSLIAAISAARPKIADYPFTTLVPNLGVVQAGDTRFTVADVPGLIPGASQGKGLGLQFLRHVERCVALVHVLDCGTLETDRNPIDDLEAIENELALYGGLEDRVRIVALNKVDLPDGKAMADMVEQQLKEKGYEVYKVSAASREGLQELLYSMARLVQRERAEAAKEERTRIILRPVAVDDSGFTVQKNGDGSFSVRGQKVVRWVRQTNFKNAEAIGYLADRLAQLGVEKELFKKGAVAGSEVRIGSGDNEVVFEWEPTIEAGAEQLAGFLHRRGEDSRLEGAWNTVETERDRLSDDEVARQWEYNVAEPTNPEMKLTLSEIQESDTESNDK
>NZ_CP016772.1|WP_095692664.1|930533_931649_-|glutamate-5-kinase
MNRGAITSAKRVVIKIGSSSLTGSAGSELDPHAVQKVVDLAYSLKKRGAEVVVVSSGAIAAGLSPLGLKVRPKDLATQQAAASVGQGLLIAQYSEKFKAHGVISSQVLLTTEDVVRRSHYANAQQTLTKLLSLGVVPVINENDTVGTQEIRFGDNDRLAALVALLIQADLLVLVSDIDALYDAPPTQAGAKAIRYVANISDIESITLGGAGSSGVGSGGMVTKVEAARIATSAGIPMLLTSLQDSGHAVAGEEFGTFFEAHTSKANSRLLWLAHASTPRGRLILDDGAVTAILERGVSLLPAGVTAVEGDFISGDTVELASGSGKVIARGLVAFDSEEIPQMLGRSTKELAAALGAEYERELVHRDDLVLL
>NZ_CP016772.1|WP_095692663.1|929268_930537_-|glutamate-5-semialdehyde-dehydrogenase
MNAEAVVAELAQKARKASRSLSTATGAERKAALEAIAKAIESRSAEILAANVLDMASARAEDMHPQMQDRLLLTAERIAGIAGGARQVAALADPLGQTLRKSTLANGLELEQISVPFGVIGMVYEARPNVTVDAAVILLMSGNAALLRGSSSAHHSNEILVNVMKDALATTKISPDVIQLIPSEDRATTKALLTARGKVDLVIPRGSAALIRMVVDEATVPTIETGAGVCHVYVDEFADIEKALPILINSKTHRPSVCNAAETLLVHKAIAPTFLPMALKALSDAGVILHSDATAQKVADTFKIASTLATDANWSTEYGVLEMNVAVVDSVDAAADHIAQYGTNHTEAIVTENKANAARFIALSDCAAVMVNTSTRFTDGEQMGFGAEIGISNQKLHARGPMGLEAMTTTTWIVTGTGQIRS
>NZ_CP016772.1|WP_095692662.1|928943_929243_-|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatC
MSSLSRDDVAKLAGLARIEMTEAELVELSSQFGLILDAVARVQEMDLSGVKATSHPQPLENIARPDVVHPSLSPHDALSGAPAQEESRFRVPQILGEAE
>NZ_CP016772.1|WP_095692661.1|927450_928947_-|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatA
MIRNTAAQMADALAKGETTSVELTQAHLDRIAEVDGQVKAFLHVDSQGALAQAKDVDARRAKGEKLSPIAGIPLALKDVLAQKGVPTTAGSKILQGWLPPYDSTVVSKLKDAGVVIMGKTNMDEFAMGSSTENSGYGPTFNPWDLTRTPGGSSGGSAAAVSAFEAPLAIGSDTGGSIRQPAALTGIVGVRPTYGAVSRFGLIAYSSSLDQAGPFGRTVLDTALLHEVMAGHDVKDATSINAPVPAVVAAAKSGDVKGMKIGVIKQLQGEGYQKGVQTRFDESLQVLASLGAEIVEVDCPSFEYALAAYYLIAPSECSSNLARFDAMRYGLRTGDVDGASAEAVMSATRDAGFGREVKRRIILGTYALSSGYYDAYYGSAQKIRTLIIQDYAKAFTKADVLVSPTAPTTAYKIGEKVDDPMAMYLGDVATIPVNLAGICGMSLPAGLADEDNLPVGFQIMAPAMQDQRLYQTGAALEAALLSKWGAPILSKAPELKGAK
>NZ_CP016772.1|WP_095692660.1|925945_927451_-|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatB
MALPTYDEVIAKWDPVLGLEVHVELNTASKMFCSCATEFGAAPNTQTCPVCLALPGALPVVNEKAIESTILIGLALNCKIAPYSRFARKNYFYPDMPKNFQISQYDEPICFDGYVDVEIDTEEGPKQFRIEVERVHMEEDTGKSLHVGGATGRIHGADYSLLDYNRAGIPLVEIVTKIVPGTGKYAPEVAKAYVAELRDILRGLKVSDVKMEQGSLRCDANVSLKPIGSDVLGTRSETKNVNSLRSVERAIRGEMIRHAELLNDGKKVKQETRHFQEDTGLTRSGRSKEQAEDYRYFPDPDLVPVTPAAAWIEELRATLPERPSLRRKRIKEEWNVPDKEMQAMINADVLDIVEATVLLGADPTKARTWWLGEISRIANDQNIAVADLAITPADVAEIVALVAKGELTDKLARQVVEGVIAGEGKPAEVVEKRGIKVVSDDGALMAAIEKVCAEQADTAEKVRGGHLPAAGALIGAVMKETKGQADAAKVRELLLKHLGQG
>NZ_CP016772.1|WP_095692659.1|924262_925936_-|dihydroxy-acid-dehydratase
MSKMKPRSGLVTDGLERAPARGMLRAVGMGDEDWVKPQIGIASSWNEITPCNLSLDRLAKASKKGVIDAGGFPMQFGTISVSDGISMGHEGMHFSLVSREVIADSVETVMQAERLDGMVTFAGCDKSLPGMMMAAARIDVASVFVYAGSTLPGQVDGKDVTIIDAFEAVGACARGLITKDRVDQIERAICPGEGACGGMYTANTMASIAEAIGLSLPGSAAPPAVDRRRDAYAEQAGAAVVNLIAKGITTRDILTKKAFENAITILMALGGSTNAVLHLLAIAHEADVDLTLEDFHRIGSKVPLLGDLKPFGKYVMTDVDRVGGIPVVLRILLDAGFLHGDTLTVTGKTMAENLADINPPLADGNVLFPADKPMSTDIGITILGGTLATEGAVCKTAGIGIESFEGPARVFEREQAAMDALENGTIQVGDVVVIRYEGPKGGPGMREMLMITGAIKGAGLGKTTLLLTDGRFSGGSTGLCVGHVAPEAVDGGPIAFIKDGDRVRIDIPNRTLDLLVDPAELAARKVGWKPLPHKYTRGVLHKYSKLVGSASKGAVCD
>NZ_CP016772.1|WP_095692658.1|922287_924051_-|acetolactate-synthase-large-subunit
MAKHVPTANGTEMTGATALVKSLEAAGVDVMFGLPGGAILPAYDPIYDSTIRHILVRHEQGAGHAATGYAQVTGRAGVCIATSGPGATNLVTPLMDAAMDSVPLLAITGQVPSAAIGTDAFQEADIRGITMPFTKHNYLITNPDEIPGVIAEAFHIATTGRPGPVLVDIAKDALQKMTKYNWPTSIKLAGYNPKTTPDAQAITDAAALIAQSSKPVFYVGGGVIKANAHAELRQLVELLGGPVVTTLMARGAFPDSHPLHMGMPGMHGTVAAVTALQKADLLITLGARFDDRVTGKLSTFAPNAKILHADIDPAEIGKNRHADVAVVGDVRETIAALIPALKAALAKNKPDLTAWLRQMNSLKSTYPLGFDTPDDGSLSPQLVIQRLGQISGTDTIFTAGVGQHQMWASQFISYEHPRTWLNSGGAGTMGYGVPAAMGAKVGAPDTTVWAIDGDGCFQMTNQELVTCALNNIPIKVAIINNESLGMVRQWQTLFYDSRYSNTSLESKRVPNFPMLAESMGCVGLSCERPEDLDKTIEKAMSINDQPVVVDFRVHRDAMVWPMVAAGTSNDEIMIARATAPDWDSQEL
>NZ_CP016772.1|WP_095692667.1|936302_937463_-|rod-shape-determining-protein-RodA
MSTFLNRSPYRRARRSSVFSGFDPVLTGAVAALLVIGTLLVYAATRDWYASNGLDPQYYLKRHVINIVIGLALAWGTTIIDYRLLRAYTPYIWGLGVFGLLFVLIPGVGSEVNGAKAWIRLPAGLQIQPAEIAKISIIIGIAMLLSERTHNNDAPSHQDVLKALGVAAIPILLILAQPDMGTVLIISASVVTMLAVSGAPTRWVVGLILLALIGGFVAVKAGVISDYQVKRLQSFVDPNADSQGAGYQLRQARITVGSGGLIGTGLLNGPQTNGRFVPEQQTDFIFTVAGEELGFLGSGLIIFLLFLILMRAFAIARRSTDPYGMLVCTGVIAWFAFQIFENIGMTLGLMPMTGVPLPFMSYGGSSMFANLIGFGLLQNVHASHRS
>NZ_CP016772.1|WP_095692668.1|937459_939616_-|penicillin-binding-protein-2
MNQRSRLSLLVFQIFIASLMLALFGRLFYLQVAAGPIYRDAALSIQSRDVVTPANRGFIVDSSGVPMALNRVGLAVTVDRTKIDKLPDKGVAVVKDLVTLLGLNFDDVWQRTRLCGELPKGKKAGCWTGSRFQPIPITNTADPQIALRIVERSDRYPGISATPLAIRSYPTTLGLNGGHVLGYVGPLTESDLSGANGRSYFRSESIGKAGLEIVYDEYLRGTPGIKTFIVDRKEAVTTTSKNTKPVAGNHLVTSLDIRLQAASEAALAAAVKRARGSGFRADGGAAVVLDVRNGQVLSLASYPTFDPNAFETGLTVQEAEDLYSEKMGVPALNRALQGLYALGSTFKAVSVIAAKDAGYSLSASYACPSEVQVGTRAFQNFESKAQGTLSMKKAIAVSCDTIWYRIAYDEWLRDGGLRPKSNPNDYFFKAAEKFQMGKKTGVDLPSESSGRLANREWRKAWYSQNKDFYCNYKERSTKSQQTAFLLQLARENCLDGDKIRAGDAVNFSIGQGDTVVTPLKLAQMYAAIANGGTIWKPTVAKAIVKTDGTVLRTFQPEKLGELGEDQATIDFLHDALREVAISGTGAGAFAGFPVATSGKTGTAQVFGRNPNGSAKSDTSWYASFAPAKNPRYAVVMMVSQGGYGAGTSGVGVRQIYEAIFGAQGSTVKPELALFPNGKPPTTLPRISPATKPKPSILNPGKPKVLASPTPTAKAKVKR
>NZ_CP016772.1|WP_095676409.1|939612_940134_-|rod-shape-determining-protein-MreD
MSLRRFFYSFPIFFTVFLLQEAVVTQMRLPAGGINLLLVVALIWAALSTPEIGALTGFGAGLMMDVSQTSPGPMGHWTLVLIIACYAIAFLGYGDDNIRGNPINIIFLVTIGVIAAQTVFLLLGMMLGQQVGSVSNIAFLLAGSAFWTAIISPLILKVISFFHANIFGMRSQL
>NZ_CP016772.1|WP_095676410.1|940136_941081_-|rod-shape-determining-protein-MreC
MRYGGDNRGRLLIIVLLVTSLFLITLDLRGVQVIDGLRTGTQTALTPVQKAGSWLVSPFRNFLSDVTHLGRTRNKMEKLTAENEKLRLTLQNRKTADAQLKQLKGVLNLAGTAGYEVVNAKVISQGSTTSFTQTITIDAGTSSGVRANMTVLSGYGLVGVVKYAYRDSALVQLASDPAFKIGARIAGTQQIGILSGQGTRKGVLQLLDNTTQVRKGDALLARGSQNGRPFVPGVPIGEVTSVDNSPGAVTQTADVKFYTNFSTLGVVAVVVSGSSADPRDSLVPPKPRPTPLPTVTIYATPGAVEPTPTPTATK
>NZ_CP016772.1|WP_190277152.1|941091_942111_-|rod-shape-determining-protein
MSFIGRDMAVDLGTANTLVYVRGRGIVLNEPSVVAINQDTGGILAVGLEAKKMIGRTPGNIVAIRPLKDGVIADFDTTERMLRYFIQKVHRRSYLAKPRIVVCVPSGITGVEQRAVKDAGYAAGARKVYIIEEPMAAAIGAGLPIHEPTGNMVVDIGGGTTEVAVISLGGIVTALSIRIGGDELDQSIISWTKREYSLLLGERTAEEIKMAIGSAYPLQGENDAEIRGRDLATGLPKTIVVTAAEIRKALEEPVNQIINAVKATLDKCPPELASDLMDRGIVLTGGGALLKGLDERLRKETGMPIHIADRPLDAVVEGSGKCIEEFEALEKVLISEPRR
>NZ_CP016772.1|WP_095676412.1|942123_942546_-|nucleoside-diphosphate-kinase
MSIEKTLVLVKPDGVARGLVGEVIARIEAKGYSIVSLRMLQADRALLEKHYAEHQGKPFFEPLVEFMMSGPIVALVAEGNRVIEGFRSLAGVTDPTVAAPGTIRGDLARDQGTKVVQNIVHGSDSPESAAREIAIFFEGK
>NZ_CP016772.1|WP_095692669.1|942558_942894_-|DUF4233-domain-containing-protein
MRVLGSAVLVMEFFVMGFAMLLAKDNQEPSSIIAGAVIAILMLLTPGLLKKRTGWILGSILQFLMIGYAVVVPSMAIVGLIFAGLWIAAIVVGRRGEAIRAKLMASRTPNP
>NZ_CP016772.1|WP_095692670.1|942893_944252_-|bifunctional-folylpolyglutamate-synthase/dihydrofolate-synthase
MTNTSPEDQSRIDVIEQALLARWPETRIEPTLERIAALVDMLGSPQLSYPTIHIGGTNGKTTTSRMIDSLLFEMGLRTGRFTSPHLESYLERIAINGEPIAAKDLIFSFNDISAYLDLMDEKFEHPISFFEAITALAFAAFAEHPIDVGVIEVGMGGQWDATNVVKADVSVIMPIGLDHTEYLGETLTEIAQTKAGIIKEGGYVVLAQQEPECAVELLKQAALVGADVAREGVEYSVLTRSIAVGGQLLAIQGTKEIYTDIFIPLHGKHQASNAAAALVAVEVFFGDQDLDIEAVRAGFANVKSPGRCEVLHRDPTIIVDAAHNPHGASAIADTIQSEFTFDEVIGIFAPMGDKDVRGILLELEQVMDSVIVTANSSSRSMKVSELEKMAAEIFGSDRVFAVPTVTEAIDKAVKDCIRPLSVDTIGILITGSVVTVGEARAIVRKKFAKEEK
>NZ_CP016772.1|WP_095692671.1|944252_946832_-|valine--tRNA-ligase
MSSEKRELASSFLPGDIEGPLYTKWIEAGYFTADANSSKEPFTIVIPPPNVTGNLHIGHALDQTLQDCLTRMKRMQGFEALWLPGMDHAGIATQNVVEKQLATQGLSRHDLGREDFVKKVWEWKSESGGQILGQMRRLGDSVDWSREAFTMDENLSQAVLTIFKKLFDQGLIYRAERIINWCPRCLTALSDIEVEHQDDEGEFVQVRYGEGEQSIVVATTRAETMMGDGAVAVHPDDPRYKHMVGTEVLLPLVNRMIPIIADELVDPDFGTGAVKVTAAHDPNDFEMAMRHNVPFVVIMNEHGIMDGTGTEFDGMDRFDARVAVVAKLKEMGRIVAEKRPYIHAVGHCSRCDITVEPRLSKQWFVKVAPLAKAAGDAVRDGRVKIEPAELAPRYFEWVDNMHDWCISRQLWWGHRIPVWYGPNDEVIVVGPGESAPAGYTQDPDVLDTWFSSALWPFSTLGWPNNTADVKKFYPTSVLVTGYDILFFWVARMMLFGLFAMDGVPPFHTIVLHGLVRDQFGKKMSKSRGNVVDPLEFIDKYGADALRFTLARGSNPGKDQALAEDWIAGSRNFATKLWNATRFAMMNGATVEGPLPATETLSDIDKWVLSRLSETTTEFTALMESYEFARACDAIYHFAWDDLCDWYLELSKEAFASGNAGASQRVLGHVLDTLFRLLHPVMPFITETLWTTLTGGETLVTAKWPVADSSHINKKSEALVGELQKIITEVRRFRNDQGVKPSQKIPGRFIAPADVTAYASAMAFLLRLELTEFTPSASVEIGSMKVELDLSGTVDVVAERARLEKDLVTAQKDMKTADVKLNNEGFMAKAPESVVAEIRERMAATSADIERITAQLAALK
>NZ_CP016772.1|WP_095692672.1|946854_948153_-|ATP-dependent-Clp-protease-ATP-binding-subunit-ClpX
MSTRIGEANDLLKCSFCGKTQKQVKKLIAGPGVYICDECIELCNEIIVEELSEASSLGLSELPKPQAIFEFLDQYVIGQDRAKKSLSVAVYNHYKRVQSGDSRNEDGIELAKSNILLLGPTGCGKTLMAQTLARMLNVPFAIADATALTEAGYVGEDVENILLKLLQAADYDVKKAETGIIYIDEIDKVARKSENPSITRDVSGEGVQQALLKILEGTVASVPPQGGRKHPHQEFIQIDTTNVLFIVGGAFSGLEKIIEARSGSTGVGFGAELQSAEEKNRRDIFADVMPEDLLKFGMIPEFIGRLPVLTSVENLDKPALMQILTEPKNALVKQYQKLFDLDDVELEFAPDALDAIAELALNRGTGARGLRAIMESALLGVMYDVPSRADIAKVIIEKACIDSNAAPTLLPRTGDIPKRASRREKPNEEKSA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP016772_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP016772_4

1013663-1013759

Unclear

Consensus_repeat	Method
TGCAGATGTTCTTGAAGAGATGGAT	CRISPRCasFinder

1 spacers

cas3

The CRISPR arrays of NZ_CP016772_4

>merge|NZ_CP016772|4|1013663-1013759|CRISPRCasFinder
TGCAGATGTTCTTGAAGAGATGGATGAGTCCGAGCGCGTTGCACTGATGGCAGAACTTGAAGGCGAACGTGCTGCAGATATTCTTGAAGAGATGGAT

>NZ_CP016772|4|4|1013663-1013759|CRISPRCasFinder
TGCAGATGTTCTTGAAGAGATGGAT	GAGTCCGAGCGCGTTGCACTGATGGCAGAACTTGAAGGCGAACGTGC
TGCAGATATTCTTGAAGAGATGGAT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP016772.1\|WP_095676468.1\|1007139_1008321_-\|adenylyltransferase/sulfurtransferase-MoeZ	unknown	unknown	gnl\|CDD\|181156
NZ_CP016772.1\|WP_095676475.1\|1014349_1014844_+\|DUF1003-domain-containing-protein	unknown	unknown	gnl\|CDD\|377629
NZ_CP016772.1\|WP_095676469.1\|1009028_1009280_+\|DUF3107-domain-containing-protein	unknown	unknown	gnl\|CDD\|378634
NZ_CP016772.1\|WP_095676465.1\|1004374_1005958_+\|cysteine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234705
NZ_CP016772.1\|WP_095692987.1\|1008376_1009012_+\|TetR/AcrR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|366102
NZ_CP016772.1\|WP_095676466.1\|1005959_1006271_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP016772.1\|WP_095692710.1\|1012092_1013004_-\|DMT-family-transporter	unknown	unknown	gnl\|CDD\|223769
NZ_CP016772.1\|WP_095692715.1\|1018011_1019493_-\|leucyl-aminopeptidase-family-protein	unknown	unknown	gnl\|CDD\|238247
NZ_CP016772.1\|WP_020045748.1\|1019508_1019688_-\|DUF3117-domain-containing-protein	unknown	unknown	gnl\|CDD\|371461
NZ_CP016772.1\|WP_095692716.1\|1020053_1020503_-\|SRPBCC-family-protein	unknown	unknown	gnl\|CDD\|176854
NZ_CP016772.1\|WP_095692713.1\|1016257_1017376_-\|trypsin-like-peptidase-domain-containing-protein	unknown	unknown	gnl\|CDD\|273938
NZ_CP016772.1\|WP_095676471.1\|1010642_1011254_-\|MarC-family-protein	unknown	unknown	gnl\|CDD\|225006
NZ_CP016772.1\|WP_095676481.1\|1019800_1020001_-\|sigma-70-family-RNA-polymerase-sigma-factor	unknown	unknown	gnl\|CDD\|274357
NZ_CP016772.1\|WP_095692707.1\|1006270_1007140_-\|N-acetyl-1-D-myo-inositol-2-amino-2-deoxy-alpha--D-glucopyranoside-deacetylase	unknown	unknown	gnl\|CDD\|274584
NZ_CP016772.1\|WP_095692714.1\|1017388_1018015_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|226607
NZ_CP016772.1\|WP_095676476.1\|1014814_1015933_-\|Mrp/NBP35-family-ATP-binding-protein	unknown	unknown	gnl\|CDD\|378455
NZ_CP016772.1\|WP_095692708.1\|1009280_1010642_+\|DEAD/DEAH-box-helicase	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|223587
NZ_CP016772.1\|WP_095692709.1\|1011250_1012096_-\|PHP-domain-containing-protein	unknown	unknown	gnl\|CDD\|223686
NZ_CP016772.1\|WP_095692712.1\|1015929_1016238_-\|Sec-independent-protein-secretion-pathway-component	unknown	unknown	gnl\|CDD\|179287
NZ_CP016772.1\|WP_095692717.1\|1020505_1021045_-\|TIGR00730-family-Rossman-fold-protein	unknown	unknown	gnl\|CDD\|129813

Protein	Function_ID	Function_description	E-value
NZ_CP016772.1\|WP_095676468.1\|1007139_1008321_-\|adenylyltransferase/sulfurtransferase-MoeZ	gnl\|CDD\|181156	PRK07878, PRK07878, molybdopterin biosynthesis-like protein MoeZ; Validated.	0
NZ_CP016772.1\|WP_095676475.1\|1014349_1014844_+\|DUF1003-domain-containing-protein	gnl\|CDD\|377629	pfam06210, DUF1003, Protein of unknown function (DUF1003). This family consists of several hypothetical bacterial proteins of unknown function.	1.69535e-44
NZ_CP016772.1\|WP_095676469.1\|1009028_1009280_+\|DUF3107-domain-containing-protein	gnl\|CDD\|378634	pfam11305, DUF3107, Protein of unknown function (DUF3107). Some members in this family of proteins are annotated as ATP-binding proteins however this cannot be confirmed. Currently no function is known.	6.8761e-21
NZ_CP016772.1\|WP_095676465.1\|1004374_1005958_+\|cysteine--tRNA-ligase	gnl\|CDD\|234705	PRK00260, cysS, cysteinyl-tRNA synthetase; Validated.	7.51487e-162
NZ_CP016772.1\|WP_095692987.1\|1008376_1009012_+\|TetR/AcrR-family-transcriptional-regulator	gnl\|CDD\|366102	pfam00440, TetR_N, Bacterial regulatory proteins, tetR family.	4.88892e-15
NZ_CP016772.1\|WP_095692710.1\|1012092_1013004_-\|DMT-family-transporter	gnl\|CDD\|223769	COG0697, RhaT, Permeases of the drug/metabolite transporter (DMT) superfamily [Carbohydrate transport and metabolism / Amino acid transport and metabolism / General function prediction only].	3.10655e-11
NZ_CP016772.1\|WP_095692715.1\|1018011_1019493_-\|leucyl-aminopeptidase-family-protein	gnl\|CDD\|238247	cd00433, Peptidase_M17, Cytosol aminopeptidase family, N-terminal and catalytic domains. Family M17 contains zinc- and manganese-dependent exopeptidases ( EC 3.4.11.1), including leucine aminopeptidase. They catalyze removal of amino acids from the N-terminus of a protein and play a key role in protein degradation and in the metabolism of biologically active peptides. They do not contain HEXXH motif (which is used as one of the signature patterns to group the peptidase families) in the metal-binding site. The two associated zinc ions and the active site are entirely enclosed within the C-terminal catalytic domain in leucine aminopeptidase. The enzyme is a hexamer, with the catalytic domains clustered around the three-fold axis, and the two trimers related to one another by a two-fold rotation. The N-terminal domain is structurally similar to the ADP-ribose binding Macro domain. This family includes proteins from bacteria, archaea, animals and plants.	4.96471e-145
NZ_CP016772.1\|WP_020045748.1\|1019508_1019688_-\|DUF3117-domain-containing-protein	gnl\|CDD\|371461	pfam11314, DUF3117, Protein of unknown function (DUF3117). This family of proteins with unknown function appears to be restricted to Actinobacteria.	5.34468e-23
NZ_CP016772.1\|WP_095692716.1\|1020053_1020503_-\|SRPBCC-family-protein	gnl\|CDD\|176854	cd07812, SRPBCC, START/RHO_alpha_C/PITP/Bet_v1/CoxG/CalC (SRPBCC) ligand-binding domain superfamily. SRPBCC domains have a deep hydrophobic ligand-binding pocket; they bind diverse ligands. Included in this superfamily are the steroidogenic acute regulatory protein (StAR)-related lipid transfer (START) domains of mammalian STARD1-STARD15, and the C-terminal catalytic domains of the alpha oxygenase subunit of Rieske-type non-heme iron aromatic ring-hydroxylating oxygenases (RHOs_alpha_C), as well as the SRPBCC domains of phosphatidylinositol transfer proteins (PITPs), Bet v 1 (the major pollen allergen of white birch, Betula verrucosa), CoxG, CalC, and related proteins. Other members of this superfamily include PYR/PYL/RCAR plant proteins, the aromatase/cyclase (ARO/CYC) domains of proteins such as Streptomyces glaucescens tetracenomycin, and the SRPBCC domains of Streptococcus mutans Smu.440 and related proteins.	7.87845e-07
NZ_CP016772.1\|WP_095692713.1\|1016257_1017376_-\|trypsin-like-peptidase-domain-containing-protein	gnl\|CDD\|273938	TIGR02037, Probable_periplasmic_serine_protease_do/HhoA-like, periplasmic serine protease, Do/DeqQ family. This family consists of a set proteins various designated DegP, heat shock protein HtrA, and protease DO. The ortholog in Pseudomonas aeruginosa is designated MucD and is found in an operon that controls mucoid phenotype. This family also includes the DegQ (HhoA) paralog in E. coli which can rescue a DegP mutant, but not the smaller DegS paralog, which cannot. Members of this family are located in the periplasm and have separable functions as both protease and chaperone. Members have a trypsin domain and two copies of a PDZ domain. This protein protects bacteria from thermal and other stresses and may be important for the survival of bacterial pathogens.// The chaperone function is dominant at low temperatures, whereas the proteolytic activity is turned on at elevated temperatures. [Protein fate, Protein folding and stabilization, Protein fate, Degradation of proteins, peptides, and glycopeptides].	1.1342e-91
NZ_CP016772.1\|WP_095676471.1\|1010642_1011254_-\|MarC-family-protein	gnl\|CDD\|225006	COG2095, MarC, Multiple antibiotic transporter [Intracellular trafficking and secretion].	5.92741e-36
NZ_CP016772.1\|WP_095676481.1\|1019800_1020001_-\|sigma-70-family-RNA-polymerase-sigma-factor	gnl\|CDD\|274357	TIGR02937, RNA_polymerase_sigma_factor, RNA polymerase sigma factor, sigma-70 family. This model encompasses all varieties of the sigma-70 type sigma factors including the ECF subfamily. A number of sigma factors have names with a different number than 70 (i.e. sigma-38), but in fact, all except for the Sigma-54 family (TIGR02395) are included within this family. Several Pfam models hit segments of these sequences including Sigma-70 region 2 (pfam04542) and Sigma-70, region 4 (pfam04545), but not always above their respective trusted cutoffs.	6.22266e-08
NZ_CP016772.1\|WP_095692707.1\|1006270_1007140_-\|N-acetyl-1-D-myo-inositol-2-amino-2-deoxy-alpha--D-glucopyranoside-deacetylase	gnl\|CDD\|274584	TIGR03445, mycothiol_MshB, N-acetyl-1-D-myo-inositol-2-amino-2-deoxy-alpha-D-glucopyranoside deacetylase. Members of this protein family are N-acetyl-1-D-myo-inositol-2-amino-2-deoxy-alpha-D-glucopyranoside deacetylase, also called 1D-myo-inosityl-2-acetamido-2-deoxy-alpha-D-glucopyranoside deacetylase, the MshB protein of mycothiol biosynthesis in Mycobacterium tuberculosis and related species. [Cellular processes, Detoxification].	4.81101e-122
NZ_CP016772.1\|WP_095692714.1\|1017388_1018015_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|226607	COG4122, COG4122, Predicted O-methyltransferase [General function prediction only].	1.54609e-31
NZ_CP016772.1\|WP_095676476.1\|1014814_1015933_-\|Mrp/NBP35-family-ATP-binding-protein	gnl\|CDD\|378455	pfam10609, ParA, NUBPL iron-transfer P-loop NTPase. This family contains ATPases involved in plasmid partitioning. It also contains the cytosolic Fe-S cluster assembling factor NBP35 which is required for biogenesis and export of both ribosomal subunits.	2.42966e-119
NZ_CP016772.1\|WP_095692708.1\|1009280_1010642_+\|DEAD/DEAH-box-helicase	gnl\|CDD\|223587	COG0513, SrmB, Superfamily II DNA and RNA helicases [DNA replication, recombination, and repair / Transcription / Translation, ribosomal structure and biogenesis].	1.80003e-147
NZ_CP016772.1\|WP_095692709.1\|1011250_1012096_-\|PHP-domain-containing-protein	gnl\|CDD\|223686	COG0613, COG0613, Predicted metal-dependent phosphoesterases (PHP family) [General function prediction only].	5.32555e-37
NZ_CP016772.1\|WP_095692712.1\|1015929_1016238_-\|Sec-independent-protein-secretion-pathway-component	gnl\|CDD\|179287	PRK01371, PRK01371, Sec-independent protein translocase protein TatB.	4.11935e-29
NZ_CP016772.1\|WP_095692717.1\|1020505_1021045_-\|TIGR00730-family-Rossman-fold-protein	gnl\|CDD\|129813	TIGR00730, LOG_family_protein_YJL055W, TIGR00730 family protein. This model represents one branch of a subfamily of proteins of unknown function. Both PSI-BLAST and weak hits by this model show a low level of similarity to and suggest an evolutionary relationship of the subfamily to the DprA/Smf family of DNA-processing proteins involved in chromosomal transformation with foreign DNA. Both Aquifex aeolicus and Mycobacterium leprae have one member in each of two branches of this subfamily, suggesting that the branches may have distinct functions. [Hypothetical proteins, Conserved].	3.626e-53

>NZ_CP016772.1|WP_095692710.1|1012092_1013004_-|DMT-family-transporter
MSEVQKATVHNHTELPARPDLIRLIIGIFGIGSSGPLIALSAMPVPTLIFWRNLGGSLMTLPFALRHKLDRTGVKWAVLAGIVLAVHFVGFFLSMRMTSVTAGTAIVATQPIFAAFFVKLTGGHIPTKAWLGMLISFTGVVVVTGIDLQLDRRSFLGDLAALISGALAAAYMLIGSRAQQTLATTSYTTICYFVCAMTALPMALLSGYDIVGFALREWWILLGLIIGAQILGHTMFNMTLKRVSPAVVSMIVFFEVPVAAIVSLVFDIGKQPTLSIIPGVILILLGCILVVLRTRPESAMTEQ
>NZ_CP016772.1|WP_095692709.1|1011250_1012096_-|PHP-domain-containing-protein
MIDLHTHTTCSDGTDAPFALVKKALAAGITTLAITDHDSTAGWEEAVSAIQPQIELVLGAEISCLTTDGISVHMLGLLFDGKNSEMQQMLSDSRDTRVPRMRKMVELMSTDGINISLDDVYRATPEGATVGRPHLADALVANGVVATRDEAFLDLLNNESKYYVTHAAPTPVDAIRVIRKAGGVAVIAHPFASRRGQIITASTFTDLVAAGLNGIEVHHRDQSADEQSTLTAIAQELNLVITGSSDYHGTGKLNGLAENTTHQAQWEQLESLADARRVVKK
>NZ_CP016772.1|WP_095676471.1|1010642_1011254_-|MarC-family-protein
MNSLGAVTFATQAFVTLFVIMDPPGATPIFLGLVGDKSPRERVRLAWQAAGVSLFVIASFALFGRFILDYMNVSIEALQAAGGLLLLYVALQLLTGNKNTGTENASDNIGMVPLGTPLLAGPGAIVATMIYVQKADTNAQILGLVIAILAVHLIIGTVLMASTKIVGLIKDSGVTLLASIAGLLLAAIAVQMLANAIKAFAAS
>NZ_CP016772.1|WP_095692708.1|1009280_1010642_+|DEAD/DEAH-box-helicase
MSLTFADLPLRKETIDALHEHGFTSPFPIQEMVMPIALADGDVIGQAKTGTGKTLAFGIPVIERVIAPNDADWAQLPNQGKPQVLIVVPTRELCVQVTKDVEELSFNRGIRTLAVYGGRAFEPQIEALNNGVEIVVGTPGRLLDLYRQGQLTLKFVSRVVLDEADEMLDLGFLPDVEKIFTSTPARQQTMLFSATMPGDIIALARRFMNQPVHIRTQDNEDEGAVVSRIEQHVIRAHAMDKIEMLARILQADGRGPTIVFCRTKRTAQKTSDDLFERGFRAATIHGDLGQSAREKALNDFKAGKSDVLIATDVAARGIDIDGITHVINYQCPEDEKTYVHRIGRTARAGAAGIAVTFVDWDDLARWKMIDTALVLGLPEPVETYSSSEHLFEMLNIPAGSSGRMTKKSAAAVDKPKTDRPKSDRPRSEKAVEPKKPAADRIKRERTRTKRISE
>NZ_CP016772.1|WP_095676469.1|1009028_1009280_+|DUF3107-domain-containing-protein
MSSKKSEKAAKVRISIINVGSELSFDCPSTPAEIKSAVTAALTAQTPLSLQDVQGHEIIVPADKIGYVEIGEPAERRVGFGVV
>NZ_CP016772.1|WP_095692987.1|1008376_1009012_+|TetR/AcrR-family-transcriptional-regulator
MSTESATANNSRSDKSRLPRDERRAILLSAALEVFTAAGYHSAAMDEIADRANVSKPVLYQHFPSKLDLYLAVLDLHIDSLVFEIQKAISSTPDNEQRVHVTIEAYFNFIENEGEAFRLLFESDMSVEPQVRERLNRMTYDCAAAVSGVISNDTGLPKEAAMMLGVGLIGYVQVTARHWLERDSKLTRQQAMDLVENLMWRGISGFPRTDS
>NZ_CP016772.1|WP_095676468.1|1007139_1008321_-|adenylyltransferase/sulfurtransferase-MoeZ
MKTPPLVTPGPALTVDEVRRYSRHLIIPDVAMAGQQRLMNAKVLCVGAGGLGSPALMYLAAAGVGTLGIVEFDTVDESNLQRQIIHGQSDIGKSKALSAKEKIAEINPYVNVILHETRLDNSNVMEIFSQYDIIVDGTDNFATRYLVNDACVLLKKPYVWGSIYRFDGQASVFWAEYGPCYRCLYPEPPPPGMVPSCAEGGVLGVLCATIGSIQTTEAIKVLTGVGEPLIGSLMVYDALDMTFRKIKVRKDPNCPLCSENATQTALLPDYEAFCGTLSEAAQEASSGSTITVQDLKAKIDNKDNFYLIDVREPSEYEIVNIPTAHLIPKQGFIDGSVLASLPQDKPIVLHCKSGVRSAECLAILKNAGFADASHVFGGVIAWAKQIDTTLPVY
>NZ_CP016772.1|WP_095692707.1|1006270_1007140_-|N-acetyl-1-D-myo-inositol-2-amino-2-deoxy-alpha--D-glucopyranoside-deacetylase
MLSSYKGYRMLLVHAHPDDETINNGSTMAMYAALGADVTLVTCTRGEEGEVLVKDLAHLAAHETDSLGEHRVGELADAMKALGISDHRFLGEGEKKYRDSGMMGTEPNNRPDVFWQADLEEASSELVKIIDEVKPHVLITYDEIGGYGHPDHIQAHRVAMRASEKSSWNIEKIYWNVMPRSVIQEGIDAMKKLGSDFMGAEKAEDLPFAKDDSFVHAMVDGNAYVEKKMDAMRAHSTQIEVDGPFFALSNNLGLQVWGNEYYTLVKGEKSEPLDSRGHEMDLFAGINPS
>NZ_CP016772.1|WP_095676466.1|1005959_1006271_-|hypothetical-protein
MQFLSSLLFGAMIAISATLVHQTLPPVGVSVGIFATYLGIWYVGRHYGKRRYKLIALSAWLAVISIAGSFGVGEELLIQGDNQGSALLTIGFVAGVVAVLRNP
>NZ_CP016772.1|WP_095676465.1|1004374_1005958_+|cysteine--tRNA-ligase
MASMSLRTQIAQALGKRATIRLRDSDGGLRDIVGVLQSETELINRRGEVVNFNPDEAVAFRVIPVFNRRDVSTGSLSIYDTKSKSLHTIAGTDGVVRIYCCGPTVYRDAHVGNLRTFLLSDLISRTLQMTGLDVSLVQNITDVGHMADDFEEDKMLAESAKTKVNPFEIARTFEDRFHIDLERLNIQPAASYPRASEKMAEMITAIEKLIAMKRAYVGSDGSVYFDATSFPTYGALSGNKLDSLQPGHRYEFTDEGGKRFHADWALWKLAGARTQMIWDSPWGAGFPGWHIECSAMSIELLDAHVDLHLGGIDLRFPHHENERAQSNSLTGNETVDTWVHGEHLLFEGRKMSKSAGNVVLLQDVIDRGLDPLSLRFALLENRYRSQMDLSWASLEAAHSTLKRWRQLLSNAGTSAEMKFDQEVSDALTTDLDTPRAMQRIRTIEKDSTIGALDKRALFLFADQVFGLDLDRGVEQREVSSEIQALLDARITARAEKNWSLSDSLREQLTNAGLEINDGAEGQSWSWK
>NZ_CP016772.1|WP_095676475.1|1014349_1014844_+|DUF1003-domain-containing-protein
MARNFGLDTPRETRRSLRGNIDPETFGRLSERFARFLGTARFLVYMTAFVLTWVLWNTLAPRDIRFDNYPFIFLTLILSLQASYAAPLILLAQNRQADRDRIALNEDRAQNARSIADTEYLTRELASLRIALGDVATRDYLRNELGDMAKEIVVELRKPESDAK
>NZ_CP016772.1|WP_095676476.1|1014814_1015933_-|Mrp/NBP35-family-ATP-binding-protein
MTTLESVHAALATVQDPELHRALPELGMVKSVEIKGSIAHLEILLTISGCPMRDRLQKDIESAVTAVEGISAIELTFGVMDEEQRANIKKLLRNGRESFISFAQKDSLTRVIGVASGKGGVGKSSLTANLAVSSAQKGLRVGILDADVYGHSIPRLMGLIGQRPTAIDQMFIPLESFGVKTVSMEMFKPERSDAIAYRGPLLHRVLEQLLSDAYWGDLDLLYIDLPPGTGDLAISLGQLVPSSEIVVVTTPQVAAAEVAERAGRIAHQIHQRVIGVIENMSAYPCAKCGELTSLFGEGGGEETSRRLSQLVGSDVPLLGKIPFSPDLREGGDAGAPVVISAPDSPSAKAIEAIVSQLIVREKSLLGVRLGLA
>NZ_CP016772.1|WP_095692712.1|1015929_1016238_-|Sec-independent-protein-secretion-pathway-component
MFFDFGAGELVGLAILAMILIGPERLPNLAVDAAKFVKRIREMASKATEELKENLGPGFEDLKPTDLNPKSFIKKQLSSVLDDDVSTPATSKRTSTIDPDLL
>NZ_CP016772.1|WP_095692713.1|1016257_1017376_-|trypsin-like-peptidase-domain-containing-protein
MSINNGGPWWDAPSKSGLGKNITLRSAIVLALVVGVIAGAFGASSSGSLFGRSVNLVKSTSAIERPAGSVAEIAQRVLPSVVSIEAKSSNGGSTGSGFVIDSSGYILTNNHVIAASVTSGGDITVRLNDGSSFDAKVVGRDSSYDLAVLKIVGASLKALQFGDSDKVAVGDSVIAIGSPLGLTGTVTLGIISAKDRAVTAGESSSENSFINALQTDAAINPGNSGGPLVDATGSVIGVNSAIASLGSSFSSQTGSIGLGFAIPINQARKTADQLIRNGKATYPVMGISVDMNFSGDGAMIAKNAQAILPGGPAAKAGLKSGDIITAIDGRPITSPEELIVTIRSLNIGDSVVVTYKRGSESKSATLTLTASK
>NZ_CP016772.1|WP_095692714.1|1017388_1018015_-|class-I-SAM-dependent-methyltransferase
MNNNPHSYAESFIAEDAVKIAARARGLELGTLDASQGTGAYLRHLAHLLDAQSVVEIGTGSGVGSLWILEGMIASGTLTSIDDEMEHTSIAKLAMADADIAQSRFRFITNSVMDVMTKLTDRAYDLVVYRHNPEDLSFAISEAHRILRSGGVFVIDNFFGGSKVHDPAQRDPKTIALREAGKLIKGDTDSWVSSLIPTGDGLLLATKL
>NZ_CP016772.1|WP_095692715.1|1018011_1019493_-|leucyl-aminopeptidase-family-protein
MLHTVAPDLEALISADVLALGFTKKNDENIELVGSARLISSLEKYFGINLIDEITFFAPSGKAGELFEIPVLHKDSTVDRLYLVAVGDGSLTSLRAAGASLGRKVRGKAIELISLVCQSRAEIRAHGVSILLGAYSWNLKTGKPAEIATIAIATKDGASVSEAGVIARALYTARDLIHTPSNIKNPLWMAQEAKKIAEEKGLSISVLAGKDLSQFGGLRAVGNSSPKPGPRFIEITYIPKGKARSAAALPYVVIVGKGITFDTGGISLKRPYEFMTAMKSDMAGAAAALATISALPDLQPQVKVTVLMMCAENSLSGTSQRPSDVITQYGGTTVEIINTDAEGRLVLADGLAYAVENLDPDYLFDIATLTGSATLGLGRQYAALYTRDEKLAKELVSIGESSGERVWHMPLIDDYQDSLESDVADLNHAADKGDYSAGSVTAALYLEHFVGDSRWVHLDIAGTGRSETDSGENAKGGTGFGVRFFIDWILSLS
>NZ_CP016772.1|WP_020045748.1|1019508_1019688_-|DUF3117-domain-containing-protein
MAAMKPRTGDGPMEVTKEARSLVMRIPLEGGGRLVVELNPQEANNLSAALEAAVALIKK
>NZ_CP016772.1|WP_095676481.1|1019800_1020001_-|sigma-70-family-RNA-polymerase-sigma-factor
MSSSSNPQTLAELLASLPEEERIILTLHYLRSKSSGEIATLLSVPERAVIVVIESGKTRLKAILGL
>NZ_CP016772.1|WP_095692716.1|1020053_1020503_-|SRPBCC-family-protein
MSSNTLSISLTIDAPREVVWKKIADWKSQGEWMLQTKVWVTSNQVEGVGTSIAAFTGPLHKFYPRLKSLGLLDLMVVTQWQPPHRCDVDHVGKVLKGSGSFQLSEINGSSTRFDWSETIVAPKVIFLLAAPFLYVGVRISLARFARSFT
>NZ_CP016772.1|WP_095692717.1|1020505_1021045_-|TIGR00730-family-Rossman-fold-protein
MRIAVFCSSSPTIDSKFIDLAFELGAGIAQSGAELVSGGGHISAMGAISRGARSQGGRTIGIIPQKLVDIEFADHDSDELIVVDSMRTRKAKIEDLSDAFITLPGGLGTLEELFEIWVGRYLKFHDKPVIILDPHGVFQPLHALVEHLENENFVKPGMRDLLHWTTTVEEAVAIAHGKK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

621036 : 628962

Cedratvirus(16.67%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_095676118.1\|621036_621789_+	Fe-S cluster assembly ATPase SufC	A0A285PWH2	Cedratvirus	1.0e-10	30.5
WP_095692436.1\|621791_623039_+	cysteine desulfurase	Q2XUY6	environmental_halophage	2.9e-108	46.7
WP_095692437.1\|623038_623482_+	SUF system NifU family Fe-S cluster assembly protein	A0A2P1CJL8	Mycobacterium_phage	7.6e-19	42.0
WP_095531491.1\|623502_623814_+	metal-sulfur cluster assembly factor	NA	NA	NA	NA
WP_095692438.1\|623833_625699_+	ABC transporter ATP-binding protein	W8CYL7	Bacillus_phage	8.4e-43	27.7
WP_095692439.1\|625660_626383_-	SURF1 family protein	NA	NA	NA	NA
WP_095676123.1\|626375_626648_-	DUF3099 domain-containing protein	NA	NA	NA	NA
WP_095692440.1\|626675_627389_+	3-oxoacyl-ACP reductase FabG	Q06VL0	Trichoplusia_ni_ascovirus	6.8e-09	27.6
WP_095676125.1\|627391_628159_+	enoyl-ACP reductase FabI	NA	NA	NA	NA
WP_190277142.1\|628338_628962_+	translation initiation factor IF-3	A0A2L0UZ54	Agrobacterium_phage	1.2e-12	31.3

DBSCAN-SWA_2

1063617 : 1075611

uncultured_virus(22.22%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_095692747.1\|1063617_1065861_-	DNA helicase PcrA	A7KV33	Bacillus_phage	2.5e-126	39.2
WP_095692748.1\|1065889_1066615_+	PIG-L family deacetylase	NA	NA	NA	NA
WP_095676867.1\|1066616_1067297_-	peptidylprolyl isomerase	A0A1V0SCU1	Indivirus	1.6e-07	34.1
WP_095692749.1\|1067308_1068859_-	glutamine-hydrolyzing GMP synthase	A0A1V0SH76	Hokovirus	2.1e-10	26.1
WP_095692750.1\|1068848_1069961_-	GuaB3 family IMP dehydrogenase-related protein	A0A0N9Q9A5	Chrysochromulina_ericina_virus	2.8e-09	31.1
WP_095676526.1\|1069963_1071076_-	IMP dehydrogenase	A0A1V0SHK8	Klosneuvirus	4.2e-58	31.8
WP_095692751.1\|1071121_1072021_-	MerR family transcriptional regulator	NA	NA	NA	NA
WP_095692752.1\|1072164_1072467_+	WhiB family transcriptional regulator	A0A0R8V0E7	Thermobifida_phage	3.6e-12	42.3
WP_095676529.1\|1072529_1074164_-	chaperonin GroEL	A0A240F779	uncultured_virus	6.1e-154	56.0
WP_095676530.1\|1074167_1074461_-	co-chaperone GroES	A0A221S3C8	uncultured_virus	3.5e-20	57.1
WP_095692753.1\|1074582_1075611_-\|tRNA	tRNA (adenosine(37)-N6)-threonylcarbamoyltransferase complex transferase subunit TsaD	A0A0R6PI74	Moraxella_phage	9.0e-63	43.8

DBSCAN-SWA_3

1205627 : 1215035

Acanthocystis_turfacea_Chlorella_virus(16.67%)

tRNA,protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_095692827.1\|1205627_1207238_-	L-aspartate oxidase	M1GXT4	Acanthocystis_turfacea_Chlorella_virus	6.2e-26	30.1
WP_095692828.1\|1207234_1208005_-	pantoate--beta-alanine ligase	NA	NA	NA	NA
WP_095692829.1\|1208055_1208502_-	2-amino-4-hydroxy-6- hydroxymethyldihydropteridine diphosphokinase	NA	NA	NA	NA
WP_095692830.1\|1208498_1208855_-	dihydroneopterin aldolase	NA	NA	NA	NA
WP_095676657.1\|1208851_1209607_-	dihydropteroate synthase	A0A0B5J4J5	Pandoravirus	3.7e-21	29.5
WP_095676658.1\|1209613_1210201_-	GTP cyclohydrolase I FolE	E7DN69	Pneumococcus_phage	2.9e-42	51.4
WP_095692831.1\|1210217_1212281_-\|protease	ATP-dependent zinc metalloprotease FtsH	C7U047	Ostreococcus_tauri_virus	1.0e-105	45.9
WP_095676660.1\|1212289_1212841_-	hypoxanthine phosphoribosyltransferase	A0A2K9L634	Tupanvirus	7.6e-08	21.3
WP_095692832.1\|1212860_1213823_-\|tRNA	tRNA lysidine(34) synthetase TilS	NA	NA	NA	NA
WP_095676662.1\|1213832_1215035_-	C40 family peptidase	A0A2L1IW19	Streptomyces_phage	3.4e-13	37.0

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP016772

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection