CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP044398	Moritella marina ATCC 15381 strain MP-1 plasmid unnamed1, complete sequence	1 crisprs	NA	0	1	0	0
NZ_CP044399	Moritella marina ATCC 15381 strain MP-1 chromosome, complete genome	3 crisprs	cas3,TnsE_C,DEDDh,DinG,csa3,RT	0	2	2	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP044398_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP044398_1

20525-20625

Orphan

Consensus_repeat	Method
ATAACTGAGTAAATCACCGTGGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP044398_1

>merge|NZ_CP044398|1|20525-20625|CRISPRCasFinder
ATAACTGAGTAAATCACCGTGGGAATATCTGAACCCTAGGTGGAAATTAATTAATAATCGCAAGAACTAACGCCTTACATAACCGAGTAAATCACCGTGGG

>NZ_CP044398|1|1|20525-20625|CRISPRCasFinder
ATAACTGAGTAAATCACCGTGGG	AATATCTGAACCCTAGGTGGAAATTAATTAATAATCGCAAGAACTAACGCCTTAC
ATAACCGAGTAAATCACCGTGGG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP044398.1\|WP_019442210.1\|13387_14416_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376986
NZ_CP044398.1\|WP_019442228.1\|22997_23984_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_019442231.1\|20969_21455_+\|VOC-family-protein	unknown	unknown	gnl\|CDD\|319968
NZ_CP044398.1\|WP_019443267.1\|17855_18299_+\|winged-helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224759
NZ_CP044398.1\|WP_019443266.1\|17441_17852_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|176871
NZ_CP044398.1\|WP_019443153.1\|16621_17137_+\|metal-dependent-hydrolase	unknown	unknown	gnl\|CDD\|377294
NZ_CP044398.1\|WP_019442233.1\|19511_19904_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_019442230.1\|21832_22000_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_151676813.1\|15745_15964_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_019629005.1\|15000_15741_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_019443152.1\|15890_16625_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_019629019.1\|19152_19443_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_019442232.1\|20361_20511_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044398.1\|WP_019442229.1\|22214_22787_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_CP044398.1\|WP_019443266.1\|17441_17852_+\|hypothetical-protein	gnl\|CDD\|176871	cd08862, SRPBCC_Smu440-like, Ligand-binding SRPBCC domain of Streptococcus mutans Smu.440 and related proteins. This family includes the SRPBCC (START/RHO_alpha_C/PITP/Bet_v1/CoxG/CalC) domain of Streptococcus mutans Smu.440 and related proteins. This domain belongs to the SRPBCC domain superfamily of proteins that bind hydrophobic ligands. SRPBCC domains have a deep hydrophobic ligand-binding pocket. Streptococcus mutans is a dental pathogen, and the leading cause of dental caries. In this pathogen, the gene encoding Smu.440 is in the same operon as the gene encoding SMU.441, a member of the MarR protein family of transcriptional regulators involved in multiple antibiotic resistance. It has been suggested that SMU.440 is involved in polyketide-like antibiotic resistance.	8.35436e-28
NZ_CP044398.1\|WP_019442210.1\|13387_14416_-\|hypothetical-protein	gnl\|CDD\|376986	pfam03090, Replicase, Replicase family. This is a family of bacterial plasmid DNA replication initiator proteins. pfam01051 is a similar family. These RepA proteins exist as monomers and dimers in equilibrium: monomers bind directly to repeated DNA sequences and thus activate replication; dimers repress repA transcription by binding an inversely repeated DNA operator. Dimer dissociation can occur spontaneously or be mediated by Hsp70 chaperones.	1.48042e-34
NZ_CP044398.1\|WP_019442231.1\|20969_21455_+\|VOC-family-protein	gnl\|CDD\|319968	cd16361, VOC_ShValD_like, vicinal oxygen chelate (VOC) family protein similar to Streptomyces hygroscopicus ValD protein. This subfamily of vicinal oxygen chelate (VOC) family protein includes Streptomyces hygroscopicus ValD protein and similar proteins. ValD protein functions in validamycin biosynthetic pathway. The vicinal oxygen chelate (VOC) superfamily is composed of structurally related proteins with paired beta.alpha.beta.beta.beta motifs that provide a metal coordination environment with two or three open or readily accessible coordination sites to promote direct electrophilic participation of the metal ion in catalysis. VOC domain is found in a variety of structurally related metalloproteins, including the bleomycin resistance protein, glyoxalase I, and type I ring-cleaving dioxygenases. A bound metal ion is required for protein activities for the members of this superfamily. A variety of metal ions have been found in the catalytic centers of these proteins including Fe(II), Mn(II), Zn(II), Ni(II) and Mg(II). The protein superfamily contains members with or without domain swapping. The proteins of this family share three conserved metal binding amino acids with the type I extradiol dioxygenases, which shows no domain swapping.	7.17542e-64
NZ_CP044398.1\|WP_019443153.1\|16621_17137_+\|metal-dependent-hydrolase	gnl\|CDD\|377294	pfam04307, YdjM, LexA-binding, inner membrane-associated putative hydrolase. YdjM is a family of putative LexA-binding proteins. Members are predicted to be membrane-bound metal-dependent hydrolases that may be acting as phospholipases. It is a member of the SOS network, that rescues cells from UV and other DNA-damage. Expression of YdjM is regulated by LexA.	4.27048e-06
NZ_CP044398.1\|WP_019443267.1\|17855_18299_+\|winged-helix-turn-helix-transcriptional-regulator	gnl\|CDD\|224759	COG1846, MarR, Transcriptional regulators [Transcription].	1.09125e-14

>NZ_CP044398.1|WP_019442232.1|20361_20511_-|hypothetical-protein
MRTFKGRIQFPSGVSQDVVVQADNQYKATQLAKSMYQGARISRSFTEVR
>NZ_CP044398.1|WP_019442233.1|19511_19904_+|hypothetical-protein
MDPILSGLLGVLVGAILGHRLSLGRDRRKEFNQATELLRKNSIIQLDSMEDDYIGTKRVTEDEIQTLRSIIGDKRSKKIAYAFKLYTQSHKNYSQSQPPSNPINPQPINISKIPECKLALKKLIKSLEPL
>NZ_CP044398.1|WP_019629019.1|19152_19443_+|hypothetical-protein
MRYYLLPILLLLPLYAQAEIPSLDSMAFAAKHQINSNAFKNAKYVQGNTFPLGKHKTAYELFYSGKYKGRSAVMQINCKAVNKTGDIEYCKPVDIK
>NZ_CP044398.1|WP_019443267.1|17855_18299_+|winged-helix-turn-helix-transcriptional-regulator
MFKVDNPTHSIGLQFWNLYTKWNAEITISLKPLGITHTQFVILAAILWREKTHNISSQSEISALTSIDKMTLSKALIKLVEKKFIVKNKAENDSRIFILTLTEIGAGLTKQAISIVEDIDEKIFGSLGAEKKAIFLSLILELKSFSS
>NZ_CP044398.1|WP_019443266.1|17441_17852_+|hypothetical-protein
MIIEESIKVNSTPEHIFSLYKDVSNWKEWDKEVKASSLIGAFKNGSFGSVTPSKGPKSKIYLSEVEENKTFTAESKLPFCVMYFEHNLTAVDNAVLVTHRVKFKGPLRFIFGYLIGKPIKVGLPVTLKGLKYSAEK
>NZ_CP044398.1|WP_019443153.1|16621_17137_+|metal-dependent-hydrolase
MKWINHILIAGSIAAVISPSLVAPAIAGATAPDWMESLLKAIGRPVKHRTTTHVFTHWLIAGIATSFLWDFHGIFAAFCWGGFSHILTDGMTVSGVPFSPYSDRRFHLFGGRFRTGEPVEYAISAVIVMISITLNAMIGDSFAPYFYDWSGLYAEGMIDASEWKANRFRLM
>NZ_CP044398.1|WP_019443152.1|15890_16625_+|hypothetical-protein
MQKWNLCTLIIATQLASISLAKAIELPWQQTEEKPTVLPFEVPRLHGQSESFKNPVNPLGSAPLIDTDSIYYAALNCYPEQSTFKISVNLVAGYKANTDQFEEDDWPDITDHYIGIVAKMPLYDTTDRSRSRDREYNRRVKTASHVAGFAQALANRNYAYREVGIYLAMEARAQARVSQGIVGVDEQIKYLEKTAGAQRNIIKTTAEATEHRLALVAMCDSEKSDRFNDYLVNVANLPKTVQTQ
>NZ_CP044398.1|WP_151676813.1|15745_15964_+|hypothetical-protein
MKKRIKSILRITTASALLTLLTFAAIPTPAGPSYLTGYIELFETHRETNAEMEFMHANYCDTASKHFACQSD
>NZ_CP044398.1|WP_019629005.1|15000_15741_+|hypothetical-protein
MRFLKIKRVSALRADGSEMKTPSIIDTPRRFAKSHERKETCIKRTKCQLITGAHDSGKTRWLERLYDDWEPIWSAKIKSQPVYISALDPVSDWVDAAHVAKWFEVQERESAEQGGGEPRNWRKLSQKQRISETARYLHETGTLLFLDDAHKLTGRKLQFVRQIMMSTRIWLMTANAENRLSPSLRTLVERASPQRTELDSDASYDATRIMLWLMIAGFTVSGVWEAALILGGLQMLGAGRNAAKPD
>NZ_CP044398.1|WP_019442210.1|13387_14416_-|hypothetical-protein
MLNSLGLSYNDVSVKVTSDVYNALPNKPYCSDSKTYAIIRSKYYAQDKPYIQVNNPNLKRYLIVDIDEQDAYSTLLDSRLPQPTYISINRVNGHLQCAWKLRDAVSTSYNSRVAPMRFLAAIDAAYNYRLGGDASFGDCLAKNPLHDRWHNEYYDTEYTLHELADYVDLREKDASNVAANDDVSGLGRNNTVFDVARKQAYKMVRKAVSKPQFQSWKADILACCESLNKQFSKPMQHNEVKNIARSIARYTFKMWALFVHSMDNFRAIQAVRGAIGGKLGSNKALSGAKGGAKSKRSGSVKKDGLLSKVLAMKSQHYNHRAIAEDLNISASTVSLWLKGARS
>NZ_CP044398.1|WP_019442231.1|20969_21455_+|VOC-family-protein
MKMNHVGIMVGDMDKAVEFYTKALGLKTVMGNTKVEEERETAIGKMCIAVFGEGFKGFNIAHLVTSDGIGVEMFEMKERQERHEVDFSRIGIFHFCLQTDDFDGVIARTEEYGGKVRMDIHRYHPEDDSKQAQMVYLEDPFGNLFELYSHTYEETYASDYE
>NZ_CP044398.1|WP_019442230.1|21832_22000_+|hypothetical-protein
MSKLYNLGYALGSMINKEKPAEPVQEQSVKRTAQSFTTTRRVQVKAHTRNYPQSK
>NZ_CP044398.1|WP_019442229.1|22214_22787_+|hypothetical-protein
MDIIFVDAENIGLKELEKLETSIIDKVFVFSKSNCIKLVCEKKLYLFLSDYPCGSNQADFYIIAYLSRVLSSLNHTELTSINFKLITNDESLISAFGFQCSQLGGISKIIKTNEKIKTDVNTVVQLTPVLAPKSVEEKIIFHLKSPETLNPEFRKKLGISQQDFSRATGELIRQNKIKRSKGSKKKWVTR
>NZ_CP044398.1|WP_019442228.1|22997_23984_-|hypothetical-protein
MKNKLLVMLISLIPLIALYAPVTFAAQNIDTCEQLLDIPNRATETYMLTQDVDCNGYVQNKAIDFKGKLDGHGYRVIGLEVQYDDNYMGLFSRIIGGSVIRLGLDSMVITGNKGNTAVGLLAGNVAYDSLITDIEINASSISITESVSNGLGLLVGYVSDQSQLEGIRSYNSQIDTTDKAKHVGGLVGVLKESSLSLASVDENKISISYDLGGNVSVGGIIGTLEKSVTSDVTIESSHILADEIDRGYGAQFIGKMNKSRLVNALSINNYIEYLSAGTHWNPAIAAGYINGDFGLIPTLENIRVSSSNDFPWYNSASDVLTKDLQIMK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP044398_1	1.1\|20548\|55\|NZ_CP044398\|CRISPRCasFinder	20548-20602	55	NZ_CP044398	Moritella marina ATCC 15381 strain MP-1 plasmid unnamed1, complete sequence	20548-20602	0	1.0

1. spacer 1.1|20548|55|NZ_CP044398|CRISPRCasFinder matches to NZ_CP044398 (Moritella marina ATCC 15381 strain MP-1 plasmid unnamed1, complete sequence) position: , mismatch: 0, identity: 1.0

aatatctgaaccctaggtggaaattaattaataatcgcaagaactaacgccttac	CRISPR spacer
aatatctgaaccctaggtggaaattaattaataatcgcaagaactaacgccttac	Protospacer
*******************************************************

Prophage detection

Region	Region Position	Protein_number	Hit_taxonomy	Key_proteins	Att_site	Prophage annotation

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP044399_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP044399_1

74968-75080

Orphan

Consensus_repeat	Method
AGCAGACCCCCTCCCAGCCTCCCCCTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP044399_1

>merge|NZ_CP044399|1|74968-75080|CRISPRCasFinder
AGCAGACCCCCTCCCAGCCTCCCCCTTGCAGTTAAAGGGGAGGAGCAGACCCCCTCCCAACCTCCCCCTTGAAGTTAAAGGGGAGGAGCAGACCCCCTCCCAACCTCCCCCTT

>NZ_CP044399|1|1|74968-75080|CRISPRCasFinder
AGCAGACCCCCTCCCAGCCTCCCCCTT	GCAGTTAAAGGGGAGGAGCAGACCCCCTCCCAACCTCCCCCTTGAAGTTAAAGGGGAGG
AGCAGACCCCCTCCCAACCTCCCCCTT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP044399.1\|WP_019440385.1\|82995_83910_-\|recombination-associated-protein-RdgC	unknown	unknown	gnl\|CDD\|234726
NZ_CP044399.1\|WP_019440395.1\|71877_73995_+\|polyribonucleotide-nucleotidyltransferase	unknown	unknown	gnl\|CDD\|236995
NZ_CP044399.1\|WP_019440386.1\|81338_82493_-\|Na/Pi-symporter	unknown	unknown	gnl\|CDD\|162157
NZ_CP044399.1\|WP_019440391.1\|77366_77909_+\|SCP2-domain-containing-protein	unknown	unknown	gnl\|CDD\|225696
NZ_CP044399.1\|WP_019440396.1\|71396_71666_+\|30S-ribosomal-protein-S15	unknown	unknown	gnl\|CDD\|180170
NZ_CP044399.1\|WP_019440401.1\|65023_65482_+\|ribosome-maturation-factor-RimP	unknown	unknown	gnl\|CDD\|173103
NZ_CP044399.1\|WP_019440392.1\|76149_77145_-\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|223896
NZ_CP044399.1\|WP_019440390.1\|78127_78706_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377026
NZ_CP044399.1\|WP_019440393.1\|75166_76048_-\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|237968
NZ_CP044399.1\|WP_019440399.1\|67022_69719_+\|translation-initiation-factor-IF-2	unknown	unknown	gnl\|CDD\|235401
NZ_CP044399.1\|WP_019440402.1\|64004_64325_+\|preprotein-translocase-subunit-SecG	unknown	unknown	gnl\|CDD\|235881
NZ_CP044399.1\|WP_019440388.1\|79467_79731_-\|YfhL-family-4Fe-4S-dicluster-ferredoxin	unknown	unknown	gnl\|CDD\|131747
NZ_CP044399.1\|WP_019440394.1\|74075_74963_+\|lipoprotein-NlpI	unknown	unknown	gnl\|CDD\|236875
NZ_CP044399.1\|WP_019440389.1\|78748_79333_+\|ribosomal-protein-S5-alanine-N-acetyltransferase	unknown	unknown	gnl\|CDD\|182749
NZ_CP044399.1\|WP_019440400.1\|65496_66996_+\|transcription-termination/antitermination-protein-NusA	unknown	unknown	gnl\|CDD\|236410
NZ_CP044399.1\|WP_019440387.1\|79757_81128_-\|tRNA-5-hydroxyuridine-modification-protein-YegQ	unknown	unknown	gnl\|CDD\|237969
NZ_CP044399.1\|WP_019440403.1\|62409_63744_+\|phosphoglucosamine-mutase	unknown	unknown	gnl\|CDD\|236787
NZ_CP044399.1\|WP_019440398.1\|69796_70222_+\|30S-ribosome-binding-factor-RbfA	unknown	unknown	gnl\|CDD\|234787
NZ_CP044399.1\|WP_019440397.1\|70224_71190_+\|tRNA-pseudouridine(55)-synthase-TruB	unknown	unknown	gnl\|CDD\|235333
NZ_CP044399.1\|WP_019440384.1\|84307_84994_+\|phosphate-regulon-transcriptional-regulator-PhoB	unknown	unknown	gnl\|CDD\|131209

Protein	Function_ID	Function_description	E-value
NZ_CP044399.1\|WP_019440385.1\|82995_83910_-\|recombination-associated-protein-RdgC	gnl\|CDD\|234726	PRK00321, rdgC, recombination associated protein; Reviewed.	6.57606e-174
NZ_CP044399.1\|WP_019440395.1\|71877_73995_+\|polyribonucleotide-nucleotidyltransferase	gnl\|CDD\|236995	PRK11824, PRK11824, polynucleotide phosphorylase/polyadenylase; Provisional.	0
NZ_CP044399.1\|WP_019440386.1\|81338_82493_-\|Na/Pi-symporter	gnl\|CDD\|162157	TIGR01013, Sodium-dependent_phosphate_transport_protein, Phosphate:Na+ Symporter (PNaS) Family. [Transport and binding proteins, Cations and iron carrying compounds].	1.06039e-40
NZ_CP044399.1\|WP_019440391.1\|77366_77909_+\|SCP2-domain-containing-protein	gnl\|CDD\|225696	COG3154, COG3154, Putative lipid carrier protein [Lipid metabolism].	3.22491e-53
NZ_CP044399.1\|WP_019440396.1\|71396_71666_+\|30S-ribosomal-protein-S15	gnl\|CDD\|180170	PRK05626, rpsO, 30S ribosomal protein S15; Reviewed.	4.66426e-50
NZ_CP044399.1\|WP_019440401.1\|65023_65482_+\|ribosome-maturation-factor-RimP	gnl\|CDD\|173103	PRK14640, PRK14640, hypothetical protein; Provisional.	5.4903e-85
NZ_CP044399.1\|WP_019440392.1\|76149_77145_-\|U32-family-peptidase	gnl\|CDD\|223896	COG0826, COG0826, Collagenase and related proteases [Posttranslational modification, protein turnover, chaperones].	7.22038e-107
NZ_CP044399.1\|WP_019440390.1\|78127_78706_+\|hypothetical-protein	gnl\|CDD\|377026	pfam03358, FMN_red, NADPH-dependent FMN reductase.	3.78408e-14
NZ_CP044399.1\|WP_019440393.1\|75166_76048_-\|U32-family-peptidase	gnl\|CDD\|237968	PRK15447, PRK15447, putative protease; Provisional.	3.35875e-171
NZ_CP044399.1\|WP_019440399.1\|67022_69719_+\|translation-initiation-factor-IF-2	gnl\|CDD\|235401	PRK05306, infB, translation initiation factor IF-2; Validated.	0
NZ_CP044399.1\|WP_019440402.1\|64004_64325_+\|preprotein-translocase-subunit-SecG	gnl\|CDD\|235881	PRK06870, secG, preprotein translocase subunit SecG; Reviewed.	3.39565e-24
NZ_CP044399.1\|WP_019440388.1\|79467_79731_-\|YfhL-family-4Fe-4S-dicluster-ferredoxin	gnl\|CDD\|131747	TIGR02700, Uncharacterized_protein_MJ0208, archaeoflavoprotein, MJ0208 family. This model describes one of two paralogous families of archaealflavoprotein. The other, described by TIGR02699 and typified by the partially characterized AF1518 of Archaeoglobus fulgidus, is a homodimeric FMN-containing flavoprotein that accepts electrons from ferredoxin and can transfer them to various oxidoreductases. The function of this protein family is unknown. [Unknown function, General].	9.29384e-06
NZ_CP044399.1\|WP_019440394.1\|74075_74963_+\|lipoprotein-NlpI	gnl\|CDD\|236875	PRK11189, PRK11189, lipoprotein NlpI; Provisional.	6.35724e-114
NZ_CP044399.1\|WP_019440389.1\|78748_79333_+\|ribosomal-protein-S5-alanine-N-acetyltransferase	gnl\|CDD\|182749	PRK10809, PRK10809, 30S ribosomal protein S5 alanine N-acetyltransferase.	2.6861e-69
NZ_CP044399.1\|WP_019440400.1\|65496_66996_+\|transcription-termination/antitermination-protein-NusA	gnl\|CDD\|236410	PRK09202, nusA, transcription elongation factor NusA; Validated.	0
NZ_CP044399.1\|WP_019440387.1\|79757_81128_-\|tRNA-5-hydroxyuridine-modification-protein-YegQ	gnl\|CDD\|237969	PRK15452, PRK15452, putative protease; Provisional.	0
NZ_CP044399.1\|WP_019440403.1\|62409_63744_+\|phosphoglucosamine-mutase	gnl\|CDD\|236787	PRK10887, glmM, phosphoglucosamine mutase; Provisional.	0
NZ_CP044399.1\|WP_019440398.1\|69796_70222_+\|30S-ribosome-binding-factor-RbfA	gnl\|CDD\|234787	PRK00521, rbfA, 30S ribosome-binding factor RbfA.	8.75683e-51
NZ_CP044399.1\|WP_019440397.1\|70224_71190_+\|tRNA-pseudouridine(55)-synthase-TruB	gnl\|CDD\|235333	PRK05033, truB, tRNA pseudouridine synthase B; Provisional.	0
NZ_CP044399.1\|WP_019440384.1\|84307_84994_+\|phosphate-regulon-transcriptional-regulator-PhoB	gnl\|CDD\|131209	TIGR02154, PhoB, phosphate regulon transcriptional regulatory protein PhoB. PhoB is a DNA-binding response regulator protein acting with PhoR in a 2-component system responding to phosphate ion. PhoB acts as a positive regulator of gene expression for phosphate-related genes such as phoA, phoS, phoE and ugpAB as well as itself. It is often found proximal to genes for the high-affinity phosphate ABC transporter (pstSCAB; GenProp0190) and presumably regulates these as well. [Regulatory functions, DNA interactions, Signal transduction, Two-component systems].	5.83863e-134

>NZ_CP044399.1|WP_019440394.1|74075_74963_+|lipoprotein-NlpI
MKRCLSLLIVTALLSGCSSLSGSFSTDDRTPSELILAEPLQVNYQTEIMLMRYSQLILDAKDDRSRQARYFYERGLLADSMGLRSLAHADFQRSLTLQPDFVPAYNFIGLYMTQTEQFDEAYDAYDSIAQLDPENNYVLLNRGIALYYGERYRLATDDLISAYNESPNDPFRTLWLYYPEYEVSPQDALAAVKTRYSQHIDNNWSWNIVALYTQELSETQLLAKLLDGLDKTDPAYNKILAHRLTETYFYLGKYKLLSNDNRAAESYFKLALSNNVYEFIEHGYARLELSRLAAK
>NZ_CP044399.1|WP_019440395.1|71877_73995_+|polyribonucleotide-nucleotidyltransferase
MNPIVKSFKYGQHTVTLETGVIARQATAAVMASIGDTSVLVSVVGKKQAEAGRDFFPLTVNYQERTYAAGKIPGGFFKREGRPSEGETLTCRLIDRPIRPLFPAGFKNEVQVVATVVSVNPEIQPDLVALIGVSAALSISGMPFNGPIGAARIGFQNDEYILNPSTSELAESKLDLVVAGTENAVLMVESEAEILSEEQMLGAVVYGHEQMQVVIEAVKEFAAEVNTPKWDWSAPVVNTELKAKIAELASGELAEAYQIQEKTERYAKVGGIKSAAIAKLQEENEELNTREAGELLGSLEKNIVRNRILDGEPRIDGRDPEMIRALSVMTGVLPRTHGSSLFTRGETQALVTATLGTERDAQRIDSLTGETVDRFLMHYNFPPYCVGETGMVGSPKRREIGHGRLAKRGVLAVMPNADEFPYTVRVVSEITESNGSSSMASVCGTSLALMDAGVPIKASVAGIAMGLVLDGDRSVVLSDILGDEDHLGDMDFKVAGSTGGITALQMDIKIEGITKEIMQKALVQAKAARLHILSVMDQAIATNRDDVSEFAPRIHTIKINTDKIKDIIGKGGATIRALTEETGTTIEIEDDGTVKIAATSGEQAQAAIERIHQLTAEVEVGQIYEGKVVRLADFGAFVNILPGKDGLVHISQITQERVNKVADHLSVEQVVKVKVLEVDRQGRIRLSIKEAMDAPAAPAEQPVSE
>NZ_CP044399.1|WP_019440396.1|71396_71666_+|30S-ribosomal-protein-S15
MSLSAEAKAVIVADFARQEGDTGSTEVQVALLTAQINHLQGHFKKHIHDHHSRRGLLRMVASRRKLLDYLKRTENVRYADLIARLGLRR
>NZ_CP044399.1|WP_019440397.1|70224_71190_+|tRNA-pseudouridine(55)-synthase-TruB
MSGRRRRWNGRDVHGVFLLDKPTGISSNDALQRVKKIFFAAKAGHTGALDPLATGMLPLCFGEATKFSQFLLDSDKRYIVTAKLGERTDTSDSHGEIVQTRTVNVSDAELLIALDTFRGDTKQVPSMFSALKHEGKPLYWYARQGIFIDRPARPISVFELKLLSFENDEVNLEIHVSKGTYIRTIVDDLGELLGCGAHVSMLRRIGVSAYPAERMMTFEQLEEMVEQAKAAGVEPKDVLDPLLMPLDSAVSHLPEANMSEETGGFVLHGQPVVVPNTPESGLVRMTVGDERAFIGVGAIDDQGRVAPKRIVNYETQAREAK
>NZ_CP044399.1|WP_019440398.1|69796_70222_+|30S-ribosome-binding-factor-RbfA
MAKEFSRSRRVAQQLQQEIARILQREVKDPRVGMVTVSSIDLSRDLSYAKVYVTFFNIDNDEERIKDGIAALDTASGYIRSLVGSSMKLRIVPELRFIYDNTLVEGMRLSSLVTEVRAKDKKLQDDYGTTADEKDASEGES
>NZ_CP044399.1|WP_019440399.1|67022_69719_+|translation-initiation-factor-IF-2
MADVSITKLAEDIGTTVDRLVQQFSDAGIAKANDSTVNEGEKQTLLVHLSEQHGSDTAEPSRLTLQRKTKSTLSVASGGGKQKSVAVEVRKKRTYVKRTAAEDEAQLAEEKAAAEAAELKAQAEAKAQAKAQADAQAKEKADAEAKAKRDAADKAKRDTKQKTTKSKEADDMAKREAEALKQKQEQEATRKAELEAQQKAEEARKLAEENSGRWAAEEAERAKTEKSADYHVTTSTHAQAAEDDADAQAQKGERKKKPVAPVTEAAKPAPKGKGKARKAKGRKPDNRYNRHQGKSVNAPEGMQQGFNKPVAKVERDVRIGETISVSELAQKMAIKATEIIKYMMKQGSMVTINQVLDQETAQLVAEDMGHKVILVKENALEEAVLADAQDVTQGVKVTRAPVVTIMGHVDHGKTSLLDYIRRAKVADGEAGGITQHIGAYHVETENGMVSFLDTPGHAAFTSMRARGAQATDIVVLVVAADDGVMPQTIEAIHHAKAAGVPLIIAVNKMDKEGADTDRVKSELAQHNVMPEDWGGENMFVYVSAKAGTGVDELLEAILLQADVLELEAVATGPAAGVVIESRLDKGRGPVATVLVQQGELKQGDIVLCGLEYGRVRAMRDENGKAIESAGPSIPVEILGLSGVPQSGDEATVVRDEKKAREVALYRQGKFRDVKLARQQKSKLDNMFANMEAGEVSELNIVLKADVQGSLEALCDSLVKLSTDEVKVAIITRGVGGITETDVTLAAASNAIVLGFNVRADAKAREVVSNESVDLRYYSVIYDVIDEVRQAMSGLLAPEFRQEIIGLAEVRDVFKSPKIGSIAGCMVTEGIIKRSAPIRVLRDNIVIYEGELESLRRFKDDVQEVRMGIECGIGVKNYNDVRVGDQIEVFETVEIKRTL
>NZ_CP044399.1|WP_019440400.1|65496_66996_+|transcription-termination/antitermination-protein-NusA
MNKEILLVVDAVSNEKALPREKIFEAMEIALATATKKRYEGEIEVRVEIDRKTGNFETFRRWLVIDDKGEALENPFSEITLDAAKFDDETIEVGGYIEDTIESVVFDRVTTQTAKQVIIQKVREAERDLIVQQYAKHEGELITGLVKRANRETVVLDLGNNAEAVMFKDEMLPRESFRTGDRIKGLLKEVKPEARGTQLFISRACNEMLIELFRVEVPEFNEEMLELKAAARDPGSRAKIAVKSNDKRIDPVGACVGMRGARVQAVSSELNGERVDIILWDDNPAQFVINAMAPAEVASIIVDEDQHSMDIAVEQDNLAQAIGRNGQNVRLASQLTGWELNVMTVAEANEKHQKENDRLMNIFTDKLDIDEDMAELLIGEGFSSLEEIAYVPVNEFLQIDGFDEDLVDELRSRAKNALTTSALAAEESLEGAEPSADLLALEGLEKHLAYVLASIGVTTLEELAEQGIDDLSEIEELTDERAGELIMAARNICWFSDSE
>NZ_CP044399.1|WP_019440401.1|65023_65482_+|ribosome-maturation-factor-RimP
MASLEQTLTELLEPTVEMLGFDLIGIEFTRAGKHSTLLVYIDHENGIFVDDCSKVSHQISAIMDVEDPITTEYFLEVSSPGMERPLFKVAHYAEYCGSEIKALLRMAVNGRRKFKGVIKSVDGEMITVTIDGKDEVLAHANIQKANIVPKFD
>NZ_CP044399.1|WP_019440402.1|64004_64325_+|preprotein-translocase-subunit-SecG
MYEVIIVIYLIVALAIIGFVLMQQGKGADMGASFGSGGSNTVFGSGGSGNFLTRVTAILAVVFFALSLVLGNLSTQSETDVILDAEKPVITSDVPVSPVDNSDVPQ
>NZ_CP044399.1|WP_019440403.1|62409_63744_+|phosphoglucosamine-mutase
MSRKYFGTDGIRGLVGKAPITPEFVLKLGWAAGKVLAQQGTKKVLIGKDTRISGYMLESALEAGLSAAGLDAAFMGPMPTPAVAYLTRTFRAEAGIVISASHNPYHDNGIKFFSANGTKLPDEVELAIEAQLEKELTCVESALLGKAVRIDDAAGRYIEYCKSTFPSRASLKGLKIVLDCAHGATYHIAPSVFKELGAEIIPIGVSPNGLNINDGCGATEPAALAARVLAEKADLGVAYDGDGDRLMMVDHTGYVIDGDEILYIMAREALRNGELKGGVVGTLMANMGLEVALKSLGIPFARSAVGDRYVVEMLLEKGWRIGGENSGHIISLDHTTTGDGIVSSLLVLAAMINSGLTLQELRSGMSKFPQVLVNVRFSGDSDPLLAESVLAAVKDVEQELADRGRVLLRKSGTEPLIRVMVEGEDETHVLALANKIADAVKATF
>NZ_CP044399.1|WP_019440393.1|75166_76048_-|U32-family-peptidase
MKYALGPILYYWPKQQVEDFYTAAVNSDADIIYLGETVCSKRRELKPKDWLGLAKEIANSGKQVVISTMALLEAPSEVNILRKYCENGDFIVEANDFGAINLLAEAKTPFVCGHALNVYNAQVLQLLVNKGMQRWVMPVELSRDWLVQLQEDSRLLNIRDQFEIEVFAHGHLPLAYSARCFTARSENRAKDDCELCCINHANGKPVYSQDDKELFTINGIQTMSGYKYNLLNDVASMQDLVDVVRVSPLGDSAFETLGQFKQAAEDNIKFDLKLDRECNGYWHQIAGFDTVTT
>NZ_CP044399.1|WP_019440392.1|76149_77145_-|U32-family-peptidase
MELLCPAGNLPALKTAVDNGADAVYIGFKDDTNARHFAGLNFTDKKLDKAVDYIRSNNRHLHVAINTFAHPGKLERWERAVDRCADMGVDAAIISDVAVLDYATKKYPDLELHLSVQASATNVEAINFYTNNFNVSRVVLPRVLSIHQVKQLARNTDVELEVFAFGSLCIMAEGRCYLSSYLTGESPNTVGACSPAKFVRWEETEQGLESRLNDVLIDRYQPEEKTGYPTLCKGRFNVDGKVFHALEEPTSLNTLALIPELAQANIAAVKIEGRQRSPAYTEQVTKVWRAALDRYRQDPAQYQVETAWNKQLDQLSEGTSTTLGAYHRDWQ
>NZ_CP044399.1|WP_019440391.1|77366_77909_+|SCP2-domain-containing-protein
MLHSLHRKLVHTVPTLLAIPAKVLPFSLQEKVLSQVFNKVFAEALADDEFEFLEQKWLQVEITDLGINWFISCVDNKLVIAPCAATVDVSFKGNLNELVLITARKEDPDTLFFQRRLKIEGDTELGLEVKNMLDSFDLDELPTAVTTLLAYVAEFIQQGLADPVLSNELSSSTVKNKTMA
>NZ_CP044399.1|WP_019440390.1|78127_78706_+|hypothetical-protein
MRLVVISGSTRNRSTTIKVAQSVLQLAEQSQLFSKINLLDFVKVSLPIWDKAIQNEFDDWQDEWQVTAQLIRSADAIIIVSPEWEEESLDNFYAFCQHDDFPLLPCAVLRVGSNCRGAYSSTELAMANFCKNHTCLILEHFIVATIESVNNCKETYYPFETPLVERILANLGLMKQLVDNGGLLSPTRLHLA
>NZ_CP044399.1|WP_019440389.1|78748_79333_+|ribosomal-protein-S5-alanine-N-acetyltransferase
MSSKFPQFATERLIIRVAVASDAEKLCQYYIRNQVHLAPWEPIRSEVYYTLRWWQLRVEQIHIEFNAASAINFIAIDRDTSEIVAVANFSNIIQGVFKSCYLGYSISKAYEGRGLMVEFLQSCLAFMFENVGLNRVMANYIPVNERSGALLQRLGFEREGYARQYLKIAGVWQDHVLTALLHADWSARNRNSDN
>NZ_CP044399.1|WP_019440388.1|79467_79731_-|YfhL-family-4Fe-4S-dicluster-ferredoxin
MALLINDKCINCDMCDPECPNGAITFGAKIYEIDPLLCTECVGHYDKPTCKTVCPINCIITDPDNVEKEETLWEKFVMIQEATKATR
>NZ_CP044399.1|WP_019440387.1|79757_81128_-|tRNA-5-hydroxyuridine-modification-protein-YegQ
MFTPELLSPAGSLKNMRYAFAYGADAVYAGQPRYSLRVRNNEFSLENLAVGINEAHALGKQFYVVCNIQPHNSKLKTFIRDLTPIIAMKPDAIIMSDPGLIMMVREAFPDMVIHLSVQANAVNWATVKFWYTQGIKRVILSRELSLDEIEDIRFHCPDMEIEVFVHGALCMAYSGRCLLSGYINKRDPNQGSCTNSCRWKYDAHDATENETGDIVATKPEIYMPETDSPEPTLGEGKPTDQIFLLQEQGRPNEYMPAFEDEHGTYIMNSKDLRAIQHVERLTKMGVHSLKIEGRTKSFYYCARTAQVYKQAINDAVAGRDFDPSLLGTLEHLAHRGYTEGFLSRHTHDAYQNYDYGYSISETQQFVGELNGRNDKGFAEVIVKNKFLVGDSLELMTPQGNMTFKLEELENRKGESMEYAPGSGHIVYLPVPEEVELDHALLMRNFANSEDTRNPHK
>NZ_CP044399.1|WP_019440386.1|81338_82493_-|Na/Pi-symporter
MKNNNEAIELNPSTMQKVFSWVSVAALVYFVLVAVSTVSGGFKMFSGGSAGAEQIFAFATNPFVALLLGILVTALVQSSSTVTSVIVGLVAGGLPLSIAIPMVMGANMGTTITNTFVSMGHIRDKKEFERAFSAATVHDFFNLLAVAIFLPLEIAFGILEKMATFLADFFVSDSSLSIKEFNFIKPLTKPAVNQIKELAGSLPVESNTVGLVMVFIGIFMIGFSVTFLGKVLKSVMVGRAKAVLHGAIGRGPVSGILSGTAVTVMVQSSSTTTSLMIPLAGSGVFTTRQIFPFTLGANIGTTITALLAATSISGEFAQVAMTIALVHVMFNVFAVALIYGIPFLREIPIKCSEALARQGTENKFIAFGYVVGAFFALPGLMIIF
>NZ_CP044399.1|WP_019440385.1|82995_83910_-|recombination-associated-protein-RdgC
MWFKNLLIYRFTRPFELDIEQLETKLADFPFTPCGSQDLSKFGWIKPLGKSGQALTHGISDNILICAKKEDRVLPASVVKDMLQEKVDSIEAEQGRGLKKKEKDALKEDIVHQLLPRAFPRSSQTFAWICPSQDLLVVDASSAKKAEDLIALLRKCVGSLPVVPVALTTPADITMTEWLNKGNAAPGFELGDEAELRSALEHGGIIRCKEQDLTSEEIQHHLNADKLVTKLALDWSESLSFLLGDDMSVKRLKFSDLIKEQNDDVATDDYAAKFDADFALMTGELMRFIPELITALGGEESTAK
>NZ_CP044399.1|WP_019440384.1|84307_84994_+|phosphate-regulon-transcriptional-regulator-PhoB
MSKRILVVEDELAIREMLCFALEQKGFDVVEAGDYPEAVERLVEPYPDLILLDWMLPGGSGIKYIKHLKSQPHSSAIPVVMLTARGEEEDKVKGLEVGADDYITKPFSPKELIARLNAVMRRVAPMTQDSVIDISGLQLDPVAHRVSAGDEVIDIGPTEFKLLHFFMTHTERVYSREQLLDNVWGMNVYVEDRTVDVHIRRLRKALTPSEHDKYVQTVRGAGYRFSVR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP044399_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP044399_2

1013664-1013774

Orphan

Consensus_repeat	Method
ATCTTCAAGTGTCGTACTGGTGACATT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP044399_2

>merge|NZ_CP044399|2|1013664-1013774|CRISPRCasFinder
ATCTTCAAGTGTCGTACTGGTGACATTCTCATCTTTAGGGGCATCTTCAAGTGTTGTACTGGTGACATTCTCATCTTTAGGGACATCTTCAAGTGTCGTATTGGTGACATT

>NZ_CP044399|2|2|1013664-1013774|CRISPRCasFinder
ATCTTCAAGTGTCGTACTGGTGACATT	CTCATCTTTAGGGGCATCTTCAAGTGTTGTACTGGTGACATTCTCATCTTTAGGGAC
ATCTTCAAGTGTCGTATTGGTGACATT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP044399.1\|WP_019442874.1\|1008527_1008827_+\|Dabb-family-protein	unknown	unknown	gnl\|CDD\|369566
NZ_CP044399.1\|WP_019442876.1\|1007616_1008030_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019442865.1\|1020047_1021583_+\|Re/Si-specific-NAD(P)(+)-transhydrogenase-subunit-beta	unknown	unknown	gnl\|CDD\|236520
NZ_CP044399.1\|WP_019442880.1\|1003442_1005395_-\|DUF3413-domain-containing-protein	unknown	unknown	gnl\|CDD\|225625
NZ_CP044399.1\|WP_019442868.1\|1016472_1017177_-\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NZ_CP044399.1\|WP_019442871.1\|1012433_1013231_-\|response-regulator	unknown	unknown	gnl\|CDD\|381150
NZ_CP044399.1\|WP_019442877.1\|1006869_1007364_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019442863.1\|1022306_1023533_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376290
NZ_CP044399.1\|WP_019442869.1\|1015013_1016423_-\|HAMP-domain-containing-histidine-kinase	unknown	unknown	gnl\|CDD\|223715
NZ_CP044399.1\|WP_019442881.1\|1002729_1003407_+\|protein-phosphatase	unknown	unknown	gnl\|CDD\|277367
NZ_CP044399.1\|WP_019442879.1\|1005413_1005644_-\|DUF1414-domain-containing-protein	unknown	unknown	gnl\|CDD\|237471
NZ_CP044399.1\|WP_019442872.1\|1011381_1012299_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176132
NZ_CP044399.1\|WP_019442878.1\|1005724_1006759_+\|nucleoid-associated-protein-YejK	unknown	unknown	gnl\|CDD\|178993
NZ_CP044399.1\|WP_019442860.1\|1027254_1028100_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019442873.1\|1008910_1011199_-\|5-methyltetrahydropteroyltriglutamate---homocysteine-S-methyltransferase	unknown	unknown	gnl\|CDD\|235367
NZ_CP044399.1\|WP_019442867.1\|1017399_1017855_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019442861.1\|1025072_1026533_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|274008
NZ_CP044399.1\|WP_019442862.1\|1023878_1025024_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019442864.1\|1021809_1022220_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019442866.1\|1018497_1020036_+\|Re/Si-specific-NAD(P)(+)-transhydrogenase-subunit-alpha	unknown	unknown	gnl\|CDD\|236507

Protein	Function_ID	Function_description	E-value
NZ_CP044399.1\|WP_019442874.1\|1008527_1008827_+\|Dabb-family-protein	gnl\|CDD\|369566	pfam07876, Dabb, Stress responsive A/B Barrel Domain. The function of this family is unknown, but it is upregulated in response to salt stress in Populus balsamifera. It is also found at the C-terminus of an fructose 1,6-bisphosphate aldolase from Hydrogenophilus thermoluteolus. Arthrobacter nicotinovorans ORF106 is found in the pA01 plasmid, which encodes genes for molybdopterin uptake and degradation of plant alkaloid nicotine. The structure of one has been solved and the domain forms an a/b barrel dimer. Although there is a clear duplication within the domain it is not obviously detectable in the sequence.	9.06265e-25
NZ_CP044399.1\|WP_019442861.1\|1025072_1026533_-\|hypothetical-protein	gnl\|CDD\|274008	TIGR02168, Chromosome_partition_protein_Smc, chromosome segregation protein SMC, common bacterial type. SMC (structural maintenance of chromosomes) proteins bind DNA and act in organizing and segregating chromosomes for partition. SMC proteins are found in bacteria, archaea, and eukaryotes. This family represents the SMC protein of most bacteria. The smc gene is often associated with scpB (TIGR00281) and scpA genes, where scp stands for segregation and condensation protein. SMC was shown (in Caulobacter crescentus) to be induced early in S phase but present and bound to DNA throughout the cell cycle. [Cellular processes, Cell division, DNA metabolism, Chromosome-associated proteins].	0.000340799
NZ_CP044399.1\|WP_019442865.1\|1020047_1021583_+\|Re/Si-specific-NAD(P)(+)-transhydrogenase-subunit-beta	gnl\|CDD\|236520	PRK09444, pntB, Re/Si-specific NAD(P)(+) transhydrogenase subunit beta.	0
NZ_CP044399.1\|WP_019442880.1\|1003442_1005395_-\|DUF3413-domain-containing-protein	gnl\|CDD\|225625	COG3083, COG3083, Predicted hydrolase of alkaline phosphatase superfamily [General function prediction only].	1.40142e-177
NZ_CP044399.1\|WP_019442868.1\|1016472_1017177_-\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	6.19319e-90
NZ_CP044399.1\|WP_019442863.1\|1022306_1023533_-\|hypothetical-protein	gnl\|CDD\|376290	pfam18871, HEPN_Toprim_N, HEPN/Toprim N-terminal domain 1. Alpha + beta domain. Fused to two distinct HEPN families: MAE_28990 and ERFG_01251 families, TOPRIM and a Mrr-like REase domain.	7.50017e-37
NZ_CP044399.1\|WP_019442869.1\|1015013_1016423_-\|HAMP-domain-containing-histidine-kinase	gnl\|CDD\|223715	COG0642, BaeS, Signal transduction histidine kinase [Signal transduction mechanisms].	1.15266e-56
NZ_CP044399.1\|WP_019442881.1\|1002729_1003407_+\|protein-phosphatase	gnl\|CDD\|277367	cd07424, MPP_PrpA_PrpB, PrpA and PrpB, metallophosphatase domain. PrpA and PrpB are bacterial type I serine/threonine and tyrosine phosphatases thought to modulate the expression of proteins that protect the cell upon accumulation of misfolded proteins in the periplasm. The PPP (phosphoprotein phosphatase) family, to which PrpA and PrpB belong, is one of two known protein phosphatase families specific for serine and threonine. This family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-). The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes. Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central role in the regulation of many cellular processes. PPPs belong to the metallophosphatase (MPP) superfamily. MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases). The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.	4.64009e-45
NZ_CP044399.1\|WP_019442879.1\|1005413_1005644_-\|DUF1414-domain-containing-protein	gnl\|CDD\|237471	PRK13689, PRK13689, hypothetical protein; Provisional.	1.04051e-28
NZ_CP044399.1\|WP_019442871.1\|1012433_1013231_-\|response-regulator	gnl\|CDD\|381150	cd19923, REC_CheY_CheY3, phosphoacceptor receiver (REC) domain of chemotaxis response regulator CheY3 and similar CheY family proteins. CheY family chemotaxis response regulators (RRs) comprise about 17% of bacterial RRs and almost half of all RRs in archaea. This subfamily contains Vibrio cholerae CheY3, Escherichia coli CheY, and similar CheY family RRs. CheY proteins control bacterial motility and participate in signaling phosphorelays and in protein-protein interactions. CheY RRs contain only the REC domain with no output/effector domain. REC domains function as phosphorylation-mediated switches within response regulators, but some also transfer phosphoryl groups in multistep phosphorelays.	6.02424e-40
NZ_CP044399.1\|WP_019442878.1\|1005724_1006759_+\|nucleoid-associated-protein-YejK	gnl\|CDD\|178993	PRK00378, PRK00378, nucleoid-associated protein NdpA; Validated.	1.58915e-162
NZ_CP044399.1\|WP_019442873.1\|1008910_1011199_-\|5-methyltetrahydropteroyltriglutamate---homocysteine-S-methyltransferase	gnl\|CDD\|235367	PRK05222, PRK05222, 5-methyltetrahydropteroyltriglutamate--homocysteine S-methyltransferase; Provisional.	0
NZ_CP044399.1\|WP_019442872.1\|1011381_1012299_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176132	cd08441, PBP2_MetR, The C-terminal substrate binding domain of LysR-type transcriptional regulator metR, which regulates the expression of methionine biosynthetic genes, contains type 2 periplasmic binding fold. MetR, a member of the LysR family, is a positive regulator for the metA, metE, metF, and metH genes. The sulfur-containing amino acid methionine is the universal initiator of protein synthesis in all known organisms and its derivative S-adenosylmethionine (SAM) and autoinducer-2 (AI-2) are involved in various cellular processes. SAM plays a central role as methyl donor in methylation reactions, which are essential for the biosynthesis of phospholipids, proteins, DNA and RNA. The interspecies signaling molecule AI-2 is involved in cell-cell communication process (quorum sensing) and gene regulation in bacteria. Although methionine biosynthetic enzymes and metabolic pathways are well conserved in bacteria, the regulation of methionine biosynthesis involves various regulatory mechanisms. In Escherichia coli and Salmonella enterica serovar Typhimurium, MetJ and MetR regulate the expression of methionine biosynthetic genes. The MetJ repressor negatively regulates the E. coli met genes, except for metH. Several of these genes are also under the positive control of MetR with homocysteine as a co-inducer. In Bacillus subtilis, the met genes are controlled by S-box termination-antitermination system. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	8.7296e-120
NZ_CP044399.1\|WP_019442866.1\|1018497_1020036_+\|Re/Si-specific-NAD(P)(+)-transhydrogenase-subunit-alpha	gnl\|CDD\|236507	PRK09424, pntA, Re/Si-specific NAD(P)(+) transhydrogenase subunit alpha.	0

>NZ_CP044399.1|WP_019442871.1|1012433_1013231_-|response-regulator
MSLEVRDLSILLIEPSTTQNKFIKTQLQDAGVDNIECVVSIAQAKQSLTGFIPDLIISAMYFEDGSGAELAEFVKSNRLTENIAFMLISSEQRFSVLDKVKQAGAVAILPKPFKFVDLQRALNATLSYIEPEEMELDLYDVTALSILVVDDSLTARKHICRVLNSMGIVGVTSAENGVEALEYLAQNTFDLIVTDYNMPEMDGKELVEKIRMNPELSYLPIMMVTSEEGNAQLSAVKQAGVSALCDKPFDIDTVRMLIKQLLDEK
>NZ_CP044399.1|WP_019442872.1|1011381_1012299_+|LysR-family-transcriptional-regulator
MLEVKHLKTIIALEKTGSLVEASESLYMTQSALSHQIKDLEERLNTPLFIRKTRPLRFTVAGERVLKLAKSVMPMFTNTERDISRLLSGNAGRLHMAIECHSCFQWLMPAIDVFRDQWPEVELDLASGFSFAPLPALKRGDVDLVVTSDPQVLSGIHYEPLFSYQPMLAVSRHHMLASKSYIDPEDLATETLITYPVEQERLDIFNLFLDPAGVSPHAIRHAELTIMMLQLVASGRGVAALPNWALTEYLEKDYILAKPLGEESCWTTLYAAVRVEQLEMPYMSEFLKDAKASSFQQLKGIKIAN
>NZ_CP044399.1|WP_019442873.1|1008910_1011199_-|5-methyltetrahydropteroyltriglutamate---homocysteine-S-methyltransferase
MAKSHILGFPRIGADRELKKAIESYWKGDITKAELETVGKTLRAKHWQQQIDAGLDFITVGDFAWYDQVLALSATLGVIPARHQEETITLDTLFNMARGSSPCCGQQAAACEMTKWFDTNYHYLVPELNEDQQFTLSYNQLIEEIQEAKTLGFPIKATLLGPVSYLSLSKTNSDFDKLALLPQLVTTYKQLLANIAAEGIEWLQIEEPILVQDLTNDWQQAFTTSYAALAQGTNKLLLTSYFGALGDNAELAFSLPVDGFHIDLSRAPKQLETALTLLPANAILSAGIVNGRNIWRNDLATSVSSLQQAKAQLGDRLWVASSCSLQHSPVDLDNETKLDSELKSWLAYATQKLTEISSINAVLNGVNNETLTQQLRESTAVVSSRATSTRIHNTAVKARVAAITDQDAQRHSEFTQRIASQQQELNLPLFPTTTIGSFPQTSDIRQTRNQFKQNVISQDQYITKMQAEIKDVVTRQEALGLDVLVHGEPERNDMVEYFGELLDGFAFSKNGWVQSYGTRCVKPPIIFGDISRPAPMTVAWSQYAQAQTNKLMKGMLTGPVTILCWSFTRDDISREEQTNQIALAIRDEVVDLEQAGIKVIQIDEPALREGLPLRSCEQQAYLDWSTKAFRISASGVRDNTQIHTHMCYCEFNEIMPSIAALDADVITIETSRSNMELLSAFTDFSYPNDIGPGVYDIHSPNVPSVEWMTQLITNASEYIDVARLWVNPDCGLKTRGWPETEAALKNMVTAAHNLRVTFSHKA
>NZ_CP044399.1|WP_019442874.1|1008527_1008827_+|Dabb-family-protein
MAFKHIVMWTLLDTANGNDKSTNAKLAKEALEALNGQIPGLQHLEVGIDSLQGAGSYDLVLIADLDSRATLDVYQDHPAHQAVLPMMKSITSQRAAVDY
>NZ_CP044399.1|WP_019442876.1|1007616_1008030_-|hypothetical-protein
MANLLNQVETIYNVAKETAKTSVTAGFGVYGTIVDEASKSSDKATQLFESLVERGTQVEPQVKEQVSALLGKKISLETIETKAQSITSRFTGVQGQKLNEVESKIDLLAQMISELKTEPAKVQKVVKAATAKVTAEA
>NZ_CP044399.1|WP_019442877.1|1006869_1007364_-|hypothetical-protein
MSQVSLTYNPVEDRMLLIVSNNINHPQWWLTRHMCKKLLEMLNAELTLQYELDKIQSCYKENKANQEASFADKHQQALHDAAGRTEIQKKSTPAQPDALLTTRISLDKKPDNLVALYIYSRENHGICLDLDNNGLHIFLDMMLKVAIKGEWGLKQVKSIENKLI
>NZ_CP044399.1|WP_019442878.1|1005724_1006759_+|nucleoid-associated-protein-YejK
MQLKLNNIILHSLAFNTEGELKCYPRNEELANSQPVEELASELHRIYNAKPAKGFGYFKCAEEDNSRLPFEIELRKFIDEESNFVDFSSAASSLLVGELLKYDFVTQGILAFVHYNWMASDYLIVALLENKDSVMVTEQLDLNSSHYLELSKVQLAAKIDLTEWRQNSDSKRYLSFIKGRAGRKVSDFFLDFLGCTEGMDAKIQNAGLMRAVDEFCHVAELDADEAIQAREQVAQYCNEQIKEGSEIEVKDLSDHLADVSSRDFYQYASEAYELEDSFPADRGAVRKLTKYVGQGGGLSVSFDQKLMGERISYNAQTDTLTIVGIPPNLREQLTRRSNSEDDSE
>NZ_CP044399.1|WP_019442879.1|1005413_1005644_-|DUF1414-domain-containing-protein
MPIVSKYKSDKVEKVIDEVIDVLEKHDAPLDLGLMVLGNAAANIINASLSPKQRQAVAEKFAKALVASVKSKDTSH
>NZ_CP044399.1|WP_019442880.1|1003442_1005395_-|DUF3413-domain-containing-protein
MPCHLFLPITLLKAKLETVVQLMLETGHHYRDQVSKIISWGHWFSLANILLAILLASRYLFIAEWPETMLGQAYSLISLLGHFSFIIFIMYLVVIFPISFVIPFPRALRFLTVIFATVGLSLLIIDTEIFKLYNLHINPIIFEILLGESEQTLNSDWQTLFAFVPFLFLLELLISSLLWHRLRPLSRFKLGPIIAIFFFCCFLTGHLLHMWADAAVYRPITAQKANFPLAYPMTARTFLAKYGWLDKDAFNKRVSDTKKQSDSRLDYPKNPLDVNDEKQDFNVLLINISALRADMLNDSVMPEMTKLALEGQRFNNHFSISNSDLLGNFGIMYGLAPQYWDDIEISAKSPFMLDYFAQADYNLGIFNTEALSRHKQKQTTFINLDSPQTTIVEDTENDKETVTKTREWIRDQDATTPWFAYVSLESVQNMDTPAGFPALFYPNIQDLNSQANNRQIALFNSYRNSVSYVDKAIAKIVYQLKQSQQYANTVIIFTANHGNEFNESEDHSWGYGSNYSIYQTQVPLFIVWPGKKPSVITQDTNSTDLVPTILTNLNAVNNPISDYSSGIDLFAGEFKSWQLLGDKNNFVILQQDTITQFSYQGLFTNQGNHNVRNRDNYKPMPRGAMLDTQFNQILAELNYFYKATPAQEQK
>NZ_CP044399.1|WP_019442881.1|1002729_1003407_+|protein-phosphatase
MLIHKDMPMNHKGQDFFVGDIHGEYDLLLTTLTQCQFNFECDRLFSVGDLVDRGSNSIACLALLHEPWFFAVRGNHEEMLLADEDSELARIHRSAGGEWFFQCSLLEQHRLRMLVEEYCPFAFTIESKFGSIGVCHANAPHHWSALQNATVDDIALLQDCAWSTKQYQQVKQGKLFNISGVKFVVHGHVNCARVTTNLNQLWIDTLMRTRRLTVLSAQQAYMVTA
>NZ_CP044399.1|WP_019442869.1|1015013_1016423_-|HAMP-domain-containing-histidine-kinase
MATGLFVIYCAITDTNSARVEQTLHKNLAQQIIHYSDDLQQGDISRSALKPAFHSLMLLGPRYEIYITDNRGQLLVYAAEPSKIKRNNINTAPLERFIKGADYPIYADNPRSPDQQKLFSSAPIFKNSQQIGYVFVILGGDKYDSIVKNLAFDSDMYKILAALIIFFALAFALLVFIFARLVRPISQLDKDMANFVNSDFSTVSNSIPDQYAANEIINLHNNFGSLESKINKQLTQIKSTEQLRREMLSHISHDLKTPLASLKGYLETWLLQYPDAAGTDFIQVAQKNANQLQRLVEQIIELAQLDSNTVSLYQEPVAVAELAQDVLSKFQLQAQQKNITLSVEPKDPSLQAIADIAKLERVLTNLVDNALRHCQSGDSIKIQLKPKDNQLIISIADSGVGIPKEDVDHIFDAHFRAKNTVNGQQGNSGLGLAIVAKLLSLHHAHISVSSVLSQGTTFSFSLPTTSVNI
>NZ_CP044399.1|WP_019442868.1|1016472_1017177_-|response-regulator-transcription-factor
MDTHVLVVEDQQDIANLIRINLEMIGNKVICCHNAKDAFQQLSAHTFQLILLDLNLPDMDGLDICKKIRSTDAIVPIMMLTARTEELDRVQGLEAGADDYLAKPFSVLELQARVKALLRRSNVQAVKNEEPEKIKIADLIIDQATHSVRRNDTLITLTSTEFSLLLFLAKSPGRVYSREQLLAEVWDYHNDCYEHTVNSHMNRLRNKIEPNPAQPTYIKTVWGVGYKLEVNDVT
>NZ_CP044399.1|WP_019442867.1|1017399_1017855_+|hypothetical-protein
MLGQITESDKLILLYQFETQGELAPESIIDISDEEARFIRTSGEYILWESSKRDFDYPEVANSHWLETTYLGQAAKLDCLQSRDAILCPLFMSNQFRGEWHIHNGFLRMNIESSHHQMELFSVANDDCNIHSLLLFKDKQLKGAANITLMV
>NZ_CP044399.1|WP_019442866.1|1018497_1020036_+|Re/Si-specific-NAD(P)(+)-transhydrogenase-subunit-alpha
MQIGIPRESLKGETRAAATPATVEQLQKLGFTVLVESNAGQLASFSDATFEAAGATISTDTKQVWASDIVLKVNAPANDKEIKLLQKGTSLISFIWPAQNEELLEKLAKREINVLAMDSVPRISRSQSLDALSSMANIAGYRAVIESANEFGRFFTGQITAAGKVPPAKVLIIGAGVAGLAAVGAAGSLGAIVRAYDTRPEVKEQITSMGAEFLEVDFEESAGSGDGYAKVMSDDYKVHEQKMLADQVADADIVITTALIPGRPAPRLISQEMVDAMKAGSVIVDLAAVNGGNVEPSVVDKVITTDGGVKIIGYNEMARRLPAQASQLYGTNLVNLLKLLTPEKDGEMSINFDDVVQRGVTVIKDGEITWPAPPIQVSAAPAAKKEEVTAAPAKPEKKKTGIYKALLAGGGIWAYSALASYVPAEFLNHLMVFALACVIGYYLIWDVASSLHTPLMSVTNAISGIVILGAFFQMGAESGLVTFLAFLGTFIATINIAGGFAVTERMLKMFRK
>NZ_CP044399.1|WP_019442865.1|1020047_1021583_+|Re/Si-specific-NAD(P)(+)-transhydrogenase-subunit-beta
MSQESIDAAQTAINAAQAAVDAATQAAQVAQTAVAEQAPVVIEAVQEVAVATSGKGILEAAYIAAAVLFVLALAALSKQETAQKGIFVGILGMVVAVVATLFSSDVTNIGYIIAAMLAGGAFGVRWANKVAMTEMPEMVAILNSFGGLAAVFIGYNSYIEHSITEPVMLSIHLTLIFLGVFIGIVTFVGSLVAWGKLNGRVKSSALMLPHRHKMNLAALLVIVFLMFSFVGAGLEGDTAALVIMSLIAIVFGAHLVLSIGGADMPVVVSMLNSYSGWAGAATGLILGNDLLIVTGALVGSSGAILSYVMCKAMNRSFISVIAGGFGNDVAAPTGDEEQGVHVETSAAEVAEMLMGSKRVIITPGYGMAVAQAQYPVFAITKKLRDAGVDVRFGIHPVAGRLPGHMNVLLAEAKVPYDIVLEMDEINEDFNTTDTVLVIGANDTVNPAAKEENSPISGMPVLEVWNATNVVVFKRSMATGYAGVQNPLFFKENTTMLFGDAKESCEQIISAM
>NZ_CP044399.1|WP_019442864.1|1021809_1022220_+|hypothetical-protein
MADVKWEAAPSGLTSGDLNGWKRRMALACPSPKLGQMVAVETDDSDGKVIHIGYKCIRADGENSSWRRMKGTEIVITPETIIIKGAVTESGQQATLSDVFLGNASTSSGIPVTMSDDGPGVYLGDGVYVSAEDCWF
>NZ_CP044399.1|WP_019442863.1|1022306_1023533_-|hypothetical-protein
MGSYAEIKINGNGLIDWKNTYDEWYFTKADRVRYIANKEDEYDPENIIGYRTNVATLRRRLQLAGNDLKSVECDFNDTRSIWVQNMKDMLLLYQEDKESKYDQFNSNMVDRITSQLEIVQNTSFNDWKKAVPIALEMSDNYTEQAIMNRDVYIPDEPLLSLMLSPLAGVYDHSLGFMGSTFPCTYVESYAIILFDMCNDDDICELNISDLVYGGWVDDFEDIAQIQAGRTVFHEHFKQSLDELSTLNNSSENKILQRMIFATAISTVEAYLSDTMKKQVLNRHAIKRRFVKHFKSFNKNVKESGVFEFLDTLDERLNEEIDKISFHNLDTVTGLYKNVLLCEFPKDKISKLDAAIDIRHDIVHRNGKKTDGSLVMVSQQDVVNLIDLVQHIIKEIDYQIIDGLLDNVE
>NZ_CP044399.1|WP_019442862.1|1023878_1025024_+|hypothetical-protein
MLRILVLFLVSFNLLASTIEQEYPQEIKQLKIEINETNSTLKILNNRITSSLDSNKEVVNQSRDLIKAVNESLRVKTVQNNQILDAFEKAKDMTAQEVDLSLSLEPDEYGIWMNFASALLIAIGSIAVTFLILKRTLAKETDVQLKGFELNLQEETKLSNSQISTQLAVATEQNKANHLLKMAEFRQAWINTFRDYISVYIKTVITLIDFHTVESSLFSSWDNLKRAERARDRFLLEKSVEAKQIREEEYKAEPVTNRQKLTNSVRDKLLIQASSEYQDFVENTANAKNGFERYKTELRDFKDLQSSITQQKTRIILMYGPDRTKIEDLIIERLNNIEEYLMFNSDRTFLPQGNVNKVHEYINELQHLVQIMLKIEWTKIK
>NZ_CP044399.1|WP_019442861.1|1025072_1026533_-|hypothetical-protein
MSIEAIDIEGTETIEIPLFENPSMTDFEISMNKFNTSINSQFMNVSTGSQRINFNGILSVEGIDSKAKKIITNSNYEINALDGELVILFTDPLYVSMLTCRGKSFRDSKSCMIRLISGEFSEKKFISRHSVTSHGREAEYKINDIIRGVILSPSTEFSHASAIDFPLFFSDDIKMNSISDAHKGLSLEAETLRQTIFNQVNDVTSYLDTKTSDYKALVKDMNTATKEKERLEKSNAQNSLILNQIQHDIAKTSEEAAKYQLLKMNAAAEIDGLKASINEHKDIVKSESREFDVLLKDVADKKIELLGLKDEIRTAKKDINLTSLDMKGHSTESQKQLTYYYRLSLAVIVFLAAVFFFIYSNAETFKVLIDANSKVSPWNILLSRLPLITATTLIIGTLSALLFYLVNHIILVNADKMNMLKASILAEQITGTLSSKGMTDEEIRDCKRNTKIELVMNVFTTKPEKVSESKQQDVLKQILEAVKITK
>NZ_CP044399.1|WP_019442860.1|1027254_1028100_+|hypothetical-protein
MSFKKVLLASIIASTLVGCDSSSPDSVIAPAPVTLTIPTEMQAQDVSGCDNEYMVTHSIEMRDDLELPVNVAEVRSVCNPELFVEYDVAEVDKPMVHINWAKEVFSEDGDLIMYQGGHAKPSSSAAHDKLAAERGYRGYYLTLDELGGYINANEVTDITYFSSGNYHHTFTSGLDKQSYTIIDNTIDTVVVSAAMFVDPTKVDEHDWNEFWYECTGTVTSIGSNETMGCLVHKAGAPKYQFQTITVDMNNFPKPTKFKEDYAHATQMYVEKAFTDNGIMIE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP044399_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP044399_3

2267637-2268024

Orphan

Consensus_repeat	Method
ATATCGCTCAAGATGGTGATGACAATTTAGCGAAAGTTGATAT	CRISPRCasFinder

5 spacers

The CRISPR arrays of NZ_CP044399_3

>merge|NZ_CP044399|3|2267637-2268024|CRISPRCasFinder
TTATCGCACAGGATGGTGACGAAAACAAAGCTAAAGTATATCTCAGTGTAGCTGGTTTCAATGATGTCGGTATAGCACAAGATGGTGATTATAATACAGCGAAAGTTGATATTCACTATGGTGCGTATAATACCGTCGATATCGCTCAAGATGGTGATGACAATTTAGCGAAAGTTGATATTTCAGGTGGTCTTGGTAATAATGTGAATATCGCTCAAGATGGTGATGACAATTTAGCGAAAGTTGATATCTCTCTCGGCCTTGATAACAACGTAAATATCGGCCAAGAGGGTCATGATAATACAGCCAAAGTTGATATTACTCACGGTGCTCATAATACGGTTGATATCGAGCAAGATGGTTATGATAATTTAGCGAAAGTTGATGT

>NZ_CP044399|3|3|2267637-2268024|CRISPRCasFinder
TTATCGCACAGGATGGTGACGAAAACAAAGCTAAAGTATATCT	CAGTGTAGCTGGTTTCAATGATGTCG
GTATAGCACAAGATGGTGATTATAATACAGCGAAAGTTGATAT	TCACTATGGTGCGTATAATACCGTCG
ATATCGCTCAAGATGGTGATGACAATTTAGCGAAAGTTGATAT	TTCAGGTGGTCTTGGTAATAATGTGA
ATATCGCTCAAGATGGTGATGACAATTTAGCGAAAGTTGATAT	CTCTCTCGGCCTTGATAACAACGTAA
ATATCGGCCAAGAGGGTCATGATAATACAGCCAAAGTTGATAT	TACTCACGGTGCTCATAATACGGTTG
ATATCGAGCAAGATGGTTATGATAATTTAGCGAAAGTTGATGT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP044399.1\|WP_019440512.1\|2265000_2265975_-\|paraslipin	unknown	unknown	gnl\|CDD\|259811
NZ_CP044399.1\|WP_019440511.1\|2264504_2264969_-\|NfeD-family-protein	unknown	unknown	gnl\|CDD\|376684
NZ_CP044399.1\|WP_019440517.1\|2269446_2270394_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|185106
NZ_CP044399.1\|WP_019440516.1\|2268208_2268592_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019440522.1\|2273684_2274665_+\|tripartite-tricarboxylate-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|225722
NZ_CP044399.1\|WP_019440513.1\|2266150_2266417_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019440514.1\|2266429_2266972_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182242
NZ_CP044399.1\|WP_019440521.1\|2272496_2273402_+\|acyltransferase	unknown	unknown	gnl\|CDD\|237584
NZ_CP044399.1\|WP_019440507.1\|2260240_2261230_-\|peptidase-M19	unknown	unknown	gnl\|CDD\|366534
NZ_CP044399.1\|WP_026032076.1\|2262921_2263314_-\|endoribonuclease	unknown	unknown	gnl\|CDD\|100004
NZ_CP044399.1\|WP_019440505.1\|2256732_2258463_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP044399.1\|WP_019440506.1\|2258575_2260141_-\|BCCT-family-transporter	unknown	unknown	gnl\|CDD\|376718
NZ_CP044399.1\|WP_019440525.1\|2276919_2277609_-\|response-regulator	unknown	unknown	gnl\|CDD\|226931
NZ_CP044399.1\|WP_019440510.1\|2263511_2264405_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176131
NZ_CP044399.1\|WP_019440524.1\|2275241_2276777_+\|tripartite-tricarboxylate-transporter-permease	unknown	unknown	gnl\|CDD\|225870
NZ_CP044399.1\|WP_019440523.1\|2274733_2275231_+\|tripartite-tricarboxylate-transporter-TctB-family-protein	unknown	unknown	gnl\|CDD\|377815
NZ_CP044399.1\|WP_019440520.1\|2271292_2271955_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|182241
NZ_CP044399.1\|WP_019440518.1\|2270416_2270824_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|371165
NZ_CP044399.1\|WP_019440508.1\|2261321_2262785_-\|aldehyde-dehydrogenase-family-protein	unknown	unknown	gnl\|CDD\|143415
NZ_CP044399.1\|WP_019440519.1\|2270834_2271293_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|337812

Protein	Function_ID	Function_description	E-value
NZ_CP044399.1\|WP_019440512.1\|2265000_2265975_-\|paraslipin	gnl\|CDD\|259811	cd08829, SPFH_paraslipin, Paraslipin or slipin-2 (SLP-2, a subgroup of the stomatin-like proteins (slipins) family; belonging to the SPFH (stomatin, prohibitin, flotillin, and HflK/C) superfamily. This model summarizes a subgroup of the stomatin-like protein family (SLPs or slipins) that is found in all three kingdoms of life. The conserved domain common to these families has also been referred to as the Band 7 domain. Individual proteins of the SPFH family may cluster to form membrane microdomains which may in turn recruit multiprotein complexes. This subgroup of the SLPs remains largely uncharacterized. It includes human SLP-2 which is upregulated and involved in the progression and development in several types of cancer, including esophageal squamous cell carcinoma, endometrial adenocarcinoma, breast cancer, and glioma.	8.66974e-51
NZ_CP044399.1\|WP_019440517.1\|2269446_2270394_-\|hypothetical-protein	gnl\|CDD\|185106	PRK15184, PRK15184, curli production assembly/transport protein CsgG; Provisional.	2.74213e-108
NZ_CP044399.1\|WP_019440514.1\|2266429_2266972_+\|hypothetical-protein	gnl\|CDD\|182242	PRK10101, csgB, curlin minor subunit CsgB; Provisional.	3.13769e-09
NZ_CP044399.1\|WP_019440522.1\|2273684_2274665_+\|tripartite-tricarboxylate-transporter-substrate-binding-protein	gnl\|CDD\|225722	COG3181, COG3181, Uncharacterized protein conserved in bacteria [Function unknown].	7.05945e-89
NZ_CP044399.1\|WP_019440511.1\|2264504_2264969_-\|NfeD-family-protein	gnl\|CDD\|376684	pfam01957, NfeD, NfeD-like C-terminal, partner-binding. NfeD-like proteins are widely distributed throughout prokaryotes and are frequently associated with genes encoding stomatin-like proteins (slipins). There appear to be three major groups: an ancestral group with only an N-terminal serine protease domain and this C-terminal beta sheet-rich domain which is structurally very similar to the OB-fold domain, associated with its neighboring slipin cluster; a second major group with an additional middle, membrane-spanning domain, associated in some species with eoslipin and in others with yqfA; a final 'artificial' group which unites truncated forms lacking the protease region and associated with their ancestral gene partner, either yqfA or eoslipin. This NefD, C-terminal, domain appears to be the major one for relating to the associated protein. NfeD homologs are clearly reliant on their conserved gene neighbor which is assumed to be necessary for function, either through direct physical interaction or by functioning in the same pathway, possibly involve with lipid-rafts.	1.09813e-11
NZ_CP044399.1\|WP_019440521.1\|2272496_2273402_+\|acyltransferase	gnl\|CDD\|237584	PRK14014, PRK14014, putative acyltransferase; Provisional.	8.96939e-176
NZ_CP044399.1\|WP_019440507.1\|2260240_2261230_-\|peptidase-M19	gnl\|CDD\|366534	pfam01244, Peptidase_M19, Membrane dipeptidase (Peptidase family M19).	7.6387e-78
NZ_CP044399.1\|WP_026032076.1\|2262921_2263314_-\|endoribonuclease	gnl\|CDD\|100004	cd00448, YjgF_YER057c_UK114_family, YjgF, YER057c, and UK114 belong to a large family of proteins present in bacteria, archaea, and eukaryotes with no definitive function. The conserved domain is similar in structure to chorismate mutase but there is no sequence similarity and no functional connection. Members of this family have been implicated in isoleucine (Yeo7, Ibm1, aldR) and purine (YjgF) biosynthesis, as well as threonine anaerobic degradation (tdcF) and mitochondrial DNA maintenance (Ibm1). This domain homotrimerizes forming a distinct intersubunit cavity that may serve as a small molecule binding site.	7.81041e-27
NZ_CP044399.1\|WP_019440506.1\|2258575_2260141_-\|BCCT-family-transporter	gnl\|CDD\|376718	pfam02028, BCCT, BCCT, betaine/carnitine/choline family transporter.	3.72402e-163
NZ_CP044399.1\|WP_019440525.1\|2276919_2277609_-\|response-regulator	gnl\|CDD\|226931	COG4565, CitB, Response regulator of citrate/malate metabolism [Transcription / Signal transduction mechanisms].	1.21583e-88
NZ_CP044399.1\|WP_019440510.1\|2263511_2264405_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176131	cd08440, PBP2_LTTR_like_4, TThe C-terminal substrate binding domain of an uncharacterized LysR-type transcriptional regulator, contains the type 2 periplasmic binding fold. LysR-transcriptional regulators comprise the largest family of prokaryotic transcription factor. Homologs of some of LTTRs with similar domain organizations are also found in the archaea and eukaryotic organisms. The LTTRs are composed of two functional domains joined by a linker helix involved in oligomerization: an N-terminal HTH (helix-turn-helix) domain, which is responsible for the DNA-binding specificity, and a C-terminal substrate-binding domain, which is structurally homologous to the type 2 periplasmic binding proteins. As also observed in the periplasmic binding proteins, the C-terminal domain of the bacterial transcriptional repressor undergoes a conformational change upon substrate binding which in turn changes the DNA binding affinity of the repressor. The genes controlled by the LTTRs have diverse functional roles including amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to a name a few. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	1.40936e-56
NZ_CP044399.1\|WP_019440524.1\|2275241_2276777_+\|tripartite-tricarboxylate-transporter-permease	gnl\|CDD\|225870	COG3333, COG3333, Uncharacterized protein conserved in bacteria [Function unknown].	0
NZ_CP044399.1\|WP_019440523.1\|2274733_2275231_+\|tripartite-tricarboxylate-transporter-TctB-family-protein	gnl\|CDD\|377815	pfam07331, TctB, Tripartite tricarboxylate transporter TctB family. This family consists of several hypothetical bacterial proteins of around 150 residues in length. This family was formerly known as DUF1468.	7.44508e-09
NZ_CP044399.1\|WP_019440520.1\|2271292_2271955_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|182241	PRK10100, PRK10100, transcriptional regulator CsgD.	1.99604e-34
NZ_CP044399.1\|WP_019440518.1\|2270416_2270824_-\|hypothetical-protein	gnl\|CDD\|371165	pfam10614, CsgF, Type VIII secretion system (T8SS), CsgF protein. The extracellular nucleation-precipitation (ENP) pathway or Type VIII secretion system (T8SS) in Gram-negative (diderm) bacteria is responsible for the secretion and assembly of prepilins for fimbiae biogenesis, the prototypical curli. Besides the T2SS that can be involved in the assembly of prototypical Type 4 pilus, the T4SS that can be involved in the biogenesis of the prototypical pilus T, the T3SS involved in the assembly of the injectisome and the T7SS involved in the formation of the prototypical Type 1 pilus, the T8SS differs in that fibre-growth occurs extracellularly. The curli, also called thin aggregative fimbriae (Tafi), are the only fimbriae dependent on the T8SS. Tafi were first identified in Salmonella spp and the controlling operon termed agf; however subsequent isolation of the homologous operon in E coli led to its being called csg. In the absence of extracellular polysaccharides Tafi appear curled, although when expressed with such polysaccharides their morphology appears as a tangled amorphous matrix. CsgF is one of three putative curli assembly factors appearing to act as a nucleator protein. Unlike eukaryotic amyloid formation, curli biogenesis is a productive pathway requiring a specific assembly machinery.	9.40265e-23
NZ_CP044399.1\|WP_019440508.1\|2261321_2262785_-\|aldehyde-dehydrogenase-family-protein	gnl\|CDD\|143415	cd07097, ALDH_KGSADH-YcbD, Bacillus subtilis NADP+-dependent alpha-ketoglutaric semialdehyde dehydrogenase ycbD-like. Kinetic studies of the Bacillus subtilis ALDH-like ycbD protein, which is involved in d-glucarate/d-galactarate utilization, reveal that it is a NADP+-dependent, alpha-ketoglutaric semialdehyde dehydrogenase (KGSADH). KGSADHs (EC 1.2.1.26) catalyze the NAD(P)+-dependent conversion of KGSA to alpha-ketoglutarate. Interestingly, the NADP+-dependent, tetrameric, 2,5-dioxopentanoate dehydrogenase (EC=1.2.1.26), an enzyme involved in the catabolic pathway for D-arabinose in Sulfolobus solfataricus, also clusters in this group. This CD shows a distant phylogenetic relationship to the Azospirillum brasilense KGSADH-II (-III) group.	0
NZ_CP044399.1\|WP_019440519.1\|2270834_2271293_-\|hypothetical-protein	gnl\|CDD\|337812	pfam10627, CsgE, Curli assembly protein CsgE. Curli are a class highly aggregated surface fibers that are part of a complex extracellular matrix. They promote biofilm formation in addition to other activities. CsgE is a non-structural protein involved in curli biogenesis. CsgE forms an outer membrane complex with the curli assembly proteins CsgG and CsgF.	9.94998e-39

>NZ_CP044399.1|WP_019440514.1|2266429_2266972_+|hypothetical-protein
MARLLKVKNISICCLLTLSSYVFAGGSPYEPPPELAALSELAPSGNYSNIEFDGAYLSKVKVLQSRDGGLGNKAHIQLSGIKNKAKIVQDGSNNSAYIDQSGRFNIAKTVQRGQGHESAIIQHGHRNVAVHIQGGNAQHKGTINQSGNNNLAFIKDTTNNSRDFSVNQTGRGRIIINNTF
>NZ_CP044399.1|WP_019440513.1|2266150_2266417_-|hypothetical-protein
MTLFLLKQHVVTWIKYWIVRGFNHQLYDEIINVYVNFKGLIRLIIGHLFGLETVKKLMLKFIFWLGLNRCWDICLCFYNKKATAVYIA
>NZ_CP044399.1|WP_019440512.1|2265000_2265975_-|paraslipin
MNNAIDILLTPWLWITIVVIFTIQRSVLFIPQNRGYVIYTFGRYSGTLQAGLNFIVPFIQRVAADRNLKEQSLDISSQLAITKDNITLELDGILFMKVVDAAAATNNITDYKLAVVQLATTTMRNAIGSMELDQCFQNRDNINASILASMTEATQPWGVQVTRYEIKDITPPISIKEDMEKQMAAEREKRSVILTAEGVKTAAITQAEGLKQARVLDAEAAKAEQVLAAEASKESQILEATGKAEAIRLVADADSSALHVVGAVAITGEGQQAVRLKLAQDAIAAHKAIAAEGSVILTDGKTSENIGNTVAQAIAVSSALKLSE
>NZ_CP044399.1|WP_019440511.1|2264504_2264969_-|NfeD-family-protein
MDTLMDYLQNNHDQLLYVIGALALIIELSVTGLSGPLLFFGLSCLLTGLLVSIGVIQGWEFEILSVGLLSAVVALLLWKPLKQFQGNRVVQDTSSDMIGQTVPVSEVITINGGKVRHSGINWNARLSESATVSSIAVDLRVKIVAVDGNVLIVE
>NZ_CP044399.1|WP_019440510.1|2263511_2264405_+|LysR-family-transcriptional-regulator
MDIKIQQLRHFVLVVEDGGFRAAASRANRSQAALSTSIKELERTLEQPLFEPGNKSTLTPFGQICLPKITQFLQIYKTLDNDLRAAAAGQQGRVRIASVPSVAAKLIPNVLGRFCKEYPNVEVSLIDDNAAGVEARLVSGEVDLALGNCANLDADTVDFTPLISDPIGVVCLKDNPIANNMNGIEWQALLDQPFIHNGTCTLLEPTPARVLIDKALYSVENITSLFSVLKLGIGITTLPKLAFPSNETDLVWLPLLDPPLERKMGIFRLAEHTISPQAQAFYELCVEHLICSDELGS
>NZ_CP044399.1|WP_026032076.1|2262921_2263314_-|endoribonuclease
MNMTTQSYPVKTELFASKAPLEWAIVNNGTLYTAQIPIDQTGAVVAGGIEAQTRQTFDNLVHTLECAGESLNSVLQVLIYVTDREYLATVNKVYAEYFDAPYPNRAAMIVAGLAREEMLVEFVVYAAVSE
>NZ_CP044399.1|WP_019440508.1|2261321_2262785_-|aldehyde-dehydrogenase-family-protein
MTTQTQRIQAENSLYIGGEWQTGVSTVANINPSDISQNLGNFAQADTAQVHQAISAAKHAQPTWEKTPLEQKQAVLQGIGDELIARCDELGRLLSSEEGKPFLEGRGEIYRAGQFFQYFAAEVLRQIGDSAASVRPGVSVEVTREAVGVVAIISPWNFPTATAAWKIAPALAFGNSVIWKPANLTPASAVALTEIIHRQGLPAGTFNLVLGSGSEVGNVLINSTEVNGVSFTGSVDTGRKIAAATAPNFVRCQLEMGSKNALIVADDADINIAVEATIAGSFSGAGQKCTASSRLVVMDGIHDAYVEALIKRMSELKVGHALKDGVFMGPVVDGKQLDANFDWIDTARQSGGELAFGGERLNLEHEGFYMSPTLFINTKNDWSVNQEEVFAPMASVIRVADLEEAIATTNDTRFGLTSGIITQSLRTSTLFKQQAQTGCVMVNLPTAGTDYHVPFGGRKESSFGPREQGQYAKEFYTVVKTAYQRAY
>NZ_CP044399.1|WP_019440507.1|2260240_2261230_-|peptidase-M19
MYSQRIVIDGLQYCNWDREYFQTLKNSGITAVHATIVYHETARETLSRFAEWNLRFEQNADLIMPIHSVADIEKAKALGKVGIFFGAQNCSSIDDEIGLIEVMRQQGLLIMQLTYNNQSLLATGCYEKNDNGITRFGKQAIAEMNRVGMIIDMSHSAERSTLEAIDLSSRPICISHANPTFAFEALRNKSDTVIKSLAARGGLLGFSLYPFHLPNGSQCSLDDFCQMVAKTADMVGVEHLGIGSDLCLNQPQAVLEWMRNGRWSKAMDYGEGSANNSGWPDSLPWFCGSAGMENIYNGLIRYGFSESEAGQVLGENWFNFLKQGLEPIS
>NZ_CP044399.1|WP_019440506.1|2258575_2260141_-|BCCT-family-transporter
MSDLTKSAKAASLDNDNNSTADKLGFSNPAFWYSGSFLALFVLLALYDEVLLSSLVNTGFSWAVTVFGPYWQVLLLLTFLIGIALAAGRTGKVVLGALPKPEMDGFRWMAIIFCTLLAGGGVFWAAAEPIAHFVNPPPLYGAQENIQQTAVNALSQSFMHWGFLAWAIVGSLTSIVVMHLHYDKGLPLKPRILLYPVFGKRVLTGHTGALIDACCIVAVAAGTIGPIGFLGLQVSYALNVLFEIPDGFTTQLIIVLFAIALYTISALSGLNRGMQMLSRYNVVLACLLMAYILIFGPTNFIFNGYIQGVGSMVDNFIPMATYRGDEGWLSWWTVFFWGWFLGYGPMMAIFIARISRGRTIRQLVSTISIIAPLTTCFWFTIVGGSGLAFEIANPGSVSSAFEGFNLPGALLAVTSQLPFPMITSVLFLILTTIFIVTTGDSMTYTISVVISGEEEPNAFIRTFWGVVMGITALVLISLGSGGISALQSFIVITAVPVSLILLPSLWNAPQIAIQMAKDQGL
>NZ_CP044399.1|WP_019440505.1|2256732_2258463_-|hypothetical-protein
MDARPSTCGGTYMRDPVTVMAPERLGAMHQNRISFVRSLIRKMAQQKWQVTKHDWQLSAEGFGHVIYKLTTLNHIYHLVIFCDEIADEDRNDRVIAEKWDVTFALVYGDVDVDLLSRLRTNVPLQEAGRNPNKVLVLARANKSVRVFEHLVSHLAKGQQPNAKELAEVGYILRTTAVYGNGKFGIADFGWLETTEDFNQSFSAQMCAVYILREFSLDWVHYLAQQQGGDKAVNLDLGLQRYLGIGNATGLGMAPYLINHPCVVDQWLSSRESALTAVLNAAVEVHKLAPLQHLLQKGLCHLEQIITINEHQDDLNNTAITELHDLLSNLDSLLIQSHSLLPQMKTWSELIDYASKYSLETQEILLSCLMELYPALVDNYETKMNCDESLNLPSGKRIEDLLAVLQSRYRWAIETDFKQPENNYWFWYRSQDKEEPRLGVRGEEPGEDRELPLDIGRQANRLYHALLICKPNMQLAEFLVLHPQYRAISRRVWTLGNKQMGEIQMNVLHQKSLPMHLLRCKLAVLGATKFDPRSERWVRVTFFQGAPLLNELHDGEWLFPLLPSNALNQAVLEGEVS
>NZ_CP044399.1|WP_019440516.1|2268208_2268592_+|hypothetical-protein
MTYLVNRKKSAAFSAAIFLFALQLPQTLHSKEQLRIKPNDIKREAKEMNILCQNVGNSIHLVIINQDDNYHTINLTSKTSNQFTTSIDKNSQVNLSLSKEQFPIKIITSSSNKTTVFMIDKDCKISS
>NZ_CP044399.1|WP_019440517.1|2269446_2270394_-|hypothetical-protein
MKFLWLFFIVIMTGCSNSLSIPDTSDTPSLMQRGNTYNDLVALPKPKGKIYVAVYDFRDQTGQYKPQPNSNFSTAVPQGATALLTMALLDSQWFYPLERQGLQNLLTERKIIRAAQSKDKVVSNHGTDLPSLQSANVMIEGGIVAYDTNIKTGGMGAKYLGIGGSGKYRTDQITVNIRAVDIRSGKILSSITTTKTILSYELAAGAFRFVDYKELLEVEMGYTNNEPVNIALMSAIDAAVIHLIVNGVEQGLWSPSSLDSLDSPVFKKYASQSSTLNTNAQQASTNDVFTKDASELMTKNTSVTNSRPKDYRATY
>NZ_CP044399.1|WP_019440518.1|2270416_2270824_-|hypothetical-protein
MKITTQLFALSFILSCSNVIASELVYTPVSPSFGGNPLNSSHLFNTANAINDYSGPEIDSGFEEKSALERLASSLESRLISQILSDASEGKTGQLITEDFTVNVVEGDSGALLIHLVDNLTGESSTIQVGGITSN
>NZ_CP044399.1|WP_019440519.1|2270834_2271293_-|hypothetical-protein
MMKSKQGKALFYVMCISGLCISANVQAIDDKTPLEESQSNDDSLVEIQGLLIDRTLTRLGKDFYFTFAMKMNSEYGDLEVNLTISEVPTALSGSIITIHHFNRVIYKTALSPGRYQAEQRAEEAMYVTRNYIVKWKAEKQFQDTFDLERSEL
>NZ_CP044399.1|WP_019440520.1|2271292_2271955_-|helix-turn-helix-transcriptional-regulator
MINEKYTCYLVSKSSLQSSLLKQSLEKSLDIVILDVSFTELLQSLSSKKSNKNLNYVIIDLNHLQDDYLSKYLILVDEKNLNTKEILINSESVIIIDDLMRLPNLTGLFYESDTMELMSKGMQKMLDGEFWISRDLATSIITVHRKDKYFTSSVIAELTRREEEIMKLLTLGASNSQIAEQLFVSENTVKTHLHNVFKKIKVKSRLQAVMWAKGQQFQRV
>NZ_CP044399.1|WP_019440521.1|2272496_2273402_+|acyltransferase
MSSLRGCLAFVLWLVNLLFWVIPIMILSPIKLLPIKIIQRICSSLLVFFASSWIRVNGVIEHFIHPVKIHVHNADIELSEKEWYMVIANHQSWVDILILQRVLNKKIPFLKFFLKKELIFVPFLGMAWWALDFPFMRRYSTAQLKKNPKLRGKDIEVTRKACAKFKSSPVSVMNFVEGTRLTTEKHSKQKSPFKHLLKPKAGGLAFALSALGEHIQKIVDVAIYYPGQTPSFWQYLCGEVKDVHVHIRVADIDDKMRGDYQKDRAFKIGFQQHLNDVWVEKDAILKTMAQSHKADTDKTAL
>NZ_CP044399.1|WP_019440522.1|2273684_2274665_+|tripartite-tricarboxylate-transporter-substrate-binding-protein
MLKQFRKCVTSSLIVASIATLSSAAWAADLEKIHFIVPGGAGGGWDMTARGTGDVLMKADLVEKVSYQNLSGGGGGKAIAHMIETAARQQDTLMVNSTPIVIRSLTGIFPQSFRDLTPVATTIADYGAIVVAADSKFENWSQVVTAFKENPRKVKIAGGSARGSMDHLIAAAAFKGEGFDARKVRYIAYDAGGKAMAAVLSGETPLLSTGLGEVLEMSKSGQVRILAITAPERLAAAPNVPTLTEMGNETVFANWRGFFASPGISDAKVAEWNKVLAEMYKTDQWATVRDRNGWIDNYKADKDFYAFLEQQEEQMGALMRELGFLK
>NZ_CP044399.1|WP_019440523.1|2274733_2275231_+|tripartite-tricarboxylate-transporter-TctB-family-protein
MQTTPLPRLNRDRVSGLIFLLVCLIYGYQATQIQLFPGDEYEAFTARTLPYLLTAGGIIMSLLLIVMSPTNACSTSACENNNESSLDWRLLSAFVALMTAYGVGLTWLGFVLATSLFLLVGFWLLGERRKAVLFGASFPFVTVFWLLLTKVLDIYLEPGYLFLSF
>NZ_CP044399.1|WP_019440524.1|2275241_2276777_+|tripartite-tricarboxylate-transporter-permease
MLDGILAGLSTAIMPTNLMMVMVGCFVGTFIGMLPGLGPISAIALMIPITYGLDPSSGMILMAGVYYGAIFGGSTSSILINAPGCSSTVVTAFDGYPLAKKGQAGKALALAAYASFTGGTLSAIMLLIAAPALAKVSLSFQSSDYFALMLVGLSAVAAFAGKGQVLKAWMMTIFGLMLSTVGIDKGIGVERFTFGLTDLMDGFSFLLLAMATFALGEILFSILKPEPDTSAEENSALSEIGSMKVTKEEFKEVAPVAARSSILGFFVGVLPGAGATIAAFLSYGLERNLAPKDKRDEFGKGSIRGLVAPEAANNAASSGSFVPLLTLGIPGSGTTAIMLGAMISYGIQPGPRLFVDNPEIFWSVIISMYFGNLVLMVLNLPLIPYIAKLLAVPRTVLLPMIIFFSITGVYLVSFNTVDVFIMILVAVIAIFLRLASFPLAPLLLGFILGGLMEENLRRSLMISDGELSFLWERPITLTFTVISALVLVTPILLTAFNRRRAKKAVFVDECD
>NZ_CP044399.1|WP_019440525.1|2276919_2277609_-|response-regulator
MTSTNTIKVLIIEDDVGIAEIHRRNLMKIDGLDIIGIATTKAEAEVLLDVLTPDLILLDVYLPDGNGLDILRDLRQQQHACDVILITADRDSDTLQAAMRGGVVDYILKPVIFARLEESLNKYLKQKNQFVNLDDVDQHMVDAMISVSVKSPATSRLPKGIDSVTLDKVRGLFAEHADITADNAGVLIGASRTTARRYLEHLISTGELVADLNYGTVGRPERTYKKQVR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP044399_3	3.1\|2267680\|26\|NZ_CP044399\|CRISPRCasFinder	2267680-2267705	26	KJ019094	Synechococcus phage ACG-2014e isolate Syn7803US33, complete genome	22081-22106	4	0.846
NZ_CP044399_3	3.1\|2267680\|26\|NZ_CP044399\|CRISPRCasFinder	2267680-2267705	26	KJ019156	Synechococcus phage ACG-2014e isolate Syn7803C2, complete genome	22081-22106	4	0.846
NZ_CP044399_3	3.1\|2267680\|26\|NZ_CP044399\|CRISPRCasFinder	2267680-2267705	26	KJ019054	Synechococcus phage ACG-2014e isolate Syn7803C85, complete genome	22081-22106	4	0.846
NZ_CP044399_3	3.3\|2267818\|26\|NZ_CP044399\|CRISPRCasFinder	2267818-2267843	26	MN694284	Marine virus AFVG_250M474, complete genome	20112-20137	4	0.846
NZ_CP044399_3	3.3\|2267818\|26\|NZ_CP044399\|CRISPRCasFinder	2267818-2267843	26	NZ_CP011829	Enterococcus faecium strain UW8175 plasmid unnamed1, complete sequence	44935-44960	5	0.808
NZ_CP044399_3	3.3\|2267818\|26\|NZ_CP044399\|CRISPRCasFinder	2267818-2267843	26	NZ_CP032307	Enterococcus faecium strain HY07 plasmid unnamed2, complete sequence	49947-49972	5	0.808
NZ_CP044399_3	3.3\|2267818\|26\|NZ_CP044399\|CRISPRCasFinder	2267818-2267843	26	NZ_LR135289	Enterococcus faecium isolate E7199 plasmid 3	21750-21775	5	0.808
NZ_CP044399_3	3.3\|2267818\|26\|NZ_CP044399\|CRISPRCasFinder	2267818-2267843	26	NZ_CP040704	Enterococcus faecium strain HOU503 plasmid p1, complete sequence	83821-83846	5	0.808
NZ_CP044399_3	3.3\|2267818\|26\|NZ_CP044399\|CRISPRCasFinder	2267818-2267843	26	NZ_CP035137	Enterococcus faecium strain SRCM103341 plasmid unnamed1, complete sequence	194324-194349	5	0.808
NZ_CP044399_3	3.3\|2267818\|26\|NZ_CP044399\|CRISPRCasFinder	2267818-2267843	26	NZ_CP035221	Enterococcus faecium strain SRCM103470 plasmid unnamed1	101565-101590	5	0.808

1. spacer 3.1|2267680|26|NZ_CP044399|CRISPRCasFinder matches to KJ019094 (Synechococcus phage ACG-2014e isolate Syn7803US33, complete genome) position: , mismatch: 4, identity: 0.846

cagtgtagctggtttcaatgatgtcg	CRISPR spacer
aagtgttgctggtttcaatgctgtca	Protospacer
 ***** ************* ****.

2. spacer 3.1|2267680|26|NZ_CP044399|CRISPRCasFinder matches to KJ019156 (Synechococcus phage ACG-2014e isolate Syn7803C2, complete genome) position: , mismatch: 4, identity: 0.846

cagtgtagctggtttcaatgatgtcg	CRISPR spacer
aagtgttgctggtttcaatgctgtca	Protospacer
 ***** ************* ****.

3. spacer 3.1|2267680|26|NZ_CP044399|CRISPRCasFinder matches to KJ019054 (Synechococcus phage ACG-2014e isolate Syn7803C85, complete genome) position: , mismatch: 4, identity: 0.846

cagtgtagctggtttcaatgatgtcg	CRISPR spacer
aagtgttgctggtttcaatgctgtca	Protospacer
 ***** ************* ****.

4. spacer 3.3|2267818|26|NZ_CP044399|CRISPRCasFinder matches to MN694284 (Marine virus AFVG_250M474, complete genome) position: , mismatch: 4, identity: 0.846

ttcaggtggtcttggtaataatgtga	CRISPR spacer
gacaggtggtcttggtaaaaatgtaa	Protospacer
  **************** *****.*

5. spacer 3.3|2267818|26|NZ_CP044399|CRISPRCasFinder matches to NZ_CP011829 (Enterococcus faecium strain UW8175 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.808

ttcaggtggtcttggtaataatgtga	CRISPR spacer
agtaggtggtcttgttaataatttga	Protospacer
  .*********** ******* ***

6. spacer 3.3|2267818|26|NZ_CP044399|CRISPRCasFinder matches to NZ_CP032307 (Enterococcus faecium strain HY07 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.808

ttcaggtggtcttggtaataatgtga	CRISPR spacer
agtaggtggtcttgttaataatttga	Protospacer
  .*********** ******* ***

7. spacer 3.3|2267818|26|NZ_CP044399|CRISPRCasFinder matches to NZ_LR135289 (Enterococcus faecium isolate E7199 plasmid 3) position: , mismatch: 5, identity: 0.808

ttcaggtggtcttggtaataatgtga	CRISPR spacer
agtaggtggtcttgttaataatttga	Protospacer
  .*********** ******* ***

8. spacer 3.3|2267818|26|NZ_CP044399|CRISPRCasFinder matches to NZ_CP040704 (Enterococcus faecium strain HOU503 plasmid p1, complete sequence) position: , mismatch: 5, identity: 0.808

ttcaggtggtcttggtaataatgtga	CRISPR spacer
agtaggtggtcttgttaataatttga	Protospacer
  .*********** ******* ***

9. spacer 3.3|2267818|26|NZ_CP044399|CRISPRCasFinder matches to NZ_CP035137 (Enterococcus faecium strain SRCM103341 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.808

ttcaggtggtcttggtaataatgtga	CRISPR spacer
agtaggtggtcttgttaataatttga	Protospacer
  .*********** ******* ***

10. spacer 3.3|2267818|26|NZ_CP044399|CRISPRCasFinder matches to NZ_CP035221 (Enterococcus faecium strain SRCM103470 plasmid unnamed1) position: , mismatch: 5, identity: 0.808

ttcaggtggtcttggtaataatgtga	CRISPR spacer
agtaggtggtcttgttaataatttga	Protospacer
  .*********** ******* ***

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

360529 : 369251

Mycobacterium_phage(16.67%)

tRNA

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_019628835.1\|360529_363151_+	DUF87 domain-containing protein	A0A218M9A2	Mycobacterium_phage	4.8e-84	47.7
WP_019440950.1\|363154_363775_+	outer membrane lipoprotein chaperone LolA	NA	NA	NA	NA
WP_019440951.1\|363774_365112_+	replication-associated recombination protein A	G3MBE0	Bacillus_virus	1.5e-78	39.7
WP_019440952.1\|365185_365569_+	fluoride efflux transporter CrcB	A0A2H4PQR0	Staphylococcus_phage	2.1e-09	36.8
WP_019440953.1\|365713_367000_+\|tRNA	serine--tRNA ligase	A0A1B1IVT2	uncultured_Mediterranean_phage	6.8e-92	43.6
WP_019440954.1\|367198_367528_-	TusE/DsrC/DsvC family sulfur relay protein	NA	NA	NA	NA
WP_019440955.1\|367613_368276_-	BAX inhibitor protein	A0A2H4JFM9	uncultured_Caudovirales_phage	1.9e-50	51.8
WP_019440956.1\|368639_369251_-	glutaredoxin	K4F987	Cronobacter_phage	1.7e-05	35.0

DBSCAN-SWA_2

1524700 : 1560905

Vibrio_phage(28.57%)

head,terminase,portal,capsid,integrase,tail

attL 1524586:1524606|attR 1561344:1561364

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1524586:1524606	attL	NA	NA	NA	NA
WP_019440202.1\|1524700_1525669_-\|integrase	tyrosine-type recombinase/integrase	A0A0F7LBR0	Escherichia_phage	2.4e-89	51.9
WP_019440201.1\|1526015_1527698_+	N-6 DNA methylase	NA	NA	NA	NA
WP_019440200.1\|1527690_1530033_+	ATP-binding protein	NA	NA	NA	NA
WP_019440199.1\|1530022_1531171_+	hypothetical protein	NA	NA	NA	NA
WP_019440198.1\|1531160_1531913_+	hypothetical protein	NA	NA	NA	NA
WP_019440197.1\|1531994_1532696_-	helix-turn-helix transcriptional regulator	A0A0M5M1I9	Salmonella_phage	1.1e-16	53.8
WP_019440196.1\|1532795_1533017_+	hypothetical protein	NA	NA	NA	NA
WP_019440195.1\|1533213_1533732_+	hypothetical protein	A0A1D9C9Z1	Salinivibrio_phage	7.1e-32	41.3
WP_019440194.1\|1533750_1534041_+	hypothetical protein	NA	NA	NA	NA
WP_019440193.1\|1534037_1534265_+	hypothetical protein	NA	NA	NA	NA
WP_019440192.1\|1534261_1534417_+	hypothetical protein	NA	NA	NA	NA
WP_019440191.1\|1534413_1534629_+	hypothetical protein	NA	NA	NA	NA
WP_019440190.1\|1534609_1536559_+	replication endonuclease	A0A2P1CKY6	Pseudoalteromonas_phage	1.8e-59	35.9
WP_019440189.1\|1536559_1536823_+	ogr/Delta-like zinc finger family protein	U3PB63	Vibrio_phage	4.4e-14	46.1
WP_019440188.1\|1536910_1538941_+	hypothetical protein	NA	NA	NA	NA
WP_019440187.1\|1539294_1539534_+	hypothetical protein	A0A2I7RQ60	Vibrio_phage	9.8e-21	60.3
WP_019440186.1\|1539680_1540373_+	hypothetical protein	NA	NA	NA	NA
WP_019440185.1\|1540451_1540901_-	hypothetical protein	NA	NA	NA	NA
WP_019440184.1\|1540897_1541221_-	hypothetical protein	NA	NA	NA	NA
WP_019440183.1\|1541220_1542261_-\|portal	phage portal protein	A0A1D9C9P9	Salinivibrio_phage	3.1e-63	42.7
WP_019440182.1\|1542260_1544066_-\|terminase	terminase	R4JDJ3	Burkholderia_phage	1.0e-117	39.7
WP_019440181.1\|1544256_1545207_+\|capsid	phage capsid scaffolding protein	A0A2H4JGC7	uncultured_Caudovirales_phage	1.0e-20	29.8
WP_019440180.1\|1545224_1546310_+\|capsid	phage major capsid protein, P2 family	A0A0U4K5I9	Pseudomonas_phage	5.8e-68	45.1
WP_019440179.1\|1546391_1547141_+	hypothetical protein	NA	NA	NA	NA
WP_019440178.1\|1547212_1547716_+\|head	head completion/stabilization protein	NA	NA	NA	NA
WP_019440177.1\|1547712_1548198_+	hypothetical protein	NA	NA	NA	NA
WP_019440176.1\|1548204_1548849_+	virion morphogenesis protein	A0A1D9C9S1	Salinivibrio_phage	8.5e-27	41.8
WP_019440175.1\|1548861_1549962_+	DUF2586 family protein	A0A0U4KLE6	Pseudomonas_phage	2.9e-67	38.5
WP_019440174.1\|1549972_1550425_+	DUF2597 family protein	A0A1L5C2D0	Pseudoalteromonas_phage	2.0e-27	40.0
WP_019440173.1\|1550424_1551039_+	hypothetical protein	NA	NA	NA	NA
WP_019440172.1\|1551041_1551308_+	hypothetical protein	NA	NA	NA	NA
WP_019440170.1\|1551517_1553983_+\|tail	phage tail tape measure protein	A0A2I7RNI7	Vibrio_phage	1.3e-88	38.5
WP_019440169.1\|1553982_1554306_+	DUF2590 family protein	F1BUK8	Cronobacter_phage	2.5e-11	39.0
WP_019440168.1\|1554318_1555491_+	hypothetical protein	A0A0U4JJ14	Pseudomonas_phage	4.8e-68	38.0
WP_019440167.1\|1555483_1556212_+	hypothetical protein	A0A0U4JVX3	Pseudomonas_phage	7.4e-27	39.3
WP_019440166.1\|1556218_1556971_+\|tail	tail fiber protein	A0A0U4K5K2	Pseudomonas_phage	4.0e-20	38.0
WP_019440165.1\|1556990_1557728_+	hypothetical protein	NA	NA	NA	NA
WP_019440164.1\|1557743_1558031_+	hypothetical protein	Q8H9M8	Vibrio_phage	1.5e-12	71.1
WP_019440163.1\|1558030_1558672_+	hypothetical protein	NA	NA	NA	NA
WP_019440162.1\|1558668_1559151_+	hypothetical protein	NA	NA	NA	NA
WP_019440161.1\|1559851_1560706_+	hypothetical protein	A0A2I7RNK2	Vibrio_phage	1.1e-21	31.1
WP_019440160.1\|1560707_1560905_+	hypothetical protein	A0A2I7RNJ8	Vibrio_phage	1.6e-13	68.8
1561344:1561364	attR	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP044398

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. NZ_CP044399

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection