CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP043489	Labrys neptuniae strain KNU-23 chromosome 1, complete sequence	2 crisprs	WYL,csa3,cas3,RT,DEDDh	0	0	3	0
NZ_CP043488	Labrys neptuniae strain KNU-23 chromosome 2, complete sequence	0 crisprs	csa3	0	0	0	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP043489_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043489_1

1837189-1837275

Orphan

Consensus_repeat	Method
TTGACTGAACCGTTCGGTTCGAT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP043489_1

>merge|NZ_CP043489|1|1837189-1837275|CRISPRCasFinder
TTGACTGAACCGTTCGGTTCGATTTTTATTGCGTATCGCAGCGCAACATGATAGTCAACGGAAACTGACTGAACCGTTCGGTTCGAT

>NZ_CP043489|1|1|1837189-1837275|CRISPRCasFinder
TTGACTGAACCGTTCGGTTCGAT	TTTTATTGCGTATCGCAGCGCAACATGATAGTCAACGGAAA
CTGACTGAACCGTTCGGTTCGAT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043489.1\|WP_149252314.1\|1834026_1834329_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043489.1\|WP_149252310.1\|1826503_1827043_-\|HdeD-family-acid-resistance-protein	unknown	unknown	gnl\|CDD\|225786
NZ_CP043489.1\|WP_149252324.1\|1845466_1845874_+\|heme-binding-protein	unknown	unknown	gnl\|CDD\|377163
NZ_CP043489.1\|WP_149252326.1\|1847233_1848487_+\|flavodoxin-dependent-(E)-4-hydroxy-3-methylbut-2-enyl-diphosphate-synthase	unknown	unknown	gnl\|CDD\|234737
NZ_CP043489.1\|WP_149252321.1\|1842765_1843689_+\|MerR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|133381
NZ_CP043489.1\|WP_149252312.1\|1830149_1831235_+\|redoxin-family-protein	unknown	unknown	gnl\|CDD\|239308
NZ_CP043489.1\|WP_149252311.1\|1827302_1828865_+\|trimethylamine-methyltransferase-family-protein	unknown	unknown	gnl\|CDD\|368818
NZ_CP043489.1\|WP_149252320.1\|1842091_1842613_+\|transcriptional-repressor	unknown	unknown	gnl\|CDD\|183251
NZ_CP043489.1\|WP_149255370.1\|1829033_1829813_-\|TIGR04222-domain-containing-membrane-protein	unknown	unknown	gnl\|CDD\|275063
NZ_CP043489.1\|WP_149255371.1\|1840715_1841957_+\|glutamate-5-semialdehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|234685
NZ_CP043489.1\|WP_149252323.1\|1844697_1845474_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|181762
NZ_CP043489.1\|WP_149252319.1\|1838998_1840579_+\|DHA2-family-efflux-MFS-transporter-permease-subunit	unknown	unknown	gnl\|CDD\|129794
NZ_CP043489.1\|WP_149252309.1\|1825862_1826489_-\|prolyl-oligopeptidase-family-serine-peptidase	unknown	unknown	gnl\|CDD\|183144
NZ_CP043489.1\|WP_149252313.1\|1831403_1833833_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043489.1\|WP_149252315.1\|1834322_1835462_-\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|225117
NZ_CP043489.1\|WP_149252317.1\|1836510_1837167_-\|TetR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|379522
NZ_CP043489.1\|WP_149252325.1\|1845986_1847087_-\|FUSC-family-protein	unknown	unknown	gnl\|CDD\|224208
NZ_CP043489.1\|WP_149252318.1\|1837499_1838828_+\|HlyD-family-efflux-transporter-periplasmic-adaptor-subunit	unknown	unknown	gnl\|CDD\|224482
NZ_CP043489.1\|WP_149252316.1\|1835601_1836384_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043489.1\|WP_149252322.1\|1843702_1844608_-\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176163

Protein	Function_ID	Function_description	E-value
NZ_CP043489.1\|WP_149252320.1\|1842091_1842613_+\|transcriptional-repressor	gnl\|CDD\|183251	PRK11639, PRK11639, zinc uptake transcriptional repressor Zur.	3.24863e-34
NZ_CP043489.1\|WP_149252310.1\|1826503_1827043_-\|HdeD-family-acid-resistance-protein	gnl\|CDD\|225786	COG3247, HdeD, Uncharacterized conserved protein [Function unknown].	2.94163e-15
NZ_CP043489.1\|WP_149252324.1\|1845466_1845874_+\|heme-binding-protein	gnl\|CDD\|377163	pfam03928, Haem_degrading, Haem-degrading. Haem_bdg is a bacterial protein that is up-regulated in response to haemin- and peroxide-based oxidative stress. It interacts with the SenS/SenR two-component signal transduction system. Iron binds to surface-exposed lysine residues of an octomeric assembly of the protein.	1.28785e-29
NZ_CP043489.1\|WP_149252326.1\|1847233_1848487_+\|flavodoxin-dependent-(E)-4-hydroxy-3-methylbut-2-enyl-diphosphate-synthase	gnl\|CDD\|234737	PRK00366, ispG, flavodoxin-dependent (E)-4-hydroxy-3-methylbut-2-enyl-diphosphate synthase.	0
NZ_CP043489.1\|WP_149252321.1\|1842765_1843689_+\|MerR-family-transcriptional-regulator	gnl\|CDD\|133381	cd01106, HTH_TipAL-Mta, Helix-Turn-Helix DNA binding domain of the transcription regulators TipAL, Mta, and SkgA. Helix-turn-helix (HTH) TipAL, Mta, and SkgA transcription regulators, and related proteins, N-terminal domain. TipAL regulates resistance to and activation by numerous cyclic thiopeptide antibiotics, such as thiostrepton. Mta is a global transcriptional regulator; the N-terminal DNA-binding domain of Mta interacts directly with the promoters of mta, bmr, blt, and ydfK, and induces transcription of these multidrug-efflux transport genes. SkgA has been shown to control stationary-phase expression of catalase-peroxidase in Caulobacter crescentus. These proteins are comprised of distinct domains that harbor an N-terminal active (DNA-binding) site and a regulatory (effector-binding) site. The conserved N-terminal domain of these transcription regulators contains winged HTH motifs that mediate DNA binding. These proteins share the N-terminal DNA binding domain with other transcription regulators of the MerR superfamily that promote transcription by reconfiguring the spacer between the -35 and -10 promoter elements. Unique to this family, is a TipAL-like, lineage specific Bacilli subgroup, which has five conserved cysteines in the C-terminus of the protein.	5.47256e-25
NZ_CP043489.1\|WP_149252312.1\|1830149_1831235_+\|redoxin-family-protein	gnl\|CDD\|239308	cd03010, TlpA_like_DsbE, TlpA-like family, DsbE (also known as CcmG and CycY) subfamily; DsbE is a membrane-anchored, periplasmic TRX-like reductase containing a CXXC motif that specifically donates reducing equivalents to apocytochrome c via CcmH, another cytochrome c maturation (Ccm) factor with a redox active CXXC motif. Assembly of cytochrome c requires the ligation of heme to reduced thiols of the apocytochrome. In bacteria, this assembly occurs in the periplasm. The reductase activity of DsbE in the oxidizing environment of the periplasm is crucial in the maturation of cytochrome c.	2.61889e-24
NZ_CP043489.1\|WP_149252311.1\|1827302_1828865_+\|trimethylamine-methyltransferase-family-protein	gnl\|CDD\|368818	pfam06253, MTTB, Trimethylamine methyltransferase (MTTB). This family consists of several trimethylamine methyltransferase (MTTB) (EC:2.1.1.-) proteins from numerous Rhizobium and Methanosarcina species.	0
NZ_CP043489.1\|WP_149255370.1\|1829033_1829813_-\|TIGR04222-domain-containing-membrane-protein	gnl\|CDD\|275063	TIGR04222, integral_membrane_protein, TIGR04222 domain. The majority of the proteins with a domain as described by this model have an extreme C-terminal sequence that is consists of extremely low-complexity sequence, rich in Ser or in Gly interspersed with Cys. That C-terminal region resembles ribosomal natural product precursors, although there is no evidence that C-terminal regions of these proteins undergo any modification or have any such function.	3.00175e-19
NZ_CP043489.1\|WP_149255371.1\|1840715_1841957_+\|glutamate-5-semialdehyde-dehydrogenase	gnl\|CDD\|234685	PRK00197, proA, gamma-glutamyl phosphate reductase; Provisional.	0
NZ_CP043489.1\|WP_149252323.1\|1844697_1845474_+\|SDR-family-oxidoreductase	gnl\|CDD\|181762	PRK09291, PRK09291, SDR family oxidoreductase.	1.37463e-152
NZ_CP043489.1\|WP_149252319.1\|1838998_1840579_+\|DHA2-family-efflux-MFS-transporter-permease-subunit	gnl\|CDD\|129794	TIGR00711, Uncharacterized_MFS-type_transporter_YhcA, drug resistance transporter, EmrB/QacA subfamily. This subfamily of drug efflux proteins, a part of the major faciliator family, is predicted to have 14 potential membrane-spanning regions. Members with known activities include EmrB (multiple drug resistance efflux pump) in E. coli, FarB (antibacterial fatty acid resistance) in Neisseria gonorrhoeae, TcmA (tetracenomycin C resistance) in Streptomyces glaucescens, etc. In most cases, the efflux pump is described as having a second component encoded in the same operon, such as EmrA of E. coli. [Cellular processes, Toxin production and resistance, Transport and binding proteins, Other].	1.85686e-123
NZ_CP043489.1\|WP_149252309.1\|1825862_1826489_-\|prolyl-oligopeptidase-family-serine-peptidase	gnl\|CDD\|183144	PRK11460, PRK11460, putative hydrolase; Provisional.	3.93921e-31
NZ_CP043489.1\|WP_149252315.1\|1834322_1835462_-\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	4.45522e-20
NZ_CP043489.1\|WP_149252317.1\|1836510_1837167_-\|TetR-family-transcriptional-regulator	gnl\|CDD\|379522	pfam14246, TetR_C_7, AefR-like transcriptional repressor, C-terminal region. This family comprises the C-terminal domain of transcriptional regulators of the TetR family. It includes the AefR transcriptional regulator from P. syringae. It is found in association with pfam00440.	9.12326e-35
NZ_CP043489.1\|WP_149252325.1\|1845986_1847087_-\|FUSC-family-protein	gnl\|CDD\|224208	COG1289, COG1289, Predicted membrane protein [Function unknown].	5.98814e-14
NZ_CP043489.1\|WP_149252318.1\|1837499_1838828_+\|HlyD-family-efflux-transporter-periplasmic-adaptor-subunit	gnl\|CDD\|224482	COG1566, EmrA, Multidrug resistance efflux pump [Defense mechanisms].	8.23338e-94
NZ_CP043489.1\|WP_149252322.1\|1843702_1844608_-\|LysR-family-transcriptional-regulator	gnl\|CDD\|176163	cd08474, PBP2_CrgA_like_5, The C-terminal substrate binding domain of an uncharacterized LysR-type transcriptional regulator CrgA-like, contains the type 2 periplasmic binding fold. This CD represents the substrate binding domain of an uncharacterized LysR-type transcriptional regulator (LTTR) CrgA-like 5. The LTTRs are acting as both auto-repressors and activators of target promoters, controlling operons involved in a wide variety of cellular processes such as amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to name a few. In contrast to the tetrameric form of other LTTRs, CrgA from Neisseria meningitides assembles into an octameric ring, which can bind up to four 63-bp DNA oligonucleotides. Phylogenetic cluster analysis showed that the CrgA-like regulators form a subclass of the LTTRs that function as octamers. The CrgA is an auto-repressor of its own gene and activates the expression of the mdaB gene which coding for an NADPH-quinone reductase and that its action is increased by MBL (alpha-methylene-gamma-butyrolactone), an inducer of NADPH-quinone oxidoreductase. The structural topology of this substrate-binding domain is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	3.83711e-106

>NZ_CP043489.1|WP_149252317.1|1836510_1837167_-|TetR-family-transcriptional-regulator
MLAESPAPAKEPATDPPAADNAKCRQIVDGARRVFLAHGFEGASMNDIAKEAGVSKGTLYVYFENKERLFAAIVDEERSSHVERIFEFDYNSPDVEGTLLELSAAITAFICQPRIISAMRAVMGITERMPDIGAHFYNAGPGHSRKQLAKYLDLRVAAGQLAIEDTELAAAQFLEMSHGPLLKPMFFMANNTPPTKERIREVAQSAVRVFMAAYGVKK
>NZ_CP043489.1|WP_149252316.1|1835601_1836384_+|hypothetical-protein
MRTLLIRPLPVLVTLVVIAGWMAPKQGILDRASGSIKGDLPGGVQTGTGEFDVGTVTAVRVTGPAGLVRLSASRGGPYRAELRSRPEGWFGFWRSNWSAGGCANAGSIRLVGTQLQVDTGNRAWFGASDCRLELDASLPEGVAVSIEQDATSSQLSGNFASLDVDSRAGDIALDGHARTVSIEGNAIRARLSYARVDQDESITLGGNAIDAELRFAGAEAVNYAVSGHASLVDSTLPNKPGVRPAIAIKGNFLRVRIGGE
>NZ_CP043489.1|WP_149252315.1|1834322_1835462_-|helix-turn-helix-domain-containing-protein
MIFVPLPFVSALLFAILLVQMARQGDRPWRDNAFFLLLLGFTVLAVLLGLRWGYGIRTFIPLQAMLAALTPALAWLAFRGLTVEGPALRWAKVWPHLLPAGLVGLLFTISSVSIDLVVILAFLGYGLALVRLVLAGPDLLIAPRLDGVLRSYRALQITAVACLLSGLMDIVISFDMRWMGGAISEAMVSGGNVVVLLVLGAAAASAGSAAPAEEVEPPTVEPPVRPGSDEDKAVAQALDALMAERQLYKDVDLNLGRLARRLNLPARRVSSAVNRIHGMSVSHYVNKYRIEEACRLLASTDTSIIQVMMEAGFLSKSNFNREFLRLTGVSPIAWRRGQRAAPVGNAETDKQKAPLWRGPQTQLNMTQRDLTQLERNATQ
>NZ_CP043489.1|WP_149252314.1|1834026_1834329_+|hypothetical-protein
MLKKILTGTLVAATLAGTAIATTGTAEARYGRGGAFAAGAGIGLLGGLLAGSAYNNSYYGGGYYDEYRPVYYRQYRRCTIQKRWVEDYYGGHWARVRVCY
>NZ_CP043489.1|WP_149252313.1|1831403_1833833_-|hypothetical-protein
MRSGWRVGVWLVLGLMFVAPPVVAAPCSGEPAACAAVGKTALGLPYQAALTILQDMGEKDRQVRIERLSKALEANPVDDLARLELIMLGGDDRKQTAIATSLADLLAKAGKAGDPTVAALARLLSIPTIDAEGEEAEARITALVEAALADIQTMRHATMRGGQARLTVDDADLLAGLIARRAVFDLDEAIEDYDRDVGKAHAALLQAAIEAFSARLERAPRDPARFQLLVEALRDNYYDKGRYDRLVEICRRWTSVAPANPKARRSLVSALAARADERNLADKTASALADAEALAVLAKPTAGSARLDAIESEALVASHRVRAVAQGKTEPVRAAATLAEGLEQLRAGTQGDPAQSSGDDLILAAAMLAGERIDKQDAASADAIETKLLSVLAEPERRAQLRDMIAARYQTKGEVEAAMQRYRRSMAELAAAPLDGERSWRFFAAARNLLDLGRRDARSFDADAHARLLTDYAAEARLRALDGLDGKERARLLLQIADALHVTAKRLEEAGIEAPRIGLLEREIALREPLVRDPAERANRLDDLARAYRDLSDAFDTANREKEALDLARKRVEIRRELKEKSPSGFDELSDYVWALRDFGDEQRHVGDDKGAQASYQEGAEVGAMLLERFPDRGGSYEAMSAIQVAMGHAARSTMMKLIHYKRAEATNLAHLGKLGEKKFDQDFLAVSSINIGDTYLEAGKYQAALTHLGKALEASDKSLADDKDNNSLLRRRVRIFDKMARAEQGLGRTEPAIATRRRQIELLEKLARLRGAAVENQAEAYEALISLLSESGDHADEIAEIRRKVAAL
>NZ_CP043489.1|WP_149252312.1|1830149_1831235_+|redoxin-family-protein
MVKLLLQHLTAELTPITSRVEQMQMPGFVHRPRGTGAMPAGEGNGDEALIFEGDAACLVAAPAAFSGQLRREGDEIAWLVELIGFEPSPKPGESRLPLGFRGLQGRSGFTGIRQEAPQQLWGTSARLYHRTRAWLSPSSKAFRPACSVQGSSKPVRNHLRPVAKAGMMASSRIVGAHRSKEPGKAPHGRTGMIGRRAFLASIAASLATSARAEDATAPDSNGTVLGSFQVEALPGLVDVPAPTLEALQDQITVLNFWASWCEACQEEHRYLVNLQRKGVRIAGVAVQDRGEAVLRYLEKAGNPYGFVGIDNKRELITMLSLRSIPQTFLIGRRCEVVWQTDEGLDNALVAELLGKIEAISG
>NZ_CP043489.1|WP_149255370.1|1829033_1829813_-|TIGR04222-domain-containing-membrane-protein
MLSRALQDSVNGPVMPGDAGVLLGPYHFAYLAGGANRVLEAALTQLYLDGTIAMQSNEAVLIRRVPRRAPAVERLIGDKLAEGPLRIGPTTIEIAVEPIRRDLLVAGLVPGPDELARTRQIPFLLIGPLLLLALIRFFFGIANERPIALLAFCLVATPFLIVIAAMRQPPHTRAGGELLRQAERSIQARGKPAANSPGLTEWVALHGHVGLAGLGLTAFSFFLANQPALAVKAGGGGSCGGGGGDGGGGGCGGGGGCGG
>NZ_CP043489.1|WP_149252311.1|1827302_1828865_+|trimethylamine-methyltransferase-family-protein
MTDAADNATHTEAPSASRRGRDARRAARVQRGGVSVPYITRNIPLTEVLSEEAMQIIEHNAETLLEEVGIEFREYPRALELLKAAGCDIKGERVRFPRGLARKLIQTAPSQYTQHARNSERNVVIGGNNTVFAPNYGSPFVHDLDKGRRYGTIEDFRNFVKLAYANPYVHHSGGTVCEPVDLPVNKRHLEMLYAHMRLSDKPFMGSVTAPERAQDTVDMAKILFGEDFIRENTVCTSLINANSPMVWDNTMLGAADVYAQNNQACIITPFILSGAMSPVTVAGTLTQVLAEVLAGVSFLQLVRPGAPAIFGTFVSTLSMQSGAPTFGTPEAALAIYGAGQLARRMKLPFRSGGSLCASKVPDAQAAYESANTLLPAMFGGVNFMLHSAGWLEGGLSASYEKFVMDFDQLGAMHVLAKGVDMSENGQAMDAFHQVEPGGHFLGCAHTQANFETAFYRSTISDNNSVEQWEAEGKQDAAQRANKIWKKTLADYEAPAIDPGIDEALRDFIERKKAAVPDANY
>NZ_CP043489.1|WP_149252310.1|1826503_1827043_-|HdeD-family-acid-resistance-protein
MEVLQRSWPWFVILGVVAVIGGILALIHPGFASLVVVVWAAWAFIVLGVGQLVHATVIRAWSGFLMTALMGILALLLGASLLLNPLAGVVSLTALLGAMFLVYGLAKVIIAFNIRASANWTWLLLSGLISILLAVLIFSDFQQSASSLLGILLGVELLFYGFASLMTGMALRSRVDGSR
>NZ_CP043489.1|WP_149252309.1|1825862_1826489_-|prolyl-oligopeptidase-family-serine-peptidase
MTDRLPDSLVILLHGVAAFGYDLDPLAGMLRRSLPRTAVVAPDAPFAYEQGPGRQWYSLEGVTPENRLARIVAARPAFDALIRSLVAAQGLEKRLERVALVGFSQGATLAFDAVARGRWPVGALALLSGRFVAPAPFTPARMTPVLLVHGSADGAVPSEETRRARALLQEADMTVESHILRGVGHTISPTGVKLTRRFLRERLGEAGV
>NZ_CP043489.1|WP_149252318.1|1837499_1838828_+|HlyD-family-efflux-transporter-periplasmic-adaptor-subunit
MDAARDHNAVPGGQGATGPADAIDNVVTLERQRTDTPEAPEIKKTEPQKAEAPAVPAQTKPAAAAGKKKSKARTVMPILLIVALAAGGWYGYDWWTNGRFMVETDDAYVQADVSTLGVKVSGYVDSVPVQNGDSVKAGDVIVKLDDTDYRTALDSAKAKRVTQNATIARIDQQVTAQQAAIETANAGVASAKAGIESAQAGIDSAKAEIVRANAAFERADTLAAQNFGSKATLDQAIADRDKANAGLASAKATLTNAQASLNSAQAGVIAAKANLAVTQAQKAEAEQGAKELDVAITKAQNDLDATVVRAPSDGVVGNRAAQPGQYVSPGSRLIALVPLKSIYVAANFKETQLGPLVPGQKVEVSVDSMDGNAFEGVVGKFSPASGSVFSLLPPENATGNFTKITQRVPVRIEVPADVALSGKLRPGLSVVVTVDSRTGPKG
>NZ_CP043489.1|WP_149252319.1|1838998_1840579_+|DHA2-family-efflux-MFS-transporter-permease-subunit
MATATATAIPAPAEEAIDKRKLIAFLAMVFGMFMAILDIQVVSASLPQIQAGLGASGDEIPWVQTAYLVAEVVMIPLSGFLSRAFSTRWTFAVSCAGFTVMSFMCGTATNINEMIIYRALQGFIGGGMIPTVFAAAFTIFPRSKQAIVSPMIGLVATLAPTIGPTVGGILTDAISWHWLFFINVVPGVIVTLMTFSMVDFDEPDLSLLSNFDWTGLISMAVFLGGMEYALEEGPGHDWFAETPVLVMSVLAAIGALVFFARVLLARQPIVDLYAFKDGNFATGSLLSFVLGVGLYGLTYLFPVYLSGVRGYDSRMIGETMFVTGLCMFFTAPIAGNLTRFVDPRLMIAGGFIGFAAGTWIMTGITHDWDFYEILLPQILRGVSLMICMVPISNIALGTLPPARIKNASGLFNLMRNLGGAVGLAIINTSLNKRQDLHLSRLGEAVNWSRDNVLQTYDNMKAGFAAFGAAADQMTVARLVSLMRREALVMAFSDVFLLLTLLFGLLSLSVFMLKKPQMAGGGGGGGH
>NZ_CP043489.1|WP_149255371.1|1840715_1841957_+|glutamate-5-semialdehyde-dehydrogenase
MRKVGQAARSAARTLALAPAPIKNAALEAMAKAILANEAVILAANALDVADALARGQIASYVDRLTLDEKRVAGIAAAIREVAAQPDPVGRVLASWTRPNGLEFERVSTPLGVVGVIFESRPNVLADAGALCLKAGNASILRGGSESFRTCSEIAKALRAGLQAAGLPEAAIQMVPTPDRSAVGAMLAGLDGNLDVLVPRGGKNLVSRVQAEARVPVFAHLEGVNHTYVHAGASLDMAVAVVLNAKMRRTGVCGATETLLVDQAVAPVFLKPLVKALLEAGCEVRGDSRTLSVDPHVKPADDTDWATEYLDAIISVKVVSGLDAALAHIERYGSHHTDAIVTDDEAAAARFLAEVDSAIVLHNASTQFADGGEFGFGGEIGIATGRMHARGPVGAEQLCSFKYRVRGQGTVRP
>NZ_CP043489.1|WP_149252320.1|1842091_1842613_+|transcriptional-repressor
MAHRHAHDHEPAPVFAEPGHDHSHCSSSVLARAESLSAERGVRLTQIRRQVLEALAATHQPIGAYELIERLEDGEGKRPAPITVYRALDFLLEQGFAHRIESRNAFIACAHDHKDGSVVMFLICESCGTVGEAESDTVGKALATAAGAIGFTPRGQVIELAGICRHCREKAQA
>NZ_CP043489.1|WP_149252321.1|1842765_1843689_+|MerR-family-transcriptional-regulator
MSEKTYTIGELSKLSGIAVRRIRFYSDKGLLPPAARAESGYRVYSEADRARLDLILALRDAGVKLGDIARLIARRLGLADVLALRLDAIEAEISAKRRIAAALRATLRLADPTPQDLRRLWTVTALSKTQFRTAIEAFYAEAGSDARMDPAWRDKMIAAATPDLPDDPTTAQLDAWTELMGMLTDKSYRDEMQVSMRELWHDGFDPAAYRQASDQTFAQVRAAMAKGIAPDSDTGRAIAEAWLESSARAMKKEPDAAFLDWQLEQYRKHHARSRRYLELMAILRGDPPGQLAASEWGWIVEALSSRL
>NZ_CP043489.1|WP_149252322.1|1843702_1844608_-|LysR-family-transcriptional-regulator
MKDIHQLKSGDLFALTVFLSVAAHRSFRAAGIELNVTPSAVSHSVKSLEQRLDVRLFNRTTRSVSLTDAGEQLAAKLRPAVSSIAEALQVVDDYRETPSGTVRINSSEGAIRLVLLPVLARFARDYPQVHLDIVSDGRLSDVVADGFDAGIRLAEAVPQDMIAVRLTETARFAAVGSPGYFAARGRPAVPQDLHRHACIRFRFDSGAIYRWEFERHGMTETINVTGPLTLTDQPLMVEAAIQGIGIAFVPDHLVVGALADGRLERVLDDWCPAFPGLCLYYPGHRHVSAGLRALIAAIRAG
>NZ_CP043489.1|WP_149252323.1|1844697_1845474_+|SDR-family-oxidoreductase
MSKKILITGASSGFGRGAAIELARQGHQVVATAESWPLVRSLRADAAAAGVKLEAIKLNLLDDIDIAHAYSYDPDILVLNAGVMESGSVIDIPMQRVRESFEINVFGHIRLVQGIVPKMVARKAGKVVWTSSMGGILVIPFVGVYCATKHAIEAIAGSMRAELAPYGVKVATVNPGVFGTGFNDTGAESHTQWYDAGSAVVPMPDFAGSLADQNDPQEMIDAMVEIIPAEEHLYRTMRPLDTIKAARQWQETEWSQNA
>NZ_CP043489.1|WP_149252324.1|1845466_1845874_+|heme-binding-protein
MPEITLEDAHGVVARARAAAEKAGMKAVFAVLDKGANLVTFSRMDGAWLASNELAIAKARTSVMFQAPTVALSAPLKIGEPLLHFDHIHHGGLLLVGGGEPLFDVEGALIGGLGVSGGSPEQDAAIARSAVQQQS
>NZ_CP043489.1|WP_149252325.1|1845986_1847087_-|FUSC-family-protein
MMIGAGATARLFKWFAAKRMELALAVRVTVAAGLTFVAVKLVDLSQSSWAVITSIIVMQASLGGSVKAAMDRMAGTLLGALWGAVVSVVLPHHEGNIALGLAVLTAVAPMAVASALRPSFRVAPITALIVLIPAGGTLLPPYAYAAERVAEIALGIIVGVGVALFVLPARAQGALAAAAARVADLNAELLLALTGSLLDGKGRPELAGINKRIRAGLRQIDAAVEETVRERSTHLSHAIDPEPMARTLYRVRHDLVIIARVCVRALPERVAPTLTEPLEAMRDATVGLLRGIAEALRRGYLGPDAAGFDTSLSAYVAAMDKLRGAGVLRELQSEEVGRLYALRFGFEQLGQDIKDLVERSSDLARE
>NZ_CP043489.1|WP_149252326.1|1847233_1848487_+|flavodoxin-dependent-(E)-4-hydroxy-3-methylbut-2-enyl-diphosphate-synthase
MIPSYARFGLMSRRPTVPVDVGGVLVGGGAPIVVQSMTNTDTADIDGTVRQVAALARAGSEMVRITVDRDEAAAAVPRIKERLMRIGVTTPIIGDFHYIGHKLLADHPACAKALDKYRINPGNVGFKDKRDRQFGAIIEMAMRHDKPVRIGANWGSLDQELLTHLMDENARSEAPVDARTVTWEALVQSALLSADRAVEMGLPKSRIIISAKVSAVQDLIAVYNEMASRSDYALHLGLTEAGMGSKGIVASAAALSPLLQAGIGDTIRVSLTPEPGGDRTQEVKVSQEILQVMGIRTFVPLVAACPGCGRTTSTVFQELAQSIQGFIIDSMPEWKTRYPGVEALKVAVMGCIVNGPGESKHADIGISLPGTGETPTAPVFIDGQKAATLRGPGIADEFKQMVIDYIENRYGVRPAAE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP043489_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP043489_2

2815237-2815313

Orphan

Consensus_repeat	Method
GAGGGTCGATCTGGAGATCGACC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP043489_2

>merge|NZ_CP043489|2|2815237-2815313|CRISPRCasFinder
GAGGGTCGATCTGGAGATCGACCATCTTCCCTGTCCTCACATTCGGCGTTTCCGAGAGGTCGATCTGGAGATCGACC

>NZ_CP043489|2|2|2815237-2815313|CRISPRCasFinder
GAGGGTCGATCTGGAGATCGACC	ATCTTCCCTGTCCTCACATTCGGCGTTTCCG
AGAGGTCGATCTGGAGATCGACC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP043489.1\|WP_149253103.1\|2808255_2808624_-\|GFA-family-protein	unknown	unknown	gnl\|CDD\|226314
NZ_CP043489.1\|WP_149253109.1\|2813530_2814199_-\|FCD-domain-containing-protein	unknown	unknown	gnl\|CDD\|224715
NZ_CP043489.1\|WP_149253105.1\|2809129_2809900_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|368724
NZ_CP043489.1\|WP_149253116.1\|2825249_2826275_-\|ribose-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|226633
NZ_CP043489.1\|WP_149253106.1\|2809844_2811005_-\|coproporphyrinogen-III-oxidase	unknown	unknown	gnl\|CDD\|181629
NZ_CP043489.1\|WP_149255428.1\|2811139_2812300_-\|mandelate-racemase	unknown	unknown	gnl\|CDD\|239442
NZ_CP043489.1\|WP_149253120.1\|2830521_2831616_-\|substrate-binding-domain-containing-protein	unknown	unknown	gnl\|CDD\|224525
NZ_CP043489.1\|WP_149253118.1\|2827917_2829507_-\|mannitol-dehydrogenase-family-protein	unknown	unknown	gnl\|CDD\|223324
NZ_CP043489.1\|WP_149253111.1\|2815392_2818122_+\|DNA-mismatch-repair-protein-MutS	unknown	unknown	gnl\|CDD\|235444
NZ_CP043489.1\|WP_149253113.1\|2821135_2822467_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043489.1\|WP_149253117.1\|2826357_2827896_-\|ATP-binding-cassette-domain-containing-protein	unknown	unknown	gnl\|CDD\|224053
NZ_CP043489.1\|WP_149253119.1\|2829463_2830423_-\|substrate-binding-domain-containing-protein	unknown	unknown	gnl\|CDD\|380544
NZ_CP043489.1\|WP_149253114.1\|2822463_2823807_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043489.1\|WP_149253112.1\|2818333_2821105_+\|[protein-PII]-uridylyltransferase	unknown	unknown	gnl\|CDD\|235342
NZ_CP043489.1\|WP_149253104.1\|2808717_2809125_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP043489.1\|WP_149253115.1\|2823823_2824942_-\|trypsin-like-peptidase-domain-containing-protein	unknown	unknown	gnl\|CDD\|379142
NZ_CP043489.1\|WP_149253110.1\|2814352_2815162_-\|ammonia-dependent-NAD(+)-synthetase	unknown	unknown	gnl\|CDD\|234831
NZ_CP043489.1\|WP_149253108.1\|2812776_2813367_-\|biotin-transporter-BioY	unknown	unknown	gnl\|CDD\|224187
NZ_CP043489.1\|WP_149253102.1\|2807939_2808248_+\|antibiotic-biosynthesis-monooxygenase	unknown	unknown	gnl\|CDD\|224278
NZ_CP043489.1\|WP_149253107.1\|2812354_2812780_-\|DUF1284-domain-containing-protein	unknown	unknown	gnl\|CDD\|226073

Protein	Function_ID	Function_description	E-value
NZ_CP043489.1\|WP_149253103.1\|2808255_2808624_-\|GFA-family-protein	gnl\|CDD\|226314	COG3791, COG3791, Uncharacterized conserved protein [Function unknown].	1.10193e-25
NZ_CP043489.1\|WP_149253109.1\|2813530_2814199_-\|FCD-domain-containing-protein	gnl\|CDD\|224715	COG1802, GntR, Transcriptional regulators [Transcription].	1.16242e-41
NZ_CP043489.1\|WP_149253105.1\|2809129_2809900_+\|hypothetical-protein	gnl\|CDD\|368724	pfam06057, VirJ, Bacterial virulence protein (VirJ). This family consists of several bacterial VirJ virulence proteins. VirJ is thought to be involved in the type IV secretion system. It is thought that the substrate proteins localized to the periplasm may associate with the pilus in a manner that is mediated by VirJ, and suggest a two-step process for type IV secretion in Agrobacterium.	1.05986e-56
NZ_CP043489.1\|WP_149253116.1\|2825249_2826275_-\|ribose-ABC-transporter-permease	gnl\|CDD\|226633	COG4158, COG4158, Predicted ABC-type sugar transport system, permease component [General function prediction only].	1.92035e-120
NZ_CP043489.1\|WP_149253106.1\|2809844_2811005_-\|coproporphyrinogen-III-oxidase	gnl\|CDD\|181629	PRK09057, PRK09057, coproporphyrinogen III oxidase; Provisional.	0
NZ_CP043489.1\|WP_149255428.1\|2811139_2812300_-\|mandelate-racemase	gnl\|CDD\|239442	cd03326, MR_like_1, Mandelate racemase (MR)-like subfamily of the enolase superfamily, subgroup 1. Enzymes of this subgroup share three conserved carboxylate ligands for the essential divalent metal ion (usually Mg2+), two aspartates and a glutamate, and conserved catalytic residues, a Lys-X-Lys motif and a conserved histidine-aspartate dyad. This subgroup's function is unknown.	1.26743e-178
NZ_CP043489.1\|WP_149253120.1\|2830521_2831616_-\|substrate-binding-domain-containing-protein	gnl\|CDD\|224525	COG1609, PurR, Transcriptional regulators [Transcription].	1.64755e-93
NZ_CP043489.1\|WP_149253118.1\|2827917_2829507_-\|mannitol-dehydrogenase-family-protein	gnl\|CDD\|223324	COG0246, MtlD, Mannitol-1-phosphate/altronate dehydrogenases [Carbohydrate transport and metabolism].	3.29504e-142
NZ_CP043489.1\|WP_149253111.1\|2815392_2818122_+\|DNA-mismatch-repair-protein-MutS	gnl\|CDD\|235444	PRK05399, PRK05399, DNA mismatch repair protein MutS; Provisional.	0
NZ_CP043489.1\|WP_149253117.1\|2826357_2827896_-\|ATP-binding-cassette-domain-containing-protein	gnl\|CDD\|224053	COG1129, MglA, ABC-type sugar transport system, ATPase component [Carbohydrate transport and metabolism].	0
NZ_CP043489.1\|WP_149253119.1\|2829463_2830423_-\|substrate-binding-domain-containing-protein	gnl\|CDD\|380544	cd06321, PBP1_ABC_sugar_binding-like, periplasmic sugar-binding domain of uncharacterized ABC-type transport systems. This group includes the periplasmic sugar-binding domain of uncharacterized ABC-type transport systems that share homology with a family of pentose/hexose sugar-binding proteins of the type 1 periplasmic binding protein superfamily, which consist of two domains connected by a three-stranded hinge. The substrate specificity of this group is not known, but it is predicted to be involved in the transport of sugar-containing molecules and chemotaxis.	1.62629e-114
NZ_CP043489.1\|WP_149253112.1\|2818333_2821105_+\|[protein-PII]-uridylyltransferase	gnl\|CDD\|235342	PRK05092, PRK05092, PII uridylyl-transferase; Provisional.	0
NZ_CP043489.1\|WP_149253115.1\|2823823_2824942_-\|trypsin-like-peptidase-domain-containing-protein	gnl\|CDD\|379142	pfam13365, Trypsin_2, Trypsin-like peptidase domain. This family includes trypsin-like peptidase domains.	2.18882e-14
NZ_CP043489.1\|WP_149253110.1\|2814352_2815162_-\|ammonia-dependent-NAD(+)-synthetase	gnl\|CDD\|234831	PRK00768, nadE, ammonia-dependent NAD(+) synthetase.	2.1724e-155
NZ_CP043489.1\|WP_149253108.1\|2812776_2813367_-\|biotin-transporter-BioY	gnl\|CDD\|224187	COG1268, BioY, Uncharacterized conserved protein [General function prediction only].	1.6768e-38
NZ_CP043489.1\|WP_149253102.1\|2807939_2808248_+\|antibiotic-biosynthesis-monooxygenase	gnl\|CDD\|224278	COG1359, COG1359, Uncharacterized conserved protein [Function unknown].	1.28244e-18
NZ_CP043489.1\|WP_149253107.1\|2812354_2812780_-\|DUF1284-domain-containing-protein	gnl\|CDD\|226073	COG3543, COG3543, Uncharacterized conserved protein [Function unknown].	2.00684e-51

>NZ_CP043489.1|WP_149253110.1|2814352_2815162_-|ammonia-dependent-NAD(+)-synthetase
MPQPLTPDIIVPEAFDPAAEAERRIAFLADYLKASGGRAYVLGISGGVDSLTAGLLAQAAVERLRTEGYQAQFLAMRLPYGVQADEKDAQHSLATIKADRVVTVNIKPAADAMMAELTREAGDLIEGARADFHHGNIKARQRMIAQFGLAGAVRGIVIGTDHAAEAVMGFYTKFGDGAADILPLAGLNKRRVRALAAHLGAPRELVFKVPTADLETNVPLKPDEDAYGVTYDEIDDFLEGKAIAEASHQRILSTYRASAHKRALPVAAG
>NZ_CP043489.1|WP_149253109.1|2813530_2814199_-|FCD-domain-containing-protein
MNAPKDDTIAIRIAKVLADRIISGAIEPGARLRQDHVAEEFATSHVPVREAFRRLEAQGLAVSEPRRGVRVAAFDLAEVKEVAQMRAALEVLALRQAAPHLTATILDEAEEATKAGDRSPDVRSWEEANRRFHRLILAPCRMPRLLAAIDDLHAASARFLFAAWRSEWETPTDQDHRAILSALRSGKVDDAAGTLARHVQRVGLKPVRSASGATREAFAIIG
>NZ_CP043489.1|WP_149253108.1|2812776_2813367_-|biotin-transporter-BioY
MSHSATPSLTPAFSPLDISRRSLGWQAAAVVAGTAVLALASHIQVPMFPVPMTMQTLAVTLIGALYGWRLGAITVLAWLAEAWMGLPVTATGSIGTLLFVGPTAGYLISFPLVAALCGLLAERGWNGNRPVLAFVNMTLGNALCLAIGGAWLGAQIGLEKAFLLGVAPFLLGGLLKSVIGAVTLMALVRGKAGAAQ
>NZ_CP043489.1|WP_149253107.1|2812354_2812780_-|DUF1284-domain-containing-protein
MTVRLRAHHLLCMLTYVGKGYSPGFVANYDAIAARLSQGEDIMIVAGPDDICAPLLQQTDSHCHEPRIDQRDELAIRDVGALMRLPIRTGTRIALTPTLLARFRGAFAANLTRSACVGCEWSGLCSAVARDRYQESRVRRD
>NZ_CP043489.1|WP_149255428.1|2811139_2812300_-|mandelate-racemase
MRILDIRERSLPISRYTGPAGAGGLTTSVVALTTDRMKAGRPIVGYGYASIGRYAQGGLIRERFAPRLLQAPAETLIGNDGILDPFKAWQAMMTGEKPGGHGERCVAIGALDMALWDIAAKAAELPLHAYLADRLGGRAGQTDRVRVYASGGYHHPRNDLAWLADEMRRFADLGFINAKMKIGSASLDQDLHRIEVAAAALGEPGRLAVDAMNAYDRPAGLAAAATLSPLGLWWFEDICDPLDFETQSALASAYAPPIGAGEALFSAAEAGLLARHGDLRPDRDVLLFDPVHCYGLPGYLQIIEVMTAKGWARQAFWPHGGHLFALHLAAALGLGGAEVTPIAFQPFCGLADDSVIADGFATLPQAEGIGFETNTALKRLFAELAG
>NZ_CP043489.1|WP_149253106.1|2809844_2811005_-|coproporphyrinogen-III-oxidase
MIPNSPEPGFGVYVHWPFCLAKCPYCDFNSHVRTGGVDQAGYVEAYLKEIAHMAAIAPGRQVQSIFFGGGTPSLMEPKTVGAILDAIGGAWTIAPDAEISLEANPTSVDATRFAGYRAAGVNRVSLGVQAMNDADLKRLGRMHSVAEAMAAVEIAAKSFERYSFDLIYARPDQRPGDWQTELDEAIDRAAEHLSLYQLTIEPDTMYERLVAAGKLIPMPDEDARVLFDITRETCERRGLPAYEISNHARPGAECRHNLVYWRYGEYAGIGPGAHGRLIDAAGVRRALSTERSPEKWLAGVRTNGHGLVDDQALTADQQGDEMLLMGLRLAEGIDLARLARLRGRPMAEATLAGLQQNGMIERRDDRVRVTRAGFPLLDAVVAELAA
>NZ_CP043489.1|WP_149253105.1|2809129_2809900_+|hypothetical-protein
MPWRSGWRVLAMGLASGLLFGSAQIAAAQTSAADDGFADLPLEISAAPAGHGALVVFLSGDTGWGGLERSLVRRLARAGVGVIGLDARRYFFTKRSPAELARDIERVLAVYRRRWHAGRIVLAGYSFGADALPFAWPLLSTKTRQDTRLIALIGLLPEANFRISLLEMLDLPASDDTPVAPMLRHLPVGKVVCLYGREEHSACTLPELAGAERIARPGGHDRDGDAGAVVQAILRHLALRPPAPPPPHRAGESPRG
>NZ_CP043489.1|WP_149253104.1|2808717_2809125_+|hypothetical-protein
MSAARKIHTLTFHLLGIAGEDAMDDIIDEIEEFADGVDWPIEAPDAFKHKVSETAPDMGCAVELPVRASLAGETIAGEKADFAGAMALIEHLRQLSARHRFDVEIAFDKEIVGTIDKGAYSEALRQGLVEPWQAG
>NZ_CP043489.1|WP_149253103.1|2808255_2808624_-|GFA-family-protein
MALKGSCHCGGTTFELSEAPQEVTRCTCSFCSKRGSLWAYYRPEQFKLTSPPEQVATYRWGSKTIQHHFCATCGCGTYTQTPDWSTGEPDFDNPKISINARLFDDFDLEAVPVTVIDGRNLW
>NZ_CP043489.1|WP_149253102.1|2807939_2808248_+|antibiotic-biosynthesis-monooxygenase
MSVTYLIGFVVNPGQRERFLGMLNTLLDTMRHEATFVNATLHADPNDPCRFLLHETWVDHQDVLDVQLSRPYRQAWHEALPELLAQPREVSIWQPLRADRKD
>NZ_CP043489.1|WP_149253111.1|2815392_2818122_+|DNA-mismatch-repair-protein-MutS
MTSTPRKLDTADASAPVTPMMAQYLEIKAGYPGALLFYRMGDFYELFFEDAEIASKTLGIVLTKRGKHQGEDIAMCGVPVVRADEYLQRLIAHGHRVAVCEQMEDPAEAKKRGSKSVVKRGVVRLVTPGTITEETLLEPTRTNLLLALARLRISDDEARYGLAFADISTGEFGLSECDEAGLPAELARLDPSEVVMAEAVHEDAELASLWRECRAAVTPVGRDVFDGSQAERRLAAFYDVGTIDGFGTFSRAELVAASGLVTYILRTQVGQKPALAPPRRDGASAHMAVDAATRANLELTRTLGGERAGSLFDAVDRSVTAAGGRLLAQWLASPLLQPEAIALRQDAVAFFAEQALLRGQVRARLKSAPDIARSMARLALDRAGPRDLAALREGLVGIAGIETLLRQREAELPSMLAGILSALARPDQGLAARLAAALQDDLPLLKRDGGFVRAGYDQALDETRALRDESRRVIAGLQARYAEESEVRQLKIKHNNMIGYFVEVPQQAGEAFLQPGLRETYVHRQTMAGAMRFSTAELSTLESRIASAAERSLASELQIFSDLAAALLGDSVAIRAATEALALLDVIVALAVLADEENYVRPVVDTSLAFAIEGGRHPVVERALKREGKPFVANDCELSGEGQGKQAAGRIWLLTGPNMAGKSTFLRQNALIAVLAQIGSFVPAKSAHIGAVDALFSRVGAADDLARGRSTFMVEMVETAAILNQAGPRALVILDEIGRGTATFDGLSIAWAAIENLSAVNHCRALFATHYHELTQLTKKLPRLANATMRVTEWHGDVVFLHEVVPGAADRSYGIQVAKLAGMPAAVVERARAVLAQLEAGDRQAPAARLVDDLPLFAAAPRASAQVAVTARDEVAEALDGLDPNDMTPRQALDALFSLKAKRDSAKKG
>NZ_CP043489.1|WP_149253112.1|2818333_2821105_+|[protein-PII]-uridylyltransferase
MLDKPDRELHLVLDRMALEAEIDALALEHEGHADALRQAVVALLKATLRDGRETIRTWFSEDRLGTACAQRLSWLEDEIIRASYAYVTRYVYTTHNPTAGERMAVIAVGGYGRGTLAPGSDIDLLFLLPSKQTAWGESVTEAILYVLWDLGQKVGHATRTIDECLRLARGDMTIRTALLEARPILGDMGLASELAARFDRELVQLTAAEFVAAKLAERDERLIKAGNSRYRVEPNVKEGKGGLRDLNTLYWIAKYVYRVRDAADLVEAGLFTRREYRQFTLAEDFLWATRCALHFLTGRAEERLTFDIQREIAAFLGYSDRGGLRGVERFMKHYFLVAKDVGDLTAIVCAALEARQEKPKAMLDRFIAPFRRSQRQALIGTKDFVIETGRLNVANDQVFARDPVNLIRLFHLADLHSLALHPDAMRLVTRSLKLVNASLRENGEANRLFLEILTSRNAPETVLRRMNEAGVLGRFIPDFGKVVAMMQFNMYHRYTVDEHLLRSVGELADIDRGEGGDEHPLVNEIMPTIQNRTALYVATFLHDIAKGRPEDHSLAGAKIAKRLGPRLGLTPGQTDTVSWLVEQHLVMSMTAQSRDISDRKTIETFAGTVQTLERLKLLLILTVSDIRAVGPGVWNGWKGQLLRSLFWETELVLAGGHSNVDRRASVQLAQDELRAGLSDWSAEEIDAYTARLYAPYWLKVDLPRRLRHARFVRAVRERGETLGTEVATDAFRGVTELTILAPDHPRLLSIITGACAASGANIVDAQINTTTDGLALDTIFVSREFPEDEDELRRAGRIAQAMEQALTGTIRLPEAVAKRSAIKPRQKAFQVAPEVVVDNEWSNRHTVVEVWGLDRPGLLYDLTTAISRLNLNIASAHIATFGEKAVDVFYVTDLTGAKITSVQRQDSIRSNLLAVFRGEGKSG
>NZ_CP043489.1|WP_149253113.1|2821135_2822467_-|hypothetical-protein
MSGKTSHHPPISFANITDISSQHLDLLRSSSQRNDDSPEAIAAFRDRIADFRTGVAAAGARLEKEGDRETAQGIIDYWSTQLLAWSTNGARPDLDLPLASYLDLPGAALPAGATAARRPTGEAVAQDGRAQVRIGSLAYQWRRSNRAPGYLLTGNALVEAAGYRGKDPEIEAFVSASEAAERRTRHIRAGFIVTLVLSIAFAVLALISFFRENEARKEADQLSADNDKRAQRFLVADVRLQTERFQHAAELKELNDQLLAMKSALEEAQAKLKVALAQTPSPTLNPTQHMYLRDSNAVLTQAIDQSRAHKPSLPPLTAGEQLLANVNLIDGPDGDVRRATTENLVRAVRDGTVSPDDQRMLVGALVNMLARPAVQSLTLTGRYNVLYILSIITSAQWTLPAWSALRDRARIVTADLVGPNAQNDLPMGADSQKFYQQLVQRLQ
>NZ_CP043489.1|WP_149253114.1|2822463_2823807_-|hypothetical-protein
MGLVTLPPQSVVSISNAIGDLCTFRELGDLMQICYGTSVAITGVSFAEQPRRKVARDCVDWAQKCGILTNFVAIVLHAKNDNTAFRELVTQLIPDALTAPPSVASQVGTVVSGLDSLAAYLAKDEVRKKAGISKQRLVEIGQRINLLAAYKGLHDSLHHIQINHTRILLQAVATMDNPISYETVQVYISQVRAAVIAIRTEIAKPGANEILGGLDLSWVEDLASSSQRCQEGLDADKPGPVLIAIRQIASISDGQSVQLNKGIFDAATKLPLPELAGALVEIGAADAGLLAALDEAIVALGALQRTLMSRIATHNRLQKVEQNLSILASCLDDPGVLIVDEIAALWPETRVMLLNLAALGLERADMTVDGEDCGKIDACLQDVEIAQRDTAFNLKSAPAIRALQRAFSAFQKNASAQFFALDSRLKADFDSVFQISDRLRNILGAVQ
>NZ_CP043489.1|WP_149253115.1|2823823_2824942_-|trypsin-like-peptidase-domain-containing-protein
MDKLTGAQVSDLAKTLSTTVNLDDLSNFVYVATGDQLEVYWTDVRQPLVSVLRELVIRLEQEGQTGNFLKTVYVNRPLRDDVRQLIARLAPEAAAEILSNPYDLVMLDKDNRGTQPSDATLGPGLQRNIKPHLRMLDPALWIAGMTQTLRRVCRIEIAGSPAGTGFLVGPQAVLTNWHVVEAAAGQNDLPTVCCRFDYARKADGGFNEGEAVALSGTALLHHRPYAPAEMTEAPDEPPPVATELDFALLQLAETAGTERGWFALPERDGALSQGSPLIIVQHPHGGPVKLAIDTEAILPTPAPPGRPRLRYATNTDAGSSGSPCLNLEWQLLALHHFGDPAWGEPKFNQGVPAGLIRADIEAAGFGAAIPAA
>NZ_CP043489.1|WP_149253116.1|2825249_2826275_-|ribose-ABC-transporter-permease
MTSTNPSTADTARRKFALSGTLRGLGMLPALVLIAILFQLLSGYVESGGLSWASGRFMSWNNLSIVAQQASINTVLAAGMTFVILTGGIDLSVGSVLAASAMIALIVSLIPGWGMMGLVAALVTGGLLGLINGALIAFMRLPPFIVTLGSMTAVRGLARLFGEDKTIFNPSLPFAFIGNGTLFGVPWLMVIALATVVVSWLILRRTVLGLRIYAIGGNAEASRLSGIKVWSILLIVYGISGLLAGLGGAMSAAKLYAANGLQLGQSYELDAIAAVILGGTSFVGGVGSIWGTLIGALIIAVLSNGLILIGVSDIWQFIIKGLVIIGAVALDRLRSSSSART
>NZ_CP043489.1|WP_149253117.1|2826357_2827896_-|ATP-binding-cassette-domain-containing-protein
MNPGQTHPFLEMRNVSKTFGRVQALKNVSLDVKLGEIHALMGENGAGKSTLMKILSGAYTPDEGSEILIDGQKVAISGPMAAKQLGIAIIYQELALAPNLTVAENIYLGREPSRAGLIDRGAMIAGVESVLQRLGATFTARDKVAELSIAERQLVEIARAVHARSRVLIMDEPTTTLSERETERLFALVRQLKQEGLAIVYISHRMKEVYELSDRVSVLRDGTYVGTLDREAITPAAVVRMMVGRDLSSFYKKEHDAHQSRGRIIFSVRDIADGRRIQPCSFDLHEGEVLGIAGLVGAGRTELARLVYGADARTSGTVAVDGKEVSIRSPQDAIEAGIAYLTEDRKLLGLMLDMSVAENINLGVIARDALAGGFLNLAKGRKRTAEAIQATGIRTASPDAPVGGLSGGNQQKVLLSRLLETKPRVLILDEPTRGVDIGAKSEIYRLIDRLAREGVGVAVISSELPEIVGICDRVIVMREGHIAGELGGGPDAEAVSQENIMAIATSAAKDAA
>NZ_CP043489.1|WP_149253118.1|2827917_2829507_-|mannitol-dehydrogenase-family-protein
MSATTRDGMPSTTTDVAVWSKMASSCPRRPFQLLKVQAMLPLNTSTLASFGPTVTRPTYDRSRLRAGIVHFGVGNFHRVHQAIAIEACLHHPGQEEWAICGVGLTDGPAARAKAEAYRRQDNLYTVTQLTSPAPRDTQIVGAMIDYLHAPADPEAVLARLADPATRIVSLTITEGGYNIDETTGAFRLDTPDIRHDLEGGPPRTVFGYIVAALARRRQAGLPPFTVMSCDNLPRNGDTSRLAVLGFARALDPGLADWIEANGAFPNSMVDRIAPQVPEDERRRITAGIGVEDLVAATCEPYTSWVVEDRFCAGRPELERAGVVFSSEVPAYVAVKGRLSNAAHMLMCYPSLLMGARLVDEGMRHPDIPRLLHAFWERDARRLVEPPAGYSTRAFTDTVIERFANPAIKDQLLRVAGDGASKIVVFHGKTIGQLIAGGSDLAREAFLLACFARYLGGVDDRSIAFDIFEPRIGEADWQRLQSGDPLAVLDIEAFAGLGLRQSPAFVAAYQIQSKSLASQGTAATLAQLLK
>NZ_CP043489.1|WP_149253119.1|2829463_2830423_-|substrate-binding-domain-containing-protein
MKALKCLAGIAMAGAALVTGLAAPALAKDVKTVGISVGSLGNPGFVIIANTATRIIKKAYPQAQVTTVGYDYDLGKQVNQIDNFIAAGADFILLNPGDPKAITPAIKKAQAAGIPVIAFDTGADGADAIVMTDNIMAGSVSCQYIADKLKGAGNVVIQNGPQVSSVIDRVVGCKQVLAKYPDIKILSDDQDGKGSRDGGMAVAQGYLTRFPKIDAIFTINDPQAIGTALAAKQAGRSEFFITSVDGSPDIEAALKDPALDMIKASASQDFYAIPKVSAQTAMDLVNGKKPEKPVILIPSALVTRENVGDYKGWNAKHDD
>NZ_CP043489.1|WP_149253120.1|2830521_2831616_-|substrate-binding-domain-containing-protein
MTQNKKTNEESPRSGSSRPARLLDVARLAKVSRATAARALGGYGLVTEETRERVAAAARTLNYRLNEAARAMRAGRTQVIGVVLADISNSFFASAARAIIDTCASLGYQTLIVNTDDDLKTEIEAVQTLMEKRVAGMIVVPSSPDHNEHLQKAGAGEGRMVLLDRRIADIPVSAVTTDDRGGAREAVELFIARGHRRIGLVVLTAAAASQRQSEPRGAVSSARDRVLGAREALEAADLDLPKAWLRYTPNNPQTIIDAASTILRSHPRPTAILATCEEIAIGVLAACRDLNLVVGRDVALISFDESPWSGALTPAISVVQRPIHEMGRAAVNLLVRQIQGGEARRDIEMPTILIDRESVFDLTP

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

80105 : 90055

uncultured_Mediterranean_phage(75.0%)

tRNA

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_149250901.1\|80105_81902_-	peptidoglycan DD-metalloendopeptidase family protein	S6B1Q4	Bacillus_phage	1.8e-10	34.7
WP_149250902.1\|82218_83436_-	cytochrome P450	NA	NA	NA	NA
WP_149250903.1\|83728_84415_-	protein-L-isoaspartate(D-aspartate) O-methyltransferase	A0A1J0MC50	Streptomyces_phage	8.8e-14	35.3
WP_149255232.1\|84411_85194_-	5'/3'-nucleotidase SurE	A0A1B1ITZ2	uncultured_Mediterranean_phage	1.1e-36	38.8
WP_149250904.1\|85375_86659_-\|tRNA	serine--tRNA ligase	A0A1B1IVT2	uncultured_Mediterranean_phage	1.0e-95	45.6
WP_149250905.1\|86697_87480_-	twin-arginine translocase subunit TatC	A0A1B1IVR7	uncultured_Mediterranean_phage	9.3e-44	42.5
WP_149250906.1\|87481_87943_-	twin-arginine translocase subunit TatB	NA	NA	NA	NA
WP_149250907.1\|88043_88274_-	twin-arginine translocase TatA/TatE family subunit	A0A1B1IVR9	uncultured_Mediterranean_phage	1.7e-06	73.7
WP_149255233.1\|88397_89030_-	SMC-Scp complex subunit ScpB	A0A1B1IVT7	uncultured_Mediterranean_phage	3.2e-42	49.4
WP_149250908.1\|89257_90055_-	segregation/condensation protein A	A0A1B1IVW1	uncultured_Mediterranean_phage	3.1e-34	34.9

DBSCAN-SWA_2

336741 : 369695

Sinorhizobium_phage(21.43%)

terminase,portal,tRNA,capsid,tail,head,protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_149251095.1\|336741_338061_-\|tRNA	proline--tRNA ligase	A0A2K9L6B6	Tupanvirus	4.8e-08	26.3
WP_149251096.1\|339034_340462_+	uroporphyrinogen-III C-methyltransferase	NA	NA	NA	NA
WP_149251097.1\|340573_340912_+	hypothetical protein	NA	NA	NA	NA
WP_149251098.1\|341309_341681_-	hypothetical protein	NA	NA	NA	NA
WP_149251099.1\|342250_343036_-	hypothetical protein	NA	NA	NA	NA
WP_149251100.1\|343303_343561_+	hypothetical protein	NA	NA	NA	NA
WP_149251101.1\|343538_343856_-	hypothetical protein	NA	NA	NA	NA
WP_149251102.1\|343859_344171_-	hypothetical protein	NA	NA	NA	NA
WP_149251103.1\|344172_344433_-	hypothetical protein	NA	NA	NA	NA
WP_149251104.1\|344429_344696_-	hypothetical protein	NA	NA	NA	NA
WP_149251105.1\|344835_345237_+	hypothetical protein	NA	NA	NA	NA
WP_149251106.1\|345247_345904_+	SOS response-associated peptidase	A0A291AUP1	Sinorhizobium_phage	1.8e-48	45.6
WP_149251107.1\|345951_346332_+	hypothetical protein	NA	NA	NA	NA
WP_149251108.1\|346328_346658_-	hypothetical protein	NA	NA	NA	NA
WP_149251109.1\|346868_347222_-	hypothetical protein	NA	NA	NA	NA
WP_149251110.1\|347218_347818_-	glycoside hydrolase family protein	L7TM06	Rhizobium_phage	5.1e-34	45.2
WP_149251111.1\|347789_348029_-	hypothetical protein	L7TNZ5	Rhizobium_phage	5.6e-08	44.2
WP_149251112.1\|348085_348781_-	hypothetical protein	NA	NA	NA	NA
WP_149251113.1\|348777_351318_-	hypothetical protein	A0A1B3B062	Gordonia_phage	1.8e-11	38.0
WP_149251114.1\|351314_351680_-	hypothetical protein	NA	NA	NA	NA
WP_149251115.1\|351801_352224_+	hypothetical protein	NA	NA	NA	NA
WP_149251116.1\|352220_352646_-	hypothetical protein	NA	NA	NA	NA
WP_149251117.1\|352651_353116_-	hypothetical protein	NA	NA	NA	NA
WP_149251118.1\|353122_353494_-	hypothetical protein	NA	NA	NA	NA
WP_149251119.1\|353493_353958_-	hypothetical protein	NA	NA	NA	NA
WP_149251120.1\|353950_356419_-	hypothetical protein	G8DH58	Emiliania_huxleyi_virus	5.4e-45	27.7
WP_149251121.1\|356418_356826_-	hypothetical protein	NA	NA	NA	NA
WP_149251122.1\|356868_357486_-	DUF2163 domain-containing protein	A0A2D2W208	Sinorhizobium_phage	3.7e-19	36.1
WP_149251123.1\|357485_358136_-	hypothetical protein	NA	NA	NA	NA
WP_149251124.1\|358135_360955_-	tape measure protein	A0A0K2QJE7	Achromobacter_phage	1.6e-21	26.3
WP_149251125.1\|360967_361366_+	hypothetical protein	NA	NA	NA	NA
WP_149251126.1\|361566_361974_-	gene transfer agent family protein	A0A2D2W210	Sinorhizobium_phage	1.7e-09	38.7
WP_149251127.1\|361987_362452_-	hypothetical protein	NA	NA	NA	NA
WP_149251128.1\|362500_362899_-	DUF3168 domain-containing protein	NA	NA	NA	NA
WP_149251129.1\|362891_363356_-	HK97 gp10 family phage protein	A0A141GEW6	Brucella_phage	5.7e-09	32.5
WP_149251130.1\|363491_363854_-\|head,tail	head-tail adaptor protein	NA	NA	NA	NA
WP_149251131.1\|363853_364432_-\|head,tail	phage gp6-like head-tail connector protein	NA	NA	NA	NA
WP_149251132.1\|364434_364698_-	hypothetical protein	NA	NA	NA	NA
WP_149251133.1\|364767_366066_-\|capsid	phage major capsid protein	A0A2H4JD98	uncultured_Caudovirales_phage	1.5e-134	65.1
WP_149251134.1\|366109_366769_-\|head,protease	HK97 family phage prohead protease	A0A0U2BX10	Paracoccus_phage	8.4e-46	48.0
WP_149251135.1\|366765_368001_-\|portal	phage portal protein	A0A0U2BXP2	Paracoccus_phage	6.7e-121	58.6
WP_149251136.1\|367997_369695_-\|terminase	terminase large subunit	Q3HQS7	Burkholderia_phage	4.5e-144	46.8

DBSCAN-SWA_3

376975 : 386857

Sinorhizobium_phage(50.0%)

integrase

attL 372557:372572|attR 388354:388369

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
372557:372572	attL	NA	NA	NA	NA
WP_149251145.1\|376975_379573_-	DNA methylase N-4	R9TRS8	Rhizobium_phage	0.0e+00	66.1
WP_149251146.1\|379840_380323_-	hypothetical protein	NA	NA	NA	NA
WP_149251147.1\|380494_380812_-	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_149251148.1\|380906_381566_+	helix-turn-helix domain-containing protein	A0A1X9HW95	Ruegeria_phage	5.5e-21	36.8
WP_149251149.1\|381730_382060_+	hypothetical protein	NA	NA	NA	NA
WP_149251150.1\|382243_382462_+	hypothetical protein	NA	NA	NA	NA
WP_149251151.1\|382468_382714_+	DUF2312 domain-containing protein	Q8W6H2	Sinorhizobium_phage	2.6e-21	70.7
WP_149251152.1\|382717_383005_+	hypothetical protein	NA	NA	NA	NA
WP_149255248.1\|383022_384141_+	DNA polymerase III subunit beta	B4UTW9	Rhizobium_phage	4.7e-57	39.0
WP_149251153.1\|384133_384421_+	hypothetical protein	NA	NA	NA	NA
WP_149251154.1\|384422_384821_+	hypothetical protein	NA	NA	NA	NA
WP_149251155.1\|384823_385087_-	DUF982 domain-containing protein	NA	NA	NA	NA
WP_149251156.1\|385134_385491_+	HNH endonuclease	A0A291AUJ4	Sinorhizobium_phage	3.4e-25	56.6
WP_149251157.1\|385490_385913_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_149251158.1\|385708_386857_+\|integrase	tyrosine-type recombinase/integrase	A0A076G7B8	Sinorhizobium_phage	4.6e-76	42.6
388354:388369	attR	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP043489

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection