CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_016026	Micavibrio aeruginosavorus ARL-13, complete sequence	4 crisprs	PrimPol,DinG,cas3,RT,csa3,DEDDh	0	2	3	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_016026_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_016026_1

473637-473780

Orphan

Consensus_repeat	Method
GCCAGCATCTTCGAAAAACTTTGAAAAAAGATTGAAAAAGATG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_016026_1

>merge|NC_016026|1|473637-473780|CRISPRCasFinder
GCCAGCATCTTCGAAAAACTTTGAAAAAAGATTGAAAAAGATGATTGACAACGGAGTGAGTACCGACTAAATACTCGCTCCCTCGGCAGATGGAAACGTCGGCCAGCATCTTGGAAAAACTTTGAAAAAAGATTGAAAAAGATG

>NC_016026|1|1|473637-473780|CRISPRCasFinder
GCCAGCATCTTCGAAAAACTTTGAAAAAAGATTGAAAAAGATG	ATTGACAACGGAGTGAGTACCGACTAAATACTCGCTCCCTCGGCAGATGGAAACGTCG
GCCAGCATCTTGGAAAAACTTTGAAAAAAGATTGAAAAAGATG

Protein	Signature genes	Signature genes Name	Protein_function
NC_016026.1\|WP_014102031.1\|487734_489120_-\|homospermidine-synthase	unknown	unknown	gnl\|CDD\|227626
NC_016026.1\|WP_014102023.1\|479945_481268_+\|PAS-domain-containing-protein	unknown	unknown	gnl\|CDD\|206779
NC_016026.1\|WP_014102012.1\|463081_464362_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102025.1\|481874_482273_-\|response-regulator	unknown	unknown	gnl\|CDD\|381150
NC_016026.1\|WP_014102019.1\|471716_472373_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_148260498.1\|471149_471599_+\|DUF1489-family-protein	unknown	unknown	gnl\|CDD\|369333
NC_016026.1\|WP_014102029.1\|485746_486895_+\|chemotaxis-response-regulator-protein-glutamate-methylesterase	unknown	unknown	gnl\|CDD\|234828
NC_016026.1\|WP_014102032.1\|489286_489985_-\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102027.1\|482572_485236_+\|chemotaxis-protein-CheW	unknown	unknown	gnl\|CDD\|223716
NC_016026.1\|WP_081463057.1\|467357_468311_-\|glycosyltransferase	unknown	unknown	gnl\|CDD\|133055
NC_016026.1\|WP_014102020.1\|472428_472908_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102013.1\|464369_465701_+\|glycosyltransferase-family-4-protein	unknown	unknown	gnl\|CDD\|340825
NC_016026.1\|WP_014102024.1\|481330_481861_-\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102022.1\|479195_479549_+\|DMT-family-protein	unknown	unknown	gnl\|CDD\|377316
NC_016026.1\|WP_014102015.1\|466557_467403_+\|glycosyltransferase-family-2-protein	unknown	unknown	gnl\|CDD\|133005
NC_016026.1\|WP_014102021.1\|472982_473513_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102014.1\|465704_466565_+\|chain-length-determinant-family-protein	unknown	unknown	gnl\|CDD\|367147
NC_016026.1\|WP_041794216.1\|468310_471007_-\|SLBB-domain-containing-protein	unknown	unknown	gnl\|CDD\|224512
NC_016026.1\|WP_014102030.1\|486884_487700_+\|protein-glutamate-O-methyltransferase-CheR	unknown	unknown	gnl\|CDD\|224271
NC_016026.1\|WP_014102028.1\|485257_485740_+\|chemotaxis-protein-CheW	unknown	unknown	gnl\|CDD\|238374

Protein	Function_ID	Function_description	E-value
NC_016026.1\|WP_014102031.1\|487734_489120_-\|homospermidine-synthase	gnl\|CDD\|227626	COG5310, COG5310, Homospermidine synthase [Secondary metabolites biosynthesis, transport, and catabolism].	0
NC_016026.1\|WP_014102023.1\|479945_481268_+\|PAS-domain-containing-protein	gnl\|CDD\|206779	cd11386, MCP_signal, Methyl-accepting chemotaxis protein (MCP), signaling domain. Methyl-accepting chemotaxis proteins (MCPs or chemotaxis receptors) are an integral part of the transmembrane protein complex that controls bacterial chemotaxis, together with the histidine kinase CheA, the receptor-coupling protein CheW, receptor-modification enzymes, and localized phosphatases. MCPs contain a four helix trans membrane region, an N-terminal periplasmic ligand binding domain, and a C-terminal HAMP domain followed by a cytoplasmic signaling domain. This C-terminal signaling domain dimerizes into a four-helix bundle and interacts with CheA through the adaptor protein CheW.	2.03802e-32
NC_016026.1\|WP_014102014.1\|465704_466565_+\|chain-length-determinant-family-protein	gnl\|CDD\|367147	pfam02706, Wzz, Chain length determinant protein. This family includes proteins involved in lipopolysaccharide (lps) biosynthesis. This family comprises the whole length of chain length determinant protein (or wzz protein) that confers a modal distribution of chain length on the O-antigen component of lps. This region is also found as part of bacterial tyrosine kinases.	0.00257375
NC_016026.1\|WP_014102029.1\|485746_486895_+\|chemotaxis-response-regulator-protein-glutamate-methylesterase	gnl\|CDD\|234828	PRK00742, PRK00742, chemotaxis-specific protein-glutamate methyltransferase CheB.	2.16785e-129
NC_016026.1\|WP_148260498.1\|471149_471599_+\|DUF1489-family-protein	gnl\|CDD\|369333	pfam07370, DUF1489, Protein of unknown function (DUF1489). This family consists of several hypothetical bacterial proteins of around 150 residues in length. Members of this family seem to be founds exclusively in the Class Alphaproteobacteria. The function of this family is unknown.	2.31692e-57
NC_016026.1\|WP_081463057.1\|467357_468311_-\|glycosyltransferase	gnl\|CDD\|133055	cd06433, GT_2_WfgS_like, WfgS and WfeV are involved in O-antigen biosynthesis. Escherichia coli WfgS and Shigella dysenteriae WfeV are glycosyltransferase 2 family enzymes involved in O-antigen biosynthesis. GT-2 enzymes have GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.	3.64794e-41
NC_016026.1\|WP_014102025.1\|481874_482273_-\|response-regulator	gnl\|CDD\|381150	cd19923, REC_CheY_CheY3, phosphoacceptor receiver (REC) domain of chemotaxis response regulator CheY3 and similar CheY family proteins. CheY family chemotaxis response regulators (RRs) comprise about 17% of bacterial RRs and almost half of all RRs in archaea. This subfamily contains Vibrio cholerae CheY3, Escherichia coli CheY, and similar CheY family RRs. CheY proteins control bacterial motility and participate in signaling phosphorelays and in protein-protein interactions. CheY RRs contain only the REC domain with no output/effector domain. REC domains function as phosphorylation-mediated switches within response regulators, but some also transfer phosphoryl groups in multistep phosphorelays.	2.71255e-53
NC_016026.1\|WP_014102013.1\|464369_465701_+\|glycosyltransferase-family-4-protein	gnl\|CDD\|340825	cd03794, GT4_WbuB-like, Escherichia coli WbuB and similar proteins. This family is most closely related to the GT1 family of glycosyltransferases. WbuB in E. coli is involved in the biosynthesis of the O26 O-antigen. It has been proposed to function as an N-acetyl-L-fucosamine (L-FucNAc) transferase.	5.9045e-68
NC_016026.1\|WP_014102022.1\|479195_479549_+\|DMT-family-protein	gnl\|CDD\|377316	pfam04342, DMT_6, Putative member of DMT superfamily (DUF486). This family contains several proteins of uncharacterized function. The family is represented in the Transport classification database as 2.A.7.34, though the exact nature of what is transported is not known.	1.58184e-57
NC_016026.1\|WP_014102015.1\|466557_467403_+\|glycosyltransferase-family-2-protein	gnl\|CDD\|133005	cd02511, Beta4Glucosyltransferase, UDP-glucose LOS-beta-1,4 glucosyltransferase is required for biosynthesis of lipooligosaccharide. UDP-glucose: lipooligosaccharide (LOS) beta-1-4-glucosyltransferase catalyzes the addition of the first residue, glucose, of the lacto-N-neotetrase structure to HepI of the LOS inner core. LOS is the major constituent of the outer leaflet of the outer membrane of gram-positive bacteria. It consists of a short oligosaccharide chain of variable composition (alpha chain) attached to a branched inner core which is lined in turn to lipid A. Beta 1,4 glucosyltransferase is required to attach the alpha chain to the inner core.	1.3803e-40
NC_016026.1\|WP_014102030.1\|486884_487700_+\|protein-glutamate-O-methyltransferase-CheR	gnl\|CDD\|224271	COG1352, CheR, Methylase of chemotaxis methyl-accepting proteins [Cell motility and secretion / Signal transduction mechanisms].	1.04368e-79
NC_016026.1\|WP_014102027.1\|482572_485236_+\|chemotaxis-protein-CheW	gnl\|CDD\|223716	COG0643, CheA, Chemotaxis protein histidine kinase and related kinases [Cell motility and secretion / Signal transduction mechanisms].	7.58166e-158
NC_016026.1\|WP_041794216.1\|468310_471007_-\|SLBB-domain-containing-protein	gnl\|CDD\|224512	COG1596, Wza, Periplasmic protein involved in polysaccharide export, contains SLBB domain of b-grasp fold [Cell wall/membrane/envelope biogenesis].	2.01761e-19
NC_016026.1\|WP_014102028.1\|485257_485740_+\|chemotaxis-protein-CheW	gnl\|CDD\|238374	cd00732, CheW, CheW, a small regulator protein, unique to the chemotaxis signalling in prokaryotes and archea. CheW interacts with the histidine kinase CheA, most likely with the related regulatory domain of CheA. CheW is proposed to form signalling arrays together with CheA and the methyl-accepting chemotaxis proteins (MCPs), which are involved in response modulation.	2.21311e-24

>NC_016026.1|WP_014102021.1|472982_473513_+|hypothetical-protein
MSGYDGLRKFFGLIVTRRTLSDPVAAPPDLSVIVGHLDAVSAFNTVPIGRDFSISENGYMQRAWDCLLAERIGKPAGVRTLFAVRRVSGFMEGRGHCADCVTTSVVSEPLFGRPMALEAVIPEMETLLRALRLGDAGCFLDQVHFNQPTLAEMQALVGAYRALAPRKTGHLALVPK
>NC_016026.1|WP_014102020.1|472428_472908_+|hypothetical-protein
MPALDRTAVKHRAQIESLLQQINDIHGLYAMPLAKNFQTMPDYTVHYDWMCLLADRVGEPAGVRTAFRLRWAHGWASQRMGCAPYGQLGDPAYTELGIVLPLEKIFPVMMVLQDERRRVFGIGPCTMTFERTTIEDARQLVDAYRMLCPVKKDFLKLVK
>NC_016026.1|WP_014102019.1|471716_472373_+|hypothetical-protein
MDWKDLGGKLRRAFGLQTQPTPEPLPPPTDRYLSARELKTLLECVQHIKDITQTNALALKSLSQATPRPLGDAERDFQDAMCAQFRPLGGDPLQNSQMALGTCVAWLAQLNQAHNIAARNETVVTPNLALPVRSGSRKFAADIGVMARGATTAMGGICASLSSAAPFLDIPNIQRIHEEYAEHGAVMNQILEKITTILTDATYGVRDQTPKQTLSLKK
>NC_016026.1|WP_148260498.1|471149_471599_+|DUF1489-family-protein
MISNDPIHLIKLAVGVDDVGHLHALQSSRLFDFDGALATCAWTRRKPTRDGGLLNGGSIYWIIKGRIQARQAFLGFEMEDTDEGPYCRLVLDPALMLVAAMPHRAFQGWRYLDPAKAPPDLRFFDPDLAAEDDEMPADLAAQLRDAGLI
>NC_016026.1|WP_041794216.1|468310_471007_-|SLBB-domain-containing-protein
MARARKFKSTRFFMQSGLCTVWVLTGLAFGAPSARAQDFLPMQIAPWSTDTRNIARVTQARTDIQAGGHQQAAPAAASPPARKAGTLTPLTPQDYEPLLADLLARDEMLARMVGHHVSPLSSIEEFYAGRVVDPLEQFGYDLFENFSAPSTQARGKQTDGEPSPTPQAALPAGAVQDNFVLSTGDRLNITFRGQRRDQGIYTITTDGLLILDDLPPVSAAGRTIGQLREALAASADSLYNTDIYVSLESVRQVNVLVVGNVRKPGRQTLTVFHTALDALMQADGIDKNGSLRQIKLVRDGRTTMVDLYGLLIHGSSGMDLALRDGDRLIVPPLGPTIAVAGGVKRPGIYEILPALKGMKHAPEKSSEFLSMQEALDMAGGLVSPGNNRFMKLGLHRNGQETVETITDPFTPALNDGSILMVARADDKRAGLVELVGHTRQPGLHPLSSSKTLAALLSDRSMFGADIYPLIGAIERWDDERMARIFLDFPPILVAQGQYDQELKDGDIVHLFSRSQMMALQKQKFNPASIEPAAGSVDETDIDPADTVTGDPALSAFLAERTISVRGAVRDSGVWPVAAGTTLDSVLAVAGGLSLEANTSNIEVTRTHDASIPDTESSIPFRTAVNMNDTDPKTVAINPGDTVRVKQKFRKAEGQSVTIIGEVNNPGKYDLVPGDTLRDLFARAGGITDQAYPDGTIFSRESERKAEEERFRAAAREMERALATALHKEKDAPDMTQIAMVQDLAAELRNVEAVGRITVEADPTVLEVQPELDILLEAGDRIYVPRRPLTVRVEGEVLSPAALQFRNGKNPRDYIAEAGGPSHFADQDRAFVLYPDGSAQPLFISAWNHKASMIPPGSTIVVPRDPKPFDFIESAKDVSQILSNLAVTGIFLSDIRDDD
>NC_016026.1|WP_081463057.1|467357_468311_-|glycosyltransferase
MMFSIVTITRNDLAGLHATYKSVQSQTCTDYEWIVIDGASDDGTVAYLQNLSSQTPSSPHPTLPPLQEGRKEEEEILLPPEQEVRVEEEIPLPPQRGGRLGGGRENGTGGRAILWTSEPDAGLYDAMNKGLARATGDYIIFLNGGDQFADDNVLSNLSQLIGMASTKPGFIYGDALETLPDGQTAYKAARPFIKVDLGMFTHHQAMVYARNVIGDMHYDTRYKIAADYKFTLQTLGATRAIYYVPAPFCLFAHGGLSQTRTALGRREQFDIRRELGVVGPIRNRAITTLQMINMGVRRICPPLYWALKARRDNAAIR
>NC_016026.1|WP_014102015.1|466557_467403_+|glycosyltransferase-family-2-protein
MPDHPVIPVSVIIVTKGEGAFLSPTLAALSGFDQIIVVDSGGDADTFSVAQSFGADTVAYTWDGAYPKKRQWCLDHVTLAHDWVFFVDADEIVTPDLTRAIADLFVSGAPDADGYFVRGRYVWGGRVLRFGLTNNKLALFNRHAFMFPVVDDLGLPGMGEIEGHYQPVAKKSGARIGVLSPMLTHDAATDPARWYERHERYAQWEAGMNARNAWPVDPVAGRHRLKRIFRALPARGVVAFLYCYVWRCGFLDGWAGFDFARARGWYYHRIAALSRRAFNAQ
>NC_016026.1|WP_014102014.1|465704_466565_+|chain-length-determinant-family-protein
MSTHSQTMNAPEPDLIDLLRDWWRLRGWIMAGMVAGVLAAFAFLALAVPQYRVSMLIAPADRGTGTDIKALLPDNATFALQYLASSIGAQDTTDFSRLENIMRGADVAAIVMKNKDVADGVRASRSLRISAGADIRDPAELADWMARTIKIEPVGTTTMRRVVLNHPDREWATGFLTLVHDAADRLIRNDVRTRADARSAYLQDALRRTDHPDHRRALTNLLMEQEHVRMMLAMDEAFAAVIAESPSASARAVWPRKSIVLPAFVFAGAVLFYCLGLIFGRRDRHA
>NC_016026.1|WP_014102013.1|464369_465701_+|glycosyltransferase-family-4-protein
MSRPSVIFFNRVYPSDRGATGRVLRDLARAMARDGWAVTVVTTASVAREDRDGDVRVIRLKSNTKSRNLFTYGAAWVRMMIAGLKLPRPDLIVTMTDPPMMVVAGGIMARARKTKHIHWCQDLYPDLLPSIGIRLPDFMMSGLSALSFNAMRRCEKIVVIGRCMARQLTKTGLDPKRIAVIPNWPDQELTRTMTDAMNEAAVEADASIPAKPFEELFKDDGAPKFRVLYAGTIGRAHPIHTIVDAAAILQHQCPDIEFVFVGDGPGLDRLAHERARRGLENIRLLPRQPNRRLRPLMESGDVHIISMKHDAAGLLVPSKLYSALAVGRPCVFVGPMNSEVAKVISDFHAGAVVAQGEPETLAQTILTLRMDGNAWHNAHDGSAQAGRIFVPSESINAWIKRARDVVGRPLTPPSAKPKVTVPTPVAQDNAVQQPPSVTIHAAE
>NC_016026.1|WP_014102012.1|463081_464362_+|hypothetical-protein
MFSTYRDVQCAALCAAILVYALWGEPTPPAFGWPEILVGVLLTAAVGLRSFARAVTPVRGDAHPFWFRAGQFFLLYGLSVPLVGAVIAGASPGNIVRDIVPFLFMLLPVFMVDTVRDRVRWHFIVTACVVVLGVIFAARVVAPLALASSGMDHAAQLGMNLSGQDPRRLANAPSVLFAAMALLGAAGWIITRRINANAMISAAILSGVALIPLAAMALVLQRASLGLLALGLAFWIAIGIVKKPRRMVVPLLGLAVLCLMVWAPLADVVAGLAHKNVMVGANMRWQEAAAVRDALHGIGAILFGNGWGATVQSPAVGDSIVTFTHNLGTTLWLKSGLIGVGLGLAYFGGLALALIRFLPIHPILVVALGAPMVIDYLLYASFKSLDFGLILLLAALYSARTAAVSPGGQPGNPVVFKTIPNNADFK
>NC_016026.1|WP_014102022.1|479195_479549_+|DMT-family-protein
MSFSLPVPIATIGLLLASNIFMTFAWYGHLKFKTTPLLIVIFVSWGIAFFEYCLQVPANRMGHAVFNAAQLKTIQECLTLLVFMGFSIWYLKEPIQWNHLLGFGLIVLAAWVIFKKW
>NC_016026.1|WP_014102023.1|479945_481268_+|PAS-domain-containing-protein
MKNLAYALGFREKQFANDDDRFLSLKMGALRGLSTNIMMADKDYNIVYVNDAIIEFLRALEGDIKKDFPSFNVDQLIGTNIDMFHKSPSHQRGMLDRMSGEFDTSIKVGGIVFNLHAFPVFDDNKNRVGTVVEWQDSKQMDGVSQIASIHKSMAVIEFNMDGTIITANKNFLDTVGYGLDEVKGHHHRMFMEASEADSAEYRKFWDDLRAGQYQSSEYKRVGKGGREIWIQASYNPVFDLNGRPFKVVKFATDVTKQVIAKQNAGKMIESAAVGTEELSASVKEITESMTKSRATTEKAYGIVDQADQQTNKLADAAASMGGIVELINSIAGQINLLALNATIESARAGEAGKGFAVVANEVKNLAAQAKTATDKISLEINSMRDISSNVVSSLNAIKESIETVREYVNSTASAVEEQSAVANEIASNMQRVTREVNSMV
>NC_016026.1|WP_014102024.1|481330_481861_-|hypothetical-protein
MTSLIQTIQETSQAMGHVSPEKRAALVDSMAQLARRLADHVSALDDIPSHYQAFTMPAINDQIAAAEKRTEKAADQILTAAESIMKSLAKMKGDAAAEIQNQANIIFEATSFQDLVTQHLNEIRLRMKELNDDMLALQNCMTSISSGSGDAPLQKTRTRKSERPDAHLLNGPTTNF
>NC_016026.1|WP_014102025.1|481874_482273_-|response-regulator
MDINKDMKVLIVDDHKTMLRIVRNLLSQINISNVDEATDGQSALQKLAHNKYDLVLSDWNMMPMTGLQLLQFVRTDSTYEHKNVPFIMITAESRPENVMEAKQAGVDNYIIKPFNADTLETKIKSVMTKKQR
>NC_016026.1|WP_014102027.1|482572_485236_+|chemotaxis-protein-CheW
MDDLVTEFITETVESLSTLDLDLVRLEQEPENKDLLGNIFRLMHTIKGTCGFIGLPRLEKTAHAAENLLDNFRNDKMDVSERAMTLLFMCIDRVRFLVSEVSKSGAEPEGNDSDIIQVIEAEIEQSLHGGEKKESAVSNRDPVPEPPVSVDISPAQTVEKGPEYLRVQMNVLEDLINMVSELVLTRNQLSQLIRMEENSNLTTPFQRLNRIVSDLQDSVMKTRMQPIGNAWSKLPRIVRDLSTEMKKKIVLEMEGEETELDRQVLEQIKDPLTHMIRNSCDHGIERPADRLDAGKKEQGCIRLRAYHEGGFIVLQISDDGKGLDPAKIAEKAIEKGLADPDKIQAMSDKQILSYIMRPGFSTAEQITNVSGRGVGMDVVRANIEKIGGSIDMESTPGKGTCFTIQIPLTLAIISALIVEIDSYRYAIPQMNIQELVSINPTDSDMIEYINDKPVLRLRDRIIPLLDSEALFDFKSDQGQKPHNEKLICVISTGSSYYGILVDQIYDTEEVVIKSVSSVLKNAGIFSGNTILGDGRVIMILDPAAIARKFNVEKAVNQIEAENIMARQARESVKERASMLVFKAGDGALKAVPLALVSRIQVFPRGEITCSADKIVVRYNNTLMQLCFIDSTTQGLNDHEVMSLVLSDDMSDASMGLIIDHVVDIIEGDLDLTTATLRPGVLGSMILSDRTVDVIDIAHFLSLSRSDWFSKMAHQSAPYANYHIERVHERLDIVETGPHTTGRSATIGELEQTAMAHRPMAEYRGQKMRLLVVDDSPFFRSMLYPILTGAGYDVTLSEDPLHAIRLHDDGHMFDIVLSDIEMPHMDGYEFVERMRDDSSWKDVPFIAITSHNTREDIEYGYKKGFNKYIGKFDKDELIRSLVSIRNNE
>NC_016026.1|WP_014102028.1|485257_485740_+|chemotaxis-protein-CheW
MNNAKPNIVADTFKILILNIGNHYFGAPIESIQDVIQRNPTTPVPLTPPNIIGLLNLRGHIVTEIDVAYTLGIHNRDWLAGNNGYSIVINRGGEMYSLVFEGIGDVVDVMDSSIEKLPDTINRKWFSISRGVCRMGDKLVVLLDFNLMIDHLTPEPANMV
>NC_016026.1|WP_014102029.1|485746_486895_+|chemotaxis-response-regulator-protein-glutamate-methylesterase
MDISPVRVMLVDDSVVVRGLLRNIIEKHNDLDIVAAAADGQTALRDYRTHRPDIVLMDVEMPHMDGLSALREILVHDPDARVIMCSSLTQAGAETTYQALHIGAVDCLAKPSSKSIDRGLTFEQELLLKLRTLGRNGAKRKAVSITARSSGVPELVSLSTPYMHKLGGDVVLRRMPDHLPPNFPLALAIGASTGGPKALVEFLTSVDKNIMLPIFITQHIPPGFSRFLAENIERKTGFPAHEAEEGMLVSPGHVYIAPGQKHMGVQKGIPKRITLTDGPPVNFCKPSVDVMLDSLEHAYGGHLLTVILTGMGADGHQSSRRMVVDGTHNILIAQDEESSVVWGMPGAVAKDGICHAVLPLSRIGAAVNKLVRRESIGDHHAN
>NC_016026.1|WP_014102030.1|486884_487700_+|protein-glutamate-O-methyltransferase-CheR
MQIDDIEFHFFRNFLKESSGYHLTDDKRYLLESRLEDVLRSWKLNDHRAIISSIRNDYSSKMATDVIEAMTINETFFFRDQIPFDVFENQLLDRLAESAVANRVRIWSAACSTGQEPYSVAMIATEKRSVYPKLLCEVVGTDINSRVLSRARQGVFSDIEVHRGLPDHYRDKYFTRDGSNWKINDDIRAQVHFRQMNLKGDYDVEGPFDFVLLRNVLIYFDTALKENILRRIADRMRPGGYLLLGAAEGIYDLNHHFQRCPDIKGLYEYRG
>NC_016026.1|WP_014102031.1|487734_489120_-|homospermidine-synthase
MIGFGSIGRGMVPLLERHFKFDRDRFVIIDPEDIYRPVVEGLGIRFIHAELSLENYRDILTPLLRNGEGVGFCVNVSVDTSSRDIMRLCRELDCHYIDTVAEPWAGYYDNKNAHPGDRTNYDLRDDIIEEKALARGTRTAVSCCGANPGMVSWFVKQAVLNIARDTNTPFTEPQTREDWARLMQTLGIKGVHIAERDTQRARMPKEMNVFVNTWSVEGFVSEGYQPAELGWGTHENWMPPNASTHSFGCQAAIYLNQPGAATRVRTWCPTPGAQFGFLVTHNEAISISDYFTVGSGPKPEYRPTCHYAYHPCNNAILSWHELFGRDGKMQPRMHILGESEIVDGRDELGVLLFGHAKNAYWYGSRLTIEETRALAPYQNATALQVTSAIIAGMVWALENPMAGIVETEEMDHRRCLEVQSPYLGTVEGHYTDWTPLDNRPGLFPEDIDTSDPWQFRNILVH
>NC_016026.1|WP_014102032.1|489286_489985_-|hypothetical-protein
MTIKTATNDNAPLRSVFENANLRRAGALSTLGLAAAILSGCATPGLNTETCMGTDYNGIGFYGVGQSKWDKDCANAEFAETLLRKKNDPVGNALGFLLYLDQLPGARAQLEARLGQKGALRIEPETVATLLASPDVSRYTGVQLYAKMNEDDRATVNSLLQKRGIDPKVALTLNDDDRRAMIQAQEQATSRAEQDVAKTQATPPTTPENTPKQQCKPVVTNGRQIRFVCGGQ

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_016026_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_016026_2

677987-678152

Orphan

Consensus_repeat	Method
TTTTTTAGCAGCAGCTTTTTTC	CRT

3 spacers

DinG

The CRISPR arrays of NC_016026_2

>merge|NC_016026|2|677987-678152|CRT
TTTTTTAGCAGCAGCTTTTTTCGGAGCGGCTTTCTTAGCGGTTGCTTTTTTCGGAGCAGCTTTTTTCACTGTCTTCTTAGCAGCCGGCTTTTTAGCAGCAGCTTTTTTCGGAGCAGCTTTTTTCACCGTCTTTTTCACTGCCGGTTTTTTAGCAGCTACTTTTTTC

>NC_016026|2|1|677987-678152|CRT
TTTTTTAGCAGCAGCTTTTTTC	GGAGCGGCTTTCTTAGCGGTTGC
TTTTTTCGGAGCAGCTTTTTTC	ACTGTCTTCTTAGCAGCCGG
CTTTTTAGCAGCAGCTTTTTTC	GGAGCAGCTTTTTTCACCGTCTTTTTCACTGCCGG
TTTTTTAGCAGCTACTTTTTTC

Protein	Signature genes	Signature genes Name	Protein_function
NC_016026.1\|WP_014102244.1\|679192_680845_+\|lysine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234778
NC_016026.1\|WP_014102243.1\|678529_679234_-\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102245.1\|680972_681251_+\|type-II-toxin-antitoxin-system-HicA-family-toxin	unknown	unknown	gnl\|CDD\|377942
NC_016026.1\|WP_014102249.1\|683020_683290_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102234.1\|671812_673234_+\|F0F1-ATP-synthase-subunit-beta	unknown	unknown	gnl\|CDD\|236447
NC_016026.1\|WP_148260412.1\|674814_675000_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102238.1\|674380_674626_-\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102240.1\|674980_677785_-\|ATP-dependent-DNA-helicase	DinG	COG1199_DinG_CAS-IV-A	gnl\|CDD\|224120
NC_016026.1\|WP_014102247.1\|681539_682151_-\|nitroreductase	unknown	unknown	gnl\|CDD\|380312
NC_016026.1\|WP_041794270.1\|671380_671713_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102251.1\|684000_684375_-\|CBS-domain-containing-protein	unknown	unknown	gnl\|CDD\|341358
NC_016026.1\|WP_041794273.1\|682238_683018_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102236.1\|673499_673925_+\|ATP-synthase-F1-subunit-epsilon	unknown	unknown	gnl\|CDD\|223432
NC_016026.1\|WP_014102237.1\|674056_674389_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102252.1\|684899_686378_-\|aminopeptidase	unknown	unknown	gnl\|CDD\|225191
NC_016026.1\|WP_014102235.1\|673236_673488_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014102232.1\|670315_671227_+\|F0F1-ATP-synthase-subunit-gamma	unknown	unknown	gnl\|CDD\|235535
NC_016026.1\|WP_014102250.1\|683304_683985_-\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NC_016026.1\|WP_014102246.1\|681262_681568_+\|type-II-toxin-antitoxin-system-HicB-family-antitoxin	unknown	unknown	gnl\|CDD\|374224
NC_016026.1\|WP_014102231.1\|668690_670241_+\|F0F1-ATP-synthase-subunit-alpha	unknown	unknown	gnl\|CDD\|236448

Protein	Function_ID	Function_description	E-value
NC_016026.1\|WP_014102244.1\|679192_680845_+\|lysine--tRNA-ligase	gnl\|CDD\|234778	PRK00484, lysS, lysyl-tRNA synthetase; Reviewed.	0
NC_016026.1\|WP_014102245.1\|680972_681251_+\|type-II-toxin-antitoxin-system-HicA-family-toxin	gnl\|CDD\|377942	pfam07927, HicA_toxin, HicA toxin of bacterial toxin-antitoxin,. HicA_toxin is a bacterial family of toxins that act as mRNA interferases. The antitoxin that neutralizes this is family HicB, pfam15919.	3.20093e-17
NC_016026.1\|WP_014102234.1\|671812_673234_+\|F0F1-ATP-synthase-subunit-beta	gnl\|CDD\|236447	PRK09280, PRK09280, F0F1 ATP synthase subunit beta; Validated.	0
NC_016026.1\|WP_014102240.1\|674980_677785_-\|ATP-dependent-DNA-helicase	gnl\|CDD\|224120	COG1199, DinG, Rad3-related DNA helicases [Transcription / DNA replication, recombination, and repair].	1.07751e-81
NC_016026.1\|WP_014102247.1\|681539_682151_-\|nitroreductase	gnl\|CDD\|380312	cd02135, YdjA-like, nitroreductase family protein similar to Escherichia coli YdjA. A subfamily of the nitroreductase family containing uncharacterized proteins that are similar to nitroreductase YdjA from Escherichia coli. Nitroreductase catalyzes the reduction of nitroaromatic compounds such as nitrotoluenes, nitrofurans and nitroimidazoles. This process requires NAD(P)H as electron donor in an obligatory two-electron transfer and uses FMN as cofactor. The enzyme is typically a homodimer. Members of this family are also called NADH dehydrogenase, oxygen-insensitive NAD(P)H nitrogenase or dihydropteridine reductase.	2.24519e-54
NC_016026.1\|WP_014102251.1\|684000_684375_-\|CBS-domain-containing-protein	gnl\|CDD\|341358	cd02205, CBS_pair_SF, Two tandem repeats of the cystathionine beta-synthase (CBS pair) domains superfamily. The CBS domain, named after human CBS, is a small domain originally identified in cystathionine beta-synthase and is subsequently found in a wide range of different proteins. CBS domains usually occur in tandem repeats. They associate to form a so-called Bateman domain or a CBS pair based on crystallographic studies in bacteria. The CBS pair was used as a basis for this cd hierarchy since the human CBS proteins can adopt the typical core structure and form an intramolecular CBS pair. The interface between the two CBS domains forms a cleft that is a potential ligand binding site. The CBS pair coexists with a variety of other functional domains and this has been used to help in its classification here. It has been proposed that the CBS domain may play a regulatory role, although its exact function is unknown. Mutations of conserved residues within this domain are associated with a variety of human hereditary diseases, including congenital myotonia, idiopathic generalized epilepsy, hypercalciuric nephrolithiasis, and classic Bartter syndrome (CLC chloride channel family members), Wolff-Parkinson-White syndrome (gamma 2 subunit of AMP-activated protein kinase), retinitis pigmentosa (IMP dehydrogenase-1), and homocystinuria (cystathionine beta-synthase).	1.32939e-11
NC_016026.1\|WP_014102236.1\|673499_673925_+\|ATP-synthase-F1-subunit-epsilon	gnl\|CDD\|223432	COG0355, AtpC, F0F1-type ATP synthase, epsilon subunit (mitochondrial delta subunit) [Energy production and conversion].	4.86171e-34
NC_016026.1\|WP_014102231.1\|668690_670241_+\|F0F1-ATP-synthase-subunit-alpha	gnl\|CDD\|236448	PRK09281, PRK09281, F0F1 ATP synthase subunit alpha; Validated.	0
NC_016026.1\|WP_014102252.1\|684899_686378_-\|aminopeptidase	gnl\|CDD\|225191	COG2309, AmpS, Leucyl aminopeptidase (aminopeptidase T) [Amino acid transport and metabolism].	2.57116e-36
NC_016026.1\|WP_014102232.1\|670315_671227_+\|F0F1-ATP-synthase-subunit-gamma	gnl\|CDD\|235535	PRK05621, PRK05621, F0F1 ATP synthase subunit gamma; Validated.	6.87492e-142
NC_016026.1\|WP_014102246.1\|681262_681568_+\|type-II-toxin-antitoxin-system-HicB-family-antitoxin	gnl\|CDD\|374224	pfam15919, HicB_lk_antitox, HicB_like antitoxin of bacterial toxin-antitoxin system. This is a family of HicB-like antitoxins.	7.1014e-16
NC_016026.1\|WP_014102250.1\|683304_683985_-\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	2.027e-76

>NC_016026.1|WP_014102240.1|674980_677785_-|ATP-dependent-DNA-helicase
MSGHVAEQTQKRARVSMPAAAVITVTARTTTALSPDGEIKSYPHDQARMIFHKRPVIVCHAPYTRHRLGTDDLIAYDVLELFAFVHPAKFCVPTPFGIATALGIHVGDNSEDAPLALHESVRVLLSDLRACESDQEIRANLLGIADAMGAQGKGWVWTPYIFSALNAEYDPERQILTRTALNIWKNLPEWSEGAPPPPAGHDSVSGEEARERLRSMLTQGRSAEPRPQQMDYTGQIASIFAPAQNADQPHVLLAEAGTGVGKTLGYLAPSSVWAEKNGGPVWVSTYTRNLQRQIGQELERLYPDPMVRDRAVAIRKGRENYLCLLNYEDLANAAALARHATQIIAAGLMARWISATKDGDLSGGDFPGWLPALLGYGGTTSLADKRGECIHSACDHYHRCFVERSIRKARHADIVVANHALVMINTALAGTATPDDQPHRYVFDEGHHLFDAADGAFSGNLSARETADLRRWIFGQEGGKRSRARGLKRRMEDLIAGDGAAEEDLEKIIQAAHSLPGPGWSKRFKDNAAFGATEQFLALVYQQVYARADGRDGPYSLECTTLPLIDGLGDAARLLKSRLNDLRTPMMVLAGRLRRRLGEQSATLDTDTRRRLESVAASLQRRGEVTIGAWIAMLDTLESGNADDQFVDWMEIERIEGQAIDVGLYRHWVDPMIPFAAAMKTQAHGIAITSATLRDGTGDEEEDWRVAIERTGALSLTPSPHRFAVSSPYNYADQTRVYIITDVRKDDLDQVAGAYQALFEAAGGGGLGLFTAIQRLRAVRDRIAPKLEDNGIALYAQHVDEMDTGTLVDIFRADTHACLLGTDAVRDGVDVPGDSLRMLVYDRVPWTRPTILHKARREAFGKRRYDELLTRLKLRQAFGRLVRRADDRGVFVMLDSMLPTRLHGAFPEGVTIERVGLADAVKGIKEFWSTDSVG
>NC_016026.1|WP_148260412.1|674814_675000_+|hypothetical-protein
MEFIYDEQSTPIALLTPELKAEFERAGLFRMLDPYYQYPQTTSEPASRVRHLALVINPPNP
>NC_016026.1|WP_014102238.1|674380_674626_-|hypothetical-protein
MPKKSLKAAFNAACNRFFELAKEWENARSVPWDAVDDARQAVLNARDDLQGAQLTPDEWDDVIQDIIAVSDTHERLKPPSP
>NC_016026.1|WP_014102237.1|674056_674389_+|hypothetical-protein
MTASIMCVVFRPAHDKNIGDVSRMMPVIEQVIADCDGLNFSEDVYDSSAFRFFLPSGANVYDADRVVQCLNRLNDHDGGALLEAEQVSVPEKSVTLTRYPGIERNIVRLG
>NC_016026.1|WP_014102236.1|673499_673925_+|ATP-synthase-F1-subunit-epsilon
MADATTSNDVLTFELVSPERKLMSGTAYRVTIPGVEGDFGVLAGHASVLSTVRMGVVEILESASAAPVRIFITGGFADVTPVNCTLLAEEAVNVNDLDAAKLEQDIRNLSDDLSVAKDAFEKSKLQRRLDVTRAKLKAVAA
>NC_016026.1|WP_014102235.1|673236_673488_+|hypothetical-protein
MTTAPAHSSPMLQQVQTILRGMGYAPVAGDLGMYMRPIGSTPSISGTFYIVSQDDVQKVGELPVNEPVPHAVFVAQKAQYLFR
>NC_016026.1|WP_014102234.1|671812_673234_+|F0F1-ATP-synthase-subunit-beta
MTQAKGTITQILGAVLDVQFEEGNVPAILNALTTQNEGKTLVLEVAQHLGENTVRCIAMDTTDGLVRGQEVLDTGDAISVPVGPEVLGRILDVIGNPIDNLPAPSAKKRYPIHRPAPAFVDQSTEAEQLVTGIKVVDLLCPYLKGGKIGLFGGAGVGKTVTIQELINNIAKGHGGVSVFAGVGERTREGNDLYHEMMDAGVIKLDGESKVGLVFGQMNEPPGARARVALTGLSMAEYFRDEEGQDVLFFMDNVFRFTQAGAEVSALLGRIPSAVGYQPTLATDMGALQERITSTNKGSITSVQAVYVPADDLTDPAPATTFSHLDATTVLSRQIAELGIYPAVDPLDSTSRILDPRIVGEEHYKCAADVQKTLQTYKALQDIIAILGMDELSEEDKLIVARARKIQRFLSQPFHVAEVFTGSPGKFVQLEDTIKGFRAIVDGKYDHLPESAFYMVGTIEEAEEKAKKMAAEAA
>NC_016026.1|WP_041794270.1|671380_671713_+|hypothetical-protein
MAVAMQALERAERHIDAVLDPKAKASRDVKVKAFAELVRVLDVMQDAIATAPFLIARTAQDVVDDAFYRAFGLMNKEGIDEDEVRAHVHHFTSSTGGRMISPDFSRRFDA
>NC_016026.1|WP_014102232.1|670315_671227_+|F0F1-ATP-synthase-subunit-gamma
MPSLKEYRNRIASVKSTRKITSAMKMVAASKLKKAQEQAEASQPYAHAMAGMMSRVAKGVVVGPNSPKLLIGTGSDQVHMIVVVSSDRGLCGGFNGNLVRRVRNEVRGLLNAGKTVKLVCVGRKARDILRREFPKHITHSFTGLAGKNRIGFAEADEVSQYILSQFDAGEFDVCTLMYNEFKSVLTQRPVGAQLIPFRLPEVEAANQNVDAAEADKGATSPYSFEPDEAEILSALLPKNLSIQIFGALLDSAAGEQAARMTAMDNATRNAGEMIKKLSLQYNRARQAYITKELIEIISGAEAL
>NC_016026.1|WP_014102231.1|668690_670241_+|F0F1-ATP-synthase-subunit-alpha
MEIRAAEISEILKKQIAEFDAQADVAEIGQVLSVGDGVARVYGLDQVRAGEMVEFPGGIKGMALNLEADNVGVVIFGDDRSIKEGDIVKRTGEIVQVPVGKGLLGRVVDGLGNPIDGKGPIKNAEMRRVEVKAPGIIPRKSVHEPMQSGLKAIDALVPVGRGQRELIIGDRQTGKTAVALDTIINQKVINKSANEKDHLYCIYVAVGQKRSTVAQLVRQLEESGAMEYSIVVAATASDPAPMQFMAPYTGCTMGEFFRDNGMHALCVYDDLSKQAVAYRQMSLLLRRPPGREAYPGDVFYIHSRLLERAAKMNDEHGAGSLTALPVIETQAGDVSAYIPTNVISITDGQIFLETGLFFKGIRPAINVGLSVSRVGSAAQIKAMKQVAGTIKLELAQYREMEAFAQFASDLDASTQKLLARGARLTQLLVQPQYQPMPVEEQVLVIFAGTKGFLDSVPVASVREYERRLLEDVRANGKHILDAIRTEKALSDKLQKDLSDYLSQFGKGFEAVEKKAA
>NC_016026.1|WP_014102243.1|678529_679234_-|hypothetical-protein
MMPFLTPKTPVTPQSGQSGNALWFILLAIALLTALTIAITKTGDNVQQAGETERATVEATRIMRDGKAMQTAIQQMLARGGSENDICFDSDDWATNDYDFAACADAENRVFDPAGAGLGMPKTTATQKIIYTGSLAIDGVGTSAPDLVFILSGVGKADCLRINRMMKIDDASGNPPPISAVVSYTPFTGTYTAGNTVTAPQILQKSAGCVGGNGSDADELDQDFYHYYHVLIAR
>NC_016026.1|WP_014102244.1|679192_680845_+|lysine--tRNA-ligase
MGCNRGFGGQKGHHLRGYPGVEKGDRACIFVSHKRQNQDLKQLYHGDLKMGQNPAQNSETTVTTAGNPRLAKQVKLDALKAAGIDPYPHVFPRTHQNGTLQDMYKDLPNGTETDDHVAVAGRIMAIRNNGMFLDLMDPSGKMQVFCHKDSMSEEALSILDYFDIGDIIGAEGTVRRTPRGELSVRAKKVTMLTKSLMPLPEKYHGLTDVEQRYRQRYLDLIMNDESRQKLLMRSKIISTIRKFMEEHGAIEVETPMMHPILGGASAKPFVTHHNALDADFFLRIAPELYLKRLIVGGLADAVFEINRNFRNEGISYKHNPEFTMIESYHAYKDYYDVMDLIEKLVQAVAMAVHGTLEINFQGNVINLGSPWARKGMVELVQEETGVDFMSMDAAQAHAEAKKLGVHVDPKANWGQVVETIFGEKVEHKLIQPIHVIDHPLDISPLSKVHRNNPRLVERFESYINGWEMANAFTELNDPKIQHDRFMDQVAQREGGNEEAMMVDHDFVTALEYGLPPTGGWGMGIDRLTMIMTDSHNIREVIAFPTLKPEK
>NC_016026.1|WP_014102245.1|680972_681251_+|type-II-toxin-antitoxin-system-HicA-family-toxin
MPTLKHNDMVDILLHDGWKCVGQTGSHEQFKHDAKPNVVTVTNHGPKDIPCGTVRSILKTAGLDNVLKQLQHGASIKQLSKQMAKEMRAHLA
>NC_016026.1|WP_014102246.1|681262_681568_+|type-II-toxin-antitoxin-system-HicB-family-antitoxin
MSKSYVALIRKEDNTEYWIDIPDVPGCASCGETIDAAIANFEDALQFHLQGMKESGVFLQDPRSVQDVLRSEEDPFIESYMVEIDDMTPHLKFSFSRLSIV
>NC_016026.1|WP_014102247.1|681539_682151_-|nitroreductase
MTTITPQPATVQPDAIEFLLRRRSCKIKTLAAPGPDDQQLAIILQIAARVPDHGKLAPWSFVTFTGNARADFGKILAQAWKQDNPDAEPAKLDLESERFLRAPVVVAVLSHVREGKIPAWEQILSAGAACQNLILAATMMGFGAQWVTEWYATNNTVRTALGLKTDQDQVAGFIYLGTPSETPEERPRPEMDTIVTQWTGVKS
>NC_016026.1|WP_041794273.1|682238_683018_+|hypothetical-protein
MKYNLFENPFFQDKRRVALLVAAGVVLGGIVAVATMPDRVTNKSPVTHVLQPVPAGMMTLRGEGTLPDLHVAQQNDTVLKDMVTNFAAAGAVGLLSSVNDLDNRIMVLLFRWGGVDNINPDSYGGGMDGRIVALLQKAGQVPADVRPDMVIKADEVVRLTQRWNNGFNHFKIRLLAQAAGPEVFDGQIRYDVRSDRLDVTGGLSPAFMAQFARAVRDNPQSASIMAQFLDFIDSTRGFANLSEDDQDAIMALSAGPQGE
>NC_016026.1|WP_014102249.1|683020_683290_+|hypothetical-protein
MQIIKVWLKITAVLAVLGWVLHWASPDFAAWLDGVFSKKETAAVVEQVASPGSADVIPPSDAGAIRPGQQTDGQGDAKRVPRAPYQFNQ
>NC_016026.1|WP_014102250.1|683304_683985_-|response-regulator-transcription-factor
MRLLLIEDDELLSQFIAAGLHQAGYESDCAYTADEALALVRTQSYDLIITDLGLPDQDGLSLLKKIREHNKNIPVLILTARQGVDDKVKGLDLGADDYLPKPFEMPELTARVRALLRRPAQALDAVITVGNLALDTNAHTASVINAPMKLTRREIDLLEQLMRNSGKVVSKELIESRLYSYGEQGSSNSIEVLVHRLRKKLEDAGADVQIATLRGLGYVLAERTEE
>NC_016026.1|WP_014102251.1|684000_684375_-|CBS-domain-containing-protein
MYRYKTQYVAVMDRGDLVGIFTYASYLGNVLRSGKEAENTPLDEVMNTAPAPVDAEQSCRDVFQTVCQNGFPYVPVEQNGRFLGLVSDDILRLELSRELNAMRKKIGFSFFSPDDGSAMGGARP
>NC_016026.1|WP_014102252.1|684899_686378_-|aminopeptidase
MKIQSLGPYYEDQIKTIKALAKGSSLWKAEAEALLPRITQSYKRADADALLATLSDMQRLAYIVAAGLEHESSFRADLKDMPASGWAAFTAPPVEDKLNLSLAKKLYNVKPNNNDVATMRLGDTSRAIGSYLVQWCLRDKVPFSVYFQDSDFHALLLNHATPDGVKALAADYMRMVDGVNKSMIVRANTPNRKIVHAHPDKAKIYDHETAPFFQKAGTGEVFYTLTCIPTENDSKIDGITYNDYIKLFFEMCDQPWDAISDAHLKLIQEFNIATHVRITNNDGTDVSMELVDDDGSHFTFCNSLIAKNVPGSEIFSAPRKNSVNGVVVAKGKFTHGGALIEDLTMEFKNGELVKYEAKAGLDAFKRAVEMDEGARFVGELGIGTNPHLKQHVANGLLVEKIGGSFHLALGRPYSYTEYQGVQVKVDNGGRSKLHWDITTMLYGKDGIIYLDGRKVMENGLWIDPQYDVLNRGWAAIPRKDRPAYWKNYDPKL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_016026_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_016026_3

1544833-1544926

Orphan

Consensus_repeat	Method
AAATGGCGCGCCCGTTCGAACAACGTTCGAAC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_016026_3

>merge|NC_016026|3|1544833-1544926|CRISPRCasFinder
AAATGGCGCGCCCGTTCGAACAACGTTCGAACTGTCATAAAAAAGGCCGCAATTTCTGGAAGAAATGGCGCGCCCGTTCGAACAAAGTTCGAAC

>NC_016026|3|2|1544833-1544926|CRISPRCasFinder
AAATGGCGCGCCCGTTCGAACAACGTTCGAAC	TGTCATAAAAAAGGCCGCAATTTCTGGAAG
AAATGGCGCGCCCGTTCGAACAAAGTTCGAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_016026.1\|WP_081463073.1\|1534785_1536747_-\|type-II/IV-secretion-system-protein	unknown	unknown	gnl\|CDD\|225363
NC_016026.1\|WP_014103103.1\|1553035_1553404_-\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014103091.1\|1543106_1543805_-\|pirin-family-protein	unknown	unknown	gnl\|CDD\|380375
NC_016026.1\|WP_014103088.1\|1538513_1540145_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|283599
NC_016026.1\|WP_014103084.1\|1533509_1534730_-\|type-II-secretion-system-F-family-protein	unknown	unknown	gnl\|CDD\|224376
NC_016026.1\|WP_014103086.1\|1536928_1537555_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|223477
NC_016026.1\|WP_014103095.1\|1545422_1546658_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014103098.1\|1548865_1549801_+\|electron-transfer-flavoprotein-subunit-alpha	unknown	unknown	gnl\|CDD\|215032
NC_016026.1\|WP_014103090.1\|1542385_1543069_-\|hydrolase	unknown	unknown	gnl\|CDD\|238494
NC_016026.1\|WP_148260541.1\|1531739_1533458_-\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_081463094.1\|1540246_1542256_-\|amidohydrolase	unknown	unknown	gnl\|CDD\|224490
NC_016026.1\|WP_148260446.1\|1550820_1551669_+\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|153251
NC_016026.1\|WP_014103102.1\|1552165_1553020_+\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014103097.1\|1548053_1548803_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	unknown	unknown	gnl\|CDD\|224997
NC_016026.1\|WP_014103087.1\|1537561_1538494_-\|ring-cleaving-dioxygenase	unknown	unknown	gnl\|CDD\|319935
NC_016026.1\|WP_014103104.1\|1553569_1554859_+\|3-deoxy-D-manno-octulosonic-acid-transferase	unknown	unknown	gnl\|CDD\|235589
NC_016026.1\|WP_014103092.1\|1543911_1544802_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176114
NC_016026.1\|WP_014103101.1\|1551717_1551957_+\|DUF3126-family-protein	unknown	unknown	gnl\|CDD\|371468
NC_016026.1\|WP_041793921.1\|1549960_1550824_+\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|225717
NC_016026.1\|WP_014103096.1\|1547070_1547850_+\|PRC-barrel-domain-containing-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_016026.1\|WP_081463073.1\|1534785_1536747_-\|type-II/IV-secretion-system-protein	gnl\|CDD\|225363	COG2804, PulE, Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB [Cell motility and secretion / Intracellular trafficking and secretion].	2.18167e-170
NC_016026.1\|WP_014103091.1\|1543106_1543805_-\|pirin-family-protein	gnl\|CDD\|380375	cd02910, cupin_Yhhw_N, Escherichia coli YhhW and YhaK and related proteins, pirin-like bicupin, N-terminal cupin domain. This family includes the N-terminal cupin domains of YhhW and YhaK, Escherichia coli pirin-like proteins with unknown function. YhhW is structurally similar not only to human pirin but also to quercitin 2,3-dioxygenase (quercitinase). Although the function of YhhW is not completely understood, YhhW and its human ortholog have quercitinase activity and are likely to play an important role in transcription and apoptosis. This N-terminal cupin domain of YhhW has a metal coordination site and is thought to have catalytic activity while the C-terminal cupin-like domain has diverged considerably and has closer alignment with C-terminal pirin. YhaK is found in low abundance in the cytosol of E. coli and is strongly up-regulated by nitroso-glutathione (GSNO). There are major structural differences at the N-terminus of YhaK compared with YhhW; YhaK lacks the canonical cupin metal-binding residues of pirins and may be involved in chloride binding and/or sensing of oxidative stress in enterobacteria. YhaK showed no quercetinase and peroxidase activity; however, reduced YhaK was very sensitive to reactive oxygen species (ROS). Proteins in this family belong to the cupin superfamily with a conserved "jelly roll-like" beta-barrel fold.	5.82802e-78
NC_016026.1\|WP_014103088.1\|1538513_1540145_-\|MFS-transporter	gnl\|CDD\|283599	pfam05977, MFS_3, Transmembrane secretion effector. This is a family of transport proteins. Members of this family include a protein responsible for the secretion of the ferric chelator, enterobactin, and a protein involved in antibiotic resistance.	1.36583e-172
NC_016026.1\|WP_014103084.1\|1533509_1534730_-\|type-II-secretion-system-F-family-protein	gnl\|CDD\|224376	COG1459, PulF, Type II secretory pathway, component PulF [Cell motility and secretion / Intracellular trafficking and secretion].	5.78361e-105
NC_016026.1\|WP_014103086.1\|1536928_1537555_-\|alpha/beta-hydrolase	gnl\|CDD\|223477	COG0400, COG0400, Predicted esterase [General function prediction only].	2.12365e-64
NC_016026.1\|WP_014103090.1\|1542385_1543069_-\|hydrolase	gnl\|CDD\|238494	cd01012, YcaC_related, YcaC related amidohydrolases; E.coli YcaC is an homooctameric hydrolase with unknown specificity. Despite its weak sequence similarity, it is structurally related to other amidohydrolases and shares conserved active site residues with them. Multimerisation interface seems not to be conserved in all members.	1.50117e-58
NC_016026.1\|WP_014103098.1\|1548865_1549801_+\|electron-transfer-flavoprotein-subunit-alpha	gnl\|CDD\|215032	PLN00022, PLN00022, electron transfer flavoprotein subunit alpha; Provisional.	3.75448e-125
NC_016026.1\|WP_081463094.1\|1540246_1542256_-\|amidohydrolase	gnl\|CDD\|224490	COG1574, COG1574, Predicted metal-dependent hydrolase with the TIM-barrel fold [General function prediction only].	0
NC_016026.1\|WP_148260446.1\|1550820_1551669_+\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	gnl\|CDD\|153251	cd07989, LPLAT_AGPAT-like, Lysophospholipid Acyltransferases (LPLATs) of Glycerophospholipid Biosynthesis: AGPAT-like. Lysophospholipid acyltransferase (LPLAT) superfamily member: acyltransferases of de novo and remodeling pathways of glycerophospholipid biosynthesis which catalyze the incorporation of an acyl group from either acylCoAs or acyl-acyl carrier proteins (acylACPs) into acceptors such as glycerol 3-phosphate, dihydroxyacetone phosphate or lyso-phosphatidic acid. Included in this subgroup are such LPLATs as 1-acyl-sn-glycerol-3-phosphate acyltransferase (AGPAT, PlsC), Tafazzin (product of Barth syndrome gene), and similar proteins.	5.49835e-31
NC_016026.1\|WP_014103097.1\|1548053_1548803_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	gnl\|CDD\|224997	COG2086, FixA, Electron transfer flavoprotein, beta subunit [Energy production and conversion].	3.69801e-99
NC_016026.1\|WP_014103087.1\|1537561_1538494_-\|ring-cleaving-dioxygenase	gnl\|CDD\|319935	cd08347, PcpA_C_like, C-terminal domain of Sphingobium chlorophenolicum 2,6-dichloro-p-hydroquinone 1,2-dioxygenase (PcpA), and similar proteins. The C-terminal domain of Sphingobium chlorophenolicum (formerly Sphingomonas chlorophenolica) 2,6-dichloro-p-hydroquinone 1,2-dioxygenase (PcpA), and similar proteins. PcpA is a key enzyme in the pentachlorophenol (PCP) degradation pathway, catalyzing the conversion of 2,6-dichloro-p-hydroquinone to 2-chloromaleylacetate. This domain belongs to a conserved domain superfamily that is found in a variety of structurally related metalloproteins, including the bleomycin resistance protein, glyoxalase I, and type I ring-cleaving dioxygenases.	5.56586e-65
NC_016026.1\|WP_014103104.1\|1553569_1554859_+\|3-deoxy-D-manno-octulosonic-acid-transferase	gnl\|CDD\|235589	PRK05749, PRK05749, 3-deoxy-D-manno-octulosonic-acid transferase; Reviewed.	6.64574e-145
NC_016026.1\|WP_014103092.1\|1543911_1544802_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176114	cd08422, PBP2_CrgA_like, The C-terminal substrate binding domain of LysR-type transcriptional regulator CrgA and its related homologs, contains the type 2 periplasmic binding domain. This CD includes the substrate binding domain of LysR-type transcriptional regulator (LTTR) CrgA and its related homologs. The LTTRs are acting as both auto-repressors and activators of target promoters, controlling operons involved in a wide variety of cellular processes such as amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to name a few. In contrast to the tetrameric form of other LTTRs, CrgA from Neisseria meningitides assembles into an octameric ring, which can bind up to four 63-bp DNA oligonucleotides. Phylogenetic cluster analysis further showed that the CrgA-like regulators form a subclass of the LTTRs that function as octamers. The CrgA is an auto-repressor of its own gene and activates the expression of the mdaB gene which coding for an NADPH-quinone reductase and that its action is increased by MBL (alpha-methylene-gamma-butyrolactone), an inducer of NADPH-quinone oxidoreductase. The structural topology of this substrate-binding domain is most similar to that of the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	3.43697e-94
NC_016026.1\|WP_014103101.1\|1551717_1551957_+\|DUF3126-family-protein	gnl\|CDD\|371468	pfam11324, DUF3126, Protein of unknown function (DUF3126). This family of proteins with unknown function appear to be restricted to Alphaproteobacteria.	7.76483e-27
NC_016026.1\|WP_041793921.1\|1549960_1550824_+\|GNAT-family-N-acetyltransferase	gnl\|CDD\|225717	COG3176, COG3176, Putative hemolysin [General function prediction only].	1.48413e-58

>NC_016026.1|WP_014103092.1|1543911_1544802_+|LysR-family-transcriptional-regulator
MDKLANMQAFAMVGQTGSFAEAARRLNLAHSVVSKRIKDLEDYLGAQLLMRTTRKVSLTDAGYAYLDHVRKFLDEMDEIEGALRHKAQKPVGTIKLTAPLSFGLQYLGPAIASYLAQYPDVTVKTYLSDRRVDLVEEGYDLAIRVGALSDSSLIAKKLGACRRVVCATPAYFKQHGTPQTPDDLRNHNCLSYINLAEGKSWPFMVDGHKTWQPVTGNFLSDNGDLLYQAALANGGITLLPTFIVGDALNDGRLVPVLESYEETDFDIHAVYQHTRHLSAKIRTLIDHFGKVFGAGF
>NC_016026.1|WP_014103091.1|1543106_1543805_-|pirin-family-protein
MLRKRASGERGPTQTGWLSSKHSFSFGHYYDADHMGFGPLRVMNEDRVTPAAGFGTHPHANMEIISYVLDGELAHKDSMGNGSVIRPGDIQLMSAGTGVRHSEFNNSKDRGVHFLQIWIMPNVENATPSYQQQTFDPADMENKFRVVISPDGADNSLRVNQDARMMAGKFKKGSFSDVPTSSGRRYWLQMARGTANVNSVNLESGDGLAIMDEDKIFVQATSDAEILILDLP
>NC_016026.1|WP_014103090.1|1542385_1543069_-|hydrolase
MTAATNKLLTPDNSVFVFIDHQPQMAFGVTSIDRQLLKNNTIAMAKTAKLFNIPTILTAVETESFSGYIWPELMDVLQQEPIERTSMNSWEDKAFVDAVKKTGRKKLVMAALWTEACLIFPTICALDEGFEVIMNVDASGGTSKDAHDAAIRRGEQHGAESISTVQLLLEMQRDWSRKETYQGTTDIVREHFGAYGMGIDYAASMVHDYGQRAKFPHNVKKSGNKAA
>NC_016026.1|WP_081463094.1|1540246_1542256_-|amidohydrolase
MKSDFLIHKLTRRNFMQNTAMLGAGAVLGGAIGLLPKGAGAMTNAQIDTVFFNGKITTLDKDNPDVTAIALAGGMVAATGSDKEMRALAGPLARMIDLQGKRVIPGLNDSHTHLIRGGLNYNMELRWDGVASLSDALAMLKIQADRTPAPQWVRVVGGWSEFQFRERRMPTLAEINAVSPDTPVFILHLYDSALLNGAALRAVGLTKDSQDPPGGKIQRDANGNPTGMLIAEPNAMILYSTLAKGPTLPLSDQINSTRHFMRELNRLGITSVIDAGGGFQNYPDDYNVINKLHNDGHMTVRIAYNLFTQNKGVELADFQRWSGMVKPYSGDGFLRHNGAGEMLVFSAADFEDFLQPRPDMAANMEKELGAVVRHLIEQRWPFRLHATYDETISRALDVFEQVNADTPFNGVRWFFDHAETVSDKSLERIKKLNGGVAVQHRMAFQGEYFVDRYGAEAAKHSPPIRKMLDMGVPVGGGTDATRVASFNPFVSLYWLITGKTVGGLSLYGDENRLDREEALRLWTLGSAYKSNEETVKGALVPGMYADLAVLSHDFMTVPDEAIKDTVSIMTVVGGKIVYAADEFKSFDAPLPPVSPDWSPVRHFGGYQSGALEGAVKVASACAVHGCGHSHHHHASGHDGILSRWLGLDGSGNKPSFENPWAIGCGCFAY
>NC_016026.1|WP_014103088.1|1538513_1540145_-|MFS-transporter
MTKETKISAFSPFHHRVFAVLWGATLISNIGTWMFNVTSGWLMTDLAPSPLMVSLVQAATALPIFLFAIPAGAFGDLFDRRRLLIITQILSAVALFIFAGLLWVGAVGAWTLLFFTFLTGAMSAFAMPAWQAIVPRLVPKNELAPAIALNGVSVNIARAIGPALGGFILVAMGAVATVVLDAVSFLVIVAALLWWKTTTPQTTPNVPRERLVGAMQAGVRFSIRSLPLRHTLVRAFAFFVFASAYWALLPLLAKDVLQGGPGLYGILLTALGAGAIAGTFMLAPLKTKIGPNRILALASGLTALGMVVMAYGGTEIAGIAGAFIGGIGWILAVSSLNVSAQLSLPDWVRARGLAVFQMVFFGAMTLGSIVWGHVAGLVGLSETLAVAAAMIVVGIPLTWRFHLNRGEGEDYTPSHHWPEPMLVAPVDHDRGPVLVTLEYRIDDADREKFYHLMTELGDIRRRDGAIQWGFFEDVEDHGRFIEMFTAESWADHLRHHDRVTESDRVLQHKIHELHKGGKVKTMHAVMPGLSGGSLKKIPKNHKD
>NC_016026.1|WP_014103087.1|1537561_1538494_-|ring-cleaving-dioxygenase
MTHASGIHHITAIASDPKTNYDFYTKLLGLRFIKKTVNFDDPSTYHFYFGDKVGSPGTILTFFPYPGTPQGRPGLGQAVEVTFAIPKTAFSFWLDRFHQKGIQYQGPEDRFGDKVLRISDPDGLMLEFVGVDDLPSENVWTTDEISADVAIRGFHSVTLWVQGYEKTAALLNEHLGFHAVGNEESRFRFTTGKKGLGQTVDLRCLPEIWSGAPGAGTIHHVAWRIGGDKEEGHVRAALARQGLNLTPVIDRNYFHSVYFREPNGVLFELATDNPGFAVDEPVDTLGQDLKLPAQYEQHREAIVAVLPPLE
>NC_016026.1|WP_014103086.1|1536928_1537555_-|alpha/beta-hydrolase
MNFPESDFKHIFLPGDVEKPVLLLLHGTGGDENDLVPLGQAVAPDHAILSVRGRVLENGMPRFFRRLAEGVFDLDDLKFRTDELADFITAARDEYEIGKRPLVALGYSNGANIAASLFLKRPEVLDGAMLLRAMVPFEPDELPNLSGKKILMLTGMMDLIIPLDNSKKLAGMLADAGADLDFRAKPMAHGLGQSDLADMQNWFPAAFR
>NC_016026.1|WP_081463073.1|1534785_1536747_-|type-II/IV-secretion-system-protein
MRFSKDTGPEIMDDANKKAPRKPGADLELDDGAFALALDDDYIEAETVEVVTRDIAPQPSAQQPAPNAGSTAGASAPSGTRDLAVQNTGGVSEDLNRGRMGDRLVAMGIITEDQLNVALQEKKVTGKMLGSVLVDLGFIDEDLLSGFLAESSGFDVFDPKNTIFSGDALAMIDKATAKKHQLLPISIDDKEAAVAMCDPYDVMAMDTLRRFLPKNITIKPLVTTPKIIMEAIDAAYGYASSIAAILKELEEGEPTDLSTLSEDEAYSHPIVRLVNALVYDAVKIGASDLHFEPEENFVRLRYRLDGVLFTAQILHKQHWNGISQRLKIMSHMNIADKLSPQDGRFGLNIGGKLADFRVSSLPTVHGENIVLRVLDQSSNIIPLEQLGFSPHNLEKIRRAQARPEGIIIVTGPTGSGKTTSLYSMLNEINTVEVNIQTLEDPVEYSLPMIRQTPIREGVLEFADGIRALLRQDPDIIFLGEIRDGITAEKALQASMTGHQVYSTLHTNDSFGAIPRLLDLGLKPGMIAGAIVAVFAQRLVRKVCPHCREAYQPGPDECAILNVDPANPPTIYKAHQGGCQMCAGQGYKGRISIAEILLFDDELDEVIAQNGSKAELKRKAYEKGFKNMKDDGILKVLEGITTLESLATAVDVYK
>NC_016026.1|WP_014103084.1|1533509_1534730_-|type-II-secretion-system-F-family-protein
MAADRYKYRAINNKGRPVRGVISAANEVDLYNQLQSAGLELIQCQSLTKKKGMLSDLRAPKISTRDLIQLFMHMEQMQGAGVALLDALADIRDTTEHDRLRDVLSEVHRDVSDGSALSEAMGHHPKTFGSLYISLIAAGEETGDLTAAYRHLIKYLKWVDQMQAKVRKATRYPTILVVVVIATIVVMMSFVVPQIVGFIRNLDQELPWYTTSLMATSDFFVKYWWGVLATPPILFVVYKALVKSSEDFAYRMDRLFLEMPVAGPLIRKINIARFAQTFGAMFASGIDVLSALRAARNTVKNLALVEALEGVEEQVAAGSPLSEAFNASGEFPSMVVRMLKVGEESGNLTVVLDQVAEFYTNDVDEAVQGLIAMIEPFLTMFLGVMIMWIAVAVFGPIYASFENIDF
>NC_016026.1|WP_148260541.1|1531739_1533458_-|hypothetical-protein
MISDDALYVYDVGGKVRLVDTVPWATRDFEQTVSGLIRRECGGKSVMIVNDMTDQLFKGGQRIPKVGPMDKANVVARKLAVAFPNYPIRGALALKDVGPRKTGATAAKAGGGLYLFAAVPMSEPVQKTIGAVKTSMSSIAGFTLLPVESSDMVRTLAEKAAKREKTKSRWAVLIGQHQSGGLRQVITRDGQLAMTRMTPVTDLSTDPGAWVSEVAQEFKATISYLSRFGYSAGDGTEVFVITTPQAGEMLRQRIDVPCNIHNYTVGEAARELGFSIGIQENQYHADPLHASWIGRKSRLILPMVATDINKIYGPRQAATFAGLLLFCGAAYLGWQLAGNAQAWFTAKDDLVSQQRLRINVNQEYEIEVARMNALGVDIKLIQSSLETYKTLEAESLRPLPILRKVGEALGSELRLDTMKIERVVPKLPDDPYVVAEMTEDQKAPTLKASLQLSFPGTVDPLVAKREVDDLQARLRTALPGYDVAIPRPVGDLVYEEVEGGTGVPGAQGGVQAPLEDHVAELVITGPVQFHEPDVPVEDAPADTPADAPTDSPVDTNTEGQTAPDMTYEGAEQ
>NC_016026.1|WP_014103095.1|1545422_1546658_+|hypothetical-protein
MTRNVSTRRGASFSRFACNAAVFALAGLSAALINGAPADARTGGTMPPALVVTNEPLPNELQSKIYQQPRRAPVIDTQQVMGSQYWDEGSETIVSRKIDDLRKELFGLQGNVSGLSDRLNQLSLAGQNHSAEYYANVATISTQLQSGTTPGNPRLIKRLSVARNSLEQLAGNVASLNDLAVEISNAASMAGFLLESARTTYSLSGAVEEDHVRLSQLEDSISNTVVAIDRMLNTVNDDITRTVAYLSTERNNLRTLSLGITTGDLFGKSLGTRPFSGAPQTSMNGAPQAAPMGDDMAGGYVQPVSQPAPLASARPLVKIRFDKANVNYEQPVYMAVNEALQRYPNARFELVAVQPTGGNSAEATIESTRARRNAEKVLRSLTEMGVSLDRIDLSNLQSNEATTSEVHLYVR
>NC_016026.1|WP_014103096.1|1547070_1547850_+|PRC-barrel-domain-containing-protein
MRSLLFSIAFAVVTLIVLTLAFPAKPKAQEAPSPATSLFSSTTETSVMRINAHRGRAEEARYNNAQSIQNLLGQDVLDGRGQAVALVHDVIIVNGDDRNDNEAEFLILSDGTQFGMPGRMVALDYDDAVKSEPRRESLKRIDTSDSDDVVAFDYSFGPGMNDTRLLRLNEISVRNTIGTPIYGTQMDQVGMVADVTLKNGRADLIVFVPTPVMGMGIDPVALFYDQTLIISAADGHNAFQLSPEQNEALNSYRDALRTF
>NC_016026.1|WP_014103097.1|1548053_1548803_+|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein
MKILVPVKRVIDAYVTIRVKADGTGVETANVKMSMNPFCEIAVEEAVRMKEAGKATEIVVVSAGPANVQETMRTAMAMGADRGIHIQTDEDIQPLAMAKLLKAVVEKEQPGLVLMGKQAIDGDNNQTGQMLAGLLNWAQGTFASKVELNGDHAIVTREIDGGLETLKLKMPCVVTTDLRLNEPRYAALPNIMKAKKKPLDTTTPADLGVTIEHKLKTLKVSEPPKRAAGIKVADVAELVSKLKNEAKVL
>NC_016026.1|WP_014103098.1|1548865_1549801_+|electron-transfer-flavoprotein-subunit-alpha
MTILVVAEHDNQTLNHATLCTIAAAQKLGSDIHVLVAGSGSASVADAVSKAAGVTKVLHADDAAYARELAENMGNLIAKIGGAYSHILAPASFFGKNILPRAAALLDVQQISDIVAIESADTFVRPVYAGNALATVQVTGSPIVVTVRPTAFDAVAETGGAGAVEALASAGDSGLSSFVGQEVTKSERPDLQTAKVVVSGGRGLGSGENYEKIITPLADKLGAALGASRAAVDAGYVPNDYQVGQTGKVVAPQLYIAVGISGAIQHLAGMKDSKVIVAINKDADAPIFQIADYGLVADLFEAVPELEKALG
>NC_016026.1|WP_041793921.1|1549960_1550824_+|GNAT-family-N-acetyltransferase
MSNPLLSAIAGSDKVSVRLAKTPAEIEAAQRLRYSIFYDEFGAKPDDTVAATKLDADKYDPVADHIIVVDTSGDAEKIVGTYRLIRKEPADSVGGFYTSNEYDISALQSCGMSILELGRSCVLPDYRTRPVLQLLWQGIANYVMVDHQIELLFGCASFHGTDPDKISEQLSYLYHYHLAPPGLRPTALPDRFVKMDLHPKESLNPKKIFNELPPLIKGYLRVGSMVGDGAVIDEQFNTIDVCIVLQTHLVTSRYKKHYERKTGQNMPIPEELAGQTDADAEALFRRD
>NC_016026.1|WP_148260446.1|1550820_1551669_+|1-acyl-sn-glycerol-3-phosphate-acyltransferase
MKDKNTMTRSLIAVIKALMFILWSLLVAPLQFVFLLFNRGPAAYILPHIWQRGVCRILGLRVVVEGTPDTARQVMFVSNHLSYLDIPVIASVLKASFIAKKDVSSWPVFGFLSTLQQTAFISRDRKDAKVEKNNLSSMIAAGKSLILFPEGTSTDGCDVVKFKSSLFSLAADPTTGAFLPVQPISLVMDRVDGRVPADGPNDVRDVYAWHGDMTMGPHLWNFVKSRGATIRLIFHPVLDPQVYNDRKLLAEAAWNQVRGGVAGPSLSAPATASTLAAAAIGG
>NC_016026.1|WP_014103101.1|1551717_1551957_+|DUF3126-family-protein
MSQAQAKLKMTGEESSKIQKFLEKTLKTPGLALRARPQAADSVEVLVNGEYVGLIHKDLDEGETSYIFTMTILDIDLDE
>NC_016026.1|WP_014103102.1|1552165_1553020_+|hypothetical-protein
MILFSGNKQSKSGPVSARSVIRMALTVCGAAFIAATISSAAQAQPASCDPAYWESMKQRGMLEAQREVQQNQNLIFKADSVLELTCFDRQLQALAQQAISLFSETTRWGVILSPTSMDAALNNLVATGLMNYIANNSFAHTYGGGRFPGDYTMQSSFGGSTVYNCNTMALVWEAAKCYNFAEESKDGFFTLADFVEPRVGVGHQGFTCSGDGRLGNMRSVASNSGDQYQTETYNSYAGLFASDSCSAPIPTGVRVSRVNMNPYNEHICINPGCFYNLSTCTNTP
>NC_016026.1|WP_014103103.1|1553035_1553404_-|hypothetical-protein
MTDSHMDPAALRRKQVLDDALTQLRQTRDQLDPALLARVRALIGDRTLLDLMEPVSDDRPSLPPGVKAWNPAADIKPEPAKPGYEAIDRRRNLQTIRLFLELQPQNKSVQTKVRTLMSEFFN
>NC_016026.1|WP_014103104.1|1553569_1554859_+|3-deoxy-D-manno-octulosonic-acid-transferase
MERIYRTLMRAGTPALRLLLATRVKRGKEDPARLNERMGVAGHARPDGPLVWFHAASVGEAQSTLILITALLDAHPDLNILVTTGTVTSAELMKNRLPPRAIHQFYPLDHPIWVERFVDHWQPDLVLWMESELWPNMLGTIRARNIPAVLVNARLSPRSMRRWKRMRSVITPMLSTFTTILTQTDEHAANYRALGATHVITTDNLKFASLPLPYNATDLHALKDAIGARPVWLYASTHDGEEGLACTLHRKLFIDFPELLTIIVPRHPERRAVIATTVQAEHLRVCMRGPNKALPSMDDDIYVADTLGELGLFYRLAPISCIGRSFSRDGGGGHNPVEAAQLGSAVLYGPMVQNQQALYDEMRDYGAAIALADPDMFAETLRDLMRNQGRLIEQQNRGQNFAREKNAVLDRVMAAITPLVPTPKKSDAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_016026_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_016026_4

2270437-2270781

Orphan

Consensus_repeat	Method
CTATGGCGGCGCAGGCGGCAGCGG	CRISPRCasFinder

5 spacers

The CRISPR arrays of NC_016026_4

>merge|NC_016026|4|2270437-2270781|CRISPRCasFinder
CCGGGGCGGCCCCGGTGGCGGCGGAGGCAGAGACCAGGGATTGGGTGGCGATATAGCCGCTGGCAAGGCTGGCGTTTATGGCGGCGGTGGTGGCGGCGACGCTGGATGGGGCGGCGGATCATCCACCTATGGCGGCGCAGGCGGCAGCGGCGATGGAACCAACAACGGATCAACCACCAGCTATGGCGGCGCAGGCGGCGCGGATGCGACATATGCCTGCGGCACATCGACCAACGGCGGGGCCTGTGGCGCCACACTGAATGGCGGCGGTGGCGGCGGCATCGGCGACACGGTGACCCAGGGCAGTGCCGGGTCCGGCGGCACAGGCGGCGCAGCCGCCAATGG

>NC_016026|4|3|2270437-2270781|CRISPRCasFinder
CCGGGGCGGCCCCGGTGGCGGCGG	AGGCAGAGACCAGGGATTGGGTGGCGATATAGCCGCTGGCAAGGCTGGCGT
TTATGGCGGCGGTGGTGGCGGCGA	CGCTGGATGGGGCGGCGGATCATCCAC
CTATGGCGGCGCAGGCGGCAGCGG	CGATGGAACCAACAACGGATCAACCACCAG
CTATGGCGGCGCAGGCGGCGCGGA	TGCGACATATGCCTGCGGCACATCGACCAACGGCGGGGCCTGTGGCGCCACACT
GAATGGCGGCGGTGGCGGCGGCAT	CGGCGACACGGTGACCCAGGGCAGTGCCGGGTCCGGCGG
CACAGGCGGCGCAGCCGCCAATGG

Protein	Signature genes	Signature genes Name	Protein_function
NC_016026.1\|WP_014103790.1\|2276632_2277085_-\|acetyl-CoA-carboxylase-biotin-carboxyl-carrier-protein	unknown	unknown	gnl\|CDD\|235777
NC_016026.1\|WP_014103789.1\|2275269_2276610_-\|acetyl-CoA-carboxylase-biotin-carboxylase-subunit	unknown	unknown	gnl\|CDD\|236307
NC_016026.1\|WP_081463086.1\|2264162_2264867_-\|ribonuclease-III	unknown	unknown	gnl\|CDD\|234633
NC_016026.1\|WP_014103777.1\|2263242_2264166_-\|GTPase-Era	unknown	unknown	gnl\|CDD\|234624
NC_016026.1\|WP_081463095.1\|2274554_2275193_+\|NYN-domain-containing-protein	unknown	unknown	gnl\|CDD\|350235
NC_016026.1\|WP_014103794.1\|2278816_2279599_-\|thioredoxin-domain-containing-protein	unknown	unknown	gnl\|CDD\|239321
NC_016026.1\|WP_148260473.1\|2266234_2266465_-\|hypothetical-protein	unknown	unknown	unknown
NC_016026.1\|WP_014103785.1\|2270856_2271453_-\|DUF2062-domain-containing-protein	unknown	unknown	gnl\|CDD\|378263
NC_016026.1\|WP_014103783.1\|2267655_2268855_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|372323
NC_016026.1\|WP_014103787.1\|2273755_2274172_-\|DNA-directed-RNA-polymerase-subunit-omega	unknown	unknown	gnl\|CDD\|234744
NC_016026.1\|WP_014103780.1\|2265786_2266209_-\|holo-ACP-synthase	unknown	unknown	gnl\|CDD\|234610
NC_016026.1\|WP_014103779.1\|2264866_2265712_-\|signal-peptidase-I	unknown	unknown	gnl\|CDD\|274044
NC_016026.1\|WP_014103782.1\|2266499_2267636_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|372323
NC_016026.1\|WP_014103792.1\|2277615_2278110_-\|copper-chaperone-PCu(A)C	unknown	unknown	gnl\|CDD\|377298
NC_016026.1\|WP_014103791.1\|2277180_2277615_-\|type-II-3-dehydroquinate-dehydratase	unknown	unknown	gnl\|CDD\|376496
NC_016026.1\|WP_014103776.1\|2262391_2262928_-\|gcrA-cell-cycle-regulator-family-protein	unknown	unknown	gnl\|CDD\|254404
NC_016026.1\|WP_014103775.1\|2261641_2262214_+\|CspA-family-cold-shock-protein	unknown	unknown	gnl\|CDD\|224197
NC_016026.1\|WP_014103786.1\|2271473_2273645_-\|bifunctional-(p)ppGpp-synthetase/guanosine-3',5'-bis(diphosphate)-3'-pyrophosphohydrolase	unknown	unknown	gnl\|CDD\|223394
NC_016026.1\|WP_041794603.1\|2259469_2261191_-\|long-chain-fatty-acid--CoA-ligase	unknown	unknown	gnl\|CDD\|341259
NC_016026.1\|WP_014103793.1\|2278120_2278765_-\|DsbA-family-protein	unknown	unknown	gnl\|CDD\|239321

Protein	Function_ID	Function_description	E-value
NC_016026.1\|WP_014103790.1\|2276632_2277085_-\|acetyl-CoA-carboxylase-biotin-carboxyl-carrier-protein	gnl\|CDD\|235777	PRK06302, PRK06302, acetyl-CoA carboxylase biotin carboxyl carrier protein.	2.73942e-46
NC_016026.1\|WP_014103789.1\|2275269_2276610_-\|acetyl-CoA-carboxylase-biotin-carboxylase-subunit	gnl\|CDD\|236307	PRK08591, PRK08591, acetyl-CoA carboxylase biotin carboxylase subunit; Validated.	0
NC_016026.1\|WP_081463086.1\|2264162_2264867_-\|ribonuclease-III	gnl\|CDD\|234633	PRK00102, rnc, ribonuclease III; Reviewed.	4.35256e-94
NC_016026.1\|WP_014103777.1\|2263242_2264166_-\|GTPase-Era	gnl\|CDD\|234624	PRK00089, era, GTPase Era; Reviewed.	1.18847e-143
NC_016026.1\|WP_081463095.1\|2274554_2275193_+\|NYN-domain-containing-protein	gnl\|CDD\|350235	cd10911, PIN_LabA, PIN domain of Synechococcus elongatus LabA (low-amplitude and bright) and related proteins. This subfamily contains Synechococcus elongatus PCC 7942 LabA which participates in cyanobacterial circadian timing, it is required for negative feedback regulation of the autokinase/autophosphatase KaiC, a central component of the circadian clock system, and appears to be necessary for KaiC-dependent repression of gene expression. This subfamily belongs to the LabA-like domain family which includes the N-terminal domain of limkain b1, a human autoantigen localized to a subset of ABCD3 and PXF marked peroxisomes. Also included in the LabA-like domain family are human ZNF451, uncharacterized Bacillus subtilis YqxD, uncharacterized Escherichia coli YaiI, and the N-terminal domain of a well-conserved group of mainly bacterial proteins with no defined function, which contain a C-terminal LabA_like_C domain. Curiously Pseudomonas putida S16 NicB , which is described as a putative NADH-dependent hydroxylase involved in the microbial degradation of nicotine also falls into the LabA-like family. The PIN (PilT N terminus) domain belongs to a large nuclease superfamily. The structural properties of the PIN domain indicate its active center, consisting of three highly conserved catalytic residues which coordinate metal ions; in some members, additional metal coordinating residues can be found while some others lack several of these key catalytic residues. The PIN active site is geometrically similar in the active center of structure-specific 5' nucleases, PIN-domain ribonucleases of eukaryotic rRNA editing proteins, and bacterial toxins of toxin-antitoxin (TA) operons.	1.76933e-67
NC_016026.1\|WP_014103794.1\|2278816_2279599_-\|thioredoxin-domain-containing-protein	gnl\|CDD\|239321	cd03023, DsbA_Com1_like, DsbA family, Com1-like subfamily; composed of proteins similar to Com1, a 27-kDa outer membrane-associated immunoreactive protein originally found in both acute and chronic disease strains of the pathogenic bacteria Coxiella burnetti. It contains a CXXC motif, assumed to be imbedded in a DsbA-like structure. Its homology to DsbA suggests that the protein is a protein disulfide oxidoreductase. The role of such a protein in pathogenesis is unknown.	6.65858e-56
NC_016026.1\|WP_014103785.1\|2270856_2271453_-\|DUF2062-domain-containing-protein	gnl\|CDD\|378263	pfam09835, DUF2062, Uncharacterized protein conserved in bacteria (DUF2062). This domain, found in various prokaryotic proteins, has no known function.	1.4358e-35
NC_016026.1\|WP_014103783.1\|2267655_2268855_+\|hypothetical-protein	gnl\|CDD\|372323	pfam12810, Gly_rich, Glycine rich protein. This family of proteins is greatly expanded in Trichomonas vaginalis. The proteins are composed of several glycine rich motifs interspersed through the sequence. Although many proteins have been annotated by similarity in the family these annotations given the biased composition of the sequences these are unlikely to be functionally relevant.	1.81177e-06
NC_016026.1\|WP_014103787.1\|2273755_2274172_-\|DNA-directed-RNA-polymerase-subunit-omega	gnl\|CDD\|234744	PRK00392, rpoZ, DNA-directed RNA polymerase subunit omega; Reviewed.	6.82487e-24
NC_016026.1\|WP_014103780.1\|2265786_2266209_-\|holo-ACP-synthase	gnl\|CDD\|234610	PRK00070, acpS, 4'-phosphopantetheinyl transferase; Provisional.	1.01319e-53
NC_016026.1\|WP_014103779.1\|2264866_2265712_-\|signal-peptidase-I	gnl\|CDD\|274044	TIGR02227, Inactive_signal_peptidase_IA., signal peptidase I, bacterial type. This model represents signal peptidase I from most bacteria. Eukaryotic sequences are likely organellar. Several bacteria have multiple paralogs, but these represent isozymes of signal peptidase I. Virtually all known bacteria may be presumed to A related model finds a simlar protein in many archaea and a few bacteria, as well as a microsomal (endoplasmic reticulum) protein in eukaryotes. [Protein fate, Protein and peptide secretion and trafficking].	2.17684e-45
NC_016026.1\|WP_014103782.1\|2266499_2267636_+\|hypothetical-protein	gnl\|CDD\|372323	pfam12810, Gly_rich, Glycine rich protein. This family of proteins is greatly expanded in Trichomonas vaginalis. The proteins are composed of several glycine rich motifs interspersed through the sequence. Although many proteins have been annotated by similarity in the family these annotations given the biased composition of the sequences these are unlikely to be functionally relevant.	0.000172219
NC_016026.1\|WP_014103792.1\|2277615_2278110_-\|copper-chaperone-PCu(A)C	gnl\|CDD\|377298	pfam04314, PCuAC, Copper chaperone PCu(A)C. PCu(A)C is a periplasmic copper chaperone. Its role may be to capture and transfer copper to two other copper chaperones, PrrC and Cox11, which in turn deliver Cu(I) to cytochrome c oxidase.	2.31478e-37
NC_016026.1\|WP_014103791.1\|2277180_2277615_-\|type-II-3-dehydroquinate-dehydratase	gnl\|CDD\|376496	pfam01220, DHquinase_II, Dehydroquinase class II.	1.12063e-83
NC_016026.1\|WP_014103776.1\|2262391_2262928_-\|gcrA-cell-cycle-regulator-family-protein	gnl\|CDD\|254404	pfam07750, GcrA, GcrA cell cycle regulator. GcrA is a master cell cycle regulator that, together with CtrA (see pfam00072 and pfam00486), is involved in controlling cell cycle progression and asymmetric polar morphogenesis. During this process, there are temporal and spatial variations in the concentrations of GcrA and CtrA. The variation in concentration produces time and space dependent transcriptional regulation of modular functions that implement cell-cycle processes. More specifically, GcrA acts as an activator of components of the replisome and the segregation machinery.	2.84216e-41
NC_016026.1\|WP_014103775.1\|2261641_2262214_+\|CspA-family-cold-shock-protein	gnl\|CDD\|224197	COG1278, CspC, Cold shock proteins [Transcription].	9.046e-18
NC_016026.1\|WP_014103786.1\|2271473_2273645_-\|bifunctional-(p)ppGpp-synthetase/guanosine-3',5'-bis(diphosphate)-3'-pyrophosphohydrolase	gnl\|CDD\|223394	COG0317, SpoT, Guanosine polyphosphate pyrophosphohydrolases/synthetases [Signal transduction mechanisms / Transcription].	0
NC_016026.1\|WP_041794603.1\|2259469_2261191_-\|long-chain-fatty-acid--CoA-ligase	gnl\|CDD\|341259	cd05936, FC-FACS_FadD_like, Prokaryotic long-chain fatty acid CoA synthetases similar to Escherichia coli FadD. This subfamily of the AMP-forming adenylation family contains Escherichia coli FadD and similar prokaryotic fatty acid CoA synthetases. FadD was characterized as a long-chain fatty acid CoA synthetase. The gene fadD is regulated by the fatty acid regulatory protein FadR. Fatty acid CoA synthetase catalyzes the formation of fatty acyl-CoA in a two-step reaction: the formation of a fatty acyl-AMP molecule as an intermediate, followed by the formation of a fatty acyl-CoA. This is a required step before free fatty acids can participate in most catabolic and anabolic reactions.	0
NC_016026.1\|WP_014103793.1\|2278120_2278765_-\|DsbA-family-protein	gnl\|CDD\|239321	cd03023, DsbA_Com1_like, DsbA family, Com1-like subfamily; composed of proteins similar to Com1, a 27-kDa outer membrane-associated immunoreactive protein originally found in both acute and chronic disease strains of the pathogenic bacteria Coxiella burnetti. It contains a CXXC motif, assumed to be imbedded in a DsbA-like structure. Its homology to DsbA suggests that the protein is a protein disulfide oxidoreductase. The role of such a protein in pathogenesis is unknown.	2.22585e-20

>NC_016026.1|WP_014103783.1|2267655_2268855_+|hypothetical-protein
MKQRIKNIRKNTHLMAITSLMACAVLTGTLAKPAHAACSSPTALAGTLEWFSGTTEFKYCDGTNWLSMAGGTVTWVQSGSNIYYNTGNVAIGTTNSQGLKLAVNGGLRLADSGTACNATYKGVMRYSAAKNIEFCNGTSWKALAGPTIETCSVQEYTTPGSHSYTVLPGCEDLAIETYGAGGGGGYSTYGGGGGGSSRVQDESNTIIALGGGGGGGAGDSSAQGGGGGGGYGKKIVTLSAGDNLLVVVGEGGESGCGTNGGTGGNPDGGTFGNNSNGGNSTYGGGGGGDGGGYRGGASTYGGGGGGGDGVNNDGSTTDYGGAGGADAQYLCGTSTYGGPCGGEKSGGGGGSGIGDLVLRGLNGNSFQGGPAANNGPGQGATDSSSCARGGNGKVVIRPF
>NC_016026.1|WP_014103782.1|2266499_2267636_+|hypothetical-protein
MIAIAGFCALVPNAAHAACTSPAKGEGAIEWFTADQKFKYCDNTNWVVIGTGGSWVVSGSDIYYTTDMVGINRSNPAVMLDVGGSVRIGDNSVTCNTAREGAIRYSSVNTVDFCDGTSWKSFSGITPSTCPTTEYTTPGSYTYTVTAGCTNLILESYGAGGGGGWASYAGGGGGSSRIEYPASTIVSLGGGGGGGGGDAGGPGGGGGGGYGKKLMTLSVGNVLNIYVGQGGQNGCSNNGGAGGNPSGGTLGNSSNGGNSTYGGGGGGDGGYRGGTSTYGGGGGGGDGVDNNGSTTTYGGAGGADVAYLCGTSTYGGPCGGSKSGGGGGYGIGDVALQGSGGNSSAGGTAAGGGTGTGGAPASACNRGGDGKVVIRPQQ
>NC_016026.1|WP_148260473.1|2266234_2266465_-|hypothetical-protein
MEGTDAAASALKTWARPDTENPLLPEIQNGLLNSPKFSRPTIVMMLNLPAADLFYAIVLNKVLPVKSAVRTGLHIQ
>NC_016026.1|WP_014103780.1|2265786_2266209_-|holo-ACP-synthase
MIIGTGSDLIDIRRIEKTLARFGDRFILRCFTETERAKAESRRGAGTHIATYAKRFAAKEACSKALGTGFAEGVFMRDIGVVNDSFGRPTLHLTGGAAKRLAAMVPAGMRPVIHLTLTDEPPLGMAHVMIEARPQGEPDI
>NC_016026.1|WP_014103779.1|2264866_2265712_-|signal-peptidase-I
MSDQTPADQQANQKSAPKSPPLSASEEWSEFIKTAMIAVVLALLIRTFLYEPFNIPSGSMKPTLEVGDYLFVSKPAYGYSRYSFPFGLAPIEGRVWAKAPERGDVAVFKLPTNPRIDYIKRIVGMPGDTVQVIDGRLYINRQIVPRESVGLKRVDEDGSIVVMTEYLETLPNGVVHSIYEEGDDHPLDNTPEYTVPDGHYFAMGDNRDNSQDSRVMNHVGFIPYENIVGRASFLFFSTNGSASLAEVWKWPGAIRYSRLLMSVEPVKVEAPAAASTPVAAD
>NC_016026.1|WP_081463086.1|2264162_2264867_-|ribonuclease-III
MPMAGAPDMDQAMNDLQDRLNHRFSNPDLLRAALTHSSTGAAVNYERLEFLGDRVMGLALARFLFDIFPHENEGDLARRHAALVSGSTLARVAKGINLGDALHLSHAERAAGGAENDNILSDVVEAMIGALYLDAGLDPCMSAIQSLWGDLLQADLTPPRDPKTALQEWAQGQGHPLPRYTMIERSGPDHAPIFTVSVFVEGFDEVAEQGTSRRAAEKAAATRLLNIIEKDNRS
>NC_016026.1|WP_014103777.1|2263242_2264166_-|GTPase-Era
MTERCGFVAIIGAPNAGKSTLINRMVGAKVSIVNRKVQTTRINVRGIVMMDDDATQIILIDTPGIFSPKRRLDRAMVAAAWNGEADADITALLIDASKEGFDKDTRALLDTIEKRVKDGAVGDRKIILLLNKIDQMPADQLLKISAELNDRIPFTATFMISGLKGRGVQDVLDWISKNIPEGPHHYPGDQLSDLPERLLAAEITREKIYDNLHQELPYAATVETETWESFDDGSVKISQIIYLAREAHKPIILGKGGSRLKTIGMQSRKELESLLECRVHLKLFVKVKENWMDDPDRYSVWGLDPGA
>NC_016026.1|WP_014103776.1|2262391_2262928_-|gcrA-cell-cycle-regulator-family-protein
MSWTEERVSLLKQLWGEGKSAAEIAKALGGGLTRNAVIGKAHRLKLSNRVSPIQQNSKTPDAAPIAVKATVRVVEETAAPVRAAARVAIAIPQAANNGKGVSMVELKDRMCRWPVGDPKDSNFHFCGCSSEAGLPYCGAHAKIAYQAPSRSRQLNAEDFEREGSAVHAEEELKDVVRA
>NC_016026.1|WP_014103775.1|2261641_2262214_+|CspA-family-cold-shock-protein
MSHFVGNSEDGFQTDTLPAVRAKLKWFNGPKGFGFVVPDGEDIDAFLHVTTLQRAGATALGDGADLMCRIKRGPRGAMVTEVTEILDLGALPETAMPTSAPRMPQSGGPSISDHAGPEKGVTMDGTVKWYKPEKGFGFIIPEDQAKDVFIHKACLERHGLMGLEPGQRVRMQVRAVAKGREVIDFELMDG
>NC_016026.1|WP_041794603.1|2259469_2261191_-|long-chain-fatty-acid--CoA-ligase
MSVETISPASSSAQYPWLSHYPQGLNWGCDIDMGPVPAMLDKTVAAHGAWPGIDFMGKVWSWADIGAQVDALAKAFQDMGVVKGTRIGMFLPNCPTFIVGYYAALKAGATVVNFNPLYTPRELKHQIEDSGTTIMLTLDLQMLHQKMDEMLKTSSLQKLVVARFTDILPFPKSLLFPIFKAKDKAKIAPSDKIVWLHEITAGGGKPAPVSIDPMNDIAVLQYTGGTTGTPKGAALTHANVTANAHQCSLWLGGHGGDGQQRMMGVLPFFHVFAMTAVMNFSVRSAFEIIIPAPRFELDITLKAIDKKKPHYFPAVPAIYNGINNHPKLAEFDLKSLRYCISGGAPLPVEVKKAFERNTGCVVVEGYGLTESAPVVCVNPIVGANKAGSIGMPVPGTIVEIVSTEDGVSLVKQGERGELCVRGPQVMKGYWNKPEETDLVLKGGRLHTGDVATMDQEGYVYIVDRIKDLIITNGYNVYPRNVEEAIYLHTGVEECIVAGVPDDERGEAVKAWIKPKAGVTLTEKDMLAFLADKISKIEMPRHMEIRETPLPKTMIGKLSRKDILAEEKAKREAA
>NC_016026.1|WP_014103785.1|2270856_2271453_-|DUF2062-domain-containing-protein
MLFRRRTKLHPIKRLREILWPSMGWGRTWDYIRHRMFRRSDSSYSITAGLAAGVAVSFSPIMGTHIVQAAGVALVTRANVFAGAIGTLFGNPTTFPMIWWASYQLGAFIIGLFWDVRMVELPDHITFAFLMAHPYKIFLPMMVGGYTLALVSWPVAYLICYWPVKQMQKAYHAERLQKLRDKILHREHAAREKGDNTD
>NC_016026.1|WP_014103786.1|2271473_2273645_-|bifunctional-(p)ppGpp-synthetase/guanosine-3',5'-bis(diphosphate)-3'-pyrophosphohydrolase
MSLSSDLVDQIKTYNPDIDPALIERAIEYARVKHDGQVRASGEPYYTHPVEVAAILADMKMDPATIVTAILHDTLEDTDATMEELKKLFGDDVANMVNGVSKLSRIEGQTVEGKQAENFRKLVLAMSDDIRVLLVKLADRLHNMRTIHHIAKPEKQRRIARETLEIYAPLAERIGIHQIKEELEDRAFGVMNPEARESITNRLSYLRQEGTDMADTIIKALSKTLKDAGINGVVLGREKTRYSIWRKMQRKNVSFEQLSDIMAFRVLVDNVEQCYHVLGIIHSQYPTVPGRFKDYISTPKPNGYRSIHTTVIGPENQRIEVQIRTKDMNEEADLGVAAHWAYKGGASKADMKDARQFRWLRELLDLIENEQRPEEFLENTKLELFQDQVFVFTPKGDLMELPNGSTPVDFAYAIHSNVGDRCTGAKINGRIAPLNTKLQNGDQVDIITAKNQTPSPTWERFVATGKARSHIRRYVRQQQRDEYATLGRAMLQKVFQAEGYEYSEKGLAGILNQFRGAEVVDDILAGIGQGNFVARDVFRAIFPSHKAAPARKPNEMDVAEAGVTGRKAESSSRPMPIKGLIPGMAVHFARCCHPLPGDRIVGIVTTGKGVTIHTIDCETLENFADTPERWLDVSWGDGPDSPESHIGRIDVTIANVAGALGTISTVIGKNGGNITNLKITNRSLDFWDMILDVYVNDIKHLNNIIAALRATPQIASVQRSRGR
>NC_016026.1|WP_014103787.1|2273755_2274172_-|DNA-directed-RNA-polymerase-subunit-omega
MARVTVEDCVEKVANRFELVMLAAQRARKIGSGAALTLDRDNDKNPVVALREIAEETVGVEDLKEELIRNNQRVIEMDDSEDIIDQMDGEEEWNALAAQSAAMDLDRDSDDDDDFGDDDGEPSLEDLAGGVPDGDDDL
>NC_016026.1|WP_081463095.1|2274554_2275193_+|NYN-domain-containing-protein
MPFYPEEKLALFIDGSNLYAAARALEFDIDYRLLLKWAADQGRLVRALYYTALIEDQEYSPIRPLVDWLDYNGYTMVTKPTKEFVDAQGRRKIKGNMDIELAIDMMEMADNVDHIMLFSGDGDFRRLIEAVQRKGVRVTVVSSIKTSPPMVADELRRQADHFLELEMLANAIQRAGGPRTAANAQPATDGMDDEDEDDNFGNALPPSILGAE
>NC_016026.1|WP_014103789.1|2275269_2276610_-|acetyl-CoA-carboxylase-biotin-carboxylase-subunit
MFKKILIANRGEIALRIIRACREMGIQTVAVHSTADANAMAVRLADESVCIGPAPSRESYLNIPAILTAATVTGAEAIHPGYGFLSENEQFARMVEEHGFVFIGPKPEHIATMGDKVMAKKTVKALGLPVVPGSEGALESVEEGLAFAKEAGYPVLIKAASGGGGKGMKVVRSPEEFQEAYSTARSEAKANFGDDTVYVEKYLEKPRHIEIQVFGDTHGNAIHLGERDCSTQRRHQKLVEEAPSPVLSAEERDQIGSLAAEVIRKMGYRGAGTIEFLYENGQFFFMEMNTRIQVEHPVTEMITGIDLIAEQIRVAAGEPLSVNKDRIHLRGHAIEIRINAEDPDTFMPSPGTITQFHAPGGLGVRFDSAIYGGYRIPPYYDSMVGKLIVHGRNRDECIRRLRRAITETVVEGVKTTLPLQLWISEQPEFTSGEYNIHWLEKKLAER
>NC_016026.1|WP_014103790.1|2276632_2277085_-|acetyl-CoA-carboxylase-biotin-carboxyl-carrier-protein
MKIDEKAIRKLAELLDETHLTEIEVAEGEQVIRVARGGAVFSGSAPMPVSMASDPTIPQAANLSAPSTVAGNHPGAVVSPMVGTAYLQAEPGAPSFVQKGATVKAGDTLLIIEAMKVMNPIKAQKGGVVTQIAIENGQPVEYGDVLMVIE
>NC_016026.1|WP_014103791.1|2277180_2277615_-|type-II-3-dehydroquinate-dehydratase
MKKILVLNGPNLNMLGRREPDIYGTTTLGDIEALCRAAGAKAGHEIDFRQSNHEGVLVDWIQEVAHDPDLVGVVINAAAYTHTSVAIHDALKILHVPVVEVHLSDPSTREPFRHISYVEPVASAVFKGMGPQGYLLGIEHLLSN
>NC_016026.1|WP_014103792.1|2277615_2278110_-|copper-chaperone-PCu(A)C
MKMRSAALMALMLSVLSSAAYADVIVHDAYSFATVSGTKTGAVFLTVGADAADRLIGAETPVTKRAELHTHEDDNGVMKMRKTDGFDVGADAGLTLKPGGHHIMLLDLPQPLVKDQTFPLTLVFEKAGKVETTVLVRAAGDVPADHDHGHDHGAGHDDHAGHAH
>NC_016026.1|WP_014103793.1|2278120_2278765_-|DsbA-family-protein
MWGLGGFAILLVFLATSMTMRTLSWKKTQSHITQAVAGQVMHAAEQGDPVIRIVALTRYGSCDPCMQAHQALTQALADEAAGAGDIQVIVQPVPLSDPHNQRLARLALAAGLQDKFAPFHDALMNYDGALTDDVVKTLAMDAGVDFDRLNADMNDPRVDDALNAGRALMDAVKPPALPSFVFNDHLVFAPPKDGVFKSSDFLAFFNHVRTTPSR
>NC_016026.1|WP_014103794.1|2278816_2279599_-|thioredoxin-domain-containing-protein
MTLSSKLRLSAVAVSVLAVSVAGFALVPHAATKDVFTADQKAALNDIIYDYLMENPQVIMEAVAKHQVDQEQAQVDAMKELIVTKKDALFNDAGKPVAGNPKGTVVIAEFYDYNCGYCKHAFNDMAQILESDKDVKFVMIDFPILSEGSHMAAKYALAAGKQGKYFEMHSKLMKMSGQLREEQVQAMGKDLGLDVEQMKKDAESADVAKQIESNIALARELGISGTPGFIINETPVRGYLGLEGMQSIIAEERAKLAKKD

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_013859	Azospirillum sp. B510 plasmid pAB510e, complete sequence	316910-316936	3	0.889
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_048876	Gordonia phage Secretariat, complete genome	19921-19947	4	0.852
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP019586	Sinorhizobium meliloti strain CCMM B554 (FSM-MA) plasmid pSymB, complete sequence	670717-670743	5	0.815
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_019849	Sinorhizobium meliloti GR4 plasmid pRmeGR4d, complete sequence	1104891-1104917	5	0.815
NC_016026_3	3.1\|1544865\|30\|NC_016026\|CRISPRCasFinder	1544865-1544894	30	NZ_CP040048	Acinetobacter baumannii strain VB1190 plasmid unnamed1, complete sequence	388870-388899	6	0.8
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP019586	Sinorhizobium meliloti strain CCMM B554 (FSM-MA) plasmid pSymB, complete sequence	1319803-1319829	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_019849	Sinorhizobium meliloti GR4 plasmid pRmeGR4d, complete sequence	383926-383952	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_014818	Asticcacaulis excentricus CB 48 plasmid pASTEX01, complete sequence	92671-92697	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_003078	Sinorhizobium meliloti 1021 plasmid pSymB, complete sequence	1357624-1357650	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021799	Sinorhizobium meliloti strain USDA1106 plasmid psymB, complete sequence	1423847-1423873	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_016624	Azospirillum lipoferum 4B plasmid AZO_p5, complete sequence	212382-212408	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021828	Sinorhizobium meliloti strain KH35c plasmid psymB, complete sequence	922579-922605	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021823	Sinorhizobium meliloti strain KH46 plasmid psymB, complete sequence	1043647-1043673	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021795	Sinorhizobium meliloti strain USDA1157 plasmid psymB, complete sequence	584256-584282	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021806	Sinorhizobium meliloti strain T073 plasmid psymB, complete sequence	636625-636651	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP019484	Sinorhizobium meliloti strain B401 plasmid pSymB, complete sequence	1476077-1476103	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP019487	Sinorhizobium meliloti strain B399 plasmid pSym, complete sequence	1252370-1252396	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_020560	Sinorhizobium meliloti 2011 plasmid pSymB, complete sequence	1357630-1357656	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP013635	Rhizobium sp. N324 plasmid pRspN324e, complete sequence	414883-414909	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_017326	Sinorhizobium meliloti SM11 plasmid pSmeSM11d, complete sequence	377784-377810	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_017323	Sinorhizobium meliloti BL225C plasmid pSINMEB02, complete sequence	1620436-1620462	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP009146	Sinorhizobium meliloti strain RMO17 plasmid pSymB, complete sequence	378929-378955	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NC_018701	Sinorhizobium meliloti Rm41 plasmid pSYMB, complete sequence	372700-372726	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021802	Sinorhizobium meliloti strain USDA1021 plasmid psymB, complete sequence	996998-997024	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021820	Sinorhizobium meliloti strain M162 plasmid psymB, complete sequence	724804-724830	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021831	Sinorhizobium meliloti strain HM006 plasmid psymB, complete sequence	628673-628699	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021814	Sinorhizobium meliloti strain M270 plasmid psymB, complete sequence	260285-260311	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021810	Sinorhizobium meliloti strain Rm41 plasmid psymB, complete sequence	1161494-1161520	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP021218	Sinorhizobium meliloti RU11/001 plasmid pSymB, complete sequence	524964-524990	6	0.778
NC_016026_4	4.2\|2270536\|27\|NC_016026\|CRISPRCasFinder	2270536-2270562	27	NZ_CP026527	Sinorhizobium meliloti strain AK21 plasmid pSymB, complete sequence	382032-382058	6	0.778
NC_016026_3	3.1\|1544865\|30\|NC_016026\|CRISPRCasFinder	1544865-1544894	30	JF314845	Cronobacter phage ES2, complete genome	17836-17865	7	0.767
NC_016026_3	3.1\|1544865\|30\|NC_016026\|CRISPRCasFinder	1544865-1544894	30	NZ_AP014865	Bacillus thuringiensis serovar tolworthi strain Pasteur Institute Standard strain plasmid pKK1, complete sequence	235712-235741	8	0.733

1. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_013859 (Azospirillum sp. B510 plasmid pAB510e, complete sequence) position: , mismatch: 3, identity: 0.889

-cgctggatggggcggcggatcatccac	CRISPR spacer
gcgc-ggatgcggcggcggatcatccgc	Protospacer
 *** ***** ***************.*

2. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_048876 (Gordonia phage Secretariat, complete genome) position: , mismatch: 4, identity: 0.852

cgctggatggggcggcggatcatccac	CRISPR spacer
cgaaggatggggcggcggatcctcctc	Protospacer
**  ***************** *** *

3. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP019586 (Sinorhizobium meliloti strain CCMM B554 (FSM-MA) plasmid pSymB, complete sequence) position: , mismatch: 5, identity: 0.815

cgctggatggggcggcggatcatccac	CRISPR spacer
cgctggatcgggcggcggaacatcgga	Protospacer
******** ********** **** .

4. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_019849 (Sinorhizobium meliloti GR4 plasmid pRmeGR4d, complete sequence) position: , mismatch: 5, identity: 0.815

cgctggatggggcggcggatcatccac	CRISPR spacer
cgctggatcgggcggcggaacatcgga	Protospacer
******** ********** **** .

5. spacer 3.1|1544865|30|NC_016026|CRISPRCasFinder matches to NZ_CP040048 (Acinetobacter baumannii strain VB1190 plasmid unnamed1, complete sequence) position: , mismatch: 6, identity: 0.8

tgtcataa----aaaaggccgcaatttctggaag	CRISPR spacer
----atagccgcaaaaggccgcaatttctgtaag	Protospacer
    ***.    ****************** ***

6. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP019586 (Sinorhizobium meliloti strain CCMM B554 (FSM-MA) plasmid pSymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

7. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_019849 (Sinorhizobium meliloti GR4 plasmid pRmeGR4d, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

8. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_014818 (Asticcacaulis excentricus CB 48 plasmid pASTEX01, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
agctggatggggcggcggctcatatcg	Protospacer
 ***************** **** .

9. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_003078 (Sinorhizobium meliloti 1021 plasmid pSymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

10. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021799 (Sinorhizobium meliloti strain USDA1106 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

11. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_016624 (Azospirillum lipoferum 4B plasmid AZO_p5, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gtgcggatgcggcggcggatcatccgc	Protospacer
   .***** ***************.*

12. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021828 (Sinorhizobium meliloti strain KH35c plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

13. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021823 (Sinorhizobium meliloti strain KH46 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

14. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021795 (Sinorhizobium meliloti strain USDA1157 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

15. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021806 (Sinorhizobium meliloti strain T073 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

16. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP019484 (Sinorhizobium meliloti strain B401 plasmid pSymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

17. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP019487 (Sinorhizobium meliloti strain B399 plasmid pSym, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

18. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_020560 (Sinorhizobium meliloti 2011 plasmid pSymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

19. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP013635 (Rhizobium sp. N324 plasmid pRspN324e, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
ggctggaagcggcggcggatcatctgt	Protospacer
 ****** * **************...

20. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_017326 (Sinorhizobium meliloti SM11 plasmid pSmeSM11d, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

21. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_017323 (Sinorhizobium meliloti BL225C plasmid pSINMEB02, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

22. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP009146 (Sinorhizobium meliloti strain RMO17 plasmid pSymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

23. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NC_018701 (Sinorhizobium meliloti Rm41 plasmid pSYMB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

24. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021802 (Sinorhizobium meliloti strain USDA1021 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

25. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021820 (Sinorhizobium meliloti strain M162 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

26. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021831 (Sinorhizobium meliloti strain HM006 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

27. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021814 (Sinorhizobium meliloti strain M270 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

28. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021810 (Sinorhizobium meliloti strain Rm41 plasmid psymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

29. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP021218 (Sinorhizobium meliloti RU11/001 plasmid pSymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

30. spacer 4.2|2270536|27|NC_016026|CRISPRCasFinder matches to NZ_CP026527 (Sinorhizobium meliloti strain AK21 plasmid pSymB, complete sequence) position: , mismatch: 6, identity: 0.778

cgctggatggggcggcggatcatccac	CRISPR spacer
gattggatggggcgcccgatcatccaa	Protospacer
 ..*********** * *********

31. spacer 3.1|1544865|30|NC_016026|CRISPRCasFinder matches to JF314845 (Cronobacter phage ES2, complete genome) position: , mismatch: 7, identity: 0.767

tgtcataaaaaaggccgcaatttctggaag	CRISPR spacer
tgtaataaaaaaggccgccatttggcgacc	Protospacer
*** ************** ****   **

32. spacer 3.1|1544865|30|NC_016026|CRISPRCasFinder matches to NZ_AP014865 (Bacillus thuringiensis serovar tolworthi strain Pasteur Institute Standard strain plasmid pKK1, complete sequence) position: , mismatch: 8, identity: 0.733

tgtcataaaaaaggccgcaatttctggaag	CRISPR spacer
aacaataaaaaaggccgtcatttctggcgg	Protospacer
 .. *************. ******** .*

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

508142 : 516390

Acanthocystis_turfacea_Chlorella_virus(16.67%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_041793744.1\|508142_509222_+	GDP-mannose 4,6-dehydratase	M1HVG7	Acanthocystis_turfacea_Chlorella_virus	4.3e-100	51.8
WP_014102052.1\|509205_510165_+	GDP-L-fucose synthase	R9S8B8	Prochlorococcus_phage	1.9e-86	50.8
WP_014102053.1\|510168_511035_+	mannose-1-phosphate guanylyltransferase	A0A1V0SH58	Hokovirus	1.7e-25	27.9
WP_014102054.1\|511095_512079_+	arginase	A0A0N9R043	Chrysochromulina_ericina_virus	1.1e-12	26.3
WP_148260499.1\|512053_512362_-	hypothetical protein	NA	NA	NA	NA
WP_014102056.1\|512443_513454_-	L-histidine N(alpha)-methyltransferase	NA	NA	NA	NA
WP_014102057.1\|513469_514129_-	helix-turn-helix transcriptional regulator	B0VK64	Azospirillum_phage	7.2e-05	40.3
WP_014102058.1\|514320_516390_-	M3 family metallopeptidase	A0A1V0SIU1	Klosneuvirus	2.1e-34	23.9

DBSCAN-SWA_2

563889 : 581959

Pseudomonas_phage(21.43%)

capsid

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014102105.1\|563889_564993_-	hypothetical protein	B0VK50	Azospirillum_phage	1.8e-16	56.7
WP_041793749.1\|564989_565826_-	hypothetical protein	B0VK49	Azospirillum_phage	1.0e-11	31.7
WP_014102107.1\|565825_567496_-	hypothetical protein	F8TV92	EBPR_siphovirus	4.4e-43	29.8
WP_014102108.1\|567495_570933_-	tape measure protein	A9J4X2	Pseudomonas_phage	1.4e-30	27.8
WP_148260406.1\|570929_571175_-	hypothetical protein	A5A3Q3	Burkholderia_phage	4.8e-07	39.0
WP_014102110.1\|571237_571657_-	hypothetical protein	A0A0S0N5N1	Pseudomonas_phage	1.2e-29	48.6
WP_014102111.1\|571779_572706_-	hypothetical protein	A0A2D2W241	Stenotrophomonas_phage	4.5e-45	36.5
WP_014102112.1\|572768_573173_-	hypothetical protein	NA	NA	NA	NA
WP_014102113.1\|573169_573577_-	HK97 gp10 family phage protein	A0A0K0PVL1	Roseobacter_phage	3.3e-16	43.5
WP_014102114.1\|573573_573849_-	hypothetical protein	NA	NA	NA	NA
WP_014102115.1\|573845_574214_-	hypothetical protein	NA	NA	NA	NA
WP_014102116.1\|574210_574675_-	hypothetical protein	R9TG38	Synechococcus_phage	2.2e-29	43.8
WP_014102117.1\|574678_575077_-	hypothetical protein	NA	NA	NA	NA
WP_041793751.1\|575073_575877_-	hypothetical protein	NA	NA	NA	NA
WP_014102119.1\|575876_576869_-	hypothetical protein	A0A2H5BHF7	Acinetobacter_phage	2.9e-34	30.8
WP_014102120.1\|576930_577602_-	hypothetical protein	NA	NA	NA	NA
WP_014102121.1\|577668_578736_-\|capsid	minor capsid protein	A0A0S0N1M5	Pseudomonas_phage	3.8e-64	39.3
WP_014102122.1\|578719_580132_-	DUF4055 domain-containing protein	A0A1V0DY64	Dinoroseobacter_phage	5.9e-65	32.9
WP_014102123.1\|580128_581430_-	hypothetical protein	A0A0N7IRE3	Acinetobacter_phage	2.1e-186	71.0
WP_014102124.1\|581413_581959_-	hypothetical protein	C7U0V7	Enterobacteria_phage	1.0e-20	44.4

DBSCAN-SWA_3

2325817 : 2372236

Agrobacterium_phage(21.43%)

tRNA,tail,protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_014103849.1\|2325817_2326366_+\|tRNA	prolyl-tRNA synthetase associated domain-containing protein	NA	NA	NA	NA
WP_014103850.1\|2326371_2327325_+	tetratricopeptide repeat protein	A0A1X9I9P5	Staphylococcus_phage	1.8e-12	41.5
WP_014103852.1\|2327587_2328271_+	LON peptidase substrate-binding domain-containing protein	NA	NA	NA	NA
WP_014103853.1\|2328303_2328489_+	Trm112 family protein	NA	NA	NA	NA
WP_014103854.1\|2328506_2329676_+	2-isopropylmalate synthase	E5EQ69	Micromonas_sp._RCC1109_virus	1.5e-05	23.6
WP_148260477.1\|2329835_2330570_+\|tRNA	leucyl/phenylalanyl-tRNA--protein transferase	NA	NA	NA	NA
WP_014103856.1\|2330665_2331187_+	hypothetical protein	NA	NA	NA	NA
WP_049782188.1\|2331265_2331730_-	DUF2155 domain-containing protein	NA	NA	NA	NA
WP_014103858.1\|2331803_2332298_-	outer membrane lipid asymmetry maintenance protein MlaD	NA	NA	NA	NA
WP_041794092.1\|2332334_2332748_-	NADH:ubiquinone oxidoreductase subunit NDUFA12	NA	NA	NA	NA
WP_014103860.1\|2332988_2333891_-	response regulator	S4VYT2	Pandoravirus	9.8e-13	33.7
WP_014103861.1\|2334040_2334943_+\|protease	ATP-dependent Clp protease proteolytic subunit	A0A223W000	Agrobacterium_phage	6.5e-25	36.1
WP_014103862.1\|2335024_2335468_-	hypothetical protein	NA	NA	NA	NA
WP_014103863.1\|2335634_2336216_-	GDYXXLXY domain-containing protein	NA	NA	NA	NA
WP_014103864.1\|2336212_2337421_-	DUF2157 domain-containing protein	NA	NA	NA	NA
WP_014103866.1\|2337566_2338301_+	hypothetical protein	NA	NA	NA	NA
WP_014103867.1\|2338354_2340724_-	AAA family ATPase	A0A223W0B1	Agrobacterium_phage	1.8e-154	41.2
WP_014103868.1\|2340941_2343242_-\|protease	ATP-dependent Clp protease ATP-binding subunit ClpA	A0A223W0B1	Agrobacterium_phage	2.1e-176	44.4
WP_049782190.1\|2343409_2343757_-\|protease	ATP-dependent Clp protease adapter ClpS	A0A218MMY6	uncultured_virus	8.4e-13	41.7
WP_014103871.1\|2344150_2344654_-	phasin family protein	NA	NA	NA	NA
WP_014103872.1\|2344990_2346439_+	serine hydrolase	B6DZZ7	Stx2-converting_phage	4.1e-29	34.9
WP_014103873.1\|2346453_2347287_+	SDR family oxidoreductase	NA	NA	NA	NA
WP_014103874.1\|2347290_2347980_+	hypothetical protein	NA	NA	NA	NA
WP_014103875.1\|2347990_2348767_-	hypothetical protein	NA	NA	NA	NA
WP_014103876.1\|2348783_2349446_-	hypothetical protein	NA	NA	NA	NA
WP_014103877.1\|2349575_2351036_-	D-glycero-beta-D-manno-heptose-7-phosphate kinase	A0A0K0KVL9	Prochlorococcus_phage	2.9e-14	32.9
WP_014103879.1\|2351212_2352190_+	transglutaminase-like cysteine peptidase	NA	NA	NA	NA
WP_014103880.1\|2352269_2352746_-	hypothetical protein	NA	NA	NA	NA
WP_014103881.1\|2352762_2353197_-	hypothetical protein	NA	NA	NA	NA
WP_014103882.1\|2353248_2353983_-	hypothetical protein	NA	NA	NA	NA
WP_014103883.1\|2354165_2355998_-	ribonucleoside-diphosphate reductase subunit alpha	A0A0K1LMZ5	Caulobacter_phage	4.3e-217	62.5
WP_014103885.1\|2356625_2357192_+	AAA family ATPase	NA	NA	NA	NA
WP_014103886.1\|2357272_2358712_+	pyruvate kinase	NA	NA	NA	NA
WP_187287634.1\|2358949_2359114_-	hypothetical protein	NA	NA	NA	NA
WP_014103887.1\|2359189_2361712_+\|tail	tail fiber domain-containing protein	A0A1D8KU59	Synechococcus_phage	1.1e-13	38.5
WP_014103888.1\|2361718_2362981_+	hypothetical protein	NA	NA	NA	NA
WP_148260478.1\|2363175_2364279_+	hypothetical protein	NA	NA	NA	NA
WP_014103890.1\|2364289_2365567_+	hypothetical protein	NA	NA	NA	NA
WP_187287635.1\|2365570_2366431_-	histidine phosphatase family protein	NA	NA	NA	NA
WP_041794101.1\|2366682_2367762_+	ribonucleotide-diphosphate reductase subunit beta	A0A0K1LM33	Caulobacter_phage	4.8e-99	55.8
WP_014103893.1\|2367944_2369909_+\|tail	tail fiber domain-containing protein	A0A0P0YNI2	Yellowstone_lake_phycodnavirus	4.0e-11	42.3
WP_148260569.1\|2370193_2372236_+\|tail	tail fiber domain-containing protein	A0A0P0YNI2	Yellowstone_lake_phycodnavirus	4.2e-11	38.9

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_016026

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection