CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
CP034953	Escherichia coli strain MT102 chromosome, complete genome	8 crisprs	csa3,PD-DExK,cas3,cas8e,cse2gr11,cas7,cas5,cas6e,cas1,cas2,WYL,DEDDh,DinG,c2c9_V-U4	0	12	8	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: CP034953_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_1

652069-652209

Orphan

Consensus_repeat	Method
CACGCCGCATCCGCCAGTGGCGCGGTGCAGATGCCGGATGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP034953_1

>merge|CP034953|1|652069-652209|CRISPRCasFinder
CACGCCGCATCCGCCAGTGGCGCGGTGCAGATGCCGGATGCGACGCTTGTCGCGTCTTATCCGACCTACGGGAACACACATGTAGGGCGGATAAGGCGTTCACGCCGCATCCGCCAGTGGCGCGGTGCAGTTGCCGGATGC

>CP034953|1|1|652069-652209|CRISPRCasFinder
CACGCCGCATCCGCCAGTGGCGCGGTGCAGATGCCGGATGC	GACGCTTGTCGCGTCTTATCCGACCTACGGGAACACACATGTAGGGCGGATAAGGCGTT
CACGCCGCATCCGCCAGTGGCGCGGTGCAGTTGCCGGATGC

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA88441.1\|657809_660902_-\|beta-galactosidase-subunit-alpha	unknown	unknown	gnl\|CDD\|236673
CP034953.1\|QAA88445.1\|664458_665979_+\|PAS-domain-S-box-protein	unknown	unknown	gnl\|CDD\|214599
CP034953.1\|QAA88430.1\|645237_646224_-\|Gfo/Idh/MocA-family-oxidoreductase	unknown	unknown	gnl\|CDD\|223745
CP034953.1\|QAA88438.1\|654663_655734_-\|protein-YgjJ	unknown	unknown	unknown
CP034953.1\|QAA88435.1\|649390_649807_+\|type-II-toxin-antitoxin-system-antitoxin-HigA	unknown	unknown	gnl\|CDD\|227786
CP034953.1\|QAA88427.1\|641790_642342_+\|YgjV-family-protein	unknown	unknown	gnl\|CDD\|378474
CP034953.1\|QAA88436.1\|649851_651870_-\|NADPH-dependent-2,4-dienoyl-CoA-reductase	unknown	unknown	gnl\|CDD\|239240
CP034953.1\|QAA88440.1\|657363_657813_-\|beta-galactosidase-subunit-beta	unknown	unknown	gnl\|CDD\|182302
CP034953.1\|QAA88431.1\|646302_646995_-\|vancomycin-high-temperature-exclusion-protein	unknown	unknown	gnl\|CDD\|225500
CP034953.1\|QAA88437.1\|652295_654647_-\|alpha-glucosidase	unknown	unknown	gnl\|CDD\|236653
CP034953.1\|QAA88444.1\|662661_664152_-\|putrescine-aminotransferase	unknown	unknown	gnl\|CDD\|183175
CP034953.1\|QAA88439.1\|655867_657301_-\|amino-acid-permease	unknown	unknown	gnl\|CDD\|237929
CP034953.1\|QAA88434.1\|649079_649394_+\|mRNA-interferase-HigB	unknown	unknown	gnl\|CDD\|227025
CP034953.1\|QAA88442.1\|661085_662069_-\|transcriptional-regulator-EbgR	unknown	unknown	gnl\|CDD\|182389
CP034953.1\|QAA88446.1\|666132_666756_-\|PadR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224609
CP034953.1\|QAA88432.1\|647071_647575_-\|M48-family-peptidase	unknown	unknown	gnl\|CDD\|224368
CP034953.1\|QAA88433.1\|647659_648796_+\|23S-rRNA-(guanine(1835)-N(2))-methyltransferase-RlmG	unknown	unknown	gnl\|CDD\|184963
CP034953.1\|QAA88429.1\|643989_644955_-\|TerC-family-membrane-protein-Alx	unknown	unknown	gnl\|CDD\|274743
CP034953.1\|QAA88428.1\|642346_643591_-\|serine/threonine-transporter-SstT	unknown	unknown	gnl\|CDD\|184190
CP034953.1\|QAA88443.1\|662287_662620_+\|tRNA-binding-protein	unknown	unknown	gnl\|CDD\|182232

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA88441.1\|657809_660902_-\|beta-galactosidase-subunit-alpha	gnl\|CDD\|236673	PRK10340, ebgA, cryptic beta-D-galactosidase subunit alpha; Reviewed.	0
CP034953.1\|QAA88445.1\|664458_665979_+\|PAS-domain-S-box-protein	gnl\|CDD\|214599	smart00283, MA, Methyl-accepting chemotaxis-like domains (chemotaxis sensory transducer). Thought to undergo reversible methylation in response to attractants or repellants during bacterial chemotaxis.	7.77978e-74
CP034953.1\|QAA88430.1\|645237_646224_-\|Gfo/Idh/MocA-family-oxidoreductase	gnl\|CDD\|223745	COG0673, MviM, Predicted dehydrogenases and related proteins [General function prediction only].	2.09081e-61
CP034953.1\|QAA88435.1\|649390_649807_+\|type-II-toxin-antitoxin-system-antitoxin-HigA	gnl\|CDD\|227786	COG5499, COG5499, Predicted transcription regulator containing HTH domain [Transcription].	6.73706e-55
CP034953.1\|QAA88427.1\|641790_642342_+\|YgjV-family-protein	gnl\|CDD\|378474	pfam10688, Imp-YgjV, Bacterial inner membrane protein. This is a family of inner membrane proteins. Many of the members are YgjV protein.	8.39339e-62
CP034953.1\|QAA88436.1\|649851_651870_-\|NADPH-dependent-2,4-dienoyl-CoA-reductase	gnl\|CDD\|239240	cd02930, DCR_FMN, 2,4-dienoyl-CoA reductase (DCR) FMN-binding domain. DCR in E. coli is an iron-sulfur flavoenzyme which contains FMN, FAD, and a 4Fe-4S cluster. It is also a monomer, unlike that of its eukaryotic counterparts which form homotetramers and lack the flavin and iron-sulfur cofactors. Metabolism of unsaturated fatty acids requires auxiliary enzymes in addition to those used in b-oxidation. After a given number of cycles through the b-oxidation pathway, those unsaturated fatty acyl-CoAs with double bonds at even-numbered carbon positions contain 2-trans, 4-cis double bonds that can not be modified by enoyl-CoA hydratase. DCR utilizes NADPH to remove the C4-C5 double bond. DCR can catalyze the reduction of both natural fatty acids with cis double bonds, as well as substrates containing trans double bonds. The reaction is initiated by hybrid transfer from NADPH to FAD, which in turn transfers electrons, one at a time, to FMN via the 4Fe-4S cluster. The fully reduced FMN provides a hydrid ion to the C5 atom of substrate, and Tyr and His are proposed to form a catalytic dyad that protonates the C4 atom of the substrate and completes the reaction.	0
CP034953.1\|QAA88440.1\|657363_657813_-\|beta-galactosidase-subunit-beta	gnl\|CDD\|182302	PRK10202, ebgC, beta-galactosidase subunit beta.	6.45912e-94
CP034953.1\|QAA88431.1\|646302_646995_-\|vancomycin-high-temperature-exclusion-protein	gnl\|CDD\|225500	COG2949, SanA, Uncharacterized membrane protein [Function unknown].	1.24751e-136
CP034953.1\|QAA88437.1\|652295_654647_-\|alpha-glucosidase	gnl\|CDD\|236653	PRK10137, PRK10137, alpha-glucosidase; Provisional.	0
CP034953.1\|QAA88444.1\|662661_664152_-\|putrescine-aminotransferase	gnl\|CDD\|183175	PRK11522, PRK11522, putrescine--2-oxoglutarate aminotransferase; Provisional.	0
CP034953.1\|QAA88439.1\|655867_657301_-\|amino-acid-permease	gnl\|CDD\|237929	PRK15238, PRK15238, inner membrane transporter YjeM; Provisional.	1.55373e-41
CP034953.1\|QAA88434.1\|649079_649394_+\|mRNA-interferase-HigB	gnl\|CDD\|227025	COG4680, COG4680, Uncharacterized protein conserved in bacteria [Function unknown].	6.96177e-48
CP034953.1\|QAA88442.1\|661085_662069_-\|transcriptional-regulator-EbgR	gnl\|CDD\|182389	PRK10339, PRK10339, DNA-binding transcriptional repressor EbgR; Provisional.	0
CP034953.1\|QAA88446.1\|666132_666756_-\|PadR-family-transcriptional-regulator	gnl\|CDD\|224609	COG1695, COG1695, Predicted transcriptional regulators [Transcription].	1.3254e-30
CP034953.1\|QAA88432.1\|647071_647575_-\|M48-family-peptidase	gnl\|CDD\|224368	COG1451, COG1451, Predicted metal-dependent hydrolase [General function prediction only].	2.33097e-43
CP034953.1\|QAA88433.1\|647659_648796_+\|23S-rRNA-(guanine(1835)-N(2))-methyltransferase-RlmG	gnl\|CDD\|184963	PRK15001, PRK15001, 23S rRNA (guanine(1835)-N(2))-methyltransferase RlmG.	0
CP034953.1\|QAA88429.1\|643989_644955_-\|TerC-family-membrane-protein-Alx	gnl\|CDD\|274743	TIGR03718, R_switched_Alx, integral membrane protein, TerC family. Rfam model RF00080 describes a structured RNA element called the yybP-ykoY leader, or SraF, which may precede one or several genes in a genome. Members of this highly hydrophobic protein family often are preceded by a yybP-ykoY leader, which may serve as a riboswitch. From the larger group of TerC homologs (pfam03741), this subfamily contains TerC itself from Alcaligenes sp. plasmid IncHI2 pMER610 and from Proteus mirabilis. It also contains the alkaline-inducible E. coli protein Alx, which unlike the two TerC examples is preceded by a yybP-ykoY leader.	2.43296e-141
CP034953.1\|QAA88428.1\|642346_643591_-\|serine/threonine-transporter-SstT	gnl\|CDD\|184190	PRK13628, PRK13628, serine/threonine transporter SstT; Provisional.	0
CP034953.1\|QAA88443.1\|662287_662620_+\|tRNA-binding-protein	gnl\|CDD\|182232	PRK10089, PRK10089, chaperone CsaA.	7.63973e-49

>CP034953.1|QAA88436.1|649851_651870_-|NADPH-dependent-2,4-dienoyl-CoA-reductase
MSYPSLFAPLDLGFTTLKNRVLMGSMHTGLEEYPDGAERLAAFYAERARHGVALIVSGGIAPDLTGVGMEGGAMLNDASQIPHHRTITEAVHQEGGKIALQILHTGRYSYQPHLVAPSALQAPINRFVPHELSHEEILQLIDNFARCAQLAREAGYDGVEVMGSEGYLINEFLTLRTNQRSDQWGGDYRNRMRFAVEVVRAVRERVGNDFIIIYRLSMLDLVEDGGTFAETVELAQAIEAAGATIINTGIGWHEARIPTIATPVPRGAFSWVTRKLKGHVSLPLVTTNRINDPQVADDILSRGDADMVSMARPFLADAELLSKAQSGRADEINTCIGCNQACLDQIFVGKVTSCLVNPRACHETKMPILPAVQKKNLAVVGAGPAGLAFAINAAARGHQVTLFDAHSEIGGQFNIAKQIPGKEEFYETLRYYRRMIEVTGVTLKLNHTVTADQLQAFDETILASGIVPRTPPIDGIDHPKVLSYLDVLRDKAPVGNKVAIIGCGGIGFDTAMYLSQPGESTSQNIAGFCNEWGIDSSLQQAGGLSPQGMQIPRSPRQIVMLQRKASKPGQGLGKTTGWIHRTTLLSRGVKMIPGVSYQKIDDDGLHVVINGETQVLAVDNVVICAGQEPNRALAQPLIDSGKTVHLIGGCDVAMELDARRAIAQGTRLALEI
>CP034953.1|QAA88435.1|649390_649807_+|type-II-toxin-antitoxin-system-antitoxin-HigA
MIAIADILQAGEKLTAVAPFLAGIQNEEQYTQALELVDHLLLNDPENPLLDLVCAKITAWEESAPEFAEFNAMAQAMPGGIAVIRTLMDQYGLTLSDLPEIGSKSMVSRVLSGKRKLTLEHAKKLATRFGISPALFID
>CP034953.1|QAA88434.1|649079_649394_+|mRNA-interferase-HigB
MHLITQKALKDAAEKYPQHKTELVALGNTIAKGYFKKPESLKAVFPSLDNFKYLDKHYVFNVGGNELRVVAMVFFESQKCYIREVMTHKEYDFFTAVHRTKGKK
>CP034953.1|QAA88433.1|647659_648796_+|23S-rRNA-(guanine(1835)-N(2))-methyltransferase-RlmG
MSHLDNGFRSLTLQRFPATDDVNPLQAWEAADEYLLQQLDDTEIRGPVLILNDAFGALSCALAEHKPYSIGDSYISELATRENLRLNGIDESSVKFLDSTADYPQQPGVVLIKVPKTLALLEQQLRALRKVVTSDTRIIAGAKARDIHTSTLELFEKVLGPTTTTLAWKKARLINCTFNEPQLADAPQTVSWKLEGTDWTIHNHANVFSRTGLDIGARFFMQHLPENLEGEIVDLGCGNGVIGLTLLDKNPQAKVVFVDESPMAVASSRLNVETNMPEALDRCEFMINNALSGVEPFRFNAVLCNPPFHQQHALTDNVAWEMFHHARRCLKINGELYIVANRHLDYFHKLKKIFGNCTTIATNNKFVVLKAVKLGRRR
>CP034953.1|QAA88432.1|647071_647575_-|M48-family-peptidase
MSNLTYLQGYPEQLLSQVRTLINEQRLGDVLAKRYPGTHDYATDKALWQYTQDLKNQFLRNAPPINKVMYDNKIHVLKNALGLHTAVSRVQGGKLKAKVEIRVATVFRNAPEPFLRMIVVHELAHLKEKEHNKAFYQLCCHMEPQYHQLEFDTRLWLTQLSLGQNKI
>CP034953.1|QAA88431.1|646302_646995_-|vancomycin-high-temperature-exclusion-protein
MLRAFARLLLRICFSRRTLKIACLLLLVAGATILIADRVMVNASKQLTWSDVNAVPARNVGLLLGARPGNRYFTRRIDTAAALYHAGKVKWLLVSGDNGRKNYDEASGMQQALIAKGVPAKVIFCDYAGFSTLDSVVRAKKVFGENHITIISQEFHNQRAIWLAKQYGIDAIGFNAPDLNMKHGFYTQLREKLARVSAVIDAKILHRQPKYLGPSVMIGPFSEHGCPAQK
>CP034953.1|QAA88430.1|645237_646224_-|Gfo/Idh/MocA-family-oxidoreductase
MIRFAVIGTNWITRQFVEAAHESGKYKLTAVYSRSLEQAQHFANDFSVEHLFTSLEAMAESDAIDAVYIASPNSLHFSQTQLFLSHKINVICEKPLASNLAEVDAAIACARENQVVLFEAFKTACLPNFHLLRQALPKVGKLRKVFFNYCQYSSRYQRYLDGENPNTFNPAFSNGSIMDIGFYCLASAVALFGEPKSVQATASLLASGVDAQGVVVMDYGDFSVTLQHSKVSDSVLASEIQGEAGSLVIEKLSECQKVCFVPRGSQMQDLTQPQHINTMLYEAELFATLVDEHLVDHPGLAVSRITAKLLTEIRRQTGVIFPADSVKL
>CP034953.1|QAA88429.1|643989_644955_-|TerC-family-membrane-protein-Alx
MNTVGTPLLWGGFAVVVAIMLAIDLLLQGRRGAHAMTMKQAAAWSLVWVTLSLLFNAAFWWYLVQTEGRAVADPQALAFLTGYLIEKSLAVDNVFVWLMLFSYFSVPAALQRRVLVYGVLGAIVLRTIMIFTGSWLISQFDWILYIFGAFLLFTGVKMALAHEDESGIGDKPLVRWLRGHLRMTDTIDNEHFFVRKNGLLYATPLMLVLILVELSDVIFAVDSIPAIFAVTTDPFIVLTSNLFAILGLRAMYFLLAGVAERFSMLKYGLAVILVFIGIKMLIVDFYHIPIAVSLGVVFGILVMTFIINAWVNYRHDKQRGG
>CP034953.1|QAA88428.1|642346_643591_-|serine/threonine-transporter-SstT
MTTQRSPGLFRRLAHGSLVKQILVGLVLGILLAWISKPAAEAVGLLGTLFVGALKAVAPILVLMLVMASIANHQHGQKTNIRPILFLYLLGTFSAALAAVVFSFAFPSTLHLSSSAGDISPPSGIVEVMRGLVMSMVSNPIDALLKGNYIGILVWAIGLGFALRHGNETTKNLVNDMSNAVTFMVKLVIRFAPIGIFGLVSSTLATTGFSTLWGYAQLLVVLVGCMLLVALVVNPLLVWWKIRRNPFPLVLLCLRESGVYAFFTRSSAANIPVNMALCEKLNLDRDTYSVSIPLGATINMAGAAITITVLTLAAVNTLGIPVDLPTALLLSVVASLCACGASGVAGGSLLLIPLACNMFGISNDIAMQVVAVGFIIGVLQDSCETALNSSTDVLFTAAACQAEDDRLANSALRN
>CP034953.1|QAA88427.1|641790_642342_+|YgjV-family-protein
MTAYWLAQGVGVIAFLIGITTFFNRDERRFKKQLSVYSAVIGVHFFLLGTYPAGASAILNAIRTLITLRTRSLWVMAIFIVLTGGIGLAKFHHPVELLPVIGTIVSTWALFCCKGLTMRCVMWFSTCCWVIHNFWAGSIGGTMIEGSFLLMNGLNIIRFWRMQKRGIDPFKVEKTPSAVDERG
>CP034953.1|QAA88437.1|652295_654647_-|alpha-glucosidase
MKIKTILTPVTCALLISFSAHAANADNYKNVINRTGAPQYMKDYDYDDHQRFNPFFDLGAWHGHLLPDGPNTMGGFPGVALLTEEYINFMASNFDRLTVWQDGKKVDFTLEAYSIPGALVQKLTAKDVQVEMTLRFATPRTSLLETKITSNKPLDLVWDGELLEKLEAKEGKPLSDKTIAGEYPDYQRKISATRDGLKVTFGKVRATWDLLTSGESEYQVHKSLPVQTEINGNRFTSKAHINGSTTLYTTYSHLLTAQEVSKEQMQIRDILARPAFYLTASQQRWEEYLKKGLTNPDATPEQTRVAVKAIETLNGNWRSPGGAVKFNTVTPSVTGRWFSGNQTWPWDTWKQAFAMAHFNPDIAKENIRAVFSWQIQPGDSVRPQDVGFVPDLIAWNLSPERGGDGGNWNERNTKPSLAAWSVMEVYNVTQDKTWVAEMYPKLVAYHDWWLRNRDHNGNGVPEYGATRDKAHNTESGEMLFTVKKGDKEETQSGLNNYARVVEKGQYDSLEIPAQVAASWESGRDDAAVFGFIDKEQLDKYVANGGKRSDWTVKFAENRSQDGTLLGYSLLQESVDQASYMYSDNHYLAEMATILGKPEEAKRYRQLAQQLADYINTCMFDPTTQFYYDVRIEDKPLANGCAGKPIVERGKGPEGWSPLFNGAATQANADAVVKVMLDPKEFNTFVPLGTAALTNPAFGADIYWRGRVWVDQFWFGLKGMERYGYRDDALKLADTFFRHAKGLTADGPIQENYNPLTGAQQGAPNFSWSAAHLYMLYNDFFRKQ
>CP034953.1|QAA88438.1|654663_655734_-|protein-YgjJ
MKLITAPCRALLALPFCYAFSAAGEEARPAEHDDTKTPAITSTSSPSFRFYGELGVGGYMDLEGENKHKYSDGTYIEGGLEMKYGSWFGLIYGEGWTVQADHDGNAWVPDHSWGGFEGGINRFYGGYRTNDGTEIMLSLRQDSSLDDLQWWGDFTPDLGYVIPNTRDIMTALKVQNLSGNFRYSVTATPAGHHDESKAWLHFGKYDRYDDKYTYPAMMNGYIQYDLAEGITWMNGLEITDGTGQLYLTGLLTPNFAARAWHHTGRADGLDVPGSESGMMVSAMYEALKGVYLSTAYTYAKHRPDHADDETTSFMQFGIWYEYGGGRFATAFDSRFYMKNASHDPSDQIFLMQYFYW
>CP034953.1|QAA88439.1|655867_657301_-|amino-acid-permease
MSDTKRNTIGKFGLLSLTFAAVYSFNNVINNNIELGLASAPMFFLATIFYFIPFCLIIAEFVSLNKNSEAGVYAWVKSSLGGRWAFITAYTYWFVNLFFFTSLLPRVIAYASYAFLGYEYIMTPVATTIISMVLFAFSTWVSTNGAKMLGPITSVTSTLMLLLTLSYILLAGTALVGGVQPADAITVDAMIPNFNWAFLGVTTWIFMAAGGAESVAVYVNDVKGGSKSFVKVIILAGIFIGVLYSVSSVLINVFVSSKELKFTGGSVQVFHGMAAYFGLPEALMNRFVGLVSFTAMFGSLLMWTATPVKIFFSEIPEGIFGKKTVELNENGVPARAAWIQFLIVIPLMIIPMLGSNTVQDLMNTIINMTAAASMLPPLFIMLAYLNLRAKLDHLPRDFRMGSRRTGIIVVSMLIAIFAVGFVASTFPTGANILTIIFYNVGGIVIFLGFAWWKYSKYIKGLTAEERHIEATPASNVD
>CP034953.1|QAA88440.1|657363_657813_-|beta-galactosidase-subunit-beta
MRIIDNLEQFRQIYASGKKWQRCVEAIENIDNIQPGVAHSIGDSLTYRVETDSATDALFTGHRRYFEVHYYLQGQQKIEYAPKETLQVVEYYRDETDREYLKGCGETVEVHEGQIVICDIHEAYRFICNNAVKKVVLKVTIEDGYFHNK
>CP034953.1|QAA88441.1|657809_660902_-|beta-galactosidase-subunit-alpha
MNRWENIQLTHENRLAPRAYFFSYDSVAQARTFARETSSLFLPLSGQWNFHFFDHPLQVPEAFTSELMADWGHITVPAMWQMEGHGKLQYTDEGFPFPIDVPFVPSDNPTGAYQRIFTLSDGWQGKQTLIKFDGVETYFEVYVNGQYVGFSKGSRLTAEFDISAMVKTGDNLLCVRVMQWADSTYVEDQDMWWSAGIFRDVYLVGKHLTHINDFTVRTDFDEAYCDATLSCEVVLENLAASPVVTTLEYTLFDGERVVHSSAIDHLAIEKLTSASFAFTVEQPQQWSAESPYLYHLVMTLKDANGNVLEVVPQRVGFRDIKVRDGLFWINNRYVMLHGVNRHDNDHRKGRAVGMDRVEKDLQLMKQHNINSVRTAHYPNDPRFYELCDIYGLFVMAETDVESHGFANVGDISRITDDPQWEKVYVERIVRHIHAQKNHPSIIIWSLGNESGYGCNIRAMYHAAKALDDTRLVHYEEDRDAEVVDIISTMYTRVPLMNEFGEYPHPKPRIICEYAHAMGNGPGGLTEYQNVFYKHDCIQGHYVWEWCDHGIQAQDDHGNVWYKFGGDYGDYPNNYNFCLDGLIYSDQTPGPGLKEYKQVIAPVKIHARDLTRGELKVENKLWFTTLDDYTLHAEVRAEGETLATQQIKLRDVAPNSEAPLQITLPQLDAREAFLNITVTKDSRTRYSEAGHPIATYQFPLKENTAQPVPFAPNNARPLTLEDDRLSCTVRGYNFAITFSKMSGKPTSWQVNGESLLTREPKINFFKPMIDNHKQEYEGLWQPNHLQIMQEHLRDFAVEQSDGEVLIISRTVIAPPVFDFGMRCTYIWRIAADGQVNVALSGERYGDYPHIIPCIGFTMGINGEYDQVAYYGRGPGENYADSQQANIIDIWRSTVDAMFENYPFPQNNGNRQHVRWTALTNRHGNGLLVVPQRPINFSAWHYTQENIHAAQHCNELQRSDDITLNLDHQLLGLGSNSWGSEVLDSWRVWFRDFSYGFTLLPVSGGEATAQSLASYEFGAGFFSTNLHSENKQ
>CP034953.1|QAA88442.1|661085_662069_-|transcriptional-regulator-EbgR
MATLKDIAIEAGVSLATVSRVLNDDPTLNVKEETKHRILEIAEKLEYKTSSARKLQTGAVNQHHILAIYSYQQELEINDPYYLAIRHGIETQCEKLGIELTNCYEHSGLPDIKNVTGILIVGKPTPALRAAASALTDNICFIDFHEPGSGYDAVDIDLARISKEIIDFYINQGVNRIGFIGGEDEPGKADIREVAFAEYGRLKQVVREEDIWRGGFSSSSGYELAKQMLAREDYPKALFVASDSIAIGVLRAIHERGLNIPQDISLISVNDIPTARFTFPPLSTVRIHSEMMGSQGVNLVYEKARDGRALPLLVFVPSKLKLRGTTR
>CP034953.1|QAA88443.1|662287_662620_+|tRNA-binding-protein
METVAYADFARLEMRVGKIVEVKRHENADKLYIVQVDVGQKTLQTVTSLVPYYSEEELMGKTVVVLCNLQKAKMRGETSECMLLCAETDDGSESVLLTPERMMPAGVRVV
>CP034953.1|QAA88444.1|662661_664152_-|putrescine-aminotransferase
MITEFVFIPIFAIAAGVAQSLQYLNRYHVIREPPEHILNRLPSSASALACSAHALNLIEKRTLDHEEMKALNREVIEYFKEHVNPGFLEYRKSVTAGGDYGAVEWQAGSLNTLVDTQGQEFIDCLGGFGIFNVGHRNPVVVSAVQNQLAKQPLHSQELLDPLRAMLAKTLAALTPGKLKYSFFCNSGTESVEAALKLAKAYQSPRGKFTFIATSGAFHGKSLGALSATAKSTFRKPFMPLLPGFRHVPFGNIEAMRTALNECKKTGDDVAAVILEPIQGEGGVILPPPGYLTAVRKLCDEFGALMILDEVQTGMGRTGKMFACEHENVQPDILCLAKALGGGVMPIGATIATEEVFSVLFDNPFLHTTTFGGNPLACAAALATINVLLEQNLPAQAEQKGDMLLDGFRQLAREYPDLVQEARGKGMLMAIEFVDNEIGYNFASEMFRQRVLVAGTLNNAKTIRIEPPLTLTIEQCELVIKAARKALAAMRVSVEEA
>CP034953.1|QAA88445.1|664458_665979_+|PAS-domain-S-box-protein
MSSHPYVTQQNTPLADDTTLMSTTDLQSYITHANDTFVQVSGYTLQELQGQPHNMVRHPDMPKAAFADMWFTLKKGEPWSGIVKNRRKNGDHYWVRANAVPMVREGKISGYMSIRTRATDEEIAAVEPLYKALNAGRTSKRIHKGLVVRKGWLGKLPSLPLRWRARGVMTLMFILLAAMLWFVAAPVVTYILCALVVLLASACFEWQIVRPIENVAHQALKVATGERNSVEHLNRSDELGLTLRAVGQLGLMCRWLINDVSSQVSSVRNGSETLAKGTDELNEHTQQTVDNVQQTVATMNQMAASVKQNSATASAADKLSITASNAAVQGGEAMTTVIKTMDDIADSTQRIGTITSLINDIAFQTNILALNAAVEAARAGEQGKGFAVVAGEVRHLASRSANAANDIRKLIDASADKVQSGSQQVHAAGRTMEDIVAQVKNVTQLIAQISHSTLEQADGLSSLTRAVDELNLITQKNAELVEESAQVSAMVKHRASRLEDAVTVLH
>CP034953.1|QAA88446.1|666132_666756_-|PadR-family-transcriptional-regulator
MSHHHEGCCKHEGQPRHEGCCKGEKSEHEHCGHGHQHEHGQCCGGRHGRGGGRRQRFFGHGELRLVILDILSRDDSHGYELIKAIENLTQGNYTPSPGVIYPTLDFLQEQSLITIREEEGGKKQIALTEQGAQWLEENREQVEMIEERIKARCVGAALRQNPQMKRALDNFKAVLDLRVNQSDISDAQIKKIIAVIDRAAFDITQLD

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP034953_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_2

980239-980632

Unclear

I-E

Consensus_repeat	Method
GTGTTCCCCGCGCCAGCGGGGATAAACC	PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACC	CRISPRCasFinder
GTGTTCCCCGCGCCAGCGGGGATAAACC	CRT

6 spacers

The CRISPR arrays of CP034953_2

>merge|CP034953|2|980239-980632|PILER-CR,CRISPRCasFinder,CRT
GTGTTCCCCGCGCCAGCGGGGATAAACCGGCAAAAACCGGGCAATCGCAAAAAGGCGTAATGTGTTCCCCGCGCCAGCGGGGATAAACCTGTGTTTGCGGCATTAACGCTCACCAGCATTTCGTGTTCCCCGCGCCAGCGGGGATAAACCGACGTGGTCATGGGTGCTGCTGTTGCAGAGCCAGTGTTCCCCGCGCCAGCGGGGATAAACCGAGCAGATACACGGCTTTGTATTCCGTGCGCCCGTGTTCCCCGCGCCAGCGGGGATAAACCGAATAGCAATAGTCCATAGATTTGCGAAAACAGGTGTTCCCCGCGCCAGCGGGGATAAACCGGAGCCTGACGAGACTACTGAGGCCGTTCTGTCGAGTTCCCCGCGCCAGCGGGGATAAACC

>CP034953|2|1|980239-980632|PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGCAAAAACCGGGCAATCGCAAAAAGGCGTAAT
GTGTTCCCCGCGCCAGCGGGGATAAACC	TGTGTTTGCGGCATTAACGCTCACCAGCATTTC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GACGTGGTCATGGGTGCTGCTGTTGCAGAGCCA
GTGTTCCCCGCGCCAGCGGGGATAAACC	GAGCAGATACACGGCTTTGTATTCCGTGCGCCC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GAATAGCAATAGTCCATAGATTTGCGAAAACAG
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGAGCCTGACGAGACTACTGAGGCCGTTCTGTC
GAGTTCCCCGCGCCAGCGGGGATAAACC

>CP034953|2|2|980239-980632|CRISPRCasFinder
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGCAAAAACCGGGCAATCGCAAAAAGGCGTAAT
GTGTTCCCCGCGCCAGCGGGGATAAACC	TGTGTTTGCGGCATTAACGCTCACCAGCATTTC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GACGTGGTCATGGGTGCTGCTGTTGCAGAGCCA
GTGTTCCCCGCGCCAGCGGGGATAAACC	GAGCAGATACACGGCTTTGTATTCCGTGCGCCC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GAATAGCAATAGTCCATAGATTTGCGAAAACAG
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGAGCCTGACGAGACTACTGAGGCCGTTCTGTC
GAGTTCCCCGCGCCAGCGGGGATAAACC

>CP034953|2|1|980239-980632|CRT
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGCAAAAACCGGGCAATCGCAAAAAGGCGTAAT
GTGTTCCCCGCGCCAGCGGGGATAAACC	TGTGTTTGCGGCATTAACGCTCACCAGCATTTC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GACGTGGTCATGGGTGCTGCTGTTGCAGAGCCA
GTGTTCCCCGCGCCAGCGGGGATAAACC	GAGCAGATACACGGCTTTGTATTCCGTGCGCCC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GAATAGCAATAGTCCATAGATTTGCGAAAACAG
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGAGCCTGACGAGACTACTGAGGCCGTTCTGTC
GAGTTCCCCGCGCCAGCGGGGATAAACC

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA88720.1\|988866_989727_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|224936
CP034953.1\|QAA88717.1\|985227_986682_+\|FAD-linked-oxidoreductase	unknown	unknown	gnl\|CDD\|223354
CP034953.1\|QAA88718.1\|986775_988113_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
CP034953.1\|QAA88714.1\|979227_979899_+\|7-carboxy-7-deazaguanine-synthase-QueE	unknown	unknown	gnl\|CDD\|275126
CP034953.1\|QAA88711.1\|974979_976617_+\|CTP-synthase-(glutamine-hydrolyzing)	unknown	unknown	gnl\|CDD\|235437
CP034953.1\|QAA91862.1\|984372_985158_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|187605
CP034953.1\|QAA88713.1\|978948_979089_-\|hypothetical-protein	unknown	unknown	unknown
CP034953.1\|QAA88707.1\|969964_971238_+\|IS3-like-element-IS2-family-transposase	unknown	unknown	gnl\|CDD\|181829
CP034953.1\|QAA88709.1\|973554_973890_+\|endoribonuclease-MazF	unknown	unknown	gnl\|CDD\|182138
CP034953.1\|QAA88712.1\|976704_978003_+\|phosphopyruvate-hydratase	unknown	unknown	gnl\|CDD\|234617
CP034953.1\|QAA88706.1\|968309_969611_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	unknown	unknown	gnl\|CDD\|237291
CP034953.1\|QAA88705.1\|965496_968253_-\|two-component-sensor-histidine-kinase-BarA	unknown	unknown	gnl\|CDD\|236848
CP034953.1\|QAA88719.1\|988090_988870_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	unknown	unknown	gnl\|CDD\|224997
CP034953.1\|QAA88723.1\|990717_991989_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
CP034953.1\|QAA88721.1\|989874_990450_-\|glycerol-3-phosphate-responsive-antiterminator	unknown	unknown	gnl\|CDD\|224865
CP034953.1\|QAA88722.1\|990466_990727_-\|ferredoxin-family-protein	unknown	unknown	gnl\|CDD\|225289
CP034953.1\|QAA88715.1\|981271_982750_-\|sugar-kinase	unknown	unknown	gnl\|CDD\|212662
CP034953.1\|QAA88710.1\|973960_974752_+\|nucleoside-triphosphate-pyrophosphohydrolase	unknown	unknown	gnl\|CDD\|236569
CP034953.1\|QAA88708.1\|973306_973555_+\|MazF-MazE-toxin-antitoxin-system-antitoxin-MazE	unknown	unknown	gnl\|CDD\|182082
CP034953.1\|QAA88716.1\|982776_984054_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|349949

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA88720.1\|988866_989727_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|224936	COG2025, FixB, Electron transfer flavoprotein, alpha subunit [Energy production and conversion].	7.42017e-90
CP034953.1\|QAA88717.1\|985227_986682_+\|FAD-linked-oxidoreductase	gnl\|CDD\|223354	COG0277, GlcD, FAD/FMN-containing dehydrogenases [Energy production and conversion].	2.73778e-83
CP034953.1\|QAA88714.1\|979227_979899_+\|7-carboxy-7-deazaguanine-synthase-QueE	gnl\|CDD\|275126	TIGR04322, organic_radical_activating_enzyme, putative 7-cyano-7-deazaguanosine (preQ0) biosynthesis protein QueE. Members of this radical SAM domain protein family appear to be the E. coli form of the queuosine biosynthesis protein QueE. QueE is involved in making preQ0 (7-cyano-7-deazaquanine), a precursor of both the bacterial/eukaryotic modified tRNA base queuosine and the archaeal modified base archaeosine. Members occur in species that lack known forms of QueE but usually are not found in queuosine biosynthesis operons. Members of this family tend to form bi-directional best hit matches to members of known (TIGR03365) and putative (TIGR03963) QueE families from other lineages.	3.98248e-155
CP034953.1\|QAA88711.1\|974979_976617_+\|CTP-synthase-(glutamine-hydrolyzing)	gnl\|CDD\|235437	PRK05380, pyrG, CTP synthetase; Validated.	0
CP034953.1\|QAA91862.1\|984372_985158_+\|SDR-family-oxidoreductase	gnl\|CDD\|187605	cd05347, Ga5DH-like_SDR_c, gluconate 5-dehydrogenase (Ga5DH)-like, classical (c) SDRs. Ga5DH catalyzes the NADP-dependent conversion of carbon source D-gluconate and 5-keto-D-gluconate. This SDR subgroup has a classical Gly-rich NAD(P)-binding motif and a conserved active site tetrad pattern. However, it has been proposed that Arg104 (Streptococcus suis Ga5DH numbering), as well as an active site Ca2+, play a critical role in catalysis. In addition to Ga5DHs this subgroup contains Erwinia chrysanthemi KduD which is involved in pectin degradation, and is a putative 2,5-diketo-3-deoxygluconate dehydrogenase. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase (15-PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, 15-PGDH numbering) and/or an Asn (Asn-107,15-PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	7.96451e-139
CP034953.1\|QAA88718.1\|986775_988113_+\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	3.74708e-50
CP034953.1\|QAA88707.1\|969964_971238_+\|IS3-like-element-IS2-family-transposase	gnl\|CDD\|181829	PRK09409, PRK09409, IS2 transposase TnpB; Reviewed.	0
CP034953.1\|QAA88709.1\|973554_973890_+\|endoribonuclease-MazF	gnl\|CDD\|182138	PRK09907, PRK09907, endoribonuclease MazF.	1.17475e-74
CP034953.1\|QAA88712.1\|976704_978003_+\|phosphopyruvate-hydratase	gnl\|CDD\|234617	PRK00077, eno, enolase; Provisional.	0
CP034953.1\|QAA88706.1\|968309_969611_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	gnl\|CDD\|237291	PRK13168, rumA, 23S rRNA (uracil(1939)-C(5))-methyltransferase RlmD.	0
CP034953.1\|QAA88705.1\|965496_968253_-\|two-component-sensor-histidine-kinase-BarA	gnl\|CDD\|236848	PRK11107, PRK11107, hybrid sensory histidine kinase BarA; Provisional.	0
CP034953.1\|QAA88719.1\|988090_988870_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	gnl\|CDD\|224997	COG2086, FixA, Electron transfer flavoprotein, beta subunit [Energy production and conversion].	1.56693e-62
CP034953.1\|QAA88723.1\|990717_991989_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	5.03655e-125
CP034953.1\|QAA88721.1\|989874_990450_-\|glycerol-3-phosphate-responsive-antiterminator	gnl\|CDD\|224865	COG1954, GlpP, Glycerol-3-phosphate responsive antiterminator (mRNA-binding) [Transcription].	5.83077e-88
CP034953.1\|QAA88722.1\|990466_990727_-\|ferredoxin-family-protein	gnl\|CDD\|225289	COG2440, FixX, Ferredoxin-like protein [Energy production and conversion].	7.43419e-42
CP034953.1\|QAA88715.1\|981271_982750_-\|sugar-kinase	gnl\|CDD\|212662	cd07779, FGGY_ygcE_like, uncharacterized ygcE-like proteins. This subfamily consists of uncharacterized hypothetical bacterial proteins with similarity to Escherichia coli sugar kinase ygcE , whose functional roles are not yet clear. Escherichia coli ygcE is recognized by this model, but is not present in the alignment as it contains a deletion relative to other members of the group. These proteins belong to the FGGY family of carbohydrate kinases, the monomers of which contain two large domains, which are separated by a deep cleft that forms the active site. This model includes both the N-terminal domain, which adopts a ribonuclease H-like fold, and the structurally related C-terminal domain.	1.27376e-109
CP034953.1\|QAA88710.1\|973960_974752_+\|nucleoside-triphosphate-pyrophosphohydrolase	gnl\|CDD\|236569	PRK09562, mazG, nucleoside triphosphate pyrophosphohydrolase; Reviewed.	8.97718e-160
CP034953.1\|QAA88708.1\|973306_973555_+\|MazF-MazE-toxin-antitoxin-system-antitoxin-MazE	gnl\|CDD\|182082	PRK09798, PRK09798, MazF-MazE toxin-antitoxin system antitoxin MazE.	6.19513e-48
CP034953.1\|QAA88716.1\|982776_984054_-\|MFS-transporter	gnl\|CDD\|349949	cd06174, MFS, Major Facilitator Superfamily. The Major Facilitator Superfamily (MFS) is a large and diverse group of secondary transporters that includes uniporters, symporters, and antiporters. MFS proteins facilitate the transport across cytoplasmic or internal membranes of a variety of substrates including ions, sugar phosphates, drugs, neurotransmitters, nucleosides, amino acids, and peptides. They do so using the electrochemical potential of the transported substrates. Uniporters transport a single substrate, while symporters and antiporters transport two substrates in the same or in opposite directions, respectively, across membranes. MFS proteins are typically 400 to 600 amino acids in length, and the majority contain 12 transmembrane alpha helices (TMs) connected by hydrophilic loops. The N- and C-terminal halves of these proteins display weak similarity and may be the result of a gene duplication/fusion event. Based on kinetic studies and the structures of a few bacterial superfamily members, GlpT (glycerol-3-phosphate transporter), LacY (lactose permease), and EmrD (multidrug transporter), MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement. Bacterial members function primarily for nutrient uptake, and as drug-efflux pumps to confer antibiotic resistance. Some MFS proteins have medical significance in humans such as the glucose transporter Glut4, which is impaired in type II diabetes, and glucose-6-phosphate transporter (G6PT), which causes glycogen storage disease when mutated.	1.60446e-29

>CP034953.1|QAA88714.1|979227_979899_+|7-carboxy-7-deazaguanine-synthase-QueE
MQYPINEMFQTLQGEGYFTGVPAIFIRLQGCPVGCAWCDTKHTWEKLEDREVSLFSILAKTKESDKWGAASSEDLLAVIGRQGYTARHVVITGGEPCIHDLLPLTDLLEKNGFSCQIETSGTHEVRCTPNTWVTVSPKLNMRGGYEVLSQALERANEIKHPVGRVRDIEALDELLATLTDDKPRVIALQPISQKDDATRLCIETCIARNWRLSMQTHKYLNIA
>CP034953.1|QAA88713.1|978948_979089_-|hypothetical-protein
MSEENKENGFNHVKTFTKIIFIFSVLVFNDNEYKITDAAVNLFIQI
>CP034953.1|QAA88712.1|976704_978003_+|phosphopyruvate-hydratase
MSKIVKIIGREIIDSRGNPTVEAEVHLEGGFVGMAAAPSGASTGSREALELRDGDKSRFLGKGVTKAVAAVNGPIAQALIGKDAKDQAGIDKIMIDLDGTENKSKFGANAILAVSLANAKAAAAAKGMPLYEHIAELNGTPGKYSMPVPMMNIINGGEHADNNVDIQEFMIQPVGAKTVKEAIRMGSEVFHHLAKVLKAKGMNTAVGDEGGYAPNLGSNAEALAVIAEAVKAAGYELGKDITLAMDCAASEFYKDGKYVLAGEGNKAFTSEEFTHFLEELTKQYPIVSIEDGLDESDWDGFAYQTKVLGDKIQLVGDDLFVTNTKILKEGIEKGIANSILIKFNQIGSLTETLAAIKMAKDAGYTAVISHRSGETEDATIADLAVGTAAGQIKTGSMSRSDRVAKYNQLIRIEEALGEKAPYNGRKEIKGQA
>CP034953.1|QAA88711.1|974979_976617_+|CTP-synthase-(glutamine-hydrolyzing)
MTTNYIFVTGGVVSSLGKGIAAASLAAILEARGLNVTIMKLDPYINVDPGTMSPIQHGEVFVTEDGAETDLDLGHYERFIRTKMSRRNNFTTGRIYSDVLRKERRGDYLGATVQVIPHITNAIKERVLEGGEGHDVVLVEIGGTVGDIESLPFLEAIRQMAVEIGREHTLFMHLTLVPYMAASGEVKTKPTQHSVKELLSIGIQPDILICRSDRAVPANERAKIALFCNVPEKAVISLKDVDSIYKIPGLLKSQGLDDYICKRFSLNCPEANLSEWEQVIFEEANPVSEVTIGMVGKYIELPDAYKSVIEALKHGGLKNRVSVNIKLIDSQDVETRGVEILKGLDAILVPGGFGYRGVEGMITTARFARENNIPYLGICLGMQVALIDYARHVANMENANSTEFVPDCKYPVVALITEWRDENGNVEVRSEKSDLGGTMRLGAQQCQLVDDSLVRQLYNAPTIVERHRHRYEVNNMLLKQIEDAGLRVAGRSGDDQLVEIIEVPNHPWFVACQFHPEFTSTPRDGHPLFAGFVKAASEFQKRQAK
>CP034953.1|QAA88710.1|973960_974752_+|nucleoside-triphosphate-pyrophosphohydrolase
MNQIDRLLTIMQRLRDPENGCPWDKEQTFATIAPYTLEETYEVLDAIAREDFDDLRGELGDLLFQVVFYAQMAQEEGRFDFNDICAAISDKLERRHPHVFADSSAENSSEVLARWEQIKTEERAQKAQHSALDDIPRSLPALMRAQKIQKRCANVGFDWTTLGPVVDKVYEEIDEVMYEARQAVVDQAKLEEEMGDLLFATVNLARHLGTKAEIALQKANEKFERRFREVERIVAARGLEMTGVDLETMEEVWQQVKRQEIDL
>CP034953.1|QAA88709.1|973554_973890_+|endoribonuclease-MazF
MVSRYVPDMGDLIWVDFDPTKGSEQAGHRPAVVLSPFMYNNKTGMCLCVPCTTQSKGYPFEVVLSGQERDGVALADQVKSIAWRARGATKKGTVAPEELQLIKAKINVLIG
>CP034953.1|QAA88708.1|973306_973555_+|MazF-MazE-toxin-antitoxin-system-antitoxin-MazE
MIHSSVKRWGNSPAVRIPATLMQALNLNIDDEVKIDLVDGKLIIEPVRKEPVFTLAELVNDITPENLHENIDWGEPKDKEVW
>CP034953.1|QAA88707.1|969964_971238_+|IS3-like-element-IS2-family-transposase
MIVLILVFRLVIGEQMIDVLGPEKRRRRTTQEKIAIVQQSFEPGMTVSLVARQHGVAASQLFLWRKQYQEGSLTAVAAGEQVVPASELAAAMKQIKELQRLLGKKTMENELLKEAVEYGRGKKVDSARALIARGWGVSLVSRCLRVSRAQLHVILRRTDDWMDGRRSRHTDDTDVLLRIHHVIGELPTYGYRRVWALLRRQAELDGMPAINAKRVYRIMRQNALLLERKPAVPPSKRAHTGRVAVKESNQRWCSDGFEFCCDNGERLRVTFALDCCDREALHWAVTTGGFNSETVQDVMLGAVERRFGNDLPSSPVEWLTDNGSCYRANETRQFARMLGLEPKNTAVRSPESNGIAESFVKTIKRDYISIMPKPDGLTAAKNLAEAFEHYNEWHPHSALGYRSPREYLRQRACNGLSDNRCLEI
>CP034953.1|QAA88706.1|968309_969611_+|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD
MAQFYSAKRRTTTRQIITVSVNDLDSFGQGVARHNGKTLFIPGLLPQENAEVTVTEDKKQYARAKVVRRLSDSPERETPRCPHFGVCGGCQQQHASVDLQQRSKSAALARLMKHDVSEVIADVPWGYRRRARLSLNYLPKTQQLQMGFRKAGSSDIVDVKQCPILAPQLEALLPKVRACLGSLQAMRHLGHVELVQATSGTLMILRHTAPLSSADREKLERFSHSEGLDLYLAPDSEILETVSGEMPWYDSNGLRLTFSPRDFIQVNAGVNQKMVARALEWLDVQPEDRVLDLFCGMGNFTLPLATQAASVVGVEGVPALVEKGQQNARLNGLQNVTFYHENLEEDVTKQPWAKNGFDKVLLDPARAGAAGVMQQIIKLEPIRIVYVSCNPATLARDSEALLKAGYTIARLAMLDMFPHTGHLESMVLFSRVK
>CP034953.1|QAA88705.1|965496_968253_-|two-component-sensor-histidine-kinase-BarA
MTNYSLRARMMILILAPTVLIGLLLSIFFVVHRYNDLQRQLEDAGASIIEPLAVSTEYGMSLQNRESIGQLISVLHRRHSDIVRAISVYDENNRLFVTSNFHLDPSSMQLGSNVPFPRQLTVTRDGDIMILRTPIISESYSPDESPSSDAKNSQNMLGYIALELDLKSVRLQQYKEIFISSVMMLFCIGIALIFGWRLMRDVTGPIRNMVNTVDRIRRGQLDSRVEGFMLGELDMLKNGINSMAMSLAAYHEEMQHNIDQATSDLRETLEQMEIQNVELDLAKKRAQEAARIKSEFLANMSHELRTPLNGVIGFTRLTLKTELTPTQRDHLNTIERSANNLLAIINDVLDFSKLEAGKLILESIPFPLRSTLDEVVTLLAHSSHDKGLELTLNIKSDVPDNVIGDPLRLQQIITNLVGNAIKFTENGNIDILVEKRALSNTKVQIEVQIRDTGIGIPERDQSRLFQAFRQADASISRRHGGTGLGLVITQKLVNEMGGDISFHSQPNRGSTFWFHINLDLNPNIIIEGPSTQCLAGKRLAYVEPNSAAAQCTLDILSETPLEVVYSPTFSALPPAHYDMMLLGIAVTFREPLTMQHERLAKAVSMTDFLMLALPCHAQVNAEKLKQDGIGACLLKPLTPTRLLPALTEFCHHKQNTLLPVTDESKLAMTVMAVDDNPANLKLIGALLEDMVQHVELCDSGHQAVERAKQMPFDLILMDIQMPDMDGIRACELIHQLPHQQQTPVIAVTAHAMAGQKEKLLGAGMSDYLAKPIEEERLHNLLLRYKPGSGISSRVVTPEVNEIVVNPNATLDWQLALRQAAGKTDLARDMLQMLLDFLPEVRNKVEEQLVGENPEGLVDLIHKLHGSCGYSGVPRMKNLCQLIEQQLRSGTKEEDLEPELLELLDEMDNVAREASKILG
>CP034953.1|QAA88715.1|981271_982750_-|sugar-kinase
MSKKYIIGIDGGSQSTKVVMYDLEGNVVCEGKGLLQPMHTPDADTAEHPDDDLWASLCFAGHDLMSQFAGNKEDIVGIGLGSIRCCRALLKADGTPAAPLISWQDARVTRPYEHTNPDVAYVTSFSGYLTHRLTGEFKDNIANYFGQWPVDYKSWAWSEDAAVMDKFNIPRHMLFDVQMPGTVLGHITPQAALATHFPAGLPVVCTTSDKPVEALGAGLLDDETAVISLGTYIALMMNGKALPKDPVAYWPIMSSIPQTLLYEGYGIRKGMWTVSWLRDMLGESLIQDARAQDLSPEDLLNKKASCVPPGCNGLMTVLDWLTNPWEPYKRGIMIGFDSSMDYAWIYRSILESVALTLKNNYDNMCNEMNHFAKHVIITGGGSNSDLFMQIFADVFNLPARRNAINGCASLGAAINTAVGLGLYPDYATAVDNMVRVKDIFIPIESNAKRYDAMNKGIFKDLTKHTDVILKKSYEVMHGELGNVDSIQSWSNA
>CP034953.1|QAA88716.1|982776_984054_-|MFS-transporter
MQHNSYRRWITLAIISFSGGVSFDLAYLRYIYQIPMAKFMGFSNTEIGLIMSTFGIAAIILYAPSGVIADKFSHRKMITSAMIITGLLGLLMATYPPLWVMLCIQIAFAITTILMLWSVSIKAASLLGDHSEQGKIMGWMEGLRGVGVMSLAVFTMWVFSRFAPDDSTSLKTVIIIYSVVYILLGILCWFFVSDNNNLRSANNEEKQSFQLSDILAVLRISTTWYCSMVIFGVFTIYAILSYSTNYLTEMYGMSLVAASYMGIVINKIFRALCGPLGGIITTYSKVKSPTRVIQILSVLGLLTLTALLVTNSNPQSVAMGIGLILLLGFTCYASRGLYWACPGEARTPSYIMGTTVGICSVIGFLPDVFVYPIIGHWQDTLPAAEAYRNMWLMGMAALGMVIVFTFLLFQKIRTADSAPAMASSK
>CP034953.1|QAA91862.1|984372_985158_+|SDR-family-oxidoreductase
MSIESLNAFSMDFFSLKGKTAIVTGGNSGLGQAFAMALAKAGANIFIPSFVKDNGETKEMIEKQGVEVDFMQVGITAEGAPQKIIAACCERFGTVDILVNNAGICKLNKVLDFGRADWDPMIDVNLTAAFELSYEAAKIMIPQKSGKIINICSLFSYLGGQWSPAYSATKHALAGFTKAYCDELGQYNIQVNGIAPGYYATDITLATRSNPETNQRVLDHIPANRWGDTQDLMGAAVFLASPASNYVNGHLLVVDGGYLVR
>CP034953.1|QAA88717.1|985227_986682_+|FAD-linked-oxidoreductase
MSLSRAAIVDQLKEIVGADRVITDETVLKKNSIDRFRKFPDIHGIYTLPIPAAVVKLGSTEQVSRVLNFMNAHKINGVPRTGASATEGGLETVVENSVVLDGSAMNQIINIDIENMQATAQCGVPLEVLENALREKGYTTGHSPQSKPLAQMGGLVATRSIGQFSTLYGAIEDMVVGLEAVLADGTVTRIKNVPRRAAGPDIRHIIIGNEGALCYITEVTVKIFKFTPENNLFYGYILEDMKTGFNILREIMVEGYRPSIARLYDAEDGTQHFTHFADGKCVLIFMAEGNPRIAKVTGEGIAEIVARYPQCQRVDSKLIETWFNNLNWGPDKVAAERVQILKTGNMGFTTEVSGCWSCIHEIYESVINRIRTEFPHADDITMLGGHSSHSYQNGTNMYFVYDYNVVDCKPEEEIDKYHNPLNKIICEETIRLGGSMVHHHGIGKHRVHWSKLEHGSAWALLEGLKKQFDPNGIMNTGTIYPIEK
>CP034953.1|QAA88718.1|986775_988113_+|MFS-transporter
MNTSPVRMDDLPLNRFHCRIAALTFGAHLTDGYVLGVIGYAIIQLTPAMQLTPFMAGMIGGSALLGLFLGSLVLGWISDHIGRQKIFTFSFLLITLASFLQFFATTPEHLIGLRILIGIGLGGDYSVGHTLLAEFSPRRHRGILLGAFSVVWTVGYVLASIAGHHFISENPEAWRWLLASAALPALLITLLRWGTPESPRWLLRQGRFAEAHAIVHRYFGPHVLLGDEVVTATHKHIKTLFSSRYWRRTAFNSVFFVCLVIPWFVIYTWLPTIAQTIGLEDALTASLMLNALLIVGALLGLVLTHLLAHRKFLLGSFLLLAATLVVMACLPSGSSLTLLLFVLFSTTISAVSNLVGILPAESFPTDIRSLGVGFATAMSRLGAAVSTGLLPWVLAQWGMQVTLLLLATVLLVGFVVTWLWAPETKALPLVAAGNVGGANEHSVSV
>CP034953.1|QAA88719.1|988090_988870_+|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein
MNILLAFKAEPDAGMLAEKEWQAAAQGKSGPDISLLRSLLGADEQAAAALLLAQRKNGTPMSLTALSMGDERALHWLRYLMALGFEEAVLLETAADLRFAPEFVARHIAEWQHQNPLDLIITGCQSSEGQNGQTPFLLAEMLGWPCFTQVERFTLDALFITLEQRTEHGLRCCRVRLPAVIAVRQCGEVALPVPGMRQRMAAGKAEIIRKTVAAEMPAMQCLQLARAEQRRGATLIDGQTVAEKAQKLWQDYLRQRMQP
>CP034953.1|QAA88720.1|988866_989727_+|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MNIAIVTINQENAAIASWLAAQDFSGCTLAHWQIEPQPVVAEQVLDALVEQWQRTPADVVLFPPGTFGDELSTRLAWRLHGASICQVTSLDIPTVSVRKSHWGNALTATLQTEKRPLCLSLARQAGAAKNATLPSGMQQLNIVPGALPDWLVSTEDLKNVTRDPLAEARRVLVVGQGGEADNQEIAMLAEKLGAEVGYSRARVMNGGVDAEKVIGISGHLLAPEVCIVVGASGAAALMAGVRNSKFVVAINHDASAAVFSQADVGVVDDWKVVLEALVTNIHADCQ
>CP034953.1|QAA88721.1|989874_990450_-|glycerol-3-phosphate-responsive-antiterminator
MPLLHLLRQNPVIAAVKDNASLQLAIDSECQFISVLYGNICTISNIVKKIKNAGKYAFIHVDLLEGASNKEVVIQFLKLVTEADGIISTKASMLKAARAEGFFCIHRLFIVDSISFHNIDKQVAQSNPDCIEILPGCMPKVLGWVTEKIRQPLIAGGLVCDEEDARNAINAGVVALSTTNTGVWTLAKKLL
>CP034953.1|QAA88722.1|990466_990727_-|ferredoxin-family-protein
MSVARNLWRVADAPHIVPADSVERQTAERLINACPAGLFSLTPEGNLRIDYRSCLECGTCRLLCDESTLQQWRYPPSGFGITYRFG
>CP034953.1|QAA88723.1|990717_991989_-|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERRITHESLSLLTPDGVTTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGRICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP034953_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_3

1006183-1006945

TypeI-E

I-E

Consensus_repeat	Method
GAGTTCCCCGCGCCAGCGGGGATAAACCG	PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRT

12 spacers

cas2,cas1,cas6e,cas5,cas7,cse2gr11,cas8e,cas3

The CRISPR arrays of CP034953_3

>merge|CP034953|3|1006183-1006945|PILER-CR,CRISPRCasFinder,CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCGCTTTCGCAGACGCGCGGCGATACGCTCACGCAGAGTTCCCCGCGCCAGCGGGGATAAACCGCAGCCGAAGCCAAAGGTGATGCCGAACACGCTGAGTTCCCCGCGCCAGCGGGGATAAACCGGGCTCCCTGTCGGTTGTAATTGATAATGTTGAGAGTTCCCCGCGCCAGCGGGGATAAACCGTTTGGATCGGGTCTGGAATTTCTGAGCGGTCGCGAGTTCCCCGCGCCAGCGGGGATAAACCGCGAATCGCGCATACCCTGCGCGTCGCCGCCTGCGAGTTCCCCGCGCCAGCGGGGATAAACCGTCAGCTTTATAAATCCGGAGATACGGAAACTAGAGTTCCCCGCGCCAGCGAGGATAAACCGGACTCACCCCGAAAGAGATTGCCAGCCAGCTTGAGTTCCCCGCGCCAGCGGGGATAAACCGCTGCTGGAGCTGGCTGCAAGGCAAGCCGCCCAGAGTTCCCCGCGCCAGCGGGGATAAACCGGGGGGCGCATGACCGTAAACATTATCCCCCGGGAGTTCCCCGCGCCAGCGGGGATAAACCGGGAGTTCAGACATAGGTGGAATGATGGACTACGAGTTCCCCGCGTTAGCGGGGATAAACCGCCCGGTAGCCAGGTTTGCAACGCCTGAACCGAGAGTTCCCCGCGCCAGCAGGGATAAACCGGCAACGACGGTGAGATTTCACGCCTGACGCTGGTGTTCCCCGCATCAGCGGGGATAAACCG

>CP034953|3|2|1006183-1006701|PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CTTTCGCAGACGCGCGGCGATACGCTCACGCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CAGCCGAAGCCAAAGGTGATGCCGAACACGCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGCTCCCTGTCGGTTGTAATTGATAATGTTGA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TTTGGATCGGGTCTGGAATTTCTGAGCGGTCGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CGAATCGCGCATACCCTGCGCGTCGCCGCCTGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAGCTTTATAAATCCGGAGATACGGAAACTA
GAGTTCCCCGCGCCAGCGAGGATAAACCG	GACTCACCCCGAAAGAGATTGCCAGCCAGCTT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CTGCTGGAGCTGGCTGCAAGGCAAGCCGCCCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG

>CP034953|3|3|1006183-1006945|CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CTTTCGCAGACGCGCGGCGATACGCTCACGCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CAGCCGAAGCCAAAGGTGATGCCGAACACGCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGCTCCCTGTCGGTTGTAATTGATAATGTTGA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TTTGGATCGGGTCTGGAATTTCTGAGCGGTCGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CGAATCGCGCATACCCTGCGCGTCGCCGCCTGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAGCTTTATAAATCCGGAGATACGGAAACTA
GAGTTCCCCGCGCCAGCGAGGATAAACCG	GACTCACCCCGAAAGAGATTGCCAGCCAGCTT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CTGCTGGAGCTGGCTGCAAGGCAAGCCGCCCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGGGCGCATGACCGTAAACATTATCCCCCGG
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGAGTTCAGACATAGGTGGAATGATGGACTAC
GAGTTCCCCGCGTTAGCGGGGATAAACCG	CCCGGTAGCCAGGTTTGCAACGCCTGAACCGA
GAGTTCCCCGCGCCAGCAGGGATAAACCG	GCAACGACGGTGAGATTTCACGCCTGACGCTG
GTGTTCCCCGCATCAGCGGGGATAAACCG

>CP034953|3|2|1006183-1006945|CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CTTTCGCAGACGCGCGGCGATACGCTCACGCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CAGCCGAAGCCAAAGGTGATGCCGAACACGCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGCTCCCTGTCGGTTGTAATTGATAATGTTGA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TTTGGATCGGGTCTGGAATTTCTGAGCGGTCGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CGAATCGCGCATACCCTGCGCGTCGCCGCCTGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAGCTTTATAAATCCGGAGATACGGAAACTA
GAGTTCCCCGCGCCAGCGAGGATAAACCG	GACTCACCCCGAAAGAGATTGCCAGCCAGCTT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CTGCTGGAGCTGGCTGCAAGGCAAGCCGCCCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGGGCGCATGACCGTAAACATTATCCCCCGG
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGAGTTCAGACATAGGTGGAATGATGGACTAC
GAGTTCCCCGCGTTAGCGGGGATAAACCG	CCCGGTAGCCAGGTTTGCAACGCCTGAACCGA
GAGTTCCCCGCGCCAGCAGGGATAAACCG	GCAACGACGGTGAGATTTCACGCCTGACGCTG
GTGTTCCCCGCATCAGCGGGGATAAACCG

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA88742.1\|1012155_1012866_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	unknown	unknown	gnl\|CDD\|234670
CP034953.1\|QAA88735.1\|1005792_1006077_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	cd09648_cas2_CAS-I-E	gnl\|CDD\|236930
CP034953.1\|QAA88731.1\|1002503_1003595_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	cas7	cd09646_cas7_CAS-I-E	gnl\|CDD\|273843
CP034953.1\|QAA88739.1\|1010653_1011259_+\|adenylyl-sulfate-kinase	unknown	unknown	gnl\|CDD\|179661
CP034953.1\|QAA88736.1\|1007027_1008065_-\|aminopeptidase	unknown	unknown	gnl\|CDD\|182299
CP034953.1\|QAA88738.1\|1009226_1010654_+\|sulfate-adenylyltransferase-subunit-CysN	unknown	unknown	gnl\|CDD\|235349
CP034953.1\|QAA88737.1\|1008316_1009225_+\|sulfate-adenylyltransferase-subunit-2	unknown	unknown	gnl\|CDD\|235375
CP034953.1\|QAA88727.1\|996333_997068_+\|phosphoadenosine-phosphosulfate-reductase	unknown	unknown	gnl\|CDD\|234997
CP034953.1\|QAA88741.1\|1011825_1012137_+\|cell-division-protein-FtsB	unknown	unknown	gnl\|CDD\|179156
CP034953.1\|QAA88730.1\|1002008_1002491_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	cse2gr11	cd09670_cse2gr11_CAS-I-E	gnl\|CDD\|187801
CP034953.1\|QAA88732.1\|1003597_1004272_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|273842
CP034953.1\|QAA88726.1\|994546_996259_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	unknown	unknown	gnl\|CDD\|237402
CP034953.1\|QAA88745.1\|1014371_1015133_+\|5'/3'-nucleotidase-SurE	unknown	unknown	gnl\|CDD\|234732
CP034953.1\|QAA88743.1\|1012865_1013345_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	unknown	unknown	gnl\|CDD\|178851
CP034953.1\|QAA88744.1\|1013341_1014391_+\|tRNA-pseudouridine(13)-synthase-TruD	unknown	unknown	gnl\|CDD\|234884
CP034953.1\|QAA88733.1\|1004258_1004858_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	cd09664_cas6e_CAS-I-E	gnl\|CDD\|273869
CP034953.1\|QAA88740.1\|1011308_1011632_+\|DUF3561-family-protein	unknown	unknown	gnl\|CDD\|371891
CP034953.1\|QAA88728.1\|997426_1000093_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|182031
CP034953.1\|QAA88734.1\|1004873_1005791_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
CP034953.1\|QAA88729.1\|1000507_1002016_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	cas8e	cd09669_cas8e_CAS-I-E	gnl\|CDD\|236613

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA88742.1\|1012155_1012866_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	gnl\|CDD\|234670	PRK00155, ispD, D-ribitol-5-phosphate cytidylyltransferase.	3.26939e-121
CP034953.1\|QAA88735.1\|1005792_1006077_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|236930	PRK11558, PRK11558, putative ssRNA endonuclease; Provisional.	4.76227e-62
CP034953.1\|QAA88731.1\|1002503_1003595_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	gnl\|CDD\|273843	TIGR01869, CRISPR_system_Cascade_subunit_CasC, CRISPR-associated protein Cas7/Cse4/CasC, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum and is part of the Ecoli subtype of CRISPR/Cas locis. It is designated Cse4, for CRISPR/Cas Subtype Ecoli protein 4.	5.43824e-154
CP034953.1\|QAA88739.1\|1010653_1011259_+\|adenylyl-sulfate-kinase	gnl\|CDD\|179661	PRK03846, PRK03846, adenylylsulfate kinase; Provisional.	7.34447e-148
CP034953.1\|QAA88736.1\|1007027_1008065_-\|aminopeptidase	gnl\|CDD\|182299	PRK10199, PRK10199, alkaline phosphatase isozyme conversion aminopeptidase; Provisional.	0
CP034953.1\|QAA88738.1\|1009226_1010654_+\|sulfate-adenylyltransferase-subunit-CysN	gnl\|CDD\|235349	PRK05124, cysN, sulfate adenylyltransferase subunit 1; Provisional.	0
CP034953.1\|QAA88737.1\|1008316_1009225_+\|sulfate-adenylyltransferase-subunit-2	gnl\|CDD\|235375	PRK05253, PRK05253, sulfate adenylyltransferase subunit CysD.	0
CP034953.1\|QAA88727.1\|996333_997068_+\|phosphoadenosine-phosphosulfate-reductase	gnl\|CDD\|234997	PRK02090, PRK02090, phosphoadenylyl-sulfate reductase.	2.39575e-137
CP034953.1\|QAA88741.1\|1011825_1012137_+\|cell-division-protein-FtsB	gnl\|CDD\|179156	PRK00888, ftsB, cell division protein FtsB; Reviewed.	5.55235e-62
CP034953.1\|QAA88730.1\|1002008_1002491_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	gnl\|CDD\|187801	cd09670, Cse2_I-E, CRISPR/Cas system-associated protein Cse2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; also known as Cse2/CasB/YgcK family; specific gene for I-E subtype;.	1.76293e-33
CP034953.1\|QAA88732.1\|1003597_1004272_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|273842	TIGR01868, hypothetical_protein, CRISPR-associated protein Cas5/CasD, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is part of the ECOLI subtype CRISPR/Cas locus, and now characterized as part of the CASCADE complex of that system. It shares a small N-terminal homology region with members of several other CRISPR/Cas subtypes, and we view the families that share this region as being Cas5.	2.15381e-103
CP034953.1\|QAA88726.1\|994546_996259_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	gnl\|CDD\|237402	PRK13504, PRK13504, NADPH-dependent assimilatory sulfite reductase hemoprotein subunit.	0
CP034953.1\|QAA88745.1\|1014371_1015133_+\|5'/3'-nucleotidase-SurE	gnl\|CDD\|234732	PRK00346, surE, 5'(3')-nucleotidase/polyphosphatase; Provisional.	1.92279e-150
CP034953.1\|QAA88743.1\|1012865_1013345_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	gnl\|CDD\|178851	PRK00084, ispF, 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase; Reviewed.	1.56248e-104
CP034953.1\|QAA88744.1\|1013341_1014391_+\|tRNA-pseudouridine(13)-synthase-TruD	gnl\|CDD\|234884	PRK00984, truD, tRNA pseudouridine synthase D; Reviewed.	0
CP034953.1\|QAA88733.1\|1004258_1004858_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|273869	TIGR01907, CRISPR_system_Cascade_subunit_CasE, CRISPR-associated protein Cas6/Cse3/CasE, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model family, represented by CT1974 from Chlorobium tepidum, is found in the Ecoli subtype of CRISPR/Cas regions and is designated Cse3 (CRISPR/Cas Subtype Ecoli protein 3). The representative of this family from Thermus thermophilus HB8 (TTHB192) has been crystallized and found to have a structure consisting of two domains with opposing parallel beta-sheets known as a beta-sheet platform. This structure is similar to those found in the Sex-lethal protein and poly(A)-binding protein. This structure is consistent with an RNA-binding function.	1.81669e-101
CP034953.1\|QAA88740.1\|1011308_1011632_+\|DUF3561-family-protein	gnl\|CDD\|371891	pfam12084, DUF3561, Protein of unknown function (DUF3561). This family of proteins is functionally uncharacterized. This protein is found in bacteria. Proteins in this family are about 110 amino acids in length.	1.22003e-52
CP034953.1\|QAA88728.1\|997426_1000093_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	0
CP034953.1\|QAA88734.1\|1004873_1005791_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	2.68794e-159
CP034953.1\|QAA88729.1\|1000507_1002016_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	gnl\|CDD\|236613	PRK09693, PRK09693, Cascade antiviral complex protein; Validated.	0

>CP034953.1|QAA88735.1|1005792_1006077_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MSMLVVVTENVPPRLRGRLAIWLLEVRAGVYVGDVSAKIREMIWEQIAGLAEEGNVVMAWATNTETGFEFQTFGLNRRTPVDLDGLRLVSFLPV
>CP034953.1|QAA88734.1|1004873_1005791_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MTWLPLNPIPLKDRVSMIFLQYGQIDVIDGAFVLIDKTGIRTHIPVGSVACIMLEPGTRVSHAAVRLAAQVGTLLVWVGEAGVRVYASGQPGGARSDKLLYQAKLALDEDLRLKVVRKMFELRFGEPAPARRSVEQLRGIEGSRVRATYALLAKQYGVTWNGRRYDPKDWEKGDTINQCISAATSCLYGVTEAAILAAGYAPAIGFVHTGKPLSFVYDIADIIKFDTVVPKAFEIARRNPGEPDREVRLACRDIFRSSKTLAKLIPLIEDVLAAGEIQPPAPPEDAQPVAIPLPVSLGDAGHRSS
>CP034953.1|QAA88733.1|1004258_1004858_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQSAQMPVSTAVATVIKTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCRVPLIKEAEQIAWLQRKLGNAARVEDVHPISERPQYFSGDGKSGKIQTVCFEGVLTINDAPALIDLVQQGIGPAKSMGCGLLSLAPL
>CP034953.1|QAA88732.1|1003597_1004272_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MRSYLILRLAGPMQAWGQPTFEGTRPTGRFPTRSGLLGLLGACLGIQRDDTSSLQALSESVQFAVRCDELILDDRRVSVTGLRDYHTVLGAREDYRGLKSHETIQTWREYLCDASFTVALWLTPHATMVISELEKAVLKPRYTPYLGRRSCPLTHPLFLGTCQASDPQKALLNYEPVGGDIYSEESVTGHHLKFTARDEPMITLPRQFASREWYVIKGGMDVSQ
>CP034953.1|QAA88731.1|1002503_1003595_+|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC
MSNFINIHVLISHSPSCLNRDDMNMQKDAIFGGKRRVRISSQSLKRAMRKSGYYAQNIGESSLRTIHLAQLRDVLRQKLGERFDQKIIDKTLALLSGKSVDEAEKISADAVTPWVVGEIAWFCEQVAKAEADNLDDKKLLKVLKEDIAAIRVNLQQGVDIALSGRMATSGMMTELGKVDGAMSIAHAITTHQVDSDIDWFTAVDDLQEQGSAHLGTQEFSSGVFYRYANINLAQLQENLGGASREQALEIATHVVHMLATEVPGAKQRTYAAFNPADMVMVNFSDMPLSMANAFEKAVKAKDGFLQPSIQAFNQYWDRVANGYGLNGAAAQFSLSDVDPITAQVKQMPTLEQLKSWVRNNGEA
>CP034953.1|QAA88730.1|1002008_1002491_+|type-I-E-CRISPR-associated-protein-Cse2/CasB
MADEIDAMALYRAWQQLDNGSCAQIRRVSEPDELRDIPAFYRLVQPFGWENPRHQQALLRMVFCLSAGKNVIRHQDKKSEQTTGISLGRALANSGRINERRIFQLIRADRTADMVQLRRLLTHAEPVLDWPLMARMLTWWGKRERQQLLEDFVLTTNKNA
>CP034953.1|QAA88729.1|1000507_1002016_+|type-I-E-CRISPR-associated-protein-Cse1/CasA
MNLLIDNWIPVRPRNGGKVQIINLQSLYCSRDQWRLSLPRDDMELAALALLVCIGQIIAPAKDDVEFRHRIMNPLTEDEFQQLIAPWIDMFYLNHAEHPFMQTKGVKANDVTPMEKLLAGVSGATNCAFVNQPGQGEALCGGCTAIALFNQANQAPGFGGGFKSGLRGGTPVTTFVRGIDLRSTVLLNVLTLPRLQKQFPNESHTENQPTWIKPIKSNESIPASSIGFVRGLFWQPAHIELCDPIGIGKCSCCGQESNLRYTGFLKEKFTFTVNGLWPHPHSPCLVTVKKGEVEEKFLAFTTSAPSWTQISRVVVDKIIQNENGNRVAAVVNQFRNIAPQSPLELIMGGYRNNQASILERRHDVLMFNQGWQQYGNVINEIVTVGLGYKTALRKALYTFAEGFKNKDFKGAGVSVHETAERHFYRQSELLIPDVLANVNFSQADEVIADLRDKLHQLCEMLFNQSVAPYAHHPKLISTLALARATLYKHLRELKPQGGPSNG
>CP034953.1|QAA88728.1|997426_1000093_+|CRISPR-associated-helicase/endonuclease-Cas3
MEPFKYICHYWGKSSKSLTKGNDIHLLIYHCLDVAAVADCWWDQSVVLQNTFCRNEMLSKQRVKAWLLFFIALHDIGKFDIRFQYKSAESWLKLNPATPSLNGPSTQMCRKFNHGAAGLYWFNQDSLSEQSLGDFFSFFDAAPHPYESWFPWVEAVTGHHGFILHSQDQDKSRWEMPASLASYAAQDKQAREEWISVLEALFLTPAGLSINDIPPDCSSLLAGFCSLADWLGSWTTTNTFLFNEDAPSDINALRTYFQDRQQDASRVLELSGLVSNKRCYEGVHALLDNGYQPRQLQVLVDALPVAPGLTVIEAPTGSGKTETALAYAWKLIDQQIADSVIFALPTQATANAMLTRMEASASHLFSSPNLILAHGNSRFNHLFQSIKSRAITEQGQEEAWVQCCQWLSQSNKKVFLGQIGVCTIDQVLISVLPVKHRFIRGLGIGRSVLIVDEVHAYDTYMNGLLEAVLKAQADVGGSVILLSATLPMKQKQKLLDTYGLHTDPVENNSAYPLINWRGVNGAQRFDLLAHPEQLPPRFSIQPEPICLADMLPDLTMLERMIAAANAGAQVCLICNLVDVAQVCYQRLKELNNTQVDIDLFHARFTLNDRREKENRVISNFGKNGKRNVGRILVATQVVEQSLDVDFDWLITQHCPADLLFQRLGRLHRHHRKYRPAGFEIPVATILLPDGEGYGRHEHIYSNVRVMWRTQQHIEELNGASLFFPDAYRQWLDSIYDDAEMDEPEWVGNGMDKFESAECEKRFKARKVLQWAEEYSLQDNDETILAVTRDGEMSLPLLPYVQTSSGKQLLDGQVYEDLSHEQQYEALALNRVNVPFTWKRSFSEVVDEDGLLWLEGKQNLDGWVWQGNSIVITYTGDEGMTRVIPANPK
>CP034953.1|QAA88727.1|996333_997068_+|phosphoadenosine-phosphosulfate-reductase
MSKLDLNALNELPKVDRILALAETNAELEKLDAEGRVAWALDNLPGEYVLSSSFGIQAAVSLHLVNQIRPDIPVILTDTGYLFPETYRFIDELTDKLKLNLKVYRATESAAWQEARYGKLWEQGVEGIEKYNDINKVEPMNRALKELNAQTWFAGLRREQSGSRANLPVLAIQRGVFKVLPIIDWDNRTIYQYLQKHGLKYHPLWDEGYLSVGDTHTTRKWEPGMAEEETRFFGLKRECGLHEG
>CP034953.1|QAA88726.1|994546_996259_+|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit
MSEKHPGPLVVEGKLTDAERMKHESNYLRGTIAEDLNDGLTGGFKGDNFLLIRFHGMYQQDDRDIRAERAEQKLEPRHAMLLRCRLPGGVITTKQWQAIDKFAGENTIYGSIRLTNRQTFQFHGILKKNVKPVHQMLHSVGLDALATANDMNRNVLCTSNPYESQLHAEAYEWAKKISEHLLPRTRAYAEIWLDQEKVATTDEEPILGQTYLPRKFKTTVVIPPQNDIDLHANDMNFVAIAENGKLVGFNLLVGGGLSIEHGNKKTYARTASEFGYLPLEHTLAVAEAVVTTQRDWGNRTDRKNAKTKYTLERVGVETFKAEVERRAGIKFEPIRPYEFTGRGDRIGWVKGIDDNWHLTLFIENGRILDYPARPLKTGLLEIAKIHKGDFRITANQNLIIAGVPESEKAKIEKIAKESGLMNAVTPQRENSMACVSFPTCPLAMAEAERFLPSFIDNIDNLMAKHGVSDEHIVMRVTGCPNGCGRAMLAEVGLVGKAPGRYNLHLGGNRIGTRIPRMYKENITEPEILASLDELIGRWAKEREAGEGFGDFTVRAGIIRPVLDPARDLWD
>CP034953.1|QAA88736.1|1007027_1008065_-|aminopeptidase
MFSALRHRTAALALGVCFILPVHASSPKPGDFANTQARHIATFFPGRMTGTPAEMLSADYIRQQFQQMGYRSDIRTFNSRYIYTARDNRKSWHNVTGSTVIAAHEGKAPQQIIIMAHLDTYAPLSDADADANLGGLTLQGMDDNAAGLGVMLELAERLKNTPTEYGIRFVATSGEEEGKLGAENLLKRMSDTEKKNTLLVINLDNLIVGDKLYFNSGVKTPEAVRKLTRDRALAIARSHGIAATTNPGLNKNYPKGTGCCNDAEIFDKAGIAVLSVEATNWNLGNKDGYQQRAKTPAFPAGNSWHDVRLDNHQHIDKALPGRIERRCRDVMRIMLPLVKELAKAS
>CP034953.1|QAA88737.1|1008316_1009225_+|sulfate-adenylyltransferase-subunit-2
MDQIRLTHLRQLEAESIHIIREVAAEFSNPVMLYSIGKDSSVMLHLARKAFYPGTLPFPLLHVDTGWKFREMYEFRDRTAKAYGCELLVHKNPEGVAMGINPFVHGSAKHTDIMKTEGLKQALNKYGFDAAFGGARRDEEKSRAKERIYSFRDRFHRWDPKNQRPELWHNYNGQINKGESIRVFPLSNWTEQDIWQYIWLENIDIVPLYLAAERPVLERDGMLMMIDDNRIDLQPGEVIKKRMVRFRTLGCWPLTGAVESNAQTLPEIIEEMLVSTTSERQGRVIDRDQAGSMELKKRQGYF
>CP034953.1|QAA88738.1|1009226_1010654_+|sulfate-adenylyltransferase-subunit-CysN
MNTALAQQIANEGGVEAWMIAQQHKSLLRFLTCGSVDDGKSTLIGRLLHDTRQIYEDQLSSLHNDSKRHGTQGEKLDLALLVDGLQAEREQGITIDVAYRYFSTEKRKFIIADTPGHEQYTRNMATGASTCELAILLIDARKGVLDQTRRHSFISTLLGIKHLVVAINKMDLVDYSEETFTRIREDYLTFAGQLPGNLDIRFVPLSALEGDNVASQSESMPWYSGPTLLEVLETVEIQRVVDAQPMRFPVQYVNRPNLDFRGYAGTLASGRVEVGQRVKVLPSGVESNVARIVTFDGDREEAFAGEAITLVLTDEIDISRGDLLLAADEALPAVQSASVDVVWMAEQPLSPGQSYDIKIAGKKTRARVDGIRYQVDINNLTQREVENLPLNGIGLVDLTFDEPLVLDRYQQNPVTGGLIFIDRLSNVTVGAGMVHEPVSQATAAPSEFSAFELELNALVRRHFPHWGARDLLGDK
>CP034953.1|QAA88739.1|1010653_1011259_+|adenylyl-sulfate-kinase
MALHDENVVWHSHPVTVQQRELHHGHRGVVLWFTGLSGSGKSTVAGALEEALHKLGVSTYLLDGDNVRHGLCSDLGFSDADRKENIRRVGEVANLMVEAGLVVLTAFISPHRAERQMVRERVGEGRFIEVFVDTPLAICEARDPKGLYKKARAGELRNFTGIDSVYEAPESAEIHLNGEQLVTNLVQQLLDLLRQNDIIRS
>CP034953.1|QAA88740.1|1011308_1011632_+|DUF3561-family-protein
MRNSHNITLTNNDSLTEDEETTWSLPGAVVGFISWLFALAMPMLIYGSNTLFFFIYTWPFFLALMPVAVVVGIALHSLMDGKLRYSIVFTLVTVGIMFGALFMWLLG
>CP034953.1|QAA88741.1|1011825_1012137_+|cell-division-protein-FtsB
MGKLTLLLLAILVWLQYSLWFGKNGIHDYTRVNDDVAAQQATNAKLKARNDQLFAEIDDLNGGQEALEERARNELSMTRPGETFYRLVPDASKRAQSAGQNNR
>CP034953.1|QAA88742.1|1012155_1012866_+|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase
MATTHLDVCAVVPAAGFGRRMQTECPKQYLSIGNQTILEHSVHALLAHPRVKRVVIAISPGDSRFAQLPLANHPQITVVDGGDERADSVLAGLKAAGDAQWVLVHDAARPCLHQDDLARLLALSETSRTGGILAAPVRDTMKRAEPGKNAIAHTVDRNGLWHALTPQFFPRELLHDCLTRALNEGATITDEASALEYCGFHPQLVEGRADNIKVTRPEDLALAEFYLTRTIHQENT
>CP034953.1|QAA88743.1|1012865_1013345_+|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase
MRIGHGFDVHAFGGEGPIIIGGVRIPYEKGLLAHSDGDVALHALTDALLGAAALGDIGKLFPDTDPAFKGADSRELLREAWRRIQAKGYTLGNVDVTIIAQAPKMLPHIPQMRVFIAEDLGCHMDDVNVKATTTEKLGFTGRGEGIACEAVALLIKATK
>CP034953.1|QAA88744.1|1013341_1014391_+|tRNA-pseudouridine(13)-synthase-TruD
MIEFDNLTYLHGKPQGTGLLKANPEDFVVVEDLGFEPDGEGEHILVRILKNGCNTRFVADALAKFLKIHAREVSFAGQKDKHAVTEQWLCARVPGKEMPDLSAFQLEGCQVLEYARHKRKLRLGALKGNAFTLVLREVSNRDDVEQRLIDICVKGVPNYFGAQRFGIGGSNLQGAQRWAQTNTPVRDRNKRSFWLSAARSALFNQIVAERLKKADVNQVVDGDALQLAGRGSWFVATTEELAELQRRVNDKELMITAALPGSGEWGTQREALAFEQAAVAAETELQALLVREKVEAARRAMLLYPQQLSWNWWDDVTVEIRFWLPAGSFATSVVRELINTTGDYAHIAE
>CP034953.1|QAA88745.1|1014371_1015133_+|5'/3'-nucleotidase-SurE
MRILLSNDDGVHAPGIQTLAKALREFADVQVVAPDRNRSGASNSLTLESSLRTFTFENGDIAVQMGTPTDCVYLGVNALMRPRPDIVVSGINAGPNLGDDVIYSGTVAAAMEGRHLGFPALAVSLDGHKHYDTAAAVTCSILRALCKEPLRTGRILNINVPDLPLDQIKGIRVTRCGTRHPADQVIPQQDPRGNTLYWIGPPGGKCDAGPGTDFAAVDEGYVSITPLHVDLTAHSAQDVVSDWLNSVGVGTQW

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP034953_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_4

1537358-1537475

Orphan

Consensus_repeat	Method
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP034953_4

>merge|CP034953|4|1537358-1537475|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGCTGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAACCGAGCCGTAGGCCGGATAAGGCGTTTACGC

>CP034953|4|4|1537358-1537475|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	TGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAA
CCGAGCCGTAGGCCGGATAAGGCGTTTACGC

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA89222.1\|1548000_1549689_+\|DUF2138-domain-containing-protein	unknown	unknown	gnl\|CDD\|227030
CP034953.1\|QAA89215.1\|1533633_1534710_+\|glycerophosphodiester-phosphodiesterase	unknown	unknown	gnl\|CDD\|236859
CP034953.1\|QAA89210.1\|1526841_1527741_-\|ISNCY-family-transposase	unknown	unknown	gnl\|CDD\|182167
CP034953.1\|QAA89218.1\|1536130_1537261_-\|ribonucleoside-diphosphate-reductase-1-subunit-beta	unknown	unknown	gnl\|CDD\|181647
CP034953.1\|QAA89227.1\|1558566_1559889_-\|TIGR00366-family-protein	unknown	unknown	gnl\|CDD\|280776
CP034953.1\|QAA89214.1\|1532270_1533629_+\|glycerol-3-phosphate-transporter	unknown	unknown	gnl\|CDD\|236889
CP034953.1\|QAA89224.1\|1554847_1556497_+\|DUF2300-domain-containing-protein	unknown	unknown	gnl\|CDD\|227732
CP034953.1\|QAA89221.1\|1545224_1547852_+\|DNA-gyrase-subunit-A	unknown	unknown	gnl\|CDD\|235502
CP034953.1\|QAA89212.1\|1529120_1530380_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	unknown	unknown	gnl\|CDD\|225617
CP034953.1\|QAA89226.1\|1557351_1558536_-\|acetyl-CoA-acetyltransferase	unknown	unknown	gnl\|CDD\|180261
CP034953.1\|QAA89209.1\|1526643_1526829_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182167
CP034953.1\|QAA89213.1\|1530369_1531998_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	unknown	unknown	gnl\|CDD\|236847
CP034953.1\|QAA89225.1\|1556501_1557278_+\|DUF2135-domain-containing-protein	unknown	unknown	gnl\|CDD\|227021
CP034953.1\|QAA91875.1\|1544355_1545078_-\|bifunctional-3-demethylubiquinone-3-O-methyltransferase/2-octaprenyl-6-hydroxy-phenol-methylase	unknown	unknown	gnl\|CDD\|235350
CP034953.1\|QAA89217.1\|1535876_1536131_-\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	unknown	unknown	gnl\|CDD\|182668
CP034953.1\|QAA89223.1\|1549685_1550309_+\|DUF1175-domain-containing-protein	unknown	unknown	gnl\|CDD\|225774
CP034953.1\|QAA89220.1\|1540475_1544228_+\|AIDA-I-family-autotransporter-YfaL	unknown	unknown	gnl\|CDD\|182059
CP034953.1\|QAA89216.1\|1535172_1535823_+\|lipopolysaccharide-kinase-InaA	unknown	unknown	gnl\|CDD\|182136
CP034953.1\|QAA89211.1\|1527933_1529124_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	unknown	unknown	gnl\|CDD\|132422
CP034953.1\|QAA89219.1\|1537494_1539780_-\|ribonucleoside-diphosphate-reductase-1-subunit-alpha	unknown	unknown	gnl\|CDD\|181649

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA89222.1\|1548000_1549689_+\|DUF2138-domain-containing-protein	gnl\|CDD\|227030	COG4685, COG4685, Uncharacterized protein conserved in bacteria [Function unknown].	0
CP034953.1\|QAA89215.1\|1533633_1534710_+\|glycerophosphodiester-phosphodiesterase	gnl\|CDD\|236859	PRK11143, glpQ, glycerophosphodiester phosphodiesterase; Provisional.	0
CP034953.1\|QAA89210.1\|1526841_1527741_-\|ISNCY-family-transposase	gnl\|CDD\|182167	PRK09956, PRK09956, ISNCY family transposase.	0
CP034953.1\|QAA89218.1\|1536130_1537261_-\|ribonucleoside-diphosphate-reductase-1-subunit-beta	gnl\|CDD\|181647	PRK09101, nrdB, ribonucleotide-diphosphate reductase subunit beta; Reviewed.	0
CP034953.1\|QAA89227.1\|1558566_1559889_-\|TIGR00366-family-protein	gnl\|CDD\|280776	pfam02667, SCFA_trans, Short chain fatty acid transporter. This family consists of two sequences annotated as short chain fatty acid transporters, however, there are no references giving details of experimental characterization of this function.	0
CP034953.1\|QAA89214.1\|1532270_1533629_+\|glycerol-3-phosphate-transporter	gnl\|CDD\|236889	PRK11273, glpT, glycerol-3-phosphate transporter.	0
CP034953.1\|QAA89224.1\|1554847_1556497_+\|DUF2300-domain-containing-protein	gnl\|CDD\|227732	COG5445, COG5445, Predicted secreted protein [Function unknown].	3.75964e-127
CP034953.1\|QAA89221.1\|1545224_1547852_+\|DNA-gyrase-subunit-A	gnl\|CDD\|235502	PRK05560, PRK05560, DNA gyrase subunit A; Validated.	0
CP034953.1\|QAA89212.1\|1529120_1530380_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	gnl\|CDD\|225617	COG3075, GlpB, Anaerobic glycerol-3-phosphate dehydrogenase [Amino acid transport and metabolism].	0
CP034953.1\|QAA89226.1\|1557351_1558536_-\|acetyl-CoA-acetyltransferase	gnl\|CDD\|180261	PRK05790, PRK05790, putative acyltransferase; Provisional.	0
CP034953.1\|QAA89209.1\|1526643_1526829_-\|hypothetical-protein	gnl\|CDD\|182167	PRK09956, PRK09956, ISNCY family transposase.	1.35852e-30
CP034953.1\|QAA89213.1\|1530369_1531998_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	gnl\|CDD\|236847	PRK11101, glpA, anaerobic glycerol-3-phosphate dehydrogenase subunit A.	0
CP034953.1\|QAA89225.1\|1556501_1557278_+\|DUF2135-domain-containing-protein	gnl\|CDD\|227021	COG4676, COG4676, Uncharacterized protein conserved in bacteria [Function unknown].	4.17009e-153
CP034953.1\|QAA91875.1\|1544355_1545078_-\|bifunctional-3-demethylubiquinone-3-O-methyltransferase/2-octaprenyl-6-hydroxy-phenol-methylase	gnl\|CDD\|235350	PRK05134, PRK05134, bifunctional 2-polyprenyl-6-hydroxyphenol methylase/3-demethylubiquinol 3-O-methyltransferase UbiG.	1.65303e-171
CP034953.1\|QAA89217.1\|1535876_1536131_-\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	gnl\|CDD\|182668	PRK10713, PRK10713, 2Fe-2S ferredoxin-like protein.	2.72138e-53
CP034953.1\|QAA89223.1\|1549685_1550309_+\|DUF1175-domain-containing-protein	gnl\|CDD\|225774	COG3234, COG3234, Uncharacterized protein conserved in bacteria [Function unknown].	7.99004e-141
CP034953.1\|QAA89220.1\|1540475_1544228_+\|AIDA-I-family-autotransporter-YfaL	gnl\|CDD\|182059	PRK09752, PRK09752, AIDA-I family autotransporter YfaL.	0
CP034953.1\|QAA89216.1\|1535172_1535823_+\|lipopolysaccharide-kinase-InaA	gnl\|CDD\|182136	PRK09902, PRK09902, lipopolysaccharide kinase InaA.	2.86156e-158
CP034953.1\|QAA89211.1\|1527933_1529124_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	gnl\|CDD\|132422	TIGR03379, glycerol3P_GlpC, glycerol-3-phosphate dehydrogenase, anaerobic, C subunit. Members of this protein family are the membrane-anchoring, non-catalytic C subunit, product of the glpC gene, of a three-subunit, FAD-dependent, anaerobic glycerol-3-phosphate dehydrogenase. GlpC lasks classical hydrophobic transmembrane helices; Cole, et al suggest interaction with the membrane may involve amphipathic helices. GlcC has conserved Cys-containing motifs suggestive of iron-sulfur binding. This complex is found mostly in Escherichia coli and closely related species. [Energy metabolism, Anaerobic].	0
CP034953.1\|QAA89219.1\|1537494_1539780_-\|ribonucleoside-diphosphate-reductase-1-subunit-alpha	gnl\|CDD\|181649	PRK09103, PRK09103, ribonucleoside-diphosphate reductase subunit alpha.	0

>CP034953.1|QAA89218.1|1536130_1537261_-|ribonucleoside-diphosphate-reductase-1-subunit-beta
MAYTTFSQTKNDQLKEPMFFGQPVNVARYDQQKYDIFEKLIEKQLSFFWRPEEVDVSRDRIDYQALPEHEKHIFISNLKYQTLLDSIQGRSPNVALLPLISIPELETWVETWAFSETIHSRSYTHIIRNIVNDPSVVFDDIVTNEQIQKRAEGISSYYDELIEMTSYWHLLGEGTHTVNGKTVTVSLRELKKKLYLCLMSVNALEAIRFYVSFACSFAFAERELMEGNAKIIRLIARDEALHLTGTQHMLNLLRSGADDPEMAEIAEECKQECYDLFVQAAQQEKDWADYLFRDGSMIGLNKDILCQYVEYITNIRMQAVGLDLPFQTRSNPIPWINTWLVSDNVQVAPQEVEVSSYLVGQIDSEVDTDDLSNFQL
>CP034953.1|QAA89217.1|1535876_1536131_-|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE
MARVTLRITGTQLLCQDEHPSLLAALESHNVAVEYQCREGYCGSCRTRLVAGQVDWIAEPLAFIQPGEILPCCCRAKGDIEIEM
>CP034953.1|QAA89216.1|1535172_1535823_+|lipopolysaccharide-kinase-InaA
MAVSAKYDEFNHWWATEGDWVEEPNYRRNGMSGVQCVERNGKKLYVKRMTHHLFHSVRYPFGRPTIVREVAVIKELERAGVIVPKIVFGEAVKIEGEWRALLVTEDMAGFISIADWYAQHAVSPYSDEVRQAMLKAVALAFKKMHSINRQHGCCYVRHIYVKTEGNAEAGFLDLEKSRRRLRRDKAINHDFRQLEKYLEPIPKADWEQVKAYYYAM
>CP034953.1|QAA89215.1|1533633_1534710_+|glycerophosphodiester-phosphodiesterase
MKLTLKNLSMAIMMSTIVMGSSAMAADSNEKIVIAHRGASGYLPEHTLPAKAMAYAQGADYLEQDLVMTKDDNLVVLHDHYLDRVTDVADRFPDRARKDGRYYAIDFTLDEIKSLKFTEGFDIENGKKVQTYPGRFPMGKSDFRVHTFEEEIEFVQGLNHSTGKNIGIYPEIKAPWFHHQEGKDIAAKTLEVLKKYGYTGKDDKVYLQCFDADELKRIKNELEPKMGMELNLVQLIAYTDWNETQQKQPDGSWVNYNYDWMFKPGAMKQVAEYADGIGPDYHMLIEETSQPGNIKLTGMVQDAQQNKLVVHPYTVRSDKLPEYTPDVNQLYDALYNKAGVNGLFTDFPDKAVKFLNKE
>CP034953.1|QAA89214.1|1532270_1533629_+|glycerol-3-phosphate-transporter
MLSIFKPAPHKARLPAAEIDPTYRRLRWQIFLGIFFGYAAYYLVRKNFALAMPYLVEQGFSRGDLGFALSGISIAYGFSKFIMGSVSDRSNPRVFLPAGLILAAAVMLFMGFVPWATSSIAVMFVLLFLCGWFQGMGWPPCGRTMVHWWSQKERGGIVSVWNCAHNVGGGIPPLLFLLGMAWFNDWHAALYMPAFCAILVALFAFAMMRDTPQSCGLPPIEEYKNDYPDDYNEKAEQELTAKQIFMQYVLPNKLLWYIAIANVFVYLLRYGILDWSPTYLKEVKHFALDKSSWAYFLYEYAGIPGTLLCGWMSDKVFRGNRGATGVFFMTLVTIATIVYWMNPAGNPTVDMICMIVIGFLIYGPVMLIGLHALELAPKKAAGTAAGFTGLFGYLGGSVAASAIVGYTVDFFGWDGGFMVMIGGSILAVILLIVVMIGEKRRHEQLLQERNGG
>CP034953.1|QAA89213.1|1530369_1531998_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A
MKTRDSQSSDVIIIGGGATGAGIARDCALRGLRVILVERHDIATGATGRNHGLLHSGARYAVTDAESARECISENQILKRIARHCVEPTNGLFITLPEDDLSFQATFIRACEEAGISAEAIDPQQARIIEPAVNPALIGAVKVPDGTVDPFRLTAANMLDAKEHGAVILTAHEVTGLIREGATVCGVRVRNHLTGETQALHAPVVVNAAGIWGQHIAEYADLRIRMFPAKGSLLIMDHRINQHVINRCRKPSDADILVPGDTISLIGTTSLRIDYNEIDDNRVTAEEVDILLREGEKLAPVMAKTRILRAYSGVRPLVASDDDPSGRNVSRGIVLLDHAERDGLDGFITITGGKLMTYRLMAEWATDAVCRKLGNTRPCTTADLALPGSQEPAEVTLRKVISLPAPLRGSAVYRHGDRTPAWLSEGRLHRSLVCECEAVTAGEVQYAVENLNVNSLLDLRRRTRVGMGTCQGELCACRAAGLLQRFNVTTSAQSIEQLSTFLNERWKGVQPIAWGDALRESEFTRWVYQGLCGLEKEQKDAL
>CP034953.1|QAA89212.1|1529120_1530380_-|glycerol-3-phosphate-dehydrogenase-subunit-GlpB
MRFDTVIMGGGLAGLLCGLQLQKHGLRCAIVTRGQSALHFSSGSLDLLSHLPDGQPVTDIHSGLESLRQQAPAHPYSLLEPQRVLDLACQAQALIAESGAQLQGSVELAHQRVTPLGTLRSTWLSSPEVPVWPLPAKKICVVGISGLMDFQAHLAAASLRELGLAVETAEIELPELDVLRNNATEFRAVNIARFLDNEENWPLLLDALIPVANTCEMILMPACFGLADDKLWRWLNEKLPCSLMLLPTLPPSVLGIRLQNQLQRQFVRQGGVWMPGDEVKKVTCKNGVVNEIWTRNHADIPLRPRFAVLASGSFFSGGLVAERNGIREPILGLDVLQTATRGEWYKGDFFAPQPWQQFGVTTDETLRPSQAGQTIENLFAIGSVLGGFDPIAQGCGGGVCAVSALHAAQQIAQRAGGQQ
>CP034953.1|QAA89211.1|1527933_1529124_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C
MNDTSFENCIKCTVCTTACPVSRVNPGYPGPKQAGPDGERLRLKDGALYDEALKYCINCKRCEVACPSDVKIGDIIQRARAKYDTTRPSLRNFVLSHTDLMGSVSTPFAPIVNTATSLKPVRQLLDAALKIDHRRTLPKYSFGTFRRWYRSVAAQQAQYKDQVAFFHGCFVNYNHPQLGKDLIKVLNAMGTGVQLLSKEKCCGVPLIANGFTDKARKQAITNVESIREAVGVKGIPVIATSSTCTFALRDEYPEVLNVDNKGLRDHIELATRWLWRKLDEGKTLPLKPLPLKVVYHTPCHMEKMGWTLYTLELLRNIPGLELTVLDSQCCGIAGTYGFKKENYPTSQAIGAPLFRQIEESGADLVVTDCETCKWQIEMSTSLRCEHPITLLAQALA
>CP034953.1|QAA89210.1|1526841_1527741_-|ISNCY-family-transposase
MTESTTSSPHDAVFKTFMFTPETARDFLEIHLPEPLRKLCNLQTLRLEPTSFIEKSLRAYYSDVLWSVETSDGDGYIYCVIEHQSSAEKNMAFRLMRYATAAMQRHQDKGYDRVPLVVPLLFYHGETSPYPYSLNWLDEFDDPQLARQLYTEAFLLVDITIVPDDEIMQHRRIALLELIQKHIRDRDLIGMVDRITTLLVRGFTNDSQLQTLFNYLLQCGDTSRFTRFIEEIAERSPLQKERLMTIAERLRQEGHQIGWQEGMHEQAIKIALRMLEQGFEREIVLATTQLTDADIPNCH
>CP034953.1|QAA89209.1|1526643_1526829_-|hypothetical-protein
MTIAERLRQEGHQIGWQEGKLEGLHEQAIKIALRMLEQGFDRDQVLAATQLSEADLAANNH
>CP034953.1|QAA89219.1|1537494_1539780_-|ribonucleoside-diphosphate-reductase-1-subunit-alpha
MNQNLLVTKRDGSTERINLDKIHRVLDWAAEGLHNVSISQVELRSHIQFYDGIKTSDIHETIIKAAADLISRDAPDYQYLAARLAIFHLRKKAYGQFEPPALYDHVVKMVEMGKYDNHLLEDYTEEEFKQMDTFIDHDRDMTFSYAAVKQLEGKYLVQNRVTGEIYESAQFLYILVAACLFSNYPRETRLQYVKRFYDAVSTFKISLPTPIMSGVRTPTRQFSSCVLIECGDSLDSINATSSAIVKYVSQRAGIGINAGRIRALGSPIRGGEAFHTGCIPFYKHFQTAVKSCSQGGVRGGAATLFYPMWHLEVESLLVLKNNRGVEGNRVRHMDYGVQINKLMYTRLLKGEDITLFSPSDVPGLYDAFFADQEEFERLYTKYEKDDSIRKQRVKAVELFSLMMQERASTGRIYIQNVDHCNTHSPFDPAIAPVRQSNLCLEIALPTKPLNDVNDENGEIALCTLSAFNLGAINNLDELEELAILAVRALDALLDYQDYPIPAAKRGAMGRRTLGIGVINFAYYLAKHGKRYSDGSANNLTHKTFEAIQYYLLKASNELAKEQGACPWFNETTYAKGILPIDTYKKDLDTIANEPLHYDWEALRESIKTHGLRNSTLSALMPSETSSQISNATNGIEPPRGYVSIKASKDGILRQVVPDYEHLHDAYELLWEMPGNDGYLQLVGIMQKFIDQSISANTNYDPSRFPSGKVPMQQLLKDLLTAYKFGVKTLYYQNTRDGAEDAQDDLVPSIQDDGCESGACKI
>CP034953.1|QAA89220.1|1540475_1544228_+|AIDA-I-family-autotransporter-YfaL
MRIIFLRKEYLSLLPSMIASLFSANGVAAVTDSCQGYDVKASCQASRQSLSGITQDWSIADGQWLVFSDMTNNASGGAVFLQQGAEFSLLPENETGMTLFANNTVTGEYNNGGAIFAKENSTLNLTDVIFSGNVAGGYGGAIYSSGTNDTGAVDLRVTNAMFRNNIANDGKGGAIYTINNDVYLSDVIFDNNQAYTSTSYSDGDGGAIDVTDNNSDSKHPSGYTIVNNTAFTNNTAEGYGGAIYTNSVTAPYLIDISVDDSYSQNGGVLVDENNSAAGYGDGPSSAAGGFMYLGLSEVTFDIADGKTLVIGNTENDGAVDSIAGTGLITKTGSGDLVLNADNNDFTGEMQIENGEVTLGRSNSLMNVGDTHCQDDPQDCYGLTIGSIDQYQNQAELNVGSTQQTFVHALTGFQNGTLNIDAGGNVTVNQGSFAGIIEGAGQLTIAQNGSYVLAGAQSMALTGDIVVDDGAVLSLEGDAADLTALQDDPQSIVLNGGVLDLSDFSTWQSGTSYNDGLEVSGSSGTVIGSQDVVDLAGGDNLHIGGDGKDGVYVVVDASDGQVSLANNNSYLGTTQIASGTLMVSDNSQLGDTHYNRQVIFTDKQQESVMEITSDVDTRSDAAGHGRDIEMRADGEVAVDAGVDTQWGALMADSSGQHQDEGSTLTKTGAGTLELTASGTTQSAVRVEEGTLKGDVADILPYASSLWVGDGATFVTGADQDIQSIDAISSGTIDISDGTVLRLTGQDTSVALNASLFNGDGTLVNATDGVTLTGELNTNLETDSLTYLSNVTVNGNLTNTSGAVSLQNGVAGDTLTVNGDYTGGGTLLLDSELNGDDSVSDQLVMNGNTAGNTTVVVNSITGIGEPTSTGIKVVDFAADPTQFQNNAQFSLAGSGYVNMGAYDYTLVEDNNDWYLRSQEVTPPSPPDPDPTPDPDPTPDPDPTPDPEPTPAYQPVLNAKVGGYLNNLRAANQAFMMERRDHAGGDGQTLNLRVIGGDYHYTAAGQLAQHEDTSTVQLSGDLFSGRWGTDGEWMLGIVGGYSDNQGDSRSNMTGTRADNQNHGYAVGLTSSWFQHGNQKQGAWLDSWLQYAWFSNDVSEQEDGTDHYHSSGIIASLEAGYQWLPGRGVVIEPQAQVIYQGVQQDDFTAANRARVSQSQGDDIQTRLGLHSEWRTAVHVIPTLDLNYYHDPHSTEIEEDGSTISDDAVKQRGEIKVGVTGNISQRVSLRGSVAWQKGSDDFAQTAGFLSMTVKW
>CP034953.1|QAA91875.1|1544355_1545078_-|bifunctional-3-demethylubiquinone-3-O-methyltransferase/2-octaprenyl-6-hydroxy-phenol-methylase
MNAEKSPVNHNVDHEEIAKFEAVASRWWDLEGEFKPLHRINPLRLGYIAERAGGLFGKKVLDVGCGGGILAESMAREGATVTGLDMGFEPLQVAKLHALESGIQVDYVQETVEEHAAKHAGQYDVVTCMEMLEHVPDPQSVVRACAQLVKPGGDVFFSTLNRNGKSWLMAVVGAEYILRMVPKGTHDVKKFIKPAELLGWVDQTSLKERHITGLHYNPITNTFKLGPGVDVNYMLHTQNK
>CP034953.1|QAA89221.1|1545224_1547852_+|DNA-gyrase-subunit-A
MSDLAREITPVNIEEELKSSYLDYAMSVIVGRALPDVRDGLKPVHRRVLYAMNVLGNDWNKAYKKSARVVGDVIGKYHPHGDSAVYDTIVRMAQPFSLRYMLVDGQGNFGSIDGDSAAAMRYTEIRLAKIAHELMADLEKETVDFVDNYDGTEKIPDVMPTKIPNLLVNGSSGIAVGMATNIPPHNLTEVINGCLAYIDDEDISIEGLMEHIPGPDFPTAAIINGRRGIEEAYRTGRGKVYIRARAEVEVDAKTGRETIIVHEIPYQVNKARLIEKIAELVKEKRVEGISALRDESDKDGMRIVIEVKRDAVGEVVLNNLYSQTQLQVSFGINMVALHHGQPKIMNLKDIIAAFVRHRREVVTRRTIFELRKARDRAHILEALAVALANIDPIIELIRHAPTPAEAKTALVANPWQLGNVAAMLERAGDDAARPEWLEPEFGVRDGLYYLTEQQAQAILDLRLQKLTGLEHEKLLDEYKELLDQIAELLRILGSADRLMEVIREELELVREQFGDKRRTEITANSADINLEDLITQEDVVVTLSHQGYVKYQPLSEYEAQRRGGKGKSAARIKEEDFIDRLLVANTHDHILCFSSRGRVYSMKVYQLPEATRGARGRPIVNLLPLEQDERITAILPVTEFEEGVKVFMATANGTVKKTVLTEFNRLRTAGKVAIKLVDGDELIGVDLTSGEDEVMLFSAEGKVVRFKESSVRAMGCNTTGVRGIRLGEGDKVVSLIVPRGDGAILTATQNGYGKRTAVAEYPTKSRATKGVISIKVTERNGLVVGAVQVDDCDQIMMITDAGTLVRTRVSEISIVGRNTQGVILIRTAEDENVVGLQRVAEPVDEEDLDTIDGSAAEGDDEIAPEVDVDDEPEEE
>CP034953.1|QAA89222.1|1548000_1549689_+|DUF2138-domain-containing-protein
MSGEKKAKGWRFYGLVGFGAIALLSAGVWALQYAGSGPEKTLSPLVVHNNLQIDLNEPDLFLDSDSLSQLPKDLLTIPFLHDVLSEDFVFYYQNHADRLGIEGSIRRIVYEHDLTLKDKLFSSLLDQPAQAALWHDKQGHLSHYMVLIQRSGLSKLLEPLLFAATSDSQLSKTEISSIKINSETVPVYQLRYNGNNALMFATYQDKMLVFSSTDMLFKDDQQDTEATAIAGDLLSGKKRWQASFGLEERTAEKTPVRQRIVVSARWLGFGYQRLMPSFAGVRFEMGNDGWHSFVALNDESASVDASFDFTPVWNSMPAGASFCVAVPYSHGIAEEMLSHISQENDKLNGALDGAAGLCWYEDSKLQTPLFVGQFDGTAEQAQLPGKLFTQNIGAHESKAPEGVLPVSQTQQGEAQIWRREVSSRYGQYPKAQAAQPDQLMSDYFFRVSLAMQNKTLLFSLDDTLVNNALQTLNKTRPAMVDVIPTDGIVPLYINPQGIAKLLRNETLTSLPKNLEPVFYNAAQTLLMPKLDALSQQPRYVMKLAQMEPGAAWQWLPITWQPL
>CP034953.1|QAA89223.1|1549685_1550309_+|DUF1175-domain-containing-protein
MRHGLLALICWLCCVVAHSEMLNVEQSGLFRAWFVRIAQEQLRQGPSPRWYQQDCAGLVRFAANETLKVHDSKWLKSNGLSSQYLPPEMTLTPEQRQLAQNWNQGNGKTGPYVTAINLIQYNSQFIGQDINQALPGDMIFFDQGDAQHLMVWMGRYVIYHTGSATKTDNGMRAVSLQQLMTWKDTRWIPNDSNPNFIGIYRLNFLAR
>CP034953.1|QAA89224.1|1554847_1556497_+|DUF2300-domain-containing-protein
MNWRRIVWLLALVTLPTLAEETPLQLVLRGAQHDQLYQLSSSGVTKVSALPDSLTTPLGSLWKLYVYAWLEDTHQPEQPYQCRGNSPEEVYCCQAGESITRDTALVRSCGLYFAPQRLHIGADVWGQYWQQRQAPAWLASLTTLKPETSVTVKSLLDSLATLPAQNKAQEVLLDVVLDEAKIGVASMLGSRVRVKTWSWFADDKQEIRQGGFAGWLTDGTPLWVTGSGTSKTVLTRYATVLNRVLPVPTQVASGQCVEVELFARYPLKKITAEKSTTAVNPGVLNGRYRVTFTNGNHITFVSHGETTLLSEKGKLKLQSHLDREEYVARVLDREAKSTPPEAAKAMTVAIRTFLQQNANREGDCLTIPDSSATQRVSASPATTGARTMTAWTQDLIYAGDPVHYHGSRATEGTLSWRQATAQAGQGERYDQILAFAYPDNSLSRWGAPRSTCQLLPKAKAWLAKKMPQWRRILQAETGYNEPDVFAVCRLVSGFPYTDRQQKRLFIRNFFTLQDRLDLTHEYLHLAFDGYPTGLDENYIETLTRQLLMD
>CP034953.1|QAA89225.1|1556501_1557278_+|DUF2135-domain-containing-protein
MRKIFLPLLLVALSPVAHSEGVQEVEIDAPLSGWHPAEGEDASFSQSINYPASSVNMADDQNISAQIRGKIKNYAAAGKVQQGRLVVNGASMPQRIESDGSFARPYIFTEGSNSVQVISPDGQSRQKMQFYSTPGTGTIRARLRLVLSWDTDNTDLDLHVVTPDGEHAWYGNTVLKNSGALDMDVTTGYGPEIFAMPAPIHGRYQVYINYYGGRSETELTTAQLTLITDEGSVNEKQETFIVPMRNAGELTLVKSFDW
>CP034953.1|QAA89226.1|1557351_1558536_-|acetyl-CoA-acetyltransferase
MKNCVIVSAVRTAIGSFNGSLASTSAIDLGATVIKAAIERAKIDSQHVDEVIMGNVLQAGLGQNPARQALLKSGLAETVCGFTVNKVCGSGLKSVALAAQAIQAGQAQSIVAGGMENMSLAPYLLDAKARSGYRLGDGQVYDVILRDGLMCATHGYHMGITAENVAKEYGITREMQDELALHSQRKAAAAIESGAFTAEIVPVNVVTRKKTFVFSQDEFPKANSTAEALGALRPAFDKAGTVTAGNASGINDGAAALVIMEESAALAAGLTPLARIKSYASGGVPPALMGMGPVPATQKALQLAGLQLADIDLIEANEAFAAQFLAVGKNLGFDSEKVNVNGGAIALGHPIGASGARILVTLLHAMQARDKTLGLATLCIGGGQGIAMVIERLN
>CP034953.1|QAA89227.1|1558566_1559889_-|TIGR00366-family-protein
MIGRISRFMTRFVSRWLPDPLIFAMLLTLLTFVIALWLTPQTPISMVKMWGDGFWNLLAFGMQMALIIVTGHALASSAPVKSLLRTAASAAKTPVQGVMLVTFFGSVACVINWGFGLVVGAMFAREVARRVPGSDYPLLIACAYIGFLTWGGGFSGSMPLLAATPGNPVEHIAGLIPVGDTLFSGFNIFITVALIVVMPFITRMMMPKPSDVVSIDPKLLMEEADFQKQLPKDAPPSERLEESRILTLIIGALGIAYLAMYFSEHGFNITINTVNLMFMIAGLLLHKTPMAYMRAISAAARSTAGILVQFPFYAGIQLMMEHSGLGGLITEFFINVANKDTFPVMTFFSSALINFAVPSGGGHWVIQGPFVIPAAQALGADLGKSVMAIAYGEQWMNMAQPFWALPALAIAGLGVRDIMGYCITALLFSGVIFVIGLTLF

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP034953_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_5

2135099-2135222

Orphan

Consensus_repeat	Method
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP034953_5

>merge|CP034953|5|2135099-2135222|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTACGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAACGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

>CP034953|5|5|2135099-2135222|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAA
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA89738.1\|2132928_2134533_-\|FAD-NAD(P)-binding-protein	unknown	unknown	gnl\|CDD\|182134
CP034953.1\|QAA89734.1\|2129939_2130587_+\|YdhW-family-putative-oxidoreductase-system-protein	unknown	unknown	gnl\|CDD\|182160
CP034953.1\|QAA89733.1\|2127833_2129936_+\|aldehyde-ferredoxin-oxidoreductase	unknown	unknown	gnl\|CDD\|236629
CP034953.1\|QAA89731.1\|2126522_2126732_+\|fumarate-hydratase-FumD	unknown	unknown	gnl\|CDD\|182359
CP034953.1\|QAA89737.1\|2132104_2132917_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182159
CP034953.1\|QAA89743.1\|2139102_2140251_-\|cyclopropane-fatty-acyl-phospholipid-synthase	unknown	unknown	gnl\|CDD\|183282
CP034953.1\|QAA89735.1\|2130650_2131319_+\|4Fe-4S-dicluster-domain-containing-protein	unknown	unknown	gnl\|CDD\|274451
CP034953.1\|QAA89736.1\|2131315_2132101_+\|thiosulfate-reductase-cytochrome-B-subunit	unknown	unknown	gnl\|CDD\|184968
CP034953.1\|QAA89742.1\|2138421_2139063_+\|riboflavin-synthase	unknown	unknown	gnl\|CDD\|183846
CP034953.1\|QAA89748.1\|2144373_2145543_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|225371
CP034953.1\|QAA89740.1\|2135536_2136793_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|137602
CP034953.1\|QAA89749.1\|2145704_2146286_-\|superoxide-dismutase-[Fe]	unknown	unknown	gnl\|CDD\|182534
CP034953.1\|QAA89739.1\|2134658_2134964_-\|monooxygenase	unknown	unknown	gnl\|CDD\|182975
CP034953.1\|QAA89732.1\|2127186_2127813_+\|ferredoxin-like-protein	unknown	unknown	gnl\|CDD\|182135
CP034953.1\|QAA89741.1\|2136833_2138207_-\|multidrug-efflux-MATE-transporter-MdtK	unknown	unknown	gnl\|CDD\|234981
CP034953.1\|QAA89745.1\|2141865_2142798_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|182948
CP034953.1\|QAA89744.1\|2140541_2141753_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	unknown	unknown	gnl\|CDD\|182924
CP034953.1\|QAA89730.1\|2124553_2125966_-\|pyruvate-kinase-I	unknown	unknown	gnl\|CDD\|181699
CP034953.1\|QAA89747.1\|2144118_2144208_+\|YnhF-family-membrane-protein	unknown	unknown	unknown
CP034953.1\|QAA89746.1\|2142794_2143820_-\|HTH-type-transcriptional-repressor-PurR	unknown	unknown	gnl\|CDD\|236739

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA89738.1\|2132928_2134533_-\|FAD-NAD(P)-binding-protein	gnl\|CDD\|182134	PRK09897, PRK09897, FAD-NAD(P)-binding protein.	0
CP034953.1\|QAA89734.1\|2129939_2130587_+\|YdhW-family-putative-oxidoreductase-system-protein	gnl\|CDD\|182160	PRK09947, PRK09947, YdhW family putative oxidoreductase system protein.	3.717e-122
CP034953.1\|QAA89733.1\|2127833_2129936_+\|aldehyde-ferredoxin-oxidoreductase	gnl\|CDD\|236629	PRK09849, PRK09849, putative oxidoreductase; Provisional.	0
CP034953.1\|QAA89731.1\|2126522_2126732_+\|fumarate-hydratase-FumD	gnl\|CDD\|182359	PRK10292, PRK10292, fumarate hydratase FumD.	2.11502e-34
CP034953.1\|QAA89737.1\|2132104_2132917_+\|hypothetical-protein	gnl\|CDD\|182159	PRK09946, PRK09946, hypothetical protein; Provisional.	2.57656e-174
CP034953.1\|QAA89743.1\|2139102_2140251_-\|cyclopropane-fatty-acyl-phospholipid-synthase	gnl\|CDD\|183282	PRK11705, PRK11705, cyclopropane fatty acyl phospholipid synthase.	0
CP034953.1\|QAA89735.1\|2130650_2131319_+\|4Fe-4S-dicluster-domain-containing-protein	gnl\|CDD\|274451	TIGR03149, cyt_nit_nrfC, cytochrome c nitrite reductase, Fe-S protein. Members of this protein family are the Fe-S protein, NrfC, of a cytochrome c nitrite reductase system for which the pentaheme cytochrome c protein, NrfB (family TIGR03146) is an unambiguous marker. Members of this protein family show similarity to other ferredoxin-like proteins, including a subunit of a polysulfide reductase. [Energy metabolism, Electron transport].	2.09652e-76
CP034953.1\|QAA89736.1\|2131315_2132101_+\|thiosulfate-reductase-cytochrome-B-subunit	gnl\|CDD\|184968	PRK15006, PRK15006, thiosulfate reductase cytochrome B subunit; Provisional.	5.40835e-163
CP034953.1\|QAA89742.1\|2138421_2139063_+\|riboflavin-synthase	gnl\|CDD\|183846	PRK13020, PRK13020, riboflavin synthase subunit alpha; Provisional.	2.24506e-123
CP034953.1\|QAA89748.1\|2144373_2145543_+\|MFS-transporter	gnl\|CDD\|225371	COG2814, AraJ, Arabinose efflux permease [Carbohydrate transport and metabolism].	1.92383e-98
CP034953.1\|QAA89740.1\|2135536_2136793_+\|hypothetical-protein	gnl\|CDD\|137602	PRK09945, PRK09945, hypothetical protein; Provisional.	0
CP034953.1\|QAA89749.1\|2145704_2146286_-\|superoxide-dismutase-[Fe]	gnl\|CDD\|182534	PRK10543, PRK10543, superoxide dismutase [Fe].	3.77321e-138
CP034953.1\|QAA89739.1\|2134658_2134964_-\|monooxygenase	gnl\|CDD\|182975	PRK11118, PRK11118, putative monooxygenase; Provisional.	1.12003e-64
CP034953.1\|QAA89732.1\|2127186_2127813_+\|ferredoxin-like-protein	gnl\|CDD\|182135	PRK09898, PRK09898, ferredoxin-like protein.	6.99609e-140
CP034953.1\|QAA89741.1\|2136833_2138207_-\|multidrug-efflux-MATE-transporter-MdtK	gnl\|CDD\|234981	PRK01766, PRK01766, multidrug efflux protein; Reviewed.	0
CP034953.1\|QAA89745.1\|2141865_2142798_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|182948	PRK11074, PRK11074, putative DNA-binding transcriptional regulator; Provisional.	0
CP034953.1\|QAA89744.1\|2140541_2141753_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	gnl\|CDD\|182924	PRK11043, PRK11043, Bcr/CflA family multidrug efflux MFS transporter.	0
CP034953.1\|QAA89730.1\|2124553_2125966_-\|pyruvate-kinase-I	gnl\|CDD\|181699	PRK09206, PRK09206, pyruvate kinase PykF.	0
CP034953.1\|QAA89746.1\|2142794_2143820_-\|HTH-type-transcriptional-repressor-PurR	gnl\|CDD\|236739	PRK10703, PRK10703, HTH-type transcriptional repressor PurR.	0

>CP034953.1|QAA89739.1|2134658_2134964_-|monooxygenase
MATLLQLHFAFNGPFGDAMAEQLKPLAESINQEPGFLWKVWTESEKNHEAGGIYLFTDEKSALAYLEKHTARLKNLGVEEVVAKVFDVNEPLSQINQAKLA
>CP034953.1|QAA89738.1|2132928_2134533_-|FAD-NAD(P)-binding-protein
MKKIAIVGAGPTGIYTLFSLLQQQTPLSISIFEQADEAGVGMPYSDEENSKMMLANIASIEIPPIYCTYLEWLQKQEDSHLQRYGVKKETLHDRQFLPRILLGEYFRDQFLRLVDQARQQKFAVAVYESCQVTDLQITNAGVMLATNQDLPSETFDLAVIATGHVWPDEEEATRTYFPSPWSGLMEAKVDACNVGIMGTSLSGLDAAMAVAIQHGSFIEDDKQHVVFHRDNASEKLNITLLSRTGILPEADFYCPIPYEPLHIVTDQALNAEIQKGEEGLLDRVFRLIVEEIKFADPDWSQRIALESLNVDSFAQAWFAERKQRDPFDWAEKNLQEVERNKREKHTVPWRYVILRLHEAVQEIVPHLNEHDHKRFSKGLARVFIDNYAAIPSESIRRLLALREAGIIHILALGEDYKMEINESRTVLKTEDNSYSFDVFIDARGQRPLKVKDIPFPGLREQLQKTGDEIPDVGEDYTLQQPEDIRGRVAFGALPWLMHDQPFVQGLTACAEIGEAMARAVVKPASRARRRLSFD
>CP034953.1|QAA89737.1|2132104_2132917_+|hypothetical-protein
MIITQADLREWRIGAVMYRWFLRHFPRGGSYADIHHALIEEGYTDWAESLVEYAWKKWLADENFAHQEVSSMQKLATDPGERPFCSQFARSDDHARIGCCEDNARIATAGYAAQIASMGYSVRIGSVGFNSHIGSSGERARVAVTGNSSRISSAGDSSRIANTGMRVRVCTLGERCHVASNGDLVQIASFGANARIANSGDNVHIIASGENSTVVSTGVVDSIILGPGGSAALAYHDGERVRFAVAIEGENNIRAGVRYRLNEQHQFVEC
>CP034953.1|QAA89736.1|2131315_2132101_+|thiosulfate-reductase-cytochrome-B-subunit
MNPSQHAEQFQSQLANYVPQFTPEFWPVWLIIAGVLLVGMWLVLGLHALLRARGVKKSATDHGEKIYLYSKAVRLWHWSNALLFVLLLASGLINHFAMVGATAVKSLVAVHEVCGFLLLACWLGFVLINAVGDNGHHYRIRRQGWLERAAKQTRFYLFGIMQGEEHPFPATTQSKFNPLQQVAYVGVMYGLLPLLLLTGLLCLYPQAVGDVFPGVRYWLLQTHFALAFISLFFIFGHLYLCTTGRTPHETFKSMVDGYHRH
>CP034953.1|QAA89735.1|2130650_2131319_+|4Fe-4S-dicluster-domain-containing-protein
MSFTRRKFVLGMGTVIFFTGSASSLLANTRQEKEVRYAMIHDESRCNGCNICARACRKTNHVPAQGSRLSIAHIPVTDNDNETQYHFFRQSCQHCEDAPCIDVCPTGASWRDEQGIVRVEKSQCIGCSYCIGACPYQVRYLNPVTKVADKCDFCAESRLAKGFPPICVSACPEHALIFGREDSPEIQAWLQQNKYYQYQLPGAGKPHLYRRFGQHLIKKENV
>CP034953.1|QAA89734.1|2129939_2130587_+|YdhW-family-putative-oxidoreductase-system-protein
MGKMNHQDELPLAKVSEVDEAKRQWLQGMRHPVDTVTEPEPAEILAEFIRQHSAAGQLVARAVFLSPPYLVAEEELSVLLESIKQNGDYADIACLTGSKDDYYYSTQAMSENYAAMSLQVVEQDICRAIAHAVRFECQTYPRPYKVAMLMQAPYYFQEAQIEAAIAAMDVAPEYADIRQVESSTAVLYLFSERFMTYGKAYGLCEWFEVEQFQNP
>CP034953.1|QAA89733.1|2127833_2129936_+|aldehyde-ferredoxin-oxidoreductase
MANGWTGNILRVNLTTGNITLEDSSKFKSFVGGMGFGYKIMYDEVPPGTKPFDEANKLVFATGPLTGSGAPCSSRVNITSLSTFTKGNLVVDAHMGGFFAAQMKFAGYDVIIIEGKAKSPVWLKIKDDKVSLEKADFLWGKGTRATTEEICRLTSPETCVAAIGQAGENLVPLSGMLNSRNHSGGAGTGAIMGSKNLKAIAVEGTKGVNIADRQEMKRLNDYMMTELIGANNNHVVPSTPQSWAEYSDPKSRWTARKGLFWGAAEGGPIETGEIPPGNQNTVGFRTYKSVFDLGPAAEKYTVKMSGCHSCPIRCMTQMNIPRVKEFGVPSTGGNTCVANFVHTTIFPNGPKDFEDKDDGRVIGNLVGLNLFDDYGLWCNYGQLHRDFTYCYSKGVFKRVLPAEEYAEIRWDQLEAGDVNFIKDFYYRLAHRVGELSHLADGSYAIAERWNLGEEYWGYAKNKLWSPFGYPVHHANEASAQVGSIVNCMFNRDCMTHTHINFIGSGLPLKLQREVAKELFGSEDAYDETKNYTPINDAKIKYAKWSLLRVCLHNAVTLCNWVWPMTVSPLKSRNYRGDLALEAKFFKAITGEEMTQEKLDLAAERIFTLHRAYTVKLMQTKDMRNEHDLICSWVFDKDPQIPVFTEGTDKMDRDDMHASLTMFYKEMGWDPQLGCPTRETLQRLGLEDIAADLAAHNLLPA
>CP034953.1|QAA89732.1|2127186_2127813_+|ferredoxin-like-protein
MNPVDRPLLDIGLTRLEFLRISGKGLAGLTIAPALLSLLGCKQEDIDSGTVGLINTPKGVLVTQRARCTGCHRCEISCTNFNDGSVGTFFSRIKIHRNYFFGDNGVGSGGGLYGDLNYTADTCRQCKEPQCMNVCPIGAITWQQKEGCITVDHKRCIGCSACTTACPWMMATVNTESKKSSKCVLCGECANACPTGALKIIEWKDITV
>CP034953.1|QAA89731.1|2126522_2126732_+|fumarate-hydratase-FumD
MGNRTKEDELYREMCRVVGKVVLEMRDLGQEPKHIVIAGVLRTALANKRIQRSELEKQAMETVINALVK
>CP034953.1|QAA89730.1|2124553_2125966_-|pyruvate-kinase-I
MKKTKIVCTIGPKTESEEMLAKMLDAGMNVMRLNFSHGDYAEHGQRIQNLRNVMSKTGKTAAILLDTKGPEIRTMKLEGGNDVSLKAGQTFTFTTDKSVIGNSEMVAVTYEGFTTDLSVGNTVLVDDGLIGMEVTAIEGNKVICKVLNNGDLGENKGVNLPGVSIALPALAEKDKQDLIFGCEQGVDFVAASFIRKRSDVIEIREHLKAHGGENIHIISKIENQEGLNNFDEILEASDGIMVARGDLGVEIPVEEVIFAQKMMIEKCIRARKVVITATQMLDSMIKNPRPTRAEAGDVANAILDGTDAVMLSGESAKGKYPLEAVSIMATICERTDRVMNSRLEFNNDNRKLRITEAVCRGAVETAEKLDAPLIVVATQGGKSARAVRKYFPDATILALTTNEKTAHQLVLSKGVVPQLVKEITSTDDFYRLGKELALQSGLAHKGDVVVMVSGALVPSGTTNTASVHVL
>CP034953.1|QAA89740.1|2135536_2136793_+|hypothetical-protein
MGSDAKNLMSDGNVQIVKTGEVIGATQLTEGELIVEAGGRAENTVVTGAGWLKVATGGIAKCTQYGNNGTLSVSDGAIATDIVQSEGGAISLSTLATVNGRHPEGEFSVDKGYACGLLLENGGNLRVLEGHRAEKIILDQEGGLLVNGTTSAVVVDEGGELLVYPGGEASNCEINQGGVFMLAGKASDTLLAGGTMNNLGGEDSDTIVENGSIYRLGTDGLQLYSSGKTQNLSVNVGGRAEVHAGTLENAVIQGGTVILLSPTSADENFVVEEDRAPVELTGSVALLDGASMIIGYGAELQQSTITVQQGGVLILDGSTVKGDSVTFIVGNINLNGGKLWLITDAATHVQLKVKRLRGEGAICLQTSAKEISPDFINVKGEVTGDIHVEITDASRQTLCNALKLQPDEDGIGATLQPA
>CP034953.1|QAA89741.1|2136833_2138207_-|multidrug-efflux-MATE-transporter-MdtK
MQKYISEARLLLALAIPVILAQIAQTAMGFVDTVMAGGYSATDMAAVAIGTSIWLPAILFGHGLLLALTPVIAQLNGSGRRERIAHQVRQGFWLAGFVSVLIMLVLWNAGYIIRSMENIDPALADKAVGYLRALLWGAPGYLFFQVARNQCEGLAKTKPGMVMGFIGLLVNIPVNYIFIYGHFGMPELGGVGCGVATAAVYWVMFLAMVSYIKRARSMRDIRNEKGTAKPDPAVMKRLIQLGLPIALALFFEVTLFAVVALLVSPLGIVDVAGHQIALNFSSLMFVLPMSLAAAVTIRVGYRLGQGSTLDAQTAARTGLMVGVCMATLTAIFTVSLREQIALLYNDNPEVVTLAAHLMLLAAVYQISDSIQVIGSGILRGYKDTRSIFYITFTAYWVLGLPSGYILALTDLVVEPMGPAGFWIGFIIGLTSAAIMMMLRMRFLQRLPSAIILQRASR
>CP034953.1|QAA89742.1|2138421_2139063_+|riboflavin-synthase
MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLAARENAMNQPGTEA
>CP034953.1|QAA89743.1|2139102_2140251_-|cyclopropane-fatty-acyl-phospholipid-synthase
MSSSCIEEVSVPDDNWYRIANELLSRAGIAINGSAPADIRVKNPDFFKRVLQEGSLGLGESYMDGWWECDRLDMFFSKVLRAGLENQLPHHFKDTLRIAGARLFNLQSKKRAWIVGKEHYDLGNDLFSRMLDPFMQYSCAYWKDADNLESAQQAKLKMICEKLQLKPGMRVLDIGCGWGGLAHYMASNYDVSVVGVTISAEQQKMAQERCEGLDVTILLQDYRDLNDQFDRIVSVGMFEHVGPKNYDTYFAVVDRNLKPEGIFLLHTIGSKKTDLNVDPWINKYIFPNGCLPSVRQIAQSSEPHFVMEDWHNFGADYDTTLMAWYERFLAAWPEIADNYSERFKRMFTYYLNACAGAFRARDIQLWQVVFSRGVENGLRVAR
>CP034953.1|QAA89744.1|2140541_2141753_-|Bcr/CflA-family-multidrug-efflux-MFS-transporter
MQPGKRFLVWLAGLSVLGFLATDMYLPAFAAIQADLQTPASAVSASLSLFLAGFAAAQLLWGPLSDRYGRKPVLLIGLTIFALGSLGMLWVENAATLLVLRFVQAVGVCAAAVIWQALVTDYYPSQKVNRIFAAIMPLVGLSPALAPLLGSWLLVHFSWQAIFATLFAITVVLILPIFWLKPTTKARNNSQDGLTFTDLLRSKTYRGNVLIYAACSASFFAWLTGSPFILSEMGYSPAVIGLSYVPQTIAFLIGGYGCRAALQKWQGKQLLPWLLVLFAVSVIATWAAGFISHVSLVEILIPFCVMAIANGAIYPIVVAQALRPFPHATGRAAALQNTLQLGLCFLASLVVSWLISISTPLLTTTSVMLSTVVLVALGYMMQRCEEVGCQNHGNAEVAHSESH
>CP034953.1|QAA89745.1|2141865_2142798_+|LysR-family-transcriptional-regulator
MWSEYSLEVVDAVARNGSFSAAAQELHRVPSAVSYTVRQLEEWLAVPLFERRHRDVELTAAGAWFLKEGRSVVKKMQITRQQCQQIANGWRGQLAIAVDNIVRPERTRQMIVDFYRHFDDVELLVFQEVFNGVWDALSDGRVELAIGATRAIPVGGRYAFRDMGMLSWSCVVASHHPLALMDGPFSDDTLRNWPSLVREDTSRTLPKRITWLLDNQKRVVVPDWESSATCISAGLCIGMVPTHFAKPWLNEGKWVALELENPFPDSACCLTWQQNDMSPALTWLLEYLGDSETLNKEWLREPEETPATGD
>CP034953.1|QAA89746.1|2142794_2143820_-|HTH-type-transcriptional-repressor-PurR
MATIKDVAKRANVSTTTVSHVINKTRFVAEETRNAVWAAIKELHYSPSAVARSLKVNHTKSIGLLATSSEAAYFAEIIEAVEKNCFQKGYTLILGNAWNNLEKQRAYLSMMAQKRVDGLLVMCSEYPEPLLAMLEEYRHIPMVVMDWGEAKADFTDAVIDNAFEGGYMAGRYLIERGHREIGVIPGPLERNTGAGRLAGFMKAMEEAMIKVPESWIVQGDFEPESGYRAMQQILSQPHRPTAVFCGGDIMAMGALCAADEMGLRVPQDVSLIGYDNVRNARYFTPALTTIHQPKDSLGETAFNMLLDRIVNKREEPQSIEVHPRLIERRSVADGPFRDYRR
>CP034953.1|QAA89747.1|2144118_2144208_+|YnhF-family-membrane-protein
MSTDLKFSLVTTIIVLGLIVAVGLTAALH
>CP034953.1|QAA89748.1|2144373_2145543_+|MFS-transporter
MKINYPLLALAIGAFGIGTTEFSPMGLLPVIARGVDVSIPAAGMLISAYAVGVMVGAPLMTLLLSHRARRSALIFLMAIFTLGNVLSAIAPDYMTLMLSRILTSLNHGAFFGLGSVVAASVVPKHKQASAVATMFMGLTLANIGGVPAATWLGETIGWRMSFLATAGLGVISMVSLFFSLPKGGAGARPEVKKELAVLMRPQVLSALLTTVLGAGAMFTLYTYISPVLQSITHATPVFVTAMLVLIGVGFSIGNYLGGKLADRSVNGTLKGFLLLLMVIMLAIPFLARNEFGAAISMVVWGAATFAVVPPLQMRVMRVASEAPGLSSSVNIGAFNLGNALGAAAGGAVISAGLGYSFVPVMGAIVAGLALLLVFMSARKQPETVCVANS
>CP034953.1|QAA89749.1|2145704_2146286_-|superoxide-dismutase-[Fe]
MSFELPALPYAKDALAPHISAETIEYHYGKHHQTYVTNLNNLIKGTAFEGKSLEEIIRSSEGGVFNNAAQVWNHTFYWNCLAPNAGGEPTGKVAEAIAASFGSFADFKAQFTDAAIKNFGSGWTWLVKNSDGKLAIVSTSNAGTPLTTDATPLLTVDVWEHAYYIDYRNARPGYLEHFWALVNWEFVAKNLAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP034953_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_7

3061743-3061887

Orphan

Consensus_repeat	Method
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP034953_7

>merge|CP034953|7|3061743-3061887|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGCTGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTCGTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

>CP034953|7|7|3061743-3061887|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	TGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTC
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA90568.1\|3055397_3056153_-\|malonyl-ACP-O-methyltransferase-BioC	unknown	unknown	gnl\|CDD\|182340
CP034953.1\|QAA90577.1\|3067099_3068053_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176131
CP034953.1\|QAA90569.1\|3056139_3057294_-\|8-amino-7-oxononanoate-synthase	unknown	unknown	gnl\|CDD\|235655
CP034953.1\|QAA90576.1\|3065863_3066916_-\|4-oxalomesaconate-tautomerase	unknown	unknown	gnl\|CDD\|380230
CP034953.1\|QAA90580.1\|3070062_3071121_-\|molybdenum-ABC-transporter-ATP-binding-protein-ModC	unknown	unknown	gnl\|CDD\|182993
CP034953.1\|QAA90565.1\|3051027_3051936_+\|uridine-diphosphate-N-acetylglucosamine-binding-protein-YvcK	unknown	unknown	gnl\|CDD\|211689
CP034953.1\|QAA90575.1\|3064354_3065788_-\|anion-permease	unknown	unknown	gnl\|CDD\|279307
CP034953.1\|QAA90578.1\|3068093_3069089_-\|6-phosphogluconolactonase	unknown	unknown	gnl\|CDD\|182912
CP034953.1\|QAA90574.1\|3061910_3064172_-\|hydratase	unknown	unknown	gnl\|CDD\|183125
CP034953.1\|QAA90583.1\|3072752_3072902_-\|multidrug-efflux-pump-associated-protein,-AcrZ-family	unknown	unknown	gnl\|CDD\|371231
CP034953.1\|QAA90566.1\|3052127_3054149_-\|excinuclease-ABC-subunit-B	unknown	unknown	gnl\|CDD\|235395
CP034953.1\|QAA90572.1\|3059765_3060242_+\|kinase-inhibitor	unknown	unknown	gnl\|CDD\|182339
CP034953.1\|QAA90582.1\|3071812_3072586_-\|molybdate-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|182641
CP034953.1\|QAA90567.1\|3054727_3055405_-\|ATP-dependent-dethiobiotin-synthetase-BioD	unknown	unknown	gnl\|CDD\|234625
CP034953.1\|QAA90579.1\|3069243_3070062_+\|pyridoxal-phosphatase	unknown	unknown	gnl\|CDD\|182523
CP034953.1\|QAA90570.1\|3057290_3058331_-\|biotin-synthase	unknown	unknown	gnl\|CDD\|185063
CP034953.1\|QAA90581.1\|3071123_3071813_-\|molybdenum-ABC-transporter-permease	unknown	unknown	gnl\|CDD\|181841
CP034953.1\|QAA90571.1\|3058417_3059707_+\|adenosylmethionine--8-amino-7-oxononanoate-transaminase	unknown	unknown	gnl\|CDD\|181189
CP034953.1\|QAA90573.1\|3060393_3061677_+\|putative-acyl-CoA-thioester-hydrolase	unknown	unknown	gnl\|CDD\|236709
CP034953.1\|QAA90564.1\|3049641_3050631_-\|GTP-3',8-cyclase-MoaA	unknown	unknown	gnl\|CDD\|234672

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA90568.1\|3055397_3056153_-\|malonyl-ACP-O-methyltransferase-BioC	gnl\|CDD\|182340	PRK10258, PRK10258, biotin biosynthesis protein BioC; Provisional.	7.9121e-172
CP034953.1\|QAA90577.1\|3067099_3068053_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176131	cd08440, PBP2_LTTR_like_4, TThe C-terminal substrate binding domain of an uncharacterized LysR-type transcriptional regulator, contains the type 2 periplasmic binding fold. LysR-transcriptional regulators comprise the largest family of prokaryotic transcription factor. Homologs of some of LTTRs with similar domain organizations are also found in the archaea and eukaryotic organisms. The LTTRs are composed of two functional domains joined by a linker helix involved in oligomerization: an N-terminal HTH (helix-turn-helix) domain, which is responsible for the DNA-binding specificity, and a C-terminal substrate-binding domain, which is structurally homologous to the type 2 periplasmic binding proteins. As also observed in the periplasmic binding proteins, the C-terminal domain of the bacterial transcriptional repressor undergoes a conformational change upon substrate binding which in turn changes the DNA binding affinity of the repressor. The genes controlled by the LTTRs have diverse functional roles including amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to a name a few. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	1.43952e-82
CP034953.1\|QAA90569.1\|3056139_3057294_-\|8-amino-7-oxononanoate-synthase	gnl\|CDD\|235655	PRK05958, PRK05958, 8-amino-7-oxononanoate synthase; Reviewed.	0
CP034953.1\|QAA90576.1\|3065863_3066916_-\|4-oxalomesaconate-tautomerase	gnl\|CDD\|380230	NF033377, OMA_tautomer, 4-oxalomesaconate tautomerase.	0
CP034953.1\|QAA90580.1\|3070062_3071121_-\|molybdenum-ABC-transporter-ATP-binding-protein-ModC	gnl\|CDD\|182993	PRK11144, modC, molybdenum ABC transporter ATP-binding protein ModC.	0
CP034953.1\|QAA90565.1\|3051027_3051936_+\|uridine-diphosphate-N-acetylglucosamine-binding-protein-YvcK	gnl\|CDD\|211689	TIGR01826, Putative_gluconeogenesis_factor, conserved hypothetical protein, cofD-related. This model represents a subfamily of conserved hypothetical proteins that forms a sister group to the family of CofD, (TIGR01819), LPPG:Fo 2-phospho-L-lactate transferase, an enzyme of cytochrome F420 biosynthesis. Both this family and TIGR01819 are within the scope of the pfam01933. [Hypothetical proteins, Conserved].	2.22556e-139
CP034953.1\|QAA90575.1\|3064354_3065788_-\|anion-permease	gnl\|CDD\|279307	pfam00939, Na_sulph_symp, Sodium:sulfate symporter transmembrane region. There are also some members in this family that do not match the Prosite motif, and belong to the subfamily SODIT1.	0
CP034953.1\|QAA90578.1\|3068093_3069089_-\|6-phosphogluconolactonase	gnl\|CDD\|182912	PRK11028, PRK11028, 6-phosphogluconolactonase; Provisional.	0
CP034953.1\|QAA90574.1\|3061910_3064172_-\|hydratase	gnl\|CDD\|183125	PRK11413, PRK11413, putative hydratase; Provisional.	0
CP034953.1\|QAA90583.1\|3072752_3072902_-\|multidrug-efflux-pump-associated-protein,-AcrZ-family	gnl\|CDD\|371231	pfam10766, AcrZ, Multidrug efflux pump-associated protein AcrZ. AcrZ is associated with the AcrA-TolC multidrug efflux pump, it may enhance the ability of the pump to recognize and export certain substrates.	1.04381e-17
CP034953.1\|QAA90566.1\|3052127_3054149_-\|excinuclease-ABC-subunit-B	gnl\|CDD\|235395	PRK05298, PRK05298, excinuclease ABC subunit UvrB.	0
CP034953.1\|QAA90572.1\|3059765_3060242_+\|kinase-inhibitor	gnl\|CDD\|182339	PRK10257, PRK10257, putative kinase inhibitor protein; Provisional.	1.08182e-118
CP034953.1\|QAA90582.1\|3071812_3072586_-\|molybdate-ABC-transporter-substrate-binding-protein	gnl\|CDD\|182641	PRK10677, modA, molybdate transporter periplasmic protein; Provisional.	0
CP034953.1\|QAA90567.1\|3054727_3055405_-\|ATP-dependent-dethiobiotin-synthetase-BioD	gnl\|CDD\|234625	PRK00090, bioD, ATP-dependent dethiobiotin synthetase BioD.	3.39733e-110
CP034953.1\|QAA90579.1\|3069243_3070062_+\|pyridoxal-phosphatase	gnl\|CDD\|182523	PRK10530, PRK10530, pyridoxal phosphate (PLP) phosphatase; Provisional.	0
CP034953.1\|QAA90570.1\|3057290_3058331_-\|biotin-synthase	gnl\|CDD\|185063	PRK15108, PRK15108, biotin synthase; Provisional.	0
CP034953.1\|QAA90581.1\|3071123_3071813_-\|molybdenum-ABC-transporter-permease	gnl\|CDD\|181841	PRK09421, modB, molybdate ABC transporter permease subunit.	2.41762e-146
CP034953.1\|QAA90571.1\|3058417_3059707_+\|adenosylmethionine--8-amino-7-oxononanoate-transaminase	gnl\|CDD\|181189	PRK07986, PRK07986, adenosylmethionine--8-amino-7-oxononanoate transaminase; Validated.	0
CP034953.1\|QAA90573.1\|3060393_3061677_+\|putative-acyl-CoA-thioester-hydrolase	gnl\|CDD\|236709	PRK10531, PRK10531, putative acyl-CoA thioester hydrolase.	0
CP034953.1\|QAA90564.1\|3049641_3050631_-\|GTP-3',8-cyclase-MoaA	gnl\|CDD\|234672	PRK00164, moaA, GTP 3',8-cyclase MoaA.	0

>CP034953.1|QAA90573.1|3060393_3061677_+|putative-acyl-CoA-thioester-hydrolase
MNTFSVSRLALALAFGVTLTACSSTPPDQRPSDQTAPGTSSRPILSAKEAQNFDAQHYFASLTPGAAAWNPSPITLPAQPDFVVGPAGTQGVTHTTIQAAVDAAIIKRTNKRQYIAVMPGEYQGTVYVPAAPGGITLYGTGEKPIDVKIGLSLDGGMSPADWRHDVNPRGKYMPGKPAWYMYDSCQSKRSDSIGVLCSAVFWSQNNGLQLQNLTIENTLGDSVDAGNHPAVALRTDGDQVQINNVNILGRQNTFFVTNSGVQNRLETNRQPRTLVTNSYIEGDVDIVSGRGAVVFDNTEFRVVNSRTQQEAYVFAPATLSNIYYGFLAVNSRFNAFGDGVAQLGRSLDVDANTNGQVVIRDSAINEGFNTAKPWADAVISNRPFAGNTGSVDDNDEIQRNLNDTNYNRMWEYNNRGVGSKVVAEAKK
>CP034953.1|QAA90572.1|3059765_3060242_+|kinase-inhibitor
MKLISNDLRDGDKLPHRHVFNGMGYDGDNISPHLAWDDVPAGTKSFVVTCYDPDAPTGSGWWHWVVVNLPADTRVLPQGFGSGLVAMPDGVLQTRTDFGKTGYDGAAPPKGETHRYIFTVHALDIERIDVDEGASGAMVGFNVHFHSLASASITAMFS
>CP034953.1|QAA90571.1|3058417_3059707_+|adenosylmethionine--8-amino-7-oxononanoate-transaminase
MTTDDLAFDQRHILHPYTSMTSPLPVYPVVSAEGCELILSDGRRLVDGMSSWWAAIHGYNHPQLNAAMKSQIDAMSHVMFGGITHAPAIELCRKLVAMTPQPLECVFLADSGSVAVEVAMKMALQYWQAKGEARQRFLTFRNGYHGDTFGAMSVCDPDNSMHSLWKGYLPENLFAPAPQSRMDGEWDERDMVGFARLMAAHRHEIAAVIIEPIVQGAGGMRMYHPEWLKRIRKICDREGILLIADEIATGFGRTGKLFACEHAEIAPDILCLGKALTGGTMTLSATLTTREVAETISNGEAGCFMHGPTFMGNPLACAAANASLAILESGDWQQQVADIEVQLREQLAPARDAEMVADVRVLGAIGVVETTHPVNMAALQKFFVEQGVWIRPFGKLIYLMPPYIILPQQLQRLTAAVNRAVQDETFFCQ
>CP034953.1|QAA90570.1|3057290_3058331_-|biotin-synthase
MAHRPRWTLSQVTELFEKPLLDLLFEAQQVHRQHFDPRQVQVSTLLSIKTGACPEDCKYCPQSSRYKTGLEAERLMEVEQVLESARKAKAAGSTRFCMGAAWKNPHERDMPYLEQMVQGVKAMGLEACMTLGTLSESQAQRLANAGLDYYNHNLDTSPEFYGNIITTRTYQERLDTLEKVRDAGIKVCSGGIVGLGETVKDRAGLLLQLANLPTPPESVPINMLVKVKGTPLADNDDVDAFDFIRTIAVARIMMPTSYVRLSAGREQMNEQTQAMCFMAGANSIFYGCKLLTTPNPEEDKDLQLFRKLGLNPQQTAVLAGDNEQQQRLEQALMTPDTDEYYNAAAL
>CP034953.1|QAA90569.1|3056139_3057294_-|8-amino-7-oxononanoate-synthase
MSWQEKINAALDARRAADALRRRYPVAQGAGRWLVADDRQYLNFSSNDYLGLSHHPQIIRAWQQGAEQFGIGSGGSGHVSGYSVVHQALEEELAEWLGYSRALLFISGFAANQAVIAAMMAKEDRIAADRLSHASLLEAASLSPSQLRRFAHNDVTHLARLLASPCPGQQMVVTEGVFSMDGDSAPLAEIQQVTQQHNGWLMVDDAHGTGVIGEQGRGSCWLQKVKPELLVVTFGKGFGVSGAAVLCSSTVADYLLQFARHLIYSTSMPPAQAQALRASLAVIRSDEGDARREKLAALITRFRAGVQDLPFTLADSCSAIQPLIVGDNSRALQLAEKLRQQGCWVTAIRPPTVPAGTARLRLTLTAAHEMQDIDRLLEVLHGNG
>CP034953.1|QAA90568.1|3055397_3056153_-|malonyl-ACP-O-methyltransferase-BioC
MATVNKQAIAAAFGRAAAHYEQHADLQRQSADALLAMLPQRKYTHVLDAGCGPGWMSRHWRERHAQVTALDLSPPMLVQARQKDAADHYLAGDIESLPLATATFDLAWSNLAVQWCGNLSTALRELYRVVRPKGVVAFTTLVQGSLPELHQAWQAVDERPHANRFLPPDEIEQSLNGVHYQHHIQPITLWFDDALSAMRSLKGIGATHLHEGRDPRILTRSQLQRLQLAWPQQQGRYPLTYHLFLGVIARE
>CP034953.1|QAA90567.1|3054727_3055405_-|ATP-dependent-dethiobiotin-synthetase-BioD
MSKRYFVTGTDTEVGKTVASCALLQAAKAAGYRTAGYKPVASGSEKTPEGLRNSDALALQRNSSLQLDYATVNPYTFAEPTSPHIISAQEGRPIESLVMSAGLRALEQQADWVLVEGAGGWFTPLSDTFTFADWVTQEQLPVILVVGVKLGCINHAMLTAQVIQHAGLTLAGWVANDVTPPGKRHAEYMTTLTRMIPAPLLGEIPWLAENPENAATGKYINLALL
>CP034953.1|QAA90566.1|3052127_3054149_-|excinuclease-ABC-subunit-B
MSKPFKLNSAFKPSGDQPEAIRRLEEGLEDGLAHQTLLGVTGSGKTFTIANVIADLQRPTMVLAPNKTLAAQLYGEMKEFFPENAVEYFVSYYDYYQPEAYVPSSDTFIEKDASVNEHIEQMRLSATKAMLERRDVVVVASVSAIYGLGDPDLYLKMMLHLTVGMIIDQRAILRRLAELQYARNDQAFQRGTFRVRGEVIDIFPAESDDIALRVELFDEEVERLSLFDPLTGQIVSTIPRFTIYPKTHYVTPRERIVQAMEEIKEELAARRKVLLENNKLLEEQRLTQRTQFDLEMMNELGYCSGIENYSRFLSGRGPGEPPPTLFDYLPADGLLVVDESHVTIPQIGGMYRGDRARKETLVEYGFRLPSALDNRPLKFEEFEALAPQTIYVSATPGNYELEKSGGDVVDQVVRPTGLLDPIIEVRPVATQVDDLLSEIRQRAAINERVLVTTLTKRMAEDLTEYLEEHGERVRYLHSDIDTVERMEIIRDLRLGEFDVLVGINLLREGLDMPEVSLVAILDADKEGFLRSERSLIQTIGRAARNVNGKAILYGDKITPSMAKAIGETERRREKQQKYNEEHGITPQGLNKKVVDILALGQNIAKTKAKGRGKSRPIVEPDNVPMDMSPKALQQKIHELEGLMMQHAQNLEFEEAAQIRDQLHQLRELFIAAS
>CP034953.1|QAA90565.1|3051027_3051936_+|uridine-diphosphate-N-acetylglucosamine-binding-protein-YvcK
MRNRTLADLDRVVALGGGHGLGRVLSSLSSLGSRLTGIVTTTDNGGSTGRIRRSEGGIAWGDMRNCLNQLITEPSVASAMFEYRFGGNGELSGHNLGNLMLKALDHLSVRPLEAINLIRNLLKVDTHLIPMSEHPVDLMAIDDQGHEVYGEVNIDQLTTPIQELLLTPNVPATREAVHAINEADLIIIGPGSFYTSLMPILLLKEIAQALRRTPAPMVYIGNLGRELSLPAANLKLESKLAIMEQYVGKKVIDAVIVGPKVDVSAVKERIVIQEVLEASDIPYRHDRQLLHNALEKALQALG
>CP034953.1|QAA90564.1|3049641_3050631_-|GTP-3',8-cyclase-MoaA
MASQLTDAFARKFYYLRLSITDVCNFRCTYCLPDGYKPSGVTNKGFLTVDEIRRVTRAFARLGTEKVRLTGGEPSLRRDFTDIIAAVRENDAIRQIAVTTNGYRLERDVASWRDAGLTGINVSVDSLDARQFHAITGQDKFNQVMAGIDAAFEAGFEKVKVNTVLMRDVNHHQLDTFLNWIQHRPIQLRFIELMETGEGSELFRKHHISGQVLRDELLRRGWIHQLRQRSDGPAQVFCHPDYAGEIGLIMPYEKDFCATCNRLRVSSIGKLHLCLFGEGGVNLRDLLEDDTQQQALEARISAALREKKQTHFLHQNNTGITQNLSYIGG
>CP034953.1|QAA90574.1|3061910_3064172_-|hydratase
MIKLSEKGVFLASNNEIIAEEHFTGEIKKEEAKKGTIAWSILSSHNTSGNMDKLKIKFDSLASHDITFVGIVQTAKASGMERFPLPYVLTNCHNSLCAVGGTINGDDHVFGLSAAQRYGGIFVPPHIAVIHQYMREMMAGGGKMILGSDSHTRYGALGTMAVGEGGGELVKQLLNDTWDIDYPGVVAVHLTGKPAPYVGPQDVALAIIGAVFKNGYVKNKVMEFVGPGVSALSTDFRNSVDVMTTETTCLSSVWQTDEEVHNWLALHGRGQDYCQLNPQPMAYYDGCISVDLSAIKPMIALPFHPSNVYEIDTLNQNLTDILREIEIESERVAHGKAKLSLLDKVENGRLKVQQGIIAGCSGGNYENVIAAANALRGQSCGNDTFSLAVYPSSQPVFMDLAKKGVVADLIGAGAIIRTAFCGPCFGAGDTPINNGLSIRHTTRNFPNREGSKPANGQMSAVALMDARSIAATAANGGYLTSASELDCWDNVPEYAFDVTPYKNRVYQGFVKGATQQPLIYGPNIKDWPELGALTDNIVLKVCSKILDEVTTTDELIPSGETSSYRSNPIGLAEFTLSRRDPGYVSRSKATAELENQRLAGNVSELTEVFARIKQIAGQEHIDPLQTEIGSMVYAVKPGDGSAREQAASCQRVIGGLANIAEEYATKRYRSNVINWGMLPLQMAEVPTFEVGDYIYIPGIKAALDNPGTTFKGYVIHEDAPVTEITLYMESLTAEEREIIKAGSLINFNKNRQM
>CP034953.1|QAA90575.1|3064354_3065788_-|anion-permease
MNKKSLWKLILILAIPCIIGFMPAPAGLSELAWVLFGIYLAAIVGLVIKPFPEPVVLLIAVAASMVVVGNLSDGAFKTTAVLSGYSSGTTWLVFSAFTLSAAFVTTGLGKRIAYLLIGKIGNTTLGLGYVTVFLDLVLAPATPSNTARAGGIVLPIINSVAVALGSEPEKSPRRVGHYLMMSIYMVTKTTSYMFFTAMAGNILALKMINDILHLQISWGGWALAAGLPGIIMLLVTPLVIYTMYPPEIKKVDNKTIAKAGLAELGPMKIREKMLLGVFVLALLGWIFSKSLGVDESTVAIVVMATMLLLGIVTWEDVVKNKGGWNTLIWYGGIIGLSSLLSKVKFFEWLAEVFKNNLAFDGHGNVAFFVIIFLSIIVRYFFASGSAYIVAMLPVFAMLANVSGAPLMLTALALLFSNSYGGMVTHYGGAAGPVIFGVGYNDIKSWWLVGAVLTILTFLVHITLGVWWWNMLIGWNML
>CP034953.1|QAA90576.1|3065863_3066916_-|4-oxalomesaconate-tautomerase
MKKIPCVMMRGGTSRGAFLLAEHLPEDQTQRDKILMAIMGSGNDLEIDGIGGGNPLTSKVAIISRSSDPRADVDYLFAQVIVHEQRVDTTPNCGNMLSGVGAFAIENGLIAATSPVTRVRIRNVNTGTFIEADVQTPNGVVEYEGSARIDGVPGTAAPVALTFLNAAGTKTGKVFPTDNQIDYFDDVPVTCIDMAMPVVIIPAEYLGKTGYELPAELDADKALLARIESIRLQAGKAMGLGDVSNMVIPKPVLISPAQKGGAINVRYFMPHSCHRALAITGAIAISSSCALEGTVTRQIVPSVGYGNINIEHPSGALDVHLSNEGQDATTLRASVIRTTRKIFSGEVYLP
>CP034953.1|QAA90577.1|3067099_3068053_+|LysR-family-transcriptional-regulator
MKHELSSMKAFVILAESSSFNNAAKLLNITQPALTRRIKKMEEDLHVQLFERTTRKVTLTKAGKRLLPEARELIKKFDETLFNIRDMNAYHRGMVTLACIPTAVFYFLPLAIGKFNELYPNIKVRILEQGTNNCMESVLCNESDFGINMNNVTNSSIDFTPLVNEPFVLACRRDHPLAKKQLVEWQELVGYKMIGVRSSSGNRLLIEQQLADKPWKLDWFYEVRHLSTSLGLVEAGLGISALPGLAMPHAPYSSIIGIPLVEPVIRRTLGIIRRKDAVLSPAAERFFALLINLWTDDKDNLWTNIVERQRHALQEIG
>CP034953.1|QAA90578.1|3068093_3069089_-|6-phosphogluconolactonase
MKQTVYIASPESQQIHVWNLNHEGALTLTQVVDVPGQVQPMVVSPDKRYLYVGVRPEFRVLAYRIAPDDGALTFAAESALPGSPTHISTDHQGQFVFVGSYNAGNVSVTRLEDGLPVGVVDVVEGLDGCHSANISPDNRTLWVPALKQDRICLFTVSDDGHLVAQDPAEVTTVEGAGPRHMVFHPNEQYAYCVNELNSSVDVWELKDPHGNIECVQTLDMMPENFSDTRWAADIHITPDGRHLYACDRTASLITVFSVSEDGSVLSKEGFQPTETQPRGFNVDHSGKYLIAAGQKSHHISVYEIVGEQGLLHEKGRYAVGQGPMWVVVNAH
>CP034953.1|QAA90579.1|3069243_3070062_+|pyridoxal-phosphatase
MTTRVIALDLDGTLLTPKKTLLPSSIEALARAREAGYQLIIVTGRHHVAIHPFYQALALDTPAICCNGTYLYDYHAKTVLEADPMPVIKALQLIEMLNEHHIHGLMYVDDAMVYEHPTGHVIRTSNWAQTLPPEQRPTFTQVASLAETAQQVNAVWKFALTHDDLPQLQHFGKHVEHELGLECEWSWHDQVDIARGGNSKGKRLTKWVEAQGWSMENVVAFGDNFNDISMLEAAGTGVAMGNADDAVKARANIVIGDNTTDSIAQFIYSHLI
>CP034953.1|QAA90580.1|3070062_3071121_-|molybdenum-ABC-transporter-ATP-binding-protein-ModC
MLELNFSQTLGNHCLTINETLPANGITAIFGVSGAGKTSLINAISGLTRPQKGRIVLNGRVLNDAEKGICLTPEKRRVGYVFQDARLFPHYKVRGNLRYGMSKSMVDQFDKLVALLGIEPLLDRLPGSLSGGEKQRVAIGRALLTAPELLLLDEPLASLDIPRKRELLPYLQRLTREINIPMLYVSHSLDEILHLADRVMVLENGQVKAFGALEEVWGSSVMNPWLPKEQQSSILKVTVLEHHPHYAMTALALGDQHLWVNKLDEPLQAALRIRIQASDVSLVLQPPQQTSIRNVLRAKVVNSYDDNGQVEVELEVGGKTLWARISPWARDELAIKPGLWLYAQIKSVSITA
>CP034953.1|QAA90581.1|3071123_3071813_-|molybdenum-ABC-transporter-permease
MILTDPEWQAVLLSLKVSSLAVLFSLPFGIFFAWLLVRCTFPGKALLDSVLHLPLVLPPVVVGYLLLVSMGRRGFIGERLYDWFGITFAFSWRGAVLAAAVMSFPLMVRAIRLALEGVDVKLEQAARTLGAGRWRVFFTITLPLTLPGIIVGTVLAFARSLGEFGATITFVSNIPGETRTIPSAMYTLIQTPGGESGAARLCIISIALAMISLLISEWLARISRERAGR
>CP034953.1|QAA90582.1|3071812_3072586_-|molybdate-ABC-transporter-substrate-binding-protein
MARKWLNLFAGAALSFAVAGNALADEGKITVFAAASLTNAMQDIATQFKKEKGVDVVSSFASSSTLARQIEAGAPADLFISADQKWMDYAVDKKAIDTATRQTLLGNSLVVVAPKASVQKDFTIDSKTNWTSLLNGGRLAVGDPEHVPAGIYAKEALQKLGAWDTLSPKLAPAEDVRGALALVERNEAPLGIVYGSDAVASKGVKVVATFPEDSHKKVEYPVAVVEGHNNATVKAFYDYLKGPQAAEIFKRYGFTIK
>CP034953.1|QAA90583.1|3072752_3072902_-|multidrug-efflux-pump-associated-protein,-AcrZ-family
MLELLKSLVFAVIMVPVVMAIILGLIYGLGEVFNIFSGVGKKDQPGQNH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP034953_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_8

3317549-3317645

Orphan

Consensus_repeat	Method
TTGTAGGCCTGATAAGATGCGTCAAGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP034953_8

>merge|CP034953|8|3317549-3317645|CRISPRCasFinder
TTGTAGGCCTGATAAGATGCGTCAAGCATCGCATCAGGCATTGTGCACCAATTGCCGGATGCGGCACCGGTTGTAGGCCTGATAAGACGCGTCAAGC

>CP034953|8|8|3317549-3317645|CRISPRCasFinder
TTGTAGGCCTGATAAGATGCGTCAAGC	ATCGCATCAGGCATTGTGCACCAATTGCCGGATGCGGCACCGG
TTGTAGGCCTGATAAGACGCGTCAAGC

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA90789.1\|3311269_3312136_+\|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD	unknown	unknown	gnl\|CDD\|236760
CP034953.1\|QAA90791.1\|3312457_3312979_+\|metal-dependent-hydrolase	unknown	unknown	gnl\|CDD\|224899
CP034953.1\|QAA90790.1\|3312137_3312350_+\|ribosome-associated-protein-YbcJ	unknown	unknown	gnl\|CDD\|183166
CP034953.1\|QAA90799.1\|3319394_3320654_-\|DUF1116-domain-containing-protein	unknown	unknown	gnl\|CDD\|377673
CP034953.1\|QAA90787.1\|3309344_3310037_-\|molecular-chaperone-FimC	unknown	unknown	gnl\|CDD\|185117
CP034953.1\|QAA90793.1\|3314573_3315068_+\|peptidylprolyl-isomerase-B	unknown	unknown	gnl\|CDD\|182734
CP034953.1\|QAA90797.1\|3317678_3318572_-\|carbamate-kinase	unknown	unknown	gnl\|CDD\|181831
CP034953.1\|QAA90806.1\|3328502_3329864_-\|allantoinase-AllB	unknown	unknown	gnl\|CDD\|169193
CP034953.1\|QAA90795.1\|3315910_3316420_+\|5-(carboxyamino)imidazole-ribonucleotide-mutase	unknown	unknown	gnl\|CDD\|223119
CP034953.1\|QAA90801.1\|3322647_3323697_+\|ureidoglycolate-dehydrogenase	unknown	unknown	gnl\|CDD\|184985
CP034953.1\|QAA90792.1\|3313014_3314400_-\|cysteine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234705
CP034953.1\|QAA90798.1\|3318568_3319384_-\|DUF2877-domain-containing-protein	unknown	unknown	gnl\|CDD\|378658
CP034953.1\|QAA90800.1\|3320663_3322331_-\|acyl-CoA-synthetase-FdrA	unknown	unknown	gnl\|CDD\|180395
CP034953.1\|QAA90788.1\|3310256_3310799_-\|type-1-fimbrial-protein-subunit-FimA	unknown	unknown	gnl\|CDD\|237920
CP034953.1\|QAA90805.1\|3327144_3328446_-\|uracil/xanthine-transporter	unknown	unknown	gnl\|CDD\|183124
CP034953.1\|QAA90794.1\|3315070_3315793_+\|UDP-2,3-diacylglucosamine-diphosphatase	unknown	unknown	gnl\|CDD\|235420
CP034953.1\|QAA90796.1\|3316416_3317484_+\|5-(carboxyamino)imidazole-ribonucleotide-synthase	unknown	unknown	gnl\|CDD\|235674
CP034953.1\|QAA90802.1\|3323718_3324954_+\|allantoate-amidohydrolase	unknown	unknown	gnl\|CDD\|274471
CP034953.1\|QAA90803.1\|3324964_3325750_+\|(S)-ureidoglycine-aminohydrolase	unknown	unknown	gnl\|CDD\|200251
CP034953.1\|QAA90804.1\|3325977_3327123_-\|glycerate-3-kinase	unknown	unknown	gnl\|CDD\|182152

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA90789.1\|3311269_3312136_+\|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD	gnl\|CDD\|236760	PRK10792, PRK10792, bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD.	0
CP034953.1\|QAA90791.1\|3312457_3312979_+\|metal-dependent-hydrolase	gnl\|CDD\|224899	COG1988, COG1988, Predicted membrane-bound metal-dependent hydrolases [General function prediction only].	4.92496e-31
CP034953.1\|QAA90790.1\|3312137_3312350_+\|ribosome-associated-protein-YbcJ	gnl\|CDD\|183166	PRK11507, PRK11507, ribosome-associated protein YbcJ.	1.38756e-42
CP034953.1\|QAA90799.1\|3319394_3320654_-\|DUF1116-domain-containing-protein	gnl\|CDD\|377673	pfam06545, DUF1116, Protein of unknown function (DUF1116). This family contains hypothetical bacterial proteins of unknown function.	1.27269e-131
CP034953.1\|QAA90787.1\|3309344_3310037_-\|molecular-chaperone-FimC	gnl\|CDD\|185117	PRK15195, PRK15195, molecular chaperone FimC.	4.4332e-149
CP034953.1\|QAA90793.1\|3314573_3315068_+\|peptidylprolyl-isomerase-B	gnl\|CDD\|182734	PRK10791, PRK10791, peptidylprolyl isomerase B.	9.12357e-121
CP034953.1\|QAA90797.1\|3317678_3318572_-\|carbamate-kinase	gnl\|CDD\|181831	PRK09411, PRK09411, carbamate kinase; Reviewed.	0
CP034953.1\|QAA90806.1\|3328502_3329864_-\|allantoinase-AllB	gnl\|CDD\|169193	PRK08044, PRK08044, allantoinase AllB.	0
CP034953.1\|QAA90795.1\|3315910_3316420_+\|5-(carboxyamino)imidazole-ribonucleotide-mutase	gnl\|CDD\|223119	COG0041, PurE, Phosphoribosylcarboxyaminoimidazole (NCAIR) mutase [Nucleotide transport and metabolism].	1.14024e-91
CP034953.1\|QAA90801.1\|3322647_3323697_+\|ureidoglycolate-dehydrogenase	gnl\|CDD\|184985	PRK15025, PRK15025, ureidoglycolate dehydrogenase; Provisional.	0
CP034953.1\|QAA90792.1\|3313014_3314400_-\|cysteine--tRNA-ligase	gnl\|CDD\|234705	PRK00260, cysS, cysteinyl-tRNA synthetase; Validated.	0
CP034953.1\|QAA90798.1\|3318568_3319384_-\|DUF2877-domain-containing-protein	gnl\|CDD\|378658	pfam11392, DUF2877, Protein of unknown function (DUF2877). This bacterial family of proteins are putative carboxylase proteins however this cannot be confirmed.	3.47659e-37
CP034953.1\|QAA90800.1\|3320663_3322331_-\|acyl-CoA-synthetase-FdrA	gnl\|CDD\|180395	PRK06091, PRK06091, membrane protein FdrA; Validated.	0
CP034953.1\|QAA90788.1\|3310256_3310799_-\|type-1-fimbrial-protein-subunit-FimA	gnl\|CDD\|237920	PRK15194, PRK15194, type 1 fimbrial protein subunit FimA.	9.67411e-92
CP034953.1\|QAA90805.1\|3327144_3328446_-\|uracil/xanthine-transporter	gnl\|CDD\|183124	PRK11412, PRK11412, uracil/xanthine transporter.	0
CP034953.1\|QAA90794.1\|3315070_3315793_+\|UDP-2,3-diacylglucosamine-diphosphatase	gnl\|CDD\|235420	PRK05340, PRK05340, UDP-2,3-diacylglucosamine hydrolase; Provisional.	2.41122e-165
CP034953.1\|QAA90796.1\|3316416_3317484_+\|5-(carboxyamino)imidazole-ribonucleotide-synthase	gnl\|CDD\|235674	PRK06019, PRK06019, phosphoribosylaminoimidazole carboxylase ATPase subunit; Reviewed.	2.50904e-178
CP034953.1\|QAA90802.1\|3323718_3324954_+\|allantoate-amidohydrolase	gnl\|CDD\|274471	TIGR03176, AllC, allantoate amidohydrolase. This enzyme catalyzes the breakdown of allantoate, first to ureidoglycine by hydrolysis and then decarboxylation of one of the two equivalent ureido groups. Ureidoglycine then spontaneously exchanges ammonia for water resulting in ureidoglycolate. This enzyme is an alternative to allantoicase (3.5.3.4) which releases urea. [Central intermediary metabolism, Nitrogen metabolism].	0
CP034953.1\|QAA90803.1\|3324964_3325750_+\|(S)-ureidoglycine-aminohydrolase	gnl\|CDD\|200251	TIGR03214, ura-cupin, putative allantoin catabolism protein. This model represents a protein containing a tandem arrangement of cupin domains (N-terminal part of pfam07883 and C-terminal more distantly related to pfam00190). This protein is found in the vicinity of genes involved in the catabolism of allantoin, a breakdown product of urate and sometimes of urate iteslf. The distribution of pathway components in the genomes in which this family is observed suggests that the function is linked to the allantoate catabolism to glyoxylate pathway (GenProp0686) since it is sometimes found in genomes lacking any elements of the xanthine-to-allantoin pathways (e.g. in Enterococcus faecalis).	2.39799e-151
CP034953.1\|QAA90804.1\|3325977_3327123_-\|glycerate-3-kinase	gnl\|CDD\|182152	PRK09932, PRK09932, glycerate 3-kinase.	0

>CP034953.1|QAA90796.1|3316416_3317484_+|5-(carboxyamino)imidazole-ribonucleotide-synthase
MKQVCVLGNGQLGRMLRQAGEPLGIAVWPVGLDAEPAAVPFQQSVITAEIERWPETALTRELARHPAFVNRDVFPIIADRLTQKQLFDKLHLPTAPWQLLAERSEWPAVFDRLGELAIVKRRTGGYDGRGQWRLRANETEQLPAECYGECIVEQGINFSGEVSLVGARGFDGSTVFYPLTHNLHQDGILRTSVAFPQANAQQQAQAEEMLSAIMQELGYVGVMAMECFVTPQGLLINELAPRVHNSGHWTQNGASISQFELHLRAITDLPLPQPVVNNPSVMINLIGSDVNYDWLKLPLVHLHWYDKEVRPGRKVGHLNLTDSDTSRLTATLEALIPLLPPEYASGVIWAQSKFG
>CP034953.1|QAA90795.1|3315910_3316420_+|5-(carboxyamino)imidazole-ribonucleotide-mutase
MSSRNNPARVAIVMGSKSDWATMQFAAEIFEILNVPHHVEVVSAHRTPDKLFSFAESAEENGYQVIIAGAGGAAHLPGMIAAKTLVPVLGVPVQSAALSGVDSLYSIVQMPRGIPVGTLAIGKAGAANAALLAAQILATHDKELHQRLNDWRKAQTDEVLENPDPRGAA
>CP034953.1|QAA90794.1|3315070_3315793_+|UDP-2,3-diacylglucosamine-diphosphatase
MATLFIADLHLCVEEPAITAGFLRFLAGEARKADALYILGDLFEAWIGDDDPNPLHRKMAAAIKAVSDSGVPCYFIHGNRDFLLGKRFARESGMTLLPEEKVLELYGRRVLIMHGDTLCTDDAGYQAFRAKVHKPWLQTLFLALPLFVRKRIAARMRANSKEANSSKSLAIMDVNQNAVVSAMEKHQVQWLIHGHTHRPAVHELIANQQPAFRVVLGAWHTEGSMVKVTADDVELIHFPF
>CP034953.1|QAA90793.1|3314573_3315068_+|peptidylprolyl-isomerase-B
MVTFHTNHGDIVIKTFDDKAPETVKNFLDYCREGFYNNTIFHRVINGFMIQGGGFEPGMKQKATKEPIKNEANNGLKNTRGTLAMARTQAPHSATAQFFINVVDNDFLNFSGESLQGWGYCVFAEVVDGMDVVDKIKGVATGRSGMHQDVPKEDVIIESVTVSE
>CP034953.1|QAA90792.1|3313014_3314400_-|cysteine--tRNA-ligase
MLKIFNTLTRQKEEFKPIHAGEVGMYVCGITVYDLCHIGHGRTFVAFDVVARYLRFLGYKLKYVRNITDIDDKIIKRANENGESFVAMVDRMIAEMHKDFDALNILRPDMEPRATHHIAEIIELTEQLIAKGHAYVADNGDVMFDVPTDPTYGVLSRQDLDQLQAGARVDVVDDKRNPMDFVLWKMSKEGEPSWPSPWGAGRPGWHIECSAMNCKQLGNHFDIHGGGSDLMFPHHENEIAQSTCAHDGQYVNYWMHSGMVMVDREKMSKSLGNFFTVRDVLKYYDAETVRYFLMSGHYRSQLNYSEENLKQARAALERLYTALRGTDKTVAPAGGEAFEARFIEAMDDDFNTPEAYSVLFDMAREVNRLKAEDMAAANAMASHLRKLSAVLGLLEQEPEAFLQSGAQADDSEVAEIEALIQQRLDARKAKDWAAADAARDRLNEMGIVLEDGPQGTTWRRK
>CP034953.1|QAA90791.1|3312457_3312979_+|metal-dependent-hydrolase
MPTVITHAAVPLCIGLGLGSKVIPPRLLFAGIILAMLPDADVLSFKFGVAYGNVFGHRGFTHSLVFAFVVPLLCVFIGRRWFRAGLIRCWLFLTVSLLSHSLLDSVTTGGKGVGWLWPWSDERFFAPWQVIKVAPFALSRYTTPYGHQVIISELMWVWLPGMLLMGMLWWRRR
>CP034953.1|QAA90790.1|3312137_3312350_+|ribosome-associated-protein-YbcJ
MATFSLGKHPHVELCDLLKLEGWSESGAQAKIAIAEGQVKVDGAVETRKRCKIVAGQTVSFAGHSVQVVA
>CP034953.1|QAA90789.1|3311269_3312136_+|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD
MAAKIIDGKTIAQQVRSEVAQKVQARIAAGLRAPGLAVVLVGSNPASQIYVASKRKACEEVGFVSRSYDLPETTSEAELLELIDTLNADNTIDGILVQLPLPAGIDNVKVLERIHPDKDVDGFHPYNVGRLCQRAPRLRPCTPRGIVTLLERYNIDTFGLNAVVIGASNIVGRPMSMELLLAGCTTTVTHRFTKNLRHHVENADLLIVAVGKPGFIPGDWIKEGAIVIDVGINRLENGKVVGDVVFEDAAKRASYITPVPGGVGPMTVATLIENTLQACVEYHDPQDE
>CP034953.1|QAA90788.1|3310256_3310799_-|type-1-fimbrial-protein-subunit-FimA
MKLRFISSALAAALFAATGSYAAVVDGGTIHFEGELVNAACSVNTDSADQVVTLGQYRTDIFNAVGNTSALIPFTIQLNDCDPVVAANAAVAFSGQADAINDNLLAIASSTNTTTATGVGIEILDNTSAILKPDGNSFSTNQNLIPGTNVLHFSARYKGTGTSASAGQANADATFIMRYE
>CP034953.1|QAA90787.1|3309344_3310037_-|molecular-chaperone-FimC
MMTKIKLLMLIIFYLIISASAHAAGGIALGATRIIYPADAKQTAVWIRNSHTNERFLVNSWIENSSGVKEKSFIITPPLFVSEPKSENTLRIIYTGPPLAADRESLFWMNVKTIPSVDKNALNGRNVLQLAILSRMKLFLRPIQLQELPAEAPDTLKFSRSGNYINVHNPSPFYVTLVNLQVGSQKLGNAMAAPRVNSQIPLPSGVQGKLKFQTVNDYGSVTPVREVNLN
>CP034953.1|QAA90797.1|3317678_3318572_-|carbamate-kinase
MKTLVVALGGNALLQRGEALTAENQYRNIASAVPALARLARSYRLAIVHGNGPQVGLLALQNLAWKEVEPYPLDVLVAESQGMIGYMLAQSLSAQPQMPPVTTVLTRIEVSPDDPAFLQPEKFIGPVYQPEEQEALEAAYGWQMKRDGKYLRRVVASPQPRKILDSEAIELLLKEGHVVICSGGGGVPVTDDGAGSEAVIDKDLAAALLAEQINADGLVILTDADAVYENWGTPQQRAIRHATPDELAPFAKADGSMGPNVTAVSGYVRSRGKPAWIGALSRIEETLAGEAGTCISL
>CP034953.1|QAA90798.1|3318568_3319384_-|DUF2877-domain-containing-protein
MTIIHPLLASSSAPNYRQSWRLAGVWRRAINLMTESGELLTLHRQGSGFGPGGWVLRRAQFDALCGGLCGNERPQVVAQGIRLGRFTVKQPQRYCLLRITPPAHPQPLAAAWMQRAEETGLFGPLALAASDPLPAELRQFRHCFQAALNGVKTDWRHWLGKGPGLTPSHDDTLSGMLLAAWYYGALDARSGRPFFACSDNLQLVTTAVSVSYLRYAAQGYFASPLLHFVHALSCPKRTAVAIDSLLALGHTSGADTLLGFWLGQQLLQGKP
>CP034953.1|QAA90799.1|3319394_3320654_-|DUF1116-domain-containing-protein
MFTSVAQANAAVIEQIRRARPHWLDVQPASSLISELNEGKTLLHAGPPMRWQEMTGPMKGACVGACLFEGWAKDEAQALAILEQGEVNFIPCHHVNAVGPMGGITSASMPMLVVENVTDGNRAYCNLNEGIGKVMRFGAYGEDVLTRHRWMRDVLMPVLSAALGRMERGIDLTAMMAQGITMGDEFHQRNIASSALLMRALAPQIARLDHDKQHIAEVMDFLSVTDQFFLNLAMAYCKAAMDAGAMIRAGSIVTAMTRNGNMFGIRVSGLGERWFTAPVNTPQGLFFTGFSQEQANPDMGDSAITETFGIGGAAMIAAPGVTRFVGAGGMEAARAVSEEMAEIYLERNMQLQIPSWDFQGACLGLDIRRVVETGITPLINTGIAHKEAGIGQIGAGTVRAPLACFEQALEALAESMGIG
>CP034953.1|QAA90800.1|3320663_3322331_-|acyl-CoA-synthetase-FdrA
MIHAFIKKGCFQDSVSLMIISRKLSESENVDDVSVMMGTPANKALLDTTGFWHDDFNNATPNDICVAIRSEAADAGIAQAIMQQLEEALKQLAQGSGSSQALTQVRRWDSACQKLPDANLALISVAGEYAAELANQALDRNLNVMMFSDNVTLEDEIQLKTRAREKGLLVMGPDCGTSMIAGTPLAFANVMPEGNIGVIGASGTGIQELCSQIALAGEGITHAIGLGGRDLSREVGGISALTALEMLSADEKSEVLAFVSKPPAEAVRLKIVNAMKATGKPTVALFLGYTPAVARDENVWFASSLDEAARLACLLSRVTARRNAIAPVSSGFICGLYTGGTLAAEAAGLLAGHLGVEADDTHQHGMMLDADSHQIIDLGDDFYTVGRPHPMIDPTLRNQLIADLGAKPQVRVLLLDVVIGFGATADPAASLVSAWQKACAARLDNQPLYAIATVTGTERDPQCRSQQIATLEDAGIAVVSSLPEATLLAAALIHPLSPAAQQHTPSLLENVAVINIGLRSFALELQSASKPVVHYQWSPVAGGNKKLARLLERLQ
>CP034953.1|QAA90801.1|3322647_3323697_+|ureidoglycolate-dehydrogenase
MKISRETLHQLIENKLCQAGLKREHAATVAEVLVYADARGIHSHGAVRVEYYAERISKGGTNREPEFRLEETGPCSAILHADNAAGQVAAKMGMEHAIKTAQQNGVAVVGISRMGHSGAISYFVQQAARAGFIGISMCQSDPMVVPFGGAEIYYGTNPLAFAAPGEGDEILTFDMATTVQAWGKVLDARSRNMSIPDTWAVDKNGVPTTDPFAVHALLPAAGPKGYGLMMMIDVLSGVLLGLPFGRQVSSMYDDLHAGRNLGQLHIVINPNFFSSSELFRQHLSQTMRELNAITPAPGFNQVYYPGQDQDIKQRKAAVEGIEIVDDIYQYLISDALYNTSYETKNPFAQ
>CP034953.1|QAA90802.1|3323718_3324954_+|allantoate-amidohydrolase
MITHFRQAIEETLPWLSSFGADPAGGMTRLLYSPEWLETQQQFKKRMAASGLETRFDEVGNLYGRLNGTEYPQEVVLSGSHIDTVVNGGNLDGQFGALAAWLAIDWLKTQYGAPLRTVEVVAMAEEEGSRFPYVFWGSKNIFGLANPDDVRNICDAKGNSFVDAMKACGFTLPNAPLTPRQDIKAFVELHIEQGCVLESNGQSIGVVNAIVGQRRYTVTLNGESNHAGTTPMGYRRDTVYAFSRICHQSVEKAKRMGDPLVLTFGKVEPRPNTVNVVPGKTTFTIDCRHTDAAVLRDFTQQLENDMRAICDEMDIGIDIDLWMDEEPVPMNKELVATLTELCEREKLNYRVMHSGAGHDAQIFAPRVPTCMIFIPSINGISHNPAERTNITDLAEGVKTLALMLYQLAWQK
>CP034953.1|QAA90803.1|3324964_3325750_+|(S)-ureidoglycine-aminohydrolase
MGYLNNVTGYREDLLANRAIVKHGNFALLTPDGLVKNIIPGFENCDATILSTPKLGASFVDYLVTLHQNGGNQQGFGGEGIETFLYVISGNITAKAEGKTFALSEGGYLYCPPGSLMTFVNAQAEDSQIFLYKRRYVPVEGYAPWLVSGNASELERIHYEGMDDVILLDFLPKELGFDMNMHILSFAPGASHGYIETHVQEHGAYILSGQGVYNLDNNWIPVKKGDYIFMGAYSLQAGYGVGRGEAFSYIYSKDCNRDVEI
>CP034953.1|QAA90804.1|3325977_3327123_-|glycerate-3-kinase
MKIVIAPDSFKESLSAEKCCQAIKAGFSTLFPDANYICLPIADGGEGTVDAMVAATGGNIVTLEVCGPMGEKVNAFYGLTGDGKTAVIEMAAASGLMLVAPEKRNPLLASSFGTGELIRHALDNDIRHIILGIGGSATVDGGMGMAQALGVRFLDADGQALAANGGNLARVASIEMDECDPRLANCHIEVACDVDNPLVGARGAAAVFGPQKGATPEMVEELEQGLQNYARVLQQQTEINVCQMAGGGAAGGMGIAAAVFLNADIKPGIEIVLNAVNLAQAVQGAALVITGEGRIDSQTAGGKAPLGVASVAKQFNVPVIGIAGVLGDGVEVVHQYGIDAVFSILPRLAPLAEVLASGETNLFNSARNIACAIKIGQGIKN
>CP034953.1|QAA90805.1|3327144_3328446_-|uracil/xanthine-transporter
MFNFAVSRESLLSGFQWFFFIFCNTVVVPPTLLSAFQLPQSSLLTLTQYAFLATALACFAQAFCGHRRAIMEGPGGLWWGTILTITLGEASRGTPINDIATSLAVGIALSGVLTMLIGFSGLGHRLARLFTPSVMVLFMLMLGAQLTTIFFKGMLGLPFGIADPNFKIQLPPFALSVAVMCLVLAMIIFLPQRFARYGLLVGTITGWLLWYFCFPSSHSLSGELHWQWFPLGSGGALSPGIILTAVITGLVNISNTYGAIRGTDVFYPQQGAGNTRYRRSFVATGFMTLITVPLAVIPFSPFVSSIGLLTQTGDYTRRSFIYGSVICLLVALVPALTRLFCSIPLPVSSAVMLVSYLPLLFSALVFSQQITFTARNIYRLALPLFVGIFLMALPPVYLQDLPLTLRPLLSNGLLVGILLAVLMDNLIPWERIE
>CP034953.1|QAA90806.1|3328502_3329864_-|allantoinase-AllB
MSFDLIIKNGTVILENEARVVDIAVKGGKIAAIGQDLGDAKEVMDASGLVVSPGMVDAHTHISEPGRSHWEGYETGTRAAAKGGITTMIEMPLNQLPATVDRASIELKFDAAKGKLTIDAAQLGGLVSYNIDRLHELDEVGVVGFKCFVATCGDRGIDNDFRDVNDWQFFKGAQKLGELGQPVLVHCENALICDELGEEAKREGRVTAHDYVASRPVFTEVEAIRRVLYLAKVAGCRLHVCHVSSPEGVEEVTRARQEGQDVTCESCPHYFVLDTDQFEEIGTLAKCSPPIRDLENQKGMWEKLFNGEIDCLVSDHSPCPPEMKAGNIMKAWGGIAGLQSCMDVMFDEAVQKRGMSLPMFGKLMATNAADIFGLQQKGRIAPGKDADFVFIQPNSSYVLTNDDLEYRHKVSPYVGRTIGARITKTILRGDVIYDIEQGFPVAPKGQFILKHQQ

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP034953_9

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP034953_9

3457789-3457933

Orphan

Consensus_repeat	Method
TTTTGCAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCAT	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP034953_9

>merge|CP034953|9|3457789-3457933|CRISPRCasFinder
TTTTGCAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCATCGGAGCACTTATTGCCGGATGCGGCGTGAACGCCTTATCCGGCCTACGGTTCTGGCACCTTTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCAT

>CP034953|9|9|3457789-3457933|CRISPRCasFinder
TTTTGCAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCAT	CGGAGCACTTATTGCCGGATGCGGCGTGAACGCCTTATCCGGCCTACGGTTCTGGCACC
TTTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCAT

Protein	Signature genes	Signature genes Name	Protein_function
CP034953.1\|QAA90912.1\|3449824_3451120_-\|phosphate-regulon-sensor-histidine-kinase-PhoR	unknown	unknown	gnl\|CDD\|182895
CP034953.1\|QAA91944.1\|3459978_3460062_-\|hypothetical-protein	unknown	unknown	unknown
CP034953.1\|QAA90911.1\|3448098_3449418_-\|branched-chain-amino-acid-transporter-carrier-protein-BrnQ	unknown	unknown	gnl\|CDD\|185331
CP034953.1\|QAA90918.1\|3460903_3461581_-\|AroM-family-protein	unknown	unknown	gnl\|CDD\|182491
CP034953.1\|QAA90919.1\|3461838_3462030_-\|protein-YaiA	unknown	unknown	gnl\|CDD\|182421
CP034953.1\|QAA91943.1\|3458989_3459901_+\|recombination-associated-protein-RdgC	unknown	unknown	gnl\|CDD\|225521
CP034953.1\|QAA90920.1\|3462079_3462604_-\|shikimate-kinase-AroL	unknown	unknown	gnl\|CDD\|235153
CP034953.1\|QAA90921.1\|3462786_3463245_-\|YaiI/YqxD-family-protein	unknown	unknown	gnl\|CDD\|178882
CP034953.1\|QAA90908.1\|3444090_3444672_+\|ACP-phosphodiesterase	unknown	unknown	gnl\|CDD\|182207
CP034953.1\|QAA90907.1\|3442927_3443998_-\|tRNA-preQ1(34)-S-adenosylmethionine-ribosyltransferase-isomerase-QueA	unknown	unknown	gnl\|CDD\|234666
CP034953.1\|QAA90913.1\|3451177_3451867_-\|phosphate-response-regulator-transcription-factor-PhoB	unknown	unknown	gnl\|CDD\|182277
CP034953.1\|QAA90915.1\|3453255_3456402_+\|exonuclease-subunit-SbcC	unknown	unknown	gnl\|CDD\|182330
CP034953.1\|QAA90923.1\|3464190_3465306_-\|diguanylate-cyclase-AdrA	unknown	unknown	gnl\|CDD\|182329
CP034953.1\|QAA90917.1\|3460547_3460832_-\|pyrimidine/purine-nucleoside-phosphorylase	unknown	unknown	gnl\|CDD\|182565
CP034953.1\|QAA90916.1\|3457956_3458865_-\|fructokinase	unknown	unknown	gnl\|CDD\|236565
CP034953.1\|QAA90922.1\|3463364_3464174_+\|pyrroline-5-carboxylate-reductase	unknown	unknown	gnl\|CDD\|237008
CP034953.1\|QAA90910.1\|3446649_3448023_-\|proline-specific-permease-ProY	unknown	unknown	gnl\|CDD\|182566
CP034953.1\|QAA90909.1\|3444676_3446494_-\|maltodextrin-glucosidase	unknown	unknown	gnl\|CDD\|236759
CP034953.1\|QAA90914.1\|3452056_3453259_+\|exonuclease-subunit-SbcD	unknown	unknown	gnl\|CDD\|182871
CP034953.1\|QAA91942.1\|3456527_3457712_+\|MFS-transporter-AraJ	unknown	unknown	gnl\|CDD\|182234

Protein	Function_ID	Function_description	E-value
CP034953.1\|QAA90912.1\|3449824_3451120_-\|phosphate-regulon-sensor-histidine-kinase-PhoR	gnl\|CDD\|182895	PRK11006, phoR, phosphate regulon sensor histidine kinase PhoR.	0
CP034953.1\|QAA90922.1\|3463364_3464174_+\|pyrroline-5-carboxylate-reductase	gnl\|CDD\|237008	PRK11880, PRK11880, pyrroline-5-carboxylate reductase; Reviewed.	1.87564e-128
CP034953.1\|QAA90911.1\|3448098_3449418_-\|branched-chain-amino-acid-transporter-carrier-protein-BrnQ	gnl\|CDD\|185331	PRK15433, PRK15433, branched-chain amino acid transporter carrier protein BrnQ.	0
CP034953.1\|QAA90918.1\|3460903_3461581_-\|AroM-family-protein	gnl\|CDD\|182491	PRK10481, PRK10481, hypothetical protein; Provisional.	2.13662e-120
CP034953.1\|QAA90919.1\|3461838_3462030_-\|protein-YaiA	gnl\|CDD\|182421	PRK10380, PRK10380, hypothetical protein; Provisional.	5.14477e-31
CP034953.1\|QAA91943.1\|3458989_3459901_+\|recombination-associated-protein-RdgC	gnl\|CDD\|225521	COG2974, RdgC, DNA recombination-dependent growth factor C [DNA replication, recombination, and repair].	0
CP034953.1\|QAA90920.1\|3462079_3462604_-\|shikimate-kinase-AroL	gnl\|CDD\|235153	PRK03731, aroL, shikimate kinase AroL.	2.43812e-108
CP034953.1\|QAA90921.1\|3462786_3463245_-\|YaiI/YqxD-family-protein	gnl\|CDD\|178882	PRK00124, PRK00124, YaiI/YqxD family protein.	2.50663e-80
CP034953.1\|QAA90908.1\|3444090_3444672_+\|ACP-phosphodiesterase	gnl\|CDD\|182207	PRK10045, PRK10045, ACP phosphodiesterase.	3.03368e-136
CP034953.1\|QAA90907.1\|3442927_3443998_-\|tRNA-preQ1(34)-S-adenosylmethionine-ribosyltransferase-isomerase-QueA	gnl\|CDD\|234666	PRK00147, queA, S-adenosylmethionine:tRNA ribosyltransferase-isomerase; Provisional.	0
CP034953.1\|QAA90913.1\|3451177_3451867_-\|phosphate-response-regulator-transcription-factor-PhoB	gnl\|CDD\|182277	PRK10161, PRK10161, phosphate response regulator transcription factor PhoB.	5.1688e-159
CP034953.1\|QAA90915.1\|3453255_3456402_+\|exonuclease-subunit-SbcC	gnl\|CDD\|182330	PRK10246, PRK10246, exonuclease subunit SbcC; Provisional.	0
CP034953.1\|QAA90923.1\|3464190_3465306_-\|diguanylate-cyclase-AdrA	gnl\|CDD\|182329	PRK10245, adrA, diguanylate cyclase AdrA; Provisional.	0
CP034953.1\|QAA90917.1\|3460547_3460832_-\|pyrimidine/purine-nucleoside-phosphorylase	gnl\|CDD\|182565	PRK10579, PRK10579, pyrimidine/purine nucleoside phosphorylase.	5.85948e-64
CP034953.1\|QAA90916.1\|3457956_3458865_-\|fructokinase	gnl\|CDD\|236565	PRK09557, PRK09557, fructokinase; Reviewed.	0
CP034953.1\|QAA90910.1\|3446649_3448023_-\|proline-specific-permease-ProY	gnl\|CDD\|182566	PRK10580, proY, putative proline-specific permease; Provisional.	0
CP034953.1\|QAA90909.1\|3444676_3446494_-\|maltodextrin-glucosidase	gnl\|CDD\|236759	PRK10785, PRK10785, maltodextrin glucosidase; Provisional.	0
CP034953.1\|QAA90914.1\|3452056_3453259_+\|exonuclease-subunit-SbcD	gnl\|CDD\|182871	PRK10966, PRK10966, exonuclease subunit SbcD; Provisional.	0
CP034953.1\|QAA91942.1\|3456527_3457712_+\|MFS-transporter-AraJ	gnl\|CDD\|182234	PRK10091, PRK10091, MFS transport protein AraJ; Provisional.	0

>CP034953.1|QAA91942.1|3456527_3457712_+|MFS-transporter-AraJ
MKKVILSLALGTFGLGMAEFGIMGVLTELAHNVGISIPAAGHMISYYALGVVVGAPIIALFSSRYSLKHILLFLVALCVIGNAMFTLSSSYLMLAIGRLVSGFPHGAFFGVGAIVLSKIIKPGKVTAAVAGMVSGMTVANLLGIPLGTYLSQEFSWRYTFLLIAVFNIAVMASVYFWVPDIRDEAKGNLREQFHFLRSPAPWLIFAATMFGNAGVFAWFSYVKPYMMFISGFSETAMTFIMMLVGLGMVLGNMLSGRISGRYSPLRIAAVTDFIIVLALLMLFFCGGMKTTSLIFAFICCAGLFALSAPLQILLLQNAKGGELLGAAGGQIAFNLGSAVGAYCGGMMLTLGLAYNYVALPAALLSFAAMSSLLLYGRYKRQQAADTPVLAKPLG
>CP034953.1|QAA90915.1|3453255_3456402_+|exonuclease-subunit-SbcC
MKILSLRLKNLNSLKGEWKIDFTREPFASNGLFAITGPTGAGKTTLLDAICLALYHETPRLSNVSQSQNDLMTRDTAECLAEVEFEVKGEAYRAFWSQNRARNQPDGNLQVPRVELARCADGKILADKVKDKLELTATLTGLDYGRFTRSMLLSQGQFAAFLNAKPKERAELLEELTGTEIYGQISAMVFEQHKSARTELEKLQAQASGVTLLTPEQVQSLTASLQVLTDEEKQLITAQQQEQQSLNWLTRQDELQQEASRRQQALQQALAEEEKAQPQLAALSLAQPARNLRPHWERIAEHSAALAHIRQQIEEVNTRLQSTMALRASIRHHAAKQSAELQQQQQSLNTWLQEHDRFRQWNNEPAGWRAQFSQQTSDREHLRQWQQQLTHAEQKLNALAAITLTLTADEVATALAQHAEQRPLRQHLVALHGQIVPQQKRLAQLQVAIQNVTQEQTQRNAALNEMRQRYKEKTQQLADVKTICEQEARIKTLEAQRAQLQAGQPCPLCGSTSHPAVEAYQALEPGVNQSRLLALENEVKKLGEEGATLRGQLDAITKQLQRDENEAQSLRQDEQALTQQWQAVTASLNITLQPLDDIQPWLDAQDEHERQLRLLSQRHELQGQIAAHNQQIIQYQQQIEQRQQLLLTTLTGYALTLPQEDEEESWLATRQQEAQSWQQRQNELTALQNRIQQLTPILETLPQSDELPHCEETVVLENWRQVHEQCLALHSQQQTLQQQDVLAAQSLQKAQAQFDTALQASVFDDQQAFLAALMDEQTLTQLEQLKQNLENQRRQAQTLVTQTAETLAQHQQHRPDDGLALTVTVEQIQQELAQTHQKLRENTTSQGEIRQQLKQDADNRQQQQTLMQQIAQMTQQVEDWGYLNSLIGSKEGDKFRKFAQGLTLDNLVHLANQQLTRLHGRYLLQRKASEALEVEVVDTWQADAVRDTRTLSGGESFLVSLALALALSDLVSHKTRIDSLFLDEGFGTLDSETLDTALDALDALNASGKTIGVISHVEAMKERIPVQIKVKKINGLGYSKLESTFAVK
>CP034953.1|QAA90914.1|3452056_3453259_+|exonuclease-subunit-SbcD
MRILHTSDWHLGQNFYSKSREAEHQAFLDWLLETAQTHQVDAIIVAGDVFDTGSPPSYARTLYNRFVVNLQQTGCHLVVLAGNHDSVATLNESRDIMAFLNTTVVASAGHAPQILPRRDGTPGAVLCPIPFLRPRDIITSQAGLNGIEKQQHLLAAITDYYQQHYADACKLRGDQPLPIIATGHLTTVGASKSDAVRDIYIGTLDAFPAQNFPPADYIALGHIHRAQIIGGMEHVRYCGSPIPLSFDECGKSKYVHLVTFSNGKLESVENLNVPVTQPMAVLKGDLASITAQLEQWRDVSQEPPVWLDIEITTDEYLHDIQRKIQALTESLPVEVLLVRRSREQRERVLASQQRETLSELSVEEVFNRRLALEELDESQQQRLQHLFTTTLHTLAGEHEA
>CP034953.1|QAA90913.1|3451177_3451867_-|phosphate-response-regulator-transcription-factor-PhoB
MARRILVVEDEAPIREMVCFVLEQNGFQPVEAEDYDSAVNQLNEPWPDLILLDWMLPGGSGIQFIKHLKRESMTRDIPVVMLTARGEEEDRVRGLETGADDYITKPFSPKELVARIKAVMRRISPMAVEEVIEMQGLSLDPTSHRVMAGEEPLEMGPTEFKLLHFFMTHPERVYSREQLLNHVWGTNVYVEDRTVDVHIRRLRKALEPGGHDRMVQTVRGTGYRFSTRF
>CP034953.1|QAA90912.1|3449824_3451120_-|phosphate-regulon-sensor-histidine-kinase-PhoR
MLERLSWKRLVLELLLCCLPAFILGAFFGYLPWFLLASVTGLLIWHFWNLLRLSWWLWVDRSMTPPPGRGSWEPLLYGLHQMQLRNKKRRRELGNLIKRFRSGAESLPDAVVLTTEEGGIFWCNGLAQQILGLRWPEDNGQNILNLLRYPEFTQYLKTRDFSRPLNLVLNTGRHLEIRVMPYTHKQLLMVARDVTQMHQLEGARRNFFANVSHELRTPLTVLQGYLEMMNEQPLEGAVREKALHTMREQTQRMEGLVKQLLTLSKIEAAPTHLLNEKVDVPMMLRVVEREAQTLSQKKQTFTFEIDNGLKVSGNEDQLRSAISNLVYNAVNHTPEGTHITVRWQRVPHGAEFSVEDNGPGIAPEHIPRLTERFYRVDKARSRQTGGSGLGLAIVKHAVNHHESRLNIESTVGKGTRFSFVIPERLIAKNSD
>CP034953.1|QAA90911.1|3448098_3449418_-|branched-chain-amino-acid-transporter-carrier-protein-BrnQ
MTHQLRSRDIIALGFMTFALFVGAGNIIFPPMVGLQAGEHVWTAAFGFLITAVGLPVLTVVALAKVGGGVDSLSTPIGKVAGVLLATVCYLAVGPLFATPRTATVSFEVGIAPLTGDSALPLFIYSLVYFAIVILVSLYPGKLLDTVGNFLAPLKIIALVILSVAAIVWPAGSISTATEAYQNAAFSNGFVNGYLTMDTLGAMVFGIVIVNAARSRGVTEARLLTRYTVWAGLMAGVGLTLLYLALFRLGSDSASLVDQSANGAAILHAYVQHTFGGGGSFLLAALIFIACLVTAVGLTCACAEFFAQYVPLSYRTLVFILGGFSMVVSNLGLSQLIQISVPVLTAIYPPCIALVVLSFTRSWWHNSSRVIAPPMFISLLFGILDGIKASAFSDILPSWAQRLPLAEQGLAWLMPTVVMVVLAIIWDRAAGRQVTSSAH
>CP034953.1|QAA90910.1|3446649_3448023_-|proline-specific-permease-ProY
MESKNKLKRGLSTRHIRFMALGSAIGTGLFYGSADAIKMAGPSVLLAYIIGGIAAYIIMRALGEMSVHNPAASSFSRYAQENLGPLAGYITGWTYCFEILIVAIADVTAFGIYMGVWFPTVPHWIWVLSVVLIICAVNLMSVKVFGELEFWFSFFKVATIIIMIVAGFGIIIWGIGNGGQPTGIHNLWSNGGFFSNGWLGMVMSLQMVMFAYGGIEIIGITAGEAKDPEKSIPRAINSVPMRILVFYVGTLFVIMSIYPWNQVGTAGSPFVLTFQHMGITFAASILNFVVLTASLSAINSDVFGVGRMLHGMAEQGSAPKIFSKTSRRGIPWVTVLVMTTALLFAVYLNYIMPENVFLVIASLATFATVWVWIMILLSQIAFRRRLPPEEVKALKFKVPGGVATTIGGLIFLLFIIGLIGYHPDTRISLYVGFAWIVVLLIGWMFKRRHDRQLAENQ
>CP034953.1|QAA90909.1|3444676_3446494_-|maltodextrin-glucosidase
MMLNAWHLPVPPFVKQSKDQLLITLWLTGEDPPQRIMLRTEHDNEEMSVPMHKQRSQPQPGVTAWRAAIDLSSGQPRRRYSFKLLWHDRQRWFTPQGFSRMPPARLEQFAVDVPDIGPQWAADQIFYQIFPDRFARSLPREAEQDHVYYHHAAGQEIILRDWDEPVTAQAGGSTFYGGDLDGISEKLPYLKKLGVTALYLNPVFKAPSVHKYDTEDYRHVDPQFGGDGALLRLRHNTQQLGMRLVLDGVFNHSGDSHAWFDRHNRGTGGACHNPESPWRDWYSFSDDGTALDWLGYASLPKLDYQSESLVNEIYRGEDSIVRHWLKAPWNMDGWRLDVVHMLGEAGGARNNMQHVAGITEAAKETQPEAYIVGEHFGDARQWLQADVEDAAMNYRGFTFPLWGFLANTDISYDPQQIDAQTCMAWMDNYRAGLSHQQQLRMFNQLDSHDTARFKTLLGRDIARLPLAVVWLFTWPGVPCIYYGDEVGLDGKNDPFCRKPFPWQVEKQDTALFALYQRMIALRKKSQALRHGGCQVLYAEDNVVVFVRVLNQQRVLVAINRGEACEVVLPASPFLNAVQWQCKEGHGQLTDGILALPAISATVWMN
>CP034953.1|QAA90908.1|3444090_3444672_+|ACP-phosphodiesterase
MNFLAHLHLAHLAESSLSGNLLADFVRGNPEESFPPDVVAGIHMHRRIDVLTDNLPEVREAREWFRSETRRVAPITLDVMWDHFLSRHWSQLSPDFPLQEFVCYAREQVMTILPDSPPRFINLNNYLWSEQWLVRYRDMDFIQNVLNGMASRRPRLDALRDSWYDLDAHYDALETRFWQFYPRMMAQASRKAL
>CP034953.1|QAA90907.1|3442927_3443998_-|tRNA-preQ1(34)-S-adenosylmethionine-ribosyltransferase-isomerase-QueA
MRVTDFSFELPESLIAHYPMPERSSCRLLSLDGPTGALTHGTFTDLLDKLNPGDLLVFNNTRVIPARLFGRKASGGKIEVLVERMLDDKRILAHIRASKAPKPGAELLLGDDESINATMTARHGALFEVEFNDERSVLDILNSIGHMPLPPYIDRPDEDADRELYQTVYSEKPGAVAAPTAGLHFDEPLLEKLRAKGVEMAFVTLHVGAGTFQPVRVDTIEDHIMHSEYAEVPQDVVDAVLAAKARGNRVIAVGTTSVRSLESAAQAAKNDLIEPFFDDTQIFIYPGFQYKVVDALVTNFHLPESTLIMLVSAFAGYQHTMNAYKAAVEEKYRFFSYGDAMFITYNPQAINERVGE
>CP034953.1|QAA90916.1|3457956_3458865_-|fructokinase
MRIGIDLGGTKTEVIALGDAGEQLYRHRLPTPRDDYRQTIETIATLVDMAEQATGQRGTVGMGIPGSISPYTGVVKNANSTWLNGQPFDKDLSARLQREVRLANDANCLAVSEAVDGAAAGAQTVFAVIIGTGCGAGVAFNGRAHIGGNGTAGEWGHNPLPWMDEDELRYREEVPCYCGKQGCIETFISGTGFAMDYRRLSGHALKGSEIIRLVEESDPVAELALRRYELRLAKSLAHVVNILDPDVIVLGGGMSNVDRLYQTVGQLIKQFVFGGECETPVRKAKHGDSSGVRGAAWLWPQE
>CP034953.1|QAA91943.1|3458989_3459901_+|recombination-associated-protein-RdgC
MLWFKNLMVYRLSREISLRAEEMEKQLASMAFTPCGSQDMAKMGWVPPMGSHSDALTHVANGQIVICARKEEKILPSPVIKQALEAKIAKLEAEQARKLKKTEKDSLKDEVLHSLLPRAFSRFSQTMMWIDTVNGLIMVDCASAKKAEDTLALLRKSLGSLPVVPLSMENPIELTLTEWVRSGSAAQGFQLLDEAELKSLLEDGGVIRAKKQDLTSEEITNHIEAGKVVTKLALDWQQRIQFVMCDDGSLKRLKFCDELRDQNEDIDREDFAQRFDADFILMTGELAALIQNLIEGLGGEAQR
>CP034953.1|QAA91944.1|3459978_3460062_-|hypothetical-protein
MTQRPWSKLQRKTHNIAALKIIARRSE
>CP034953.1|QAA90917.1|3460547_3460832_-|pyrimidine/purine-nucleoside-phosphorylase
MLQSNEYFSGKVKSIGFSSSSTGRASVGVMVEGEYTFSTAEPEEMTVISGALNVLLPDATDWQVYEAGSVFNVPGHSEFHLQVAEPTSYLCRYL
>CP034953.1|QAA90918.1|3460903_3461581_-|AroM-family-protein
MSASLAILTIGIVPMQEVLPLLTEYIDEDNISHHSLLGKLSREEVMAEYAPEAGEDTILTLLNDNQLAHVSRRKVERDLQGVVEVLDNQGYDVILLMSTANISSMTARNTIFLEPSRILPPLVSSIVEDHQVGVIVPVEEMLPVQAQKWQILQKSPVFSLGNPIHDSEQKIIDAGKELLAKGADVIMLDCLGFHQRHRDLLQKQLDVPVLLSNVLIARLAAELLV
>CP034953.1|QAA90919.1|3461838_3462030_-|protein-YaiA
MPTKPPYPREAYIVTIEKGKPGQTVTWYQLRADHPKPDSLISEHPTAQEAMDAKKRYEDPDKE
>CP034953.1|QAA90920.1|3462079_3462604_-|shikimate-kinase-AroL
MTQPLFLIGPRGCGKTTVGMALADSLNRRFVDTDQWLQSQLNMTVAEIVEREEWAGFRARETAALEAVTAPSTVIATGGGIILTEFNRHFMQNNGIVVYLCAPVSVLVNRLQAAPEEDLRPTLTGKPLSEEVQEVLEERDALYREVAHIIIDATNEPSQVISEIRSALAQTINC
>CP034953.1|QAA90921.1|3462786_3463245_-|YaiI/YqxD-family-protein
MTIWVDADACPNVIKEILYRAAERMQMPLVLVANQSLRVPPSRFIRTLRVAAGFDVADNEIVRQCEAGDLVITADIPLAAEAIEKGAAALNPRGERYTPATIRERLTMRDFMDTLRASGIQTGGPDSLSQRDRQAFAAELEKWWLEVQRSRG
>CP034953.1|QAA90922.1|3463364_3464174_+|pyrroline-5-carboxylate-reductase
MEKKIGFIGCGNMGKAILGGLIASGQVLPGQIWVYTPSPDKVAALHDQFGINAAESAQEVAQIADIIFAAVKPGIMIKVLSEITSSLNKDSLVVSIAAGVTLDQLARALGHDRKIIRAMPNTPALVNAGMTSVTPNALVTPEDTADVLNIFRCFGEAEVIAEPMIHPVVGVSGSSPAYVFMFIEAMADAAVLGGMPRAQAYKFAAQAVMGSAKMVLETGEHPGALKDMVCSPGGTTIEAVRVLEEKGFRAAVIEAMTKCMEKSEKLSKS
>CP034953.1|QAA90923.1|3464190_3465306_-|diguanylate-cyclase-AdrA
MFPKIMNDENFFKKAAAHGEEPPLTPQNEHQRSGLRFARRVRLPRAVGLAGMFLPIASTLVSHPPPGWWWLVLVGWAFVWPHLAWQIASRAVDPLSREIYNLKTDAVLAGMWVGVMGVNVLPSTAMLMIMCLNLMGAGGPRLFVAGLVLMVVSCLVTLELTGITVSFNSAPLEWWLSLPIIVIYPLLFGWVSYQTATKLAEHKRRLQVMSTRDGMTGVYNRRHWETMLRNEFDNCRRHNRDATLLIIDIDHFKSINDTWGHDVGDEAIVALTRQLQITLRGSDVIGRFGGDEFAVIMSGTPAESAITAMLRVHEGLNTLRLPNTPQVTLRISVGVAPLNPQMSHYREWLKSADLALYKAKKAGRNRTEVAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
CP034953_6	6.1\|2799478\|40\|CP034953\|CRISPRCasFinder	2799478-2799517	40	NZ_CP041417	Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence	47951-47990	0	1.0
CP034953_5	5.1\|2135142\|38\|CP034953\|CRISPRCasFinder	2135142-2135179	38	NZ_CP043437	Enterobacter sp. LU1 plasmid unnamed	113727-113764	2	0.947
CP034953_2	2.2\|980328\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	980328-980360	33	NZ_LR134258	Klebsiella aerogenes strain NCTC9644 plasmid 5, complete sequence	3574-3606	4	0.879
CP034953_2	2.2\|980328\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	980328-980360	33	LR134281	Klebsiella aerogenes strain NCTC9793 genome assembly, plasmid: 6	3567-3599	4	0.879
CP034953_2	2.2\|980328\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	980328-980360	33	KY271401	Klebsiella phage 1 LV-2017, complete genome	21043-21075	4	0.879
CP034953_3	3.8\|1006641\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006641-1006672	32	NC_021229	Arthrobacter nicotinovorans pAO1 megaplasmid sequence, strain ATCC 49919	65474-65505	5	0.844
CP034953_2	2.2\|980328\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	980328-980360	33	KY653119	Morganella phage IME1369_02, complete genome	18216-18248	6	0.818
CP034953_3	3.1\|1006212\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006212-1006243	32	NZ_CP009293	Novosphingobium pentaromativorans US6-1 plasmid pLA4, complete sequence	152196-152227	6	0.812
CP034953_3	3.2\|1006273\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006273-1006304	32	KY883647	Vibrio phage JSF33, complete genome	9760-9791	6	0.812
CP034953_3	3.8\|1006641\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006641-1006672	32	NZ_CP017422	Arthrobacter sp. ZXY-2 plasmid pZXY21, complete sequence	208287-208318	6	0.812
CP034953_2	2.3\|980389\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	980389-980421	33	NZ_CP007129	Gemmatirosa kalamazoonesis strain KBS708 plasmid 1, complete sequence	755172-755204	8	0.758
CP034953_3	3.1\|1006212\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006212-1006243	32	NZ_CP007130	Gemmatirosa kalamazoonesis strain KBS708 plasmid 2, complete sequence	750410-750441	8	0.75
CP034953_3	3.2\|1006273\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006273-1006304	32	MN855762	Bacteriophage sp. isolate 505, complete genome	4840-4871	8	0.75
CP034953_3	3.2\|1006273\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006273-1006304	32	NC_020548	Azoarcus sp. KH32C plasmid pAZKH, complete sequence	224460-224491	8	0.75
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NC_013856	Azospirillum sp. B510 plasmid pAB510b, complete sequence	375744-375776	8	0.758
CP034953_3	3.8\|1006641\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006641-1006672	32	MK113951	Phage 5P_3, complete genome	11967-11998	8	0.75
CP034953_3	3.8\|1006641\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006641-1006672	32	AP017924	Ralstonia phage RP12 DNA, complete genome	11643-11674	8	0.75
CP034953_3	3.12\|1006885\|32\|CP034953\|CRISPRCasFinder,CRT	1006885-1006916	32	NZ_AP018516	Acetobacter orientalis strain FAN1 plasmid pAOF1, complete sequence	48296-48327	8	0.75
CP034953_3	3.1\|1006212\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006212-1006243	32	MN234174	Mycobacterium phage Efra2, complete genome	35614-35645	9	0.719
CP034953_3	3.1\|1006212\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006212-1006243	32	MN234165	Mycobacterium phage Yunkel11, complete genome	35570-35601	9	0.719
CP034953_3	3.1\|1006212\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006212-1006243	32	MN234201	Mycobacterium phage Guanica15, complete genome	35571-35602	9	0.719
CP034953_3	3.2\|1006273\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006273-1006304	32	NZ_CP015585	Roseomonas gilardii strain U14-5 plasmid 1, complete sequence	104261-104292	9	0.719
CP034953_3	3.2\|1006273\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006273-1006304	32	NZ_CP054618	Azospirillum oryzae strain KACC 14407 plasmid unnamed4, complete sequence	142898-142929	9	0.719
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_CP010957	Sphingobium sp. YBL2 plasmid 3pYBL2-3, complete sequence	26182-26214	9	0.727
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052797	Salmonella enterica subsp. enterica serovar Infantis strain CVM N18S2039 plasmid pN18S2039, complete sequence	45808-45839	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052795	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0125 plasmid pN19S0125, complete sequence	282589-282620	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP047882	Salmonella enterica subsp. enterica serovar Infantis strain 119944 plasmid pESI, complete sequence	94965-94996	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052804	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S973 plasmid pN17S0973, complete sequence	304288-304319	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP038508	Salmonella enterica subsp. enterica serovar Infantis strain FARPER-219 plasmid p-F219, complete sequence	112376-112407	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052802	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S976 plasmid pN17S0976, complete sequence	315682-315713	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052788	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0611 plasmid pN19S0611, complete sequence	203378-203409	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052840	Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S024 plasmid pN16S024, complete sequence	127648-127679	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052786	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0641 plasmid pN19S0641, complete sequence	215302-215333	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052838	Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S097 plasmid pN16S097, complete sequence	214483-214514	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP028316	Salmonella enterica subsp. enterica serovar Typhimurium var. 5- strain CFSAN067217 plasmid pSC-31-2, complete sequence	108893-108924	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP051676	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1234 plasmid pN16S1234, complete sequence	83669-83700	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052783	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0679 plasmid pN19S0679-1, complete sequence	194119-194150	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052836	Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S103 plasmid pN16S103, complete sequence	18410-18441	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP022063	Salmonella enterica strain FDAARGOS_312 plasmid unnamed3, complete sequence	64615-64646	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052781	Salmonella enterica strain CVM N19S0949 plasmid pN19S0949, complete sequence	169480-169511	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052834	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S041 plasmid pN17S0041, complete sequence	6457-6488	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052793	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0388 plasmid pN19S0388, complete sequence	25758-25789	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052779	Salmonella enterica strain 19TN07GT06K-S plasmid pN19S1233, complete sequence	140403-140434	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052832	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1040 plasmid pN17S1040, complete sequence	160727-160758	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP031362	Salmonella enterica subsp. enterica serovar Heidelberg strain 5 plasmid p3, complete sequence	140152-140183	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052830	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1105 plasmid pN17S1105, complete sequence	193709-193740	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052828	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1126 plasmid pN17S1126, complete sequence	126974-127005	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052826	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1245 plasmid pN17S0637, complete sequence	110984-111015	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP016409	Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502916 plasmid pFSIS1502916, complete sequence	94916-94947	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052824	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1265 plasmid pN17S1265, complete sequence	91497-91528	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052822	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1349 plasmid pN17S1349, complete sequence	110984-111015	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP016407	Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502169 plasmid pFSIS1502169, complete sequence	94916-94947	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052820	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1442 plasmid pN17S1442, complete sequence	94916-94947	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP016413	Salmonella enterica subsp. enterica serovar Infantis strain CVM44454 plasmid pCVM44454, complete sequence	94916-94947	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP016411	Salmonella enterica subsp. enterica serovar Infantis strain N55391 plasmid pN55391, complete sequence	94916-94947	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052816	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1598 plasmid pN17S1598	165317-165348	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052814	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S349 plasmid pN17S0349, complete sequence	99109-99140	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP022662	Salmonella enterica subsp. enterica strain RM11065 plasmid pRM11065-2, complete sequence	54379-54410	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052812	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S376 plasmid pN17S0376, complete sequence	1671-1702	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052810	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S535 plasmid pN17S0535, complete sequence	212751-212782	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052808	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S637 plasmid pN17S0637, complete sequence	306376-306407	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052806	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S816 plasmid pN17S0816, complete sequence	164579-164610	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052791	Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0552 plasmid pN17S0637, complete sequence	168074-168105	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052818	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1509 plasmid pN17S1509, complete sequence	190524-190555	10	0.688
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	CP052799	Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S990 plasmid pN17S0990-1, complete sequence	6457-6488	10	0.688
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	CP046443	Pseudomonas coronafaciens pv. coronafaciens strain B19001 plasmid unnamed2, complete sequence	31933-31965	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_LT963392	Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence	103013-103045	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_LT963392	Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence	110510-110542	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_CP034079	Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-1, complete sequence	48454-48486	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_CP034080	Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-2, complete sequence	39480-39512	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NC_005918	Pseudomonas syringae pv. maculicola strain ES4326 plasmid pPMA4326A, complete sequence	31117-31149	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_CP047262	Pseudomonas syringae pv. maculicola str. ES4326 plasmid pPma4326A, complete sequence	30966-30998	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_CP026560	Pseudomonas amygdali pv. morsprunorum strain R15244 plasmid p3_tig5, complete sequence	19118-19150	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_LT963406	Pseudomonas syringae pv. avii isolate CFBP3846 plasmid PP4, complete sequence	54820-54852	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	LT985193	Pseudomonas syringae strain CFBP 2116 genome assembly, plasmid: PP2	32077-32109	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_LT963393	Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP2, complete sequence	50597-50629	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_LT985210	Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP1, complete sequence	105842-105874	10	0.697
CP034953_3	3.5\|1006457\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006457-1006489	33	NZ_LT985211	Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP2, complete sequence	84272-84304	10	0.697
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NZ_CP028970	Aminobacter sp. MSH1 plasmid pUSP2, complete sequence	156123-156154	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NZ_CP053984	Achromobacter pestifer strain FDAARGOS_790 plasmid unnamed, complete sequence	21888-21919	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NC_010935	Comamonas testosteroni CNB-1 plasmid pCNB, complete sequence	28766-28797	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	JX469826	Uncultured bacterium plasmid pB12, complete sequence	11283-11314	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	JN106171	Uncultured bacterium plasmid pAKD26, complete sequence	11289-11320	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NC_016968	Comamonas testosteroni plasmid pTB30, complete sequence	11287-11318	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NC_016978	Comamonas testosteroni plasmid pI2, complete sequence	11272-11303	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NZ_CP017760	Cupriavidus necator strain NH9 plasmid pENH91, complete sequence	67078-67109	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NZ_CP053554	Diaphorobacter sp. JS3050 plasmid pDCNB, complete sequence	4235-4266	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NC_019263	Delftia acidovorans plasmid pLME1, complete sequence	11288-11319	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NC_019264	Delftia acidovorans plasmid pNB8c, complete sequence	11288-11319	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NC_019283	Delftia acidovorans plasmid pC1-1, complete sequence	11288-11319	10	0.688
CP034953_3	3.7\|1006580\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006580-1006611	32	NC_006830	Achromobacter xylosoxidans A8 plasmid pA81, complete sequence	11350-11381	10	0.688
CP034953_3	3.8\|1006641\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006641-1006672	32	NC_002580	Propionibacterium freudenreichii plasmid p545, complete sequence	2898-2929	10	0.688
CP034953_9	9.1\|3457832\|59\|CP034953\|CRISPRCasFinder	3457832-3457890	59	MT230312	Escherichia coli strain DH5alpha plasmid pESBL31, complete sequence	97-155	10	0.831
CP034953_2	2.2\|980328\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	980328-980360	33	MF158039	Shigella phage Sf12, complete genome	4974-5006	11	0.667
CP034953_2	2.2\|980328\|33\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	980328-980360	33	MF158042	Shigella phage Sd1, complete genome	937-969	11	0.667
CP034953_3	3.3\|1006334\|32\|CP034953\|PILER-CR,CRISPRCasFinder,CRT	1006334-1006365	32	NZ_CP026128	Acinetobacter baumannii strain ABNIH28 plasmid pABA-1fe1, complete sequence	49165-49196	11	0.656
CP034953_9	9.1\|3457832\|59\|CP034953\|CRISPRCasFinder	3457832-3457890	59	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	40375-40433	11	0.814

1. spacer 6.1|2799478|40|CP034953|CRISPRCasFinder matches to NZ_CP041417 (Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence) position: , mismatch: 0, identity: 1.0

gcgctgcgggtcattcttgaaattacccccgctgtgctgt	CRISPR spacer
gcgctgcgggtcattcttgaaattacccccgctgtgctgt	Protospacer
****************************************

2. spacer 5.1|2135142|38|CP034953|CRISPRCasFinder matches to NZ_CP043437 (Enterobacter sp. LU1 plasmid unnamed) position: , mismatch: 2, identity: 0.947

cggacgcaggatggtgcgttcaattggactcgaaccaa	CRISPR spacer
cagacgcagaatggtgcgttcaattggactcgaaccaa	Protospacer
*.*******.****************************

3. spacer 2.2|980328|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LR134258 (Klebsiella aerogenes strain NCTC9644 plasmid 5, complete sequence) position: , mismatch: 4, identity: 0.879

tgtgtttgcggcattaacgctcaccagcatttc	CRISPR spacer
ggggttcgcggcgttaacgctcaccagcatttc	Protospacer
 * ***.*****.********************

4. spacer 2.2|980328|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to LR134281 (Klebsiella aerogenes strain NCTC9793 genome assembly, plasmid: 6) position: , mismatch: 4, identity: 0.879

tgtgtttgcggcattaacgctcaccagcatttc	CRISPR spacer
ggggttcgcggcgttaacgctcaccagcatttc	Protospacer
 * ***.*****.********************

5. spacer 2.2|980328|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to KY271401 (Klebsiella phage 1 LV-2017, complete genome) position: , mismatch: 4, identity: 0.879

tgtgtttgcggcattaacgctcaccagcatttc	CRISPR spacer
ggggttcgcggcgttaacgctcaccagcatttc	Protospacer
 * ***.*****.********************

6. spacer 3.8|1006641|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_021229 (Arthrobacter nicotinovorans pAO1 megaplasmid sequence, strain ATCC 49919) position: , mismatch: 5, identity: 0.844

-ctgctggagctggctgcaaggcaagccgccca	CRISPR spacer
tccgctcg-gcaggctgcaacgcaagccgccca	Protospacer
 *.*** * ** ******** ************

7. spacer 2.2|980328|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to KY653119 (Morganella phage IME1369_02, complete genome) position: , mismatch: 6, identity: 0.818

tgtgtttgcggcattaacgctcaccagcatttc	CRISPR spacer
aggttgtgcggcgttaacgctgaccagcatttc	Protospacer
 *  * ******.******** ***********

8. spacer 3.1|1006212|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP009293 (Novosphingobium pentaromativorans US6-1 plasmid pLA4, complete sequence) position: , mismatch: 6, identity: 0.812

ctttcgcagacgcgcggcgatacgctcacgca	CRISPR spacer
ctcacgcagacgcgcggcgacacgctcattct	Protospacer
**. ****************.*******. *

9. spacer 3.2|1006273|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to KY883647 (Vibrio phage JSF33, complete genome) position: , mismatch: 6, identity: 0.812

cagccgaagccaaaggtgatgccgaacacgct	CRISPR spacer
aagccaaagccaaagctgatgccgaaactgct	Protospacer
 ****.********* **********  .***

10. spacer 3.8|1006641|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP017422 (Arthrobacter sp. ZXY-2 plasmid pZXY21, complete sequence) position: , mismatch: 6, identity: 0.812

-ctgctggagctggctgcaaggcaagccgccca	CRISPR spacer
tccgctcg-gcaggctgcaacgcaagccgcccc	Protospacer
 *.*** * ** ******** ***********

11. spacer 2.3|980389|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP007129 (Gemmatirosa kalamazoonesis strain KBS708 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.758

gacgtggtcatgggtgctgctgttgcagagcca	CRISPR spacer
tccgtggtcgtgggtgctgctgttgctggagcg	Protospacer
  *******.**************** *.. *.

12. spacer 3.1|1006212|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP007130 (Gemmatirosa kalamazoonesis strain KBS708 plasmid 2, complete sequence) position: , mismatch: 8, identity: 0.75

-ctttcgcagacgcgcggcgatacgctcacgca	CRISPR spacer
ggcttcacgaa-gcgcggcgatacgctctcgct	Protospacer
  .***.*..* **************** ***

13. spacer 3.2|1006273|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to MN855762 (Bacteriophage sp. isolate 505, complete genome) position: , mismatch: 8, identity: 0.75

cagccgaagccaaaggtgatgccgaacacgct	CRISPR spacer
aagccgaagccaaaggtgatttcgagctggtc	Protospacer
 ******************* .***.*  *..

14. spacer 3.2|1006273|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_020548 (Azoarcus sp. KH32C plasmid pAZKH, complete sequence) position: , mismatch: 8, identity: 0.75

cagccgaagccaaaggtgatgc---cgaacacgct	CRISPR spacer
tagcagaagccgaaggtgatgccggcgagcag---	Protospacer
.*** ******.**********   ***.**

15. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_013856 (Azospirillum sp. B510 plasmid pAB510b, complete sequence) position: , mismatch: 8, identity: 0.758

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ctgatcgcgcattacctgcgcgtcgccgacgcg	Protospacer
* .*********  ************** *

16. spacer 3.8|1006641|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to MK113951 (Phage 5P_3, complete genome) position: , mismatch: 8, identity: 0.75

ctgctggagctggctgcaaggcaagccgccca	CRISPR spacer
gagcatcggctggctgcaaggcaagctgcccc	Protospacer
  **   .******************.****

17. spacer 3.8|1006641|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to AP017924 (Ralstonia phage RP12 DNA, complete genome) position: , mismatch: 8, identity: 0.75

ctgctggagctggctgcaaggcaagccgccca	CRISPR spacer
gcggaagcgctggctgcacggcaagcggccca	Protospacer
 .*  .* ********** ******* *****

18. spacer 3.12|1006885|32|CP034953|CRISPRCasFinder,CRT matches to NZ_AP018516 (Acetobacter orientalis strain FAN1 plasmid pAOF1, complete sequence) position: , mismatch: 8, identity: 0.75

gcaacgacggtgagatttcacgcctgacgctg	CRISPR spacer
tcaacgacggtaagatgtcacgcctaaagaat	Protospacer
 **********.**** ********.* *

19. spacer 3.1|1006212|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to MN234174 (Mycobacterium phage Efra2, complete genome) position: , mismatch: 9, identity: 0.719

ctttcgcagacgcgcggcgatacgctcacgca	CRISPR spacer
gatcaccagacgcgcggcgtcacgctcacggc	Protospacer
  *.  ************* .*********

20. spacer 3.1|1006212|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to MN234165 (Mycobacterium phage Yunkel11, complete genome) position: , mismatch: 9, identity: 0.719

ctttcgcagacgcgcggcgatacgctcacgca	CRISPR spacer
gatcaccagacgcgcggcgtcacgctcacggc	Protospacer
  *.  ************* .*********

21. spacer 3.1|1006212|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to MN234201 (Mycobacterium phage Guanica15, complete genome) position: , mismatch: 9, identity: 0.719

ctttcgcagacgcgcggcgatacgctcacgca	CRISPR spacer
gatcaccagacgcgcggcgtcacgctcacggc	Protospacer
  *.  ************* .*********

22. spacer 3.2|1006273|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP015585 (Roseomonas gilardii strain U14-5 plasmid 1, complete sequence) position: , mismatch: 9, identity: 0.719

cagccgaagccaaaggtgatgccgaacacgct	CRISPR spacer
cagctggagccaaaggtgatgcccgtgcggat	Protospacer
****.*.**************** .    * *

23. spacer 3.2|1006273|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP054618 (Azospirillum oryzae strain KACC 14407 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.719

cagccgaagccaaaggtgatgccgaacacgct	CRISPR spacer
gcgccgaaggcaaaggtgttgccgaggccgag	Protospacer
  ******* ******** ******.  **

24. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP010957 (Sphingobium sp. YBL2 plasmid 3pYBL2-3, complete sequence) position: , mismatch: 9, identity: 0.727

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ctcgacccgcataccttgcgtgtcgccgcctcg	Protospacer
*  . * ********.****.**********

25. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052797 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N18S2039 plasmid pN18S2039, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

26. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052795 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0125 plasmid pN19S0125, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

27. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP047882 (Salmonella enterica subsp. enterica serovar Infantis strain 119944 plasmid pESI, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

28. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052804 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S973 plasmid pN17S0973, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

29. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP038508 (Salmonella enterica subsp. enterica serovar Infantis strain FARPER-219 plasmid p-F219, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

30. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052802 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S976 plasmid pN17S0976, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

31. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052788 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0611 plasmid pN19S0611, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

32. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052840 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S024 plasmid pN16S024, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

33. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052786 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0641 plasmid pN19S0641, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

34. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052838 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S097 plasmid pN16S097, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

35. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP028316 (Salmonella enterica subsp. enterica serovar Typhimurium var. 5- strain CFSAN067217 plasmid pSC-31-2, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

36. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP051676 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1234 plasmid pN16S1234, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

37. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052783 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0679 plasmid pN19S0679-1, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

38. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052836 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N16S103 plasmid pN16S103, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

39. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP022063 (Salmonella enterica strain FDAARGOS_312 plasmid unnamed3, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

40. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052781 (Salmonella enterica strain CVM N19S0949 plasmid pN19S0949, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

41. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052834 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S041 plasmid pN17S0041, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

42. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052793 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0388 plasmid pN19S0388, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

43. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052779 (Salmonella enterica strain 19TN07GT06K-S plasmid pN19S1233, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

44. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052832 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1040 plasmid pN17S1040, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

45. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP031362 (Salmonella enterica subsp. enterica serovar Heidelberg strain 5 plasmid p3, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

46. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052830 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1105 plasmid pN17S1105, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

47. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052828 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1126 plasmid pN17S1126, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

48. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052826 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1245 plasmid pN17S0637, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

49. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016409 (Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502916 plasmid pFSIS1502916, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

50. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052824 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1265 plasmid pN17S1265, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

51. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052822 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1349 plasmid pN17S1349, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

52. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016407 (Salmonella enterica subsp. enterica serovar Infantis strain FSIS1502169 plasmid pFSIS1502169, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

53. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052820 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1442 plasmid pN17S1442, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

54. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016413 (Salmonella enterica subsp. enterica serovar Infantis strain CVM44454 plasmid pCVM44454, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

55. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016411 (Salmonella enterica subsp. enterica serovar Infantis strain N55391 plasmid pN55391, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

56. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052816 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1598 plasmid pN17S1598) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

57. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052814 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S349 plasmid pN17S0349, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

58. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP022662 (Salmonella enterica subsp. enterica strain RM11065 plasmid pRM11065-2, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

59. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052812 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S376 plasmid pN17S0376, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

60. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052810 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S535 plasmid pN17S0535, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

61. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052808 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S637 plasmid pN17S0637, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

62. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052806 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S816 plasmid pN17S0816, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

63. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052791 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N19S0552 plasmid pN17S0637, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

64. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052818 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S1509 plasmid pN17S1509, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

65. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP052799 (Salmonella enterica subsp. enterica serovar Infantis strain CVM N17S990 plasmid pN17S0990-1, complete sequence) position: , mismatch: 10, identity: 0.688

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tactccctgtcggttgtgtttgatagcgcctc	Protospacer
 .***************. ******..*..

66. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to CP046443 (Pseudomonas coronafaciens pv. coronafaciens strain B19001 plasmid unnamed2, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

67. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LT963392 (Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

68. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LT963392 (Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP1, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

69. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034079 (Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-1, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

70. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034080 (Pseudomonas syringae pv. pisi str. PP1 plasmid pPP1-2, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

71. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_005918 (Pseudomonas syringae pv. maculicola strain ES4326 plasmid pPMA4326A, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

72. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP047262 (Pseudomonas syringae pv. maculicola str. ES4326 plasmid pPma4326A, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

73. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP026560 (Pseudomonas amygdali pv. morsprunorum strain R15244 plasmid p3_tig5, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

74. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LT963406 (Pseudomonas syringae pv. avii isolate CFBP3846 plasmid PP4, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

75. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to LT985193 (Pseudomonas syringae strain CFBP 2116 genome assembly, plasmid: PP2) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

76. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LT963393 (Pseudomonas syringae pv. cerasicola isolate CFBP6109 plasmid PP2, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

77. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LT985210 (Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP1, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

78. spacer 3.5|1006457|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LT985211 (Pseudomonas syringae pv. cerasicola strain CFBP 6110 plasmid PP2, complete sequence) position: , mismatch: 10, identity: 0.697

cgaatcgcgcataccctgcgcgtcgccgcctgc	CRISPR spacer
ttcgctgcgcatctcctgcgcgtcgccgccggt	Protospacer
.  ...****** .**************** *.

79. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP028970 (Aminobacter sp. MSH1 plasmid pUSP2, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
acgtcaccccggaagcgattgccagcacacgc	Protospacer
.  ********.*** **********  .* .

80. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP053984 (Achromobacter pestifer strain FDAARGOS_790 plasmid unnamed, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

81. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_010935 (Comamonas testosteroni CNB-1 plasmid pCNB, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

82. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to JX469826 (Uncultured bacterium plasmid pB12, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

83. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to JN106171 (Uncultured bacterium plasmid pAKD26, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

84. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_016968 (Comamonas testosteroni plasmid pTB30, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

85. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_016978 (Comamonas testosteroni plasmid pI2, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

86. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP017760 (Cupriavidus necator strain NH9 plasmid pENH91, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

87. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP053554 (Diaphorobacter sp. JS3050 plasmid pDCNB, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

88. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_019263 (Delftia acidovorans plasmid pLME1, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

89. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_019264 (Delftia acidovorans plasmid pNB8c, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

90. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_019283 (Delftia acidovorans plasmid pC1-1, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

91. spacer 3.7|1006580|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_006830 (Achromobacter xylosoxidans A8 plasmid pA81, complete sequence) position: , mismatch: 10, identity: 0.688

gactcaccccgaaagagattgccagccagctt	CRISPR spacer
aggtactgacgaatgagaatgccagccagctt	Protospacer
.. *  .  **** **** *************

92. spacer 3.8|1006641|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NC_002580 (Propionibacterium freudenreichii plasmid p545, complete sequence) position: , mismatch: 10, identity: 0.688

ctgctggagctggctgcaaggcaagccgccca	CRISPR spacer
ccctgagagctggctgccacgcaagccgctgg	Protospacer
*. . .*********** * *********. .

93. spacer 9.1|3457832|59|CP034953|CRISPRCasFinder matches to MT230312 (Escherichia coli strain DH5alpha plasmid pESBL31, complete sequence) position: , mismatch: 10, identity: 0.831

-cggagcacttattgccggatgcggcgtgaacgccttatccggcctacggttctggcacc	CRISPR spacer
tcagtgcac-gatcgccggatgcggcgtgaacgccttatccgtcctacggttctgtgctc	Protospacer
 *.* ****  **.**************************** ************   .*

94. spacer 2.2|980328|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to MF158039 (Shigella phage Sf12, complete genome) position: , mismatch: 11, identity: 0.667

tgtgtttgcggcattaacgctcaccagcatttc	CRISPR spacer
attgtttgcagcattaacgctccccaagtgccg	Protospacer
  *******.************ ***.   ..

95. spacer 2.2|980328|33|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to MF158042 (Shigella phage Sd1, complete genome) position: , mismatch: 11, identity: 0.667

tgtgtttgcggcattaacgctcaccagcatttc	CRISPR spacer
attgtttgcagcattaacgctctccaagtgccg	Protospacer
  *******.************ ***.   ..

96. spacer 3.3|1006334|32|CP034953|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP026128 (Acinetobacter baumannii strain ABNIH28 plasmid pABA-1fe1, complete sequence) position: , mismatch: 11, identity: 0.656

ggctccctgtcggttgtaattgataatgttga	CRISPR spacer
tttgaactgtcggttgtaattggcaatgtatc	Protospacer
  .   ****************..*****

97. spacer 9.1|3457832|59|CP034953|CRISPRCasFinder matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 11, identity: 0.814

cggagcacttattgccggatgcggcgtgaacgccttatccggcctacggttctggcacc-	CRISPR spacer
ggtacggctttttgccggatgcggcgtaaacgccttatccggcctacggtt-tggtgcga	Protospacer
 * *  .*** ****************.*********************** ***..*

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1020414 : 1027553

Escherichia_phage(83.33%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
QAA88751.1\|1020414_1021053_-	aldolase	A0A077SK32	Escherichia_phage	3.1e-82	74.5
QAA88752.1\|1021144_1022311_-	four-carbon acid sugar kinase family protein	A0A077SLJ7	Escherichia_phage	1.1e-120	60.6
QAA88753.1\|1022307_1023216_-	NAD(P)-dependent oxidoreductase	A0A077SLF7	Escherichia_phage	4.3e-117	76.5
QAA88754.1\|1023411_1024179_+	DeoR/GlpR transcriptional regulator	A0A077SK06	Escherichia_phage	7.4e-70	56.3
QAA88755.1\|1024229_1024886_-	protein-serine/threonine phosphatase	A0A222YWF0	Escherichia_phage	4.7e-49	46.3
QAA88756.1\|1024991_1027553_-	DNA mismatch repair protein MutS	E3T5Q7	Cafeteria_roenbergensis_virus	3.0e-30	20.6

DBSCAN-SWA_2

1408134 : 1419344

Enterobacteria_phage(50.0%)

integrase,tail

attL 1404444:1404460|attR 1421354:1421370

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1404444:1404460	attL	NA	NA	NA	NA
QAA89093.1\|1408134_1408335_-	response regulator inhibitor TorI	K7P7V0	Enterobacteria_phage	2.4e-33	100.0
QAA89094.1\|1408466_1408772_-	hypothetical protein	U5P0J0	Shigella_phage	2.2e-49	96.0
QAA89095.1\|1408771_1409134_-	hypothetical protein	K7PH61	Enterobacteria_phage	2.0e-65	99.1
QAA89096.1\|1409124_1409661_-	5'-deoxynucleotidase	K7PKJ9	Enterobacteria_phage	3.7e-100	98.9
QAA89097.1\|1409788_1410613_-	DUF2303 family protein	K7PJQ6	Enterobacteria_phage	7.8e-150	99.3
QAA89098.1\|1410678_1411041_-	hypothetical protein	Q8SBF8	Shigella_phage	1.9e-60	99.2
QAA89099.1\|1411398_1411767_+	hypothetical protein	U5P0A0	Shigella_phage	1.3e-69	99.2
QAA89100.1\|1411763_1412258_+	PerC family transcriptional regulator	A0A0P0ZCF0	Stx2-converting_phage	1.2e-86	98.1
QAA89101.1\|1412257_1412533_+	phage N-6-adenine-methyltransferase	Q8SBE9	Shigella_phage	2.6e-49	100.0
QAA91873.1\|1412582_1413101_+	hypothetical protein	M1FN94	Enterobacteria_phage	4.6e-39	68.8
QAA89102.1\|1413127_1413568_+\|tail	tail fiber assembly protein	A0A0F7LDZ0	Escherichia_phage	9.5e-54	70.1
QAA89103.1\|1413866_1414148_+	hypothetical protein	NA	NA	NA	NA
QAA89104.1\|1414182_1415514_-	hypothetical protein	U5P0I5	Shigella_phage	6.8e-63	36.7
QAA89105.1\|1415510_1416431_-	glycosyltransferase	M1FQW5	Enterobacteria_phage	4.2e-160	89.9
QAA89106.1\|1416427_1416790_-	GtrA family protein	U5P0S6	Shigella_phage	1.0e-53	88.3
QAA91874.1\|1416942_1418100_-\|integrase	prophage integrase IntS	A5VW56	Enterobacteria_phage	5.7e-223	100.0
QAA89107.1\|1418411_1419344_-	hypothetical protein	E7DYY8	Enterobacteria_phage	2.5e-165	99.0
1421354:1421370	attR	NA	NA	NA	NA

DBSCAN-SWA_3

1663847 : 1673288

Enterobacteria_phage(85.71%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
QAA89313.1\|1663847_1664774_+	ABC transporter ATP-binding protein	G3M9Y6	Bacillus_virus	2.8e-23	30.8
QAA89314.1\|1664778_1665510_+	ABC transporter permease	NA	NA	NA	NA
QAA89315.1\|1665490_1665598_-	protein YohO	NA	NA	NA	NA
QAA89316.1\|1665657_1666389_-	HTH-type transcriptional regulator MlrA	Q9EYF2	Enterobacteria_phage	9.7e-112	99.5
QAA89317.1\|1666610_1668296_+	sensor histidine kinase	Q9EYF3	Enterobacteria_phage	2.5e-304	99.6
QAA89318.1\|1668292_1669012_+	two-component system response regulator YehT	NA	NA	NA	NA
QAA89319.1\|1669058_1669529_+	DUF1456 family protein	Q9EYF4	Enterobacteria_phage	5.2e-82	100.0
QAA89320.1\|1669568_1670030_-	DUF1307 domain-containing protein	Q9EYF5	Enterobacteria_phage	1.9e-76	100.0
QAA89321.1\|1670310_1672155_-	hypothetical protein	Q9EYF6	Enterobacteria_phage	0.0e+00	95.9
QAA89322.1\|1672151_1673288_-	VWA domain-containing protein	Q9EYF7	Enterobacteria_phage	1.9e-162	97.7

DBSCAN-SWA_4

1765356 : 1774027

Enterobacteria_phage(28.57%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
QAA89393.1\|1765356_1766751_+	colanic acid biosynthesis protein WcaM	A0A291LBB9	Klebsiella_phage	4.9e-19	31.9
QAA89394.1\|1766925_1767819_+	GalU regulator GalF	A0A127AW70	Bacillus_phage	1.0e-46	42.0
QAA89395.1\|1768191_1769277_+	dTDP-glucose 4,6-dehydratase	I7HTA3	Enterobacteria_phage	5.2e-101	53.9
QAA89396.1\|1769276_1770176_+	dTDP-4-dehydrorhamnose reductase	A0A291LA50	Escherichia_phage	1.5e-29	35.2
QAA89397.1\|1770233_1771115_+	glucose-1-phosphate thymidylyltransferase RfbA	I7I009	Enterobacteria_phage	1.9e-106	63.8
QAA89398.1\|1771114_1771672_+	dTDP-4-dehydrorhamnose 3,5-epimerase	A0A291LA62	Escherichia_phage	7.8e-53	57.5
QAA89399.1\|1771668_1772916_+	O16 family O-antigen flippase	NA	NA	NA	NA
QAA89400.1\|1772923_1774027_+	UDP-galactopyranose mutase	E4ZFQ1	Streptococcus_phage	1.0e-133	59.5

DBSCAN-SWA_5

2220778 : 2230742

Escherichia_phage(16.67%)

integrase,transposase

attL 2222680:2222693|attR 2235824:2235837

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
QAA89818.1\|2220778_2223205_-	dimethyl sulfoxide reductase subunit A	A0A077SK27	Escherichia_phage	7.7e-214	49.2
2222680:2222693	attL	NA	NA	NA	NA
QAA89819.1\|2223403_2223709_-	DUF1161 domain-containing protein	NA	NA	NA	NA
QAA89820.1\|2223816_2224527_+	YnfC family lipoprotein	NA	NA	NA	NA
QAA89821.1\|2224529_2225090_-	spermidine N1-acetyltransferase	NA	NA	NA	NA
QAA89822.1\|2225124_2225466_-	DUF1283 family protein	NA	NA	NA	NA
QAA89823.1\|2225600_2225927_+	YnfA family protein	A0A218MNG8	uncultured_virus	9.9e-24	55.6
QAA89824.1\|2226132_2227347_+	D-galactonate dehydratase family protein	Q6A202	Oenococcus_phage	1.4e-46	29.0
QAA89825.1\|2227358_2228378_+	Zn-dependent oxidoreductase	E3SJ82	Synechococcus_phage	4.3e-17	26.2
QAA89826.1\|2228435_2228546_+	transporter	NA	NA	NA	NA
QAA91899.1\|2228565_2229456_-\|integrase	site-specific integrase	Q859D2	Escherichia_coli_phage	1.5e-101	63.6
QAA89827.1\|2229469_2230742_+\|transposase	IS3-like element IS2 family transposase	Q9ZXG3	Shigella_phage	1.4e-177	99.3
2235824:2235837	attR	NA	NA	NA	NA

DBSCAN-SWA_6

2233946 : 2253144

Enterobacteria_phage(33.33%)

lysis,tail

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
QAA89831.1\|2233946_2234102_-	DUF1391 domain-containing protein	M4QQ57	Salicola_phage	3.0e-07	53.2
QAA89832.1\|2234268_2234676_-	helix-turn-helix domain-containing protein	K7PM82	Enterobacteria_phage	4.4e-13	54.7
QAA89833.1\|2234759_2234990_+	transcriptional regulator	NA	NA	NA	NA
QAA89834.1\|2235286_2235436_+	hypothetical protein	NA	NA	NA	NA
QAA89835.1\|2235872_2236205_-	protein FlxA	NA	NA	NA	NA
QAA89836.1\|2236407_2236713_-	hypothetical protein	NA	NA	NA	NA
QAA89837.1\|2236737_2236977_+	type II toxin-antitoxin system RelB/DinJ family antitoxin	A0A2H4JBG1	uncultured_Caudovirales_phage	1.6e-18	54.4
QAA89838.1\|2236976_2237264_+	type II toxin-antitoxin system mRNA interferase RelE	A0A2H4JBF4	uncultured_Caudovirales_phage	1.4e-29	66.0
QAA89839.1\|2237335_2237491_+	type I toxin-antitoxin system Hok family toxin	A0A0U2QV81	Escherichia_phage	1.5e-17	96.1
QAA89840.1\|2237707_2237959_+	hypothetical protein	NA	NA	NA	NA
QAA89841.1\|2238025_2238304_+	hypothetical protein	NA	NA	NA	NA
QAA89842.1\|2238305_2239355_+	DUF968 domain-containing protein	A0A291AWV9	Escherichia_phage	1.3e-112	57.3
QAA89843.1\|2239368_2240121_+	antitermination protein	A0A192Y5X6	Salmonella_phage	7.1e-134	92.8
QAA89844.1\|2240398_2240488_-	hypothetical protein	NA	NA	NA	NA
QAA89845.1\|2240542_2240755_-	cold shock-like protein CspF	NA	NA	NA	NA
QAA89846.1\|2241055_2241271_+	RNA chaperone/antiterminator CspA	A0A1W6JNX5	Morganella_phage	3.4e-25	76.5
QAA89847.1\|2242024_2242240_+\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	1.1e-31	94.4
QAA89848.1\|2242244_2242556_+	DUF1327 domain-containing protein	K7PGU6	Enterobacteria_phage	2.0e-26	64.6
QAA89849.1\|2242552_2243086_+	lysozyme	K7PLY1	Enterobacteria_phage	6.4e-97	93.2
QAA89850.1\|2243082_2243580_+	DUF2514 domain-containing protein	A0A291LBG9	Klebsiella_phage	2.9e-06	29.5
QAA89851.1\|2243942_2244155_+	cold-shock protein CspI	A0A1W6JNX5	Morganella_phage	1.2e-22	74.3
QAA91901.1\|2244165_2244354_+	cold-shock protein	NA	NA	NA	NA
QAA91902.1\|2244356_2244422_+	hypothetical protein	NA	NA	NA	NA
QAA89852.1\|2244500_2244656_+	hypothetical protein	NA	NA	NA	NA
QAA91903.1\|2244827_2245001_+	addiction module toxin, GnsA/GnsB family	NA	NA	NA	NA
QAA89853.1\|2245152_2245563_-	DUF1398 domain-containing protein	C6ZCX4	Enterobacteria_phage	2.5e-56	79.4
QAA89854.1\|2245620_2245854_-	DUF3950 domain-containing protein	A0A0K2FIR8	Escherichia_phage	2.5e-21	84.1
QAA89855.1\|2246242_2246812_+	DNA-packaging protein NohD	A0A0K2FIG2	Enterobacteria_phage	1.5e-91	98.3
QAA89856.1\|2246762_2247725_+\|tail	tail fiber protein	K7PHC9	Enterobacteria_phage	4.1e-41	70.9
QAA89857.1\|2248388_2248778_-	recombinase family protein	A0A219Y912	Aeromonas_phage	1.9e-13	39.0
QAA89858.1\|2248798_2248978_-	resolvase	NA	NA	NA	NA
QAA89859.1\|2249292_2249520_-	cold shock protein YdfK	A0A192Y6D5	Salmonella_phage	4.4e-31	87.8
QAA89860.1\|2249593_2249707_-	hypothetical protein	A0A1C9IHU6	Salmonella_phage	8.4e-07	80.6
QAA89861.1\|2250311_2251595_+	MFS transporter	NA	NA	NA	NA
QAA89862.1\|2251683_2253144_+	mannitol dehydrogenase family protein	H8ZJP8	Ostreococcus_tauri_virus	4.3e-42	29.6

DBSCAN-SWA_7

2445686 : 2476017

Escherichia_phage(43.33%)

lysis,tRNA,tail,transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
QAA90013.1\|2445686_2446820_+	porin OmpN	Q1MVN1	Enterobacteria_phage	1.1e-117	58.5
QAA90014.1\|2446960_2447395_+	universal stress protein UspF	A0A1W6JNV4	Morganella_phage	1.8e-28	52.8
QAA90015.1\|2448173_2448287_+	hypothetical protein	A0A1C9IHU6	Salmonella_phage	8.4e-07	80.6
QAA90016.1\|2448355_2448589_+	cold shock protein YdfK	A0A192Y6D5	Salmonella_phage	5.4e-32	87.0
QAA90017.1\|2448905_2449496_+	recombinase family protein	A0A0A7NPV4	Enterobacteria_phage	1.6e-24	38.8
QAA90018.1\|2449593_2450169_-\|tail	tail fiber assembly protein	K7PMH7	Enterobacteria_phage	6.5e-103	95.3
QAA90019.1\|2450168_2453531_-	short-chain fatty acid transporter	X2KTY7	Enterobacteria_phage	8.1e-12	36.4
QAA91911.1\|2453595_2453811_-	hypothetical protein	Q687E7	Enterobacteria_phage	1.4e-29	98.4
QAA90020.1\|2453853_2454834_+\|transposase	IS5-like element ISKpn26 family transposase	A0A077SK28	Escherichia_phage	1.8e-185	99.1
QAA90021.1\|2456291_2456492_-	hypothetical protein	NA	NA	NA	NA
QAA90022.1\|2456599_2456959_-	hypothetical protein	NA	NA	NA	NA
QAA90023.1\|2456939_2457203_-	hypothetical protein	A0A0R6PD10	Moraxella_phage	6.3e-21	56.1
QAA91912.1\|2457340_2458798_-	Trk system potassium uptake protein TrkG	NA	NA	NA	NA
QAA90024.1\|2458994_2459180_-\|lysis	prophage lysis lipoprotein RzoD	K7PHU6	Enterobacteria_phage	2.8e-15	98.2
QAA90025.1\|2459267_2459828_-	DUF1627 domain-containing protein	A0A0U2SAW4	Escherichia_phage	1.9e-67	88.1
QAA90026.1\|2459850_2460597_-	DNA replication protein DnaC	V5UQI5	Shigella_phage	3.8e-111	78.9
QAA90027.1\|2460603_2461461_-	DUF1376 domain-containing protein	A0A0U2RT81	Escherichia_phage	8.3e-70	84.5
QAA90028.1\|2461473_2461896_-	hypothetical protein	A0A0U2RXZ9	Escherichia_phage	1.5e-69	95.0
QAA90029.1\|2461918_2462215_-	transcriptional regulator	A0A0R6PH31	Moraxella_phage	9.6e-10	44.9
QAA90030.1\|2462338_2462815_+	DNA-binding protein	A0A2D1GNH0	Pseudomonas_phage	2.2e-11	53.4
QAA90031.1\|2463123_2463258_+	hypothetical protein	NA	NA	NA	NA
QAA90032.1\|2463268_2463424_+	DUF1391 domain-containing protein	M4QQ57	Salicola_phage	6.1e-08	55.3
QAA91913.1\|2463420_2463909_-	superinfection exclusion protein B	NA	NA	NA	NA
QAA90033.1\|2464350_2464572_+	killing protein KilR	A0A0U2RTC4	Escherichia_phage	4.9e-35	97.3
QAA90034.1\|2464571_2464742_+	hypothetical protein	A0A0U2SHB5	Escherichia_phage	3.6e-17	71.4
QAA91914.1\|2464816_2465092_+	protein RacC	A0A0U2QW85	Escherichia_phage	1.4e-42	96.7
QAA90035.1\|2465193_2467794_+	exodeoxyribonuclease VIII	A0A0U2I1R6	Escherichia_phage	5.1e-248	63.5
QAA90036.1\|2467786_2468596_+	recombination protein RecT	A0A1P8DTF2	Proteus_phage	8.8e-106	71.5
QAA90037.1\|2468652_2468847_+	type I toxin-antitoxin system endodeoxyribonuclease toxin RalR	A0A0U2QQP4	Escherichia_phage	5.8e-32	96.9
QAA90038.1\|2468839_2469049_+	double-strand break reduction protein RcbA	A0A0U2QL97	Escherichia_phage	6.1e-27	98.4
QAA90039.1\|2469127_2469343_+	hypothetical protein	A0A0U2RY08	Escherichia_phage	1.8e-37	100.0
QAA90040.1\|2469344_2470580_+	DUF3596 domain-containing protein	A0A0U2JGI6	Escherichia_phage	5.5e-240	98.8
QAA90041.1\|2470631_2471567_+\|tRNA	tRNA 2-thiocytidine(32) synthetase TtcA	A0A0U2S5Z2	Escherichia_phage	5.9e-146	98.8
QAA90042.1\|2471695_2473069_-	ATP-dependent RNA helicase DbpA	Q5GF26	Diachasmimorpha_longicaudata_entomopoxvirus	6.6e-53	33.1
QAA90043.1\|2473546_2474530_-	zinc transporter ZntB	NA	NA	NA	NA
QAA90044.1\|2474784_2476017_+	diguanylate cyclase DgcM	A0A127AWB9	Bacillus_phage	3.1e-17	39.5

DBSCAN-SWA_8

3259833 : 3304196

Enterobacteria_phage(56.0%)

integrase,transposase,protease,capsid,terminase,lysis

attL 3282908:3282954|attR 3304210:3304256

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
QAA91940.1\|3259833_3260946_-\|transposase	IS4-like element IS421 family transposase	NA	NA	NA	NA
QAA90736.1\|3261022_3261175_-	type I toxin-antitoxin system Hok family toxin	NA	NA	NA	NA
QAA90737.1\|3261627_3262746_+	glutamate--cysteine ligase	NA	NA	NA	NA
QAA90738.1\|3262811_3263060_+	DUF1158 domain-containing protein	NA	NA	NA	NA
QAA90739.1\|3263124_3263493_+	MmcQ/YjbR family DNA-binding protein	NA	NA	NA	NA
QAA90740.1\|3263586_3264240_+	oxygen-insensitive NAD(P)H nitroreductase	NA	NA	NA	NA
QAA90741.1\|3264347_3265595_+	mechanosensitive ion channel family protein	NA	NA	NA	NA
QAA90742.1\|3265675_3267052_-	phenylalanine transporter	NA	NA	NA	NA
QAA90743.1\|3267153_3270297_-	Cu(+)/Ag(+) efflux RND transporter permease subunit CusA	S5VTK5	Leptospira_phage	2.2e-59	22.1
QAA90744.1\|3270308_3271532_-	Cu(+)/Ag(+) efflux RND transporter periplasmic adaptor subunit CusB	NA	NA	NA	NA
QAA90745.1\|3271547_3271880_-	Cu(+)/Ag(+) efflux RND transporter periplasmic metallochaperone CusF	NA	NA	NA	NA
QAA90746.1\|3272037_3273411_-	Cu(+)/Ag(+) efflux RND transporter outer membrane channel CusC	NA	NA	NA	NA
QAA90747.1\|3273567_3274251_+	copper response regulator transcription factor CusR	W8CYM9	Bacillus_phage	1.0e-30	35.1
QAA90748.1\|3274240_3275683_+	Cu(+)/Ag(+) sensor histidine kinase CusS	A0A1V0SGX0	Hokovirus	3.0e-11	26.2
QAA90749.1\|3275832_3278070_+	phage adsorption protein NrfB	NA	NA	NA	NA
QAA90750.1\|3278056_3281029_+	phage receptor	NA	NA	NA	NA
QAA90751.1\|3281029_3281920_+	DUF4434 family protein	NA	NA	NA	NA
QAA90752.1\|3282102_3282864_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
3282908:3282954	attL	NA	NA	NA	NA
QAA90753.1\|3283377_3284331_+\|protease	omptin family outer membrane protease OmpT	NA	NA	NA	NA
QAA90754.1\|3284580_3285330_-	AraC family transcriptional regulator	NA	NA	NA	NA
QAA91941.1\|3286232_3286859_+	class I SAM-dependent methyltransferase	NA	NA	NA	NA
QAA90755.1\|3286803_3286941_-\|capsid	nucleocapsid protein	NA	NA	NA	NA
QAA90756.1\|3286913_3287657_-\|terminase	phage terminase large subunit family protein	K7PMH7	Enterobacteria_phage	4.1e-73	93.1
QAA90757.1\|3287631_3288177_-	DNA-packaging protein NohD	A0A0K2FIG2	Enterobacteria_phage	4.0e-94	98.3
QAA90758.1\|3288565_3288760_+	DUF3950 domain-containing protein	A0A0K2FIR8	Escherichia_phage	8.7e-28	100.0
QAA90759.1\|3288924_3289131_-	hypothetical protein	A0A0K2FJ18	Enterobacteria_phage	5.8e-30	100.0
QAA90760.1\|3289416_3289827_+	DUF1398 domain-containing protein	C6ZCX4	Enterobacteria_phage	1.2e-71	98.5
QAA90761.1\|3290117_3290411_+	serum resistance lipoprotein Bor	A0A2R2X2B2	Escherichia_phage	5.7e-47	97.9
QAA90762.1\|3290501_3290684_-\|lysis	prophage lysis lipoprotein RzoD	K7PHU6	Enterobacteria_phage	1.4e-16	78.3
QAA90763.1\|3290900_3291398_-	lysozyme	M1FJA0	Enterobacteria_phage	1.1e-90	98.2
QAA90764.1\|3291397_3291613_-\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	9.0e-34	100.0
QAA90765.1\|3292185_3293253_+	porin	Q1MVN1	Enterobacteria_phage	2.0e-150	77.9
QAA90766.1\|3293257_3294274_+\|transposase	IS5-like element IS5 family transposase	Q38213	Escherichia_phage	4.4e-187	100.0
QAA90767.1\|3294671_3295055_-	antitermination protein QuuD	A0A088CD47	Shigella_phage	4.4e-55	83.3
QAA90768.1\|3295140_3295281_-	YlcG family protein	K7PHH3	Enterobacteria_phage	1.1e-08	69.8
QAA90769.1\|3295277_3295640_-	crossover junction endodeoxyribonuclease RusA	K7PM48	Enterobacteria_phage	4.3e-60	96.5
QAA90770.1\|3295636_3295927_-	DUF1364 domain-containing protein	K7PGZ6	Enterobacteria_phage	3.3e-47	93.8
QAA90771.1\|3295919_3296090_-	protein NinE from lambdoid prophage DLP12	K7P7K0	Enterobacteria_phage	2.4e-13	69.8
QAA90772.1\|3296089_3296545_-	DNA base-flipping protein YbcN	I6PD71	Cronobacter_phage	4.1e-60	66.9
QAA90773.1\|3296541_3296643_-	hypothetical protein	NA	NA	NA	NA
QAA90774.1\|3296759_3297557_-	AraC family transcriptional regulator	NA	NA	NA	NA
QAA90775.1\|3297566_3298118_-	kinase inhibitor	NA	NA	NA	NA
QAA90776.1\|3298582_3300109_-	recombinase family protein	Q3HQV4	Burkholderia_phage	7.9e-31	27.8
QAA90777.1\|3300166_3300316_-	hypothetical protein	NA	NA	NA	NA
QAA90778.1\|3300363_3300696_-	multidrug SMR transporter	NA	NA	NA	NA
QAA90779.1\|3301006_3302169_-\|transposase	IS3-like element IS3 family transposase	A0A0P0I4A4	Acinetobacter_phage	3.1e-51	40.6
QAA90780.1\|3302231_3302327_-	protein ren	M1FPD5	Enterobacteria_phage	1.5e-09	100.0
QAA90781.1\|3302649_3302913_+	hypothetical protein	B6DZ61	Enterobacteria_phage	1.8e-44	97.7
QAA90782.1\|3303032_3304196_+\|integrase	site-specific integrase	A0A088CD23	Shigella_phage	8.9e-200	86.6
3304210:3304256	attR	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. CP034953

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection