CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Target MGE spacer number	Prophage number
NC_010693	Erwinia tasmaniensis Et1/99 plasmid pET46, complete sequence	0 crisprs	NA	0	0
NC_010695	Erwinia tasmaniensis Et1/99 plasmid pET09, complete sequence	0 crisprs	NA	0	0
NC_010699	Erwinia tasmaniensis Et1/99 plasmid pET45, complete sequence	0 crisprs	NA	0	0
NC_010697	Erwinia tasmaniensis Et1/99 plasmid pET49, complete sequence	0 crisprs	NA	0	0
NC_010694	Erwinia tasmaniensis Et1/99, complete genome	4 crisprs	cas1,cas3f,cas8f,cas5f,cas7f,cas6f,cas3,DEDDh,DinG,RT,csa3	23	6
NC_010696	Erwinia tasmaniensis Et1/99 plasmid pET35, complete sequence	0 crisprs	NA	0	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_010694_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010694_1

631766-631858

Orphan

Consensus_repeat	Method
GTGACTCTGTGCGTGACCTGTCAG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010694_1

>merge|NC_010694|1|631766-631858|CRISPRCasFinder
GTGACTCTGTGCGTGACCTGTCAGAGCATCGCGCCTATCCCTGAAGCGCGCCGCAAAGCGCTGGACGGCGTGACTCTGTGCGTGACCTGTCAG

>NC_010694|1|1|631766-631858|CRISPRCasFinder
GTGACTCTGTGCGTGACCTGTCAG	AGCATCGCGCCTATCCCTGAAGCGCGCCGCAAAGCGCTGGACGGC
GTGACTCTGTGCGTGACCTGTCAG

Protein	Signature genes	Signature genes Name	Protein_function
NC_010694.1\|WP_012440308.1\|630292_630802_+\|phage-regulatory-CII-family-protein	unknown	unknown	gnl\|CDD\|369127
NC_010694.1\|WP_012440319.1\|636343_637399_-\|phage-portal-protein	unknown	unknown	gnl\|CDD\|222860
NC_010694.1\|WP_012440309.1\|630809_631010_+\|DUF2724-domain-containing-protein	unknown	unknown	gnl\|CDD\|371288
NC_010694.1\|WP_012440305.1\|628262_629291_-\|tyrosine-type-recombinase/integrase	unknown	unknown	gnl\|CDD\|222904
NC_010694.1\|WP_012440306.1\|629290_629869_-\|phage-repressor-protein-CI	unknown	unknown	gnl\|CDD\|374550
NC_010694.1\|WP_012440322.1\|640216_641386_+\|phage-major-capsid-protein,-P2-family	unknown	unknown	gnl\|CDD\|368296
NC_010694.1\|WP_042958620.1\|636007_636307_+\|DUF1493-family-protein	unknown	unknown	gnl\|CDD\|369336
NC_010694.1\|WP_012440303.1\|625326_626058_+\|hypothetical-protein	unknown	unknown	unknown
NC_010694.1\|WP_042958617.1\|631902_632139_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|273146
NC_010694.1\|WP_012440320.1\|637398_639165_-\|terminase-ATPase-subunit-family-protein	unknown	unknown	gnl\|CDD\|222859
NC_010694.1\|WP_012440321.1\|639309_640173_+\|GPO-family-capsid-scaffolding-protein	unknown	unknown	gnl\|CDD\|368675
NC_010694.1\|WP_012440314.1\|634697_634886_+\|hypothetical-protein	unknown	unknown	unknown
NC_010694.1\|WP_012440323.1\|641389_642031_+\|phage-terminase	unknown	unknown	gnl\|CDD\|222861
NC_010694.1\|WP_012440310.1\|630973_631315_+\|DUF5347-domain-containing-protein	unknown	unknown	gnl\|CDD\|375102
NC_010694.1\|WP_012440317.1\|635552_636014_+\|hypothetical-protein	unknown	unknown	unknown
NC_010694.1\|WP_012440311.1\|631382_631610_+\|DUF2732-domain-containing-protein	unknown	unknown	gnl\|CDD\|313909
NC_010694.1\|WP_012440304.1\|626925_628248_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376281
NC_010694.1\|WP_042959250.1\|632174_634550_+\|replication-endonuclease	unknown	unknown	gnl\|CDD\|336220
NC_010694.1\|WP_042958615.1\|626624_626819_+\|hypothetical-protein	unknown	unknown	unknown
NC_010694.1\|WP_012440307.1\|629998_630262_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_010694.1\|WP_012440308.1\|630292_630802_+\|phage-regulatory-CII-family-protein	gnl\|CDD\|369127	pfam06892, Phage_CP76, Phage regulatory protein CII (CP76). This family consists of several phage regulatory protein CII (CP76) sequences which are thought to be DNA binding proteins which are involved in the establishment of lysogeny.	5.11159e-85
NC_010694.1\|WP_012440309.1\|630809_631010_+\|DUF2724-domain-containing-protein	gnl\|CDD\|371288	pfam10893, DUF2724, Protein of unknown function (DUF2724). This is a family of proteins with unknown function.	1.13894e-21
NC_010694.1\|WP_012440305.1\|628262_629291_-\|tyrosine-type-recombinase/integrase	gnl\|CDD\|222904	PHA02601, int, integrase; Provisional.	1.63024e-165
NC_010694.1\|WP_012440306.1\|629290_629869_-\|phage-repressor-protein-CI	gnl\|CDD\|374550	pfam16452, Phage_CI_C, Bacteriophage CI repressor C-terminal domain. The C-terminal domain of the CI repressor functions in oligomer formation.	4.54094e-28
NC_010694.1\|WP_012440322.1\|640216_641386_+\|phage-major-capsid-protein,-P2-family	gnl\|CDD\|368296	pfam05125, Phage_cap_P2, Phage major capsid protein, P2 family.	0
NC_010694.1\|WP_042958620.1\|636007_636307_+\|DUF1493-family-protein	gnl\|CDD\|369336	pfam07377, DUF1493, Protein of unknown function (DUF1493). This family consists of several bacterial proteins of around 115 residues in length. Members of this family seem to be found exclusively in Salmonella and Yersinia species and several have been described as being putative cytoplasmic proteins. The function of this family is unknown.	1.01322e-16
NC_010694.1\|WP_042959250.1\|632174_634550_+\|replication-endonuclease	gnl\|CDD\|336220	pfam05840, Phage_GPA, Bacteriophage replication gene A protein (GPA). This family consists of a group of bacteriophage replication gene A protein (GPA) like sequences from both viruses and bacteria. The members of this family are likely to be endonucleases.	5.79864e-143
NC_010694.1\|WP_042958617.1\|631902_632139_+\|hypothetical-protein	gnl\|CDD\|273146	TIGR00571, DNA_adenine_methylase, DNA adenine methylase (dam). All proteins in this family for which functions are known are DNA-adenine methyltransferases. This family is based on the phylogenomic analysis of JA Eisen (1999, Ph.D. Thesis, Stanford University). The DNA adenine methylase (dam) of E. coli and related species is instrumental in distinguishing the newly synthesized strand during DNA replication for methylation-directed mismatch repair. This family includes several phage methylases and a number of different restriction enzyme chromosomal site-specific modification systems. [DNA metabolism, DNA replication, recombination, and repair].	0.000118306
NC_010694.1\|WP_012440321.1\|639309_640173_+\|GPO-family-capsid-scaffolding-protein	gnl\|CDD\|368675	pfam05929, Phage_GPO, Phage capsid scaffolding protein (GPO) serine peptidase. This family consists of several bacteriophage capsid scaffolding proteins (GPO) and some related bacterial sequences. GPO is thought to function in both the assembly of proheads and the cleavage of GPN. The family is found to function as a serine peptidase, with a conserved Asp, His and Ser catalytic triad, as in subtilisin, and as represented in MEROPS:S73. The family includes capsid assembly scaffolding protein from Enterobacteria phage P2 which cleaves itself and then becomes the scaffold protein upon which the bacteriophage prohead is built - a mechanism quite common amongst phages.	1.87532e-139
NC_010694.1\|WP_012440323.1\|641389_642031_+\|phage-terminase	gnl\|CDD\|222861	PHA02537, M, terminase endonuclease subunit; Provisional.	1.84252e-78
NC_010694.1\|WP_012440310.1\|630973_631315_+\|DUF5347-domain-containing-protein	gnl\|CDD\|375102	pfam17282, DUF5347, Family of unknown function (DUF5347). This family of unknown function is found in Bacteria, mainly in Proteobacteria.	5.01961e-46
NC_010694.1\|WP_012440311.1\|631382_631610_+\|DUF2732-domain-containing-protein	gnl\|CDD\|313909	pfam10809, DUF2732, Protein of unknown function (DUF2732). This family of proteins has no known function.	3.54028e-26
NC_010694.1\|WP_012440304.1\|626925_628248_-\|hypothetical-protein	gnl\|CDD\|376281	pfam18862, ApeA_NTD1, ApeA N-terminal domain 1. Mostly beta strands. Fused to HEPN (Apea). Several conserved aromatic residues, abundant but poorly conserved.	1.29957e-44
NC_010694.1\|WP_012440319.1\|636343_637399_-\|phage-portal-protein	gnl\|CDD\|222860	PHA02536, Q, portal vertex protein; Provisional.	0
NC_010694.1\|WP_012440320.1\|637398_639165_-\|terminase-ATPase-subunit-family-protein	gnl\|CDD\|222859	PHA02535, P, terminase ATPase subunit; Provisional.	0

>NC_010694.1|WP_012440311.1|631382_631610_+|DUF2732-domain-containing-protein
MRNTETRSFNTDSNALAVLLTDAKKEERKDRALAVSIRLEALAIHITKVGMSGTEAAELLRREATRFENESQELH
>NC_010694.1|WP_012440310.1|630973_631315_+|DUF5347-domain-containing-protein
MAIEGPTATIPLSPGERLEGLNHIAELRAKVFGLDIEPELERFIKDMRAPRDVNHKQNERALAAIFYMAKIPAERHGVNISDLTTDEKRELIKAMNHFRAVVSLFPKRLTMPN
>NC_010694.1|WP_012440309.1|630809_631010_+|DUF2724-domain-containing-protein
MLTKEPSLASLLVKQSPAMHYGHGWIMGKDDKRWHPCPSQNELLAGLSTTKQGKSWLLKALRQLFH
>NC_010694.1|WP_012440308.1|630292_630802_+|phage-regulatory-CII-family-protein
MFDYCVSKHPHFDEACRTFALRHNMAKLAERAGMNVQTLRNKLNPEQPHQITPSEIWLLTDLTEDSTLVDGFLAQIHCLPCVPMNEVAKEKLPHYVMSATAEIGRVAAGAVSGDVKTTAGRRDVISSINSVTRLMALAAVSMQARLQSNPAMASAVDTVTGLGASFGLI
>NC_010694.1|WP_012440307.1|629998_630262_+|hypothetical-protein
MASEIAIIKVPAPIVTLQLFAELEGVSERTAYRWTTGDNPCVPIEPRKIRKGCKKAGGPIRIYYARWKEEQTRKALGHSRFQLVIGS
>NC_010694.1|WP_012440306.1|629290_629869_-|phage-repressor-protein-CI
MGIQKNTLEPLTILDRIISVYGFTQKLQLANHFEMSPSSLQNRYTRGTISYDLAAFCSLETGASLRWILTGEGPQFEGSPSITDPKNMDLYTLNNGILDKNSILSIDSNILNKQISKGIAVRAEGKLHFVDQEAPHSDGLWLVDIESANSIRELTILPGRRLHVAGGKVPFECNFDDIRLLGRVVGIYSEIN
>NC_010694.1|WP_012440305.1|628262_629291_-|tyrosine-type-recombinase/integrase
MAIRKHPSGVGWLSEIYPNGAKGKRIRKKFATKGEALAFEQFTVQNPWQEEREDRRTLKELVDAWYSAHGITLKDGIRRQQAMHHAFGCMGEPLARDFDAQMFSRYRERRLKGEYARSNRVKEVSPRTLNLELAYFRAVFNELNRLGEWKGENPLKNMRPFRTAEMEMAWLTHDQIALLLDECKRHDHPDLETVVRICLATGARWSEAESLKKSHLAKYKITYTNTKGRKNRTVPISKELYESLPDDKKGRLFSDCYGAFRSALERTGIELPAGQLTHVLRHTFASHFMMNGGNILVLQRVLGHTDIKMTMRYAHFAPDHLEDAVRLNPLNHQLNNYTTAIN
>NC_010694.1|WP_012440304.1|626925_628248_-|hypothetical-protein
MAGYFYDFTKEHSFHGEFWSAPHDNKDRFSAKIEYTPYNGLVLDYCISDSDSPRTCQRLYGVLNTGEPCTLIGSFDFLQGSMHFGKLRVLTGKHYFKAIIFNGIYTEEDSVEYCDIALHGMQEFIHPQGFISQLKYSTKPILSIHGSEWKIDVINNATFSMIGDSLVNIIDCQHEEAFNKFTKDFWSTKKEYPKAFFSIRKNLKFFLRYANTINDSIIKHIDDIWKLTGLFSILLDKPVIPDELNIKFKGKQKNNPCLFSNGIEQRTIDLALSTINHHFLPLNWKQIDMGEVISKWLNMSDEYNPLSVTYQYETGLRTLHQAHADIILYATQLESINLTLSAKNEDKYIGPINKYASIDLKNKLEAIFSKFNKKTIGENITIVRGELAHVGRPKKLMKVMSIDDYIKIGLYLKITITAHLLSQLGLTKEQIERYQSKVAP
>NC_010694.1|WP_042958615.1|626624_626819_+|hypothetical-protein
MTEFIDTFYLFNLEHEVGSENLKTFQTLADKYSHLLSEAEKEVEEKEAEAFYGIRPSDYEFLTE
>NC_010694.1|WP_012440303.1|625326_626058_+|hypothetical-protein
MDTVIAFLSLALFIAFIVGLIKPSLVMMPNRKRSSALYLGGCLALSFIGSILWPTEKSQRVAKADVPAVKAEPAPPTFEYADKTLKEYRNELKETRHDIVKDYVNFKSVPASSTDAFYACMSEYSFTKDDALKLGDVLGWCFNHFEKDPQSLNNKINLDTFKGNFSGWDGSYRPLEKLIKASMNDDSSYKHISTVYHLILNKDPYAVVKTTFRGTNAYGGVVKQTVAARVNVRTGEVLSILDN
>NC_010694.1|WP_042958617.1|631902_632139_+|hypothetical-protein
MKTILKRVGSKSATMPERVKSLYRRFDINHINARRSIGVAAGEGKRVAEVIAVSTSTVCTGHNPSCTPRCNVVAGARR
>NC_010694.1|WP_042959250.1|632174_634550_+|replication-endonuclease
MKPGGTDDAAWAFPWNAPKKAINPYLDRPEVKPSALSDPIALFAAENEGAKQRRAALSDEAWNRYFYNESRDPVLKEMEQERLTGRARLIHEQHRFNPDLVIIDNVRAEPAFISKPLMQRIAYFQQLDRPKACSRYLRDTITPCLQRLERVRDSQASASFRFMASRDGLDGLLVLAEMNQHQVKRLATLVGAHMSLCLEEAGSALFTADEVKPQEIRRVWERVAAEAMRLDVIPPAFEALRRKKRRRKPVPYELIPGSLARMLCADWWYRKLWQTRCEWREEQLRAVCLVSKKASPYVSYEAVVHKREQRRKSLAFFRAHELVSENGDTLDMEEVVNASASNPAHRRNEMMACVKGLELIGEMRGDCAVFYTVTCPSRFHATLSNGRPNPTWSSATVRESSDYLVNTFAAFRKAMHRRGLRWYGVRVAEPHHDGTVHWHLLCFMRKKERRSISALLRKFAIREDRAELGNNTGPRFKSELINPRKGSPTGYIAKYISKNIDGRGLAGEISKETGKSLRDNAENVNAWASLHRVQQFRFFGIPGRQAYRELRLLAGQAGRAQGDKKAGAPVLDNARLDAVLAAADVGCFATYIMKQGGVLVPRKNHLIRTAYALNDEPGTYGDRGIRIYGIWSPLVAGRICTHALKWKKVRKAVDVQEATADQGGSAAPWTRGNNCPLVENLNKSGGELPDIKTMDEKELQEYLHNMGQKERRELTARLRLVKPKRKKAYKQTISDHQRLQLEAELSSRGFDGSESEIDLLLRGGSIPSGAGLRIFYRNHCLQEDGKWRQWY
>NC_010694.1|WP_012440314.1|634697_634886_+|hypothetical-protein
MQDYFLESLKLQRIDFFIKLVAASECSEEEKRLAIQWVSELTDELMAKIRSHEYCRSMDVIS
>NC_010694.1|WP_012440317.1|635552_636014_+|hypothetical-protein
MDTTEQLNGTYFYGGLSNLNAGELFYWIMVDVTAEHFTGATAATGNVIAAAAIYAGRNNVAVSGKLANATPGTSWASIQSRRLLQKYKLPFPLPTIVGNPFKMKIIMTKKLGTFVGRTVPVIGWAIVASDVAIIGWKSVNRYNTIASAEDKIW
>NC_010694.1|WP_042958620.1|636007_636307_+|DUF1493-family-protein
MVMDDNEKAVFALVEEYNGHWFWLRKRFRLTPATDLNKDFRMAPEDAAELLETFADRFSVDPKEINFGRYFPADNGKAEKPLTIQLLIDSARAGHWIDK
>NC_010694.1|WP_012440319.1|636343_637399_-|phage-portal-protein
MSKRRNRTRTQSVPQPDNMTSGAASEAFTFGDPIPVLDRRELLDYVECVINDRWYEPPVSVDGLARTFRAAVHHSSPISVKCNILASTFIPHPLLSQQAFTRFAMDYLIFGNAYLEKRISRLGNTLKLEPSLAKYTRRGLDLDTYWYAHYGLNTEPYEFTKGSVFHLMEPDINQEIYGVPGYLSAIPSALLNESATLFRRKYYLNGSHAGFIMYMTDPAQSQQDVDNIRSAMKSAKGPGNFRNLFMYSPNGKKDGIQIIPLSEVAAKDEFLNIKNVSRDDMLAVHRVPPQLMGIIPNNTGGFGDIEKASRVFVRNELIPLQARMKELNDWLGLGQEVIRFAPYNLDLEDGN
>NC_010694.1|WP_012440320.1|637398_639165_-|terminase-ATPase-subunit-family-protein
MTTTIAPADLDPRRQALLLYFQGYRIARIAEMLGEKPATVHSWKKRDKWGSYGPLDQMQLSTAARYCQLVMKEVKEGKDYKEIDLLARQSERHARIGKFNNGGNEAVLNPNVENRNTGPRKPPKKNVFSDAQIEKLQDIFHSTMFGYQRQWWEAGNKYAVRNLLKSRQIGATFFFAREALIDALTTGRNQIFLSASKAQAHVFKQYIVEFAREADVDLKGDPMTLDNGACLYFLGTNARTAQSYHGNLYLDEYFWIPKFQELQKVASGMALHKKWRETYFSTPSSLTHSAYPFWSGAQFNRGRAKADRVDIDLSHASLAAGRLCADGQFRQIVTVEDAVRGGCDLFDLEQLRTRYSPEDYQNLLMCVFMDDLASVFQLAMLQKCMVDSWEVWDDFEALALRPFGWKEVWIGYDPAKGTQNGDSAGCVVIAPPAVPGGKFRILERHQWRGMDFRAQADAIKTLTQQYNVTYIGIDSTGVGLGVYENVKAFFPQVKEFVYNPTVKNALVLKAYDTMATGRLEFDASHLDIAQSFMSIRKATTSSGNRPTYETSRSEEVSHGDLAWATMHALANEPLQGQAAHTQNIVEMY
>NC_010694.1|WP_012440321.1|639309_640173_+|GPO-family-capsid-scaffolding-protein
MAKKAKRFRIGVEGATTDGRTIVRSWLEQMAANYDPAVYTAVINMEHIKGYTPDSAFRRFGVVDALDTEEISDGLLKGKLGLYAVINPTDELVTMTGNMQKLFTSMEIRPEFADTGEAYLIGLAVTDDPASLGTEILQFSASAGANPLANRKQHPNNLFTAATETVIEFEDVADDKPSLFSRVSALFSNKQKSDDARFGDVHKAVELVATEQQEFSQRIETALSEQASSLQAQFTEGLSAEVAAREQLQADFSQLQERLSREDGRQDFRPRTPGNGSGNSQDVRTDC
>NC_010694.1|WP_012440322.1|640216_641386_+|phage-major-capsid-protein,-P2-family
MKNNTRFKLNAYMSVLAEINKINLSALNSKFTVESSIAQTLETKIQESSAFLQAINITPVDEQSGERLGLGIGQTIAGTTDTTQKEREPTDPTYIDGDGYKCTQTNFDTALPYSKLDMWAKFSDFQVRIRDVIVKRQALDRIMIGFNGLKREKTSNRVQNPLLQDVNIGWLEKIRQEKPSQVISQRIDNSGKVVAGNITIGKGGVFNNLDAVVMGAVSEKIAVQYQDDTELVVICGRQLLADKYFPIVNKDQPNTEALAADLIISQKRIGGLPAVRASFFPADALLITRLDNLSIYWQEETRRRSIIDNPKRDRIENFESVNEAYVVEDYDCTCLIENIEMLDQEPEPEAGQMSDAEIARIASVAASVVKAMSESGTPHAQAGTDTAGE
>NC_010694.1|WP_012440323.1|641389_642031_+|phage-terminase
MTNPFRAHTRFIQAQEAAQRGSNSRHAKGYDLMLLQLNEDRRRLKGIQSNVNKAQVKIEVLPKYAAWVEGVLSVDGAQQDDVIMYVMLWRIDAGDYAGALTIGRHALKHGWVMPIGKRTTSTVLAEEMADAAKAAILAETPFDADLLLQTLESVDGEDMPDQSRARLHKSIGWAQTGNSPVSALNHLKQALQLDERCGVKKDIEQLERKLRNS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010694_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010694_2

790320-790471

Orphan

Consensus_repeat	Method
GAGTGCAGCGAGCAAAGGTGAGGCAAGGCAAAAATTCACGAAAAAGCGCAGCTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010694_2

>merge|NC_010694|2|790320-790471|CRISPRCasFinder
GAGTGCAGCGAGCAAAGGTGAGGCAAGGCAAAAATTCACGAAAAAGCGCAGCTTGCCGGAGGCGGTGAGTATTTGAAGTGCTCTTTTTACACCGAACAGAGTGCAGCGAGCAAAGGTGAGGCAAGGCAAAAATTCACGAAAAAGCGCAGCTT

>NC_010694|2|2|790320-790471|CRISPRCasFinder
GAGTGCAGCGAGCAAAGGTGAGGCAAGGCAAAAATTCACGAAAAAGCGCAGCTT	GCCGGAGGCGGTGAGTATTTGAAGTGCTCTTTTTACACCGAACA
GAGTGCAGCGAGCAAAGGTGAGGCAAGGCAAAAATTCACGAAAAAGCGCAGCTT

Protein	Signature genes	Signature genes Name	Protein_function
NC_010694.1\|WP_012440464.1\|797147_797969_+\|4-hydroxy-tetrahydrodipicolinate-reductase	unknown	unknown	gnl\|CDD\|234595
NC_010694.1\|WP_012440456.1\|789075_790236_+\|Na+/H+-antiporter-NhaA	unknown	unknown	gnl\|CDD\|181955
NC_010694.1\|WP_012440462.1\|795485_795956_+\|FKBP-type-peptidyl-prolyl-cis-trans-isomerase	unknown	unknown	gnl\|CDD\|237908
NC_010694.1\|WP_012440467.1\|799601_802826_+\|carbamoyl-phosphate-synthase-large-subunit	unknown	unknown	gnl\|CDD\|235393
NC_010694.1\|WP_012440454.1\|787232_788375_+\|molecular-chaperone-DnaJ	unknown	unknown	gnl\|CDD\|236757
NC_010694.1\|WP_012440468.1\|802951_803566_-\|LysE-family-translocator	unknown	unknown	gnl\|CDD\|273358
NC_010694.1\|WP_012440460.1\|792159_794976_+\|isoleucine--tRNA-ligase	unknown	unknown	gnl\|CDD\|235588
NC_010694.1\|WP_042958658.1\|794972_795482_+\|signal-peptidase-II	unknown	unknown	gnl\|CDD\|234739
NC_010694.1\|WP_012440451.1\|783462_784050_+\|molybdopterin-adenylyltransferase	unknown	unknown	gnl\|CDD\|181837
NC_010694.1\|WP_012440453.1\|785208_787122_+\|molecular-chaperone-DnaK	unknown	unknown	gnl\|CDD\|234715
NC_010694.1\|WP_012440447.1\|778992_779922_+\|homoserine-kinase	unknown	unknown	gnl\|CDD\|234920
NC_010694.1\|WP_012440466.1\|798411_799587_+\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	unknown	unknown	gnl\|CDD\|237139
NC_010694.1\|WP_012440449.1\|781269_782046_-\|peroxide-stress-protein-YaaA	unknown	unknown	gnl\|CDD\|234999
NC_010694.1\|WP_012440450.1\|782313_783267_+\|transaldolase	unknown	unknown	gnl\|CDD\|235381
NC_010694.1\|WP_012440455.1\|788579_788870_+\|lipoprotein	unknown	unknown	gnl\|CDD\|368828
NC_010694.1\|WP_012440458.1\|790605_790869_-\|30S-ribosomal-protein-S20	unknown	unknown	gnl\|CDD\|178943
NC_010694.1\|WP_012440463.1\|795936_796890_+\|4-hydroxy-3-methylbut-2-enyl-diphosphate-reductase	unknown	unknown	gnl\|CDD\|234893
NC_010694.1\|WP_012440448.1\|779925_781212_+\|threonine-synthase	unknown	unknown	gnl\|CDD\|236418
NC_010694.1\|WP_012440459.1\|791184_792123_+\|bifunctional-riboflavin-kinase/FAD-synthetase	unknown	unknown	gnl\|CDD\|235536
NC_010694.1\|WP_042958656.1\|784895_785093_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_010694.1\|WP_012440464.1\|797147_797969_+\|4-hydroxy-tetrahydrodipicolinate-reductase	gnl\|CDD\|234595	PRK00048, PRK00048, dihydrodipicolinate reductase; Provisional.	2.38141e-135
NC_010694.1\|WP_012440456.1\|789075_790236_+\|Na+/H+-antiporter-NhaA	gnl\|CDD\|181955	PRK09561, nhaA, sodium/proton antiporter NhaA.	0
NC_010694.1\|WP_012440462.1\|795485_795956_+\|FKBP-type-peptidyl-prolyl-cis-trans-isomerase	gnl\|CDD\|237908	PRK15095, PRK15095, FKBP-type peptidyl-prolyl cis-trans isomerase; Provisional.	1.19801e-105
NC_010694.1\|WP_012440467.1\|799601_802826_+\|carbamoyl-phosphate-synthase-large-subunit	gnl\|CDD\|235393	PRK05294, carB, carbamoyl-phosphate synthase large subunit.	0
NC_010694.1\|WP_012440454.1\|787232_788375_+\|molecular-chaperone-DnaJ	gnl\|CDD\|236757	PRK10767, PRK10767, chaperone protein DnaJ; Provisional.	0
NC_010694.1\|WP_012440468.1\|802951_803566_-\|LysE-family-translocator	gnl\|CDD\|273358	TIGR00949, Uncharacterized_membrane_protein_YahN, The Resistance to Homoserine/Threonine (RhtB) Family protein. [Transport and binding proteins, Amino acids, peptides and amines].	9.48539e-43
NC_010694.1\|WP_012440460.1\|792159_794976_+\|isoleucine--tRNA-ligase	gnl\|CDD\|235588	PRK05743, ileS, isoleucyl-tRNA synthetase; Reviewed.	0
NC_010694.1\|WP_042958658.1\|794972_795482_+\|signal-peptidase-II	gnl\|CDD\|234739	PRK00376, lspA, lipoprotein signal peptidase.	4.5164e-74
NC_010694.1\|WP_012440451.1\|783462_784050_+\|molybdopterin-adenylyltransferase	gnl\|CDD\|181837	PRK09417, mogA, molybdenum cofactor biosynthesis protein MogA; Provisional.	5.26593e-138
NC_010694.1\|WP_012440453.1\|785208_787122_+\|molecular-chaperone-DnaK	gnl\|CDD\|234715	PRK00290, dnaK, molecular chaperone DnaK; Provisional.	0
NC_010694.1\|WP_012440447.1\|778992_779922_+\|homoserine-kinase	gnl\|CDD\|234920	PRK01212, PRK01212, homoserine kinase; Provisional.	1.53313e-158
NC_010694.1\|WP_012440466.1\|798411_799587_+\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	gnl\|CDD\|237139	PRK12564, PRK12564, carbamoyl-phosphate synthase small subunit.	0
NC_010694.1\|WP_012440449.1\|781269_782046_-\|peroxide-stress-protein-YaaA	gnl\|CDD\|234999	PRK02101, PRK02101, peroxide stress protein YaaA.	7.92143e-147
NC_010694.1\|WP_012440450.1\|782313_783267_+\|transaldolase	gnl\|CDD\|235381	PRK05269, PRK05269, transaldolase B; Provisional.	0
NC_010694.1\|WP_012440455.1\|788579_788870_+\|lipoprotein	gnl\|CDD\|368828	pfam06291, Lambda_Bor, Bor protein. This family consists of several Bacteriophage lambda Bor and Escherichia coli Iss proteins. Expression of bor significantly increases the survival of the Escherichia coli host cell in animal serum. This property is a well known bacterial virulence determinant indeed, bor and its adjacent sequences are highly homologous to the iss serum resistance locus of the plasmid ColV2-K94, which confers virulence in animals. It has been suggested that lysogeny may generally have a role in bacterial survival in animal hosts, and perhaps in pathogenesis.	1.3285e-27
NC_010694.1\|WP_012440458.1\|790605_790869_-\|30S-ribosomal-protein-S20	gnl\|CDD\|178943	PRK00239, rpsT, 30S ribosomal protein S20; Reviewed.	7.70243e-26
NC_010694.1\|WP_012440463.1\|795936_796890_+\|4-hydroxy-3-methylbut-2-enyl-diphosphate-reductase	gnl\|CDD\|234893	PRK01045, ispH, 4-hydroxy-3-methylbut-2-enyl diphosphate reductase; Reviewed.	0
NC_010694.1\|WP_012440448.1\|779925_781212_+\|threonine-synthase	gnl\|CDD\|236418	PRK09225, PRK09225, threonine synthase; Validated.	0
NC_010694.1\|WP_012440459.1\|791184_792123_+\|bifunctional-riboflavin-kinase/FAD-synthetase	gnl\|CDD\|235536	PRK05627, PRK05627, bifunctional riboflavin kinase/FAD synthetase.	2.20291e-166

>NC_010694.1|WP_012440456.1|789075_790236_+|Na+/H+-antiporter-NhaA
MNLFLKKLLKNDATGGVVLIVAAAFAMFLANNDSTRHAYQAMLTLPVQFRFGALDINKDLLLWINDALMALFFLMIGLEVKRELMMGSLKGRERAMFPLIAALGGMLAPGLIYAAFNHQDAQAIHGWAIPTATDIAFALGILALLGSRVPAALKMFLMALAVIDDLGAIVIIALFYTSELSLISLTVAAASIAVLAVLNGCGVRKTSVYLAVGMVLWVAVLKSGVHATLAGVIVGLFIPLKKQEGHSPAIELAHGLHPWVSWLILPLFAFANAGISLSGVSLNGLFSAVPLGITLGLFIGKPLGITLICWLAVKLKIAALPENTRLIDIAAVGVLCGIGFTMSIFIASLAFDGAHEELVTLAKLGILSGSVISALVGYTLLRVKLR
>NC_010694.1|WP_012440455.1|788579_788870_+|lipoprotein
MKKILVATTLAVLLSGCAQQTFQMKHNQVAAPKQVTTHHFFVSGIGQQKTVDAAAICGGAAKVERVEVQETFVNVLLRVVTLGIYTPREARVYCEL
>NC_010694.1|WP_012440454.1|787232_788375_+|molecular-chaperone-DnaJ
MAKRDYYEILGVAKSADEREIKKAYKRLAMKFHPDRNQGDKESEGKFKEIKEAYEILTDGQKRAAYDQYGHAAFEQGGMGGGGHGGFGGGGADFSDIFGDVFGDIFGGGRRQQRAARGADLRYNMELTLEEAVRGVSKEIRIPTLEECGVCHGSGAKAGTKPQTCSTCHGAGQVQMRQGFFTVQQACPTCHGRGSVIKDPCNACHGHGRVEKSKTLSVKIPAGVDTGDRIRLSGEGEAGEQGAPAGDLYVQVQVRKHHIFEREENNLYCEVPINFVMAALGGEIEVPTLDGRVNLKVPAETQTGKLFRMRGKGVKSVRGGAQGDLLCRVVVETPVSLNEKQKTLLRELDESFGGPSGEKNSPRSKTFFDGVKKFFDDLTR
>NC_010694.1|WP_012440453.1|785208_787122_+|molecular-chaperone-DnaK
MGKIIGIDLGTTNSCVAIMDGGKARVLENAEGDRTTPSIIAYTQDGETLVGQPAKRQAVTNPQNTLFAIKRLIGRRFQDEEVQRDIKIMPFKIVGADNGDAWLDVKGQRVAPPQISAEVLKKMKKTAEDYLGEAVTEAVITVPAYFNDAQRQATKDAGRIAGLDVKRIINEPTAAALAYGLDKGQGNRTIAVYDLGGGTFDISIIEIDEVDGEKTFEVLATNGDTHLGGEDFDSRMINYLVAEFKKDQGIDLHNDPLAMQRLKEAAEKAKIELSSAQQTDVNLPYITADATGPKHLNIKVTRAKLESLVEDLVTRSIDPLKVALQDAGLSVSDINDVILVGGQTRMPMVQAKVAEFFGKEPRKDVNPDEAVAVGAAVQGGVLAGEVKDVLLLDVTPLSLGIETMGGVMTSLITKNTTIPTKHSQVFSTAEDNQSAVTIHVVQGERKRAADNKSLGQFNLDGIQNAPRGMPQIEVTFDIDADGILHVSAKDKNSGKEQKITIKASSGLNDEEIEKMVRDAEANAESDRKFEELVQTRNQGDQAAHSTRKQLDEAGDKLPAEDKAPIEAALTELNTALKGEDKAEIEAKIQALMEVSTKLMEFAQQQQAAGGAADAAEGAKKDDDVVDAEFEEVKDSKK
>NC_010694.1|WP_042958656.1|784895_785093_-|hypothetical-protein
MPDKMGPGNTASRGRVKKFFTFWQNNRLLTPCRVAIIIRGLLSGMPRRPPTLLASIWRGSVKWET
>NC_010694.1|WP_012440451.1|783462_784050_+|molybdopterin-adenylyltransferase
MNTLRIGLISVSDRAANGIYQDLGLPLLEEWLGQALVSPFEIEKRLVPDEQPMIEQAICDLVDERFCHLVLTTGGTGPARRDVTPDATLAVADREMPGFGEQMRQISLNFVPTAILSRQVAVIRKQSLVINLPGQPKSIKETLEGLKDEEGNSQVAGIFASVPYCIQLLEGPYIETNPQIVVAFRPKSARRETNI
>NC_010694.1|WP_012440450.1|782313_783267_+|transaldolase
MTDKLSSLRQVTTVVADTGDIAAMERYKPQDATTNPSLILSAAQIPEYRKLIDASIAWARDQSSDKDEQVSYAADRLAVNIGLEILKLVPGRISTEVDARLSYDTEGSIAKARSLIKLYNDAGISNDRILIKLASTWQGIRAAEQLEKEGINCNLTLLFSFAQARACAEAGVFLISPFVGRILDWYKANTDKKEYAGSEDPGVISVSEIYQYYKQHGYETVVMGASFRNVAEIIELAGCDRLTISPALLKELAETEGSIERKLSYRGEVKARPAKMTESEFLWQHNQDPMAVQKLAEGIRNFAIDQGKLDKMIADLL
>NC_010694.1|WP_012440449.1|781269_782046_-|peroxide-stress-protein-YaaA
MLMVISPAKTLDFASPLATERFTQPALLAESQKLINVARKLSPADIASLMHISDKLAVLNAERFNDWQPAFTPDNARQAILAFKGDVYTGLQAETFGEEDFTFAQQHLRMLSGLYGLLRPLDLMQAYRLEMGIKLANPAGKDLYSFWGDKLTTALNEALAQQGDNLLINLASDEYFRSVKPKRLEADIIKPVFLDEKNGKFKVISFYAKKARGLMCRYIIQNRLTKVEQLKKFDLDGYAFDGDTSSNNELVFKRREMA
>NC_010694.1|WP_012440448.1|779925_781212_+|threonine-synthase
MKLYNLKDHNEQVSFAQAVKQGLGKQQGLFFPLELPEFELTEIDDMLEMDFVTRSSKILSAFIGDEIPPHQLNERLKTAFTFPAPVVDVTDDIAALELFHGPTLAFKDFGGRFMAQMLSYVSGADEQITILTATSGDTGAAVAHAFYGMENVRVVILYPQGKISPLQEKLFCTLGGNIETIAIDGDFDVCQSLVKQAFDDEELKKAIGLNSANSINISRLLAQICYYFEAVAQLPQEKRNQLVISVPSGNFGDLTAGLLAKSLGLPVKRFIAATNANDTVPRFLADGQWTPNATVATLSNAMDVSQPNNWPRVEELFRRKTWRLGDLGYGAVNDETTKAAMRELADLGYLSEPHAAIAWRLLRDGLQDGEFGLFLGTAHPAKFKESVETILERTLPLPDALAERADLPLLSHSMKAEFAELRAFLLKK
>NC_010694.1|WP_012440447.1|778992_779922_+|homoserine-kinase
MVKIYAPASIGNVSVGFDVLGAAVSPVDGTLLGDCVSVEAAAEFSLRNEGRFVSKLPADPKDNIVYQCWDRFCSAIGQRVPVAMTLEKNMPIGSGLGSSACSVVAGLMAMNEYCNRPLNNNELLILMGELEGRVSGSVHFDNVAPCFLGGMQLMLEENDIISQPVPGFNDWLWVMAYPGIKVSTAEARAILPAQYRKEEIIRHGRYLGGFIHACHTQQPLLAAKLMQDVIAEPYRTKLLPGFAQARQAAADIGALACGISGSGPTLFAVCNQPDTANRMADWLSQHYLQNDEGFVHICRLDTAGARKLG
>NC_010694.1|WP_012440458.1|790605_790869_-|30S-ribosomal-protein-S20
MANIKSAKKRAVTSEKRRKHNASRRSMMRTFIKKVYAAIATGDKAAAQNAFNEMQPLVDRQAAKGLIHKNKAARHKANLTAQISKMA
>NC_010694.1|WP_012440459.1|791184_792123_+|bifunctional-riboflavin-kinase/FAD-synthetase
MKLIRGIHNLRAQHRGCVLTIGNFDGVHRGHLALLAQLCAEGRERNLPVMVMLFEPQPLELFAAEKAPARLTRLREKLRYLEQAGVDAVLCVSFDRHFAAYSAQRFITDLLVNRLGVQLLAVGDDFRFGAGRQGDFLLLQKAGVEYGFDVISTQTFCDNGKRISSTAVRQALAEDNLPLARSLLGRPFSISGRVVHGDALGRTIGFPTANLPLRRTVSPVKGVYAVEVLGLGPRALPGVANIGTRPTVAGLRQQLEVHLLDVTIDLYERHIEVVLLDKIRDEQRFNSLDALKEQIANDVVTARRFFGQSTSV
>NC_010694.1|WP_012440460.1|792159_794976_+|isoleucine--tRNA-ligase
MSDYKSTLNLPETGFPMRGDLAKREPGMLQRWYDDKLYSIIREAKKGKKTFILHDGPPYANGSIHIGHSVNKILKDIIVKSKGMAGYDSPYVPGWDCHGLPIEHKVEQTIGKPGEKVSAAEFRAACRQYAAEQVEGQKADFIRLGVLGDWDRPYLTMDFKTEANIIRALGKIIGNGHLHKGAKPVHWCLDCRSALAEAEVEYYDKTSPSIDVMFDAVDKDAVQAKFGAAHVNGPISLVIWTTTPWTMPANRAISLHPEFDYQLVQVEGRALILAKDMVDSVMKRVGVTQWTVLGDVQGAALELMGFQHPFLAHVSPVVLGEHVTLEAGTGAVHTAPGHGPDDYVIGQKYGIETANPVGPDGSFLPGTYPTLDGLNVFKANDTIVELLREKGALLHLEKLHHSYPHCWRHKTPIIFRATPQWFISMDQKGLRAQSLKEIKGVQWIPDWGQARIESMVANRPDWCISRQRTWGVPMALFVHKDTEQLHPDSLELMEKVALRVEQDGIQAWWDLDARELMGADADNYVKVPDTLDVWFDSGSTSYSVVDARPEFGGSAPDLYLEGSDQHRGWFMSSLMISTAMKGKAPYRQVLTHGFTVDGQGRKMSKSLGNTVSPQDVMNKLGADILRLWVASTDYSGEIAVSDEILKRSADSYRRIRNTARFLLANLAGFNPETDKVKPEEMVVVDRWAVGRALAAQNDIVASYEAYDFHEVVQRLMQFCSVEMGSFYLDIIKDRQYTAKADGLARRSCQTALWYIVEALVRWMAPIMSFTADEIWGYLPGKRAQYVFTEEWFDGLFSLEDNQPMNDAYWAELLKVRGEVNKVIEQARADKRVGGSLEASVTLYADAQLAEKLTSLGEELRFVLLTSGAEVADYAGAPDDAQQSETVKGLKIALRKAEGEKCPRCWHYTSDIGQNAEHADMCGRCVTNVAGSGEERKFA
>NC_010694.1|WP_042958658.1|794972_795482_+|signal-peptidase-II
MMSKPVLSTGLRWLWLVLVVIAIDFVSKQWIMNNLMLHESMPVMPFFNFFYAHNYGAAFSFLADKGGWQRWFFAGIAVAIVVVLLVMMYRSKASDRLNNIAYALIVGGALGNLFDRAYHGFVVDFIDFTIGDWHFATFNIADCGICIGAALIVLEGFINPTSKRSEHKG
>NC_010694.1|WP_012440462.1|795485_795956_+|FKBP-type-peptidyl-prolyl-cis-trans-isomerase
MSDSVQSNSAVLVHFTLKLADGSTAESTRNNAKPALFRLGDGSLSPALENHLIGLSVGGKAAFALEAQDAFGSISPDLIQYFSRRDFVDAGEPEIGAIMLFSGMDGNEMPGVIREISGDSITVDFNHPLAGQTIHFDIDVLEIDPHLEMSNADPVG
>NC_010694.1|WP_012440463.1|795936_796890_+|4-hydroxy-3-methylbut-2-enyl-diphosphate-reductase
MQILLANPRGFCAGVDRAISIVERALEMYGAPIYVRHEVVHNRYVVNSLRERGAIFIEEIDEVPDGSILIFSAHGVSQAVRAEAKARALTMLFDATCPLVTKVHMEVARASRKGTEAILIGHAGHPEVEGTMGQYNNPQGGMYLVEQPGDVQNLQVKDEDNLCFMTQTTLSVDDTSDVIDALRARFPKIVGPRKDDICYATTNRQEAVRTLARDADVVLVVGSKNSSNSNRLAELAQRAGKLARLIDSAEDIQEAWVKGVSCVGVTAGASAPDILVQQVIQRLNELGGVDAVELIGREENIIFEVPKELRVEVKQLD
>NC_010694.1|WP_012440464.1|797147_797969_+|4-hydroxy-tetrahydrodipicolinate-reductase
MSNAEIRIAIVGAAGRMGRQLIQAVVLAEGARLGAALVRSGSSLVGTDAGELAGCGALGITLTDDLEAVANDFDVLIDFTRPEGTLHYLAFCRQHHKAMVIGTTGFDDAGKAAIEAAAQDIAIVFAANFSVGVNVVLKLVEKAAKVMGEYADIEIIEAHHRHKVDAPSGTALAMGEAIADAMSWDLKQHAVYAREGFTGEREAQTIGFATVRAGDIVGEHTAMFADIGERVEISHKASSRMTFAKGAVRAAIWLDGRKKGLYDMRCVLNLHDL
>NC_010694.1|WP_012440466.1|798411_799587_+|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit
MTVYSLEDVLIKSALLVLEDGTQFHGRAIGAIGSAVGEVVFNTSMTGYQEILTDPSYSRQIVTLTYPHIGNVGTNSADEESTQVHAAGLVIRDLPLIASNYRNEEGLSEYLIRHNIVAIADIDTRKLTRLLREKGAQNGCIIAGDALDAAVALEKARAFPGLKGMDLAKEVTTPEAYTWLQGSWTLEEELPKAKAESDLPYHVVAYDYGVKRNILRMLVDRGCRLTVVPAQTRAEDVLKLNPDGVFLSNGPGDPEPCDYAITAINRLLETDIPVFGICLGHQLLALSSGARTVKMKLGHHGGNHPVKDHDNNTVMITAQNHGFAVDDSHLPANLRVTHTSLFDHTVQGIHRTDKAAFSFQGHPEASPGPHDAAPLFDHFIELIEAYRSTAK
>NC_010694.1|WP_012440467.1|799601_802826_+|carbamoyl-phosphate-synthase-large-subunit
MPKRTDIKSILILGAGPIVIGQACEFDYSGAQACKALREEGYRVILVNSNPATIMTDPEMADATYIEPIHWEVVRKIIEKERPDAVLPTMGGQTALNCALELERQGVLAEFGVTMIGATADAIDKAEDRRRFDVAMKSIGLDTARSGIAHTMEEALAVAADVGFPCIIRPSFTMGGTGGGIAYNREEFEEICERGLDLSPTNELLIDESLIGWKEYEMEVVRDKNDNCIIVCSIENFDAMGIHTGDSITVAPAQTLTDKEYQIMRNASMAVLREIGVETGGSNVQFSVNPENGRLIIIEMNPRVSRSSALASKATGFPIAKIAAKLAVGYTLDELMNDITGGLTPASFEPSIDYVVTKIPRFNFEKFAGTNDRLTTQMKSVGEVMAIGRTLQESMQKALRGLEVGANGFDPKVDLNDPEALTTIRRELKDAGSDRIWYIADAFRAGLTVEDVFALTNVDRWFLVQIEELVQLEQQVAQEGVSGLSYDFLRTLKRKGFADARLSALAGVPESEIRQLREQHNLHPVYKRVDTCAAEFSTDTAYMYSTYEEECEANPHQDRDKIMVLGGGPNRIGQGIEFDYCCVHASLALREDGFETIMVNCNPETVSTDYDTSDRLYFEPVTLEDVLEIVRIEKPKGVIVQYGGQTPLKLARALEAAGVPVIGTSPDAIDRAEDRERFQQAVERLGLKQPANATVTAIEMAVEKAAIIGYPLVVRPSYVLGGRAMEIVYDEIDLKRYFNTAVSVSNDAPVLLDRFLDDAVEVDVDAICDGEQVLIGGIMEHIEQAGVHSGDSACSLPAYTLSAEIQDVMREQVKKLAFELGVRGLMNVQFAVKDNEVYLIEVNPRAARTVPFVSKATGMPLAKVAARVMAGKTLAAQGMTKEIIPPYYSVKEVVLPFNKFQGVDPILGPEMRSTGEVMGVGRNFAEAFCKAMLGAQSNMKKSGRALLSVREGDKKRIVELARRLQEFGFELDATAGTASVLTAAGIEVRQVNKVHEGRPHIQDRLKNGEYAYIVNTTAGRQAIEDSKLIRRSALQYKVHYDTTLNGGFATANSLNASATEQVISVQEMHAQIVS
>NC_010694.1|WP_012440468.1|802951_803566_-|LysE-family-translocator
MLETSLFVATIVALGMLSPGPDFFLIVKNAARYRRSAAMMSALGVNCAVASHMAYCVAGLAVVITTTPWLFMLLKYAGAAYLIYIGIQALMSRGNGTMNINNVTLEETSLKKAFLQGYLCNLLNPKATLFFLSIFTQVLNVNSGISEKLLYAGIILGLSAIWWPSLVLLMQSGPVRRGLAKAQRVVDKLLGGVLIALGIKVALS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010694_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010694_3

934259-935308

TypeI-F

I-F

Consensus_repeat	Method
GTTCACTGCCGCACAGGCAGCTTAGAAA	CRISPRCasFinder
GTTCACTGCCGCACAGGCAGCTTAGAAA	CRT

17 spacers

cas1,cas3f,cas8f,cas5f,cas7f,cas6f

The CRISPR arrays of NC_010694_3

>merge|NC_010694|3|934259-935308|CRISPRCasFinder,CRT
GTTCACTGCCGCACAGGCAGCTTAGAAAATCAGAACCCCGTTCACAATTGCGTGTTTCAGGTTCACTGCCGCACAGGCAGCTTAGAAAACTGGTTCGCTGCACGGGTCAAACTCAATTTCGTTCACTGCCGCACAGGCAGCTTAGAAAATCAGAACCCCGTTCACAATTGCGTGTTTCAGGTTCACTGCCGCACAGGCAGCTTAGAAATCAAGAAAATCAAATGGCCGGACAAGGTAAAGGTTCACTGCCGCACAGGCAGCTTAGAAACAGATGACCAGCTAATAAGCCTCTCATCATCAGTTCACTGCCGCACAGGCAGCTTAGAAAAGTTTTTGGTTTGGTCGCCATATAGAATTATTGTTCACTGCCGCACAGGCAGCTTAGAAATTAACCCCGGCACCAATACCGATAGAGTCATAGTTCACTGCCGCACAGGCAGCTTAGAAAAAAACGTGTTCATGAATCTCGGAACGGCTAGTGTTCACTGCCGCACAGGCAGCTTAGAAATGTTTAGCGGTATCTCCGCATAGCGCATGGAAGTTCACTGCCGCACAGGCAGCTTAGAAATTGCCGGGTAAGGCAAGGCAATGGCTAAAAGAGTTCACTGCCGCACAGGCAGCTTAGAAACATCGTGGACGCCGCCCAGAGCATCACCAGCTGTTCACTGCCGCACAGGCAGCTTAGAAACATCAACCTGATGGACTCCATGCTGCCCAAAACGTTCACTGCCGCACAGGCAGCTTAGAAAAGTAGGGCGGGATAGTGCCGCATTTAATAGCCGTTCACTGCCGCACAGGCAGCTTAGAAATTACCCGATGCTTCAATGAATCCAGACGTACCGTTCACTGCCGCACAGGCAGCTTAGAAAAGTTTGCGATTAGCCAAATCATGTCAGCAATAAGTTCACTGCCGCACAGGCAGCTTAGAAAAGACGCTGAACGAGCTTATTAACGTCTTAGAGGTTCACTGCCGCACAGGCAGCTTAGAAAAAAGACGGCACGTTTTTCACCAAAGACGATTTGTTCACTGCCGTACAGGCAGCCCAGAAA

>NC_010694|3|3|934259-935308|CRISPRCasFinder
GTTCACTGCCGCACAGGCAGCTTAGAAA	ATCAGAACCCCGTTCACAATTGCGTGTTTCAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	ACTGGTTCGCTGCACGGGTCAAACTCAATTTC
GTTCACTGCCGCACAGGCAGCTTAGAAA	ATCAGAACCCCGTTCACAATTGCGTGTTTCAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	TCAAGAAAATCAAATGGCCGGACAAGGTAAAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	CAGATGACCAGCTAATAAGCCTCTCATCATCA
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGTTTTTGGTTTGGTCGCCATATAGAATTATT
GTTCACTGCCGCACAGGCAGCTTAGAAA	TTAACCCCGGCACCAATACCGATAGAGTCATA
GTTCACTGCCGCACAGGCAGCTTAGAAA	AAAACGTGTTCATGAATCTCGGAACGGCTAGT
GTTCACTGCCGCACAGGCAGCTTAGAAA	TGTTTAGCGGTATCTCCGCATAGCGCATGGAA
GTTCACTGCCGCACAGGCAGCTTAGAAA	TTGCCGGGTAAGGCAAGGCAATGGCTAAAAGA
GTTCACTGCCGCACAGGCAGCTTAGAAA	CATCGTGGACGCCGCCCAGAGCATCACCAGCT
GTTCACTGCCGCACAGGCAGCTTAGAAA	CATCAACCTGATGGACTCCATGCTGCCCAAAAC
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGTAGGGCGGGATAGTGCCGCATTTAATAGCC
GTTCACTGCCGCACAGGCAGCTTAGAAA	TTACCCGATGCTTCAATGAATCCAGACGTACC
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGTTTGCGATTAGCCAAATCATGTCAGCAATAA
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGACGCTGAACGAGCTTATTAACGTCTTAGAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	AAAGACGGCACGTTTTTCACCAAAGACGATTT
GTTCACTGCCGTACAGGCAGCCCAGAAA

>NC_010694|3|1|934259-935308|CRT
GTTCACTGCCGCACAGGCAGCTTAGAAA	ATCAGAACCCCGTTCACAATTGCGTGTTTCAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	ACTGGTTCGCTGCACGGGTCAAACTCAATTTC
GTTCACTGCCGCACAGGCAGCTTAGAAA	ATCAGAACCCCGTTCACAATTGCGTGTTTCAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	TCAAGAAAATCAAATGGCCGGACAAGGTAAAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	CAGATGACCAGCTAATAAGCCTCTCATCATCA
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGTTTTTGGTTTGGTCGCCATATAGAATTATT
GTTCACTGCCGCACAGGCAGCTTAGAAA	TTAACCCCGGCACCAATACCGATAGAGTCATA
GTTCACTGCCGCACAGGCAGCTTAGAAA	AAAACGTGTTCATGAATCTCGGAACGGCTAGT
GTTCACTGCCGCACAGGCAGCTTAGAAA	TGTTTAGCGGTATCTCCGCATAGCGCATGGAA
GTTCACTGCCGCACAGGCAGCTTAGAAA	TTGCCGGGTAAGGCAAGGCAATGGCTAAAAGA
GTTCACTGCCGCACAGGCAGCTTAGAAA	CATCGTGGACGCCGCCCAGAGCATCACCAGCT
GTTCACTGCCGCACAGGCAGCTTAGAAA	CATCAACCTGATGGACTCCATGCTGCCCAAAAC
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGTAGGGCGGGATAGTGCCGCATTTAATAGCC
GTTCACTGCCGCACAGGCAGCTTAGAAA	TTACCCGATGCTTCAATGAATCCAGACGTACC
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGTTTGCGATTAGCCAAATCATGTCAGCAATAA
GTTCACTGCCGCACAGGCAGCTTAGAAA	AGACGCTGAACGAGCTTATTAACGTCTTAGAG
GTTCACTGCCGCACAGGCAGCTTAGAAA	AAAGACGGCACGTTTTTCACCAAAGACGATTT
GTTCACTGCCGTACAGGCAGCCCAGAAA

Protein	Signature genes	Signature genes Name	Protein_function
NC_010694.1\|WP_012440590.1\|942113_943457_+\|type-I-F-CRISPR-associated-protein-Csy1	cas8f	pfam09611_cas8f_CAS-I-F	gnl\|CDD\|187866
NC_010694.1\|WP_012440593.1\|945431_945986_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	cas6f	cd09739_cas6f_CAS-I-F:CAS-IV	gnl\|CDD\|378224
NC_010694.1\|WP_042958679.1\|922284_923490_+\|thiolase-family-protein	unknown	unknown	gnl\|CDD\|238383
NC_010694.1\|WP_012440576.1\|926910_929508_+\|bifunctional-aconitate-hydratase-2/2-methylisocitrate-dehydratase	unknown	unknown	gnl\|CDD\|236424
NC_010694.1\|WP_012440574.1\|924913_925381_-\|hypothetical-protein	unknown	unknown	unknown
NC_010694.1\|WP_012440581.1\|932443_934072_+\|multicopper-oxidase-CueO	unknown	unknown	gnl\|CDD\|236810
NC_010694.1\|WP_042958683.1\|925380_926139_-\|winged-helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|226233
NC_010694.1\|WP_012440579.1\|930971_931829_-\|polyamine-aminopropyltransferase	unknown	unknown	gnl\|CDD\|234843
NC_010694.1\|WP_042958682.1\|923491_924274_-\|enoyl-CoA-hydratase/isomerase-family-protein	unknown	unknown	gnl\|CDD\|119339
NC_010694.1\|WP_012440580.1\|931925_932273_-\|YacC-family-pilotin-like-protein	unknown	unknown	gnl\|CDD\|370620
NC_010694.1\|WP_012440587.1\|937737_941031_+\|type-I-F-CRISPR-associated-helicase-Cas3	cas3f	cd09673_cas3f_CAS-I-F	gnl\|CDD\|274201
NC_010694.1\|WP_012440586.1\|936763_937741_+\|type-I-F-CRISPR-associated-endonuclease-Cas1	cas1	cd09718_cas1_CAS-I-F	gnl\|CDD\|132676
NC_010694.1\|WP_012440592.1\|944418_945423_+\|type-I-F-CRISPR-associated-protein-Csy3	cas7f	pfam09615_cas7f_CAS-I-F	gnl\|CDD\|378222
NC_010694.1\|WP_042958685.1\|935928_936204_+\|hypothetical-protein	unknown	unknown	unknown
NC_010694.1\|WP_012440585.1\|935432_935963_+\|DUF2778-domain-containing-protein	unknown	unknown	gnl\|CDD\|378506
NC_010694.1\|WP_012440591.1\|943453_944395_+\|type-I-F-CRISPR-associated-protein-Csy2	cas5f	cd09676_cas5f_CAS-I-F	gnl\|CDD\|378221
NC_010694.1\|WP_012440578.1\|930146_930950_-\|adenosylmethionine-decarboxylase	unknown	unknown	gnl\|CDD\|235480
NC_010694.1\|WP_012440589.1\|941373_941670_+\|BrnA-antitoxin-family-protein	unknown	unknown	gnl\|CDD\|373040
NC_010694.1\|WP_012440577.1\|929679_930042_+\|YacL-family-protein	unknown	unknown	gnl\|CDD\|235372
NC_010694.1\|WP_012440588.1\|941108_941387_+\|BrnT-family-toxin	unknown	unknown	gnl\|CDD\|367913

Protein	Function_ID	Function_description	E-value
NC_010694.1\|WP_012440577.1\|929679_930042_+\|YacL-family-protein	gnl\|CDD\|235372	PRK05248, PRK05248, hypothetical protein; Provisional.	1.90814e-65
NC_010694.1\|WP_042958679.1\|922284_923490_+\|thiolase-family-protein	gnl\|CDD\|238383	cd00751, thiolase, Thiolase are ubiquitous enzymes that catalyze the reversible thiolytic cleavage of 3-ketoacyl-CoA into acyl-CoA and acetyl-CoA, a 2-step reaction involving a covalent intermediate formed with a catalytic cysteine. They are found in prokaryotes and eukaryotes (cytosol, microbodies and mitochondria). There are 2 functional different classes: thiolase-I (3-ketoacyl-CoA thiolase) and thiolase-II (acetoacetyl-CoA thiolase). Thiolase-I can cleave longer fatty acid molecules and plays an important role in the beta-oxidative degradation of fatty acids. Thiolase-II has a high substrate specificity. Although it can cleave acetoacyl-CoA, its main function is the synthesis of acetoacyl-CoA from two molecules of acetyl-CoA, which gives it importance in several biosynthetic pathways.	4.37267e-151
NC_010694.1\|WP_012440576.1\|926910_929508_+\|bifunctional-aconitate-hydratase-2/2-methylisocitrate-dehydratase	gnl\|CDD\|236424	PRK09238, PRK09238, bifunctional aconitate hydratase 2/2-methylisocitrate dehydratase; Validated.	0
NC_010694.1\|WP_012440578.1\|930146_930950_-\|adenosylmethionine-decarboxylase	gnl\|CDD\|235480	PRK05462, PRK05462, adenosylmethionine decarboxylase.	0
NC_010694.1\|WP_012440586.1\|936763_937741_+\|type-I-F-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|132676	TIGR03637, cas1_YPEST, CRISPR-associated endonuclease Cas1, subtype I-F/YPEST. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the YPEST subtype of CRISPR/Cas system.	0
NC_010694.1\|WP_042958683.1\|925380_926139_-\|winged-helix-turn-helix-domain-containing-protein	gnl\|CDD\|226233	COG3710, CadC, DNA-binding winged-HTH domains [Transcription].	5.45559e-15
NC_010694.1\|WP_012440579.1\|930971_931829_-\|polyamine-aminopropyltransferase	gnl\|CDD\|234843	PRK00811, PRK00811, polyamine aminopropyltransferase.	0
NC_010694.1\|WP_042958682.1\|923491_924274_-\|enoyl-CoA-hydratase/isomerase-family-protein	gnl\|CDD\|119339	cd06558, crotonase-like, Crotonase/Enoyl-Coenzyme A (CoA) hydratase superfamily. This superfamily contains a diverse set of enzymes including enoyl-CoA hydratase, napthoate synthase, methylmalonyl-CoA decarboxylase, 3-hydoxybutyryl-CoA dehydratase, and dienoyl-CoA isomerase. Many of these play important roles in fatty acid metabolism. In addition to a conserved structural core and the formation of trimers (or dimers of trimers), a common feature in this superfamily is the stabilization of an enolate anion intermediate derived from an acyl-CoA substrate. This is accomplished by two conserved backbone NH groups in active sites that form an oxyanion hole.	5.50472e-64
NC_010694.1\|WP_012440580.1\|931925_932273_-\|YacC-family-pilotin-like-protein	gnl\|CDD\|370620	pfam09691, T2SS_PulS_OutS, Type II secretion system pilotin lipoprotein (PulS_OutS). This family comprises lipoproteins from four gamma proteobacterial species: PulS protein of Klebsiella pneumoniae (P20440), the OutS protein of Erwinia chrysanthemi (Q01567) and Pectobacterium chrysanthemi, and the functionally uncharacterized E. coli protein EtpO. PulS and OutS have been shown to interact with and facilitate insertion of secretins into the outer membrane, suggesting a chaperone-like, or piloting function for members of this family. In the pilotin from this four-helix protein from enterohemorrhagic Escherichia coli, the straight helix alpha2, the curved helix alpha3 and the bent helix alpha4 surround the central N-terminal helix alpha1. These helices create a prominent groove, mainly formed by side chains of helices 1,2 and 3 suggesting this groove is important as a binding site.	3.09008e-08
NC_010694.1\|WP_012440587.1\|937737_941031_+\|type-I-F-CRISPR-associated-helicase-Cas3	gnl\|CDD\|274201	TIGR02562, conserved_hypothetical_protein, CRISPR-associated helicase Cas3, subtype I-F/YPEST. The helicase in many CRISPR-associated (cas) gene clusters is designated Cas3, and most Cas3 proteins are described by model TIGR01587. Members of this family are considerably larger, show a number of motifs in common with TIGR01587 sequences, and replace Cas3 in some CRISPR/cas loci in a number of Proteobacteria, including Yersinia pestis, Chromobacterium violaceum, Erwinia carotovora subsp. atroseptica SCRI1043, Photorhabdus luminescens subsp. laumondii TTO1, Legionella pneumophila, etc.	0
NC_010694.1\|WP_012440591.1\|943453_944395_+\|type-I-F-CRISPR-associated-protein-Csy2	gnl\|CDD\|378221	pfam09614, Cas_Csy2, CRISPR-associated protein (Cas_Csy2). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2464 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy2, for CRISPR/Cas Subtype Ypest protein 2.	4.36999e-149
NC_010694.1\|WP_012440585.1\|935432_935963_+\|DUF2778-domain-containing-protein	gnl\|CDD\|378506	pfam10908, DUF2778, Protein of unknown function (DUF2778). This is a bacterial family of uncharacterized proteins.	6.30616e-45
NC_010694.1\|WP_012440592.1\|944418_945423_+\|type-I-F-CRISPR-associated-protein-Csy3	gnl\|CDD\|378222	pfam09615, Cas_Csy3, CRISPR-associated protein (Cas_Csy3). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2463 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy3, for CRISPR/Cas Subtype Ypest protein 3.	0
NC_010694.1\|WP_012440590.1\|942113_943457_+\|type-I-F-CRISPR-associated-protein-Csy1	gnl\|CDD\|187866	cd09735, Csy1_I-F, CRISPR/Cas system-associated protein Csy1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Large proteins; Predicted subunit of the Cascade complex; signature gene for I-F subtype; also known as Csy1 family.	3.13804e-170
NC_010694.1\|WP_012440593.1\|945431_945986_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	gnl\|CDD\|378224	pfam09618, Cas_Csy4, CRISPR-associated protein (Cas_Csy4). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This protein family, typified by YPO2462 of Yersinia pestis, is a CRISPR-associated (Cas) family strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy4, for CRISPR/Cas Subtype Ypest protein 4.	1.06886e-81
NC_010694.1\|WP_012440589.1\|941373_941670_+\|BrnA-antitoxin-family-protein	gnl\|CDD\|373040	pfam14384, BrnA_antitoxin, BrnA antitoxin of type II toxin-antitoxin system. BrnA is family of antitoxins that neutralizes the toxin BrnT, pfam04365. It consists of 3 alpha-helices and a C-terminal ribbon-helix-helix DNA binding domain. As in other toxin-antitoxin systems, BrnA negatively autoregulates the brnTA operon and has higher affinity for the DNA operator when complexed with BrnT. It dimerizes with two molecules of its toxin BrnT.	1.78145e-13
NC_010694.1\|WP_012440581.1\|932443_934072_+\|multicopper-oxidase-CueO	gnl\|CDD\|236810	PRK10965, PRK10965, multicopper oxidase; Provisional.	0
NC_010694.1\|WP_012440588.1\|941108_941387_+\|BrnT-family-toxin	gnl\|CDD\|367913	pfam04365, BrnT_toxin, Ribonuclease toxin, BrnT, of type II toxin-antitoxin system. BrnT is a ribonuclease toxin of a type II toxin-antitoxin system that exhibits a RelE-like fold. The antitoxin that neutralizes this toxin is pfam14384. BrnT is found in bacteria, archaea, bacteriophage, and plasmids. BrnT-BrnA forms a 2:2 tetrameric complex and autoregulates its own expression, which is induced by a number of different environmental stresses. Expression of BrnT alone results in cessation of bacterial growth which can be rescued after subsequent expression of BrnA.	3.45872e-19

>NC_010694.1|WP_012440581.1|932443_934072_+|multicopper-oxidase-CueO
MQRRDFIKLTAALGAASALPGWSRALTAAEQRPLLPIPTLLTPDARSEISLTAQAGSSSWRGSRVSTWGYNGPLLGPAIQLERGKEVNITVYNRLPEATTVHWHGLELPGNVDGGPQARIEPNRSRRVTFTPDQPAATCWFHPHQHGRTGYQVAQGLVGLVLVNDPESGKLLLPKRWGIDDIPVILQDKRLSADGSRIDYQLDMMSAAVGWFGDTMLTNGAIYPQHGVPRGWLRLRLLNGCNARALNLATSDKRPMYVIASDGGLLGEPVQVSELPMMPGERYEVLIDTADGKAFDLQTLPVRQMGMTLEPFNQPLPVLSLVPLLVQASGTLPDKLVDLPAVPSSQGLNTRWLQLMMDPELDRRGMQALMDKYGHASMAGMSMEAHGGDKKAGAHHDEMPEMDHGGMAGMAGMAGMDHGHSAAKKAYDFHNGNQINGVAFNMDKPSFEVRQGVYEKWTISGEGDEMLHPFHIHGTQFRILTENGKPVAAHRSGWKDTVRVEGGRSEVLVRFDHQADKASAYMAHCHLLEHEDTGMMLGFTVA
>NC_010694.1|WP_012440580.1|931925_932273_-|YacC-family-pilotin-like-protein
MKKSIKALLLLGLLGCSGSSFAIGEPEAEDLADLTAVFVYLKNDCGYQNIPDSQIRRALLFFAEQNRWDLSNYTSFNMKALGEDSYRDLSGIAIPNDTKCKSLARDSLNLLAWVK
>NC_010694.1|WP_012440579.1|930971_931829_-|polyamine-aminopropyltransferase
MATNEMWYETLHTGFGQYFSVDKIIYREKTDHQDLVIFENAALGRVMALDGVVQTTERDEFIYHEMMTHVPLLAHGAPKRVLIIGGGDGAMLREVCRHKNIEQITMVEIDAGVVTFCRQYLPNHNAGAYDDARFKLVIDDGVNFVNQTSDKFDVIISDCTDPIGPGESLFTSEFYQGCRRCLNQDGIFVAQNGVCFLQQDEAVNSHRKLSHYFGDVSFYQAAIPTYYGGIMTFAWASDNPALRQLDMATLTARFSEAGLNCRYYNPAIHTGSFALPQYLLNALAD
>NC_010694.1|WP_012440578.1|930146_930950_-|adenosylmethionine-decarboxylase
MKLQKLKLHGFNNLTKSLSFCIYDICYANTEAERDGYIAYIDEQYNANRLTEILSETCSIIGANVLNIARQDYEPQGASVTILVSEEPIDPRDIDTSEHPGPLPNSVVAHLDKSHICVHTYPESHPEGGLCTFRADIEVSTCGVISPLKALNYLIHQLESDIVTIDYRVRGFTRDVNGVKHFIDHEINSIQNFMSEDMKSMYDMMDVNVYQENMFHTKMLLKEFDLKHYLFNTKPEDLSAQEHKRITDLLWKEMREIYYGRNIPAIG
>NC_010694.1|WP_012440577.1|929679_930042_+|YacL-family-protein
MEYEFLKDVTGVVKVRMSMGHEAIGHWFNDEVNGHPEILAEVEAAIAGVKGSERQWQRVGREYTLLLDEEEVMIRANQLGFEGDDMEEGMNYYDEESLSFCGVEDFLAIIAAYRAFLLGR
>NC_010694.1|WP_012440576.1|926910_929508_+|bifunctional-aconitate-hydratase-2/2-methylisocitrate-dehydratase
MLEEYRKHVAERAAQGIVPKPLDASQMAALVELLKAPPAGEEEFLSDLLINRVPPGVDEAAYVKAGFLAAVTKGEATSPLVTPEKAIKLLGTMQGGYNIHALIDALDNDKLAPLAAESLSHTLLMFDNFYDVEDKAKAGNPHAKKIIQSWADAEWFLKRPKLAEKITVTVFKVTGETNTDDLSPAPDAWSRPDIPLHALAMLKNAREGIEPDDAGNVGPIGQIDALQKKGFPLAYVGDVVGTGSSRKSATNSVLWFMGDDIPYVPNKKGGGVCLGGKIAPIFFNTMEDAGALPIEVDVDRLNMGDVIDIYPYKGEVRHHDTDEVLANFELKTEVLLDEVRAGGRIPLIIGRGLTTKARESLGLPHSDVFLQAKDVAASTRGFSLAQKMVGRACGVEGVRPGAYCEPKMTSVGSQDTTGPMTRDELKDLACLGFSADLVMQSFCHTAAYPKPVDVTTHHTLPDFIMNRGGVSLRPGDGIIHSWLNRMLLPDTVGTGGDSHTRFPIGISFPAGSGLVAFAAATGVMPLDMPESVLVRFKGKMQPGITLRDLVHAIPLYAIKAGLLTVEKKGKKNIFSGRILEIEGLPDLKVEQAFELSDASAERSAAGCTIKLGQDPIIEYLNSNIVLLKWMISEGYGDRRTIERRIQGMEKWLADPQLLEGDAEAEYAAVIDIDLAEIKEPILCAPNDPDDARLLSDVQGTKIDEVFIGSCMTNIGHFRAAGKLLDSHKGQLPTRLWVAPPTKMDAAQLTEEGYYSVFGKSGARIEIPGCSLCMGNQARVADGATVVSTSTRNFPNRLGNGANVFLASAELSAVASLLGKLPTPDEYQAFMDRVDKTAVDTYRYLNFDQLTQYTDKADAVIFQTAV
>NC_010694.1|WP_042958683.1|925380_926139_-|winged-helix-turn-helix-domain-containing-protein
MRAYFEPKNCILSNDTKSIKITIQEARCLEYLIKHEGEFIRREMLQQECWIKRGVTVSDSAVRQSLYRLRRAFEDAGLPNLTLTTQARKGHILQKGSIALIHSGAKTDAYTDNSINPSVLNSINNDACGNFKPHFSVTSLLLIAKLLLLSALLFLAGFYSYQKIMLTDIKYHHSEEKEGRLYFYRKNQTYPQSAIERIHYWLRNKHVNYDNLKFIYLNNAWSGHISFYLCKGEMGSAGSDCTSIMIIGEHHP
>NC_010694.1|WP_012440574.1|924913_925381_-|hypothetical-protein
MKFFVFFASVIIFISGWYFFPWVLISTMEDCISKKIVIYDEPDRYIISRSTWYSWRDDNEHRYSAQILIDGPQGKLETFSSERVIETEYRFNFDSINLSTIKSFRIAGQLTSDPLTEKYIDPQAKEGFTGLIHLFRYKDNSLLFGFKGIPLSLCL
>NC_010694.1|WP_042958682.1|923491_924274_-|enoyl-CoA-hydratase/isomerase-family-protein
MNADNPITPLVLCDRPAEHVVRLTLNRPARRNAYNAQMVSELEQWLNWCERQSAVRTVILTGSGEAFCSGADLHEAFTHGGEGLRNSRGGYHPLQHLPRRKIWIAALNGHAIGGGLEMALACDFIVASEDSRIALPEVQHGLLPLGGAISQLAARLPPNIARELLLTGETMEAQRALALGLFNQVVNAERLADTALALAERLNQAAPLAVQACNALLNQALAADDSQQGDRELQQLQRSEDYQESLRAFAARRAPRWQGR
>NC_010694.1|WP_042958679.1|922284_923490_+|thiolase-family-protein
MAAAQSLLNYQPEDDRQPVIVVACRTPIGRAYGSLASVSPEALLAPLFDRLIAALPGGFTAIDEVIIGNATGGGGNIARLAALAAGVPLTVPAVTVDRQCGSGLEAVINACRLVQARAGECYLAGGVESVSNAPWRVEKPTTLKQMPRFYPRARFSPDEIGDPEMGIAAENVARQCGISRERQDSFALRSHQRALAAAQQGAFLEEIVALDVNHQRVENDECPRPDTSLARLAALPPVFAADGSVTAGNCCPLNDGAALLLVMSRRRARECGFTQGLLFADACSAGVDPNLLGLGPVPATQKLLRRQPGLTLDRVEAIEFNEAFAAQVLASVDALGIDEHRINPQGGAIALGHPYGASGAIMVTRLFSQLVSQRQSEGYGLAMLGIAGGLGLSALFKGMRL
>NC_010694.1|WP_012440585.1|935432_935963_+|DUF2778-domain-containing-protein
MALHGSFVLNGADYSPLSFPGVGTFMAFSGSGDNRNRAGCAHIPTVGPLPTGKYWIVDRSQGGLLSQSLSASKDLFNKVFRDAQFGHSDWFALWRDDMSIDDWTWINSVRRGNFRLHPGTISEGCVTLYRNSDFALLRNMLLRTPLVDVPCMRNLKARGSIEVSSHAYGDTCPTTR
>NC_010694.1|WP_042958685.1|935928_936204_+|hypothetical-protein
MRMATPARRLAKTVMFIALFCLFARLIDSSQFIGLATANAFAAWLHGSASQENYDDLWFFVDVTLSVLSAVVAYHMVMLLGRKLRASSGHK
>NC_010694.1|WP_012440586.1|936763_937741_+|type-I-F-CRISPR-associated-endonuclease-Cas1
MEMIKPSDLKTILHSKRSNIYYLQYCRVLVNGGRVEYVTDEGKQSLYWNIPIANTTVVMLGTGTSITQAAMREFARAGVLVGFCGGGGTPLYAANEVEVDVSWLNSQSEYRPTEYLQHWVSFWFDEQKRLSAAIAFQRVRISQIRQAWLGSKMMREHKFAISEPHLTGILDRFEQGLARCDNNTDLLALEAVMTKALYKLAAQAVSYGDFVRAKRGGGIDAANRFLDHGNYLAYGLAAVACWVIGLPHGLAVLHGKTRRGGLVFDVADLIKDALILPQAFLAAMAGEGEQEFRQRCLSSLQNAEALDTMIAALEATAREHSQVGK
>NC_010694.1|WP_012440587.1|937737_941031_+|type-I-F-CRISPR-associated-helicase-Cas3
MNVLLIAQCNKRALEESRRILDQFAERKGDRSWQTAITQQGLLTLRKLLRKTARRNTAVACHQIKSNGQSELLWIVGNLRRFNAQGAVPTHTTSRDVLKSADENSWHSVEAVSLLAAIAGLFHDFGKANSLFQQMLVGKKGVKRSQPYRHEWVSLRLFCAWVAGRDDRVWIAALSQIEPQDEQAMLAGLEKEGLMDTTNPFAPLPPVARVVAWLILSHHRMPVYPKKNGSSESASYLPPDLEHCDGWLTEQLDALWNAENHHDQGWTPADFKAQWQFPQGTPMRSGLWCGKARKMAQRLLAQPAWLAQIDINQRFSCHMARLALMLADHVYSAQPATPGWQDADCLLYANTDRDSGSLKQRLDEHNIGVAQNALLLARSLPHLRKTLPAITRHKGFKKRSTDERFRWQDNAWQKTCELRDRAFQQGFFGINMASTGCGKTFANARIMYALSDEQKGCRFSVALGLRTLTLQTGDALREKLNLEQDDLAVLVGSQAVTQLHQLAKDNPVSHDTGSESAEALPEENQYISYEGSLDDGRLSRWLQKSPRINKLLSAPVLVTTIDHLIGATEGLRGGRQIAPMLRLLTSDLVLDEPDDFDIDDLPALCRLVNWAGMLGSRVLFSSATLPPALVLALFNAYRSGREIFQHACGLPVDGNICCAWFDENAVLTEELRLPQAFMQQHKEFVANRVSWLAKQPVLRRGWIAPVAPPARDEATIYSHMAQVILQSMMTLHHAHHQRHKELPKTISVGVVRFANINPLVAVAQQLLATEAAEDTHIHYCVYHSRHPLAMRSHFEQRLDATLTRHQSDAIWQVAEIAAALEQHPQQHHLFVVLATSVAEVGRDHDYDWAIAEPSSMRSLIQLAGRVQRHRQEEAQSENIHILQQNICSLKERDSQKPTYCKPGFEQKGYMLASRDLQKILDKEQYQTISAIPRIQSRQKVGKGPLFANLADLEHRRLMVELQGKQKEPNEYCAALWWREQASWCGEMQRRKPFRQSPPEDMHFMLIAEEGDRPEIWQPDDGPSGRKKSMVAYPDLTFAAGVSAWITPDYQQVWQQLAERLTMELEEVSLRFGEIVLRTKPESKEWHFHPLLGAFQAE
>NC_010694.1|WP_012440588.1|941108_941387_+|BrnT-family-toxin
MDICYDPDKDVKNRRKHGYSLADSALLDWDEMVVYEDNRQPFDEIRLIGLTYGLARLGNRIFSVCFTEHEEVYRIISLRLATRKEIQRYAET
>NC_010694.1|WP_012440589.1|941373_941670_+|BrnA-antitoxin-family-protein
MPKLKPGTVFPTTEEDAKIYAAVADDEDSMLLEDPQLKLTPLKKRGRPQKAQPKIAVSVRYTPEVISAFKASGAGWQTRMDVALQDWLKTHQPTEIKL
>NC_010694.1|WP_012440590.1|942113_943457_+|type-I-F-CRISPR-associated-protein-Csy1
MLRETLASFITSYIAARKTAKLEAFDKESAKKLAVLASEDEISVLRQQLQQQRAELEQKYQPQAWLSDAASRAGQIKLVTHAAKFTHSDVRGSSIFSSGSGQHETYLSTATLQKPALDAVGNAAALDIARLLQSEVEGDSLIASLQRGDYSALESLTDNPELCASWISGFKQVLVDRQPASHKLAKQIYFPIADGQYHLLSPLFSSSLAHALNQRITEAKFSEQAKTARAALKAKSWHDAPVVAYPDTAITQFGGTKPQNISYLNSVRGGKVWLLPCAPPVWQTLSKPPAKHKSIFNSSNDFSRQSWPVIQRMSRFLRRVERLDSTLDIRQQRLAMTDEIIDILFNYVAGIQNQTESIGWSAHPDCVLKRSQQLWLDPWRGDKEFQFEREGGDWKSEVARDFGHWLSRHLHSDKLNMGETERRHFSTAPLFKQRLRELEKDLAEDLP
>NC_010694.1|WP_012440591.1|943453_944395_+|type-I-F-CRISPR-associated-protein-Csy2
MSALIVLRHLRVENANAIAGITWGFPAITHFLGFTHALSRKLQQSHNMTLSGCGVICHQQQVHAYTSGRDYQFALTRNPLTKEAKTAAFNEEGRMHMTVSLLMECHGSIAGGEQGAAELKQTLANLCQRLRLAGGTVISIGQVQISGWPQDDGETRKIMRRLLPGFALLDRSALLAQHHDQQPQPEMLDAWLDFAALKMQADDGATPADGNVQWQYQPKPGAGYLVPLMTGYRAISPLYPPGEVANSRDTETPFCFTEAVYGVGEWRGLHRIDDLRHLFWRYHHQDDYYLCRGEETACDQDYPDDADDDINYN
>NC_010694.1|WP_012440592.1|944418_945423_+|type-I-F-CRISPR-associated-protein-Csy3
MAKSAIKTASVLAFERKLSNSDAIMLAGKWQDKQNWTPIKIQEKAVRGTISNRLKNAIASDPQKLDAEIQKPNLQRVDVAALPYNCDSLKVCFTLRVLGGLATPAVCNDRAYQAALAAVIDGYIARHGFSTLAARYAENIANGRFLWRNRLGAGRVAVQVTSGEKRWQFDGHNYSLRAFSQPQGDLLELAQAIEQGLSGDSFALFNVEAQVYLGNGQEVFPSQELVLDSNSKKSKLLYQIDDTAAIHSQKIGNALRTIDSWYPDADELDVGPISVEPYGSVTSRGIAYRQPIKKMDFYTLLDNWVTKDKQPDLEQQHYVMAILIRGGVFGEKSE
>NC_010694.1|WP_012440593.1|945431_945986_+|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4
MDRYQDIRVRVDAEMTAPVLLAQVFMRLHQVLMRAANGRIGISFPDVKLTLGDRIRLHGTLDDLSSLQQSGWDKGLTDYIACSAIDPVPPGAAWRTVRRVQVKSSAERLRRRSVNKGWLNEAEAAERINVLSEQRSDLPYLQIKSGSNGHAWRLFIEHGPLVSVPVNGGFSSYGLSATATVPWF

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010694_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010694_4

946115-947582

TypeI-F

I-F

Consensus_repeat	Method
GTTCACTGCCGTACAGGCAGCTTAGAAG	PILER-CR
GTTCACTGCCGTACAGGCAGCTTAGAAG	CRISPRCasFinder
GTTCACTGCCGTACAGGCAGCTTAGAAG	CRT

24 spacers

cas6f,cas7f,cas5f,cas8f,cas3f,cas1

The CRISPR arrays of NC_010694_4

>merge|NC_010694|4|946115-947582|PILER-CR,CRISPRCasFinder,CRT
GTTCACTGCCGTACAGGCAGCTTAGAAGTTCAACAAGAAGCGCGATGAAGAAATTGCTGCGTTCACTGCCGTACAGGCAGCTTAGAAGGTATTGACTGAATCGGCAAATTCCCATCAGGTGTTCACTGCCGTACAGGCAGCTTAGAAGTTTGAAACTGGCGAGAGAGTCGGCGTGAAACAGTTCACTGCCGTACAGGCAGCTTAGAAGAACTCGTCTAGCCAACGCCGCCCGCCGCGCTCGTTCACTGCCGTACAGGCAGCTTAGAAGAACTATGAGGCACTCATTAATGTCTTTGTGCGGGTTCACTGCCGTACAGGCAGCTTAGAAGTGGCATCGCTGAAGCTGGGCCTGAATCATGACGTTCACTGCCGTACAGGCAGCTTAGAAGGGAGAAATGGAAAGCATTCATGACCATGAAACGTTCACTGCCGTACAGGCAGCTTAGAAGCTTCTGGGCCTGTCCAGTCAGTTTACGACCTAGTTCACTGCCGTACAGGCAGCTTAGAAGTGTTCGGTGCTGCGAATTCCAGTGTGGCTTATGTTCACTGCCGTACAGGCAGCTTAGAAGTCAGAACCCCGAATTGCTTCGTCGATATAGTCGTTCACTGCCGTACAGGCAGCTTAGAAGTGTTAAATGAACACCCAAGATTTTGCCTACGTGTTCACTGCCGTACAGGCAGCTTAGAAGACACCAACTTGGCCCGTTTCCCACACCAACTTGTTCACTGCCGTACAGGCAGCTTAGAAGTGGCATGGTGTACCGCCTACCAGTACATCGGGGTTCACTGCCGTACAGGCAGCTTAGAAGATGAATATAAATTCCGTTTCCGGGTCTTTCTCGTTCACTGCCGTACAGGCAGCTTAGAAGACCCAGGTGCTTACCCCAGAGAACTAACAAGTGTTCACTGCCGTACAGGCAGCTTAGAAGCACAGGCAGTCTGATTTGCACTGACATTCTGAGTTCACTGCCGTACAGGCAGCTTAGAAGCGGCAAACTTTAATAGCTGCATGCGGATTCCTGTTCACTGCCGTACAGGCAGCTTAGAAGGCGTTCCGAACATTGAAAATCTCCGCATCATCGTTCACTGCCGTACAGGCAGCTTAGAAGTTCCAGCTCACGCTCCGTCCAGTCACGCATGGGTTCACTGCCGTACAGGCAGCTTAGAAGTTCGGGAACGGCTCGGAATAACTGTTGTGGCTGTTCACTGCCGTACAGGCAGCTTAGAAGAACGTCTGATTGGTATCGCATTCCACGCTGCGTTCACTGCCGTACAGGTAGCTTAGAAGTGTGATACCCGGAAGCGCTTTTAATTCTGCGGGTTCACTGCCGTACAGGCAGCTTAGAAGGGTAACGATGGGTATGAGATTAACTGCGGAGAGTTCACTGCCGTACAGGCAGCTTAGAAGATGAAAATCGGCGAAAAAATTAAACAGATCCGGTTCACTGGCGTACAGACCGCCTTAAAT

>NC_010694|4|1|946115-947522|PILER-CR
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCAACAAGAAGCGCGATGAAGAAATTGCTGC
GTTCACTGCCGTACAGGCAGCTTAGAAG	GTATTGACTGAATCGGCAAATTCCCATCAGGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTTGAAACTGGCGAGAGAGTCGGCGTGAAACA
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACTCGTCTAGCCAACGCCGCCCGCCGCGCTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACTATGAGGCACTCATTAATGTCTTTGTGCGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGGCATCGCTGAAGCTGGGCCTGAATCATGAC
GTTCACTGCCGTACAGGCAGCTTAGAAG	GGAGAAATGGAAAGCATTCATGACCATGAAAC
GTTCACTGCCGTACAGGCAGCTTAGAAG	CTTCTGGGCCTGTCCAGTCAGTTTACGACCTA
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGTTCGGTGCTGCGAATTCCAGTGTGGCTTAT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TCAGAACCCCGAATTGCTTCGTCGATATAGTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGTTAAATGAACACCCAAGATTTTGCCTACGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	ACACCAACTTGGCCCGTTTCCCACACCAACTT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGGCATGGTGTACCGCCTACCAGTACATCGGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	ATGAATATAAATTCCGTTTCCGGGTCTTTCTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	ACCCAGGTGCTTACCCCAGAGAACTAACAAGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	CACAGGCAGTCTGATTTGCACTGACATTCTGA
GTTCACTGCCGTACAGGCAGCTTAGAAG	CGGCAAACTTTAATAGCTGCATGCGGATTCCT
GTTCACTGCCGTACAGGCAGCTTAGAAG	GCGTTCCGAACATTGAAAATCTCCGCATCATC
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCCAGCTCACGCTCCGTCCAGTCACGCATGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCGGGAACGGCTCGGAATAACTGTTGTGGCT
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACGTCTGATTGGTATCGCATTCCACGCTGC
GTTCACTGCCGTACAGGTAGCTTAGAAG	TGTGATACCCGGAAGCGCTTTTAATTCTGCGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	GGTAACGATGGGTATGAGATTAACTGCGGAGA
GTTCACTGCCGTACAGGCAGCTTAGAAG

>NC_010694|4|4|946115-947582|CRISPRCasFinder
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCAACAAGAAGCGCGATGAAGAAATTGCTGC
GTTCACTGCCGTACAGGCAGCTTAGAAG	GTATTGACTGAATCGGCAAATTCCCATCAGGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTTGAAACTGGCGAGAGAGTCGGCGTGAAACA
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACTCGTCTAGCCAACGCCGCCCGCCGCGCTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACTATGAGGCACTCATTAATGTCTTTGTGCGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGGCATCGCTGAAGCTGGGCCTGAATCATGAC
GTTCACTGCCGTACAGGCAGCTTAGAAG	GGAGAAATGGAAAGCATTCATGACCATGAAAC
GTTCACTGCCGTACAGGCAGCTTAGAAG	CTTCTGGGCCTGTCCAGTCAGTTTACGACCTA
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGTTCGGTGCTGCGAATTCCAGTGTGGCTTAT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TCAGAACCCCGAATTGCTTCGTCGATATAGTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGTTAAATGAACACCCAAGATTTTGCCTACGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	ACACCAACTTGGCCCGTTTCCCACACCAACTT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGGCATGGTGTACCGCCTACCAGTACATCGGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	ATGAATATAAATTCCGTTTCCGGGTCTTTCTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	ACCCAGGTGCTTACCCCAGAGAACTAACAAGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	CACAGGCAGTCTGATTTGCACTGACATTCTGA
GTTCACTGCCGTACAGGCAGCTTAGAAG	CGGCAAACTTTAATAGCTGCATGCGGATTCCT
GTTCACTGCCGTACAGGCAGCTTAGAAG	GCGTTCCGAACATTGAAAATCTCCGCATCATC
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCCAGCTCACGCTCCGTCCAGTCACGCATGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCGGGAACGGCTCGGAATAACTGTTGTGGCT
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACGTCTGATTGGTATCGCATTCCACGCTGC
GTTCACTGCCGTACAGGTAGCTTAGAAG	TGTGATACCCGGAAGCGCTTTTAATTCTGCGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	GGTAACGATGGGTATGAGATTAACTGCGGAGA
GTTCACTGCCGTACAGGCAGCTTAGAAG	ATGAAAATCGGCGAAAAAATTAAACAGATCCG
GTTCACTGGCGTACAGACCGCCTTAAAT

>NC_010694|4|2|946115-947582|CRT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCAACAAGAAGCGCGATGAAGAAATTGCTGC
GTTCACTGCCGTACAGGCAGCTTAGAAG	GTATTGACTGAATCGGCAAATTCCCATCAGGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTTGAAACTGGCGAGAGAGTCGGCGTGAAACA
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACTCGTCTAGCCAACGCCGCCCGCCGCGCTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACTATGAGGCACTCATTAATGTCTTTGTGCGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGGCATCGCTGAAGCTGGGCCTGAATCATGAC
GTTCACTGCCGTACAGGCAGCTTAGAAG	GGAGAAATGGAAAGCATTCATGACCATGAAAC
GTTCACTGCCGTACAGGCAGCTTAGAAG	CTTCTGGGCCTGTCCAGTCAGTTTACGACCTA
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGTTCGGTGCTGCGAATTCCAGTGTGGCTTAT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TCAGAACCCCGAATTGCTTCGTCGATATAGTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGTTAAATGAACACCCAAGATTTTGCCTACGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	ACACCAACTTGGCCCGTTTCCCACACCAACTT
GTTCACTGCCGTACAGGCAGCTTAGAAG	TGGCATGGTGTACCGCCTACCAGTACATCGGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	ATGAATATAAATTCCGTTTCCGGGTCTTTCTC
GTTCACTGCCGTACAGGCAGCTTAGAAG	ACCCAGGTGCTTACCCCAGAGAACTAACAAGT
GTTCACTGCCGTACAGGCAGCTTAGAAG	CACAGGCAGTCTGATTTGCACTGACATTCTGA
GTTCACTGCCGTACAGGCAGCTTAGAAG	CGGCAAACTTTAATAGCTGCATGCGGATTCCT
GTTCACTGCCGTACAGGCAGCTTAGAAG	GCGTTCCGAACATTGAAAATCTCCGCATCATC
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCCAGCTCACGCTCCGTCCAGTCACGCATGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	TTCGGGAACGGCTCGGAATAACTGTTGTGGCT
GTTCACTGCCGTACAGGCAGCTTAGAAG	AACGTCTGATTGGTATCGCATTCCACGCTGC
GTTCACTGCCGTACAGGTAGCTTAGAAG	TGTGATACCCGGAAGCGCTTTTAATTCTGCGG
GTTCACTGCCGTACAGGCAGCTTAGAAG	GGTAACGATGGGTATGAGATTAACTGCGGAGA
GTTCACTGCCGTACAGGCAGCTTAGAAG	ATGAAAATCGGCGAAAAAATTAAACAGATCCG
GTTCACTGGCGTACAGACCGCCTTAAAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_010694.1\|WP_012440600.1\|952934_953597_-\|carbonate-dehydratase	unknown	unknown	gnl\|CDD\|182460
NC_010694.1\|WP_012440593.1\|945431_945986_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	cas6f	cd09739_cas6f_CAS-I-F:CAS-IV	gnl\|CDD\|378224
NC_010694.1\|WP_042958685.1\|935928_936204_+\|hypothetical-protein	unknown	unknown	unknown
NC_010694.1\|WP_012440605.1\|956872_957667_-\|3-methyl-2-oxobutanoate-hydroxymethyltransferase	unknown	unknown	gnl\|CDD\|234723
NC_010694.1\|WP_012440604.1\|956002_956857_-\|pantoate--beta-alanine-ligase	unknown	unknown	gnl\|CDD\|234741
NC_010694.1\|WP_012440590.1\|942113_943457_+\|type-I-F-CRISPR-associated-protein-Csy1	cas8f	pfam09611_cas8f_CAS-I-F	gnl\|CDD\|187866
NC_010694.1\|WP_012440586.1\|936763_937741_+\|type-I-F-CRISPR-associated-endonuclease-Cas1	cas1	cd09718_cas1_CAS-I-F	gnl\|CDD\|132676
NC_010694.1\|WP_012440601.1\|953789_954716_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224054
NC_010694.1\|WP_012440588.1\|941108_941387_+\|BrnT-family-toxin	unknown	unknown	gnl\|CDD\|367913
NC_010694.1\|WP_012440598.1\|950751_952032_-\|cystathionine-gamma-synthase-family-protein	unknown	unknown	gnl\|CDD\|180809
NC_010694.1\|WP_012440587.1\|937737_941031_+\|type-I-F-CRISPR-associated-helicase-Cas3	cas3f	cd09673_cas3f_CAS-I-F	gnl\|CDD\|274201
NC_010694.1\|WP_012440597.1\|949746_950397_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|197715
NC_010694.1\|WP_012440591.1\|943453_944395_+\|type-I-F-CRISPR-associated-protein-Csy2	cas5f	cd09676_cas5f_CAS-I-F	gnl\|CDD\|378221
NC_010694.1\|WP_012440585.1\|935432_935963_+\|DUF2778-domain-containing-protein	unknown	unknown	gnl\|CDD\|378506
NC_010694.1\|WP_012440599.1\|952285_952822_+\|hypoxanthine-phosphoribosyltransferase	unknown	unknown	gnl\|CDD\|185321
NC_010694.1\|WP_012440603.1\|955558_955939_-\|aspartate-1-decarboxylase	unknown	unknown	gnl\|CDD\|180090
NC_010694.1\|WP_012440589.1\|941373_941670_+\|BrnA-antitoxin-family-protein	unknown	unknown	gnl\|CDD\|373040
NC_010694.1\|WP_012440602.1\|954712_955483_+\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|237896
NC_010694.1\|WP_012440592.1\|944418_945423_+\|type-I-F-CRISPR-associated-protein-Csy3	cas7f	pfam09615_cas7f_CAS-I-F	gnl\|CDD\|378222
NC_010694.1\|WP_157861836.1\|948071_948779_+\|PAS-domain-containing-protein	unknown	unknown	gnl\|CDD\|197715

Protein	Function_ID	Function_description	E-value
NC_010694.1\|WP_012440600.1\|952934_953597_-\|carbonate-dehydratase	gnl\|CDD\|182460	PRK10437, PRK10437, carbonic anhydrase; Provisional.	1.03316e-165
NC_010694.1\|WP_012440593.1\|945431_945986_+\|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4	gnl\|CDD\|378224	pfam09618, Cas_Csy4, CRISPR-associated protein (Cas_Csy4). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This protein family, typified by YPO2462 of Yersinia pestis, is a CRISPR-associated (Cas) family strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy4, for CRISPR/Cas Subtype Ypest protein 4.	1.06886e-81
NC_010694.1\|WP_012440605.1\|956872_957667_-\|3-methyl-2-oxobutanoate-hydroxymethyltransferase	gnl\|CDD\|234723	PRK00311, panB, 3-methyl-2-oxobutanoate hydroxymethyltransferase; Reviewed.	6.42033e-165
NC_010694.1\|WP_012440604.1\|956002_956857_-\|pantoate--beta-alanine-ligase	gnl\|CDD\|234741	PRK00380, panC, pantoate--beta-alanine ligase; Reviewed.	9.93417e-166
NC_010694.1\|WP_012440590.1\|942113_943457_+\|type-I-F-CRISPR-associated-protein-Csy1	gnl\|CDD\|187866	cd09735, Csy1_I-F, CRISPR/Cas system-associated protein Csy1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Large proteins; Predicted subunit of the Cascade complex; signature gene for I-F subtype; also known as Csy1 family.	3.13804e-170
NC_010694.1\|WP_012440586.1\|936763_937741_+\|type-I-F-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|132676	TIGR03637, cas1_YPEST, CRISPR-associated endonuclease Cas1, subtype I-F/YPEST. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the YPEST subtype of CRISPR/Cas system.	0
NC_010694.1\|WP_012440601.1\|953789_954716_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224054	COG1131, CcmA, ABC-type multidrug transport system, ATPase component [Defense mechanisms].	2.06714e-103
NC_010694.1\|WP_012440588.1\|941108_941387_+\|BrnT-family-toxin	gnl\|CDD\|367913	pfam04365, BrnT_toxin, Ribonuclease toxin, BrnT, of type II toxin-antitoxin system. BrnT is a ribonuclease toxin of a type II toxin-antitoxin system that exhibits a RelE-like fold. The antitoxin that neutralizes this toxin is pfam14384. BrnT is found in bacteria, archaea, bacteriophage, and plasmids. BrnT-BrnA forms a 2:2 tetrameric complex and autoregulates its own expression, which is induced by a number of different environmental stresses. Expression of BrnT alone results in cessation of bacterial growth which can be rescued after subsequent expression of BrnA.	3.45872e-19
NC_010694.1\|WP_012440598.1\|950751_952032_-\|cystathionine-gamma-synthase-family-protein	gnl\|CDD\|180809	PRK07049, PRK07049, cystathionine gamma-synthase family protein.	0
NC_010694.1\|WP_012440587.1\|937737_941031_+\|type-I-F-CRISPR-associated-helicase-Cas3	gnl\|CDD\|274201	TIGR02562, conserved_hypothetical_protein, CRISPR-associated helicase Cas3, subtype I-F/YPEST. The helicase in many CRISPR-associated (cas) gene clusters is designated Cas3, and most Cas3 proteins are described by model TIGR01587. Members of this family are considerably larger, show a number of motifs in common with TIGR01587 sequences, and replace Cas3 in some CRISPR/cas loci in a number of Proteobacteria, including Yersinia pestis, Chromobacterium violaceum, Erwinia carotovora subsp. atroseptica SCRI1043, Photorhabdus luminescens subsp. laumondii TTO1, Legionella pneumophila, etc.	0
NC_010694.1\|WP_012440597.1\|949746_950397_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|197715	smart00421, HTH_LUXR, helix_turn_helix, Lux Regulon. lux regulon (activates the bioluminescence operon.	1.83334e-10
NC_010694.1\|WP_012440591.1\|943453_944395_+\|type-I-F-CRISPR-associated-protein-Csy2	gnl\|CDD\|378221	pfam09614, Cas_Csy2, CRISPR-associated protein (Cas_Csy2). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2464 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy2, for CRISPR/Cas Subtype Ypest protein 2.	4.36999e-149
NC_010694.1\|WP_012440585.1\|935432_935963_+\|DUF2778-domain-containing-protein	gnl\|CDD\|378506	pfam10908, DUF2778, Protein of unknown function (DUF2778). This is a bacterial family of uncharacterized proteins.	6.30616e-45
NC_010694.1\|WP_012440599.1\|952285_952822_+\|hypoxanthine-phosphoribosyltransferase	gnl\|CDD\|185321	PRK15423, PRK15423, hypoxanthine phosphoribosyltransferase; Provisional.	9.93567e-109
NC_010694.1\|WP_012440603.1\|955558_955939_-\|aspartate-1-decarboxylase	gnl\|CDD\|180090	PRK05449, PRK05449, aspartate alpha-decarboxylase; Provisional.	2.23137e-77
NC_010694.1\|WP_012440589.1\|941373_941670_+\|BrnA-antitoxin-family-protein	gnl\|CDD\|373040	pfam14384, BrnA_antitoxin, BrnA antitoxin of type II toxin-antitoxin system. BrnA is family of antitoxins that neutralizes the toxin BrnT, pfam04365. It consists of 3 alpha-helices and a C-terminal ribbon-helix-helix DNA binding domain. As in other toxin-antitoxin systems, BrnA negatively autoregulates the brnTA operon and has higher affinity for the DNA operator when complexed with BrnT. It dimerizes with two molecules of its toxin BrnT.	1.78145e-13
NC_010694.1\|WP_012440602.1\|954712_955483_+\|ABC-transporter-permease	gnl\|CDD\|237896	PRK15066, PRK15066, inner membrane transport permease; Provisional.	8.3361e-170
NC_010694.1\|WP_012440592.1\|944418_945423_+\|type-I-F-CRISPR-associated-protein-Csy3	gnl\|CDD\|378222	pfam09615, Cas_Csy3, CRISPR-associated protein (Cas_Csy3). CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) is a widespread family of prokaryotic direct repeats with spacers of unique sequence between consecutive repeats. This entry, typified by YPO2463 of Yersinia pestis, is a CRISPR-associated (Cas) entry strictly associated with the Ypest subtype of CRISPR/Cas locus. It is designated Csy3, for CRISPR/Cas Subtype Ypest protein 3.	0
NC_010694.1\|WP_157861836.1\|948071_948779_+\|PAS-domain-containing-protein	gnl\|CDD\|197715	smart00421, HTH_LUXR, helix_turn_helix, Lux Regulon. lux regulon (activates the bioluminescence operon.	1.10454e-13

>NC_010694.1|WP_012440593.1|945431_945986_+|type-I-F-CRISPR-associated-endoribonuclease-Cas6/Csy4
MDRYQDIRVRVDAEMTAPVLLAQVFMRLHQVLMRAANGRIGISFPDVKLTLGDRIRLHGTLDDLSSLQQSGWDKGLTDYIACSAIDPVPPGAAWRTVRRVQVKSSAERLRRRSVNKGWLNEAEAAERINVLSEQRSDLPYLQIKSGSNGHAWRLFIEHGPLVSVPVNGGFSSYGLSATATVPWF
>NC_010694.1|WP_012440592.1|944418_945423_+|type-I-F-CRISPR-associated-protein-Csy3
MAKSAIKTASVLAFERKLSNSDAIMLAGKWQDKQNWTPIKIQEKAVRGTISNRLKNAIASDPQKLDAEIQKPNLQRVDVAALPYNCDSLKVCFTLRVLGGLATPAVCNDRAYQAALAAVIDGYIARHGFSTLAARYAENIANGRFLWRNRLGAGRVAVQVTSGEKRWQFDGHNYSLRAFSQPQGDLLELAQAIEQGLSGDSFALFNVEAQVYLGNGQEVFPSQELVLDSNSKKSKLLYQIDDTAAIHSQKIGNALRTIDSWYPDADELDVGPISVEPYGSVTSRGIAYRQPIKKMDFYTLLDNWVTKDKQPDLEQQHYVMAILIRGGVFGEKSE
>NC_010694.1|WP_012440591.1|943453_944395_+|type-I-F-CRISPR-associated-protein-Csy2
MSALIVLRHLRVENANAIAGITWGFPAITHFLGFTHALSRKLQQSHNMTLSGCGVICHQQQVHAYTSGRDYQFALTRNPLTKEAKTAAFNEEGRMHMTVSLLMECHGSIAGGEQGAAELKQTLANLCQRLRLAGGTVISIGQVQISGWPQDDGETRKIMRRLLPGFALLDRSALLAQHHDQQPQPEMLDAWLDFAALKMQADDGATPADGNVQWQYQPKPGAGYLVPLMTGYRAISPLYPPGEVANSRDTETPFCFTEAVYGVGEWRGLHRIDDLRHLFWRYHHQDDYYLCRGEETACDQDYPDDADDDINYN
>NC_010694.1|WP_012440590.1|942113_943457_+|type-I-F-CRISPR-associated-protein-Csy1
MLRETLASFITSYIAARKTAKLEAFDKESAKKLAVLASEDEISVLRQQLQQQRAELEQKYQPQAWLSDAASRAGQIKLVTHAAKFTHSDVRGSSIFSSGSGQHETYLSTATLQKPALDAVGNAAALDIARLLQSEVEGDSLIASLQRGDYSALESLTDNPELCASWISGFKQVLVDRQPASHKLAKQIYFPIADGQYHLLSPLFSSSLAHALNQRITEAKFSEQAKTARAALKAKSWHDAPVVAYPDTAITQFGGTKPQNISYLNSVRGGKVWLLPCAPPVWQTLSKPPAKHKSIFNSSNDFSRQSWPVIQRMSRFLRRVERLDSTLDIRQQRLAMTDEIIDILFNYVAGIQNQTESIGWSAHPDCVLKRSQQLWLDPWRGDKEFQFEREGGDWKSEVARDFGHWLSRHLHSDKLNMGETERRHFSTAPLFKQRLRELEKDLAEDLP
>NC_010694.1|WP_012440589.1|941373_941670_+|BrnA-antitoxin-family-protein
MPKLKPGTVFPTTEEDAKIYAAVADDEDSMLLEDPQLKLTPLKKRGRPQKAQPKIAVSVRYTPEVISAFKASGAGWQTRMDVALQDWLKTHQPTEIKL
>NC_010694.1|WP_012440588.1|941108_941387_+|BrnT-family-toxin
MDICYDPDKDVKNRRKHGYSLADSALLDWDEMVVYEDNRQPFDEIRLIGLTYGLARLGNRIFSVCFTEHEEVYRIISLRLATRKEIQRYAET
>NC_010694.1|WP_012440587.1|937737_941031_+|type-I-F-CRISPR-associated-helicase-Cas3
MNVLLIAQCNKRALEESRRILDQFAERKGDRSWQTAITQQGLLTLRKLLRKTARRNTAVACHQIKSNGQSELLWIVGNLRRFNAQGAVPTHTTSRDVLKSADENSWHSVEAVSLLAAIAGLFHDFGKANSLFQQMLVGKKGVKRSQPYRHEWVSLRLFCAWVAGRDDRVWIAALSQIEPQDEQAMLAGLEKEGLMDTTNPFAPLPPVARVVAWLILSHHRMPVYPKKNGSSESASYLPPDLEHCDGWLTEQLDALWNAENHHDQGWTPADFKAQWQFPQGTPMRSGLWCGKARKMAQRLLAQPAWLAQIDINQRFSCHMARLALMLADHVYSAQPATPGWQDADCLLYANTDRDSGSLKQRLDEHNIGVAQNALLLARSLPHLRKTLPAITRHKGFKKRSTDERFRWQDNAWQKTCELRDRAFQQGFFGINMASTGCGKTFANARIMYALSDEQKGCRFSVALGLRTLTLQTGDALREKLNLEQDDLAVLVGSQAVTQLHQLAKDNPVSHDTGSESAEALPEENQYISYEGSLDDGRLSRWLQKSPRINKLLSAPVLVTTIDHLIGATEGLRGGRQIAPMLRLLTSDLVLDEPDDFDIDDLPALCRLVNWAGMLGSRVLFSSATLPPALVLALFNAYRSGREIFQHACGLPVDGNICCAWFDENAVLTEELRLPQAFMQQHKEFVANRVSWLAKQPVLRRGWIAPVAPPARDEATIYSHMAQVILQSMMTLHHAHHQRHKELPKTISVGVVRFANINPLVAVAQQLLATEAAEDTHIHYCVYHSRHPLAMRSHFEQRLDATLTRHQSDAIWQVAEIAAALEQHPQQHHLFVVLATSVAEVGRDHDYDWAIAEPSSMRSLIQLAGRVQRHRQEEAQSENIHILQQNICSLKERDSQKPTYCKPGFEQKGYMLASRDLQKILDKEQYQTISAIPRIQSRQKVGKGPLFANLADLEHRRLMVELQGKQKEPNEYCAALWWREQASWCGEMQRRKPFRQSPPEDMHFMLIAEEGDRPEIWQPDDGPSGRKKSMVAYPDLTFAAGVSAWITPDYQQVWQQLAERLTMELEEVSLRFGEIVLRTKPESKEWHFHPLLGAFQAE
>NC_010694.1|WP_012440586.1|936763_937741_+|type-I-F-CRISPR-associated-endonuclease-Cas1
MEMIKPSDLKTILHSKRSNIYYLQYCRVLVNGGRVEYVTDEGKQSLYWNIPIANTTVVMLGTGTSITQAAMREFARAGVLVGFCGGGGTPLYAANEVEVDVSWLNSQSEYRPTEYLQHWVSFWFDEQKRLSAAIAFQRVRISQIRQAWLGSKMMREHKFAISEPHLTGILDRFEQGLARCDNNTDLLALEAVMTKALYKLAAQAVSYGDFVRAKRGGGIDAANRFLDHGNYLAYGLAAVACWVIGLPHGLAVLHGKTRRGGLVFDVADLIKDALILPQAFLAAMAGEGEQEFRQRCLSSLQNAEALDTMIAALEATAREHSQVGK
>NC_010694.1|WP_042958685.1|935928_936204_+|hypothetical-protein
MRMATPARRLAKTVMFIALFCLFARLIDSSQFIGLATANAFAAWLHGSASQENYDDLWFFVDVTLSVLSAVVAYHMVMLLGRKLRASSGHK
>NC_010694.1|WP_012440585.1|935432_935963_+|DUF2778-domain-containing-protein
MALHGSFVLNGADYSPLSFPGVGTFMAFSGSGDNRNRAGCAHIPTVGPLPTGKYWIVDRSQGGLLSQSLSASKDLFNKVFRDAQFGHSDWFALWRDDMSIDDWTWINSVRRGNFRLHPGTISEGCVTLYRNSDFALLRNMLLRTPLVDVPCMRNLKARGSIEVSSHAYGDTCPTTR
>NC_010694.1|WP_157861836.1|948071_948779_+|PAS-domain-containing-protein
MEFSLNKDMDIRSRSFDALISYMEHSNEFWYIKDHNSRFIYMNDYGLHYSGLPKGFNPEGKLDSECPVYWSEIADIIQANDRNVMESQKVIPTLMTFMYGGKEKLIQPFLADVTPLVKEGKSIGVVGRAKKLEIYSMYHLENNKCPESISFGKPTDLFTDREFDVVFFALQSLSAKEIAKKLSISHNTVENYLHSIYDKIGVSALNQLIEYCRKNGYDKYAPNRFINPNPYMPLI
>NC_010694.1|WP_012440597.1|949746_950397_+|helix-turn-helix-transcriptional-regulator
MDIYAQRSGSLKKIVLVTDDGYFYLGLKYSCLSNLTMTTLGFDRFMKESVCADAMLIIDMLSWSFFKSSNETSFYEKMIKNRRPEDIVMLTSNIFQEIITDMLYPGLCKVDRKLSFSFFSELASNQEKINLAKWCPKFERKRGLTNREMNIILEIFRGGKETEISLQLNICPKTVSAHKLSALSKVGCKNISHFFLLGRPFYRDLKLLLNTKSRSL
>NC_010694.1|WP_012440598.1|950751_952032_-|cystathionine-gamma-synthase-family-protein
MASSHSKKTHIGQRELQPETQMLNYGYDPALSEGAVKPPVFLTSTFVFNSAEEGRDFFDYVSGRREPPTGEGNGLVYSRFNHPNSEIVEDRLAIYERTESAALFSSGMSAIATTLLTFVRPGDTILHSQPLYGGSETLLGKTFSNLGVAAVGFADGIDEASVQAAADKAMAQGRVSAILIESPANPTNSLVDIALMKRVADRIERQQQHRPVVACDNTLLGPVFSRPTEHGADISLYSLTKYVGGHSDLIAGAAIGNRALIRQVKALRSAIGTQLDPHSSWMIGRSLETLALRMERANDNAAAVAGFLRSHPKVEQIHYLPFLSPDSAAGKIFSAQCSGAGSTFSFDIRGGQDAAFRFLNNLQLFKLAVSLGGTESLASHPASTTHSGVALDVRERIGIKSTTVRLSIGIENKDDLLEDLRLALEG
>NC_010694.1|WP_012440599.1|952285_952822_+|hypoxanthine-phosphoribosyltransferase
MKHTVEVMISEAEIASRITELGLQISEHYRNSGSDMVLVGLLRGSFMFMADLCRAIDVSHEVDFMTASSYGNSTTSSRDVKILKDLDEDIRGKDVLIVEDIIDSGNTLSKVREILSLRGPKSMAICTLLDKPSRREVDVPVEYVGFAIPDEFVVGYGIDYAQRYRHLPYVGKVVLLDE
>NC_010694.1|WP_012440600.1|952934_953597_-|carbonate-dehydratase
MKDISTLISNNRQWSRLLKEEDPGFFERLSLAQKPRFLWIGCSDSRVPAERLTGLEPGELFVHRNVANLVVHTDLNCLSVVQYAVEVLEVEHIIICGHYGCGGVQAALENPELGLIDNWLLHIRDLWYKHSALLGELPPEKRVDKLCEINVIEQVYNLGHSTIMQSAWKRGQQVNLHGWVYGIQDGYLRDLEVSATNRETLEQRYRHGIANLLNDPDLNP
>NC_010694.1|WP_012440601.1|953789_954716_+|ABC-transporter-ATP-binding-protein
MTYALELEKLTKTYQGGVQALRGIDLAVEAGDFYALLGPNGAGKSTTIGIISSLVNKTAGKVRVFGYDLQKDMVNAKRQLGLVPQEFNFNQFETVMQIVVSQAGLYGVEKAVALQRAEKYLTQLDLWDKRHERARMLSGGMKRRLMIARALMHEPKLLILDEPTAGVDIELRRSMWSFLQQLNAQGTTIILTTHYLEEAEMLCRNIGIIQHGELVENTSMKGLLAKLKSETFILDLAAKSPLPRLEGFQYRLTDTTTLEVEVLREQGMNSVFSQLSHQGVQVLSMRNKANRLEELFVDLVNGRKGDKA
>NC_010694.1|WP_012440602.1|954712_955483_+|ABC-transporter-permease
MTHLYWVALKSIWGKEVNRFARIWIQTLVPPVITMTLYFIIFGNLIGSRIGEMHGFSYMQFIVPGLIMMAVITNAYANVASSFFSAKFQRNIEELLVAPVPTHVIIAGYVGGGVARGVCVGVLVTAISLFFVPFHVHSWLMVAVTLLLTAILFSLAGLLNAVFARTFDDISLIPTFVLTPLTYLGGVFYSLSLLPPVWQMVSKLNPIVYMISGFRYGFLGINDVPLGFTLGVLVAFILVFYALVWGLIQRGRGLRT
>NC_010694.1|WP_012440603.1|955558_955939_-|aspartate-1-decarboxylase
MNRTMLQGKLHRVKVTQADLNYEGSCAIDQDFLDASGILQYEAVDIYNVNNGQRFSTYAIAAERGSKIISVNGAAARCACEGDLLIICSYVQMSDEQAREWQPKVAYFEGDNQMKRVAKAVPVQVA
>NC_010694.1|WP_012440604.1|956002_956857_-|pantoate--beta-alanine-ligase
MLIIETLPMLRREVRRWRQDGKRVALVPTMGNLHDGHMTLVDEARERADIVIVSIFVNPMQFERADDLARYPRTLQEDCEKLNRRGVDLVFSPAPADIYPHGVDGQTFVDVPSLSTLLEGASRPGHFRGVSTIVSKLFNLVQPDLACFGEKDYQQLALIRKMVADMGYDIDIIGVPTVRAKDGLALSSRNGYLTAEERKIAPLLSKVMQQIAERLGQGERHVEEMMISAENTLAENGLRADGLAIVDADTLLPLNVDSQRAVILMAAWLGKARLIDNQQVDLTQ
>NC_010694.1|WP_012440605.1|956872_957667_-|3-methyl-2-oxobutanoate-hydroxymethyltransferase
MKPTTVSTLRQWKQQGEKFASITAYDFSFARLFADEGIQVMLVGDSLGMVVQGHDSTLPVTLADIVYHTEVVRRGAPAALLLADLPFMSYATPEQTFDSAARLMRAGANMVKLEGGKWLAETVKQLTERAVPVCGHLGLTPQSVNIFGGYKVQGRDAEAADLLLEDALALEAAGMQLLVLECVPVALAKRVTEALSIPVIGIGAGNATDGQILVMHDAFGITGGHIPKFAKNFLAETGDIRAAVRQYVEEVKAGSYPAEQHSFQ

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_010694_3	3.2\|934347\|32\|NC_010694\|CRISPRCasFinder,CRT	934347-934378	32	FQ482085	Erwinia tasmaniensis phage phiEt88 complete genome	39444-39475	0	1.0
NC_010694_3	3.2\|934347\|32\|NC_010694\|CRISPRCasFinder,CRT	934347-934378	32	NC_015295	Erwinia phage phiEt88, complete genome	39444-39475	0	1.0
NC_010694_3	3.12\|934947\|33\|NC_010694\|CRISPRCasFinder,CRT	934947-934979	33	NZ_CP028352	Pantoea vagans strain PV989 plasmid pPV989-94, complete sequence	40457-40489	1	0.97
NC_010694_3	3.12\|934947\|33\|NC_010694\|CRISPRCasFinder,CRT	934947-934979	33	NZ_HG813238	Erwinia amylovora strain 692 plasmid pEA68, complete sequence	65570-65602	1	0.97
NC_010694_4	4.14\|946924\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946924-946955	32	MN602881	Erwinia phage Midgardsormr38, complete genome	44923-44954	1	0.969
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	MN602881	Erwinia phage Midgardsormr38, complete genome	371-402	2	0.938
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	JX403939	Pseudomonas phage YMC/01/01/P52_PAE_BP, complete genome	16126-16157	2	0.938
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	MT261384	Salmonella virus PAT1, complete genome	23658-23689	2	0.938
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	MK511012	Pseudomonas phage BR153, partial genome	23029-23060	2	0.938
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	MT580116	Salmonella phage 65FD, complete genome	19326-19357	2	0.938
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	KU310943	Pseudomonas phage YMC11/07/P54_PAE_BP, complete genome	31285-31316	2	0.938
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	NC_016762	Pseudomonas phage phi297, complete genome	24008-24039	2	0.938
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	MT580117	Salmonella phage 66FD, complete genome	10164-10195	2	0.938
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP019065	Rahnella sp. ERMR1:05 plasmid unnamed3, complete sequence	58536-58567	2	0.938
NC_010694_3	3.12\|934947\|33\|NC_010694\|CRISPRCasFinder,CRT	934947-934979	33	NZ_CP019065	Rahnella sp. ERMR1:05 plasmid unnamed3, complete sequence	64152-64184	3	0.909
NC_010694_3	3.12\|934947\|33\|NC_010694\|CRISPRCasFinder,CRT	934947-934979	33	NC_013973	Erwinia amylovora ATCC 49946 plasmid 2, complete sequence	68864-68896	3	0.909
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP018918	Serratia marcescens strain UMH5 plasmid unnamed2, complete sequence	74897-74928	6	0.812
NC_010694_4	4.13\|946864\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946864-946895	32	NZ_CP023152	Mycobacterium chimaera strain FLAC0070 plasmid pFLAC0070_1, complete sequence	35691-35722	6	0.812
NC_010694_4	4.13\|946864\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946864-946895	32	NZ_AP012556	Mycobacterium avium subsp. hominissuis TH135 plasmid pMAH135, complete sequence	105666-105697	6	0.812
NC_010694_4	4.19\|947224\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	947224-947255	32	NZ_CP028352	Pantoea vagans strain PV989 plasmid pPV989-94, complete sequence	43873-43904	6	0.812
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP024583	Roseomonas sp. FDAARGOS_362 plasmid unnamed2, complete sequence	164460-164491	7	0.781
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP030127	Indioceanicola profundi strain SCSIO 08040 plasmid unnamed1, complete sequence	92430-92461	7	0.781
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP013003	Caulobacter henricii strain CB4 plasmid pCB4, complete sequence	86196-86227	7	0.781
NC_010694_4	4.14\|946924\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946924-946955	32	NZ_CP032928	Agrobacterium tumefaciens strain 1D1460 plasmid pAt1D1460, complete sequence	99960-99991	7	0.781
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP024583	Roseomonas sp. FDAARGOS_362 plasmid unnamed2, complete sequence	206708-206739	8	0.75
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_LR594690	Variovorax sp. WDL1 plasmid 2	577582-577613	8	0.75
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	MN857473	Teseptimavirus S2B, complete genome	35174-35205	8	0.75
NC_010694_3	3.12\|934947\|33\|NC_010694\|CRISPRCasFinder,CRT	934947-934979	33	NZ_CP015640	Pseudomonas lurida strain L228 plasmid unnamed, complete sequence	36948-36980	8	0.758
NC_010694_4	4.2\|946203\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946203-946234	32	JF974301	Vibrio phage VD1, * SEQUENCING IN PROGRESS *, 5 unordered pieces	39823-39854	8	0.75
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP021082	Deinococcus ficus strain CC-FR2-10 plasmid pDFI1, complete sequence	386903-386934	8	0.75
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	LN997843	Streptomyces reticuli genome assembly TUE45, plasmid : II	729824-729855	8	0.75
NC_010694_4	4.6\|946444\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946444-946475	32	NZ_CP010326	Pantoea sp. PSNIH1 plasmid pPSP-3a9, complete sequence	321157-321188	8	0.75
NC_010694_4	4.10\|946684\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946684-946715	32	NZ_CP012641	Massilia sp. WG5 plasmid unnamed 1, complete sequence	41485-41516	8	0.75
NC_010694_4	4.23\|947463\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	947463-947494	32	NZ_CP046723	Pantoea agglomerans strain ASB05 plasmid pASB05p1, complete sequence	41284-41315	8	0.75
NC_010694_4	4.23\|947463\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	947463-947494	32	NZ_CP034470	Pantoea agglomerans strain CFSAN047153 plasmid pCFSAN047153_1, complete sequence	254893-254924	8	0.75
NC_010694_4	4.23\|947463\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	947463-947494	32	NZ_CP034475	Pantoea agglomerans strain CFSAN047154 plasmid pCFSAN047154_1, complete sequence	551853-551884	8	0.75
NC_010694_4	4.23\|947463\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	947463-947494	32	NZ_CP031650	Pantoea agglomerans strain TH81 plasmid unnamed1, complete sequence	445600-445631	8	0.75
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	NZ_CP045534	Bacillaceae bacterium C02 plasmid unnamed1, complete sequence	26389-26420	9	0.719
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	NZ_CP042928	Bacillus cereus strain G1-1 plasmid unnamed, complete sequence	50750-50781	9	0.719
NC_010694_3	3.4\|934467\|32\|NC_010694\|CRISPRCasFinder,CRT	934467-934498	32	NZ_CP040341	Bacillus cereus strain DLOU-Tangshan plasmid unnamed1, complete sequence	252495-252526	9	0.719
NC_010694_3	3.6\|934587\|32\|NC_010694\|CRISPRCasFinder,CRT	934587-934618	32	MT104465	Pseudomonas phage MR1, complete genome	33219-33250	9	0.719
NC_010694_3	3.7\|934647\|32\|NC_010694\|CRISPRCasFinder,CRT	934647-934678	32	LR134127	Klebsiella aerogenes strain NCTC10006 genome assembly, plasmid: 7	63782-63813	9	0.719
NC_010694_3	3.9\|934767\|32\|NC_010694\|CRISPRCasFinder,CRT	934767-934798	32	NZ_LR723678	Arsenite-oxidising bacterium NT-25 plasmid 2	103966-103997	9	0.719
NC_010694_3	3.9\|934767\|32\|NC_010694\|CRISPRCasFinder,CRT	934767-934798	32	NZ_FO082821	Rhizobium sp. NT-26 plasmid NT26_p1, complete sequence	185187-185218	9	0.719
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP015585	Roseomonas gilardii strain U14-5 plasmid 1, complete sequence	262811-262842	9	0.719
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP024587	Roseomonas sp. FDAARGOS_362 plasmid unnamed3, complete sequence	136275-136306	9	0.719
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	NZ_CP021082	Deinococcus ficus strain CC-FR2-10 plasmid pDFI1, complete sequence	54420-54451	9	0.719
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	MN694277	Marine virus AFVG_250M238, complete genome	33546-33577	9	0.719
NC_010694_3	3.11\|934887\|32\|NC_010694\|CRISPRCasFinder,CRT	934887-934918	32	MK422450	Klebsiella phage ST13-OXA48phi12.4, complete genome	6992-7023	9	0.719
NC_010694_3	3.12\|934947\|33\|NC_010694\|CRISPRCasFinder,CRT	934947-934979	33	NZ_CP037915	Sphingomonas sp. AAP5 plasmid p150, complete sequence	35204-35236	9	0.727
NC_010694_3	3.14\|935068\|32\|NC_010694\|CRISPRCasFinder,CRT	935068-935099	32	NZ_CP006684	Melissococcus plutonius S1 plasmid pMEPL_178, complete sequence	121602-121633	9	0.719
NC_010694_3	3.14\|935068\|32\|NC_010694\|CRISPRCasFinder,CRT	935068-935099	32	NZ_AP021886	Melissococcus plutonius strain DAT1033 plasmid pMP1, complete sequence	121601-121632	9	0.719
NC_010694_3	3.14\|935068\|32\|NC_010694\|CRISPRCasFinder,CRT	935068-935099	32	NZ_AP018525	Melissococcus plutonius strain DAT585 plasmid pMP1, complete sequence	121423-121454	9	0.719
NC_010694_3	3.14\|935068\|32\|NC_010694\|CRISPRCasFinder,CRT	935068-935099	32	MW084976	Bacillus phage Kirov, complete genome	101796-101827	9	0.719
NC_010694_3	3.17\|935249\|32\|NC_010694\|CRISPRCasFinder,CRT	935249-935280	32	NZ_CP044976	Hydrogenophaga sp. PBL-H3 substr. PBL-H3(B2) plasmid pPBL-H3_B2-1, complete sequence	193979-194010	9	0.719
NC_010694_4	4.1\|946143\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946143-946174	32	MK376341	Pseudomonas sp. strain ANT_H7B plasmid pA7BH1, complete sequence	1113-1144	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	CP023013	Ralstonia solanacearum strain T110 plasmid unnamed, complete sequence	1843238-1843269	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP032323	Azospirillum brasilense strain MTCC4035 plasmid p2, complete sequence	445244-445275	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP049790	Ralstonia solanacearum strain 202 plasmid unnamed, complete sequence	1441391-1441422	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP049794	Ralstonia solanacearum strain 204 plasmid unnamed, complete sequence	1230456-1230487	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP007795	Azospirillum brasilense strain Az39 plasmid AbAZ39_p2, complete sequence	651297-651328	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP049792	Ralstonia solanacearum strain 203 plasmid unnamed, complete sequence	1011932-1011963	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP016915	Ralstonia solanacearum strain CQPS-1 plasmid unnamed, complete sequence	2038052-2038083	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP015851	Ralstonia solanacearum strain YC40-M plasmid, complete sequence	562084-562115	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP022783	Ralstonia solanacearum strain SL3755 plasmid unnamed, complete sequence	1850606-1850637	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP022795	Ralstonia solanacearum strain SL2330 plasmid unnamed, complete sequence	1845453-1845484	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP022482	Ralstonia solanacearum strain HA4-1 plasmid HA4-1MP, complete sequence	1258689-1258720	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	CP023015	Ralstonia solanacearum strain T25 plasmid unnamed, complete sequence	1846823-1846854	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP052077	Ralstonia solanacearum strain FJAT445.F50 plasmid Plas1, complete sequence	1813603-1813634	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP052079	Ralstonia solanacearum strain FJAT445.F1 plasmid Plas1, complete sequence	1814252-1814283	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP052125	Ralstonia solanacearum strain FJAT1452.F1 plasmid Plas1, complete sequence	1813628-1813659	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP052123	Ralstonia solanacearum strain FJAT1452.F50 plasmid Plas1, complete sequence	1813628-1813659	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP052081	Ralstonia solanacearum strain FJAT442.F50 plasmid Plas1, complete sequence	1813628-1813659	9	0.719
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP052083	Ralstonia solanacearum strain FJAT442.F1 plasmid Plas1, complete sequence	1813628-1813659	9	0.719
NC_010694_4	4.6\|946444\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946444-946475	32	NZ_CP021082	Deinococcus ficus strain CC-FR2-10 plasmid pDFI1, complete sequence	376024-376055	9	0.719
NC_010694_4	4.8\|946564\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946564-946595	32	NC_007974	Cupriavidus metallidurans CH34 megaplasmid, complete sequence	473061-473092	9	0.719
NC_010694_4	4.8\|946564\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946564-946595	32	NZ_CP046333	Cupriavidus metallidurans strain FDAARGOS_675 plasmid unnamed3	574159-574190	9	0.719
NC_010694_4	4.19\|947224\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	947224-947255	32	MN694676	Marine virus AFVG_250M673, complete genome	25946-25977	9	0.719
NC_010694_3	3.7\|934647\|32\|NC_010694\|CRISPRCasFinder,CRT	934647-934678	32	MG592483	Vibrio phage 1.110.O._10N.261.52.C1, partial genome	1417-1448	10	0.688
NC_010694_3	3.7\|934647\|32\|NC_010694\|CRISPRCasFinder,CRT	934647-934678	32	MG592605	Vibrio phage 1.239.O._10N.261.52.F6, partial genome	1339-1370	10	0.688
NC_010694_4	4.1\|946143\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946143-946174	32	JN035618	Gordonia phage GTE7, complete genome	14328-14359	10	0.688
NC_010694_4	4.1\|946143\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946143-946174	32	KF879861	UNVERIFIED: Nocardia phage NOC1, partial genome	12537-12568	10	0.688
NC_010694_4	4.1\|946143\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946143-946174	32	NC_028673	Gordonia phage GMA7, complete genome	14269-14300	10	0.688
NC_010694_4	4.3\|946263\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946263-946294	32	NZ_CP030842	Acidisarcina polymorpha strain SBC82 plasmid pACPOL2, complete sequence	58281-58312	10	0.688
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP032342	Azospirillum brasilense strain MTCC4038 plasmid p3, complete sequence	198674-198705	10	0.688
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP033321	Azospirillum brasilense strain Cd plasmid p3, complete sequence	632563-632594	10	0.688
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	NZ_CP033315	Azospirillum brasilense strain Sp 7 plasmid p3, complete sequence	4952-4983	10	0.688
NC_010694_4	4.4\|946323\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946323-946354	32	KY653127	Corynebacterium phage IME1320_01, complete genome	12352-12383	10	0.688
NC_010694_4	4.7\|946504\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946504-946535	32	AP018319	Nostoc sp. HK-01 plasmid plasmid1 DNA, complete genome	406090-406121	10	0.688
NC_010694_4	4.12\|946804\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946804-946835	32	NZ_LT991956	Enterobacter hormaechei subsp. steigerwaltii isolate C309 plasmid pC309-p2	67604-67635	10	0.688
NC_010694_3	3.14\|935068\|32\|NC_010694\|CRISPRCasFinder,CRT	935068-935099	32	NZ_CP016317	Bacillus cereus strain M3 plasmid pBCM301, complete sequence	22531-22562	11	0.656
NC_010694_4	4.7\|946504\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946504-946535	32	NZ_CP024793	Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence	191289-191320	11	0.656
NC_010694_4	4.7\|946504\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946504-946535	32	NZ_CP024793	Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence	313344-313375	11	0.656
NC_010694_4	4.7\|946504\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946504-946535	32	NZ_CP024793	Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence	498900-498931	11	0.656
NC_010694_4	4.7\|946504\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946504-946535	32	NZ_CP026693	Nostoc sp. 'Lobaria pulmonaria (5183) cyanobiont' strain 5183 plasmid pNLP1, complete sequence	2767-2798	11	0.656
NC_010694_4	4.7\|946504\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946504-946535	32	MK047638	Phage NG54, complete genome	35388-35419	11	0.656
NC_010694_4	4.11\|946744\|32\|NC_010694\|PILER-CR,CRISPRCasFinder,CRT	946744-946775	32	NZ_CP024793	Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence	242879-242910	11	0.656

1. spacer 3.2|934347|32|NC_010694|CRISPRCasFinder,CRT matches to FQ482085 (Erwinia tasmaniensis phage phiEt88 complete genome) position: , mismatch: 0, identity: 1.0

actggttcgctgcacgggtcaaactcaatttc	CRISPR spacer
actggttcgctgcacgggtcaaactcaatttc	Protospacer
********************************

2. spacer 3.2|934347|32|NC_010694|CRISPRCasFinder,CRT matches to NC_015295 (Erwinia phage phiEt88, complete genome) position: , mismatch: 0, identity: 1.0

actggttcgctgcacgggtcaaactcaatttc	CRISPR spacer
actggttcgctgcacgggtcaaactcaatttc	Protospacer
********************************

3. spacer 3.12|934947|33|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP028352 (Pantoea vagans strain PV989 plasmid pPV989-94, complete sequence) position: , mismatch: 1, identity: 0.97

catcaacctgatggactccatgctgcccaaaac	CRISPR spacer
catcaacctgatggactccatgctgcctaaaac	Protospacer
***************************.*****

4. spacer 3.12|934947|33|NC_010694|CRISPRCasFinder,CRT matches to NZ_HG813238 (Erwinia amylovora strain 692 plasmid pEA68, complete sequence) position: , mismatch: 1, identity: 0.97

catcaacctgatggactccatgctgcccaaaac	CRISPR spacer
catcaacctgatggactcgatgctgcccaaaac	Protospacer
****************** **************

5. spacer 4.14|946924|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to MN602881 (Erwinia phage Midgardsormr38, complete genome) position: , mismatch: 1, identity: 0.969

atgaatataaattccgtttccgggtctttctc	CRISPR spacer
atgaagataaattccgtttccgggtctttctc	Protospacer
***** **************************

6. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to MN602881 (Erwinia phage Midgardsormr38, complete genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tgaagaaaatcaaatggccggacaaggtgaag	Protospacer
* **************************.***

7. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to JX403939 (Pseudomonas phage YMC/01/01/P52_PAE_BP, complete genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tcaagaagatcaaatggccggacaaggtgaag	Protospacer
*******.********************.***

8. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to MT261384 (Salmonella virus PAT1, complete genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tcaagaaaattaaatggccggacaaggtgaag	Protospacer
**********.*****************.***

9. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to MK511012 (Pseudomonas phage BR153, partial genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tcaagaagatcaaatggccggacaaggtgaag	Protospacer
*******.********************.***

10. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to MT580116 (Salmonella phage 65FD, complete genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tcaagaaaattaaatggccggacaaggtgaag	Protospacer
**********.*****************.***

11. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to KU310943 (Pseudomonas phage YMC11/07/P54_PAE_BP, complete genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tcaagaagatcaaatggccggacaaggtgaag	Protospacer
*******.********************.***

12. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to NC_016762 (Pseudomonas phage phi297, complete genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tcaagaagatcaaatggccggacaaggtgaag	Protospacer
*******.********************.***

13. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to MT580117 (Salmonella phage 66FD, complete genome) position: , mismatch: 2, identity: 0.938

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
tcaagaaaattaaatggccggacaaggtgaag	Protospacer
**********.*****************.***

14. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP019065 (Rahnella sp. ERMR1:05 plasmid unnamed3, complete sequence) position: , mismatch: 2, identity: 0.938

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
catcgttgacgccgcccacagcatcaccagct	Protospacer
****** *********** *************

15. spacer 3.12|934947|33|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP019065 (Rahnella sp. ERMR1:05 plasmid unnamed3, complete sequence) position: , mismatch: 3, identity: 0.909

catcaacctgatggactccatgctgcccaaaac	CRISPR spacer
gattaacctgatggactcaatgctgcccaaaac	Protospacer
 **.************** **************

16. spacer 3.12|934947|33|NC_010694|CRISPRCasFinder,CRT matches to NC_013973 (Erwinia amylovora ATCC 49946 plasmid 2, complete sequence) position: , mismatch: 3, identity: 0.909

catcaacctgatggactccatgctgcccaaaac	CRISPR spacer
cgttaacctgatggactccatgcttcccaaaac	Protospacer
*.*.******************** ********

17. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP018918 (Serratia marcescens strain UMH5 plasmid unnamed2, complete sequence) position: , mismatch: 6, identity: 0.812

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
cattaccgacgccgcccacagcatcaccaact	Protospacer
***... *********** **********.**

18. spacer 4.13|946864|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP023152 (Mycobacterium chimaera strain FLAC0070 plasmid pFLAC0070_1, complete sequence) position: , mismatch: 6, identity: 0.812

tggcatggtgtaccgcctaccagt-acatcggg	CRISPR spacer
gggcatggtgtaccgccatccagtcacgttgg-	Protospacer
 ****************  ***** **.*.**

19. spacer 4.13|946864|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_AP012556 (Mycobacterium avium subsp. hominissuis TH135 plasmid pMAH135, complete sequence) position: , mismatch: 6, identity: 0.812

tggcatggtgtaccgcctaccagt-acatcggg	CRISPR spacer
gggcatggtgtaccgccatccagtcacgttgg-	Protospacer
 ****************  ***** **.*.**

20. spacer 4.19|947224|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP028352 (Pantoea vagans strain PV989 plasmid pPV989-94, complete sequence) position: , mismatch: 6, identity: 0.812

ttccagctcacgctccgtccagtcacgcatgg	CRISPR spacer
ttccagctcgcgctcagtccagtcgttcatag	Protospacer
*********.***** ********.. ***.*

21. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP024583 (Roseomonas sp. FDAARGOS_362 plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.781

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
gaccatcgacgcagcccagggcatcaccagca	Protospacer
 *.*.* ***** ******.***********

22. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP030127 (Indioceanicola profundi strain SCSIO 08040 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.781

catcgtggacgccgcccagagcatc--accagct	CRISPR spacer
gatcgaggatgccgcccagagcatcggggcag--	Protospacer
 **** ***.***************  . ***

23. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP013003 (Caulobacter henricii strain CB4 plasmid pCB4, complete sequence) position: , mismatch: 7, identity: 0.781

aactcgtct--agccaacgccgcccgccgcgctc	CRISPR spacer
--ccaggctgaagccgccgccgcccgccgcgctc	Protospacer
  *. * **  ****. *****************

24. spacer 4.14|946924|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP032928 (Agrobacterium tumefaciens strain 1D1460 plasmid pAt1D1460, complete sequence) position: , mismatch: 7, identity: 0.781

atgaatataaattccgtttccgggtctttctc	CRISPR spacer
atgaatatgaattccggttccggcttgtgatc	Protospacer
********.******* ****** *. *  **

25. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP024583 (Roseomonas sp. FDAARGOS_362 plasmid unnamed2, complete sequence) position: , mismatch: 8, identity: 0.75

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
gaccgtggacgcggcccagggcatcacctcgg	Protospacer
 *.********* ******.********

26. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_LR594690 (Variovorax sp. WDL1 plasmid 2) position: , mismatch: 8, identity: 0.75

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
ctgcgttgacgccgcccagatcatcatgggcg	Protospacer
*  *** ************* *****. .**

27. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to MN857473 (Teseptimavirus S2B, complete genome) position: , mismatch: 8, identity: 0.75

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
gcgcctggacgccgtccagatcatcaccctct	Protospacer
   * *********.***** *******  **

28. spacer 3.12|934947|33|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP015640 (Pseudomonas lurida strain L228 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.758

catcaacctgatggactccatgctgcccaaaac	CRISPR spacer
catcaacctgatggattcgatgcttgccccggc	Protospacer
***************.** *****  **  ..*

29. spacer 4.2|946203|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to JF974301 (Vibrio phage VD1, *** SEQUENCING IN PROGRESS ***, 5 unordered pieces) position: , mismatch: 8, identity: 0.75

gtattgactgaatcggcaaattcccatcaggt	CRISPR spacer
gtggctactgaatcggccaattcccagcagaa	Protospacer
**. . *********** ******** ***.

30. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP021082 (Deinococcus ficus strain CC-FR2-10 plasmid pDFI1, complete sequence) position: , mismatch: 8, identity: 0.75

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
ttccgatcaagccaaagccgcccgccgcgcac	Protospacer
  *. .** ****** ************** *

31. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to LN997843 (Streptomyces reticuli genome assembly TUE45, plasmid : II) position: , mismatch: 8, identity: 0.75

aactcgt-ctagccaacgccgcccgccgcgctc	CRISPR spacer
-acgggcgctggcccacgccgcccgccgcgcgg	Protospacer
 **  *. **.*** ****************

32. spacer 4.6|946444|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP010326 (Pantoea sp. PSNIH1 plasmid pPSP-3a9, complete sequence) position: , mismatch: 8, identity: 0.75

tggcatcgctgaagctgggcctgaatcatgac	CRISPR spacer
tggcagcgctgacgctgggcctggcgcctttc	Protospacer
***** ****** **********.  * *  *

33. spacer 4.10|946684|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP012641 (Massilia sp. WG5 plasmid unnamed 1, complete sequence) position: , mismatch: 8, identity: 0.75

tcagaaccccgaattgcttcgtcgatatagtc	CRISPR spacer
accgcacccagaattgctttgtcgatatccgc	Protospacer
 * * **** *********.********   *

34. spacer 4.23|947463|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP046723 (Pantoea agglomerans strain ASB05 plasmid pASB05p1, complete sequence) position: , mismatch: 8, identity: 0.75

ggtaacgatgggtatgagattaactgcggaga	CRISPR spacer
cgtaacgtagggtatgagattaacgaagctga	Protospacer
 ******  *************** . *  **

35. spacer 4.23|947463|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034470 (Pantoea agglomerans strain CFSAN047153 plasmid pCFSAN047153_1, complete sequence) position: , mismatch: 8, identity: 0.75

ggtaacgatgggtatgagattaactgcggaga	CRISPR spacer
cgtaacgtagggtatgagattaacgaagctga	Protospacer
 ******  *************** . *  **

36. spacer 4.23|947463|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034475 (Pantoea agglomerans strain CFSAN047154 plasmid pCFSAN047154_1, complete sequence) position: , mismatch: 8, identity: 0.75

ggtaacgatgggtatgagattaactgcggaga	CRISPR spacer
cgtaacgtagggtatgagattaacgaagctga	Protospacer
 ******  *************** . *  **

37. spacer 4.23|947463|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP031650 (Pantoea agglomerans strain TH81 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

ggtaacgatgggtatgagattaactgcggaga	CRISPR spacer
cgtaacgtagggtatgagattaacgaagctga	Protospacer
 ******  *************** . *  **

38. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP045534 (Bacillaceae bacterium C02 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.719

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
ccaagtaaatgaaatggccggacaatattggt	Protospacer
.**** **** ************** .* ..

39. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP042928 (Bacillus cereus strain G1-1 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
ccaagtaaatgaaatggccggacaatattggt	Protospacer
.**** **** ************** .* ..

40. spacer 3.4|934467|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP040341 (Bacillus cereus strain DLOU-Tangshan plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.719

tcaagaaaatcaaatggccggacaaggtaaag	CRISPR spacer
ccaagtaaatgaaatggccggacaatattggt	Protospacer
.**** **** ************** .* ..

41. spacer 3.6|934587|32|NC_010694|CRISPRCasFinder,CRT matches to MT104465 (Pseudomonas phage MR1, complete genome) position: , mismatch: 9, identity: 0.719

agtttttggtttggtcgccatatagaattatt	CRISPR spacer
cgtttttggtgtggttgccatatatgcctcct	Protospacer
 ********* ****.******** . .* .*

42. spacer 3.7|934647|32|NC_010694|CRISPRCasFinder,CRT matches to LR134127 (Klebsiella aerogenes strain NCTC10006 genome assembly, plasmid: 7) position: , mismatch: 9, identity: 0.719

ttaaccccggcaccaataccgatag-agtcata	CRISPR spacer
ataaccccggccccgataccgataaccgttgc-	Protospacer
 ********** **.*********.  **...

43. spacer 3.9|934767|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_LR723678 (Arsenite-oxidising bacterium NT-25 plasmid 2) position: , mismatch: 9, identity: 0.719

tgtttagcggtatctccgcatagcgcatggaa	CRISPR spacer
agacacgcggtatcgccgcatagcggatgtca	Protospacer
 * .  ******** ********** ***  *

44. spacer 3.9|934767|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_FO082821 (Rhizobium sp. NT-26 plasmid NT26_p1, complete sequence) position: , mismatch: 9, identity: 0.719

tgtttagcggtatctccgcatagcgcatggaa	CRISPR spacer
agacacgcggtatcgccgcatagcggatgtca	Protospacer
 * .  ******** ********** ***  *

45. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP015585 (Roseomonas gilardii strain U14-5 plasmid 1, complete sequence) position: , mismatch: 9, identity: 0.719

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
gacggtggacgcggcccagggcatcacctcgg	Protospacer
 *. ******** ******.********

46. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP024587 (Roseomonas sp. FDAARGOS_362 plasmid unnamed3, complete sequence) position: , mismatch: 9, identity: 0.719

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
gacggtggacgcggcccagggcatcacctcgg	Protospacer
 *. ******** ******.********

47. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP021082 (Deinococcus ficus strain CC-FR2-10 plasmid pDFI1, complete sequence) position: , mismatch: 9, identity: 0.719

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
gttcgtggccgccgcccagagcctcggcgcca	Protospacer
  ****** ************* **. *. *

48. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to MN694277 (Marine virus AFVG_250M238, complete genome) position: , mismatch: 9, identity: 0.719

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
cgccaaacccgccgccgggagcatcaccagct	Protospacer
*..*. .  ******* .**************

49. spacer 3.11|934887|32|NC_010694|CRISPRCasFinder,CRT matches to MK422450 (Klebsiella phage ST13-OXA48phi12.4, complete genome) position: , mismatch: 9, identity: 0.719

catcgtggacgccgcccagagcatcaccagct	CRISPR spacer
aatcgtagacaccgcccagagcattaaacgaa	Protospacer
 *****.***.*************.*   *

50. spacer 3.12|934947|33|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP037915 (Sphingomonas sp. AAP5 plasmid p150, complete sequence) position: , mismatch: 9, identity: 0.727

catcaacctgatggactccatgctgcccaaaac	CRISPR spacer
ctcgatgatgatggactacatgctccccaaaaa	Protospacer
* . *   ********* ****** *******

51. spacer 3.14|935068|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP006684 (Melissococcus plutonius S1 plasmid pMEPL_178, complete sequence) position: , mismatch: 9, identity: 0.719

ttacccgatgcttcaatgaatccagacgtacc	CRISPR spacer
gaaccagatggttcaatgaatccagaaggcat	Protospacer
  *** **** *************** *   .

52. spacer 3.14|935068|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_AP021886 (Melissococcus plutonius strain DAT1033 plasmid pMP1, complete sequence) position: , mismatch: 9, identity: 0.719

ttacccgatgcttcaatgaatccagacgtacc	CRISPR spacer
gaaccagatggttcaatgaatccagaaggcat	Protospacer
  *** **** *************** *   .

53. spacer 3.14|935068|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_AP018525 (Melissococcus plutonius strain DAT585 plasmid pMP1, complete sequence) position: , mismatch: 9, identity: 0.719

ttacccgatgcttcaatgaatccagacgtacc	CRISPR spacer
gaaccagatggttcaatgaatccagaaggcat	Protospacer
  *** **** *************** *   .

54. spacer 3.14|935068|32|NC_010694|CRISPRCasFinder,CRT matches to MW084976 (Bacillus phage Kirov, complete genome) position: , mismatch: 9, identity: 0.719

ttacccgatgcttcaatgaatccagacgtacc	CRISPR spacer
actgctgttgcttcaatgattccagacttacg	Protospacer
 .  *.* *********** ******* ***

55. spacer 3.17|935249|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP044976 (Hydrogenophaga sp. PBL-H3 substr. PBL-H3(B2) plasmid pPBL-H3_B2-1, complete sequence) position: , mismatch: 9, identity: 0.719

aaagacggcacgtttttcaccaaagacgattt	CRISPR spacer
tactacggcacgtttttcaacgaagacctgat	Protospacer
 *  *************** *.*****    *

56. spacer 4.1|946143|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to MK376341 (Pseudomonas sp. strain ANT_H7B plasmid pA7BH1, complete sequence) position: , mismatch: 9, identity: 0.719

ttcaacaagaagcgcgatgaagaaattgctgc	CRISPR spacer
gagatagagaagcgggatgcagaaattgctga	Protospacer
   *  .******* **** ***********

57. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to CP023013 (Ralstonia solanacearum strain T110 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

58. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP032323 (Azospirillum brasilense strain MTCC4035 plasmid p2, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
acagcatctggccgacgccgcccgccgcggcg	Protospacer
*   *.***.***.*************** .

59. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP049790 (Ralstonia solanacearum strain 202 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

60. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP049794 (Ralstonia solanacearum strain 204 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

61. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP007795 (Azospirillum brasilense strain Az39 plasmid AbAZ39_p2, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
acagcatctggccgacgccgcccgccgcggcg	Protospacer
*   *.***.***.*************** .

62. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP049792 (Ralstonia solanacearum strain 203 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

63. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016915 (Ralstonia solanacearum strain CQPS-1 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

64. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP015851 (Ralstonia solanacearum strain YC40-M plasmid, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

65. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP022783 (Ralstonia solanacearum strain SL3755 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

66. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP022795 (Ralstonia solanacearum strain SL2330 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

67. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP022482 (Ralstonia solanacearum strain HA4-1 plasmid HA4-1MP, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

68. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to CP023015 (Ralstonia solanacearum strain T25 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

69. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP052077 (Ralstonia solanacearum strain FJAT445.F50 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

70. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP052079 (Ralstonia solanacearum strain FJAT445.F1 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

71. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP052125 (Ralstonia solanacearum strain FJAT1452.F1 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

72. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP052123 (Ralstonia solanacearum strain FJAT1452.F50 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

73. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP052081 (Ralstonia solanacearum strain FJAT442.F50 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

74. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP052083 (Ralstonia solanacearum strain FJAT442.F1 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.719

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
catcgaacaagccgacgccgcccgtcgcgctc	Protospacer
 *.. . * ****.**********.*******

75. spacer 4.6|946444|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP021082 (Deinococcus ficus strain CC-FR2-10 plasmid pDFI1, complete sequence) position: , mismatch: 9, identity: 0.719

tggcatcgctgaagctgggcctgaatcatgac	CRISPR spacer
atgaggtgctgcagctgggcctgaagcatgtc	Protospacer
  * . .**** ************* **** *

76. spacer 4.8|946564|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NC_007974 (Cupriavidus metallidurans CH34 megaplasmid, complete sequence) position: , mismatch: 9, identity: 0.719

cttctgggcctgtccagtcagtttacgaccta	CRISPR spacer
cttcggggcctggccagtcagttttctgagag	Protospacer
**** ******* *********** * .   .

77. spacer 4.8|946564|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP046333 (Cupriavidus metallidurans strain FDAARGOS_675 plasmid unnamed3) position: , mismatch: 9, identity: 0.719

cttctgggcctgtccagtcagtttacgaccta	CRISPR spacer
cttcggggcctggccagtcagttttctgagag	Protospacer
**** ******* *********** * .   .

78. spacer 4.19|947224|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to MN694676 (Marine virus AFVG_250M673, complete genome) position: , mismatch: 9, identity: 0.719

ttccagctc----acgctccgtccagtcacgcatgg	CRISPR spacer
----aaccttgaaacgcgccgtccagtcaagcatgg	Protospacer
    *.*..    **** *********** ******

79. spacer 3.7|934647|32|NC_010694|CRISPRCasFinder,CRT matches to MG592483 (Vibrio phage 1.110.O._10N.261.52.C1, partial genome) position: , mismatch: 10, identity: 0.688

ttaaccccggcaccaataccgatagagtcata	CRISPR spacer
ccagtatgagcaccaacgccgatagagtcata	Protospacer
..*.. . .*******..**************

80. spacer 3.7|934647|32|NC_010694|CRISPRCasFinder,CRT matches to MG592605 (Vibrio phage 1.239.O._10N.261.52.F6, partial genome) position: , mismatch: 10, identity: 0.688

ttaaccccggcaccaataccgatagagtcata	CRISPR spacer
ccagtatgagcaccaacgccgatagagtcata	Protospacer
..*.. . .*******..**************

81. spacer 4.1|946143|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to JN035618 (Gordonia phage GTE7, complete genome) position: , mismatch: 10, identity: 0.688

ttcaacaagaagcgcgatgaagaaattgctgc	CRISPR spacer
gagaacaagaagcgcgagcaagaaatgaagtc	Protospacer
   **************  ******* .   *

82. spacer 4.1|946143|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to KF879861 (UNVERIFIED: Nocardia phage NOC1, partial genome) position: , mismatch: 10, identity: 0.688

ttcaacaagaagcgcgatgaagaaattgctgc	CRISPR spacer
gagaacaagaagcgcgagcaagaaatgaagtc	Protospacer
   **************  ******* .   *

83. spacer 4.1|946143|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NC_028673 (Gordonia phage GMA7, complete genome) position: , mismatch: 10, identity: 0.688

ttcaacaagaagcgcgatgaagaaattgctgc	CRISPR spacer
gagaacaagaagcgcgagcaagaaatgaagtc	Protospacer
   **************  ******* .   *

84. spacer 4.3|946263|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP030842 (Acidisarcina polymorpha strain SBC82 plasmid pACPOL2, complete sequence) position: , mismatch: 10, identity: 0.688

tttgaaactggcgagagagtcggcgtgaaaca	CRISPR spacer
aagtaaactggcgagaaagtcggtgtgcatgt	Protospacer
    ************.******.*** *

85. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP032342 (Azospirillum brasilense strain MTCC4038 plasmid p3, complete sequence) position: , mismatch: 10, identity: 0.688

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
ggccgcgctggccgacgccgcccgccgcgccg	Protospacer
..*.   **.***.****************.

86. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP033321 (Azospirillum brasilense strain Cd plasmid p3, complete sequence) position: , mismatch: 10, identity: 0.688

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
ggccgcgctggccgacgccgcccgccgcgccg	Protospacer
..*.   **.***.****************.

87. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP033315 (Azospirillum brasilense strain Sp 7 plasmid p3, complete sequence) position: , mismatch: 10, identity: 0.688

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
ggccgcgctggccgacgccgcccgccgcgccg	Protospacer
..*.   **.***.****************.

88. spacer 4.4|946323|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to KY653127 (Corynebacterium phage IME1320_01, complete genome) position: , mismatch: 10, identity: 0.688

aactcgtctagccaacgccgcccgccgcgctc	CRISPR spacer
cggcaacctagccgacgacgcccgccgcgccc	Protospacer
 . . ..******.*** ************.*

89. spacer 4.7|946504|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to AP018319 (Nostoc sp. HK-01 plasmid plasmid1 DNA, complete genome) position: , mismatch: 10, identity: 0.688

ggagaaatggaaagcattcatgaccatgaaac	CRISPR spacer
atagaaattgaacgcattcatgaccccagatt	Protospacer
. ****** *** ************ ...* .

90. spacer 4.12|946804|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LT991956 (Enterobacter hormaechei subsp. steigerwaltii isolate C309 plasmid pC309-p2) position: , mismatch: 10, identity: 0.688

acaccaacttggcccgtttcccacaccaactt	CRISPR spacer
cttccatcttggcccgtttccctcaccgttcg	Protospacer
 . *** *************** ****. ..

91. spacer 3.14|935068|32|NC_010694|CRISPRCasFinder,CRT matches to NZ_CP016317 (Bacillus cereus strain M3 plasmid pBCM301, complete sequence) position: , mismatch: 11, identity: 0.656

ttacccgatgcttcaatgaatccagacgtacc	CRISPR spacer
cctgaagatgcttcaatgactccagaggttat	Protospacer
..    ************* ****** **  .

92. spacer 4.7|946504|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024793 (Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence) position: , mismatch: 11, identity: 0.656

ggagaaatggaaagcattcatgaccatgaaac	CRISPR spacer
atagaaatagaacgcattcatgacccacgttt	Protospacer
. ******.*** ************   .  .

93. spacer 4.7|946504|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024793 (Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence) position: , mismatch: 11, identity: 0.656

ggagaaatggaaagcattcatgaccatgaaac	CRISPR spacer
atagaaatagaacgcattcatgacccacgttt	Protospacer
. ******.*** ************   .  .

94. spacer 4.7|946504|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024793 (Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence) position: , mismatch: 11, identity: 0.656

ggagaaatggaaagcattcatgaccatgaaac	CRISPR spacer
atagaaatagaacgcattcatgacccacgttt	Protospacer
. ******.*** ************   .  .

95. spacer 4.7|946504|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP026693 (Nostoc sp. 'Lobaria pulmonaria (5183) cyanobiont' strain 5183 plasmid pNLP1, complete sequence) position: , mismatch: 11, identity: 0.656

ggagaaatggaaagcattcatgaccatgaaac	CRISPR spacer
atagaaatagaacgcattcatgacccacgttt	Protospacer
. ******.*** ************   .  .

96. spacer 4.7|946504|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to MK047638 (Phage NG54, complete genome) position: , mismatch: 11, identity: 0.656

ggagaaatggaaagcattcatgaccatgaaac	CRISPR spacer
acgccggcagaaagcagtcatgaccaggaaac	Protospacer
. .  ....******* ********* *****

97. spacer 4.11|946744|32|NC_010694|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024793 (Nostoc flagelliforme CCNUN1 plasmid pNFSY08, complete sequence) position: , mismatch: 11, identity: 0.656

tgttaaatgaacacccaagattttgcctacgt	CRISPR spacer
caataaatgaacccccaagatttagcgaggca	Protospacer
.. ********* ********** **  .

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

625326 : 694971

Salmonella_phage(73.68%)

plate,terminase,tail,lysis,capsid,head,portal,integrase

attL 626788:626805|attR 657181:657198

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012440303.1\|625326_626058_+	hypothetical protein	Q37850	Escherichia_phage	3.0e-121	90.1
WP_042958615.1\|626624_626819_+	hypothetical protein	NA	NA	NA	NA
626788:626805	attL	NA	NA	NA	NA
WP_012440304.1\|626925_628248_-	hypothetical protein	NA	NA	NA	NA
WP_012440305.1\|628262_629291_-\|integrase	tyrosine-type recombinase/integrase	A0A218M4I3	Erwinia_phage	5.6e-182	93.0
WP_012440306.1\|629290_629869_-	phage repressor protein CI	A0A218M4J1	Erwinia_phage	8.4e-58	55.6
WP_012440307.1\|629998_630262_+	hypothetical protein	A0A218M4I5	Erwinia_phage	1.1e-41	95.4
WP_012440308.1\|630292_630802_+	phage regulatory CII family protein	A0A1S6L008	Salmonella_phage	2.5e-82	91.7
WP_012440309.1\|630809_631010_+	DUF2724 domain-containing protein	E5G6L4	Salmonella_phage	4.5e-27	84.8
WP_012440310.1\|630973_631315_+	DUF5347 domain-containing protein	E5G6L5	Salmonella_phage	3.2e-49	84.1
WP_012440311.1\|631382_631610_+	DUF2732 domain-containing protein	A0A0M3UL87	Salmonella_phage	1.1e-29	96.0
WP_012440312.1\|631609_631906_+	TraR/DksA C4-type zinc finger protein	F1BUS2	Erwinia_phage	1.6e-12	59.7
WP_042958617.1\|631902_632139_+	hypothetical protein	NA	NA	NA	NA
WP_042959250.1\|632174_634550_+	replication endonuclease	A0A1S6L028	Salmonella_phage	0.0e+00	82.3
WP_012440314.1\|634697_634886_+	hypothetical protein	A0A1S6L006	Salmonella_phage	2.5e-24	93.5
WP_012440317.1\|635552_636014_+	hypothetical protein	A0A218M4J4	Erwinia_phage	2.7e-11	32.9
WP_042958620.1\|636007_636307_+	DUF1493 family protein	NA	NA	NA	NA
WP_012440319.1\|636343_637399_-\|portal	phage portal protein	A0A1S6KZW5	Salmonella_phage	3.3e-161	80.2
WP_012440320.1\|637398_639165_-\|terminase	terminase ATPase subunit family protein	A0A1S6KZW3	Salmonella_phage	6.5e-303	84.2
WP_012440321.1\|639309_640173_+\|capsid	GPO family capsid scaffolding protein	A0A1S6KZW9	Salmonella_phage	2.3e-83	60.6
WP_012440322.1\|640216_641386_+\|capsid	phage major capsid protein, P2 family	A0A1S6KZZ3	Salmonella_phage	3.8e-134	68.1
WP_012440323.1\|641389_642031_+\|terminase	phage terminase	E5G6M7	Salmonella_phage	7.3e-79	70.0
WP_042958622.1\|642128_642593_+\|head	head completion/stabilization protein	A0A1S6KZW8	Salmonella_phage	6.2e-80	93.5
WP_012440325.1\|642592_642796_+\|tail	tail protein X	E5G6M9	Salmonella_phage	1.9e-33	98.5
WP_000171565.1\|642799_643015_+	hypothetical protein	E5G6N0	Salmonella_phage	5.9e-33	100.0
WP_012440326.1\|642995_643505_+	lysozyme	A0A1S6KZY9	Salmonella_phage	1.2e-89	94.6
WP_012440327.1\|643514_643883_+	hypothetical protein	NA	NA	NA	NA
WP_012440328.1\|643879_644308_+\|lysis	LysB family phage lysis regulatory protein	A0A1S6KZX8	Salmonella_phage	2.7e-61	91.4
WP_012440329.1\|644403_644835_+\|tail	phage tail protein	A0A1S6KZY0	Salmonella_phage	1.5e-72	95.8
WP_012440330.1\|644827_645274_+	phage virion morphogenesis protein	A0A1S6L001	Salmonella_phage	1.0e-63	87.0
WP_012440331.1\|645342_645921_+\|plate	phage baseplate assembly protein V	E5G6N6	Salmonella_phage	4.7e-101	93.2
WP_012440332.1\|645917_646277_+	GPW/gp25 family protein	A0A1S6KZZ4	Salmonella_phage	2.4e-55	92.4
WP_012440333.1\|646263_647172_+\|plate	baseplate assembly protein	A0A1S6KZY6	Salmonella_phage	5.9e-143	90.4
WP_012440334.1\|647164_647770_+\|tail	phage tail protein I	E5G6N9	Salmonella_phage	1.5e-110	93.5
WP_012440335.1\|647766_649107_+\|tail	phage tail protein	M1TAS6	Escherichia_phage	2.2e-125	49.8
WP_012440336.1\|649106_649703_+\|tail	tail fiber assembly protein	A0A218M4J2	Erwinia_phage	8.4e-45	45.3
WP_012440337.1\|649834_651007_+\|tail	phage tail sheath protein	A0A1S6KZY7	Salmonella_phage	2.1e-209	92.8
WP_012440338.1\|651016_651532_+\|tail	phage major tail tube protein	E5G6P8	Salmonella_phage	3.0e-91	97.7
WP_012440339.1\|651582_651885_+\|tail	phage tail assembly protein	E5G6P9	Salmonella_phage	2.6e-42	93.9
WP_012440340.1\|651899_652019_+\|tail	GpE family phage tail protein	E5G6Q0	Salmonella_phage	2.0e-14	92.3
WP_012440341.1\|652011_654789_+\|tail	phage tail tape measure protein	A0A2H4JGB2	uncultured_Caudovirales_phage	7.2e-123	36.5
WP_012440342.1\|654785_655271_+\|tail	phage tail protein	E5G6Q2	Salmonella_phage	5.3e-74	95.7
WP_012440343.1\|655267_656368_+	phage late control D family protein	E5G6Q3	Salmonella_phage	2.1e-182	90.7
WP_012440344.1\|656417_656636_+	ogr/Delta-like zinc finger family protein	Q53ZE7	Salmonella_virus	7.5e-28	79.2
WP_012440345.1\|656651_657026_-	hypothetical protein	NA	NA	NA	NA
WP_012440346.1\|657392_657989_-	histidine phosphatase family protein	NA	NA	NA	NA
657181:657198	attR	NA	NA	NA	NA
WP_012440347.1\|658543_659938_+	MHS family MFS transporter	NA	NA	NA	NA
WP_012440348.1\|660019_661033_+	LacI family DNA-binding transcriptional regulator	NA	NA	NA	NA
WP_012440349.1\|661053_662040_+	nucleoside hydrolase	NA	NA	NA	NA
WP_042958626.1\|662090_663509_-	PepSY domain-containing protein	NA	NA	NA	NA
WP_012440351.1\|663571_664006_-	DUF2946 domain-containing protein	NA	NA	NA	NA
WP_012440352.1\|664304_665510_+	MFS transporter	NA	NA	NA	NA
WP_012440353.1\|665647_666745_-	GGDEF domain-containing protein	NA	NA	NA	NA
WP_049778741.1\|666990_667227_+	DUF1435 domain-containing protein	NA	NA	NA	NA
WP_012440355.1\|667817_668846_-	16S rRNA (guanine(1207)-N(2))-methyltransferase RsmC	NA	NA	NA	NA
WP_012440356.1\|669021_669441_+	DNA polymerase III subunit psi	NA	NA	NA	NA
WP_012440357.1\|669403_669844_+	ribosomal protein S18-alanine N-acetyltransferase	NA	NA	NA	NA
WP_012440358.1\|669858_670539_+	pyrimidine 5'-nucleotidase	NA	NA	NA	NA
WP_042959253.1\|671530_672031_+	hypothetical protein	NA	NA	NA	NA
WP_042958632.1\|672055_672568_+	type VI secretion system lipoprotein TssJ	NA	NA	NA	NA
WP_012440361.1\|672587_673931_+\|plate	type VI secretion system baseplate subunit TssK	NA	NA	NA	NA
WP_012440362.1\|673948_675190_+	DotU family type VI secretion system protein	NA	NA	NA	NA
WP_012440363.1\|675193_678823_+	type VI secretion system membrane subunit TssM	NA	NA	NA	NA
WP_042958634.1\|678839_679550_+	type VI secretion system-associated protein TagF	NA	NA	NA	NA
WP_012440365.1\|679567_680587_+	type VI secretion system protein TssA	NA	NA	NA	NA
WP_012440366.1\|680649_681186_+	type VI secretion system contractile sheath small subunit	NA	NA	NA	NA
WP_012440367.1\|681189_682692_+	type VI secretion system contractile sheath large subunit	NA	NA	NA	NA
WP_012440368.1\|682688_682964_+	hypothetical protein	NA	NA	NA	NA
WP_012440369.1\|683236_683719_+	type VI secretion system tube protein Hcp	NA	NA	NA	NA
WP_012440370.1\|683798_684278_+	type VI secretion system amidase effector protein Tae4	NA	NA	NA	NA
WP_012440371.1\|684262_684631_+	type VI secretion system amidase immunity protein Tai4	NA	NA	NA	NA
WP_012440372.1\|685172_685580_+	type VI secretion protein	NA	NA	NA	NA
WP_012440373.1\|685890_686430_+	hypothetical protein	NA	NA	NA	NA
WP_012440374.1\|686426_686834_+	hypothetical protein	NA	NA	NA	NA
WP_012440375.1\|686981_688811_+	type VI secretion system-associated FHA domain protein TagH	NA	NA	NA	NA
WP_012440376.1\|688810_689605_+	serine/threonine-protein phosphatase	NA	NA	NA	NA
WP_012440377.1\|689622_690630_+	hypothetical protein	NA	NA	NA	NA
WP_012440378.1\|690639_691461_+	hypothetical protein	NA	NA	NA	NA
WP_012440379.1\|691457_692024_+\|plate	type VI secretion system baseplate subunit TssE	NA	NA	NA	NA
WP_012440380.1\|692041_693916_+\|plate	type VI secretion system baseplate subunit TssF	NA	NA	NA	NA
WP_012440381.1\|693912_694971_+\|plate	type VI secretion system baseplate subunit TssG	NA	NA	NA	NA

DBSCAN-SWA_2

785208 : 794976

Chrysochromulina_ericina_virus(16.67%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012440453.1\|785208_787122_+	molecular chaperone DnaK	A0A0N9QXN8	Chrysochromulina_ericina_virus	2.9e-147	50.9
WP_012440454.1\|787232_788375_+	molecular chaperone DnaJ	E3T4P7	Cafeteria_roenbergensis_virus	3.6e-20	32.6
WP_012440455.1\|788579_788870_+	lipoprotein	A0A2R2X2B2	Escherichia_phage	2.6e-28	67.4
WP_012440456.1\|789075_790236_+	Na+/H+ antiporter NhaA	A0A2H4J5W3	uncultured_Caudovirales_phage	2.3e-75	49.7
WP_012440458.1\|790605_790869_-	30S ribosomal protein S20	NA	NA	NA	NA
WP_012440459.1\|791184_792123_+	bifunctional riboflavin kinase/FAD synthetase	A0A1V0SJE1	Klosneuvirus	2.4e-06	31.7
WP_012440460.1\|792159_794976_+\|tRNA	isoleucine--tRNA ligase	A0A2P1ELB8	Moumouvirus	3.3e-75	26.3

DBSCAN-SWA_3

1508344 : 1515280

Tupanvirus(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012441073.1\|1508344_1509241_+	UTP--glucose-1-phosphate uridylyltransferase GalF	A0A127AW70	Bacillus_phage	7.4e-45	40.6
WP_012441074.1\|1509290_1510304_+	UDP-glucose 4-epimerase GalE	A0A2K9L1R4	Tupanvirus	2.2e-77	45.6
WP_012441075.1\|1510708_1511782_+	dTDP-glucose 4,6-dehydratase	I7HTA3	Enterobacteria_phage	2.7e-102	54.1
WP_012441076.1\|1511783_1512650_+	glucose-1-phosphate thymidylyltransferase RfbA	I7I009	Enterobacteria_phage	3.5e-108	66.7
WP_012441077.1\|1512765_1513701_+	NAD-dependent epimerase/dehydratase family protein	A0A2K9L5H6	Tupanvirus	6.4e-15	26.1
WP_012441078.1\|1513772_1514540_+	ABC transporter permease	NA	NA	NA	NA
WP_012441079.1\|1514539_1515280_+	ABC transporter ATP-binding protein	A0A2H4PQG7	Staphylococcus_phage	1.4e-09	23.2

DBSCAN-SWA_4

2079963 : 2091228

Microcystis_phage(14.29%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012441563.1\|2079963_2081403_-	YdiU family protein	A0A075BSJ0	Microcystis_phage	9.4e-58	36.6
WP_012441564.1\|2081504_2082245_-	EAL domain-containing protein	NA	NA	NA	NA
WP_012441565.1\|2082595_2083054_-	C40 family peptidase	NA	NA	NA	NA
WP_012441566.1\|2083287_2083833_-	glutathione peroxidase	A0A1S7DLQ4	Molluscum_contagiosum_virus	1.7e-12	37.4
WP_004157378.1\|2083979_2084279_-	integration host factor subunit alpha	A0A0H3UZA0	Geobacillus_virus	5.5e-13	40.0
WP_012441567.1\|2084283_2086671_-\|tRNA	phenylalanine--tRNA ligase subunit beta	A0A1L3IZU3	BeAn_58058_virus	4.3e-07	27.1
WP_012441568.1\|2086686_2087670_-\|tRNA	phenylalanine--tRNA ligase subunit alpha	A0A2H4UW22	Bodo_saltans_virus	6.4e-34	37.6
WP_152525475.1\|2087833_2087878_-	pheST operon leader peptide PheM	NA	NA	NA	NA
WP_012441569.1\|2088022_2088379_-	50S ribosomal protein L20	NA	NA	NA	NA
WP_004157374.1\|2088454_2088652_-	50S ribosomal protein L35	NA	NA	NA	NA
WP_071819175.1\|2088744_2089296_-	translation initiation factor IF-3	A0A2L0UZ54	Agrobacterium_phage	6.8e-17	33.7
WP_012441571.1\|2089299_2091228_-\|tRNA	threonine--tRNA ligase	A0A2K9L297	Tupanvirus	5.7e-127	37.2

DBSCAN-SWA_5

2726972 : 2745594

Enterobacteria_phage(28.57%)

tail,tRNA,integrase

attL 2738592:2738605|attR 2743026:2743039

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012442130.1\|2726972_2727329_-	hypothetical protein	G0ZNF1	Cronobacter_phage	2.0e-54	91.5
WP_049778758.1\|2727685_2727874_-	hypothetical protein	Q7M297	Enterobacteria_phage	8.8e-09	45.2
WP_049778759.1\|2728025_2728229_-	DUF4102 domain-containing protein	E5AGD0	Erwinia_phage	9.2e-12	52.3
WP_012442131.1\|2728646_2729021_+	hypothetical protein	NA	NA	NA	NA
WP_042959052.1\|2729086_2729518_+	hypothetical protein	A0A1W6JPI4	Morganella_phage	6.9e-41	62.8
WP_042959053.1\|2729596_2729785_-	hypothetical protein	NA	NA	NA	NA
WP_012442133.1\|2729933_2730524_-	hypothetical protein	NA	NA	NA	NA
WP_012442134.1\|2730661_2731237_-\|tail	tail assembly protein	K7P6V1	Enterobacteria_phage	7.5e-75	74.7
WP_012442135.1\|2731725_2734554_-	DUF927 domain-containing protein	A0A1W6JPG0	Morganella_phage	1.1e-291	56.6
WP_012442136.1\|2734563_2735175_-	hypothetical protein	NA	NA	NA	NA
WP_012442137.1\|2735171_2735381_-	hypothetical protein	NA	NA	NA	NA
WP_157861808.1\|2735377_2735554_-	hypothetical protein	NA	NA	NA	NA
WP_012442138.1\|2735550_2736153_-	ORF6N domain-containing protein	A0A1B5FPC0	Escherichia_phage	1.3e-24	46.3
WP_012442139.1\|2736149_2736329_-	hypothetical protein	NA	NA	NA	NA
WP_012442140.1\|2736321_2737245_-	host cell division inhibitor Icd-like protein	NA	NA	NA	NA
WP_012442141.1\|2737235_2737409_-	DUF4222 domain-containing protein	NA	NA	NA	NA
WP_012442142.1\|2737408_2738245_-	antA/AntB antirepressor family protein	A0A0P0ZAZ7	Stx2-converting_phage	4.8e-22	46.0
WP_012442143.1\|2738259_2738676_-	hypothetical protein	A0A1W6JPH9	Morganella_phage	2.2e-28	56.6
2738592:2738605	attL	NA	NA	NA	NA
WP_012442144.1\|2738675_2738873_-	AlpA family transcriptional regulator	Q7M299	Enterobacteria_phage	5.1e-07	39.7
WP_012442145.1\|2739059_2740067_-	hypothetical protein	NA	NA	NA	NA
WP_012442146.1\|2740197_2741412_-\|integrase	tyrosine-type recombinase/integrase	Q7M297	Enterobacteria_phage	6.1e-127	53.6
WP_012442147.1\|2741836_2742703_+	bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD	A0A249XZQ2	Enterococcus_phage	9.0e-32	36.3
WP_012442148.1\|2742702_2742915_+	ribosome-associated protein YbcJ	NA	NA	NA	NA
WP_012442150.1\|2743109_2744126_+	alcohol dehydrogenase AdhP	A0A2K9L339	Tupanvirus	1.4e-23	26.8
2743026:2743039	attR	NA	NA	NA	NA
WP_012442151.1\|2744205_2745594_-\|tRNA	cysteine--tRNA ligase	M1PG92	Moumouvirus	2.3e-45	34.9

DBSCAN-SWA_6

2807102 : 2814381

Bacillus_virus(33.33%)

protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012442216.1\|2807102_2807375_-	DNA-binding protein HU-beta	A3E2K9	Sodalis_phage	1.0e-21	61.8
WP_012442217.1\|2807586_2809941_-	endopeptidase La	A0A0R6PGP8	Moraxella_phage	2.2e-226	52.9
WP_012442218.1\|2810131_2811406_-\|protease	ATP-dependent protease ATP-binding subunit ClpX	G3M9Z9	Bacillus_virus	6.9e-129	56.2
WP_012442219.1\|2811717_2812314_+\|protease	ATP-dependent Clp protease proteolytic subunit	A0A248SJ97	Salicola_phage	7.1e-28	37.4
WP_012442220.1\|2812385_2813660_-\|protease	ATP-dependent protease ATP-binding subunit ClpX	G3M9Z9	Bacillus_virus	5.8e-128	54.9
WP_012442221.1\|2813757_2814381_-	ATP-dependent Clp endopeptidase proteolytic subunit ClpP	A0A223W000	Agrobacterium_phage	1.9e-63	62.4

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_010694

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection