CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
LS483402	Pseudomonas aeruginosa strain NCTC13718 genome assembly, chromosome: 1	3 crisprs	csa3,cas2,cas1,cas3,cas6e,cas8e,cse2gr11,cas7,cas5,csb3,csb2gr5,csb1gr7,DEDDh,WYL	0	29	5	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: LS483402_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

LS483402_1

16480-18584

Orphan

I-C,I-E,II-B

Consensus_repeat	Method
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	PILER-CR
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CRISPRCasFinder
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CRT

34 spacers

DinG

The CRISPR arrays of LS483402_1

>merge|LS483402|1|16480-18584|PILER-CR,CRISPRCasFinder,CRT
CTTTTCTCCGCGTATGCGGAGGTAGTTCCCGGGTTGATCGATTTGAAAGCTGAACGTGATACTTTTCTCCGCGTATGCGGAGGTAGTTCCCGCCACCGCCACTTCAATCGCTATAGCAACCTCTTTTCTCCGCGTATGCGGAGGTAGTTCACCGATAAGTGGGACAGCACGAAGGGTAACCCGCCTTTTCTCCGCGTATGCGGAGGTAGTTCCCGAATTCTTGATCTCATCGACGGACATTTAACCTTTTCTCCGCGTATGCGGAGGTAGTTCCTTACAGGCCGAGGAGTTATTTTTCATGGCTAACTTTTCTCCGCGTATGCGGAGGTAGTTCCTGGTGATGCTAAGTGGGTTGAGTCGGGCAGTCCTTTTCTCCGCGTATGCGGAGGTAGTTCCAAAAAGGGCAAAGTTGATCAGGTACGTGTGGGCTTTTCTCCGCGTATGCGGAGGTAGTTCCAGGCTTTGAAGGATTCTGTGGCTGGCGCGATTCTTTTCTCCGCGTATGCGGAGGTAGTTCCCAATCGCAACAGCACCTATACCATCGACTTCACTTTTCTCCGCGTATGCGGAGGTAGTTCCTCGCGCCTTCAGCTCTTCTATCTCCGCAAGAACTTTTCTCCGCGTATGCGGAGGTAGTTCCAGAATCCTGGCTCGTGAGCTTATCCTCAAGCTCTTTTCTCCGCGTATGCGGAGGTAGTTCCTCAAGGAGCACCTGAAATGCTAAATCCCTACGCTTTTCTCCGCGTATGCGGAGGTAGTTCCAATCCAAATCAGGGTCGAAAGATGCGAAAGCGCTTTTCTCCGCGTATGCGGAGGTAGTTCCGTTTTCATTTGTACGGTAGGCGGGTACAGATGCTTTTCTCCGCGTATGCGGAGGTAGTTCCAGGATTGGAATCAGATTGCTAATGCGATCCCTGCTTTTCTCCGCGTATGCGGAGGTAGTTCCGGGAGGCCACATCGCGGGCTATGTCTGCGGATCTTTTCTCCGCGTATGCGGAGGTAGTTCCATTAAGCGTTTTGAGGGAAGGTGAAAGCGATACTTTTCTCCGCGTATGCGGAGGTAGTTCCGTGGCGAAAGCGGAGAAGATGTGCGTGTTTTTCTTTTCTCCGCGTATGCGGAGGTAGTTCCGATCACACGATCACCCTTCGCTAGGGAGTTCGCTTTTCTCCGCGTATGCGGAGGTAGTTCCCCACTCCATGAAAACATCCTCCTATCACCAAACTTTTCTCCGCGTATGCGGAGGTAGTTCCCAATCGGCTGGCCTATAGTGTTCAAAACTTCCCTTTTCTCCGCGTATGCGGAGGTAGTTCCATGTCTTTATCCTTATGTAGTGGGTGGGTTTTCTTTTCTCCGCGTATGCGGAGGTAGTTCCAGACTCTGGCACGTCGTACCATGCGAGGACCACTTTTCTCCGCGTATGCGGAGGTAGTTCCGCGCCCAATATCTGCCAAAGCCTCCGATGTGCCTTTTCTCCGCGTATGCGGAGGTAGTTCCGGTGCCAATGGCGGGCTGGTAGCTGTCTACCACTTTTCTCCGCGTATGCGGAGGTAGTTCCGACTGTGGCGAATTCTCGCAGGAAGGAGCTGGCTTTTCTCCGCGTATGCGGAGGTAGTTCCATCAACGGTGAGCTGCGAAATAAGCTCGGCGCCTTTTCTCCGCGTATGCGGAGGTAGTTCTTGATAGTGATTAGCTGGTCAATCAGTGTTTCTCTTTTCTCCGCGTATGCGGAGGCAGTTCCCTTGGACGTGTCCCGATCGTCATGATGATTAACTTTTCTCCGCGTATGCGGAGGTAGTTCCTGTTGAATCTGGCATCGACGAAGACGGAAAGCCTTTTCTCCGCGTATGCGGAGGTAGTTCCCAGCCGATCTCCTACCCACTCTGTGGTGCTTGCTTTTCTCCGCGTATGCGGAGGTAGTTCCCTACAAACTTTTCTGCAAACGCCACCTCCTCACTTTTCTCCGCGTATGCGGAGGTAGTTCCATCATTGCCCAGCTCACGAGCACGCTCGGCGGCTTTTCTCCGCGCATGCGGAGGTAGTTCCGATACGCTTAGACATAACACCGGCGGCATCAGCTTTTCTCCGCGTATGCGGAAAGTAAGCC

>LS483402|1|1|16480-18523|PILER-CR
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGGGTTGATCGATTTGAAAGCTGAACGTGATA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGCCACCGCCACTTCAATCGCTATAGCAACCT
CTTTTCTCCGCGTATGCGGAGGTAGTTCA	CCGATAAGTGGGACAGCACGAAGGGTAACCCGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGAATTCTTGATCTCATCGACGGACATTTAAC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TTACAGGCCGAGGAGTTATTTTTCATGGCTAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TGGTGATGCTAAGTGGGTTGAGTCGGGCAGTC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AAAAAGGGCAAAGTTGATCAGGTACGTGTGGG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGGCTTTGAAGGATTCTGTGGCTGGCGCGATT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAATCGCAACAGCACCTATACCATCGACTTCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TCGCGCCTTCAGCTCTTCTATCTCCGCAAGAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGAATCCTGGCTCGTGAGCTTATCCTCAAGCT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TCAAGGAGCACCTGAAATGCTAAATCCCTACG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AATCCAAATCAGGGTCGAAAGATGCGAAAGCG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GTTTTCATTTGTACGGTAGGCGGGTACAGATG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGGATTGGAATCAGATTGCTAATGCGATCCCTG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GGGAGGCCACATCGCGGGCTATGTCTGCGGAT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATTAAGCGTTTTGAGGGAAGGTGAAAGCGATA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GTGGCGAAAGCGGAGAAGATGTGCGTGTTTTT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GATCACACGATCACCCTTCGCTAGGGAGTTCG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CCACTCCATGAAAACATCCTCCTATCACCAAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAATCGGCTGGCCTATAGTGTTCAAAACTTCC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATGTCTTTATCCTTATGTAGTGGGTGGGTTTT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGACTCTGGCACGTCGTACCATGCGAGGACCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GCGCCCAATATCTGCCAAAGCCTCCGATGTGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GGTGCCAATGGCGGGCTGGTAGCTGTCTACCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GACTGTGGCGAATTCTCGCAGGAAGGAGCTGG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATCAACGGTGAGCTGCGAAATAAGCTCGGCGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCT	TGATAGTGATTAGCTGGTCAATCAGTGTTTCT
CTTTTCTCCGCGTATGCGGAGGCAGTTCC	CTTGGACGTGTCCCGATCGTCATGATGATTAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TGTTGAATCTGGCATCGACGAAGACGGAAAGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAGCCGATCTCCTACCCACTCTGTGGTGCTTG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CTACAAACTTTTCTGCAAACGCCACCTCCTCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATCATTGCCCAGCTCACGAGCACGCTCGGCGG
CTTTTCTCCGCGCATGCGGAGGTAGTTCC

>LS483402|1|1|16480-18584|CRISPRCasFinder
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGGGTTGATCGATTTGAAAGCTGAACGTGATA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGCCACCGCCACTTCAATCGCTATAGCAACCT
CTTTTCTCCGCGTATGCGGAGGTAGTTCA	CCGATAAGTGGGACAGCACGAAGGGTAACCCGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGAATTCTTGATCTCATCGACGGACATTTAAC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TTACAGGCCGAGGAGTTATTTTTCATGGCTAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TGGTGATGCTAAGTGGGTTGAGTCGGGCAGTC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AAAAAGGGCAAAGTTGATCAGGTACGTGTGGG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGGCTTTGAAGGATTCTGTGGCTGGCGCGATT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAATCGCAACAGCACCTATACCATCGACTTCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TCGCGCCTTCAGCTCTTCTATCTCCGCAAGAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGAATCCTGGCTCGTGAGCTTATCCTCAAGCT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TCAAGGAGCACCTGAAATGCTAAATCCCTACG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AATCCAAATCAGGGTCGAAAGATGCGAAAGCG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GTTTTCATTTGTACGGTAGGCGGGTACAGATG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGGATTGGAATCAGATTGCTAATGCGATCCCTG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GGGAGGCCACATCGCGGGCTATGTCTGCGGAT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATTAAGCGTTTTGAGGGAAGGTGAAAGCGATA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GTGGCGAAAGCGGAGAAGATGTGCGTGTTTTT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GATCACACGATCACCCTTCGCTAGGGAGTTCG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CCACTCCATGAAAACATCCTCCTATCACCAAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAATCGGCTGGCCTATAGTGTTCAAAACTTCC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATGTCTTTATCCTTATGTAGTGGGTGGGTTTT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGACTCTGGCACGTCGTACCATGCGAGGACCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GCGCCCAATATCTGCCAAAGCCTCCGATGTGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GGTGCCAATGGCGGGCTGGTAGCTGTCTACCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GACTGTGGCGAATTCTCGCAGGAAGGAGCTGG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATCAACGGTGAGCTGCGAAATAAGCTCGGCGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCT	TGATAGTGATTAGCTGGTCAATCAGTGTTTCT
CTTTTCTCCGCGTATGCGGAGGCAGTTCC	CTTGGACGTGTCCCGATCGTCATGATGATTAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TGTTGAATCTGGCATCGACGAAGACGGAAAGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAGCCGATCTCCTACCCACTCTGTGGTGCTTG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CTACAAACTTTTCTGCAAACGCCACCTCCTCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATCATTGCCCAGCTCACGAGCACGCTCGGCGG
CTTTTCTCCGCGCATGCGGAGGTAGTTCC	GATACGCTTAGACATAACACCGGCGGCATCAG
CTTTTCTCCGCGTATGCGGAAAGTAAGCC

>LS483402|1|1|16480-18584|CRT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGGGTTGATCGATTTGAAAGCTGAACGTGATA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGCCACCGCCACTTCAATCGCTATAGCAACCT
CTTTTCTCCGCGTATGCGGAGGTAGTTCA	CCGATAAGTGGGACAGCACGAAGGGTAACCCGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CGAATTCTTGATCTCATCGACGGACATTTAAC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TTACAGGCCGAGGAGTTATTTTTCATGGCTAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TGGTGATGCTAAGTGGGTTGAGTCGGGCAGTC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AAAAAGGGCAAAGTTGATCAGGTACGTGTGGG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGGCTTTGAAGGATTCTGTGGCTGGCGCGATT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAATCGCAACAGCACCTATACCATCGACTTCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TCGCGCCTTCAGCTCTTCTATCTCCGCAAGAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGAATCCTGGCTCGTGAGCTTATCCTCAAGCT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TCAAGGAGCACCTGAAATGCTAAATCCCTACG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AATCCAAATCAGGGTCGAAAGATGCGAAAGCG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GTTTTCATTTGTACGGTAGGCGGGTACAGATG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGGATTGGAATCAGATTGCTAATGCGATCCCTG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GGGAGGCCACATCGCGGGCTATGTCTGCGGAT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATTAAGCGTTTTGAGGGAAGGTGAAAGCGATA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GTGGCGAAAGCGGAGAAGATGTGCGTGTTTTT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GATCACACGATCACCCTTCGCTAGGGAGTTCG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CCACTCCATGAAAACATCCTCCTATCACCAAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAATCGGCTGGCCTATAGTGTTCAAAACTTCC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATGTCTTTATCCTTATGTAGTGGGTGGGTTTT
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	AGACTCTGGCACGTCGTACCATGCGAGGACCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GCGCCCAATATCTGCCAAAGCCTCCGATGTGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GGTGCCAATGGCGGGCTGGTAGCTGTCTACCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	GACTGTGGCGAATTCTCGCAGGAAGGAGCTGG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATCAACGGTGAGCTGCGAAATAAGCTCGGCGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCT	TGATAGTGATTAGCTGGTCAATCAGTGTTTCT
CTTTTCTCCGCGTATGCGGAGGCAGTTCC	CTTGGACGTGTCCCGATCGTCATGATGATTAA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	TGTTGAATCTGGCATCGACGAAGACGGAAAGC
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CAGCCGATCTCCTACCCACTCTGTGGTGCTTG
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	CTACAAACTTTTCTGCAAACGCCACCTCCTCA
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	ATCATTGCCCAGCTCACGAGCACGCTCGGCGG
CTTTTCTCCGCGCATGCGGAGGTAGTTCC	GATACGCTTAGACATAACACCGGCGGCATCAG
CTTTTCTCCGCGTATGCGGAAAGTAAGCC

Protein	Signature genes	Signature genes Name	Protein_function
LS483402.1\|SQG55651.1\|7144_7912_-\|Ribonuclease-Z	unknown	unknown	gnl\|CDD\|293802
LS483402.1\|SQG55678.1\|28204_29035_+\|NAD-synthetase	unknown	unknown	gnl\|CDD\|234831
LS483402.1\|SQG55675.1\|26572_27010_-\|ribonucleotide-reductase-stimulatory-protein	unknown	unknown	gnl\|CDD\|179603
LS483402.1\|SQG55671.1\|22284_23271_-\|ribonucleoside-diphosphate-reductase-subunit-beta	unknown	unknown	gnl\|CDD\|275027
LS483402.1\|SQG55652.1\|7984_8878_-\|glutamate-racemase	unknown	unknown	gnl\|CDD\|234851
LS483402.1\|SQG55650.1\|6371_7106_-\|ribonuclease-PH	unknown	unknown	gnl\|CDD\|178914
LS483402.1\|SQG55656.1\|10483_10864_-\|ATP-dependent-Clp-protease-adaptor-protein-ClpS	unknown	unknown	gnl\|CDD\|178809
LS483402.1\|SQG55660.1\|14396_14891_+\|N-acetyltransferase-GCN5	unknown	unknown	gnl\|CDD\|379112
LS483402.1\|SQG55672.1\|23711_24197_+\|Ferritin	unknown	unknown	gnl\|CDD\|153113
LS483402.1\|SQG55657.1\|10988_12344_+\|nicotinate-phosphoribosyltransferase	unknown	unknown	gnl\|CDD\|236426
LS483402.1\|SQG55668.1\|19608_19953_+\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG55655.1\|9848_10385_-\|Domain-of-uncharacterised-function-(DUF2017)	unknown	unknown	gnl\|CDD\|378185
LS483402.1\|SQG55669.1\|20095_21817_-\|cytochrome-c-oxidase-subunit-I	unknown	unknown	gnl\|CDD\|238832
LS483402.1\|SQG55661.1\|14893_16171_-\|phosphoserine-phosphatase	unknown	unknown	gnl\|CDD\|319803
LS483402.1\|SQG55673.1\|24263_26423_-\|ribonucleotide-diphosphate-reductase-subunit-alpha	unknown	unknown	gnl\|CDD\|236179
LS483402.1\|SQG55667.1\|18739_19042_+\|Uncharacterised-protein	unknown	unknown	gnl\|CDD\|377122
LS483402.1\|SQG55677.1\|27847_27970_-\|50S-ribosomal-protein-L36	unknown	unknown	gnl\|CDD\|179138
LS483402.1\|SQG55659.1\|12383_14375_+\|putative-helicase	DinG	COG1199_DinG_CAS-IV-A	gnl\|CDD\|224120
LS483402.1\|SQG55654.1\|8944_9763_-\|peptidase,-S54-(rhomboid)-family	unknown	unknown	gnl\|CDD\|366759
LS483402.1\|SQG55676.1\|27137_27371_-\|glutaredoxin	unknown	unknown	gnl\|CDD\|131249

Protein	Function_ID	Function_description	E-value
LS483402.1\|SQG55651.1\|7144_7912_-\|Ribonuclease-Z	gnl\|CDD\|293802	cd07716, RNaseZ_short-form-like_MBL-fold, uncharacterized bacterial subgroup of Ribonuclease Z, short form; MBL-fold metallo-hydrolase domain. The tRNA maturase RNase Z (also known as tRNase Z or 3' tRNase) catalyzes the endonucleolytic removal of the 3' extension of the majority of tRNA precursors. Two forms of RNase Z exist in eukaryotes, one long (ELAC2) and one short form (ELAC1), the former may have resulted from a duplication of the shorter enzyme. Only the short form exists in bacteria. Members of this bacterial subgroup belong to the MBL-fold metallo-hydrolase superfamily which is comprised mainly of hydrolytic enzymes which carry out a variety of biological functions.	3.40293e-74
LS483402.1\|SQG55678.1\|28204_29035_+\|NAD-synthetase	gnl\|CDD\|234831	PRK00768, nadE, ammonia-dependent NAD(+) synthetase.	1.04202e-169
LS483402.1\|SQG55675.1\|26572_27010_-\|ribonucleotide-reductase-stimulatory-protein	gnl\|CDD\|179603	PRK03600, nrdI, class Ib ribonucleoside-diphosphate reductase assembly flavoprotein NrdI.	1.61162e-75
LS483402.1\|SQG55671.1\|22284_23271_-\|ribonucleoside-diphosphate-reductase-subunit-beta	gnl\|CDD\|275027	TIGR04171, ribonucleotide-diphosphate_reductase_subunit_beta, ribonucleoside-diphosphate reductase, class 1b, beta subunit. Members of this family are NrdF, the beta subunit of class 1b ribonucleotide reductase. This form uses a dimanganese moiety associated with a tyrosine radical to reduce the cellular requirement for iron. [Purines, pyrimidines, nucleosides, and nucleotides, 2'-Deoxyribonucleotide metabolism].	0
LS483402.1\|SQG55652.1\|7984_8878_-\|glutamate-racemase	gnl\|CDD\|234851	PRK00865, PRK00865, glutamate racemase; Provisional.	6.48439e-133
LS483402.1\|SQG55650.1\|6371_7106_-\|ribonuclease-PH	gnl\|CDD\|178914	PRK00173, rph, ribonuclease PH; Reviewed.	2.23999e-164
LS483402.1\|SQG55656.1\|10483_10864_-\|ATP-dependent-Clp-protease-adaptor-protein-ClpS	gnl\|CDD\|178809	PRK00033, clpS, ATP-dependent Clp protease adaptor protein ClpS; Reviewed.	1.15238e-35
LS483402.1\|SQG55660.1\|14396_14891_+\|N-acetyltransferase-GCN5	gnl\|CDD\|379112	pfam13302, Acetyltransf_3, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	2.68164e-28
LS483402.1\|SQG55657.1\|10988_12344_+\|nicotinate-phosphoribosyltransferase	gnl\|CDD\|236426	PRK09243, PRK09243, nicotinate phosphoribosyltransferase; Validated.	0
LS483402.1\|SQG55672.1\|23711_24197_+\|Ferritin	gnl\|CDD\|153113	cd01055, Nonheme_Ferritin, nonheme-containing ferritins. Nonheme Ferritin domain, found in archaea and bacteria, is a member of a broad superfamily of ferritin-like diiron-carboxylate proteins. The ferritin protein shell is composed of 24 protein subunits arranged in 432 symmetry. Each protein subunit, a four-helix bundle with a fifth short terminal helix, contains a dinuclear ferroxidase center (H type). Unique to this group of proteins is a third metal site in the ferroxidase center. Iron storage involves the uptake of iron (II) at the protein shell, its oxidation by molecular oxygen at the ferroxidase centers, and the movement of iron (III) into the cavity for deposition as ferrihydrite.	9.84725e-59
LS483402.1\|SQG55655.1\|9848_10385_-\|Domain-of-uncharacterised-function-(DUF2017)	gnl\|CDD\|378185	pfam09438, DUF2017, Domain of unknown function (DUF2017). This is an alpha-helical domain found in gene neighborhoods that contain genes encoding ubiquitin, cysteine synthases and JAB peptidases.	2.73402e-73
LS483402.1\|SQG55669.1\|20095_21817_-\|cytochrome-c-oxidase-subunit-I	gnl\|CDD\|238832	cd01662, Ubiquinol_Oxidase_I, Ubiquinol oxidase subunit I. Ubiquinol oxidase, the terminal oxidase in the respiratory chains of aerobic bacteria, is a multi-chain transmembrane protein located in the cell membrane. It catalyzes the reduction of O2 and simultaneously pumps protons across the membrane. The number of subunits in ubiquinol oxidase varies from two to five. Subunit I contains a heme-copper binuclear center (the active site where O2 is reduced to water) formed by a high-spin heme and a copper ion. It also contains a low-spin heme, believed to participate in the transfer of electrons from ubiquinol to the binuclear center. For every reduction of an O2 molecule, eight protons are taken from the inside aqueous compartment and four electrons are taken from ubiquinol on the opposite side of the membrane. The four electrons and four of the protons are used in the reduction of O2; the four remaining protons are pumped across the membrane. This charge separation of four charges contributes to the electrochemical gradient used for ATP synthesis. Two proton channels, the D-pathway and K-pathway, leading to the binuclear center have been identified in subunit I. It is generally believed that the channels contain water molecules that act as 'proton wires' to transfer the protons. A well-defined pathway for the transfer of pumped protons beyond the binuclear center has not been identified. Electrons are believed to be transferred directly from ubiquinol (the electron donor) to the low-spin heme, and directly from the low-spin heme to the binuclear center.	0
LS483402.1\|SQG55661.1\|14893_16171_-\|phosphoserine-phosphatase	gnl\|CDD\|319803	cd07500, HAD_PSP, phosphoserine phosphatase (PSP), similar to Methanococcus Jannaschii PSP and Saccharomyces cerevisiae SER2p. This family includes Methanococcus jannaschii PSP, and Saccharomyces cerevisiae phosphoserine phosphatase SER2p, EC 3.1.3.3, which participates in a pathway whereby serine and glycine are synthesized from the glycolytic intermediate 3-phosphoglycerate; phosphoserine phosphatase catalyzes the hydrolysis of phospho-L-serine to L-serine and inorganic phosphate, the third reaction in this pathway. This family belongs to the haloacid dehalogenase-like (HAD) hydrolases, a large superfamily of diverse enzymes that catalyze carbon or phosphoryl group transfer reactions on a range of substrates, using an active site aspartate in nucleophilic catalysis. Members of this superfamily include 2-L-haloalkanoic acid dehalogenase, azetidine hydrolase, phosphonoacetaldehyde hydrolase, phosphoserine phosphatase, phosphomannomutase, P-type ATPases and many others. HAD hydrolases are found in all three kingdoms of life, and most genomes are predicted to contain multiple HAD-like proteins. Members possess a highly conserved alpha/beta core domain, and many also possess a small cap domain, the fold and function of which is variable. HAD hydrolases are sometimes referred to as belonging to the DDDD superfamily of phosphohydrolases.	2.19553e-94
LS483402.1\|SQG55673.1\|24263_26423_-\|ribonucleotide-diphosphate-reductase-subunit-alpha	gnl\|CDD\|236179	PRK08188, PRK08188, ribonucleotide-diphosphate reductase subunit alpha; Validated.	0
LS483402.1\|SQG55667.1\|18739_19042_+\|Uncharacterised-protein	gnl\|CDD\|377122	pfam03747, ADP_ribosyl_GH, ADP-ribosylglycohydrolase. This family includes enzymes that ADP-ribosylations, for example ADP-ribosylarginine hydrolase EC:3.2.2.19 cleaves ADP-ribose-L-arginine. The family also includes dinitrogenase reductase activating glycohydrolase. Most surprisingly the family also includes jellyfish crystallins, these proteins appear to have lost the presumed active site residues.	0.00172344
LS483402.1\|SQG55677.1\|27847_27970_-\|50S-ribosomal-protein-L36	gnl\|CDD\|179138	PRK00831, rpmJ, 50S ribosomal protein L36; Validated.	1.69298e-09
LS483402.1\|SQG55659.1\|12383_14375_+\|putative-helicase	gnl\|CDD\|224120	COG1199, DinG, Rad3-related DNA helicases [Transcription / DNA replication, recombination, and repair].	1.04795e-153
LS483402.1\|SQG55654.1\|8944_9763_-\|peptidase,-S54-(rhomboid)-family	gnl\|CDD\|366759	pfam01694, Rhomboid, Rhomboid family. This family contains integral membrane proteins that are related to Drosophila rhomboid protein. Members of this family are found in bacteria and eukaryotes. Rhomboid promotes the cleavage of the membrane-anchored TGF-alpha-like growth factor Spitz, allowing it to activate the Drosophila EGF receptor. Analysis has shown that Rhomboid-1 is an intramembrane serine protease (EC:3.4.21.105). Parasite-encoded rhomboid enzymes are also important for invasion of host cells by Toxoplasma and the malaria parasite.	4.22842e-23
LS483402.1\|SQG55676.1\|27137_27371_-\|glutaredoxin	gnl\|CDD\|131249	TIGR02194, Glutaredoxin-like_protein_NrdH, Glutaredoxin-like protein NrdH. NrdH-redoxin is a representative of a class of small redox proteins that contain a conserved CXXC motif and are characterized by a glutaredoxin-like amino acid sequence and thioredoxin-like activity profile. Unlike other the glutaredoxins to which it is most closely related, NrdH aparrently does not interact with glutathione/glutathione reductase, but rather with thioredoxin reductase to catalyze the reduction of ribonucleotide reductase.	1.51252e-32

>LS483402.1|SQG55661.1|14893_16171_-|phosphoserine-phosphatase
MIELDQPQVTVSLRPELTPAVITISGQDRQGVSAAAFRVLAANGVQILDVEQSQFRGFLGLAVFAGVEAAGVETLEIGLKETLKTYGQSVKIELQEVAQSSRPRSTHEVVILGDPVEAHDLSRIAQTLANFDANIDTIRGISDYPVTGLELKITVANRELGAAMPLRKALAELTTELGVDIAIERAGLLRRSKRLICFDCDSTLITGEVIEMLAAHAGREKEVAEVTERAMRGELDFEESLRERVKALAGLDASVIGEVADSIELTPGARTTIRTLKRLGYKTAVVSGGFIQVLEGLAEDLGLDYVRANTLEIVDGKLTGRVIGKVVDRAAKAEFLEEFARESGIEMHQTVAVGDGANDIDMISAAGLGIAFNAKPALREIADTSVNSPFLDEVVHMLGITRADIDAADDSDGKIRRVPLPQQKN
>LS483402.1|SQG55660.1|14396_14891_+|N-acetyltransferase-GCN5
MAHVPTLSNESIRLRPLVLSDAHDLTATCVDPLTQKYTTIPAGYTLANAEEFITTEHDNLRWVITNRTSDRFCGQIELRPLAGEHNAMDVGYMTAPWSRGQGLMTSALLLAVDYAFSLGIRRIELRTDPQNKASQRVAEKAGFLYQGLHNDFTVYSLLTDDYRS
>LS483402.1|SQG55659.1|12383_14375_+|putative-helicase
MGAASTLCPMSDSPLALSTDELLAAAVAALGGSRRNGQVSMANAVTKALESERHLAVQAGTGTGKSLAYLVPALRHAQATDSTIIVSTATIALQRQLVERDLPRLADALEPHMSRRPTFAIMKGRANYVCMNKIAAAEEPEDALIDEEDLSWLGKHVARIYEWANETEVGDRDSLDPGVPDLAWRQVSVSAQECIGASRCPHGEDCFAEIARKKAHDVDVIVTNHALLAIDALSDVNVLPEHEVVIVDEAHELDGRITAVATNEIGVTALTMSSRRAGKLGAGDKDQKLIDISKEWEDAMLAVEPGRLTSLPESLKQQTIALRDAIWSLREHVSRVPEGEAANDPERHAERMSLSNHLGDQHDSVVRILSVFEEEDAASQEDVVWVLHDDRRGVMIKVAPLSIAGLLHARLFSENTVVLASATLNIGGNFNAMAASWGLPKGSWDSLDAGTPFDPAKSGILYTPNSLPDPGRDGLSPEVIDEIYDLIMAAGGRTLGLFSSRRAAQQATEAMRTRLPFDVLCQGDDTTGALVEKFSKQENTCLFGTLSLWQGVDVPGKACSLVIIDRIPFPRPDDPLLQARKDAADAEGRNGFMEVAATHAALLIAQGAGRLLRSVTDRGVVAILDRRIVTKRYGAFFIKSLPAFWRTNDPQVVRGALARLVAK
>LS483402.1|SQG55657.1|10988_12344_+|nicotinate-phosphoribosyltransferase
MTCASALIVFKAKLVCVTEFESTALLTDMYELTMLQSALADGTAYRNCTFEVFSRRLPNERRYGVVAGTARVLEAIKRYRFTEKQLASLTFLDATTIDFLRSYEFKGQIDGYREGELYFPSSPILTIRGTFAECVILETLILSIMNADSAVASAAARMVTAADGRPIFEMGSRRTHEYAAVTAARAAYLAGFVGTSNLEAVYRYGIPGSGTAAHAWTLLHVNDDGTPNEPAAFQSQINVLGVGTTLLVDTYDIAKGVKTAIEIAGPQLGAVRIDSGDLGVMTRKVRQELDSLGAHNTGIVVSSDLDEYAIAGLRGNPVDAFGVGTSVVTGSGAPTAGMVYKLVEVDGHPVAKRSRGKAMVGGTKRAVRTHRATGTAVEEIVFPYDHETPQIGQLNSYELTIPLMRNGIVVDNLPTLEESRAYLAEQLITLPWEGLALSKDEPVLSTRFIGF
>LS483402.1|SQG55656.1|10483_10864_-|ATP-dependent-Clp-protease-adaptor-protein-ClpS
MQVNQEDVTHSLNELPSVVLAPTMDVVVSSPMATPELDEDLSVDVASSENLPWMCIVWDDPVNLMSYVTYVFQTILGYSKRRAIELMMQVHTEGKAVVSSGERDKVEGDVKKLHTAGLWATMQQGG
>LS483402.1|SQG55655.1|9848_10385_-|Domain-of-uncharacterised-function-(DUF2017)
MQPWKKKKGLMRGAHFVCVFEPMEREVLGNLASTVSEALIHRAQTAPKDELAELTGMPSGHKEAPTDPALARLLPDFEKEGDEEFEGDNSLLRCLHETDITRAKVEHLQVLGQSLGPDGGVHVDITEPEAHAWVAALNDIRLYVASGEVFGEEAEQDRDNLVEWLAYNQESLLNAMMG
>LS483402.1|SQG55654.1|8944_9763_-|peptidase,-S54-(rhomboid)-family
MELRDFFTRLCFIMTNRFNPYAQSDRNTYGGVSTSGGYLPHEYGAQYLPTPGYSADRVTQRGVNTSSWRSMGRKRLVDATVLALGYVVIIWAVHIVNTVFFGGTLAQGLGVHPLDGASIWHIFTSPLVHGNYMHLSANTLPGLIFVFLIGLSGRRAFWEVTMIAAVVGGMGTWIFGGIGTTHIGASGLIYGWLAYLVVRGIFNRSFSQVLLGMVLAFIYGGLIWGVLPGDVGVSWQAHLFGAIGGLIAGATITSDDPPALKARREQRALERS
>LS483402.1|SQG55652.1|7984_8878_-|glutamate-racemase
MDYVIQDHKSDSLKTEMPGVEPSIVYEGTIDASSPIGIFDSGVGGLTVARAIMEQLPQESVIYIGDTAHSPYGPKPIAQVRELSMRIGDELVARGCKMIVIACNTATSAALRDLRERYSIPVVGVILPAVRRAVATTRNGKIGVLGTQGTIASGAYQELFAASPGVDVYAQACPSFVSFVERGITSGRQILGVAQGYTEGLQAAGVDTLVLGCTHYPLLTGVIQLAVGDNVTLISSSEECVKDVLKTLSCNDMLADAATDKQPIRSFESTGDPALFEQLAMRFLGPHVTHVEKLREV
>LS483402.1|SQG55651.1|7144_7912_-|Ribonuclease-Z
MKLIILGSSGSLGAPDNAASGYLIQMDNAPSILMDMGPGVLAQLERVQNPSDAHVVFSHLHADHCVDFPSLLVWRRYHPTAAAKGRNLCFGPTDTPIRMGRLSADSVDNIDDMSDTFAFTPWENAQEELVGAVSITPYSVIHPIETFALRVEHKRSGKIIAYSGDSSYTENLIECARNADVFLCEATWGETSEGKAPNMHMSGAEAGRIARLAGVKRLVLVHIPPWGNAEAALEKARSEYDGPIDISYQGMEINI
>LS483402.1|SQG55650.1|6371_7106_-|ribonuclease-PH
MTTSNFKRADGRAVDQMRTVKITRGFTTNPAGSVLVEFGNTRVMCTASAEIGVPRFKRDSGEGWLTAEYAMLPAATLDRNPRESMRGKVKGRTHEISRLIGRSLRAAVDLSELGENTINIDCDVLQADGGTRTASITGAYVALADAITHLQKQGVVPGNPLKDPVAAVSVGVIDGTVCLDLPYEEDSRADVDMNVIMQSGRFVEIQGTGEHNTFDRDELARILDFAEKGCAELVEVQKAVLGIA
>LS483402.1|SQG55667.1|18739_19042_+|Uncharacterised-protein
MNTYQKIKEKTGGKIYLGVGLQPGNQDEIAIEACYIEALIDYGYLDVELKKEFLKLWLTDDMYDDLSDLDSIELKTYRNLLKYAGMQPRVDTSVFRPEPA
>LS483402.1|SQG55668.1|19608_19953_+|Uncharacterised-protein
MHLQTTVTRVLITTTIALSFALASTSTLAHAETKSVPIACQELQADVEAWTKQLKEAESSHDQLSKNGHSKDAIKRYLERSQQYFQECVSSPPKHLHFELSSALPMFMSNLSSS
>LS483402.1|SQG55669.1|20095_21817_-|cytochrome-c-oxidase-subunit-I
MTAVAPRLENYSEPTRPAPTGGARKGTLAWKMLTTTDHKQLGIMYIIMSFVFFFLGGLMALLIRAELFSPGLQYLSNEQFNQLFTMHGTVMLLLFGTPIVWGFANYILPLQIGAPDVAFPRLNAFGFWVTMIGAAAMLSGFLTPGGAADFGWTMYLPLADSIHSPGIGSDMWIVGVGATGVGTISSAINMITTILCMRAPGMTMFRMPIFCWNIFVASVLVLMIFPLLTAAALGVLYDRKLGGHLFDPGNGGAIMWQHLFWFFGHPEVYVLALPFFGIVSEIIPVFARKPMFGYIGLVFATLSIGSLSMAVWAHHMFVTGAILLPFFSFMTFLISVPTGVKFFNWLGTMWKGHVSWETPMTWTMGFLVTFLFGGLTGIMLASPPLDFHISDTYFVVAHFHYTLFGTVVFASFAGVYFWFPKMTGRMLDERLGKIHFWITFVGFHGTFLVQHWLGNEGMPRRYADYLDSDGFTTLNQISTIFSFLLGMSVLPFIWNVIKSWRYGEVVTVDDPWGYGNSLEWATSCPPPRHNFTSLPRIRSERPAFELHYPHMVERMRREAHVGHHAEPVTKKTS
>LS483402.1|SQG55671.1|22284_23271_-|ribonucleoside-diphosphate-reductase-subunit-beta
MESYDSYLESHKKPVSAINWNSIPDEKDLEVWDRLTGNFWLPEKVPVSNDLKSWGTLNDLEKTTTMRVFTGLTMLDTIQGTVGAVSMIPDAITPHEEAVYTNIAFMESVHAKSYSNIFMTLASTKEINEAFRWSEENENLQKKAKIVLSYYEGADPLKRKVASTLLESFLFYSGFYLPMYWSSHAKLTNTADIIRLIIRDEAVHGYYIGYKYQQAVRQQTPERQAELKEYTFDLLYDLYDNEIQYTEDLYDDLGWTEDVKRFLRYNANKALNNLGYEGLFPADECKVSPAILSALSPNADENHDFFSGSGSSYVIGKAENTTDDDWDF
>LS483402.1|SQG55672.1|23711_24197_+|Ferritin
MSINEKLAAALNNQITAELEASMVYLQLSYILDDLSLTGMRNWMQAQHKEELDHAAQFSKHLLDRDYRPQIGDIAPPKLDANSAIEAFEASLAHEQKVTAMIRELAEIADSVKDYDSRPLIDRFLEEQIEEEATVKEILDRLRIADTGSGILRIDAELAAR
>LS483402.1|SQG55673.1|24263_26423_-|ribonucleotide-diphosphate-reductase-subunit-alpha
MSQSLGKHVAEPVSRTEQLDYHALNALLNLYNADGKIQFDKDREAANQFFLQHVNQNTVFFHDLEEKIEYLVENNYYEPEIIQQYEFAFIKDLFKQAYAHKFRFKSFLGAYKYYTSYTLKTFDGRRYLERFEDRVCMVALTLADGDQDLARNLVDEIMTGRFQPATPTFLNSGKAQRGEPVSCFLLRIEDNMESIGRSINSALQLSKRGGGVALLLSNLREAGAPIKKIENQSSGVIPVMKLLEDSFSYANQLGARQGAGAVYLNAHHPDILNFLDTKRENADEKIRIKTLSLGVVIPDITFELAKRNDDMYLFSPYDVERVYGKAFADISVSEHYAEMVEDPRIRKSKINAREFFQTIAEIQFESGYPYIMFEDTVNKANPIEGRVNMSNLCSEILQVNTPSLFNDDLTYEEVGEDISCNLGSLNIAMTMDSPDFAKTIETAIRGLTAVSEQTAINSVPSIRKGNDAAHAIGLGQMNLHGYLGREHIYYGSEEGLDFTNAYFAAVLYQCLVASNKLARERGRTFAGFETSKYATGEYFDDFDPADFAPKTEKVAKIFADSSIYTPTVADWADLKDAVAAHGLYNRYLQAVPPTGSISYINHSTSSIHPIASKIEIRKEGKIGRVYYPAPHMDNENLDYFADAYEIGFEKVIDTYAVATKYVDQGLSLTLFFKDSATTRDINRAQIYAWRKGIKTLYYIRLRQVALMGTEVEGCVSCML
>LS483402.1|SQG55675.1|26572_27010_-|ribonucleotide-reductase-stimulatory-protein
MLVVYFSSATENTKRFVHKLGFPAKRIPLHKSSPELVVDEPYVLVCPTYGGGASISGGNTRPVPAQVIRFLNNEHNRGLLRAVIAGGNSNFGLDFGKAGDMIAAKCQVPYVYRFELLGTDEDVRLVRDGLLSNAAALGLLPEPVA
>LS483402.1|SQG55676.1|27137_27371_-|glutaredoxin
MSITVYTKPACVQCNATKKALDRAGLDYTLVDISIDDEARDYVMALGYLQAPVVEVNGEHWSGFRPERISSLVAQVA
>LS483402.1|SQG55677.1|27847_27970_-|50S-ribosomal-protein-L36
MKVRKSLRSLKNKPGAQVVRRRGKVYVINKKDPRFKARQG
>LS483402.1|SQG55678.1|28204_29035_+|NAD-synthetase
MDTLRSTIKHRLRTQSIINPSEEIAKRVDFLAHYLAASGAKGFALGISGGQDSTLAGRLAQLAVEKLRKEGHPAEFWAIRLPYGVQADEADAQTALAFIQPDHSVTINIKPATDACAADVAQALGLKELGDFNKGNVKARQRMIAQYALAGEKGLLVIGTDHAAENVTGFFTKFGDGAADILPLAGLSKRQGAQLLQALNAPDSTWLKVPTADLEEDRPALPDEAALGVTYSEIDTYIEGTEAVSKEATARIEHLWKVSEHKRHLPVEPGDTWWRR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: LS483402_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

LS483402_2

585781-587275

TypeI-E

I-C,I-E,II-B

Consensus_repeat	Method
CTTTTCTCCGCGTATGCGGAGGTAGTTCC	PILER-CR
GGAACTACCTCCGCATACGCGGAGAAAAG	CRISPRCasFinder
GGAACTACCTCCGCATACGCGGAGAAAAG	CRT

24 spacers

cas2,cas1,cas3,cas6e,cas8e,cse2gr11,cas7,cas5

The CRISPR arrays of LS483402_2

>merge|LS483402|2|585781-587275|PILER-CR,CRISPRCasFinder,CRT
GGAACTACCTCCGCATACGCGGAGAAAAGGTTCTGGACAACTCTCTTCTTTGTCTTTATAGGGAACTACCTCCGCATACGCGGAGAAAAGTCTCCGCATCACGAAGATTGTGATTAGCCTTCGGAACTACCTCCGCATACGCGGAGAAAAGTTGAGTGCTGCGCGGAAGTTTCTGTCCACAAGGGAACTACCTCCGCATACGCGGAGAAAAGGCTTATCAGCCACACGCATACCAACAAGGGCTGGAACTACCTCCGCATACGCGGAGAAAAGGCTTATCAGCCACACGCATACCAACAAGGGCTGGAACTACCTCCGCATACGCGGAGAAAAGCGTGGGCCAAACACAAGGCCTGATTGATAAAGGGGAACTACCTCCGCATACGCGGAGAAAAGTGGAACCACCCAAATCTGCGGCCAAAACAATCGGAACTACCTCCGCATACGCGGAGAAAAGCGCCCCTACCGGCGCGACCCGCAAGGACGCCGGGAACTACCTCCGCATACGCGGAGAAAAGGGAAACCGCCCGTGGCGTTTAATGAGGAGCCCGGAACTACCTCCGCATACGCGGAGAAAAGGCTCCCTCCGGCGATCAAGATCAATGCGAACAGGAACTACCTCCGCATACGCGGAGAAAAGCCCACCCACCGCGATTAAGCCACGTGGTGGGATGGAACTACCTCCGCATACGCGGAGAAAAGATGAAGACGCCGTGGAGTACCCAGAAAACACGGGAACTACCTCCGCATACGCGGAGAAAAGCAGCTTCCCCTAAAGGAGAAAATTCTATGTATGGAACTACCTCCGCATACGCGGAGAAAAGCGTCACCGACTCCGCATTATTCGCCGCAGCCTGGAACTACCTCCGCATACGCGGAGAAAAGTAGGCCCCAACGCCTTGCGAAGCGCGCTAGGGGGAACTACCTCCGCATACGCGGAGAAAAGCCAATCATGGCACGTGACCAGCGCTTCTACGGGGAACTACCTCCGCATACGCGGAGAAAAGCAATTGATCCAATGTGTCCTCGATGCTCATTGGGAACTACCTCCGCATACGCGGAGAAAAGATCTTAGGGCGGGGTGCTCTAAAATAAAAAATGGAACTACCTCCGCATACGCGGAGAAAAGTTAAGATTCGATCACAATTTCTAACCACATGCGGAACTACCTCCGCATACGCGGAGAAAAGGGCTTTGGCAGGCAAAGCGCCGGTTTCGCATCGGAACTACCTCCGCATACGCGGAGAAAAGTCGGGAAGCTCTTTCACCGTGGCGATGATGTTGGAACTACCTCCGCATACGCGGAGAAAAGGCCAAAAACCCGGTAAAACCACTCAAATCTGCGGAACTACCTCCGCATACGCGGAGAAAAGGGTAGGGAATTCACCCTGAAAGAAGAAGATAGGGAACTACCTCCGCATACGCGGAGAAAAGCGGGCAAAAACATGAGCTCCGAAAGCATATCTGGAACTACCTCCGCATACGCGGAGAAAAG

>LS483402|2|2|585781-587275|PILER-CR
GGAACTACCTCCGCATACGCGGAGAAAAG	GTTCTGGACAACTCTCTTCTTTGTCTTTATAG
GGAACTACCTCCGCATACGCGGAGAAAAG	TCTCCGCATCACGAAGATTGTGATTAGCCTTC
GGAACTACCTCCGCATACGCGGAGAAAAG	TTGAGTGCTGCGCGGAAGTTTCTGTCCACAAG
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTTATCAGCCACACGCATACCAACAAGGGCT
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTTATCAGCCACACGCATACCAACAAGGGCT
GGAACTACCTCCGCATACGCGGAGAAAAG	CGTGGGCCAAACACAAGGCCTGATTGATAAAGG
GGAACTACCTCCGCATACGCGGAGAAAAG	TGGAACCACCCAAATCTGCGGCCAAAACAATC
GGAACTACCTCCGCATACGCGGAGAAAAG	CGCCCCTACCGGCGCGACCCGCAAGGACGCCG
GGAACTACCTCCGCATACGCGGAGAAAAG	GGAAACCGCCCGTGGCGTTTAATGAGGAGCCC
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTCCCTCCGGCGATCAAGATCAATGCGAACA
GGAACTACCTCCGCATACGCGGAGAAAAG	CCCACCCACCGCGATTAAGCCACGTGGTGGGAT
GGAACTACCTCCGCATACGCGGAGAAAAG	ATGAAGACGCCGTGGAGTACCCAGAAAACACG
GGAACTACCTCCGCATACGCGGAGAAAAG	CAGCTTCCCCTAAAGGAGAAAATTCTATGTAT
GGAACTACCTCCGCATACGCGGAGAAAAG	CGTCACCGACTCCGCATTATTCGCCGCAGCCT
GGAACTACCTCCGCATACGCGGAGAAAAG	TAGGCCCCAACGCCTTGCGAAGCGCGCTAGGG
GGAACTACCTCCGCATACGCGGAGAAAAG	CCAATCATGGCACGTGACCAGCGCTTCTACGG
GGAACTACCTCCGCATACGCGGAGAAAAG	CAATTGATCCAATGTGTCCTCGATGCTCATTG
GGAACTACCTCCGCATACGCGGAGAAAAG	ATCTTAGGGCGGGGTGCTCTAAAATAAAAAAT
GGAACTACCTCCGCATACGCGGAGAAAAG	TTAAGATTCGATCACAATTTCTAACCACATGC
GGAACTACCTCCGCATACGCGGAGAAAAG	GGCTTTGGCAGGCAAAGCGCCGGTTTCGCATC
GGAACTACCTCCGCATACGCGGAGAAAAG	TCGGGAAGCTCTTTCACCGTGGCGATGATGTT
GGAACTACCTCCGCATACGCGGAGAAAAG	GCCAAAAACCCGGTAAAACCACTCAAATCTGC
GGAACTACCTCCGCATACGCGGAGAAAAG	GGTAGGGAATTCACCCTGAAAGAAGAAGATAG
GGAACTACCTCCGCATACGCGGAGAAAAG	CGGGCAAAAACATGAGCTCCGAAAGCATATCT
GGAACTACCTCCGCATACGCGGAGAAAAG

>LS483402|2|2|585781-587275|CRISPRCasFinder
GGAACTACCTCCGCATACGCGGAGAAAAG	GTTCTGGACAACTCTCTTCTTTGTCTTTATAG
GGAACTACCTCCGCATACGCGGAGAAAAG	TCTCCGCATCACGAAGATTGTGATTAGCCTTC
GGAACTACCTCCGCATACGCGGAGAAAAG	TTGAGTGCTGCGCGGAAGTTTCTGTCCACAAG
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTTATCAGCCACACGCATACCAACAAGGGCT
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTTATCAGCCACACGCATACCAACAAGGGCT
GGAACTACCTCCGCATACGCGGAGAAAAG	CGTGGGCCAAACACAAGGCCTGATTGATAAAGG
GGAACTACCTCCGCATACGCGGAGAAAAG	TGGAACCACCCAAATCTGCGGCCAAAACAATC
GGAACTACCTCCGCATACGCGGAGAAAAG	CGCCCCTACCGGCGCGACCCGCAAGGACGCCG
GGAACTACCTCCGCATACGCGGAGAAAAG	GGAAACCGCCCGTGGCGTTTAATGAGGAGCCC
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTCCCTCCGGCGATCAAGATCAATGCGAACA
GGAACTACCTCCGCATACGCGGAGAAAAG	CCCACCCACCGCGATTAAGCCACGTGGTGGGAT
GGAACTACCTCCGCATACGCGGAGAAAAG	ATGAAGACGCCGTGGAGTACCCAGAAAACACG
GGAACTACCTCCGCATACGCGGAGAAAAG	CAGCTTCCCCTAAAGGAGAAAATTCTATGTAT
GGAACTACCTCCGCATACGCGGAGAAAAG	CGTCACCGACTCCGCATTATTCGCCGCAGCCT
GGAACTACCTCCGCATACGCGGAGAAAAG	TAGGCCCCAACGCCTTGCGAAGCGCGCTAGGG
GGAACTACCTCCGCATACGCGGAGAAAAG	CCAATCATGGCACGTGACCAGCGCTTCTACGG
GGAACTACCTCCGCATACGCGGAGAAAAG	CAATTGATCCAATGTGTCCTCGATGCTCATTG
GGAACTACCTCCGCATACGCGGAGAAAAG	ATCTTAGGGCGGGGTGCTCTAAAATAAAAAAT
GGAACTACCTCCGCATACGCGGAGAAAAG	TTAAGATTCGATCACAATTTCTAACCACATGC
GGAACTACCTCCGCATACGCGGAGAAAAG	GGCTTTGGCAGGCAAAGCGCCGGTTTCGCATC
GGAACTACCTCCGCATACGCGGAGAAAAG	TCGGGAAGCTCTTTCACCGTGGCGATGATGTT
GGAACTACCTCCGCATACGCGGAGAAAAG	GCCAAAAACCCGGTAAAACCACTCAAATCTGC
GGAACTACCTCCGCATACGCGGAGAAAAG	GGTAGGGAATTCACCCTGAAAGAAGAAGATAG
GGAACTACCTCCGCATACGCGGAGAAAAG	CGGGCAAAAACATGAGCTCCGAAAGCATATCT
GGAACTACCTCCGCATACGCGGAGAAAAG

>LS483402|2|2|585781-587275|CRT
GGAACTACCTCCGCATACGCGGAGAAAAG	GTTCTGGACAACTCTCTTCTTTGTCTTTATAG
GGAACTACCTCCGCATACGCGGAGAAAAG	TCTCCGCATCACGAAGATTGTGATTAGCCTTC
GGAACTACCTCCGCATACGCGGAGAAAAG	TTGAGTGCTGCGCGGAAGTTTCTGTCCACAAG
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTTATCAGCCACACGCATACCAACAAGGGCT
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTTATCAGCCACACGCATACCAACAAGGGCT
GGAACTACCTCCGCATACGCGGAGAAAAG	CGTGGGCCAAACACAAGGCCTGATTGATAAAGG
GGAACTACCTCCGCATACGCGGAGAAAAG	TGGAACCACCCAAATCTGCGGCCAAAACAATC
GGAACTACCTCCGCATACGCGGAGAAAAG	CGCCCCTACCGGCGCGACCCGCAAGGACGCCG
GGAACTACCTCCGCATACGCGGAGAAAAG	GGAAACCGCCCGTGGCGTTTAATGAGGAGCCC
GGAACTACCTCCGCATACGCGGAGAAAAG	GCTCCCTCCGGCGATCAAGATCAATGCGAACA
GGAACTACCTCCGCATACGCGGAGAAAAG	CCCACCCACCGCGATTAAGCCACGTGGTGGGAT
GGAACTACCTCCGCATACGCGGAGAAAAG	ATGAAGACGCCGTGGAGTACCCAGAAAACACG
GGAACTACCTCCGCATACGCGGAGAAAAG	CAGCTTCCCCTAAAGGAGAAAATTCTATGTAT
GGAACTACCTCCGCATACGCGGAGAAAAG	CGTCACCGACTCCGCATTATTCGCCGCAGCCT
GGAACTACCTCCGCATACGCGGAGAAAAG	TAGGCCCCAACGCCTTGCGAAGCGCGCTAGGG
GGAACTACCTCCGCATACGCGGAGAAAAG	CCAATCATGGCACGTGACCAGCGCTTCTACGG
GGAACTACCTCCGCATACGCGGAGAAAAG	CAATTGATCCAATGTGTCCTCGATGCTCATTG
GGAACTACCTCCGCATACGCGGAGAAAAG	ATCTTAGGGCGGGGTGCTCTAAAATAAAAAAT
GGAACTACCTCCGCATACGCGGAGAAAAG	TTAAGATTCGATCACAATTTCTAACCACATGC
GGAACTACCTCCGCATACGCGGAGAAAAG	GGCTTTGGCAGGCAAAGCGCCGGTTTCGCATC
GGAACTACCTCCGCATACGCGGAGAAAAG	TCGGGAAGCTCTTTCACCGTGGCGATGATGTT
GGAACTACCTCCGCATACGCGGAGAAAAG	GCCAAAAACCCGGTAAAACCACTCAAATCTGC
GGAACTACCTCCGCATACGCGGAGAAAAG	GGTAGGGAATTCACCCTGAAAGAAGAAGATAG
GGAACTACCTCCGCATACGCGGAGAAAAG	CGGGCAAAAACATGAGCTCCGAAAGCATATCT
GGAACTACCTCCGCATACGCGGAGAAAAG

Protein	Signature genes	Signature genes Name	Protein_function
LS483402.1\|SQG56820.1\|597753_598677_+\|Phospholipase-D-precursor	unknown	unknown	gnl\|CDD\|176518
LS483402.1\|SQG56785.1\|584162_584390_-\|Uncharacterised-protein	unknown	unknown	gnl\|CDD\|375921
LS483402.1\|SQG56807.1\|588615_591309_-\|CRISPR-associated-helicase-Cas3-family-protein	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|182031
LS483402.1\|SQG56779.1\|581897_582209_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56775.1\|579368_581291_+\|Uncharacterised-protein	unknown	unknown	gnl\|CDD\|380076
LS483402.1\|SQG56789.1\|584799_584910_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56781.1\|582301_582772_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56777.1\|581366_581753_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56791.1\|585485_585752_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56818.1\|596304_597216_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56783.1\|582859_583795_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56814.1\|594456_595524_+\|CRISPR-associated-Cse4-family-protein	cas7	pfam09344_cas7_CAS-I-E	gnl\|CDD\|378153
LS483402.1\|SQG56774.1\|578230_578446_-\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56787.1\|584530_584662_+\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56810.1\|592253_593867_+\|Uncharacterised-protein	cas8e	cls000721_cas8e_CAS-I-E	unknown
LS483402.1\|SQG56816.1\|595535_596228_+\|CRISPR-associated-Cas5e-family-protein	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|187776
LS483402.1\|SQG56812.1\|593902_594457_+\|CRISPR-type-I-E/ECOLI-associated-protein-CasB/Cse2	cse2gr11	mkCas0096_cse2gr11_CAS-I-E	gnl\|CDD\|274193
LS483402.1\|SQG56805.1\|587665_588619_-\|CRISPR-associated-Cas1-family-protein	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
LS483402.1\|SQG56809.1\|591329_592040_-\|CRISPR-associated-protein-Cas6/Cse3/CasE,-subtype-I-E/ECOLI	cas6e	cd09727_cas6e_CAS-I-E	gnl\|CDD\|187858
LS483402.1\|SQG56803.1\|587293_587665_-\|CRISPR-associated-protein-Cas2	cas2	pfam09707_cas2_CAS-I-E	gnl\|CDD\|378244

Protein	Function_ID	Function_description	E-value
LS483402.1\|SQG56820.1\|597753_598677_+\|Phospholipase-D-precursor	gnl\|CDD\|176518	cd08576, GDPD_like_SMaseD_PLD, Glycerophosphodiester phosphodiesterase-like domain of spider venom sphingomyelinases D, bacterial phospholipase D, and similar proteins. This subfamily corresponds to the glycerophosphodiester phosphodiesterase-like domain (GDPD-like) present in sphingomyelinases D (SMases D) (sphingomyelin phosphodiesterase D, EC 3.1.4.4) from spider venom, the Corynebacterium pseudotuberculosis Phospholipase D (PLD)-like protein from pathogenic bacteria, and the Ajellomyces capsulatus H143 PLD-like protein from ascomycetes. Spider SMases D and bacterial PLD proteins catalyze the Mg2+-dependent hydrolysis of sphingomyelin producing choline and ceramide 1-phosphate (C1P), which possess a number of biological functions, such as regulating cell proliferation and apoptosis, participating in inflammatory responses, and playing a key role in phagocytosis. In the presence of Mg2+, SMases D can function as lysophospholipase D and hydrolyze lysophosphatidylcholine (LPC) to choline and lysophosphatidic acid (LPA), which is a multifunctional phospholipid involved in platelet aggregation, endothelial hyperpermeability, and pro-inflammatory responses. Loxosceles spider venoms' SMases D are the principal toxins responsible for dermonecrosis and complement dependent haemolysis induced by spider venom. Due to amino acid substitutions at the entrance to the active-site pocket, some members lack activity. The typical GDPD domain consists of a TIM barrel and a small insertion domain named as the GDPD-insertion (GDPD-I) domain, which is specific for GDPD proteins. Although proteins in this family contain a non-typical GDPD domain which lacks the GDPD-I, their catalytic mechanisms are based on Mg2+-dependent acid-base reactions similar to GDPD proteins. They might be divergent members of the GDPD family. Moreover, this family does not belong to phospholipase D (PLD) superfamily, since it lacks the conserved HKD sequence motif that characterizes the catalytic center of the PLD superfamily. It belongs to the superfamily of PLC-like phosphodiesterases.	1.34016e-86
LS483402.1\|SQG56785.1\|584162_584390_-\|Uncharacterised-protein	gnl\|CDD\|375921	pfam18495, VbhA, Antitoxin VbhA. VbhT is a bacterial Fic protein of the mammalian pathogen B. schoenbuchensis7,8. It is composed of an N-terminal FIC domain and a C-terminal BID domain. FIC domains are known to catalyse adenylylation (also called AMPylation). This entry represents VbhA, an antitoxin that binds FIC domain (filamentation induced by cyclic AMP) of VbhT and inhibits its activity. It inhibits the adenylylation activity of VbhT by positioning close to the putative ATP-binding site, hence competing with ATP binding.	0.000240551
LS483402.1\|SQG56807.1\|588615_591309_-\|CRISPR-associated-helicase-Cas3-family-protein	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	4.77504e-54
LS483402.1\|SQG56805.1\|587665_588619_-\|CRISPR-associated-Cas1-family-protein	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	1.72977e-71
LS483402.1\|SQG56816.1\|595535_596228_+\|CRISPR-associated-Cas5e-family-protein	gnl\|CDD\|187776	cd09645, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	2.90796e-27
LS483402.1\|SQG56812.1\|593902_594457_+\|CRISPR-type-I-E/ECOLI-associated-protein-CasB/Cse2	gnl\|CDD\|274193	TIGR02548, CRISPR_system_Cascade_subunit_CasB, CRISPR type I-E/ECOLI-associated protein CasB/Cse2. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model family is found in Ecoli subtype CRISPR/Cas regions of many bacteria, most of which are mesophiles, and not in Archaea. It was designated Cse2 originally, and renamed CasB based on its characterization in the CASCADE complex.	6.27337e-08
LS483402.1\|SQG56775.1\|579368_581291_+\|Uncharacterised-protein	gnl\|CDD\|380076	pfam17961, Big_8, Bacterial Ig domain. This entry represents a bacterial Ig-fold domain that is found in a wide range of bacterial cell surface adherence proteins.	1.95325e-10
LS483402.1\|SQG56809.1\|591329_592040_-\|CRISPR-associated-protein-Cas6/Cse3/CasE,-subtype-I-E/ECOLI	gnl\|CDD\|187858	cd09727, Cas6_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas6e. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas6e is an endoribonuclease that generates crRNA; This family is specific for CRISPR/Cas system I-E subtype; Homologous to Cas6 (RAMP superfamily protein); Possesses double RRM/ferredoxin fold; also known as Cse3 family.	3.00932e-36
LS483402.1\|SQG56814.1\|594456_595524_+\|CRISPR-associated-Cse4-family-protein	gnl\|CDD\|378153	pfam09344, Cas_CT1975, CT1975-like protein. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum.	1.8369e-81
LS483402.1\|SQG56803.1\|587293_587665_-\|CRISPR-associated-protein-Cas2	gnl\|CDD\|378244	pfam09707, Cas_Cas2CT1978, CRISPR-associated protein (Cas_Cas2CT1978). This entry represents a minor branch of the Cas2 family of CRISPR-associated protein which are found in IPR003799. Cas proteins are found adjacent to a characteristic short, palindromic repeat cluster termed CRISPR, a probable mobile DNA element.	9.67195e-22

>LS483402.1|SQG56791.1|585485_585752_-|Uncharacterised-protein
MQDYIDRFNTNAFIEPSTTKIYQSRSGAKARADLLESFGYKAIVQRSAPLVWPEGDNTTVETTKINEVFAAIKTLVNHGVVKSADELL
>LS483402.1|SQG56789.1|584799_584910_-|Uncharacterised-protein
MVEFLTIIGSFSIAFLIPTLLVIIIVLFVLSLKKKK
>LS483402.1|SQG56787.1|584530_584662_+|Uncharacterised-protein
MVAPARNYLRVRGEKNHYQSEQRPLRSPKYIGIKPFVAFLILS
>LS483402.1|SQG56785.1|584162_584390_-|Uncharacterised-protein
MDMMNPTERISEDQLRQIRNDLASAEIEGQPRTPEDEKILAAYYLGEISEQESFESLLKAAGVHPPYPSINHDLD
>LS483402.1|SQG56783.1|582859_583795_-|Uncharacterised-protein
MTTSGSVTGRIKKAKAHGYDEFTGVYVDVPLEVSLKSAQERYIRGAQEYIDGVGYGGRYVPESAIMRAQVPGSDKTRNRQVFEGLTESKVFTATEIWDNNRQDENGNRQPAALIERTTINGKEHHRPVRSGGSDDGRRETSTRQRTEGSGDKLRRDSGDRGRSLPGRPTDRHSGSGNAREDHDGTSKRNVQPRSNNIQLNQTPLAAQTSPVVPTTGHYKGKTVHNIDNTDDILKGHDLPEGMKAVIGEYGEIALKFPNKESEREYRKKHGKNFLNVTTGAQAALHDAVKNNDAIPASFFTYTEVTVPVGWV
>LS483402.1|SQG56781.1|582301_582772_-|Uncharacterised-protein
MIFSFLPKENVVFSSSYRQRKRLEHLKFLDEALEREWEKDDEESIKKQIKEIEGKFSGKHWVRQPSWMEVAIAGAMITSLTLIVSGAIFFVSHILSEYILRENGWEQGGVLALELRILIIGILLFLIIVLSAPILLDWPGSKAPDTRKKKKKWGKR
>LS483402.1|SQG56779.1|581897_582209_-|Uncharacterised-protein
MVIDNIYNRIERATDGKVFYGVGVSPENQDNISIDAGYVEALLEYGYLDISLKQEFLELWLTDDEYEDLEALDYVQDLTYKMLLKYADMTPRVDVSRFLKEEG
>LS483402.1|SQG56777.1|581366_581753_-|Uncharacterised-protein
MTNTFTALTERSEGWWSVQLKEDPGLLTQTRRLDQIADMVRDALELFPELTDDPYKDIVNIEFREGESIADIANQAVQANQKAKQAQEEASQLMRQAAAELSKKGLSYRDIGTLLGVSFQRAQKLATT
>LS483402.1|SQG56775.1|579368_581291_+|Uncharacterised-protein
MENMSFPARSQRAGKLLCVVACAIALVSSLMMFATGQPLARAESVCSGGDWSELAWKDEHSNPSLRDNTYHGPGSHAEVQFKWKAKADAKQGDKITFTLPPQLQGVDTGSILLQDSKNDLVARGSWDSGRKSFVITLEQFANTHFNVQGTAFVSVKWNRDGIDGDPKKFEGSLNFNGCGSGSLNGKYEEGSEGDSHETSKIGEYRGYDSENKVHKVQWTVGLSGKTGNGQRDLVTDNAPAGWNFACDGKYNDGYAPVYVSSFIKGDPSGERRHQIFNAQNQDTGGIREGLSGVKNLENFVQGYSYRLRCSSDRVEVELPYGISPQSSPLISLLTISTEKPALGSTIYNTAEVNGRKISGSVTFPSAGGQGRGSKGGFTIEKIVSGEHTSKQFSFEWSCTSQSKETKSGTIKLANGDVHHEKQLDKGASCVIKEEDADAASEKKHSLKWSVDGEDKEGESVAISIRQPEEQAVQVVATNIYYQEEPEIPPVPPTTTSSSSPSTTTSTETTTKTTTTTTTATKTTEPSATTTTSPPSSPRTTEPTRAPRNPLLPIPIPIPIPLPPAPPVTTTVTPHAPAPVPPPATPSIVSHKPADAAPQPPAKRLLARTGASVAGLVIPALFLMIGGVGLLMIIRRKRNSE
>LS483402.1|SQG56774.1|578230_578446_-|Uncharacterised-protein
MDKQTDTNTIRHIQALAGLRKRTQGIKIVLRNRTNDSTALLLSSELQQSSAGYPDSYDLAHSNRGHYKPCD
>LS483402.1|SQG56803.1|587293_587665_-|CRISPR-associated-protein-Cas2
MFAVIQGHNLPNHLNGYLSRFLSEVDAGLYVGVLSRAVMENLWEKCQSVDLAGSLTLIHPQYDAEQGFRIRTTGKQRRPVVDLDGLFLSARGLIEDVRFADPLDEADAIIPDEVLEDFCPESE
>LS483402.1|SQG56805.1|587665_588619_-|CRISPR-associated-Cas1-family-protein
MSYSNEALAFSTIPASEQIRLEDRVSFLYLEYCLIRQDRTGVIAVSRGDEKAPAELKDLPIKARIQLPVGGLAVLMLGPGTSISQPAATSCARAGVSVLFTGGGGVQAYSLSTPLTSSARWAIAQARLASNEAKQRTAARILYKRQLGIEEIEADSIAVMRGIEGRTIRNLYKRLSAQHKIKNFKRNTNATDPVNTNLNLGNSILYGCAASACAALGINPALGIIHRGDIRSLLFDLADLYKPTLTIPAAFKCANNDDDGSEFRRLVRSEIVNQDLLKNMIHIMMEILTPHLPERTDDRLIGGRNHEVPGHTQYGGK
>LS483402.1|SQG56807.1|588615_591309_-|CRISPR-associated-helicase-Cas3-family-protein
MTNAGTNHHVLWAKFDNVSEPYPLLAHLLDTATAATCLFNHWLRKGLRDRLSTELGPDAEKILGFVAGIHDLGKANPYFQAQRRNKKEEWITLRDAIQKAGFPLSNGTSALFEETKEKRRHENITLSILGWEITKFLQVKDVWPQLAIIGHHGNFSAPGFLSDEDDLEDIEDIFDDNGWSPTHELLVSSLLQAVGLEKQPEIKHISPASAILISGLVVLADRIASQSEMASDGLQALQKEELFFHQPEKWIANRKTFCREIIENTVGTYHPWESEAAGIRAVLGDYEPRFTQKAALNADDGLFNVMETTGAGKTEAALLRHVKRKERLLFFLPTQATTNAIMERIGKIFDGTPNVASLAHGLAVTEDFYAHPIVPVQGSSDDANYKDNGGLYPTEFVRSAGTPRLLAPVCVGTIDQALMGALPSKFNHLRLLALANAHVVVDEVHTMDQYQSELMSGLLEWWSATDTPVTLLTATMPAWQREKFHLSYTGKEPHFKGVFPSLEDWSTPSKNTETSQENIPTEAFTIPINIDKIAHNEIVDSHVQWVIEQRKLFPQARIGIICNTVGRAQSIAEALAHESPIVLHSRMTAGHRKEAATKLEQAIGKKGTATATLVIGTQAIEASLDIDLDLLRTELCPAPSLIQRAGRLWRRLDPQREVRVPGMVGKKLTIAVVDSPSTGQTLPYLRSQLYRVESWLKQRDRIEFPADIQDFIDATTPGLQELFQKVSLPEDCGSAEERETLADDYLNEVASWVTKQRQAGTSRIDFAKHGKPRQVLASDCVVEDFLQITSAKDLEERATRLIDYPTISAILCDPTGTVPGAWTDSVEKLIAIPAKDRESLRRALRASISIPRSDKFVPITSREIPLSEAKTLLSGYSAVHIQPDEYDLQSGLKGPQK
>LS483402.1|SQG56809.1|591329_592040_-|CRISPR-associated-protein-Cas6/Cse3/CasE,-subtype-I-E/ECOLI
MTNAIYWTHFPAHIALNKSLVLGNSATKDSKNKPRWDVDDPIFRHRAVMALFPEHQSDNARADSNILFRLEALPGQPPYFFVQSSIEPSNRNLDNHIKTRQVDLVSPEAGTPIEFRLSINAVRRKTIDATENTKRKIKTTCLSLKALDSDPTETAAGQWVKEKLSPALENIDIVRHGRQVLGANRNGEKTSNRTVQVDTIDGFAQVKDPEELQKMLIHGIGRAKSYGCGMLTFRPI
>LS483402.1|SQG56810.1|592253_593867_+|Uncharacterised-protein
MKSNVFKDFPFVKTNKGPMTVEEFFHSSHEESLHLDLSIPGYEYGAIWRLLASLTAVIVQRDPSLLERGESGSELRLDPEFISQILDDLGSKISLTEGKNLFFQRPLLEGENPKDTARYVGPGKDPAWKLSPTAPSEKSQIYWNLEKLKPESLEAVDAIVALMVFSMYSFTGNSKYDGAKCLNGSPGIRFLGGGNTATEFIIEAKTPLLSLLKSIPLEWCEPRGLPAWLDRTGAESRKPNGEMHPLWRATWSSNTAACCWDGETLIGVGIGGIPPEWYAIEMGSKPEARKEWWDQRNTEDPFYFYQPDKGGALKAKRLDLSRDLTELAVEWVAEDLSTALAERVRGRALRVDFKKEDSLLFIRHQIGGNASSAMIRESVVSQARKQQWIFDPTGALQKQVRGKADFILSLRNIVLSPFRRENKSDRDRGRRVLDNLASERPKMNETFWREIAPIYEEFILYFTEQVSGDETRKEVRAQAKKTLKELEKDAVRTAQKAFDMVLEPYLLQNPSQAYEVRRRIHSYLASKIAEANEGDQK
>LS483402.1|SQG56812.1|593902_594457_+|CRISPR-type-I-E/ECOLI-associated-protein-CasB/Cse2
MAEFAQRKKDKEFRAKRSALRAGSGIYTEFRAYSYVLPFLGEKASEAQRTALLRCMAALAEYPDIVSSGEKATASSVGQWVNRVAFDGKQGQSEPDSMVASRIKYLHTQDLEEAISSLRRIMAFADRKNMAIKLNPYQFVELFWYWGNGFTDASTKHRLSVLRDFYSTKQKENTDPQSSSEGEK
>LS483402.1|SQG56814.1|594456_595524_+|CRISPR-associated-Cse4-family-protein
MSRHLTIHVVASVPYSNLNRDDSGTPKNVRRGGVTCALLSSQSIKKGIRTKYEDASLDTSVRSGRIADDVLERAKVLAPEADTKALEKAVKKIIGTLTKVAEANESEGESDRSIWLSAEELEAAAVSVVEQAEKKDFIEDGRTGSLAIAAFGRMFAAAPQKGTEAALSVSPAVTTHGVTIATDYFSTVDDIRERNRDTGATYLGVSQYTTGVFYRTVTIDKEQLRESWTGLDREDAKENLAALVNAIIYGLPRGKQHSTAPFVQPALILAEEQSYRCAYDFESPVQADTREGGYLKPTLEELKRQYDSARAFDADNFGETQVVSGTYPEVSEFFAGAKYADKNGFIDEVVAWIQR
>LS483402.1|SQG56816.1|595535_596228_+|CRISPR-associated-Cas5e-family-protein
MTTTSVYLRLAGPLQSWAGPAVTGNFVRTEPIPTHSALVGLIAGACGYRRDEWPDWLNRLNFRVRVDHPGKFVDDFQTVSAHEEEMLFRERLIYATGKRPSAKTTRLTPDGRGMTSIIQRTYLAEAEFIVEVASDTHGELLRDALRAPKFSTYLGRKAFAPAFPFYLGATTDVDVLHRIPACDLSGAKRDTARVQIHHCSAELHTSAEHINVPAVQERSDWLEKTKELFV
>LS483402.1|SQG56818.1|596304_597216_-|Uncharacterised-protein
MRSGTLHQRQMKAFISWILGGKPRDKSDVSRTQRRLMSWCWQVPVPQPSMEDKACILVMNEGTFFQSWCLVVAYNSTHVLGWQWVRKDDKTTCAQVYTYFPRPCAAVISGDESTAQAIQSLWPGIPMRRCLSSIKESVDQKISHTPHTQPAIEIKNLTDSLSYVYTSDQAQLWLDRYNTWETTWKELLKHRTDSPNTNHNKNSCSWQWTYKELRSIRLMYRTLIKKEELFFQLTESAIPLSDAALPCQTSLLGDDLSADIKKLFHTHRGINHEHARRMVEWYLNSKTESPFIPERIIKHDHWE
>LS483402.1|SQG56820.1|597753_598677_+|Phospholipase-D-precursor
MKKKVVLFLSIIMGILLPVGNAVATPVSHDAASTGNRPVYAIAHRVLTTQGVDDAVAIGANALEIDFTAWRGGWWADHDGIPTSAGATAEAIFKHIAEKRKQGANITFTWLDIKNPDYCTDPDSVCSINALRDLARKYLEPAGVRVLYGFYKTVGGPGWKTITSDLRDKEAIALSGPTHDVLNDFAKAGDKILTKQKIADYGYYDINQGFGNCYGDGNKTCDQLRKSSEARDQGQLGKTFGWTITTGQDDRVNDLLGKAHVDGMIFGFKVTHFYRHADTENSFKAIKTWVDKHSDTHHLATAADNPW

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: LS483402_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

LS483402_3

662021-662860

Unclear

Consensus_repeat	Method
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	PILER-CR
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CRISPRCasFinder
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CRT

11 spacers

cas1,csb3,cas3,csb2gr5,csb1gr7

The CRISPR arrays of LS483402_3

>merge|LS483402|3|662021-662860|PILER-CR,CRISPRCasFinder,CRT
ACCTGAATGAAAGGCTGCGACCGAAGCCGCAGCGACCAAAGAACTGAACCGCCACATTCGCGAAGCAGCCGGAACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACACTTGGCGGAAGAGTTAGGCATCTCAGAGAGTTCGACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACGCCCTCGCCCGATCTGTCGCGCCGGGCATCACATGGGCACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACATTACCATTGCCCCACAATTCCGCATGCAAAAGAGCCACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACGGTGTGAAAGCTGCTGGTGCTTGTGGGGTTTCTGGACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACCAGCACCTGCACCAACAAACTGTGGCGATGCACAGAACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACTTCTGTCATTAAGGACATCATTTTGGGGCAGTGGTGGCTTACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACCGCCTCAATCTGAGCAGCCGCTGCCAGCTGGAGCGTGCCCACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACTTCACGTGGCGCTGTGTATGGCTCTAAAGCCGGTGCAATACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACCCTTACCGCACGGATAATGAAAACCGCTATAACCGACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGACGGTCTGGGTATCATCGCCACTACAGCCAGTAATAAAACCTCAATGAAAGGCTGCGACTGAAGCCGCAGCGAC

>LS483402|3|3|662021-662860|PILER-CR
ACCTGAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CAAAGAACTGAACCGCCACATTCGCGAAGCAGCCGGA
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	ACTTGGCGGAAGAGTTAGGCATCTCAGAGAGTTCG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GCCCTCGCCCGATCTGTCGCGCCGGGCATCACATGGGC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	ATTACCATTGCCCCACAATTCCGCATGCAAAAGAGCC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GGTGTGAAAGCTGCTGGTGCTTGTGGGGTTTCTGG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CAGCACCTGCACCAACAAACTGTGGCGATGCACAGA
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	TTCTGTCATTAAGGACATCATTTTGGGGCAGTGGTGGCTT
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CGCCTCAATCTGAGCAGCCGCTGCCAGCTGGAGCGTGCCC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	TTCACGTGGCGCTGTGTATGGCTCTAAAGCCGGTGCAAT
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CCTTACCGCACGGATAATGAAAACCGCTATAACCG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GGTCTGGGTATCATCGCCACTACAGCCAGTAATAAA
ACCTCAATGAAAGGCTGCGACTGAAGCCGCAGCGAC

>LS483402|3|3|662021-662860|CRISPRCasFinder
ACCTGAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CAAAGAACTGAACCGCCACATTCGCGAAGCAGCCGGA
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	ACTTGGCGGAAGAGTTAGGCATCTCAGAGAGTTCG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GCCCTCGCCCGATCTGTCGCGCCGGGCATCACATGGGC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	ATTACCATTGCCCCACAATTCCGCATGCAAAAGAGCC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GGTGTGAAAGCTGCTGGTGCTTGTGGGGTTTCTGG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CAGCACCTGCACCAACAAACTGTGGCGATGCACAGA
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	TTCTGTCATTAAGGACATCATTTTGGGGCAGTGGTGGCTT
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CGCCTCAATCTGAGCAGCCGCTGCCAGCTGGAGCGTGCCC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	TTCACGTGGCGCTGTGTATGGCTCTAAAGCCGGTGCAAT
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CCTTACCGCACGGATAATGAAAACCGCTATAACCG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GGTCTGGGTATCATCGCCACTACAGCCAGTAATAAA
ACCTCAATGAAAGGCTGCGACTGAAGCCGCAGCGAC

>LS483402|3|3|662021-662860|CRT
ACCTGAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CAAAGAACTGAACCGCCACATTCGCGAAGCAGCCGGA
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	ACTTGGCGGAAGAGTTAGGCATCTCAGAGAGTTCG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GCCCTCGCCCGATCTGTCGCGCCGGGCATCACATGGGC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	ATTACCATTGCCCCACAATTCCGCATGCAAAAGAGCC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GGTGTGAAAGCTGCTGGTGCTTGTGGGGTTTCTGG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CAGCACCTGCACCAACAAACTGTGGCGATGCACAGA
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	TTCTGTCATTAAGGACATCATTTTGGGGCAGTGGTGGCTT
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CGCCTCAATCTGAGCAGCCGCTGCCAGCTGGAGCGTGCCC
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	TTCACGTGGCGCTGTGTATGGCTCTAAAGCCGGTGCAAT
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	CCTTACCGCACGGATAATGAAAACCGCTATAACCG
ACCTCAATGAAAGGCTGCGACCGAAGCCGCAGCGAC	GGTCTGGGTATCATCGCCACTACAGCCAGTAATAAA
ACCTCAATGAAAGGCTGCGACTGAAGCCGCAGCGAC

Protein	Signature genes	Signature genes Name	Protein_function
LS483402.1\|SQG56950.1\|669889_671095_-\|CRISPR-associated-protein-GSU0053/csb1,-Dpsyc-system	csb1gr7	pfam09617_csb1gr7_CAS-I-U	gnl\|CDD\|378223
LS483402.1\|SQG56944.1\|664598_665630_-\|Uncharacterised-protein	csb3	cd09764_csb3_CAS-I-U	gnl\|CDD\|187733
LS483402.1\|SQG56940.1\|662882_662996_-\|CRISPR-associated-protein-Cas2	unknown	unknown	gnl\|CDD\|187856
LS483402.1\|SQG56934.1\|659675_660287_-\|Uncharacterised-protein	unknown	unknown	gnl\|CDD\|379205
LS483402.1\|SQG56938.1\|661305_661710_+\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56926.1\|655235_656321_-\|Inositol-3-phosphate-synthase	unknown	unknown	gnl\|CDD\|132491
LS483402.1\|SQG56956.1\|672690_673278_+\|nitroreductase	unknown	unknown	gnl\|CDD\|380327
LS483402.1\|SQG56942.1\|662992_664594_-\|CRISPR-associated-Cas1-family-protein	cas1	cd09634_cas1_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|376633
LS483402.1\|SQG56921.1\|650471_653765_+\|periplasmic-alpha-amylase	unknown	unknown	gnl\|CDD\|200478
LS483402.1\|SQG56936.1\|660314_660722_-\|DNA-binding-domain-containing-protein	unknown	unknown	gnl\|CDD\|200128
LS483402.1\|SQG56932.1\|658152_659661_+\|putative-methyl-viologen-resistance-protein	unknown	unknown	gnl\|CDD\|129794
LS483402.1\|SQG56927.1\|656554_657310_-\|VIT-family	unknown	unknown	gnl\|CDD\|153123
LS483402.1\|SQG56954.1\|671790_672597_-\|lipase-LipC	unknown	unknown	gnl\|CDD\|224001
LS483402.1\|SQG56952.1\|671480_671732_+\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56919.1\|649968_650190_+\|Uncharacterised-protein	unknown	unknown	unknown
LS483402.1\|SQG56948.1\|668308_669886_-\|CRISPR-associated-protein-GSU0054/csb2,-Dpsyc-system	csb2gr5	cls000315_csb2gr5_CAS-I-U	gnl\|CDD\|274005
LS483402.1\|SQG56958.1\|673359_673917_+\|anhydrase-family-3-protein	unknown	unknown	gnl\|CDD\|100051
LS483402.1\|SQG56924.1\|653799_655179_+\|glycosyl-hydrolase-family-protein	unknown	unknown	gnl\|CDD\|119373
LS483402.1\|SQG56946.1\|665634_668316_-\|CRISPR-associated-protein-Cas3	cas3	cd09696_cas3_CAS-I-U	gnl\|CDD\|274235
LS483402.1\|SQG56930.1\|657481_658114_-\|transcriptional-repressor-BetI	unknown	unknown	gnl\|CDD\|224228

Protein	Function_ID	Function_description	E-value
LS483402.1\|SQG56950.1\|669889_671095_-\|CRISPR-associated-protein-GSU0053/csb1,-Dpsyc-system	gnl\|CDD\|378223	pfam09617, Cas_GSU0053, CRISPR-associated protein GSU0053 (Cas_GSU0053). This entry is found in CRISPR-associated (cas) proteins in the genomes of Geobacter sulfurreducens PCA and Desulfotalea psychrophila LSv54 (both Desulfobacterales from the Deltaproteobacteria), Gemmata obscuriglobus (a Planctomycete), and Actinomyces naeslundii MG1 (Actinobacteria).	7.10362e-35
LS483402.1\|SQG56944.1\|664598_665630_-\|Uncharacterised-protein	gnl\|CDD\|187733	cd09764, Csb3_I-U, CRISPR/Cas system-associated RAMP superfamily protein Csb3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein; Might be a catalytically active RNA endoribonuclease.	5.60944e-87
LS483402.1\|SQG56930.1\|657481_658114_-\|transcriptional-repressor-BetI	gnl\|CDD\|224228	COG1309, AcrR, Transcriptional regulator [Transcription].	2.16128e-09
LS483402.1\|SQG56934.1\|659675_660287_-\|Uncharacterised-protein	gnl\|CDD\|379205	pfam13470, PIN_3, PIN domain. Members of this family of bacterial domains are predicted to be RNases (from similarities to 5'-exonucleases).	3.13457e-05
LS483402.1\|SQG56926.1\|655235_656321_-\|Inositol-3-phosphate-synthase	gnl\|CDD\|132491	TIGR03450, mycothiol_INO1, inositol 1-phosphate synthase, Actinobacterial type. This enzyme, inositol 1-phosphate synthase as found in Actinobacteria, produces an essential precursor for several different products, including mycothiol, which is a glutathione analog, and phosphatidylinositol, which is a phospholipid.	0
LS483402.1\|SQG56956.1\|672690_673278_+\|nitroreductase	gnl\|CDD\|380327	cd03370, nitroreductase, uncharacterized nitroreductase family proteins. Nitroreductase family containing Thermus thermophilus NADH oxidase and other, uncharacterized proteins. Nitroreductase catalyzes the reduction of nitroaromatic compounds such as nitrotoluenes, nitrofurans and nitroimidazoles. This process requires NAD(P)H as electron donor in an obligatory two-electron transfer and uses FMN as cofactor. The enzyme is typically a homodimer.	7.49891e-28
LS483402.1\|SQG56942.1\|662992_664594_-\|CRISPR-associated-Cas1-family-protein	gnl\|CDD\|376633	pfam01867, Cas_Cas1, CRISPR associated protein Cas1. Clustered regularly interspaced short palindromic repeats (CRISPRs) are a family of DNA direct repeats found in many prokaryotic genomes. This family of proteins corresponds to Cas1, a CRISPR-associated protein. Cas1 may be involved in linking DNA segments to CRISPR.	5.18492e-99
LS483402.1\|SQG56921.1\|650471_653765_+\|periplasmic-alpha-amylase	gnl\|CDD\|200478	cd11339, AmyAc_bac_CMD_like_2, Alpha amylase catalytic domain found in bacterial cyclomaltodextrinases and related proteins. Cyclomaltodextrinase (CDase; EC3.2.1.54), neopullulanase (NPase; EC 3.2.1.135), and maltogenic amylase (MA; EC 3.2.1.133) catalyze the hydrolysis of alpha-(1,4) glycosidic linkages on a number of substrates including cyclomaltodextrins (CDs), pullulan, and starch. These enzymes hydrolyze CDs and starch to maltose and pullulan to panose by cleavage of alpha-1,4 glycosidic bonds whereas alpha-amylases essentially lack activity on CDs and pullulan. They also catalyze transglycosylation of oligosaccharides to the C3-, C4- or C6-hydroxyl groups of various acceptor sugar molecules. Since these proteins are nearly indistinguishable from each other, they are referred to as cyclomaltodextrinases (CMDs). This group of CMDs is bacterial. The Alpha-amylase family comprises the largest family of glycoside hydrolases (GH), with the majority of enzymes acting on starch, glycogen, and related oligo- and polysaccharides. These proteins catalyze the transformation of alpha-1,4 and alpha-1,6 glucosidic linkages with retention of the anomeric center. The protein is described as having 3 domains: A, B, C. A is a (beta/alpha) 8-barrel; B is a loop between the beta 3 strand and alpha 3 helix of A; C is the C-terminal extension characterized by a Greek key. The majority of the enzymes have an active site cleft found between domains A and B where a triad of catalytic residues (Asp, Glu and Asp) performs catalysis. Other members of this family have lost the catalytic activity as in the case of the human 4F2hc, or only have 2 residues that serve as the catalytic nucleophile and the acid/base, such as Thermus A4 beta-galactosidase with 2 Glu residues (GH42) and human alpha-galactosidase with 2 Asp residues (GH31). The family members are quite extensive and include: alpha amylase, maltosyltransferase, cyclodextrin glycotransferase, maltogenic amylase, neopullulanase, isoamylase, 1,4-alpha-D-glucan maltotetrahydrolase, 4-alpha-glucotransferase, oligo-1,6-glucosidase, amylosucrase, sucrose phosphorylase, and amylomaltase.	5.44827e-83
LS483402.1\|SQG56936.1\|660314_660722_-\|DNA-binding-domain-containing-protein	gnl\|CDD\|200128	TIGR01764, Probable_excisionase, DNA binding domain, excisionase family. An excisionase, or Xis protein, is a small protein that binds and promotes excisive recombination; it is not enzymatically active. This model represents a number of putative excisionases and related proteins from temperate phage, plasmids, and transposons, as well as DNA binding domains of other proteins, such as a DNA modification methylase. This model identifies mostly small proteins and N-terminal regions of large proteins, but some proteins appear to have two copies. This domain appears similar, in both sequence and predicted secondary structure (PSIPRED) to the MerR family of transcriptional regulators (pfam00376). [Unknown function, General].	1.6421e-07
LS483402.1\|SQG56932.1\|658152_659661_+\|putative-methyl-viologen-resistance-protein	gnl\|CDD\|129794	TIGR00711, Uncharacterized_MFS-type_transporter_YhcA, drug resistance transporter, EmrB/QacA subfamily. This subfamily of drug efflux proteins, a part of the major faciliator family, is predicted to have 14 potential membrane-spanning regions. Members with known activities include EmrB (multiple drug resistance efflux pump) in E. coli, FarB (antibacterial fatty acid resistance) in Neisseria gonorrhoeae, TcmA (tetracenomycin C resistance) in Streptomyces glaucescens, etc. In most cases, the efflux pump is described as having a second component encoded in the same operon, such as EmrA of E. coli. [Cellular processes, Toxin production and resistance, Transport and binding proteins, Other].	7.28296e-63
LS483402.1\|SQG56927.1\|656554_657310_-\|VIT-family	gnl\|CDD\|153123	cd02432, Nodulin-21_like_1, Nodulin-21 and CCC1-related protein family. Nodulin-21_like_1: This is a family of proteins closely related to nodulin-21, a plant nodule-specific protein that may be involved in symbiotic nitrogen fixation. This family is also related to CCC1, a yeast vacuole transmembrane protein that functions as an iron and manganese transporter. .	6.41116e-88
LS483402.1\|SQG56954.1\|671790_672597_-\|lipase-LipC	gnl\|CDD\|224001	COG1075, LipA, Predicted acetyltransferases and hydrolases with the alpha/beta hydrolase fold [General function prediction only].	1.34252e-40
LS483402.1\|SQG56948.1\|668308_669886_-\|CRISPR-associated-protein-GSU0054/csb2,-Dpsyc-system	gnl\|CDD\|274005	TIGR02165, CRISPR-associated_protein_GSU0054_family, CRISPR-associated protein GSU0054/csb2, Dpsyc system. This model represents a CRISPR-associated protein from the Dpsyc subtype (a type I-C variant), named for Desulfotalea psychrophila LSv54. CRISPR systems confer resistance in prokaryotes to invasive DNA or RNA, including phage and plasmids. CRISPR-associated proteins typically are found near CRISPR repeats and other CRISPR-associated proteins, have low levels of sequence identify, have sequence relationships that suggest lateral transfer, and show some sequence similarity to DNA-active proteins such as helicases and repair proteins.	2.17282e-62
LS483402.1\|SQG56958.1\|673359_673917_+\|anhydrase-family-3-protein	gnl\|CDD\|100051	cd04645, LbH_gamma_CA_like, Gamma carbonic anhydrase-like: This family is composed of gamma carbonic anhydrase (CA), Ferripyochelin Binding Protein (FBP), E. coli paaY protein, and similar proteins. CAs are zinc-containing enzymes that catalyze the reversible hydration of carbon dioxide in a two-step mechanism, involving the nucleophilic attack of a zinc-bound hydroxide ion on carbon dioxide, followed by the regeneration of the active site by ionization of the zinc-bound water molecule and removal of a proton from the active site. They are ubiquitous enzymes involved in fundamental processes like photosynthesis, respiration, pH homeostasis and ion transport. There are three evolutionary distinct groups - alpha, beta and gamma carbonic anhydrases - which show no significant sequence identity or structural similarity. Gamma CAs are trimeric enzymes with left-handed parallel beta helix (LbH) structural domain.	5.51228e-73
LS483402.1\|SQG56924.1\|653799_655179_+\|glycosyl-hydrolase-family-protein	gnl\|CDD\|119373	cd00599, GH25_muramidase, Endo-N-acetylmuramidases (muramidases) are lysozymes (also referred to as peptidoglycan hydrolases) that degrade bacterial cell walls by catalyzing the hydrolysis of 1,4-beta-linkages between N-acetylmuramic acid and N-acetyl-D-glucosamine residues. This family of muramidases contains a glycosyl hydrolase family 25 (GH25) catalytic domain and is found in bacteria, fungi, slime molds, round worms, protozoans and bacteriophages. The bacteriophage members are referred to as endolysins which are involved in lysing the host cell at the end of the replication cycle to allow release of mature phage particles. Endolysins are typically modular enzymes consisting of a catalytically active domain that hydrolyzes the peptidoglycan cell wall and a cell wall-binding domain that anchors the protein to the cell wall. Endolysins generally have narrow substrate specificities with either intra-species or intra-genus bacteriolytic activity.	2.11358e-65
LS483402.1\|SQG56946.1\|665634_668316_-\|CRISPR-associated-protein-Cas3	gnl\|CDD\|274235	TIGR02621, CRISPR-associated_helicase_Cas3, CRISPR-associated helicase Cas3, subtype Dpsyc. This model describes a CRISPR-associated putative DEAH-box helicase, or Cas3, of a subtype found in Actinomyces naeslundii MG1, Geobacter sulfurreducens PCA, Gemmata obscuriglobus UQM 2246, and Desulfotalea psychrophila. This protein includes both DEAH and HD motifs.	8.1999e-84
LS483402.1\|SQG56940.1\|662882_662996_-\|CRISPR-associated-protein-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	9.12673e-07

>LS483402.1|SQG56938.1|661305_661710_+|Uncharacterised-protein
MRKSLNRPSDSRENTDKKPLLFSKWYGIPFLEIALLVVTFIVDIFSSHYVGHIYAIIFISFVGLPILSLIPLRFFSVDLLFISLGVLGILILKFSGDTASVGLGWVSLFLLGLGISGVCCLTRRILANILTKTT
>LS483402.1|SQG56936.1|660314_660722_-|DNA-binding-domain-containing-protein
MTIQTEASLNLTTEDAKILTAFRHQLAGENPKITSKAGQEAPDQLIDIIRKVLDAVAYGRAISISQLPARITTTTAASMLGVSRPTVMKYIKQGKLSNTMVGSHHRLDTQEVLKLLNDRKEEMRRSVFEVLDLET
>LS483402.1|SQG56934.1|659675_660287_-|Uncharacterised-protein
MTTAAPNEYTPIPNSVLPDANIWFSTTLHAWIGLLAAETLGSWSFYWTEDILAEAIYHKRREYPKTSSHQIEAIRDRLMTVMAENRITGFAIDESVSYSDTFDAHVHSAAIHGRIQIIVTQDYKDFAGLYSNSDDCPYEVFTPDEFLLLVAESAPEAIDAVIEQQFSYYMQKSHSFNLVQKLISAGCPHFAEYVRTRLQALSP
>LS483402.1|SQG56932.1|658152_659661_+|putative-methyl-viologen-resistance-protein
MANTANRWAVLTILMIGVSLIVLDSTIVSVSLPTIITSLNLNLTDAQWVSSLYSVVFAALLLFTGTLGDKFGRVLIFRIGLIVFALASLLAAVAGSAALLILARGLQGVGGAMILPSTLATINTVFRDQERAQAFGIWGATMASMAAIGPLLGGWLTQSLSWHWIFLINIPIVIALLIAGHFVFGPDHKGAIVGFDVPGTLLSALALGLTVFGLIEGTSLGWWNSPVPFAIACGLIAAVLFIVLERARQRAGKPVLLDVRLFRIGSFSNGNITTLTVALGEFSALFVLPLYLISVLRLGTIHAGWVLATLALGSILSGAAARHLAATFGPAITVIIGLVLEVVGIAGAGLLIGPATSAPLIALVLAIYGAGVGLASAQLASVVLADVPVESSGMGSATQSTSRQLGSALGVAIAGTVLAIDVVRRVTEGLTNLGMTGPQAEQLAHATADSAGAAIPALAEKMGPDVGSVLSTAFADATSSVLYVSAGVLLLGLISAVRLAKR
>LS483402.1|SQG56930.1|657481_658114_-|transcriptional-repressor-BetI
MVSRYESIKTHSETLRASALMENMGSREENREKTQAAILDAAEALLREGGVEALTAGAVAQRVGLARNSLYRYVGSMDELRGRVILRHFPDYVDAINQAIHEATSPTEALCAYIEANLQIVAVENHGWLMELAQGVGGEAQANIAHIHRQLIKSLSNLLAPFNLDNPTLAAALIQGLLSTGFSALERGHDVQEVTALCAQGALGIVGKPR
>LS483402.1|SQG56927.1|656554_657310_-|VIT-family
MTFPDYTAAQPETQTQPETHKESSNRLNSRLNWLRAGVLGANDGIVSVSALILGVIATGVGHGAILAAGIAATVAGAISMALGEFVSVSAQRDSERMVMERERLELLHTPEEERHEIAKILSDYGMSEETALRAATEIGHNDPFPAHLRIEYGIDAQDLTSPWHAALSSAAAFTLGAILPLLMVVIAPQGNSTVGIIAVSSITIIALAVTGYLSAAIAGTSRMRSVLRLVIGGTLGLALTYVAGALFGGIV
>LS483402.1|SQG56926.1|655235_656321_-|Inositol-3-phosphate-synthase
MSNNRTIRVAIAGVGNCASSLIQGVEYYKDADPATNVPGLMHVQFGDYHVGDIEFVAAFDVDKEKVGLDLSQAINASENCTIKICDVPEQGVTIQRGPTLDGLGKYYRQTITESDTEPVDVVGTLKDVRADVLVSYLPVGSEEADKFYAQCAIDANVAFVNALPVFIASDPEWAEKFEKAGVPIVGDDIKSQVGATITHRVLAKLFEDRGVHLDRTMQLNVGGNMDFKNMLERERLESKKISKTQAVTSNLDQHIEAHDVHIGPSDYVGWLDDRKWAYVRLEGTAFGDVPLNLEYKLEVWDSPNSAGIIIDAIRAAKIAKDRRLGGPVFAASSYLMKSPPKQLRDEHARAELESFIAGDPS
>LS483402.1|SQG56924.1|653799_655179_+|glycosyl-hydrolase-family-protein
MLMAGMPRSADAGGVIGEVKRPKIFGALTGPFTCSKGWKYVFCAAIFQLGLKFFSVLRCEKAIIVTNVTYVTSGIIGRVAIMMKTRRLKTALCTVLASSTFAVASVQAIPLPFPIGASSGIDVSGHQHPNGSSINWQDVKSHGQSFAFVKATEGLGWTNDFYASDITQAAAQGLKVGSYHYARPGADARQQARHYAKVISHTPNHSLPPVLDLEVAEGKTPQELVNWTRDFVQELEKQTGRVPMIYTYRYFWIEQMANTTEFSQYPLWLAAYQAQVPGTVGGWDQIDFWQRSSSGRINGIVGDVDMNLFNGDDGELAAFAAGNLHAAGNKFASINLPELADLGKSAGGVVAVILALSAGAAAAPQLIQAAEAAGLSSEGAQDLTAVVQALAKAGKLPVDQLNKMASGNYTVGDLVILLDNAAHLAGIDAGQSSQAVMRADGLNIDANQVARVIRGLAAR
>LS483402.1|SQG56921.1|650471_653765_+|periplasmic-alpha-amylase
MKTYRCHARRIFTALTTLTLITAGGALSRPPAQAADPSSVVIAADFQTKAGCTKDWDPACSQTQMEKQGKFYSKKIKVPKGDWNFKVVLDKNWDTSYGAPGKGYERDNVPLKLAADAELEFIFDPESHHIGLRPTQITTGDHEVKPEDRELIKAPYRQNAAQNNFYFVLTDRFNNGDPKNDRGDASAEQGDRAQHGFDPTSKAFYHGGDIKGIIQKLDYIQGLGTTAIWLTPSFKNKAVQGTGNDASAGYHGYWITDFTQIDPHLGTNQDMKDLIKAAHEKGMKVYFDIVTNHTADLIQLAGGNGSNGSTYVSQQEQPYKDVNGKEFRLEDYAGKGASEFPKLNKESFPYTPQRTNPAEKMTPDWLNDVTLYHNRGNSMFDDGGESVIMGDFFGLDDLMTEHPTVVDGMTKIYNEWVDYGLDGFRIDTVKHVDLAFWKQWTERVHQHAVEKGMGDFFMFGEAYNFSPEALSPFVRETHMDAVLDFAFQNNAVDFAKGGDTNKLKSLFYGDDWYTTTRSDAAVLPTFLGNHDMGRIGSLLQKSGDGTERLRRDQLAHALLYLTRGQPVVYYGDEQGFAGSGSDKDARQDMFATKVTDVHNEQLVNGDQFGTGDHFNSEAPVAKTITELAKLRKENKALVEGAQIERYATQGAGIYAFSRVNREEKQEYLVALNNATTTRDVDLKALTPNAEFERVYISSIYGNEAPTSLTTDNEAKTHVTVPGLTAVVYKVKNGKQVTGSVSGGLNIVGQELKGDAPIMTTVGGNAWSETNFGWRKLGEKEWNYLGTDTGQDARIFHNVRDLEPGTVVEYRTVTVDGDNKETASHGWGVVGVDLAVDSRALSVSATTASATVPAAVVAGNFTKDLGCTGGQEGNWDPACAAAELRDDSSGWKTAELTLKPGEYEYKIATGGSWAQNYGALSEGTRESDEGVLNGKNVKFQVTQDKQKVTFFYHPETHEFFNTAEHRVITLPGTMGGALECPANVEKSDAYGNWGPACLATMLTRTGAHTYGTRLPKVPTPGDYQVKVAYDRDWQESYGPDGRGDSNYLVTVAESGKVLSYKWDEQTKKLTWTTSDQGASLVEDAAMPTELEESVALEN
>LS483402.1|SQG56919.1|649968_650190_+|Uncharacterised-protein
MSNFYKSQTIVRSMVAVIVGCWAYCLVVAPLLSERSYGEVMAEKSKDIGLGFTLAALLIGVMWLFVARRKSAE
>LS483402.1|SQG56940.1|662882_662996_-|CRISPR-associated-protein-Cas2
MRRDDVRRTIIAYDIAHDRRRNKLAKILQKYGDRCLC
>LS483402.1|SQG56942.1|662992_664594_-|CRISPR-associated-Cas1-family-protein
MQALIDPVPISLVVHTEYCERRTWLELNGEQTDTYQMQAGKSSHVHVDNLKTSTPHRQVSVKVWSDELGILGICDSLETLPDGTIRVVEFKATPVRKAPIVTDANRLQLALQGICLREMGYKKLEYAVYFTDHRKTIEVELSSADFEHAKNQALRTHEIAQASTSPIPLDEDPQCTWCSHLSVCLPDELFQRQPQRRVLAQNPDSQVLHLTEQGSRASKKNGRIEVHRKSELLGSVPIERVQAVVLHGNIDLSSALIRELAWQHRPVVWCSSTGRLYGWMLPGDGPNGLARVRQHVLAETGFIPIASEIISSKIYNQATMLRRHGSAKEAVASLRRLQETARTVNDIPSLFGVEGEAASKYFESFGSMLNDAALHGLGAQWLGRKGRGAQDHINVLLNYAYGMLTAECVRALIACGLDPHAGFLHSSNRNKPAAALDLMEEFRPVVADSVVLTLINRREISSRDFFIRDKGQALTTDGRKKIVKAFERRIQTQFKHPTFGYSVSWRRAIEVQARMMLGVLDGTQLRYKGVKIR
>LS483402.1|SQG56944.1|664598_665630_-|Uncharacterised-protein
MFTIDIAGDASSALSHFALLGLAAVAEEMGDNSVRLLWSLDSEPKAQLRSIYDPLLIAQRIRELATRWSEDSSWVKARKNYAGKQFAPFSPRIKAIDAEKSPHDWEEHHHIRTSHVDQLLADKRWLDLSFISALGEPSYWHNEKKAPRPDHGASRWEMKTRNRGEEFVQHRLSLMVDELSSWTNEDILAGIQGKQVHDPLGKNSPDSRTSTGLTPPGPTDVALAFVGLLGIASFQLAPQVKEKSVTPGAFPPQALHPVLMVLPMSSTPISLGRARSVLRSEAIACIGGELVRTGDIGTTAVVSASKWLLEHGINAVALFDIKKAGSSSAPERQVQPGSVLPLG
>LS483402.1|SQG56946.1|665634_668316_-|CRISPR-associated-protein-Cas3
MPSITFDAFFAELNDGHRPFAWQQRLVDAVIKTGTWPAQIVAPTGTGKSSVVDIHVYLNALYALGECPRVPRRLSVVVNRRALVDSHIDRAETILRTMQEAKAGSVLATLSQALTSLRSDAHQDPFIVSRLRGALTNKTLPVNSLEACAIIAATPDMWGSRALFRGYGSGRLARPRETALFTMDAVVLLDESHLNRQLLTTARRIAALQELEVDLHVPRLQVVAATATSTETLGLAQSIGVFEEDCERDPVIAQRIDSSKHLSLLKLKKWNGRPKNSEIIATAVEEVLRLCADADSTVGCIVNHVETATKIHRILKKKGLRSEILVGRMRPHDVAQMKARRPGLFTIQGSQEVDVLVATQTMEVGVDVDFAHLVTELAPGSSLTQRFGRVNRLGHRVRSEVSVLVPSTADAIKTDVPPYTRKDLLNSLAWLEQLAEAGTVNPRRLLELPAPEESPGRVLLQRLEWADLHNLCRTTDPLFAEPDLDLWLRDSLEKDPALGGVVVRSPLPEDFNAAVELLNATKPQDFETFPANIAVLNRLKDVLAPTDESFKQKASAVRHRAFLYRDSEVVLLDHDKPLRPTDILIIEPGTPFTTEGVASATPEDSELIDPAPLPGIDVHVFDSAMDKAEAESFKQIAAELSEDPEETTTESQRSKGFQCSTMVLETDHHHGFDAVVPWYITETDDAIRAEEEALQEWSPTSKTVTLQQHQADVAEQADNLCTSVGLRHDLHQIVVQAAAHHDDGKIEPRFQTWLRGGKTSDDQEPWAKSAQRNRQEIRRAKNISGVPPKWRHEQLSALKVAVQLGYDTPETELILRIVGCSHGHGRSTFPYSSWEMISPLATDQEQAVARHLFSEGEWDSIIERTNRTIGPYAMAYLEALQRAADAHVSSEGR
>LS483402.1|SQG56948.1|668308_669886_-|CRISPR-associated-protein-GSU0054/csb2,-Dpsyc-system
MPKYCLTARFPLGVYLGHTGDANRDAYPDPARLHAALMNAAAQGVHAEEDPNEHQLRPSQQSLQALQWLEAHPPTGLAMPEQQWLSPDTSRMMYRNVGSVKIDKTGVTRATENRAVSDGVSVNGAYGYIWDEMPVDIAEAITALLPDVACLGEASSLVVLEQQEIEATLTLDPQATAFSTERVQVRIALPGRTQHLREVFHARYGKKPPSKKADKFLKDDPIHDPPIPKDHLGTARYLRVNAADKECVTPWTKVILLEVHGKQLGAKEQVRAAVALHRALIARIRTDVSPVITGRYAAGAQRPANNLAIQYIPHRHLEALGLKTSAFALLVPQDADSTVYEQLNQALTGPFPLRSGGKLLCQLKYNGHVFRGDAFWPAPQPGTIRMWEPLNVFIPESRPHNKQQGVLWRLADAGLLSVAFVWRDNFPTKETGPARYVELRDAAYNADVRIFHDHPVSRNTRRFVHRTNRSLTIQPWRGLVHLGSLQQDRAIIALGQSRHLGGGLLIPVDIPRSEFETMTSEMTHA
>LS483402.1|SQG56950.1|669889_671095_-|CRISPR-associated-protein-GSU0053/csb1,-Dpsyc-system
MGTLSYTDLVKACSAGGSSVLTSITELEAAVGQHGSVAPAKFVNRSEPVFAFEDRFIDGESKRTVLIDSKQSQLNRAEAALMQAINEGNETLNRIPRIEVSYNDSKVFSDLELPHRFTDGHIRAGSIDGKPTTENDLYISARNSTPRNMKPLLNLAPSALIFGGWDASRKSDQVKLRSALVGEIIGVLANQNRAESYSRRGGARVDPVAASVKMTGTDLKETALVQSHELSQKTRSKLDNQVKKAKKGETISASSLGLGAILPSLDSLGGVACQRIIRSWALSFAALRQLRFGGTAEQDIAARALLAALGLAAMARAESELNIRANCDLVEQGKPVVTLDLRYGEKRELEPISVEAADELLKEAIAKASACGVADWEGQILHVTGNPVVLRGATEDDAEAE
>LS483402.1|SQG56952.1|671480_671732_+|Uncharacterised-protein
METNSIGASEEAYSMLSLAETIYGPGRVPRTASLVDLCSRVVGIGEIVRVQLSRAMPRLSLRMLRQRSGRSLLLRLELSLQRQ
>LS483402.1|SQG56954.1|671790_672597_-|lipase-LipC
MAIIDAPLPLSARLPARGLFEDDWRARPTSRHPYPVILIHGTGVTKGDWMELGTDLRKKGYAVFAPDFGMRSTAAVAESADQVGAYIHAVLKVTGAERVILVGHSQGGILARYWMHHLDGARYVTHLICLAVPNHGTSHGGVISPLTRTARGTVVVDSIITNFFGASGFEMLAESDLIQELNANGDTLPGIYYSCITTKSDTIIQPVESCFLTGPLVRNIYVQAVSKRAIVLHEDVPYDRRVRRIVLSELERVERLTAKKHVRTEHNT
>LS483402.1|SQG56956.1|672690_673278_+|nitroreductase
MSLTVAEAIANRRATRQYTEQEVSDAVLDVVVSQALQAPSAFNAQRADLVVIRDQAIKDKIFAASGQKQLRDAPVVLVTVARADVPEDLDEVLGVERATFVRNVLAKADAARLRETALKDAMLVAGFALIAAQGEGLATSPTTGWDEAKVLEAIGLADRSDRAVGLVIGMGYPAEFPAHPGRAESRRVNDGYARD
>LS483402.1|SQG56958.1|673359_673917_+|anhydrase-family-3-protein
MNSGPIILPFNGKTPRVHETAFIAPNATLIGDVEIAAHASVFYGCVLRADINMIRVGARTNVQDNSVLHVDGDAPCILGEDVTVGHMALVHGSTVGNGTLVGMHSALLSRSVIGAGSLIAAGAVVLEGQEIPAGSLAAGVPAQVRRVLSSEQSAGFIPHAGKYVNVASMHRELGMSLSLDQVRFS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NZ_CP029834	Azospirillum ramasamyi strain M2T2B2 plasmid unnamed4, complete sequence	74661-74692	6	0.812
LS483402_2	2.24\|587215\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	587215-587246	32	NC_027331	Citrobacter phage Moon, complete genome	45353-45384	6	0.812
LS483402_1	1.1\|16509\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16509-16540	32	MK448727	Streptococcus phage Javan291, complete genome	5947-5978	7	0.781
LS483402_1	1.1\|16509\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16509-16540	32	NC_050148	Pseudomonas virus Pa193, complete genome	8390-8421	7	0.781
LS483402_1	1.25\|17975\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17975-18006	32	NZ_CP016453	Sphingobium sp. RAC03 plasmid pBSY17_1, complete sequence	451802-451833	7	0.781
LS483402_1	1.30\|18280\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18280-18311	32	NZ_CP029830	Azospirillum ramasamyi strain M2T2B2 plasmid unnamed1, complete sequence	513867-513898	7	0.781
LS483402_1	1.33\|18463\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18463-18494	32	NC_006826	Sphingobium xenophagum QYY plasmid pSx-Qyy, complete sequence	4654-4685	7	0.781
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NC_010510	Methylobacterium radiotolerans JCM 2831 plasmid pMRAD01, complete sequence	212730-212761	7	0.781
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP015881	Ensifer adhaerens strain Casida A plasmid pCasidaAA, complete sequence	301490-301521	7	0.781
LS483402_2	2.16\|586727\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586727-586758	32	NZ_HG938356	Neorhizobium galegae bv. officinalis bv. officinalis str. HAMBI 1141 plasmid pHAMBI1141a, complete sequence	1378731-1378762	7	0.781
LS483402_2	2.16\|586727\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586727-586758	32	NZ_CP030761	Rhizobium leguminosarum strain ATCC 14479 plasmid unnamed1, complete sequence	1031353-1031384	7	0.781
LS483402_2	2.21\|587032\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	587032-587063	32	NZ_CP029831	Azospirillum ramasamyi strain M2T2B2 plasmid unnamed7, complete sequence	287607-287638	7	0.781
LS483402_1	1.7\|16876\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16876-16907	32	NZ_AP022593	Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence	1860981-1861012	8	0.75
LS483402_1	1.7\|16876\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16876-16907	32	NZ_CP054622	Azospirillum oryzae strain KACC 14407 plasmid unnamed7, complete sequence	36744-36775	8	0.75
LS483402_1	1.9\|16998\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16998-17029	32	NZ_CP019603	Croceicoccus marinus strain E4A9 plasmid pCME4A9I, complete sequence	106189-106220	8	0.75
LS483402_1	1.10\|17059\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17059-17090	32	NC_022044	Paracoccus aminophilus JCM 7686 plasmid pAMI6, complete sequence	165671-165702	8	0.75
LS483402_1	1.29\|18219\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18219-18250	32	NZ_KY000046	Agrobacterium genomosp. 1 strain CFBP2177 plasmid pTi_CFBP2177, complete sequence	21935-21966	8	0.75
LS483402_1	1.33\|18463\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18463-18494	32	NZ_CP020900	Rhizobium phaseoli Brasil 5 strain Bra5 plasmid pRphaBra5d, complete sequence	568297-568328	8	0.75
LS483402_2	2.1\|585810\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	585810-585841	32	MH779523	Lactococcus phage vB_Llc_bIBBAm4, complete genome	13391-13422	8	0.75
LS483402_2	2.1\|585810\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	585810-585841	32	NC_017060	Rahnella aquatilis HX2 plasmid PRA1, complete sequence	136330-136361	8	0.75
LS483402_2	2.1\|585810\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	585810-585841	32	NC_015062	Rahnella sp. Y9602 plasmid pRAHAQ01, complete sequence	139500-139531	8	0.75
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NZ_CP023068	Ensifer sojae CCBAU 05684 plasmid pSJ05684b, complete sequence	857324-857355	8	0.75
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NC_023497	Amycolatopsis keratiniphila plasmid pXL100, complete sequence	22077-22108	8	0.75
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NC_048068	Microbacterium phage OneinaGillian, complete genome	3594-3625	8	0.75
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	MT310894	Microbacterium phage Tempo, complete genome	3942-3973	8	0.75
LS483402_2	2.21\|587032\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	587032-587063	32	NC_014838	Pantoea sp. At-9b plasmid pPAT9B01, complete sequence	753803-753834	8	0.75
LS483402_2	2.21\|587032\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	587032-587063	32	NZ_CP012399	Chelatococcus sp. CO-6 plasmid pCO-6, complete sequence	251919-251950	8	0.75
LS483402_1	1.1\|16509\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16509-16540	32	NZ_CP041677	Lactobacillus reuteri strain LL7 plasmid unnamed, complete sequence	22008-22039	9	0.719
LS483402_1	1.5\|16754\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16754-16785	32	NZ_CP014175	Clostridium argentinense strain 89G plasmid pRSJ17_1, complete sequence	97930-97961	9	0.719
LS483402_1	1.9\|16998\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16998-17029	32	MN694099	Marine virus AFVG_250M963, complete genome	21854-21885	9	0.719
LS483402_1	1.9\|16998\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16998-17029	32	MN694466	Marine virus AFVG_250M969, complete genome	16159-16190	9	0.719
LS483402_1	1.9\|16998\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16998-17029	32	MN694378	Marine virus AFVG_250M964, complete genome	21909-21940	9	0.719
LS483402_1	1.9\|16998\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16998-17029	32	MN694090	Marine virus AFVG_250M1127, complete genome	15005-15036	9	0.719
LS483402_1	1.9\|16998\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16998-17029	32	MN694428	Marine virus AFVG_250M968, complete genome	16140-16171	9	0.719
LS483402_1	1.21\|17731\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17731-17762	32	MK448905	Streptococcus phage Javan318, complete genome	13299-13330	9	0.719
LS483402_1	1.25\|17975\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17975-18006	32	NZ_CP007144	Hymenobacter swuensis DY53 plasmid pHsw1, complete sequence	157812-157843	9	0.719
LS483402_1	1.27\|18097\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18097-18128	32	AP014287	Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S24-C25, * SEQUENCING IN PROGRESS *	24844-24875	9	0.719
LS483402_1	1.32\|18402\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18402-18433	32	NZ_CP032703	Pantoea dispersa strain DSM 32899 plasmid unnamed1, complete sequence	356170-356201	9	0.719
LS483402_1	1.33\|18463\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18463-18494	32	NZ_CP045339	Vibrio sp. THAF190c plasmid pTHAF190c_a, complete sequence	1117986-1118017	9	0.719
LS483402_2	2.4\|585993\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	585993-586024	32	MK605246	Nodularia phage vB_NspS-kac68v162, complete genome	5128-5159	9	0.719
LS483402_2	2.4\|585993\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	585993-586024	32	NC_048757	Nodularia phage vB_NspS-kac68v161, complete genome	5128-5159	9	0.719
LS483402_2	2.5\|586054\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586054-586085	32	MK605246	Nodularia phage vB_NspS-kac68v162, complete genome	5128-5159	9	0.719
LS483402_2	2.5\|586054\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586054-586085	32	NC_048757	Nodularia phage vB_NspS-kac68v161, complete genome	5128-5159	9	0.719
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NZ_CP013635	Rhizobium sp. N324 plasmid pRspN324e, complete sequence	149950-149981	9	0.719
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NZ_LR134451	Tsukamurella tyrosinosolvens strain NCTC13231 plasmid 9, complete sequence	48044-48075	9	0.719
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NZ_CP048816	Caulobacter rhizosphaerae strain KCTC 52515 plasmid unnamed	171858-171889	9	0.719
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP036488	Rahnella aquatilis strain MEM40 plasmid pMEM40-1, complete sequence	108405-108436	9	0.719
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP032297	Rahnella aquatilis strain ZF7 plasmid pRAZF7, complete sequence	460873-460904	9	0.719
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NC_017060	Rahnella aquatilis HX2 plasmid PRA1, complete sequence	184336-184367	9	0.719
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP034838	Rahnella aquatilis strain KM12 plasmid pKM12v1, complete sequence	173738-173769	9	0.719
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP034839	Rahnella aquatilis strain KM25 plasmid pKM12v2, complete sequence	173738-173769	9	0.719
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP034837	Rahnella aquatilis strain KM05 plasmid pKM05, complete sequence	134061-134092	9	0.719
LS483402_2	2.13\|586544\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586544-586575	32	NZ_CP014068	Enterococcus gallinarum strain FDAARGOS_163 plasmid unnamed, complete sequence	7089-7120	9	0.719
LS483402_2	2.17\|586788\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586788-586819	32	NZ_CP018222	Tardibacter chloracetimidivorans strain JJ-A5 plasmid pHSL1, complete sequence	77545-77576	9	0.719
LS483402_2	2.19\|586910\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586910-586941	32	NZ_CP051207	Dolichospermum flos-aquae CCAP 1403/13F plasmid pAfl69, complete sequence	29362-29393	9	0.719
LS483402_2	2.20\|586971\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586971-587002	32	KU160494	Vibrio phage vB_VmeM-32, complete genome	103841-103872	9	0.719
LS483402_2	2.21\|587032\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	587032-587063	32	NC_041921	Dinoroseobacter phage vB_DshS-R5C, complete genome	19420-19451	9	0.719
LS483402_1	1.1\|16509\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16509-16540	32	NZ_CP021033	Rhizobium sp. NXC14 plasmid pRspNXC14c, complete sequence	566801-566832	10	0.688
LS483402_1	1.9\|16998\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	16998-17029	32	MN694728	Marine virus AFVG_250M962, complete genome	15616-15647	10	0.688
LS483402_1	1.10\|17059\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17059-17090	32	NZ_HG938357	Neorhizobium galegae bv. officinalis bv. officinalis str. HAMBI 1141 plasmid pHAMBI1141b, complete sequence	135949-135980	10	0.688
LS483402_1	1.10\|17059\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17059-17090	32	NC_019919	Yersinia phage phiR201 complete genome	83163-83194	10	0.688
LS483402_1	1.16\|17426\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17426-17457	32	KX889311	Pseudomonas aeruginosa plasmid pJB12, complete sequence	19899-19930	10	0.688
LS483402_1	1.17\|17487\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17487-17518	32	CP053403	Salmonella enterica strain 2010K-2057 plasmid unnamed1, complete sequence	77025-77056	10	0.688
LS483402_1	1.17\|17487\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17487-17518	32	NZ_CP019182	Salmonella enterica subsp. enterica serovar Inverness str. ATCC 10720 plasmid pATCC10720, complete sequence	74860-74891	10	0.688
LS483402_1	1.20\|17670\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17670-17701	32	CP034582	Lactococcus lactis subsp. lactis strain C10 plasmid pC10B, complete sequence	23883-23914	10	0.688
LS483402_1	1.20\|17670\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17670-17701	32	CP029292	Lactococcus lactis subsp. lactis KLDS 4.0325 plasmid unnamed5	39892-39923	10	0.688
LS483402_1	1.24\|17914\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17914-17945	32	NZ_AP017962	Synechococcus sp. NIES-970 plasmid plasmid3 DNA, complete sequence	62920-62951	10	0.688
LS483402_1	1.32\|18402\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18402-18433	32	NZ_CP020848	Klebsiella variicola strain KPN1481 plasmid pKPN1481-1, complete sequence	134018-134049	10	0.688
LS483402_1	1.32\|18402\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18402-18433	32	NZ_CP009856	UNVERIFIED_ORG: Enterobacter cloacae strain ECNIH5 plasmid pENT-784, complete sequence	60965-60996	10	0.688
LS483402_1	1.32\|18402\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18402-18433	32	NZ_CP008898	Enterobacter hormaechei subsp. hoffmannii ECNIH3 plasmid pENT-576, complete sequence	15674-15705	10	0.688
LS483402_2	2.8\|586238\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586238-586269	32	NC_020548	Azoarcus sp. KH32C plasmid pAZKH, complete sequence	250469-250500	10	0.688
LS483402_2	2.12\|586483\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586483-586514	32	NC_023285	Streptomyces sp. F8 plasmid pFRL5, complete sequence	381918-381949	10	0.688
LS483402_1	1.16\|17426\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17426-17457	32	NC_031230	Gordonia phage Yvonnetastic, complete genome	89747-89778	11	0.656
LS483402_1	1.24\|17914\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17914-17945	32	NZ_CP019984	Pediococcus inopinatus strain DSM 20285 plasmid pLDW-14, complete sequence	3045-3076	11	0.656
LS483402_1	1.24\|17914\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17914-17945	32	NZ_CP019984	Pediococcus inopinatus strain DSM 20285 plasmid pLDW-14, complete sequence	17644-17675	11	0.656
LS483402_1	1.24\|17914\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	17914-17945	32	NZ_CP019984	Pediococcus inopinatus strain DSM 20285 plasmid pLDW-14, complete sequence	32248-32279	11	0.656
LS483402_1	1.30\|18280\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	18280-18311	32	NZ_CP017565	Paraburkholderia sprentiae WSM5005 plasmid pl2WSM5005, complete sequence	373868-373899	11	0.656
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP049159	Caballeronia sp. SBC1 plasmid pSBC1_3, complete sequence	293424-293455	11	0.656
LS483402_2	2.10\|586360\|32\|LS483402\|PILER-CR,CRISPRCasFinder,CRT	586360-586391	32	NZ_CP049319	Caballeronia sp. SBC2 plasmid pSBC2-3, complete sequence	87020-87051	11	0.656

1. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP029834 (Azospirillum ramasamyi strain M2T2B2 plasmid unnamed4, complete sequence) position: , mismatch: 6, identity: 0.812

cgcccctaccggcgcgacccgcaaggacgccg-	CRISPR spacer
cgccccgtccggcgcgacccgc-accacgtcga	Protospacer
******  ************** *  ***.**

2. spacer 2.24|587215|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_027331 (Citrobacter phage Moon, complete genome) position: , mismatch: 6, identity: 0.812

---cgggcaaaaacatgagctccgaaagcatatct	CRISPR spacer
acccg---agaatcattagctccgaaagcatatct	Protospacer
   **   *.** *** ******************

3. spacer 1.1|16509|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MK448727 (Streptococcus phage Javan291, complete genome) position: , mismatch: 7, identity: 0.781

cgggttgatcgatttgaaagctgaacgtgata	CRISPR spacer
tgtgttgattgatttgaaagctggacggagta	Protospacer
.* ******.*************.*** ..**

4. spacer 1.1|16509|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_050148 (Pseudomonas virus Pa193, complete genome) position: , mismatch: 7, identity: 0.781

cgggttgatcgatttgaaagctgaacgtgata	CRISPR spacer
ggcgatgatcgatctgaaagctgaacttgcca	Protospacer
 * * ********.************ ** .*

5. spacer 1.25|17975|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP016453 (Sphingobium sp. RAC03 plasmid pBSY17_1, complete sequence) position: , mismatch: 7, identity: 0.781

ggtgccaatggcgggctggtagctgtctacca	CRISPR spacer
ggcacggaaggcgggcaggtagctgtcttcca	Protospacer
**..* .* ******* *********** ***

6. spacer 1.30|18280|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP029830 (Azospirillum ramasamyi strain M2T2B2 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.781

tgttgaatctggcatcgacgaagacggaaagc	CRISPR spacer
tctggaatctcggatcgacgaagacggcgggc	Protospacer
* * ****** * ************** ..**

7. spacer 1.33|18463|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_006826 (Sphingobium xenophagum QYY plasmid pSx-Qyy, complete sequence) position: , mismatch: 7, identity: 0.781

atcattgcccagctcacgagcacgctcggcgg	CRISPR spacer
ctcctgtgcctgctcacgggcacgctcggcgg	Protospacer
 ** *   ** *******.*************

8. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_010510 (Methylobacterium radiotolerans JCM 2831 plasmid pMRAD01, complete sequence) position: , mismatch: 7, identity: 0.781

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
cgccccgaccggcgcgaaccgcacgctgaccg	Protospacer
****** ********** ***** *   .***

9. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP015881 (Ensifer adhaerens strain Casida A plasmid pCasidaAA, complete sequence) position: , mismatch: 7, identity: 0.781

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cctcggggcggcgatccagatcactgcgaaca	Protospacer
 ***    ******** ****** ********

10. spacer 2.16|586727|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_HG938356 (Neorhizobium galegae bv. officinalis bv. officinalis str. HAMBI 1141 plasmid pHAMBI1141a, complete sequence) position: , mismatch: 7, identity: 0.781

ccaatcatggcacgtgaccagcgcttctacgg	CRISPR spacer
gcaaccatggcacgggaccagcgcttcaagct	Protospacer
 ***.********* ************ *

11. spacer 2.16|586727|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP030761 (Rhizobium leguminosarum strain ATCC 14479 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.781

-ccaatcatggcacgtgaccagcgcttctacgg	CRISPR spacer
tctggtcg-ggcacgtgaccagcgcgtctgcgg	Protospacer
 *...**. **************** ***.***

12. spacer 2.21|587032|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP029831 (Azospirillum ramasamyi strain M2T2B2 plasmid unnamed7, complete sequence) position: , mismatch: 7, identity: 0.781

tcgggaa---gctctttcaccgtggcgatgatgtt	CRISPR spacer
---gaaaccggctcgttcaccgtggcgatgatgcg	Protospacer
   *.**   **** ******************.

13. spacer 1.7|16876|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_AP022593 (Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence) position: , mismatch: 8, identity: 0.75

aaaaagggcaaagttgatcaggtacgtgtggg	CRISPR spacer
gataagggcaaagtcgatcaggtgcggctgaa	Protospacer
.* ***********.********.**  **..

14. spacer 1.7|16876|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP054622 (Azospirillum oryzae strain KACC 14407 plasmid unnamed7, complete sequence) position: , mismatch: 8, identity: 0.75

aaaaagggcaaagttgatcaggtacgtgtggg	CRISPR spacer
aaaaagggcgaagtggatcaggtctccgtcga	Protospacer
*********.**** ******** . .** *.

15. spacer 1.9|16998|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP019603 (Croceicoccus marinus strain E4A9 plasmid pCME4A9I, complete sequence) position: , mismatch: 8, identity: 0.75

caatcgcaacagcacctataccatcgacttca	CRISPR spacer
caatcgcaacatcaactataccaatatctgcc	Protospacer
*********** ** ******** .. ** *

16. spacer 1.10|17059|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_022044 (Paracoccus aminophilus JCM 7686 plasmid pAMI6, complete sequence) position: , mismatch: 8, identity: 0.75

tcgcgccttcagctcttctatctccgcaagaa	CRISPR spacer
ggcaaccttcagctcttcgatctcggcaagac	Protospacer
    .************* ***** ******

17. spacer 1.29|18219|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_KY000046 (Agrobacterium genomosp. 1 strain CFBP2177 plasmid pTi_CFBP2177, complete sequence) position: , mismatch: 8, identity: 0.75

cttggacgtgtcccgatcgtcatgatgattaa	CRISPR spacer
tatggaagtgtccagatcgtcatgatcgatag	Protospacer
. **** ****** ************ . **.

18. spacer 1.33|18463|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP020900 (Rhizobium phaseoli Brasil 5 strain Bra5 plasmid pRphaBra5d, complete sequence) position: , mismatch: 8, identity: 0.75

atcattgcccagctcacgagcacgctcggcgg	CRISPR spacer
gccgtggtccagctcgcgatcacgctcggcgc	Protospacer
..*.* *.*******.*** ***********

19. spacer 2.1|585810|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MH779523 (Lactococcus phage vB_Llc_bIBBAm4, complete genome) position: , mismatch: 8, identity: 0.75

gttctggacaactctcttctttgtctttatag	CRISPR spacer
gcattctccaactttcttctttgtctttaaag	Protospacer
*. .*   *****.*************** **

20. spacer 2.1|585810|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_017060 (Rahnella aquatilis HX2 plasmid PRA1, complete sequence) position: , mismatch: 8, identity: 0.75

-gttctggacaactctcttctttgtctttatag	CRISPR spacer
cgcgatag-caactctcttctttgtatttttaa	Protospacer
 *.  *.* **************** *** **.

21. spacer 2.1|585810|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_015062 (Rahnella sp. Y9602 plasmid pRAHAQ01, complete sequence) position: , mismatch: 8, identity: 0.75

-gttctggacaactctcttctttgtctttatag	CRISPR spacer
cgcgatag-caactctcttctttgtatttttaa	Protospacer
 *.  *.* **************** *** **.

22. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP023068 (Ensifer sojae CCBAU 05684 plasmid pSJ05684b, complete sequence) position: , mismatch: 8, identity: 0.75

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
tcgcctggccggcgcgaccagccaggacgccg	Protospacer
.  **. .*********** ** *********

23. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_023497 (Amycolatopsis keratiniphila plasmid pXL100, complete sequence) position: , mismatch: 8, identity: 0.75

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
cgagctgcgcgccgcgacccgcaaggccgccg	Protospacer
**  *.   ** ************** *****

24. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_048068 (Microbacterium phage OneinaGillian, complete genome) position: , mismatch: 8, identity: 0.75

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
cgccactaccggctcgacccgcacgtgcccta	Protospacer
**** ******** ********* * .* *..

25. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MT310894 (Microbacterium phage Tempo, complete genome) position: , mismatch: 8, identity: 0.75

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
cgccactaccggctcgacccgcacgtgcccta	Protospacer
**** ******** ********* * .* *..

26. spacer 2.21|587032|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_014838 (Pantoea sp. At-9b plasmid pPAT9B01, complete sequence) position: , mismatch: 8, identity: 0.75

tcgggaagctctttcaccgtggcgatgatgtt	CRISPR spacer
taatccagctctttcaacatggcgatgatgct	Protospacer
* .   ********** *.***********.*

27. spacer 2.21|587032|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP012399 (Chelatococcus sp. CO-6 plasmid pCO-6, complete sequence) position: , mismatch: 8, identity: 0.75

tcgggaagctctttcaccgtggcgatgatgtt	CRISPR spacer
tccgcctgctccttcaccgcggcgatgatgcg	Protospacer
** *   ****.*******.**********.

28. spacer 1.1|16509|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP041677 (Lactobacillus reuteri strain LL7 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

cgggttgatcgatttgaaagctgaacgtgata	CRISPR spacer
gtaacttatcgatttgaaagcctaacgtgatt	Protospacer
  ...* **************. ********

29. spacer 1.5|16754|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP014175 (Clostridium argentinense strain 89G plasmid pRSJ17_1, complete sequence) position: , mismatch: 9, identity: 0.719

ttacaggccgaggagttatttttcatggctaa	CRISPR spacer
gttaataatgaggatttatttttcatagctaa	Protospacer
 *  * . .***** ***********.*****

30. spacer 1.9|16998|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MN694099 (Marine virus AFVG_250M963, complete genome) position: , mismatch: 9, identity: 0.719

caatcgcaacagcacctataccatcgacttca	CRISPR spacer
gagctgcaacagcagctataccatctactaag	Protospacer
 *...********* ********** ***  .

31. spacer 1.9|16998|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MN694466 (Marine virus AFVG_250M969, complete genome) position: , mismatch: 9, identity: 0.719

caatcgcaacagcacctataccatcgacttca	CRISPR spacer
gagctgcaacagcagctataccatctactaag	Protospacer
 *...********* ********** ***  .

32. spacer 1.9|16998|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MN694378 (Marine virus AFVG_250M964, complete genome) position: , mismatch: 9, identity: 0.719

caatcgcaacagcacctataccatcgacttca	CRISPR spacer
gagctgcaacagcagctataccatctactaag	Protospacer
 *...********* ********** ***  .

33. spacer 1.9|16998|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MN694090 (Marine virus AFVG_250M1127, complete genome) position: , mismatch: 9, identity: 0.719

caatcgcaacagcacctataccatcgacttca	CRISPR spacer
gagctgcaacagcagctataccatctactaag	Protospacer
 *...********* ********** ***  .

34. spacer 1.9|16998|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MN694428 (Marine virus AFVG_250M968, complete genome) position: , mismatch: 9, identity: 0.719

caatcgcaacagcacctataccatcgacttca	CRISPR spacer
gagctgcaacagcagctataccatctactaag	Protospacer
 *...********* ********** ***  .

35. spacer 1.21|17731|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MK448905 (Streptococcus phage Javan318, complete genome) position: , mismatch: 9, identity: 0.719

caatcggctggcctatagtgttcaaaacttcc	CRISPR spacer
tagcatgctggcatatagttttcaaaactatc	Protospacer
.*..  ****** ****** ********* .*

36. spacer 1.25|17975|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP007144 (Hymenobacter swuensis DY53 plasmid pHsw1, complete sequence) position: , mismatch: 9, identity: 0.719

ggtgccaatggcgggctggtagctgtctacca	CRISPR spacer
gccctccttgacgggctggtagctgactaccc	Protospacer
* . .*  **.************** *****

37. spacer 1.27|18097|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to AP014287 (Uncultured Mediterranean phage uvMED isolate uvMED-GF-U-MedDCM-OCT-S24-C25, *** SEQUENCING IN PROGRESS ***) position: , mismatch: 9, identity: 0.719

atcaacggtgagctgcgaaataagctcggcgc	CRISPR spacer
atcaacggtgagatgagaaataaagaagctga	Protospacer
************ ** *******.   * .*

38. spacer 1.32|18402|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP032703 (Pantoea dispersa strain DSM 32899 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.719

ctacaaacttttctgcaaacgccacctcctca	CRISPR spacer
ccatcgcctgttctgcaaacgccacttcctgt	Protospacer
*.*. . ** ***************.****

39. spacer 1.33|18463|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP045339 (Vibrio sp. THAF190c plasmid pTHAF190c_a, complete sequence) position: , mismatch: 9, identity: 0.719

atcattgcccagctcacgagcacgctcggcgg	CRISPR spacer
ggcaatgcccagctcactagcacgcccattcg	Protospacer
. ** ************ *******.*. . *

40. spacer 2.4|585993|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MK605246 (Nodularia phage vB_NspS-kac68v162, complete genome) position: , mismatch: 9, identity: 0.719

gcttatcagccacacgcataccaacaagggct	CRISPR spacer
acttatcagccacactcacaccaaaagctaat	Protospacer
.************** **.***** *.  . *

41. spacer 2.4|585993|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_048757 (Nodularia phage vB_NspS-kac68v161, complete genome) position: , mismatch: 9, identity: 0.719

gcttatcagccacacgcataccaacaagggct	CRISPR spacer
acttatcagccacactcacaccaaaagctaat	Protospacer
.************** **.***** *.  . *

42. spacer 2.5|586054|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MK605246 (Nodularia phage vB_NspS-kac68v162, complete genome) position: , mismatch: 9, identity: 0.719

gcttatcagccacacgcataccaacaagggct	CRISPR spacer
acttatcagccacactcacaccaaaagctaat	Protospacer
.************** **.***** *.  . *

43. spacer 2.5|586054|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_048757 (Nodularia phage vB_NspS-kac68v161, complete genome) position: , mismatch: 9, identity: 0.719

gcttatcagccacacgcataccaacaagggct	CRISPR spacer
acttatcagccacactcacaccaaaagctaat	Protospacer
.************** **.***** *.  . *

44. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP013635 (Rhizobium sp. N324 plasmid pRspN324e, complete sequence) position: , mismatch: 9, identity: 0.719

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
gatcgttaccggcgcgacccgcgaggaagcgt	Protospacer
 ..* .****************.**** **

45. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LR134451 (Tsukamurella tyrosinosolvens strain NCTC13231 plasmid 9, complete sequence) position: , mismatch: 9, identity: 0.719

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
catcgtgaccggcgcgacccgccaggaggcgc	Protospacer
*..* . *************** **** **

46. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP048816 (Caulobacter rhizosphaerae strain KCTC 52515 plasmid unnamed) position: , mismatch: 9, identity: 0.719

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
tcccggcttcggcgtgaccagcaaggacgccg	Protospacer
. **  . .*****.**** ************

47. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP036488 (Rahnella aquatilis strain MEM40 plasmid pMEM40-1, complete sequence) position: , mismatch: 9, identity: 0.719

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
caggccgagggcgatcacgaacaatgcgaaca	Protospacer
    **   ******** ** ***********

48. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP032297 (Rahnella aquatilis strain ZF7 plasmid pRAZF7, complete sequence) position: , mismatch: 9, identity: 0.719

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cagaccgagggcgatcacgaacaatgcgaaca	Protospacer
    **   ******** ** ***********

49. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_017060 (Rahnella aquatilis HX2 plasmid PRA1, complete sequence) position: , mismatch: 9, identity: 0.719

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cagaccgagggcgatcacgaacaatgcgaaca	Protospacer
    **   ******** ** ***********

50. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034838 (Rahnella aquatilis strain KM12 plasmid pKM12v1, complete sequence) position: , mismatch: 9, identity: 0.719

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cagaccgagggcgatcacgaacaatgcgaaca	Protospacer
    **   ******** ** ***********

51. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034839 (Rahnella aquatilis strain KM25 plasmid pKM12v2, complete sequence) position: , mismatch: 9, identity: 0.719

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cagaccgagggcgatcacgaacaatgcgaaca	Protospacer
    **   ******** ** ***********

52. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP034837 (Rahnella aquatilis strain KM05 plasmid pKM05, complete sequence) position: , mismatch: 9, identity: 0.719

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cagaccgagggcgatcacgaacaatgcgaaca	Protospacer
    **   ******** ** ***********

53. spacer 2.13|586544|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP014068 (Enterococcus gallinarum strain FDAARGOS_163 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

cagcttcccctaaaggagaaaattctatgtat	CRISPR spacer
tagcttcctctaaagtagaaaatttttcgata	Protospacer
.*******.****** ********.* .*

54. spacer 2.17|586788|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP018222 (Tardibacter chloracetimidivorans strain JJ-A5 plasmid pHSL1, complete sequence) position: , mismatch: 9, identity: 0.719

caattgatccaatgtgtcctcgatgctcattg	CRISPR spacer
gcaaggatcgaatgtgtcctcgacgctcaggc	Protospacer
  *  **** *************.*****

55. spacer 2.19|586910|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP051207 (Dolichospermum flos-aquae CCAP 1403/13F plasmid pAfl69, complete sequence) position: , mismatch: 9, identity: 0.719

ttaagattcgatcacaatttctaaccacatgc	CRISPR spacer
ttctgattctatcaaaatttctaaccagtatt	Protospacer
**  ***** **** ************    .

56. spacer 2.20|586971|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to KU160494 (Vibrio phage vB_VmeM-32, complete genome) position: , mismatch: 9, identity: 0.719

ggctttggcaggcaaagcgccggtttcgcatc	CRISPR spacer
aaaattggcaggcagagcgtcggtttctcgtg	Protospacer
..  **********.****.******* *.*

57. spacer 2.21|587032|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_041921 (Dinoroseobacter phage vB_DshS-R5C, complete genome) position: , mismatch: 9, identity: 0.719

tcgggaagctctttcaccgtggcgatgatgtt	CRISPR spacer
aggaaagcctctttcaccttgtcgatgatgtc	Protospacer
  *..*. ********** ** *********.

58. spacer 1.1|16509|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP021033 (Rhizobium sp. NXC14 plasmid pRspNXC14c, complete sequence) position: , mismatch: 10, identity: 0.688

cgggttgatcgatttgaaagctgaacgtgata	CRISPR spacer
atcgtcgatcgatttgaaagctgtaccgacga	Protospacer
   **.***************** **  .  *

59. spacer 1.9|16998|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to MN694728 (Marine virus AFVG_250M962, complete genome) position: , mismatch: 10, identity: 0.688

caatcgcaacagcacctataccatcgacttca	CRISPR spacer
gagctgcaacagcagctataccatctaccagg	Protospacer
 *...********* ********** **.  .

60. spacer 1.10|17059|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_HG938357 (Neorhizobium galegae bv. officinalis bv. officinalis str. HAMBI 1141 plasmid pHAMBI1141b, complete sequence) position: , mismatch: 10, identity: 0.688

tcgcgccttcagctcttctatctccgcaagaa	CRISPR spacer
cgccgcctgcagctcttctatcaccggcccac	Protospacer
.  ***** ************* ***    *

61. spacer 1.10|17059|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_019919 (Yersinia phage phiR201 complete genome) position: , mismatch: 10, identity: 0.688

tcgcgccttcagctcttctatctccgcaagaa	CRISPR spacer
cttagccttcagctcttttatttccgcctcta	Protospacer
..  *************.***.*****    *

62. spacer 1.16|17426|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to KX889311 (Pseudomonas aeruginosa plasmid pJB12, complete sequence) position: , mismatch: 10, identity: 0.688

gggaggccacatcgcgggctatgtctgcggat	CRISPR spacer
tcagcgccacgtcgcgggcaatgtctgcgtcg	Protospacer
  .. *****.******** *********

63. spacer 1.17|17487|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to CP053403 (Salmonella enterica strain 2010K-2057 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

attaagcgttttgagggaaggtgaaagcgata	CRISPR spacer
ttctggcgttttgaggaaaggtgtaagcacac	Protospacer
 *. .***********.****** ****.

64. spacer 1.17|17487|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP019182 (Salmonella enterica subsp. enterica serovar Inverness str. ATCC 10720 plasmid pATCC10720, complete sequence) position: , mismatch: 10, identity: 0.688

attaagcgttttgagggaaggtgaaagcgata	CRISPR spacer
ttctggcgttttgaggaaaggtgtaagcacac	Protospacer
 *. .***********.****** ****.

65. spacer 1.20|17670|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to CP034582 (Lactococcus lactis subsp. lactis strain C10 plasmid pC10B, complete sequence) position: , mismatch: 10, identity: 0.688

ccactccatgaaaacatcctcctatcaccaaa	CRISPR spacer
aatatttgagaaaacatacttctatcaccaaa	Protospacer
    *... ******** **.***********

66. spacer 1.20|17670|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to CP029292 (Lactococcus lactis subsp. lactis KLDS 4.0325 plasmid unnamed5) position: , mismatch: 10, identity: 0.688

ccactccatgaaaacatcctcctatcaccaaa	CRISPR spacer
aatatttgagaaaacatacttctatcaccaaa	Protospacer
    *... ******** **.***********

67. spacer 1.24|17914|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_AP017962 (Synechococcus sp. NIES-970 plasmid plasmid3 DNA, complete sequence) position: , mismatch: 10, identity: 0.688

gcgcccaatatctgccaaagcctccgatgtgc	CRISPR spacer
ctgcccaatatccgccaaatcctccagcattg	Protospacer
 .**********.****** *****....*

68. spacer 1.32|18402|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP020848 (Klebsiella variicola strain KPN1481 plasmid pKPN1481-1, complete sequence) position: , mismatch: 10, identity: 0.688

ctacaaacttttctgcaaacgccacctcctca	CRISPR spacer
gaatccgactttccgcaaacgccacgtcctca	Protospacer
  *.  . .****.*********** ******

69. spacer 1.32|18402|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP009856 (UNVERIFIED_ORG: Enterobacter cloacae strain ECNIH5 plasmid pENT-784, complete sequence) position: , mismatch: 10, identity: 0.688

ctacaaacttttctgcaaacgccacctcctca	CRISPR spacer
gaatccgactttccgcaaacgccacgtcctca	Protospacer
  *.  . .****.*********** ******

70. spacer 1.32|18402|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP008898 (Enterobacter hormaechei subsp. hoffmannii ECNIH3 plasmid pENT-576, complete sequence) position: , mismatch: 10, identity: 0.688

ctacaaacttttctgcaaacgccacctcctca	CRISPR spacer
gaatccgactttccgcaaacgccacgtcctca	Protospacer
  *.  . .****.*********** ******

71. spacer 2.8|586238|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_020548 (Azoarcus sp. KH32C plasmid pAZKH, complete sequence) position: , mismatch: 10, identity: 0.688

cgcccctaccggcgcgacccgcaaggacgccg	CRISPR spacer
gagcccgaccgtcgcgacccgcaaggcgagcc	Protospacer
 . *** **** **************  . *

72. spacer 2.12|586483|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_023285 (Streptomyces sp. F8 plasmid pFRL5, complete sequence) position: , mismatch: 10, identity: 0.688

atgaagacgccgtggagtacccagaaaacacg	CRISPR spacer
cgcaccacgccgtggaggacccagcaaaccgt	Protospacer
   *  *********** ****** ****

73. spacer 1.16|17426|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NC_031230 (Gordonia phage Yvonnetastic, complete genome) position: , mismatch: 11, identity: 0.656

gggaggccacatcgcgggctatgtctgcggat	CRISPR spacer
atagacccacatcccgggcgatgtctgcgacc	Protospacer
. ... ******* ***** *********. .

74. spacer 1.24|17914|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP019984 (Pediococcus inopinatus strain DSM 20285 plasmid pLDW-14, complete sequence) position: , mismatch: 11, identity: 0.656

gcgcccaatatctgccaaagcctccgatgtgc	CRISPR spacer
aacgataatatctgtcaaagcctccaatgatt	Protospacer
.    .********.**********.***  .

75. spacer 1.24|17914|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP019984 (Pediococcus inopinatus strain DSM 20285 plasmid pLDW-14, complete sequence) position: , mismatch: 11, identity: 0.656

gcgcccaatatctgccaaagcctccgatgtgc	CRISPR spacer
aacgataatatctgtcaaagcctccaatgatt	Protospacer
.    .********.**********.***  .

76. spacer 1.24|17914|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP019984 (Pediococcus inopinatus strain DSM 20285 plasmid pLDW-14, complete sequence) position: , mismatch: 11, identity: 0.656

gcgcccaatatctgccaaagcctccgatgtgc	CRISPR spacer
aacgataatatctgtcaaagcctccaatgatt	Protospacer
.    .********.**********.***  .

77. spacer 1.30|18280|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP017565 (Paraburkholderia sprentiae WSM5005 plasmid pl2WSM5005, complete sequence) position: , mismatch: 11, identity: 0.656

tgttgaatctggcatcgacgaagacggaaagc	CRISPR spacer
gcgcgaagctggcatcgacgaaaacggctgcg	Protospacer
   .*** **************.****  .

78. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP049159 (Caballeronia sp. SBC1 plasmid pSBC1_3, complete sequence) position: , mismatch: 11, identity: 0.656

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cgagcctgtggcgatcaagatcaatgccggtt	Protospacer
    *** .****************** ...

79. spacer 2.10|586360|32|LS483402|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP049319 (Caballeronia sp. SBC2 plasmid pSBC2-3, complete sequence) position: , mismatch: 11, identity: 0.656

gctccctccggcgatcaagatcaatgcgaaca	CRISPR spacer
cgagcctgtggcgatcaagatcaatgccggtt	Protospacer
    *** .****************** ...

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

154805 : 163269

Pandoravirus(33.33%)

protease,holin

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
SQG55916.1\|154805_156554_+\|holin	choline dehydrogenase	A0A1V0SI18	Klosneuvirus	1.2e-62	32.2
SQG55918.1\|156531_157200_-	pantoate--beta-alanine ligase	NA	NA	NA	NA
SQG55920.1\|157207_157594_-	Uncharacterised protein	NA	NA	NA	NA
SQG55922.1\|157590_158106_-	Uncharacterised protein	NA	NA	NA	NA
SQG55924.1\|158116_158563_-	Protein of uncharacterised function (DUF3180)	NA	NA	NA	NA
SQG55926.1\|158559_159015_-	2-amino-4-hydroxy-6- hydroxymethyldihydropteridinepyrophosphokinase	S4VNV0	Pandoravirus	1.1e-09	36.0
SQG55928.1\|159016_159358_-	D-erythro-7,8-dihydroneopterin triphosphate 2'-epimerase	NA	NA	NA	NA
SQG55930.1\|159344_160127_-	dihydropteroate synthase	A0A0B5J4J5	Pandoravirus	1.4e-20	32.1
SQG55932.1\|160128_160722_-	GTP cyclohydrolase I	A0A1W7AF02	Streptococcus_virus	8.6e-50	58.2
SQG55935.1\|160684_162691_-\|protease	ATP-dependent metalloprotease FtsH	E5EQU5	Bathycoccus_sp._RCC1105_virus	2.0e-111	50.7
SQG55937.1\|162687_163269_-	phosphoribosyltransferase	A0A218MMB5	uncultured_virus	3.9e-15	31.4

DBSCAN-SWA_2

1821504 : 1843481

Corynebacterium_phage(70.59%)

terminase,tail,protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
SQG58774.1\|1821504_1821843_-	Uncharacterised protein	A0A1W6JRH1	Corynebacterium_phage	9.9e-27	53.2
SQG58775.1\|1821839_1822304_-	Uncharacterised protein	A0A1W6JRF4	Corynebacterium_phage	1.8e-58	77.2
SQG58776.1\|1822309_1822639_-	Uncharacterised protein	NA	NA	NA	NA
SQG58777.1\|1822638_1823409_-	N-acetyl-anhydromuranmyl-L-alanine amidase	A0A2P1JY73	Gordonia_phage	1.5e-65	53.2
SQG58778.1\|1823456_1823756_-	Uncharacterised protein	NA	NA	NA	NA
SQG58779.1\|1823759_1824647_-	Uncharacterised protein	A0A1W6JRF8	Corynebacterium_phage	3.3e-29	58.2
SQG58780.1\|1824675_1825797_-	Uncharacterised protein	A0A1W6JRE7	Corynebacterium_phage	2.7e-76	47.7
SQG58781.1\|1825793_1826642_-	Uncharacterised protein	A0A1P8D5L4	Corynebacterium_phage	4.5e-52	40.1
SQG58782.1\|1826648_1827455_-	Uncharacterised protein	NA	NA	NA	NA
SQG58783.1\|1827462_1833075_-\|tail	Phage-related minor tail protein	A0A1W6JRG1	Corynebacterium_phage	1.5e-82	29.5
SQG58784.1\|1833086_1833410_-	Uncharacterised protein	NA	NA	NA	NA
SQG58785.1\|1833451_1833745_-	Uncharacterised protein	A0A1P8D5N6	Corynebacterium_phage	1.3e-11	42.3
SQG58786.1\|1833847_1834744_-	Uncharacterised protein	A0A1W6JRH0	Corynebacterium_phage	3.3e-13	52.3
SQG58787.1\|1834740_1835133_-	Uncharacterised protein	NA	NA	NA	NA
SQG58788.1\|1835132_1835423_-	Uncharacterised protein	NA	NA	NA	NA
SQG58789.1\|1835422_1835755_-	Uncharacterised protein	A0A1P8D5M1	Corynebacterium_phage	6.3e-10	43.1
SQG58790.1\|1835754_1836180_-	Phage protein Gp19/Gp15/Gp42	A0A1L6BZF5	Pasteurella_phage	3.9e-12	38.4
SQG58791.1\|1836195_1836549_-	Uncharacterised protein	NA	NA	NA	NA
SQG58792.1\|1836558_1837482_-	Uncharacterised protein	A0A023ZX65	Mycobacterium_phage	3.7e-23	28.6
SQG58793.1\|1837496_1837886_-	Uncharacterised protein	A0A166Y3D5	Gordonia_phage	1.3e-06	35.6
SQG58794.1\|1837897_1839292_-\|protease	ClpP protease	A0A1L6BZF6	Pasteurella_phage	1.4e-58	36.5
SQG58795.1\|1839288_1840659_-	Protein of uncharacterised function (DUF935)	A0A1P8D5N1	Corynebacterium_phage	5.5e-92	47.8
SQG58796.1\|1840670_1842230_-\|terminase	Phage terminase-like protein, large subunit	A0A1P8D5K9	Corynebacterium_phage	4.1e-99	46.6
SQG58797.1\|1842253_1842577_-\|terminase	putative phage terminase, small subunit, P27 family	NA	NA	NA	NA
SQG58798.1\|1842728_1843481_-	Uncharacterised protein	A0A1P8D5W0	Corynebacterium_phage	3.9e-47	33.1

DBSCAN-SWA_3

1846489 : 1855204

Corynebacterium_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
SQG58804.1\|1846489_1847845_-	non-specific serine/threonine protein kinase	A0A1L6BZE2	Pasteurella_phage	5.9e-179	66.0
SQG58805.1\|1847825_1848107_-	VRR-NUC domain	A0A2K5B272	Erysipelothrix_phage	6.3e-19	52.2
SQG58806.1\|1848419_1850879_-	DNA primase domain protein	A0A1W6JQ82	Corynebacterium_phage	9.1e-271	57.3
SQG58807.1\|1850898_1852884_-	DNA polymerase I	A0A1W6JQ98	Corynebacterium_phage	4.4e-223	58.4
SQG58808.1\|1852973_1853591_-	Protein of uncharacterised function (DUF2815)	A0A2K5B2A9	Erysipelothrix_phage	4.4e-41	50.3
SQG58809.1\|1853722_1855204_-	Protein of uncharacterised function (DUF2800)	A0A1W6JQ97	Corynebacterium_phage	1.0e-155	57.6

DBSCAN-SWA_4

1858326 : 1866480

Corynebacterium_phage(37.5%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
SQG58816.1\|1858326_1859085_-	anti-repressor protein Ant	A0A1L6BZH6	Pasteurella_phage	1.2e-91	65.5
SQG58817.1\|1859149_1859371_-	Uncharacterised protein	A0A1W6JQ99	Corynebacterium_phage	8.2e-14	62.9
SQG58818.1\|1859545_1860043_+	Uncharacterised protein	A0A1W6JQ81	Corynebacterium_phage	1.0e-51	64.2
SQG58819.1\|1860174_1860753_+	Predicted membrane protein	NA	NA	NA	NA
SQG58820.1\|1860745_1861117_+	Domain of uncharacterised function (DUF955)	A0A1W6JQ88	Corynebacterium_phage	7.7e-49	71.9
SQG58821.1\|1861312_1862494_+	site-specific tyrosine recombinase XerD	Q9ZWV7	Corynephage	8.2e-44	31.7
SQG58822.1\|1862526_1864158_-	ABC transporter ATP-binding protein	A0A1V0SKJ1	Klosneuvirus	3.1e-33	24.6
SQG58823.1\|1864268_1864748_-	phenylacetate-CoA oxygenase subunit PaaJ	NA	NA	NA	NA
SQG58824.1\|1864744_1865194_-	scaffold protein	A0A2P1CJL8	Mycobacterium_phage	9.1e-20	41.7
SQG58825.1\|1865190_1866480_-	cysteine sulfinate desulfinase	Q2XUY6	environmental_halophage	6.1e-101	43.0

DBSCAN-SWA_5

2415298 : 2451328

Agrobacterium_phage(28.57%)

tRNA,protease,bacteriocin

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
SQG59314.1\|2415298_2418055_-\|tRNA	valyl-tRNA synthetase	A0A1V0S951	Catovirus	2.3e-137	38.4
SQG59315.1\|2418199_2419180_-	Malate dehydrogenase	NA	NA	NA	NA
SQG59316.1\|2419795_2420554_+	TetR family transcriptional regulator	NA	NA	NA	NA
SQG59317.1\|2420614_2421901_-\|protease	ATP-dependent protease ATP-binding subunit ClpX	G3M9Z9	Bacillus_virus	5.1e-132	55.6
SQG59318.1\|2422063_2424826_-	putative p-aminobenzoic acid synthase	S4VNU7	Pandoravirus	4.9e-79	32.7
SQG59319.1\|2424902_2425532_-\|protease	ATP-dependent Clp protease proteolytic subunit	A0A223W000	Agrobacterium_phage	1.4e-37	43.5
SQG59320.1\|2425547_2426147_-\|protease	ATP-dependent Clp protease proteolytic subunit	A0A223W000	Agrobacterium_phage	1.3e-42	48.3
SQG59321.1\|2426487_2427840_-	trigger factor	NA	NA	NA	NA
SQG59322.1\|2429093_2429897_+	Uncharacterised protein	NA	NA	NA	NA
SQG59323.1\|2429979_2430990_-	putative pirin protein	NA	NA	NA	NA
SQG59324.1\|2431107_2431614_-	ribose 5-phosphate isomerase B	NA	NA	NA	NA
SQG59325.1\|2431803_2432424_-	DSBA-like thioredoxin domain	NA	NA	NA	NA
SQG59326.1\|2432726_2435342_+	aminopeptidase N	A0A2K9L1R3	Tupanvirus	8.5e-41	32.3
SQG59327.1\|2435486_2436446_+	mechanosensitive ion channel MscS	NA	NA	NA	NA
SQG59328.1\|2436471_2436864_+	globin	NA	NA	NA	NA
SQG59329.1\|2436875_2437772_+	membrane protein	NA	NA	NA	NA
SQG59330.1\|2437775_2438384_-	Uncharacterised protein	NA	NA	NA	NA
SQG59331.1\|2438389_2438818_-	thioesterase	NA	NA	NA	NA
SQG59332.1\|2439019_2440690_-	putative ABC transporter ATP-binding protein	A0A2K9L0W2	Tupanvirus	6.0e-48	27.9
SQG59333.1\|2440860_2441424_-	Helix-destabilizing protein 2	NA	NA	NA	NA
SQG59334.1\|2441958_2443677_+	Uncharacterised protein	NA	NA	NA	NA
SQG59335.1\|2443673_2445224_+\|bacteriocin	bacteriocin biosynthesis docking scaffold, SagD family	NA	NA	NA	NA
SQG59336.1\|2445259_2446744_+	SagB-type dehydrogenase domain	NA	NA	NA	NA
SQG59337.1\|2446740_2449341_+	Lantibiotic dehydratase, C terminus	NA	NA	NA	NA
SQG59338.1\|2449340_2450354_+\|bacteriocin	thiopeptide-type bacteriocin biosynthesis domain	NA	NA	NA	NA
SQG59339.1\|2450350_2451328_+\|protease	Zn-dependent proteases	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. LS483402

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection