CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Target MGE spacer number	Prophage number
NZ_CP040642	Agrobacterium sp. T29 plasmid unnamed2, complete sequence	0 crisprs	NA	0	0
NZ_CP040641	Agrobacterium sp. T29 chromosome linear, complete sequence	1 crisprs	csa3,DEDDh	0	1
NZ_CP040640	Agrobacterium sp. T29 chromosome circular, complete sequence	1 crisprs	WYL,DEDDh,csa3,cas3	1	3

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP040641_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040641_1

1459265-1459571

Orphan

Consensus_repeat	Method
GGGCGCGGCGCGAGCGGTCCAGGTGATGCCGTCCGGCGAAGTCATGATGCGATAGGTGCCG	PILER-CR

2 spacers

The CRISPR arrays of NZ_CP040641_1

>merge|NZ_CP040641|1|1459265-1459571|PILER-CR
GGGCGCGGCGCGGGCGGTCCAGGTGATGCCGTCCGGCGAGGTCATGACCCGATTGGTGCCGTTCACTGCCACAGCGACGTACAGGCCGTTGCTGTAGGTGATATCGCCCCAAGCGTTCGCCTCGGGCGCGGTACGAGCCGTCCAGGTGATACCGTCCGGCGAAGTCATGATGCGGTAGGTGCCGCTGCCCGCCACGCCAACGAAGAGGCCGCCCCCGTAGGCGACATCACCCCAGAAAGCTGCCTGCGGCGCGGCGCGTGCGGTCCAGGTGATGCCGTCCGGCGAAGTCATGATGCGATGAGTGCCT

>NZ_CP040641|1|1|1459265-1459571|PILER-CR
GGGCGCGGCGCGGGCGGTCCAGGTGATGCCGTCCGGCGAGGTCATGACCCGATTGGTGCCG	TTCACTGCCACAGCGACGTACAGGCCGTTGCTGTAGGTGATATCGCCCCAAGCGTTCGCCTC
GGGCGCGGTACGAGCCGTCCAGGTGATACCGTCCGGCGAAGTCATGATGCGGTAGGTGCCG	CTGCCCGCCACGCCAACGAAGAGGCCGCCCCCGTAGGCGACATCACCCCAGAAAGCTGCCTG
CGGCGCGGCGCGTGCGGTCCAGGTGATGCCGTCCGGCGAAGTCATGATGCGATGAGTGCCT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040641.1\|WP_142781085.1\|1457427_1457856_+\|VOC-family-protein	unknown	unknown	gnl\|CDD\|319937
NZ_CP040641.1\|WP_142781092.1\|1464779_1465418_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_142781079.1\|1453107_1453785_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|215633
NZ_CP040641.1\|WP_142781082.1\|1455464_1456253_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_142781090.1\|1464108_1464750_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_142781094.1\|1468574_1469468_+\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|225117
NZ_CP040641.1\|WP_142781083.1\|1456285_1456840_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|215633
NZ_CP040641.1\|WP_142781086.1\|1457873_1459085_-\|DUF418-domain-containing-protein	unknown	unknown	gnl\|CDD\|225193
NZ_CP040641.1\|WP_142781088.1\|1460815_1462555_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_142781093.1\|1465433_1468184_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|379398
NZ_CP040641.1\|WP_142781097.1\|1471222_1471516_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_168208211.1\|1462573_1464064_-\|methyl-accepting-chemotaxis-protein	unknown	unknown	gnl\|CDD\|223910
NZ_CP040641.1\|WP_142781077.1\|1452015_1452528_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_142781608.1\|1470032_1470773_+\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|226425
NZ_CP040641.1\|WP_142781099.1\|1471771_1471999_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_142781096.1\|1469574_1470027_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040641.1\|WP_142781080.1\|1454048_1454459_+\|GtrA-family-protein	unknown	unknown	gnl\|CDD\|377229
NZ_CP040641.1\|WP_142781084.1\|1456939_1457356_+\|nicotinamide-mononucleotide-transporter	unknown	unknown	gnl\|CDD\|377432
NZ_CP040641.1\|WP_142781081.1\|1454517_1455201_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|215633
NZ_CP040641.1\|WP_142781078.1\|1452675_1453008_+\|lysozyme-inhibitor	unknown	unknown	gnl\|CDD\|378282

Protein	Function_ID	Function_description	E-value
NZ_CP040641.1\|WP_142781085.1\|1457427_1457856_+\|VOC-family-protein	gnl\|CDD\|319937	cd08349, BLMA_like, Bleomycin binding protein (BLMA) and similar proteins. BLMA also called Bleomycin resistance protein, confers Bm resistance by directly binding to Bm. Bm is a glycopeptide antibiotic produced naturally by actinomycetes. It is a potent anti-cancer drug, which acts as a strong DNA-cutting agent, thereby causing cell death. BLMA is produced by actinomycetes to protect themselves against their own lethal compound. BLMA has two identically-folded subdomains, with the same alpha/beta fold; these two halves have no sequence similarity. BLMAs are dimers and each dimer binds to two Bm molecules at the Bm-binding pockets formed at the dimer interface; two Bm molecules are bound per dimer. BLMA belongs to a conserved domain superfamily that is found in a variety of structurally related metalloproteins, including the bleomycin resistance protein, glyoxalase I, and type I ring-cleaving dioxygenases. As for the larger superfamily, this family contains members with or without domain swapping.	1.32154e-31
NZ_CP040641.1\|WP_142781094.1\|1468574_1469468_+\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	1.31509e-25
NZ_CP040641.1\|WP_168208211.1\|1462573_1464064_-\|methyl-accepting-chemotaxis-protein	gnl\|CDD\|223910	COG0840, Tar, Methyl-accepting chemotaxis protein [Cell motility and secretion / Signal transduction mechanisms].	1.49822e-40
NZ_CP040641.1\|WP_142781086.1\|1457873_1459085_-\|DUF418-domain-containing-protein	gnl\|CDD\|225193	COG2311, COG2311, Predicted membrane protein [Function unknown].	3.49074e-59
NZ_CP040641.1\|WP_142781093.1\|1465433_1468184_-\|hypothetical-protein	gnl\|CDD\|379398	pfam13884, Peptidase_S74, Chaperone of endosialidase. This is the very C-terminal, chaperone, domain of the bacteriophage protein endosialidase. It releases itself, via the serine-lysine dyad at the N-terminus, from the remainder of the end-tail-spike. Cleavage occurs after the threonine which is the final residue of the End-tail-spike family, pfam12219. The endosialidase protein forms homotrimeric molecules in bacteriophages. The catalytic dyad allows this portion of the molecule to be cleaved from the more N-terminal region such that the latter can fold and presumably bind to DNA.	7.13243e-11
NZ_CP040641.1\|WP_142781079.1\|1453107_1453785_-\|hypothetical-protein	gnl\|CDD\|215633	PLN03210, PLN03210, Resistant to P. syringae 6; Provisional.	2.60948e-06
NZ_CP040641.1\|WP_142781608.1\|1470032_1470773_+\|AAA-family-ATPase	gnl\|CDD\|226425	COG3910, COG3910, Predicted ATPase [General function prediction only].	8.20912e-84
NZ_CP040641.1\|WP_142781083.1\|1456285_1456840_-\|hypothetical-protein	gnl\|CDD\|215633	PLN03210, PLN03210, Resistant to P. syringae 6; Provisional.	1.58863e-07
NZ_CP040641.1\|WP_142781080.1\|1454048_1454459_+\|GtrA-family-protein	gnl\|CDD\|377229	pfam04138, GtrA, GtrA-like protein. Members of this family are predicted to be integral membrane proteins with three or four transmembrane spans. They are involved in the synthesis of cell surface polysaccharides. The GtrA family are a subset of this family. GtrA is predicted to be an integral membrane protein with 4 transmembrane spans. It is involved is in O antigen modification by Shigella flexneri bacteriophage X (SfX), but does not determine the specificity of glucosylation. Its function remains unknown, but it may play a role in translocation of undecaprenyl phosphate linked glucose (UndP-Glc) across the cytoplasmic membrane. Another member of this family is a DTDP-glucose-4-keto-6-deoxy-D-glucose reductase, which catalyzes the conversion of dTDP-4-keto-6-deoxy-D-glucose to dTDP-D-fucose, which is involved in the biosynthesis of the serotype-specific polysaccharide antigen of Actinobacillus actinomycetemcomitans Y4 (serotype b). This family also includes the teichoic acid glycosylation protein, GtcA, which is a serotype-specific protein in some Listeria innocua and monocytogenes strains. Its exact function is not known, but it is essential for decoration of cell wall teichoic acids with glucose and galactose.	4.20047e-08
NZ_CP040641.1\|WP_142781084.1\|1456939_1457356_+\|nicotinamide-mononucleotide-transporter	gnl\|CDD\|377432	pfam04973, NMN_transporter, Nicotinamide mononucleotide transporter. Members of this family are integral membrane proteins that are involved in transport of nicotinamide mononucleotide.	0.00186925
NZ_CP040641.1\|WP_142781081.1\|1454517_1455201_-\|hypothetical-protein	gnl\|CDD\|215633	PLN03210, PLN03210, Resistant to P. syringae 6; Provisional.	1.21479e-10
NZ_CP040641.1\|WP_142781078.1\|1452675_1453008_+\|lysozyme-inhibitor	gnl\|CDD\|378282	pfam09864, MliC, Membrane-bound lysozyme-inhibitor of c-type lysozyme. Lysozymes are ancient and important components of the innate immune system of animals that hydrolyze peptidoglycan, the major bacterial cell wall polymer. Various mechanisms have evolved by which bacteria can evade this bactericidal enzyme, one being the production of lysozyme inhibitors. MliC (membrane bound lysozyme inhibitor of c-type lysozyme) of E. coli and Pseudomonas aeruginosa, possess lysozyme inhibitory activity and confer increased lysozyme tolerance upon expression in E. coli. Structural analyses show that the invariant loop of MliC plays a crucial role in the inhibition of the lysozyme by its insertion into the active site cleft of the lysozyme, where the loop forms hydrogen and ionic bonds with the catalytic residues.	3.59123e-08

>NZ_CP040641.1|WP_142781086.1|1457873_1459085_-|DUF418-domain-containing-protein
MNDRIANMDAIRGFALFGILVVNILAFSSVWYGSGFPAPGNRSVLDEVLAFLVSALFELKFYLLFSFLFGYSVTLQMQSAEKAGATFLPRMMRRQAGLFLIGILHAVFLFHGDILSTYAILGFTLLALRHLRGQTKLRLALLLVLATALFWLVLAWLQGAAVPPPFDPAALNADAAASIAAWRGGPLTVVGEHLAALEDFLPLLLLLQAPCAFAMFLVGFVAGRKRLFLHRDVYGPLLNQSLAWGLLIGLPGGLIYATAAQYAPGTAVETAGIALSILTSPFLSLAILAGLLKLLDSGRVERLRDCFASLGRMALSNYLLQSLTCAFIFHGYGLGLVDRLAISQVLGLGVLVFIMQMLLSCWWMNRFHYGPLEWLLRAATVWHYPGWRKKVTKQGEPARDNRR
>NZ_CP040641.1|WP_142781085.1|1457427_1457856_+|VOC-family-protein
MEPDQWPALVPELTCTDLAASRRFYCDVIGFSVRFERPEDAFVYLELGNAHLMLEQVHADSWVAEGLDPPFGRGMNLQIEVAALAPIIDRIRATGLGFYREPAEAWYRDGDVEYGQTELLVQDPDGYLLRLVEVLGERSSAA
>NZ_CP040641.1|WP_142781084.1|1456939_1457356_+|nicotinamide-mononucleotide-transporter
MLVDLQVFTRDVAQKSDSGLMWRGFGFLASLQMSGKIVSGGTSPARHRLSQQPKKRISLFEYYGLDWLLLASGLTTKYLMIHQNRWAFATSILGCLAGLAVALMASQHGIALYNLILIGMSCTGFVHWGRLTRSRVSA
>NZ_CP040641.1|WP_142781083.1|1456285_1456840_-|hypothetical-protein
MLHRLIPPSIRGDLVLRGYEELPDLPDNLKVGGYLDLSRCRNLKGLPGNLRIKSYLDLTDCTGLMFLPDDLRVGESIILTGCTGITSLPDGLSAGGSLKLTGCMGLTALPRKLRIGGNLDLEGCTGLASLPTGLAVKGSLLLRRCAGLTNLPHKLTVGGDLDLTGTGITTLPDNLRVGGYIFRD
>NZ_CP040641.1|WP_142781082.1|1455464_1456253_+|hypothetical-protein
MQLKSSIFTNPAQRAGLEKYYDAQKSELLASLKAREADPSFQATFTSELTMPDGKTLSGKGWRITSEMAEKAMVSFDKWLEIMADTYESQETLFDMAQQRMTMLEAENPDTSSHVRTAFSAGGELLAYINEDGSLVTSNIGPRHGETMTHTALELKLQAILQQADAMRLSGENRIDYLNREVRNALSYERGDVAMTSYDSGASPTKREFGKAWHTTFDVDQVYADALADARASYDSTKVLHDQWQENLRKMQSFLLGLQETA
>NZ_CP040641.1|WP_142781081.1|1454517_1455201_-|hypothetical-protein
MLNFTVPPTVNGNLDLTSCRDLDLLPRGLTVRGSLNLTGCTDLAALPEGLNVLGSLYLAGCTGLTALPDDTRVGNSAYLNGCTGLRSLPRGLTVRGRLDLSGCEGLNLLPDGLMVGGNLYLRGCRNLLAMPDDIIVKGRLDLAGCTGLTALPDNLTVGGRLDLTGCKGLIRLPEGLSVGGSLHLTGCSSLTQLPRTLKVAGNIHISGCTKIEVLPDDLEVGGSIIHK
>NZ_CP040641.1|WP_142781080.1|1454048_1454459_+|GtrA-family-protein
MKFTRDALRRFLTYALVGGGTFGLDRLLMAGCLRLGMAYPVAVYIGFFLGVSLNYLISRRYVFRGTSRSMEMGYFNMLTVAAMGAFATSSLSVLIVRGFDVDMLLARLPVAAMVGVGNYLFNLYANFDVAGRHHAR
>NZ_CP040641.1|WP_142781079.1|1453107_1453785_-|hypothetical-protein
MPHSPFPPSVVGNLDLSHCTDIVLPEGFKISGSLYLLGCIDLTVLPDNLDIGDSLYLVGCSSLTMLPRGLKVGGDLYLIDCTGLTTLPDDLKVTRSLHLGGCTALKTLPDDLTVGGWLDLTGCKALRALPKRLKVGGWLRLNDCTSLAALPTDMRIGGSLYLTGCTGLIAASPGLLAVGGHHSLVTRFKAIDAVLLMTLRKFKTVDLMIIAALAGSGYLALFRFL
>NZ_CP040641.1|WP_142781078.1|1452675_1453008_+|lysozyme-inhibitor
MNKLILIFAATLPVLSSCAEVSGSSPSVAPIPESETTTYQCNDGRVVSADFENDAERVVLRSKGAIFARLNAKPAASGIWYEGQGYTLRGKGAQANLTGPDGRTFDCVSN
>NZ_CP040641.1|WP_142781077.1|1452015_1452528_+|hypothetical-protein
MLIQKLIASFVALVVFTSSAFAACDCVPSGTGIPASALLPSVDYGQQIKVAVVQPKAMVKTAAKTTKTVSPPAKDEMVDCLTGTSANSIEIVWAMEDTGACPGKILYKDAVRLAAKAAAGAVEFRTPFYIPSKCDSGWAKVPTKVEDGKIKLYPWRKTCVSGYFVTYVVK
>NZ_CP040641.1|WP_142781088.1|1460815_1462555_-|hypothetical-protein
MAEHIHGSLDSLRLYLTQLKTKAEDLDRECARLRAIVSQEIKRVEDLIQKQVQTTTGRRNRTLGIWIVAFAAAWWAPIAPTLAQTGTFVDVMTRDPATTNVQNRLCYTTNGRVDIGCPADAPYLDVATGRLGIGTTNPTQALDVSGSIYVGGTLGTGAGGSMPVISQNQIPLLHTFTPTGTNGGNLFLGRGSGNFTMAYISSANDASYNTGVGMDTLQGITTGKYNTAIGWTALASTSVASYNTAVGIAAMAKNVTAGSNVAVGAYSLYNANAGVDNVVIGGSSLLAMRSSFRNTTVGAYTMSNSGSGNDNTVVGHASMQYKNGSFNTTVGKNAGGVNGGTITGTVALGFEAGKSLATNTSNTLVGYRAGASLTTGSNNIIIGASTDAPVAAGSNQLNIGNAVWGDIGSGSGHANKLGVNVSSPSSSLHVSGTLRLTGGSETCDTNRLGAIRYTSGSFDVCRSIANGWEPLATTGKDSAVDRITSSSMAGVTANATGYISLTTGGITGTAYFSPNSVLVNKGISATGGVSATQGYFAATLEVSGAIKISGDGTEGCGSTSDKGKMRINPATGRLQICVD
>NZ_CP040641.1|WP_168208211.1|1462573_1464064_-|methyl-accepting-chemotaxis-protein
MLNSIRAKLTLLALISILSILAIGGVGFYGFKQLEDAILKANGDTIPTLVTSGRMSFDLARLHTLDAQYMGEPHKEDRERLLDQRVGIVTQIEKTQKEYEQLSSLPDEPKVYAEFKGAFATYREQKRALSALVEEGKVEEATTLFDGTMKTAYNEAVMSMQKIVRMNAEAAKVRAENANRTENFLSALMGINVVVAMVIVAILLIAILRSVLRGLAELERCLKALSQLDLRVVASAGTKDEIGRILEMYNSTLGKLKTVIAETKEASSTVSAASSELSSTMDVLTNATGEQSAALAEIASAVEETSSSAMSVKERTEHSVTATNDVASEFDTATESLRELQSAAAGIEEARGVIQAISEQINLLALNAAIEAARAGDAGRGFAVVADEVRKLASSTGVSTQQITERIAKLKHSVDKIAGSLSRSVSLVDGVKDNGRAMLGSVTEQTAAIEQISRSMQEFQDQMDDMVRSIQESKTASTGLSETAVGLSGTAGRFNT
>NZ_CP040641.1|WP_142781090.1|1464108_1464750_-|hypothetical-protein
MKIILLALAALSLITAAFAQERTAAGTVENQMSWSALNTKIATANSKADAVNSRVEQVVVCGRKGMLYAPGQAGADGQGCVVSKLDSSYVNMLNDINSNLTNINSCAANGSVYNRSAHSCLPVKMPDPATLNIGTYNQTLCTRGGTHTVVSSCPGGQRLLGCGGGPGDQDESHEYWVLMPDFAANRCIGYVGNPRCYDDGWSRTIVSAVCYRP
>NZ_CP040641.1|WP_142781092.1|1464779_1465418_-|hypothetical-protein
MKTPLLLILLLLALLSSVHAQERTAAGTMETQMSWSALSSKIGTVDAKVFGINSLINQDIACGRKGMLYAPGPGADGQGCMKPFVDDTALNQLNAKMNSALACASQGRMFNGSSCVTAAVALPAAPRLQCRVASHVGPGPHYASRAQCNSDEIMTGGGGQSETEGTNLCSGLGSSFIHATVPSGNGWAVDGYRPGGGDACTIAYAICCKIVN
>NZ_CP040641.1|WP_142781093.1|1465433_1468184_-|hypothetical-protein
MKVSTRVSNTRKGHYARILMAAALLAAFSPAAWAQYNTLGRDFTVRTGTTSATSVERIRVTQAGLMGIGHTNPSYTLDISGTARATRFIGDGSGLTNLPGQNIISGTTTMVQGWPDAIVCTLQNGSNGTDTRVFHLSFAPFYTGQYFYRLNEQTVVVNGPTSGGVSTQIGFTASGSYASFDTTYTSYTSAGTCANKTISQLYTEGKAFNFIGNTGMGDAGGLGYAMTSGTLSVTANTSGIVSLTTAGTTWGYLGSNGSYLPKLNTDNISATTINGVPVSSLGSGASPTNVPAFRAHRNGTDQSLPTSTYTNITWTTEEFDTYSNFSTSTGRFTPTVAGYYNIHLSIGCLNLASTNACVARILKNGAAVTHSNVRSPQFDVTAHSSVIVYLNGAGDYVTAQALSEASSASLTGNGANTYFEAALIASGNGLVSGTGASALSAMSDVTLASPATGEILTYNGTKWVNSTPTTNPTISGTTTMMEGWPDAIFCSDNSYGSDYLFHTGIRGTNHVYAPTWETQNGNFIITYNPSGGYVSGSAVIAGTCANKSISQLYTEGKAYNFIGNSGANGNSDRIASGTTSIVAETGGLIRINTSGVNTAYFDTVGRLVVPGISTTGIISGTGGYFSGNLGISGRLDVSNPANTTLQVMATNSGVRGGMSSDIPSGSAFYMGSYSNSPLALGINNSERMRIGTDGRVGIGTTSARAALDSPNGGIFNHISIGVCAYGPCPGPENQEYPYETIQLDPGNNLRISFGEYQPFFFGNNGHALKPGGGSWNAFSDKRLKDLDGTYPRGLKEIAALEPVRFHYKKNNQMGQPSDREFVGLIAQDVQPHFPEAVSKEKDGYYRLDTTPISFAVINAIKELKAENEQHRKANVQLQAENNRLQASNDNLARELRTFRSEYEAFKAKITSVVVIE
>NZ_CP040641.1|WP_142781094.1|1468574_1469468_+|helix-turn-helix-domain-containing-protein
MAGVKRDKLALVFDVNKNSSEVEHSRASSWRGFSVEFIDLSGLKGYEFRGGNPKHHYLAYHDLIRADGEWQVGGEPASNRKDIREMITYIPKQLDFKGWVTLEQRQNSIVALTFDPHLIGRELEILFPVQMQSPHVYFKNQNIQSTMLKIGSLLKRASSYPSMYMETLGLSAVLELAMVLTNETFTQKRGGLSRSQELLVAEYIKVNLTKDMSLDELASLVQMSRFHFSRSFKETFGESPIRYINKERVTFAKSVLLTSRTPIGEISETLGFGSIQNFIKTFREITGVTPLEFRRTS
>NZ_CP040641.1|WP_142781096.1|1469574_1470027_+|hypothetical-protein
MYSIVFPEVVLPHGVSLWKACTSPRDYIANPKAVAAQTFKSPQMDVPYHDSEVWSEVASLFAVQYPRTAAVDISFETHLDCPWIAFPWAICKGLASRACLVWVDDRGKRRLVRHIRLYPNGDHLEEDHRWLEHAVRKAIPSSLIVYVTSE
>NZ_CP040641.1|WP_142781608.1|1470032_1470773_+|AAA-family-ATPase
MPAPFLRRLSYAPPGEEKGFPFNVPLFTREFEIAFERPITIFCGENGSGKSTLLETIAKGCGFNPGGGNAHVYASRDDLNDLVESCRFAWLPKTSKGFFFRAESFFNYATYIDDLARQFGSRQSYRPYGGKSLHAQSHGESFLSLFAHRIGGKGVYIFDEPEAALSPMRQLAFLALLREILRSGDSQIIMATHSPILLGYPDSQLLQIADGAIEPTTLRETEHYIVMRRFLEEPDRYIGDIFSDDL
>NZ_CP040641.1|WP_142781097.1|1471222_1471516_-|hypothetical-protein
MPNVSTTAGDKQAVENQPLPKRKEWKGLYPKVTVRLNGPLGDVVDELQEATHAASPSDVVKRALVIYHTLVKQKLAGNEPYIEQKEGDTTKRIPIFL
>NZ_CP040641.1|WP_142781099.1|1471771_1471999_+|hypothetical-protein
MDPEFEKLVDPKVQAMVERYVKPEPWYSKLLWGVLGSLVASALIAIATFVYSEGSACHVATPQANARIAETDKKI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

742169 : 762379

Ochrobactrum_phage(50.0%)

transposase,integrase

attL 734853:734869|attR 765396:765412

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
734853:734869	attL	NA	NA	NA	NA
WP_142780683.1\|742169_742544_+	hypothetical protein	A0A219VHC3	Ochrobactrum_phage	3.7e-22	47.9
WP_142780684.1\|742536_743382_+	ParB N-terminal domain-containing protein	NA	NA	NA	NA
WP_080819450.1\|743378_743843_+	hypothetical protein	A0A219VHC5	Ochrobactrum_phage	1.4e-44	58.4
WP_142780685.1\|743839_745858_+\|integrase,transposase	DDE-type integrase/transposase/recombinase	A0A219VHD4	Ochrobactrum_phage	2.2e-137	53.0
WP_065656426.1\|745936_746968_+	AAA family ATPase	A0A219VHC7	Ochrobactrum_phage	6.9e-63	42.1
WP_142780686.1\|746964_747291_+	hypothetical protein	NA	NA	NA	NA
WP_142780687.1\|747274_747637_+	hypothetical protein	NA	NA	NA	NA
WP_142780688.1\|747672_748332_+	DUF3164 family protein	M4STB6	Rhodobacter_phage	4.0e-56	53.6
WP_142780689.1\|748342_748780_+	hypothetical protein	R9U4A4	Rhizobium_phage	2.7e-69	85.2
WP_142780690.1\|748776_749226_+	hypothetical protein	NA	NA	NA	NA
WP_142780691.1\|749222_749486_+	hypothetical protein	NA	NA	NA	NA
WP_142781575.1\|749472_749778_+	hypothetical protein	NA	NA	NA	NA
WP_142780692.1\|749774_750038_+	hypothetical protein	NA	NA	NA	NA
WP_142780693.1\|750021_750216_+	hypothetical protein	NA	NA	NA	NA
WP_142780694.1\|750212_750863_+	DUF1018 domain-containing protein	NA	NA	NA	NA
WP_142780695.1\|750862_751090_+	hypothetical protein	NA	NA	NA	NA
WP_035261583.1\|751067_751439_+	winged helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_142780696.1\|751545_752289_+	TIGR02594 family protein	R9TRQ2	Rhizobium_phage	3.8e-31	41.2
WP_168208184.1\|752411_752588_+	hypothetical protein	NA	NA	NA	NA
WP_142780697.1\|752584_752950_+	hypothetical protein	NA	NA	NA	NA
WP_142780698.1\|753160_753379_+	TraR/DksA family transcriptional regulator	A0A219VHE0	Ochrobactrum_phage	2.2e-11	55.4
WP_080866962.1\|753375_753750_+	DUF2730 family protein	A0A219VHD8	Ochrobactrum_phage	1.8e-24	53.4
WP_142780699.1\|753746_754058_+	hypothetical protein	A0A219VHE1	Ochrobactrum_phage	4.5e-26	59.8
WP_142780700.1\|754059_754725_+	DUF3486 family protein	A0A219VH75	Ochrobactrum_phage	3.2e-77	78.1
WP_142780701.1\|754890_756573_+	hypothetical protein	A0A219VH72	Ochrobactrum_phage	1.2e-210	72.9
WP_142780702.1\|756572_758192_+	DUF935 family protein	M4SPR8	Rhodobacter_phage	3.3e-112	43.8
WP_142780703.1\|758311_759409_+	hypothetical protein	J9STS2	Pseudomonas_phage	6.0e-49	44.4
WP_142780704.1\|759419_759929_+	phage virion morphogenesis protein	A0A2K9VH22	Faecalibacterium_phage	1.3e-14	34.6
WP_142780705.1\|760002_761085_+	hypothetical protein	A0A1B0T6E7	Thiobacimonas_phage	4.6e-33	36.1
WP_080866969.1\|761086_761476_+	hypothetical protein	A0A2H4IZH5	uncultured_Caudovirales_phage	2.2e-06	35.6
WP_080866970.1\|761485_762379_+	hypothetical protein	J9SVY7	Pseudomonas_phage	6.4e-65	43.1
765396:765412	attR	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

2. NZ_CP040640

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP040640_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040640_1

1383426-1383505

Orphan

Consensus_repeat	Method
TTCTTGGCCGGAGCCTTCTTCTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040640_1

>merge|NZ_CP040640|1|1383426-1383505|CRISPRCasFinder
TTCTTGGCCGGAGCCTTCTTCTTCGGAGCGGCTTCTTCGCCTTCAGCGGCGTCGTCAGCCTTGGCGGCAGCCTTTTTCTT

>NZ_CP040640|1|1|1383426-1383505|CRISPRCasFinder
TTCTTGGCCGGAGCCTTCTTCTT	CGGAGCGGCTTCTTCGCCTTCAGCGGCGTCGTCA
GCCTTGGCGGCAGCCTTTTTCTT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040640.1\|WP_142779284.1\|1378805_1379339_+\|DUF1003-domain-containing-protein	unknown	unknown	gnl\|CDD\|226844
NZ_CP040640.1\|WP_168208027.1\|1376748_1378689_+\|LTA-synthase-family-protein	unknown	unknown	gnl\|CDD\|224287
NZ_CP040640.1\|WP_059760139.1\|1372157_1372874_-\|5,6-dimethylbenzimidazole-synthase	unknown	unknown	gnl\|CDD\|380321
NZ_CP040640.1\|WP_142779293.1\|1394020_1395553_+\|AMP-binding-protein	unknown	unknown	gnl\|CDD\|341246
NZ_CP040640.1\|WP_168208029.1\|1392914_1393655_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040640.1\|WP_142779287.1\|1382656_1383184_-\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|379082
NZ_CP040640.1\|WP_020810249.1\|1393760_1394024_+\|acyl-carrier-protein	unknown	unknown	gnl\|CDD\|223314
NZ_CP040640.1\|WP_142779291.1\|1389855_1391070_-\|pilus-assembly-protein	unknown	unknown	gnl\|CDD\|227296
NZ_CP040640.1\|WP_004433052.1\|1385862_1386009_+\|DUF1127-domain-containing-protein	unknown	unknown	gnl\|CDD\|227744
NZ_CP040640.1\|WP_142779290.1\|1388688_1389291_-\|pilus-assembly-protein-TadG	unknown	unknown	gnl\|CDD\|227296
NZ_CP040640.1\|WP_168208026.1\|1370836_1371952_+\|DUF2865-domain-containing-protein	unknown	unknown	gnl\|CDD\|371363
NZ_CP040640.1\|WP_168208028.1\|1387239_1388682_+\|methylenetetrahydrofolate--tRNA-(uracil(54)--C(5))-methyltransferase-(FADH(2)-oxidizing)-TrmFO	unknown	unknown	gnl\|CDD\|235416
NZ_CP040640.1\|WP_003495735.1\|1386489_1386633_+\|DUF1127-domain-containing-protein	unknown	unknown	gnl\|CDD\|227744
NZ_CP040640.1\|WP_142779285.1\|1380092_1381496_+\|Si-specific-NAD(P)(+)-transhydrogenase	unknown	unknown	gnl\|CDD\|235373
NZ_CP040640.1\|WP_142780173.1\|1389287_1389854_-\|pilus-assembly-protein-TadE	unknown	unknown	gnl\|CDD\|227296
NZ_CP040640.1\|WP_142779281.1\|1373196_1374027_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|223893
NZ_CP040640.1\|WP_142779286.1\|1381742_1382393_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040640.1\|WP_003525152.1\|1391499_1392627_+\|S-(hydroxymethyl)glutathione-dehydrogenase/class-III-alcohol-dehydrogenase	unknown	unknown	gnl\|CDD\|176260
NZ_CP040640.1\|WP_142779283.1\|1374846_1376526_-\|NAD+-synthase	unknown	unknown	gnl\|CDD\|237577
NZ_CP040640.1\|WP_142779282.1\|1374215_1374593_+\|VOC-family-protein	unknown	unknown	gnl\|CDD\|319937

Protein	Function_ID	Function_description	E-value
NZ_CP040640.1\|WP_142779284.1\|1378805_1379339_+\|DUF1003-domain-containing-protein	gnl\|CDD\|226844	COG4420, COG4420, Predicted membrane protein [Function unknown].	1.25924e-72
NZ_CP040640.1\|WP_168208027.1\|1376748_1378689_+\|LTA-synthase-family-protein	gnl\|CDD\|224287	COG1368, MdoB, Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily [Cell envelope biogenesis, outer membrane].	5.61405e-131
NZ_CP040640.1\|WP_059760139.1\|1372157_1372874_-\|5,6-dimethylbenzimidazole-synthase	gnl\|CDD\|380321	cd02145, BluB, 5,6-dimethylbenzimidazole synthase. BluB catalyzes the O2-dependent conversion of FMNH2 to 5,6-dimethylbenzimidazole (DMB), a component of vitamin B12; is is a subfamily of the nitroreductase family; nitroreductases typically reduce their substrates by using NAD(P)H as electron donor and often use FMN as a cofactor.	2.54948e-111
NZ_CP040640.1\|WP_142779287.1\|1382656_1383184_-\|AAA-family-ATPase	gnl\|CDD\|379082	pfam13238, AAA_18, AAA domain.	1.80643e-05
NZ_CP040640.1\|WP_020810249.1\|1393760_1394024_+\|acyl-carrier-protein	gnl\|CDD\|223314	COG0236, AcpP, Acyl carrier protein [Lipid metabolism / Secondary metabolites biosynthesis, transport, and catabolism].	1.2191e-06
NZ_CP040640.1\|WP_142779291.1\|1389855_1391070_-\|pilus-assembly-protein	gnl\|CDD\|227296	COG4961, TadG, Flp pilus assembly protein TadG [Intracellular trafficking and secretion].	5.87356e-10
NZ_CP040640.1\|WP_004433052.1\|1385862_1386009_+\|DUF1127-domain-containing-protein	gnl\|CDD\|227744	COG5457, COG5457, Uncharacterized conserved small protein [Function unknown].	1.48472e-10
NZ_CP040640.1\|WP_142779290.1\|1388688_1389291_-\|pilus-assembly-protein-TadG	gnl\|CDD\|227296	COG4961, TadG, Flp pilus assembly protein TadG [Intracellular trafficking and secretion].	2.03083e-07
NZ_CP040640.1\|WP_168208026.1\|1370836_1371952_+\|DUF2865-domain-containing-protein	gnl\|CDD\|371363	pfam11064, DUF2865, Protein of unknown function (DUF2865). This bacterial family of proteins has no known function.	3.54692e-30
NZ_CP040640.1\|WP_168208028.1\|1387239_1388682_+\|methylenetetrahydrofolate--tRNA-(uracil(54)--C(5))-methyltransferase-(FADH(2)-oxidizing)-TrmFO	gnl\|CDD\|235416	PRK05335, PRK05335, tRNA (uracil-5-)-methyltransferase Gid; Reviewed.	0
NZ_CP040640.1\|WP_003495735.1\|1386489_1386633_+\|DUF1127-domain-containing-protein	gnl\|CDD\|227744	COG5457, COG5457, Uncharacterized conserved small protein [Function unknown].	2.25674e-13
NZ_CP040640.1\|WP_142779285.1\|1380092_1381496_+\|Si-specific-NAD(P)(+)-transhydrogenase	gnl\|CDD\|235373	PRK05249, PRK05249, Si-specific NAD(P)(+) transhydrogenase.	0
NZ_CP040640.1\|WP_142780173.1\|1389287_1389854_-\|pilus-assembly-protein-TadE	gnl\|CDD\|227296	COG4961, TadG, Flp pilus assembly protein TadG [Intracellular trafficking and secretion].	1.10127e-06
NZ_CP040640.1\|WP_142779281.1\|1373196_1374027_-\|hypothetical-protein	gnl\|CDD\|223893	COG0823, TolB, Periplasmic component of the Tol biopolymer transport system [Intracellular trafficking and secretion].	1.47144e-59
NZ_CP040640.1\|WP_142779293.1\|1394020_1395553_+\|AMP-binding-protein	gnl\|CDD\|341246	cd05922, FACL_like_6, Uncharacterized subfamily of fatty acid CoA ligase (FACL). Fatty acyl-CoA ligases catalyze the ATP-dependent activation of fatty acids in a two-step reaction. The carboxylate substrate first reacts with ATP to form an acyl-adenylate intermediate, which then reacts with CoA to produce an acyl-CoA ester. This is a required step before free fatty acids can participate in most catabolic and anabolic reactions.	0
NZ_CP040640.1\|WP_003525152.1\|1391499_1392627_+\|S-(hydroxymethyl)glutathione-dehydrogenase/class-III-alcohol-dehydrogenase	gnl\|CDD\|176260	cd08300, alcohol_DH_class_III, class III alcohol dehydrogenases. Members identified as glutathione-dependent formaldehyde dehydrogenase(FDH), a member of the zinc dependent/medium chain alcohol dehydrogenase family. FDH converts formaldehyde and NAD(P) to formate and NAD(P)H. The initial step in this process the spontaneous formation of a S-(hydroxymethyl)glutathione adduct from formaldehyde and glutathione, followed by FDH-mediated oxidation (and detoxification) of the adduct to S-formylglutathione. MDH family uses NAD(H) as a cofactor in the interconversion of alcohols and aldehydes or ketones. Like many zinc-dependent alcohol dehydrogenases (ADH) of the medium chain alcohol dehydrogenase/reductase family (MDR), these FDHs form dimers, with 4 zinc ions per dimer. The medium chain alcohol dehydrogenase family (MDR) have a NAD(P)(H)-binding domain in a Rossmann fold of a beta-alpha form. The N-terminal region typically has an all-beta catalytic domain. These proteins typically form dimers (typically higher plants, mammals) or tetramers (yeast, bacteria), and have 2 tightly bound zinc atoms per subunit. Alcohol dehydrogenase in the liver converts ethanol and NAD+ to acetaldehyde and NADH, while in yeast and some other microorganisms ADH catalyzes the conversion acetaldehyde to ethanol in alcoholic fermentation. ADH is a member of the medium chain alcohol dehydrogenase family (MDR), which have a NAD(P)(H)-binding domain in a Rossmann fold of a beta-alpha form. The NAD(H)-binding region is comprised of 2 structurally similar halves, each of which contacts a mononucleotide. A GxGxxG motif after the first mononucleotide contact half allows the close contact of the coenzyme with the ADH backbone. The N-terminal catalytic domain has a distant homology to GroES. These proteins typically form dimers (typically higher plants, mammals) or tetramers (yeast, bacteria), and have 2 tightly bound zinc atoms per subunit, a catalytic zinc at the active site and a structural zinc in a lobe of the catalytic domain. NAD(H) binding occurs in the cleft between the catalytic and coenzyme-binding domains at the active site, and coenzyme binding induces a conformational closing of this cleft. Coenzyme binding typically precedes and contributes to substrate binding.	0
NZ_CP040640.1\|WP_142779283.1\|1374846_1376526_-\|NAD+-synthase	gnl\|CDD\|237577	PRK13981, PRK13981, NAD synthetase; Provisional.	0
NZ_CP040640.1\|WP_142779282.1\|1374215_1374593_+\|VOC-family-protein	gnl\|CDD\|319937	cd08349, BLMA_like, Bleomycin binding protein (BLMA) and similar proteins. BLMA also called Bleomycin resistance protein, confers Bm resistance by directly binding to Bm. Bm is a glycopeptide antibiotic produced naturally by actinomycetes. It is a potent anti-cancer drug, which acts as a strong DNA-cutting agent, thereby causing cell death. BLMA is produced by actinomycetes to protect themselves against their own lethal compound. BLMA has two identically-folded subdomains, with the same alpha/beta fold; these two halves have no sequence similarity. BLMAs are dimers and each dimer binds to two Bm molecules at the Bm-binding pockets formed at the dimer interface; two Bm molecules are bound per dimer. BLMA belongs to a conserved domain superfamily that is found in a variety of structurally related metalloproteins, including the bleomycin resistance protein, glyoxalase I, and type I ring-cleaving dioxygenases. As for the larger superfamily, this family contains members with or without domain swapping.	1.29958e-23

>NZ_CP040640.1|WP_142779287.1|1382656_1383184_-|AAA-family-ATPase
MGVRNYLIEGVSGTGKTSVATELQRRGYHVIHGDRELAYKGDPETGEPVDLSPFQGDGDMVYRHRRHIWDVEKVQALVTDRRHANTFFCGGSRNFQRFIELFDQVFVLDVDVATLRRRLTERPEDEFGGKPAEREFVLQLHATKEDLPADATVIDSSRSLDMVVDDILVRCVDSA
>NZ_CP040640.1|WP_142779286.1|1381742_1382393_-|hypothetical-protein
MSPRMGFTLLLSLFTATGTAAHADEAGLIWKPVKNSDRSYTARIGAKLPVDTPIRAGLEMGMSASKTGQVVDTPVRVWGNVTLLAEQLPGVSLARDVGVIFNALTGSSSVSVTSQQKRIVTPELDIEANRNFTVRYDGTAQQWNGLDVSQSLRLSRSETGTAFVLTGASRNSFNEFSSGVAVEQKLGDHLTVRGTLDQGYADHFRPGVSARYSIRW
>NZ_CP040640.1|WP_142779285.1|1380092_1381496_+|Si-specific-NAD(P)(+)-transhydrogenase
MHQFDLIVVGSGPAGRRAAIQAAKLEKRVLVIEKGSRVGGVSVHTGTIPSKTLRETALNLTGWRERGFYGRAYRVKQEIDAEDLRRRLLITLDHEVEVLEHQFARNRVQHIRGTASFIDANTMKVVKSDGEIMTVTGTSILLTIGTRPYRPPHIPFDGEAVLDSDEILEIKELPRSMVVVGAGVIGIEYATIFSALDTQVTVVEPRETMLEFIDKEIVEDFTYQLRDRNMKLIFGQKAEKVERDESGKCLVSLGNGRVLKAETVLFAAGRVGATDTLNLSACGLEADSRGRLKVDPETFQTSVPNIYAAGDIIGFPSLASTSMEQGRIAARHAVGAPAGEPPQFFPYGIYAVPEISTCGLTEEEVIERGIPYECGIAHFRETSRGHIMGLDSGLLKMIFSLKTRRLLGVHIVGEGATELVHIGQAVLNLKGTVEYFVENTFNYPTLAEAYKIAGLDAWNRMGEIRKD
>NZ_CP040640.1|WP_142779284.1|1378805_1379339_+|DUF1003-domain-containing-protein
MSDISDYIVSHFKRSSREIGEVERRILELSHQKKLVSSDTNAEFSAGASFGDRLADNIAKVGGSWGFILGFCFFLIFWAVINTIILTTGAFDPYPFIFLNLLLSMLAAIQAPIIMMSQNRQAARDRFEAAKDYEVNLKAELEVLSLHEKIDVKVLAELAALRQDLAALHRHVTRRED
>NZ_CP040640.1|WP_168208027.1|1376748_1378689_+|LTA-synthase-family-protein
MGLRDSAPKTTASEKAGFVFSPAWTRSLSKLSGIAYPLANLTVASVVLVVALEWIARGSLTDVGAFLTSSARPGMTTIAAVLALLVALDALLGRRYLSLIALAPLCALTGLISAQKQTYLSDPLYPSDLLFGRQILELLPTMLKAQPMTAALVALGICATIAALTGLWLLARRHSPGLSWRERAAGLALTLPLLAGLASLMDYSHYSWVRDRLNIIPMMWDQRENYRHNGFLMAFAFNIPMANVSAPQGYGENTIADLTSEPAAFAANKGDYPDVIMLMSESLWDPTRLENVKLSADPMPTIRAKQSGNVFSPEFGGMTANVEFEALTGFSNAFLPYGSIPYQQYIRRPVPSLASFFRGEGYSAIAMHPFQEWFWNRKQVYRNFGFEEFRSEETLPAMEKRGNFASDDALMDEIMATAEKAQNPLFLFAVTLQGHGPYEATRYAENTIGIEGDLSASASQALATYSQGVAEADEALLKLMRWAKKRDRETIIVLFGDHLPPLGQTFVESGYMPGMVASRRAPLEVMKKEHETPLVVWSSKKGVRKNIGTISPALLPYHVLKTAGFSDPFYTGTLGDVQQAFSVIDRHMLVTTDGKALPDWSIAPNAVPDVVRDYRLLQFDMMFGQQYGRERFFPGFNWLHEGAPSV
>NZ_CP040640.1|WP_142779283.1|1374846_1376526_-|NAD+-synthase
MSDRHDIQNHLRIAVGQFNPTVGDVAGNLAKAREARADAATQGADLLLLTELFISGYPPEDLVLKPAFLKACLKAVEELAAETADGGPGVVIGFPRQGETGRHNSVALLDGGKIIALRDKIDLPNYGEFDEKRVFSEGSISGPYNFRGVRIGIPICEEIWNDMGVCETLAESGAEILLVPNGSPYYRGKLDVRHQVALRQVIESGLPLVFANQLGGQDELVFDGASFGFNADKTLAFQMSQFEATLAVTDWKRTADGWHCDSGPFSKIPEGEEADYRACMLGFRDYVNKNGFKSVVLGLSGGIDSAICAALAVDALGEERVRCIMLPYRYTSEESLKDAADCAKALGCRYDIVPIVEPVEGFLSALSDLFEGTEEGITEENLQSRTRGTILMAVSNKFGSMVVTTGNKSEMSVGYATLYGDMNGGFNPIKDLYKMQVYAISSWRNAHVPPGALGPSGEVIPANIISKAPSAELRPNQTDQDSLPPYPVLDDILECLVEKEMSVEEILARGHDVATVHRVEHLLYLAEYKRRQSAPGVKITKKNFGRDRRYPITNRFRDR
>NZ_CP040640.1|WP_142779282.1|1374215_1374593_+|VOC-family-protein
MNTIADHGIRFGRIAAMLPVKNIEKAHDFYVGVLGFEKTFENGTPVGFMILKQGNAELHLTLQPSHKAAPFNVAHMMVSNVDALHALCKSQGLRIIKGLQDKDYGLRAFVFEDPDGNRIDVGQVI
>NZ_CP040640.1|WP_142779281.1|1373196_1374027_-|hypothetical-protein
MRSSIEIFNIRTRQMRAVWQTPDLFEAPNWSPDGKYLLLNSEGLLYRLSLAGDISPEKVDTGFATLCNNDHGISPDGSLYAISDKVEFGKSAIYLLPSAGGAPRLMTKNLPSYWHGWSPDGKGFAYCGIRDQVFDIYSMDITSGVETRLTHGEGRNDGPDYSPDGEWIYFNSSRTGRMQIWRVRVDGSAVERITDSPYGDWFPHPSPRGDKVVFVSYDGDVFDHPRDLDVRVRLMDMDGGNAETLFELFGGQGTMNSPNWSPDGDEFAYVRYFPVE
>NZ_CP040640.1|WP_059760139.1|1372157_1372874_-|5,6-dimethylbenzimidazole-synthase
MPADSSVSNPPGASSFDHALSPARPFSCEEREAIYRAIETRRDVRDQFLPDPLPDDLVERLLKAAHSAPSVGFMQPWNFTLVTDGAIRQAAFVAFSRANEEAAAMFTGEQQALYRSLKLEGIRKAPLSICVTCDPTRGGKVVLGRTHNPRTDVYSTVCAIQNLWLAARAEGIGVGWVSIFHDSDIRTILDIPDHIEIVAWLCLGRVDALYNEPELAVKGWRQRVPLEELVFRNRWGGV
>NZ_CP040640.1|WP_168208026.1|1370836_1371952_+|DUF2865-domain-containing-protein
MTRRSRIIGLLLPLIFLAPAAAFADQVCDTLYAQLREPPRVIGNTSEVRRYANALARQNIVIRKIRNDLRGYGCSSGSVIVYGNPNAGICAEIGDALAEAESERDAIIRDRDDAMAAARDNDGDIRRQRILAALDANGCNTMPQTETQLPPPPDVTRYPDAFRQNGPQNDDEPGQAGLSPYPNAAAEGGLRTLCVRTCDGSFFPIASNASPLDFRAQAEQCEKMCPGTETELYFHSMTDQETADMVSAETGKPYRDLPTAFAYRNATAKAPGCACNMAAYHKEMQKQEEAARPQPEKPYSGITTIPSPQGDKAEKPTEQQQAAKPPEQPVPERDYDPNDSRVRVIGPKFLPDQTGRIDLKNPALKGIQPQQ
>NZ_CP040640.1|WP_004433052.1|1385862_1386009_+|DUF1127-domain-containing-protein
MNIARSLTNWRKYRQTVTELGRMTDRELSDLGIGRQDIRRVAKTAVGF
>NZ_CP040640.1|WP_003495735.1|1386489_1386633_+|DUF1127-domain-containing-protein
MNPIRIAKNWISYRRTINELGSLSNQALSDIGLTRYDIRNVAARSFR
>NZ_CP040640.1|WP_168208028.1|1387239_1388682_+|methylenetetrahydrofolate--tRNA-(uracil(54)--C(5))-methyltransferase-(FADH(2)-oxidizing)-TrmFO
MDASMQDKTTSPIHVVGGGLAGSEAAWQIAQSGVPVILHEMRGVRGTDAHKGDTLAELVCSNSFRSDDATANAVGVIHAEMRLAGSLIMACADRHQVPAGGALAVDRDGFSEAVTKELESHPLVTIIREEVNGLPPKEWGNSIIATGPLTSPDLAAAIQAETGEDALAFFDAIAPIVHRDSINMDICWYQSRYDKVGPGGTGKDYINCPLNEEQYNAFIDALIAGDTVGFKEWEGTPYFDGCLPIEIMAERGRETLRHGPMKPMGLTNAHNPTVKAYAIVQLRQDNALGTLYNMVGFQTKLKYGVQADVFRMIPGLENAEFARLGGLHRNTYIDSPILLDRSLKLKSRPDLRFAGQITGCEGYVESASVGLLAGRFAAAEQKGEAPSLPPATTALGSLLNHITGGHLSSDDEPGKRSFQPMNINFGLFPELAPGSIVKPEGVKRFRGKDKTIMKRQLIAARALRDCAAWLDESQAETEAV
>NZ_CP040640.1|WP_142779290.1|1388688_1389291_-|pilus-assembly-protein-TadG
MKKTTWFLRLAGFGRCRSGAAAVEMGLLAPLLVLMLAVIIEVGRGWLSYDRFMTIVDNSARWAARFPEFEERVRTGVPSFVVLSGSGILQTGKLDLTLRSVKLVDKVARLQFPAHNFLGSAEDVPWEKTVIANGFVAQEAIIVVSGRYSYRPLISVLADITLKFEYVAAVNPFFSQRYPYQSGKSDFAKWNLKRSPFKAN
>NZ_CP040640.1|WP_142780173.1|1389287_1389854_-|pilus-assembly-protein-TadE
MKSLLSPRQDKSRGGPSRCRVTHAKCYRLLGDRKAATAVETALLLPLFFALIFGTLEIGLLMLYYLYLSFASNAGIEYLRKAASDGKPATEIALRKAISSRFIGGTDETTLKIALLPIPDDDIAEAKVPIPIVNDFRPPADTAGQYILAIGYNWNFLMPTTRFLVPDTGGIHQLRNISLAITAVRVTE
>NZ_CP040640.1|WP_142779291.1|1389855_1391070_-|pilus-assembly-protein
MTSRRIKKAAWKWSVFSSLLRDRAGTFAIMTALLLPVFIILLGLLFEGGRALAYYNQSKRVMAMACERATKPTRTYTLLDTVRRDNVTAAFDAMIQSTRQKVLSRDVQVKWTETKINAEFSYGLIFSEMFNLEKLKYRLAYSCEGIPPYPEDDAVIIDNMFESNALGVERVLKNGVTKETPGGCWGVYPYSEIGWDGGTGPGVELQDWSSPCCRRNHNWEGYPAGMQSKKLNEAPTANDKACTLKEVDKAKTTDKIEIDKKAGTELSLPTRYVMELDSDWGPPKPGKKKNIEANSSIYKDVELHPGIYKIMVWYNGRRAVEDVEKTNGIKISLQQLLPDLKPQQRVWELTQDKNSIAWTPRDYSFRVKAYSIYRVTIEATGLSDSFGGIITGFQLIYVDRMEEG
>NZ_CP040640.1|WP_003525152.1|1391499_1392627_+|S-(hydroxymethyl)glutathione-dehydrogenase/class-III-alcohol-dehydrogenase
MDVRAAVAIQAGKPLEVMTVQLEGPRAGEVLVEVKATGICHTDDFTLSGADPEGLFPAILGHEGAGVVVDVGPGVTSVKKGDHVIPLYTPECRECYSCTSRKTNLCTSIRATQGQGVMPDGTSRFSIGKDKIHHYMGCSTFSNYTVLPEIALAKINPDAPFDKVCYIGCGVTTGIGAVINTAKVEIGSTAIVFGLGGIGLNVLQGLRLAGADMIIGVDINPDRKAWGEKFGMTHFVNPKEVGDDIVPYLVNMTKRNGDLIGGADYTFDCTGNTKVMRQALEASHRGWGKSVIIGVAGAGQEISTRPFQLVTGRNWMGTAFGGARGRTDVPKIVDWYMEGKIQIDPMITHTMPLEDINKGFDLMHKGESIRGVVVY
>NZ_CP040640.1|WP_168208029.1|1392914_1393655_+|hypothetical-protein
MSLVSEHHERRELGAIGQLLMKGDDAAGVLLTIKSRLPETGRIVVNLSSWYVEPSCRWFAPRMLQMASSNEDEIFTDLTPSPEACKLNERLGFATVTDCTLFYPLPFAALRPASARLRPPGEIKPEILSGEMRDMLEDHARLGCIVAVMEAENRHYPLVFLKTTTKRLPSARLIHCEDRQVAQRHISAIARHLLGHGRLALTMAATGAERKAGGLAAHKSAPIQVKGAWNPRFINEAYSELVLLPP
>NZ_CP040640.1|WP_020810249.1|1393760_1394024_+|acyl-carrier-protein
MLAAKKSEIDVADTIYSYLSNRFPAYAPFSADTLLLEGGVIDSLGFLELMIFLGEGFGIILDDEHFTPENLGTPADLIAFVLRERRR
>NZ_CP040640.1|WP_142779293.1|1394020_1395553_+|AMP-binding-protein
MTPHFLLHHLLTARAASDDQALVHKDRSLNYREFSAAAARCAAALQEAGAQRGDRVVIYLPRGIEECWSIFGVSMASGVFVPVNALLKAQQIRHIVKDCGAKIVISDAAMMDELKAALEDLPDVTVLLAEEIEARADTPARPSAAIGEDLAAILYTSGSTGSPKGVMLSHRNLLAGARIVRTYLDITGSDRILSLLPFSFDYGLNQLLTAVEQGAATIISTFRLGDEIVRDLRDHAITGLAGVPTIWAILTKAAPSLTKTPLPHLRYITNSGGRVPQETVKALREKLPDTKIYLMYGLTEAFRSTFLPPEEIDRRPTSIGKAIPECEIFIVTAEGQRAKPGEPGILVHRGPTVSLGYWNRPEDTAKVLRPHPFIPAALGGETVCYSGDLAVEDEDGFFSFVARNDAMIKSSGYRISPTEVEESLMSTGLFQQVAVIGLPDPFAGEKVHAVATAANQNIDVTAALKKAAEMLAPFMIPRAIELVERLPVTANGKVDYRALVRERTDNGANG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	HQ331142	Salmonella phage S16, complete genome	92743-92776	8	0.765
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NC_012586	Sinorhizobium fredii NGR234 plasmid pNGR234b, complete sequence	1761529-1761562	9	0.735
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NZ_CP043499	Rhizobium grahamii strain BG7 plasmid unnamed, complete sequence	1224348-1224381	9	0.735
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NC_008826	Methylibium petroleiphilum PM1 plasmid RPME01, complete sequence	110083-110116	9	0.735
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	JX181825	Salmonella phage STML-198, complete genome	134228-134261	9	0.735
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	KJ000058	Salmonella phage STP4-a, complete genome	93822-93855	9	0.735
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NC_042044	Salmonella phage Melville, complete genome	94122-94155	9	0.735
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NZ_CP013110	Sinorhizobium americanum strain CFNEI 73 plasmid C, complete sequence	1248601-1248634	10	0.706
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NZ_CP024310	Sinorhizobium fredii strain NXT3 plasmid pSfreNXT3c, complete sequence	850917-850950	10	0.706
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NZ_CP013054	Sinorhizobium americanum CCGM7 plasmid C, complete sequence	1160346-1160379	10	0.706
NZ_CP040640_1	1.1\|1383449\|34\|NZ_CP040640\|CRISPRCasFinder	1383449-1383482	34	NZ_CP023064	Sinorhizobium sp. CCBAU 05631 plasmid pSS05631b, complete sequence	670407-670440	10	0.706

1. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to HQ331142 (Salmonella phage S16, complete genome) position: , mismatch: 8, identity: 0.765

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ctcatcttcgtcatcgccttcatcggcgtcgtca	Protospacer
*  * *  * ** ********* ***********

2. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NC_012586 (Sinorhizobium fredii NGR234 plasmid pNGR234b, complete sequence) position: , mismatch: 9, identity: 0.735

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ctttactacttcttcgccttcggcggcttcgtcg	Protospacer
*   .* .*************.***** *****.

3. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NZ_CP043499 (Rhizobium grahamii strain BG7 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.735

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ctctactacttcttcgccttcggcggcttcgtcg	Protospacer
*   .* .*************.***** *****.

4. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NC_008826 (Methylibium petroleiphilum PM1 plasmid RPME01, complete sequence) position: , mismatch: 9, identity: 0.735

cggagcggct--tcttcgccttcagcggcgtcgtca	CRISPR spacer
--caccagtcgatcttcgccttccgcggcgccgtca	Protospacer
   * *.*..  *********** ******.*****

5. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to JX181825 (Salmonella phage STML-198, complete genome) position: , mismatch: 9, identity: 0.735

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ttcatcttcgtcatcgccttcatcggcgtcgtca	Protospacer
.  * *  * ** ********* ***********

6. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to KJ000058 (Salmonella phage STP4-a, complete genome) position: , mismatch: 9, identity: 0.735

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ttcatcttcgtcatcgccttcatcggcgtcgtca	Protospacer
.  * *  * ** ********* ***********

7. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NC_042044 (Salmonella phage Melville, complete genome) position: , mismatch: 9, identity: 0.735

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ttcatcttcgtcatcgccttcatcggcgtcgtca	Protospacer
.  * *  * ** ********* ***********

8. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NZ_CP013110 (Sinorhizobium americanum strain CFNEI 73 plasmid C, complete sequence) position: , mismatch: 10, identity: 0.706

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ctctactatttcttcgccttcggcggcttcgtcg	Protospacer
*   .* ..************.***** *****.

9. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NZ_CP024310 (Sinorhizobium fredii strain NXT3 plasmid pSfreNXT3c, complete sequence) position: , mismatch: 10, identity: 0.706

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ctctactatttcttcgccttcggcggcttcgtcg	Protospacer
*   .* ..************.***** *****.

10. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NZ_CP013054 (Sinorhizobium americanum CCGM7 plasmid C, complete sequence) position: , mismatch: 10, identity: 0.706

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ctctactatttcttcgccttcggcggcttcgtcg	Protospacer
*   .* ..************.***** *****.

11. spacer 1.1|1383449|34|NZ_CP040640|CRISPRCasFinder matches to NZ_CP023064 (Sinorhizobium sp. CCBAU 05631 plasmid pSS05631b, complete sequence) position: , mismatch: 10, identity: 0.706

cggagcggcttcttcgccttcagcggcgtcgtca	CRISPR spacer
ctctactatttcttcgccttcggcggcttcgtcg	Protospacer
*   .* ..************.***** *****.

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

638318 : 645650

Geobacillus_phage(33.33%)

protease,head,tail,portal,capsid

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_142778913.1\|638318_639485_+\|portal	phage portal protein	W8ECU7	Geobacillus_phage	1.0e-62	38.0
WP_020808622.1\|639680_640001_+	hypothetical protein	NA	NA	NA	NA
WP_142778914.1\|640029_640602_+\|head,protease	HK97 family phage prohead protease	A0A0U2BX10	Paracoccus_phage	1.2e-27	45.6
WP_137003130.1\|640632_641901_+\|capsid	phage major capsid protein	Q3HQT0	Burkholderia_phage	1.2e-77	43.2
WP_142778915.1\|642079_642649_+	hypothetical protein	NA	NA	NA	NA
WP_020808625.1\|642652_642988_+\|head	phage head closure protein	NA	NA	NA	NA
WP_142778916.1\|642984_643380_+	DUF3168 domain-containing protein	NA	NA	NA	NA
WP_168207993.1\|643387_644587_-	MFS transporter	NA	NA	NA	NA
WP_003521219.1\|644677_645085_+\|tail	phage major tail protein, TP901-1 family	NA	NA	NA	NA
WP_059753802.1\|645084_645444_+	gene transfer agent family protein	NA	NA	NA	NA
WP_125144629.1\|645440_645650_+\|tail	phage tail assembly chaperone	NA	NA	NA	NA

DBSCAN-SWA_2

1394020 : 1402298

uncultured_Mediterranean_phage(66.67%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_142779293.1\|1394020_1395553_+	AMP-binding protein	A0A2K9L3I8	Tupanvirus	1.5e-21	23.6
WP_168208030.1\|1395536_1396814_+	type III PLP-dependent enzyme	NA	NA	NA	NA
WP_142779294.1\|1396933_1398091_-	aminodeoxychorismate synthase component I	S4VT78	Pandoravirus	3.4e-42	48.1
WP_080856425.1\|1398128_1399259_-\|tRNA	tRNA guanosine(34) transglycosylase Tgt	A0A1B1IVQ4	uncultured_Mediterranean_phage	8.0e-105	53.0
WP_142779295.1\|1399258_1400341_-\|tRNA	tRNA preQ1(34) S-adenosylmethionine ribosyltransferase-isomerase QueA	NA	NA	NA	NA
WP_020810245.1\|1400657_1401167_-	peptidylprolyl isomerase	A0A1B1IVS0	uncultured_Mediterranean_phage	8.4e-46	58.8
WP_142779296.1\|1401204_1401774_-	peptidylprolyl isomerase	A0A1B1IVS0	uncultured_Mediterranean_phage	4.2e-46	53.2
WP_020810243.1\|1401803_1402298_-	pantetheine-phosphate adenylyltransferase	A0A1B1IVQ3	uncultured_Mediterranean_phage	2.9e-27	39.0

DBSCAN-SWA_3

1418701 : 1427257

uncultured_Mediterranean_phage(75.0%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_168208031.1\|1418701_1420267_-	peptidoglycan DD-metalloendopeptidase family protein	I3PV24	Clostridium_phage	1.1e-11	30.4
WP_003522731.1\|1420612_1421266_-	protein-L-isoaspartate(D-aspartate) O-methyltransferase	A0A1J0MC37	Streptomyces_phage	1.0e-11	35.1
WP_003522730.1\|1421262_1422033_-	5'/3'-nucleotidase SurE	A0A1B1ITZ2	uncultured_Mediterranean_phage	6.2e-24	29.9
WP_059760200.1\|1422239_1423523_-\|tRNA	serine--tRNA ligase	A0A1B1IVT2	uncultured_Mediterranean_phage	1.8e-97	45.8
WP_003522727.1\|1423624_1424428_-	twin-arginine translocase subunit TatC	A0A1B1IVR7	uncultured_Mediterranean_phage	9.9e-41	39.9
WP_142779309.1\|1424424_1425192_-	twin-arginine translocase subunit TatB	NA	NA	NA	NA
WP_003509722.1\|1425349_1425556_-	twin-arginine translocase TatA/TatE family subunit	A0A1B1IVR9	uncultured_Mediterranean_phage	2.1e-08	69.8
WP_142779310.1\|1425684_1426419_-	SMC-Scp complex subunit ScpB	A0A1B1IVT7	uncultured_Mediterranean_phage	7.6e-40	47.6
WP_003522723.1\|1426408_1427257_-	segregation/condensation protein A	A0A1B1IVW1	uncultured_Mediterranean_phage	1.1e-34	34.2

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP040641

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. NZ_CP040640

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection