Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NC_021878 | Arcobacter butzleri 7h1h, complete sequence | 0 crisprs | PrimPol,DEDDh,WYL,PD-DExK,csa3 | 0 | 0 | 3 | 0 |
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
427027 : 434798
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NC_021878|427027:434798|DBSCAN-SWA CTTGAACTCACCAATTTCTGTATCAACTTTAAATCTTCAAATTAAATCTCTACTTGAAACTACATTTATTCAAGTTTATGTAGAAGGTGAGATTTCAAATCTTACTTATCATAATTCAGGACATATATATTTTTCAATAAAAGATGAAAATTCTACGCTTTCTTGTGTAATGTTTAAAGGGAATACAAAATATTTAAAGTTTCAACTTGAAAATGGTTTAAAAATAGTAATTACAGGAAGTTTAACTGTTTATGCTCCAAGAGGAAATTATCAACTTTTATGTAATAAAATAGAACCTTCTGGAATAGGAAGTTTATCTTTAGCTTTTGAACAATTAAAAACTAAACTTGAAGCAAAAGGTTACTTTGAAAGAAGCAGAAAAAAAACTTTACCAAGATATCCTAAAAAAATAGCAATAGTAACTTCTCCAACAGGTGCTGCAATAGAAGATATGAAAAAAGTAGCAACTCATCGTTGGTCTTTAGTTGAATTTATATTAATCCCAACTTTAGTTCAAGGTGAGGGCGCAAGTTTAGACATAGCAAATTCTATAAAATATGCAGATAAATTAAACTGTGATATTATGATTGTTGGACGAGGTGGAGGAAGTATAGAAGACTTGTGGGCTTTTAATGAAGAGATTGTTGCAAATGCAATTTATGAAGCAAAAACTCCAATTATTTCAGCAGTTGGACATGAAGTTGATTATTTAATTTCAGATTTTGTTGCTGATATTCGAGCTGCAACTCCATCAAATGCAATTGAAATAGCACTTCCAGATATAAATGAACATAGAATTTATCTTGATTCTTTAGAAAATGAAATTACAAATAGATTTAAAAATATTTTATTCAATAAAGAGCAAGAGTTAAAAAATATGAAAAAATTATTTGAACAAAACTCTATTGAAACAAAATTCAATTTCATACAAACTCAAATTAATTTTATAAAGTCATCATTGAAAATAAATTTGAACCAAAAATTTTTAGGTTATCAAAATCAAATAGATTTACTAAAATCAAATTATTTATCAAATCATCCAGATAAAAAAGAGAAAAATGGTTTTGTACAAATTAGTAAAAGTAATAAAGTTATAAATTTAGCAGATTTAAAAATTGGAGATGAAATAGAGTTACAAACTCCAAGGTATATTGCAAGTTGTACTTTAAATAAATTAGTAAAACAATAGAATTTAAGTTTAGTATAGATAGAATAATGAAAATTCGTTTAATTTATACATATCTAATAAAGAGGGAATATTAATGGAAAATAATCGTGATAAAGCTGTAAGTTCTTCAAAGATTACTGAGTTTATGACATTTGAGTTAGGGGCAATGAAGTATGCAATTGAGTTGCCAAAGATTAAAGAAATTTTAACTTATCCAGATAATATTACAATTTTACCAAATACTTCAAAATGGGTAAAGGGTTTAATTAATTCAAGAGGAGAAGTTGTTCCTATTTTAGATATTAGAATAAAGTTCAACACAGGACCTGCTGTTTATGATGAAAATACTTCTATTATTACAGTTATTACTGAAGATAAAAGAATGATAGGAATAGTTGTAGATTTAGTTGATGATGTTCAAAAACTTGATACTAGTATGTTAGCACAAGTTGCGGAGATGGGTTCTGCAATTCCACCTAAATATTTAAAAGGTTATGTTAGACTTGATAATAACCAAATGCTTGTAATTATGGATATCGAAAGAGTTGTTGATAAAGAAGAGTTACAAGACTGATTTTAAGTAAATCAAGAATTTCTTGATTTACTCTTTTATAGATATAGAGATAATTTTTACATCTTCTAAAGGTTTATCTCCATTATATTTTCCATTTGTTCTTACGTTTTCTATTGCTTTTACTACATCAAATCCATTTATAACATATCCAAAAATAGTGTGATAACCATTTAACCAATAAGTTGGAACTGTTGTTATGAAAAATTGACTATTGTTTGTATTTGGACCTTTATTTGCCATAGCTAAAATTCCAGGTTTATCAAAAACAGCATTTTTTGCAAACTCATCTGCAAAATCTTCTTTCCAAATAGATTCTCCACCAGCTCCAGTTCCTGTTGGATCACCACCTTGAATCATAAAGTTTTTAATAACTCTATGAAAAATTTGACCATTGTAATATCCATTTTTTGCATGAGTTACAAAATTTTCGACAGCTTTTGGAGCTAAGTCTGGTCTTAATTCAACTTCAATATCACCTTTTGAAGTTTTAAATGTAGCTATTGGATTAGCAGCATTTAAAAATAGTGTAAAACAACAAAGAATAAATAAAATTCTTTTCATAAAATTGCCTTTTTTGTAGATTTTTTAGTAAATTAGTATAGTGTATTAGATTTAAAAAAAGATAAAAAAGATATTTTATAATACTTTAAAAAAAAAGTGTTAAAATGCACGAAATTATTAACTATTAAATATAAAAAAATAAAAGGCTTATAAATGACATTTGAAATGTTATACAGCAAAATTCATAGAGCAACTGTAAGTGACGCAAATCTGAATTATGTTGGTTCGATTACAATAGATGAAGATTTGATGAAAGCAGCTAATTTAAGAGTTGGTCAAAAAGTTGATATTGTAAATATTAATAATGGTGAAAGATTTCAAACTTATATTATAAAAGGGAAAGCAGGCTCTAAAGATATGTGCTTAAATGGAGCAGCAGCTAGAAAAGTAGAAATTGGGGATAAAATTATCGTTATTGCTTATGCAACTTTTAGTGAAGCAGAACTTGAAAACTATAAACCAACAGTTGTTTTAGTTGATGATAAAAATAATATTGAATTAATAACTCATGAATTAGAAGGAGGTAAATATGTTTGATGGACTTGATTTAAAAAATTTGAATTTAGGTGATATGTTAAACCAATTTCAAGATATGGCAAAAAATGCACAAAATGAAAATGCATCAAGAATTTTTACTTCAAAAGCTGGTGGAGGAATGGTAGAAATATCAATCAATGGAAATTCAGAAGTTGTTGATTTAAAAATTGATGATTCTCTTTTAGAAGATAAAGACTCTTTACAAATTTTACTTATCTCTTGTATGAATGATGTAATTAAACAAAGCGATGAAAATAAAAAAATGATGGCTATGAACTTAATGGGTGGTTTAGGCTCATTTGGACAAAAGTGATTTAATGAAAGATTTATTAAATTCTTTTGAAGATTATTTACTAAAAAATCTTCCTATCTCAAAAACATTTCATCCTCACTTTGAAGATGCTTTAGCTGATATGTTAAAAGCAGGTGGAAAAAGATTTCGTCCGATGCTTTTATTATCTGTTGTAAAATCAAATAAATCTTTATTAGTTCCAAATGCAATGAGTGTAGCATTAGGAGTTGAATTTTTACATACGTATTCTTTGATTCATGATGATTTACCAGCGATGGATAACTCTGATTTAAGAAGAGGATTTCAAACTTTACATAAAAAATATGATGAAGTAACAGCTATTTTAGTTGGAGATGCTTTAAACACTGAAGCTTTTAATTTAATAGCAAATGCTTCTTTACATAATGATATAAAAGTTGAACTTATCAAATGTTTGGCACATAATGGTGGAATAAATGGTATGATTATAGGTCAAGCAATAGATTGTCATTTTGAAAAACAAAAAATACAGTTAAATCAATTAGAGTTTTTACACATTCATAAAACGGCAAGACTAATTGCAGCTAGCCTTAAGATGGGTGCAATTATAAGTGAATATGATTTGCAAACACAAGAAAAACTTTATAATTTTGGAATAGATTTAGGACTGTTATTCCAAATTCAAGATGATATTATTGATGAAACTTGTACTGAAGAAGAAGCTGGTAAAACTACGCAAAATGATGGATTTAAAAACTCTTTTGTAAATTTATTAGGACTTGATGGTGCAAAAAAAAGTGCTGATGATTTAGCTTTAAAATGTATAGATTCTCTTAATACTTTTGAAGAAAATTTAAAAAAATCTTTAGAAGAGTTACTTCTAAAATATATAAATAGACACAAATAATTTTAAACTCTTAGTTAATTTGACTCAAATATATTGACAAATAATTTAAAATTTATTAAAATTTAGCACTTATAAAATTAGAGTGCTAATTTATAAGTTAAAAAATATAAAATTAATTTAATAATAAGGAAATAGTATGAATTTTAAACCACTAGGTGAAAGAGTTCTTGTAAAAAGAACAGAAGTTGAGAACAAAACAGCAAGTGGAATCTATATTCCAGATAATGCAAAAGAGAAACCACAAACTGCAAAAGTTGTTGCAATTGGAAATAAAGTTGAAGATGTTAAAGTTGGTGATACAATTGTATTTGAACAATATAGAGGAACTGAATTCAAACTTGAGGGTGAAGAATATCTAATTTTAAATATTGAAAATGTTATAGGAGTTATGTAATGGCAAAAGAGATTTTATTTAGTGATAATGCAAGAAATAGATTATATTCAGGTGTTGAAAAATTAGCTGATGCAGTTAAAGTTACAATGGGACCAAGAGGAAGAAATGTTTTATTACAAAAATCATTTGGTGCTCCTACAATTACAAAAGATGGTGTAAGTGTTGCTAGAGAAATTGAATTAAAAGATACTTTAGAAAATATGGGAGCACAACTTGTAAAAGAAGTAGCTTCAAAAACAAATGATGAAGCAGGAGATGGAACAACAACTGCAACTGTTTTAGCACATTCTATTTTCAAAGAAGGGCTTAGAAATGTAACAGCAGGTGCAAATCCAATATCTTTAAAAAGAGGAATGGATAAAGCTTGCGAAGCTATTTTAGCTGAACTTAAAAAATCTTCAAAAGTTGTAGCAAATAAAACAGAGATTGAACAAGTTGCTACAATCTCAGCAAATTCAGATAGTGCTATTGGAAAAATGATAGCTGAAGCTATGGATAAAGTTGGAAAAGATGGTGTTATCACTGTTGAAGAAGCAAAAGGTATTTCTGATGAGTTAGATGTTGTTGAAGGTATGCAATTTGATAGAGGATATTTATCTCCATACTTTGTAACAAATCCTGAAAAAATGATTGCAGAGTTTAATAACCCATTCATTTTATTATATGACAAAAAAATCTCTTCATTAAAAGAGATGTTACCAATTTTAGAATCAGTAAATCAATCAGGACGACCTTTAGTAATTATTGCTGAAGATGTAGATGGTGAAGCATTAGCAACACTGGTAGTAAATAGATTAAGAGGTTCATTACATATTGCTGCTGTTAAAGCTCCTGGATTTGGAGATAGAAGAAAAGCTATGCTTGAAGATATTGCAGTTTTAACTGGTGGAACTGTAATTTCAGAAGAGATGGGAATGAAACTTGAAACAGCTGAATTTAGTTGTTTAGGAACTGCTTCAAAAATCGTAATTGACAAAGATAATACAACAATCGTTGATGGAAATGGTGATAATGAAAGAGTTGTTGCAAGAGTAAATCAAATTAAAGCAGAAATATCAAATACAACAAGTGATTATGATAGAGAAAAATTACAAGAAAGATTAGCAAAACTTTCTGGTGGAGTTGCAGTTATTAAAGTTGGAGCTGCTACTGAAACTGAAATGAAAGAGAAAAAAGACAGAGTTGATGATGCTTTAAGTGCAACAAGAGCTGCTGTTGAAGAAGGTATTGTAATTGGTGGAGGAGCTGCTTTAATTAAAGCTTCTAAAAAAGTAAACCTTGATTTAACTGGTGATGAAAGAATTGGAGCAGATATTGTTTTAAGAGCTATTTCAGCACCATTAAAACAAATTGCAATTAATGCTGGATTTGATGCAGGAGTTGTTGCAAATGAAGTTGAAAAATCATCAAATGAAAATTTAGGATTTAATGCAGCAACAGGTGAATATGTAGATATGTTTGAAGCTGGAATTGTAGATCCTGCAAAAGTTGAAAGAGTTGCTATGCAAAATGCTGTTTCAGTAGCTTCACTTTTACTTACAACTGAAGCAACTGTAAGTGATATAAAAGAGGATAAACCAGCAATGCCTTCTATGCCAGACATGGGTGGAATGGGAATGCCAGGAATGATGTAACAATTATCTAAAATTGATAGTTTTTTTTAACCGTACCTTTTTAAGGTGCGGTTTTTTAATTTATAATTAATAAAAAATTTAAATGATTATGAAATTAATAGGAAAATTATAAACGAAATAGATATTATTCTAAATAAAAAAAGAGCTCCAAAATAGAGCTCTTCTAAAAATTATTTTTCGATAAATAAGACTTTTATTTATCAAGTTTACTTTGAAATAAACTTATAGTTTAAATTAAAAGTTAACAGTTATAAAAGGTGAAGTTTTCGTCAATTGAACCTCCTATAATTTTAAAGATAATGTAATTATAACATCTTTTTAAATTAAAACAAACTGAAATTTTATTAAATTATTTAATAGAAAAAGAGAGAGTTATTTTTGTTCCAATATTTTCTTGGCTTATTAAAGAAATTTTTCCTTTGTGAATATCTACAATTTTCTTCATAATCGACATTCCAAGACCAGTTCCTCCACTATTTTTATTTCTACTTTTATCTGTTCTATAAAACTTTTCATAAATTTTTTCTTGTTCATTTGTAGGAATTCCAATCCCAAAATCTTCAATAGAGATATTTAATAAATCATTTTCTTTAAATATTTTTACTATAACTTCTTTATTTTCATGGCTAAATTGAATAGCATTTTTCAAAATATTTTTTATTGCAATTTTTAATAAACTTGCAAATGCTTTCATCTCTAAGCTATCTTCTACTATCAAAGACATTTTTATTTTATGAAGTTTTGCAAAATTTTTAAGTTCATTTATTGCTTCATCTGCAAGTTCATCTAAATAAAACTCTTCTTGTTTATCTACAACTAACTCTTGTTCATTTTTAGCTAAAAATAGTAAATCATTTATTGTTTGTTCAATCCCTGATATCTCTTCTAAAGATGTTTTTAAAGCTTCTTTATATTCATTTATCGTTCTATCTTTTCTTAAAGTTACTTCCATTTCACCTTTTATAATTGTAAGAGGAGTTTTTAGTTCGTGAGAAGCATCTGAACTAAATTGCGACATTCTTTCAAAAGAGTTTTCAAGTCTTGATAATAAAGAATTAATTTCATTTATTAGTTGGTTTATTTCATCTTTTGATTTTGTTGTTTTTAATCTTGCTGATAAATCATTTGCATTTATCTGTTTTAATTCAAGCAAAATATTTTCAATTGGTAAAAATGATTTATAAATTACAAAATTTCCACCAATAACAGCAAAAATAAGAATTATTGGAAGGATAAATCCTAAAATATAAAGAAGATTTTCCAAAGTTGAAGTTAAAATATCTTTTGTTGTAACTGCTTCAATAATGATGCTTTGTTCATCATGAAAATCTATTTTTATTCTACTTACAAAATAGTTATTTTGTTCTTCAAAAGTTATTACATTCTCTTTTAATTTATCTAAATAATCATCGTTATGGTCAATGTTATTTGGGAAATTATCTGTTTTGATTACTTCTTTGTGAGTTTTAGCATCTAAAATTCTAATATAAAGAGGTTCAAAATTGTACTCTTTTTCTTCATCTAAAATATTATCTGTGATTTTATTTTTTTCTAAAATATCATCAGTAATATCAAGAACTATTACTTTTAGCGTTGCTTCAAGTTTATCAACAGTTGAAATTTCTAATGCTTTATATAAAGAAAAAGAAAAAATTACTAAAATAATAGTTTGAATAAAAAAACTATAAAATAGAAGTTTCTTTTTGATTGATAGATTAATCTTCAC
Protein sequences of DBSCAN-SWA_1 >NC_021878|427027:434798|431180_431438_+|WP_004510495.1|DBSCAN-SWA MNFKPLGERVLVKRTEVENKTASGIYIPDNAKEKPQTAKVVAIGNKVEDVKVGDTIVFEQYRGTEFKLEGEEYLILNIENVIGVM >NC_021878|427027:434798|429858_430179_+|WP_012012250.1|DBSCAN-SWA MFDGLDLKNLNLGDMLNQFQDMAKNAQNENASRIFTSKAGGGMVEISINGNSEVVDLKIDDSLLEDKDSLQILLISCMNDVIKQSDENKKMMAMNLMGGLGSFGQK >NC_021878|427027:434798|431437_433072_+|WP_004510496.1|DBSCAN-SWA MAKEILFSDNARNRLYSGVEKLADAVKVTMGPRGRNVLLQKSFGAPTITKDGVSVAREIELKDTLENMGAQLVKEVASKTNDEAGDGTTTATVLAHSIFKEGLRNVTAGANPISLKRGMDKACEAILAELKKSSKVVANKTEIEQVATISANSDSAIGKMIAEAMDKVGKDGVITVEEAKGISDELDVVEGMQFDRGYLSPYFVTNPEKMIAEFNNPFILLYDKKISSLKEMLPILESVNQSGRPLVIIAEDVDGEALATLVVNRLRGSLHIAAVKAPGFGDRRKAMLEDIAVLTGGTVISEEMGMKLETAEFSCLGTASKIVIDKDNTTIVDGNGDNERVVARVNQIKAEISNTTSDYDREKLQERLAKLSGGVAVIKVGAATETEMKEKKDRVDDALSATRAAVEEGIVIGGGAALIKASKKVNLDLTGDERIGADIVLRAISAPLKQIAINAGFDAGVVANEVEKSSNENLGFNAATGEYVDMFEAGIVDPAKVERVAMQNAVSVASLLLTTEATVSDIKEDKPAMPSMPDMGGMGMPGMM >NC_021878|427027:434798|429482_429866_+|WP_004510492.1|DBSCAN-SWA MTFEMLYSKIHRATVSDANLNYVGSITIDEDLMKAANLRVGQKVDIVNINNGERFQTYIIKGKAGSKDMCLNGAAARKVEIGDKIIVIAYATFSEAELENYKPTVVLVDDKNNIELITHELEGGKYV >NC_021878|427027:434798|430183_431044_+|WP_012012251.1|DBSCAN-SWA MKDLLNSFEDYLLKNLPISKTFHPHFEDALADMLKAGGKRFRPMLLLSVVKSNKSLLVPNAMSVALGVEFLHTYSLIHDDLPAMDNSDLRRGFQTLHKKYDEVTAILVGDALNTEAFNLIANASLHNDIKVELIKCLAHNGGINGMIIGQAIDCHFEKQKIQLNQLEFLHIHKTARLIAASLKMGAIISEYDLQTQEKLYNFGIDLGLLFQIQDDIIDETCTEEEAGKTTQNDGFKNSFVNLLGLDGAKKSADDLALKCIDSLNTFEENLKKSLEELLLKYINRHK >NC_021878|427027:434798|427027_428215_+|WP_020847394.1|DBSCAN-SWA MNSPISVSTLNLQIKSLLETTFIQVYVEGEISNLTYHNSGHIYFSIKDENSTLSCVMFKGNTKYLKFQLENGLKIVITGSLTVYAPRGNYQLLCNKIEPSGIGSLSLAFEQLKTKLEAKGYFERSRKKTLPRYPKKIAIVTSPTGAAIEDMKKVATHRWSLVEFILIPTLVQGEGASLDIANSIKYADKLNCDIMIVGRGGGSIEDLWAFNEEIVANAIYEAKTPIISAVGHEVDYLISDFVADIRAATPSNAIEIALPDINEHRIYLDSLENEITNRFKNILFNKEQELKNMKKLFEQNSIETKFNFIQTQINFIKSSLKINLNQKFLGYQNQIDLLKSNYLSNHPDKKEKNGFVQISKSNKVINLADLKIGDEIELQTPRYIASCTLNKLVKQ >NC_021878|427027:434798|428288_428768_+|WP_020847395.1|DBSCAN-SWA MENNRDKAVSSSKITEFMTFELGAMKYAIELPKIKEILTYPDNITILPNTSKWVKGLINSRGEVVPILDIRIKFNTGPAVYDENTSIITVITEDKRMIGIVVDLVDDVQKLDTSMLAQVAEMGSAIPPKYLKGYVRLDNNQMLVIMDIERVVDKEELQD >NC_021878|427027:434798|433421_434798_-|WP_020847397.1|DBSCAN-SWA MKINLSIKKKLLFYSFFIQTIILVIFSFSLYKALEISTVDKLEATLKVIVLDITDDILEKNKITDNILDEEKEYNFEPLYIRILDAKTHKEVIKTDNFPNNIDHNDDYLDKLKENVITFEEQNNYFVSRIKIDFHDEQSIIIEAVTTKDILTSTLENLLYILGFILPIILIFAVIGGNFVIYKSFLPIENILLELKQINANDLSARLKTTKSKDEINQLINEINSLLSRLENSFERMSQFSSDASHELKTPLTIIKGEMEVTLRKDRTINEYKEALKTSLEEISGIEQTINDLLFLAKNEQELVVDKQEEFYLDELADEAINELKNFAKLHKIKMSLIVEDSLEMKAFASLLKIAIKNILKNAIQFSHENKEVIVKIFKENDLLNISIEDFGIGIPTNEQEKIYEKFYRTDKSRNKNSGGTGLGMSIMKKIVDIHKGKISLISQENIGTKITLSFSIK >NC_021878|427027:434798|428795_429311_-|WP_175530872.1|DBSCAN-SWA MLCCFTLFLNAANPIATFKTSKGDIEVELRPDLAPKAVENFVTHAKNGYYNGQIFHRVIKNFMIQGGDPTGTGAGGESIWKEDFADEFAKNAVFDKPGILAMANKGPNTNNSQFFITTVPTYWLNGYHTIFGYVINGFDVVKAIENVRTNGKYNGDKPLEDVKIISISIKE |
9 | Indivirus(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
639288 : 648410
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NC_021878|639288:648410|DBSCAN-SWA AATGGATTCTATTTTAGATATATCAAATTTTCAAAAATTTTTAAAAGATGAAGAAGAGATAATAATTGATGAATTTTTGAGAAAATATATTATAAATTTTAGAAAAATAGAAGATGAAGAATCACAAAAAATAGAAAATTTTTTTACTTTAATCATCAAATCAATTTGTAGTGGTGATATAAAAAGTGCCACTTCAATTTATAAAGATTTGATAGATTATAATATTGAATTAGATATACCTTATATAATGCTAACTTATGAACTTATAAATCTTAAAAAAATTATTTTACAAAAACTACTTTACAAGGATGTAAGAGATGAACTTATGCAACTATATAAGATGCATATGTTTTTTGAAGATATGATAGCAAAAACATATCTAAACAAATATATAGTTGATTTGAATAAAAAAAATAATTTTAGCTTATCAAATTTAAGTGGAATTTCTCAAAGTAATATAATTTATTACTACAAAATGCATTTAGAGTGGTTGGAAGATTTAGCTAAAGCTATTGTTTTAGCAGATATAAATATTTTTCCAGAAATAAATCATAATTTATGTACTTTTGGAAAGTGGCTAGATAAAGAAGGTTTAGAAATCATAAAAAATAGTTCTAAGTATAAAAATATTTCTAAACTTCATGAAAATTTACATTTTTTTGCAAAACAGATTAAAAATTGTCTTATTGAAACGCAAGGTAATAATCATATTATTTTGATTTATTTAGAAAAATGTGAAATGATATCTTTATCTTTAGGAACAGAACTTGCATTAATAGATAATACTTTGATAAATTCTGAAGCTTCAAAAGATCCATTAACTGGAGCTTTAAATAGACAAAGGTTAAGTCAGTTGTATCAAAATCAATTAGAAATCTCATTTGCAACTTTTGAGCCTTTTGTTATTGCAATGTGTGATTTTGACCACTTCAAAAATATAAATGATACTTTTGGACATTTAGCTGGTGATAAAATGTTAAAAAGCTTTGTACATATTGCAAAAAAACATCTAAGAACTTCAGATATAATCATAAGATATGGTGGTGAAGAGTTTATGATAATTCTTCCTGCAATAAATACAAAAAAGGCAAAAGATATTTTAAATAAAATTAGAGAAGATATTGCTAATTTTGTTTTAAATTTGGACGGAAATAAAATATCAGCAACTATTAGTATAGGAATGATAGAAATCTATCCAGAAAATGGAAATAATAGTTATTTCAAAGATTTTGAAAATACTATTTCATTGGTGGATAAAAAATTATATGAAGCAAAAAATAGCGGAAGAAATACTATTTGTTAATATTTATTTAGCCCTAACTTAGTTTTGGCTAAAATATCCATCTTTTATTATTGGGAGTAAAAATGGATAGTGTTTATAGTATAAATATAGAAAGAGCTGTTTTAAGTTCGATTTTTTTTAATCCTGAAGAGTTAGAAGATATTTTAGGAATTTTAAAACCAAAAGATTTTTATCTACCTGCACATAAAAAAATCTTTGAAGTAATGGTTAAACTTCATGACGAAGGTATGCCAATTGACGAAGATTTTATTAGAAATAAAGTAAATTCAAAAGATGTAGATGATTCTATACTTCTTGAAATACTATCTGCAAATCCAATTACAAACACTTTAGCTTATGTAAGAGAAATAAAAGATAGTTCAGTTAAAAGAGAACTAGCTTCATTGGCAACAACTATAAAAAAAGTTGCTATTGAAGATGGAGTAAGTGCAAATGAAGCACTAGATACTATTCAAGGTGAGTTATATAAAATCTCAACTGATAGTGCAACTTCTGAACTAAAAGATATGCAATCAATTACTCATTCAACTCTATCTTATATTGAAAAAATGAAAAAACTTGGTAATAAACACTTAATTGGTGAAACAACAGGTTTTGATGCACTTGATAGAAGAACAACAGGTTTTAATGAAGGGGATTTAGTAATCATTGCAGCTCGTCCTGCTATGGGAAAAACGGCACTTGTTTTAAATATGGCATTAAAAAATGTAGAAAGAGGAAAAGGTGTAATATTTTTCTCTCTTGAGATGCCAGCGGAGCAACTAATGCTTAGGATGTTATCTGTTAAAACTTCTATTCCATTACAAAACTTAAGAAAAGGTGATATGGATGATGCTCAATGGTCAAATTTGAGTTCAGCTTTTGATAGCTTAAATACAAAAAAACTTTTTGTTGATGATGGTGGAAGTGTAAATATTAATCAACTTCGAGCAAGAGTGAGAAAACTTGCTCAAAATGAAGATAATAATATAAAACTTGTAATTATCGATTATCTTCAACTTATGCAAGGAATTGGTACAAAAGATAGACATCAAGAAGTTTCTGATATTTCAAGAGGTCTTAAGATGCTAGCAAGGGAACTTAAAATCCCTATTATTGCTCTATCTCAACTAAATCGTGGACTTGAAAGCAGACCTGATAAAAGACCAATGTTAAGTGACTTAAGAGAATCTGGAGCTATTGAACAAGATGCTGATATTATCATGTTTGTTTATAGAGATGATGTTTATAAAGAAAGAGATGAAGCAAGAAAAGAGAAAGAAGCAAAAGATAAAGGTGAAGATTATAAATCAAAATTTATAAATAAACCAATAGAAGAAGCTGAAATAATAATAGGAAAACAAAGAAATGGACCAATAGGTACTGTAAAACTTGATTTCCATAAAAACTTAACTAAGTTTTTGGATAAAGAGAATGAACATGGTGCTGCTCCAATAGAAGTTATTTTTGAAAATGTAGCAGATATAGAAAAAGAAACAAATATAGATATACCAAATATTTTATAATTAATTGTAATAATTATAAGTTTATTTATAGTAAAATAAAAACCTAATTTAGCAAGGGAAAATATGCAAAACCAAAAATATTTACAAGAAGATGAAATAGATTTGAAAGAGTTGTTTAAAACTCTGTGGAAGTATAAAATGTTTATTTTAATATTTACTTCTATGATAACTTTTATTGCTTTGATTTATGTTTTATTAAAAAATCCTATTCCTATTTATCAAGGTAAAATGTATTTAGAAATAGGGCAAATACAAAATAAAAATTTTGCTCCAATTAGTATTGAGAAAGTTAGTGACCTAGCATATATTCTAAACCTTGAATTTAAAGTAAACTCAAATATTCCTAAAAATACTTCTAATCTTATGGAAATTACTTTTGATAATGTAGATAAAAATATTATAAATGAGACTTTAACAAGAGTTAAGGGATTTGTGATTGAAAAACATAAAAAACAGACAAGTTTTTATGAGAGTGTTATTATGACAGAGCAAATTGGTGATATAATAATTTCAAATGAACCTATAAATAAACCTAAAAAAACTCTTATTATAATAGTTGCTTTTGTGACAGCTTTTATATTATCAATATTTTTAGTGTTTTTTATAGAATTTGTAAGAAGTTTAAAAAAGAAAGAAATAAAATAATGACTAAAAATGAGCAAAATATCAAATATAAAATAGCAATAGCAGGAACAGGTTATGTAGGTTTATCAAATGGCTTACTTTTATCTCAACACAATGAAGTAGTAGCACTTGATATAGTTCGACAAAAAGTTGAGATGTTAAATAATAAAAAATCTCCAATAGAAGATAAAGAAATAGAAGAGTATTTAAAAAAGGATAATATAAATTTTAAAGCAACTTTAGATAAAAATGAAGCTTATAATGGGGCTGATTTTATAATTATCGCAACACCAACAGACTATGATGAAAAGACTAACTATTTTAATACAAAATCTGTTGAAGCAGTTATAAAAGATGTACTTGAAATAAATCCAAATGCTACAATGGTAATTAAATCAACAGTACCAGTTGGATATACAAAAGAAGTAAGAGAAAGATTTGAAACTTCTAATATTATTTTTTCTCCAGAATTCTTAAGAGAAGGAAAAGCCCTATATGACAACTTATATCCAAGTAGAATAATCGTAGGTGAACAATCAAAAAGAGCTGAAACTTTTGCAAAATTATTAGAGCAAGGTGCTATAAAAAAAGATATTCCAGTATTATTTACAGATTCAACTGAAGCTGAAGCTATAAAACTATTTTCAAATACTTATCTTGCGATGAGAGTTGCATATTTTAATGAACTTGACTCTTATGCGTCTGCTCATAATCTTGATACAAAACAGATAATTGATGGTGTTGGACTTGATCCAAGAATAGGAACGCATTATAACAATCCTAGTTTTGGATATGGTGGATATTGTTTGCCAAAAGATACAAAACAACTTTTAGCAAATTATAGTGAAGTACCAAGTAATCTAATAGAAGCTATTGTAAAATCAAACTCTACAAGAAAAGATTTTATAGCAGATAGTATTATTAGAAAAAATCCAAAAATAGTTGGTATTTATAGACTTGTGATGAAAACTGGAAGTGATAATTTTAGAAGTTCTGCAATACAAGGAATAATGAAAAGAATAAAAGCAAAAGGTATAGAAGTAGTAGTATATGAGCCTGTATTAAATGAAGATACATTTTTTAATTCAAGAGTAATAAAAGATTTAAGTGAGTTTAAAAAGATATCGGATGTAATAGTAGCAAATAGACTAAGTGATATTTTAAAAGATGTACAAGATAAAGTTTATACTAGAGATATTTTTGGAAATGATTAAATAGGGAATAATAAAGTATATGAAGATATTAATAACAGGAACAGCTGGTTTTATAGGTTATCATTTAGCAAAAAAACTACTTAATCGAGGAGATGAAGTAGTTGGACTTGATAATATAAATGACTACTATGATGTAAATTTGAAATATGCAAGACTAAATGAACTTGGTATTTTAAAAGAAGAAATAATAGAAAATGAACTAATCTCTTCAAAAACTTACCCAAAACATAAATTTGTAAAAATGGATTTATCAGATACAGAAAATATTTATAAACTTTTTGAAACTGAAAAGTTTGATACAGTATGTAATCTAGCAGCACAAGCTGGAGTTAGATACTCTATAGAAAATCCACATGCATATATAGATTCAAATATAAAAGGATTTATGAATATACTTGAAGCTTGTAGACATAATGATGTAAAAAATTTATGTTATGCAAGTTCTAGCTCTGTATACGGATTAAATAAATCTCAACCTTTTAAAACAACAGACAAAACAGATACTCCAATATCTTTATATGCAGCTACAAAAAAATCAAATGAACTTATGGCTCATACTTATAGCCATCTTTTTGGAATATCTACAACTGGTTTAAGATTTTTTACTGTTTATGGACCTTGGGGAAGACCTGATATGGCTCCAATGCTTTTTACGAATGCAATACTAAATGATGAAGAGATAAAAGTTTTTAATCATGGAGATATGAGTAGAGATTTTACATATATTGATGATATCGTTGATGGTATAATAAAAGTTATAGATAATCCAGTAAAAACTAAAAGTAATTTGGCTCCATATAAGATTTATAATATAGGAAATAATTCACCAATACAATTGCTTGATTTTATAAAAACTTTAGAAAAATCTATAGGACTAGAAGCTAAAAAGAATTTTTTACCTATGCAAGATGGTGATGTAGAATCAACCTATGCAGATGTAGAAGATTTGATGAAGGATTTTAATTATAAGCCAAATACAAAATTAGCTGATGGTATTGATGAATTTGTGAAATGGTATAAAAGTTTTTATGGAGAAAATATATGAAAGGGATAATATTAGCAGGAGGAAGTGGAACAAGACTTTATCCTATAACAAAGGGAGTAAGTAAGCAGTTAACTCCTATATATGATAAACCAATGATATATTATCCTCTTTCAGTTCTGATGCTAGCAGGGATAAAAGAAATACTAATTATTACAACACCAGAAGATCAAAGTAATTTTATAAATCTATTAGGAGATGGAAGTGATTTGGGAATAAAATTTTCTTATGTAATTCAACCTAGTCCAGATGGTCTTGCGCAAGCGTTTATTTTAGGTGAAAAGTTTTTGGATGGGGATGATGCTTGTTTAGTTCTTGGAGATAATATTTTTTATGGTCATGGACTAACAAACTTACTAGCACAAAGTGTAAAGAATATAAAAGATGAAAATAAAGCAACAGTTTTTGGATATTATGTAAAAGATCCGCAAAGATATGGAGTTGCCGAATTCAATGACAATGGAGATGTAATTTCTATTGAAGAAAAGCCAAAAGAACCAAAATCAAATTATGCTGTTGTGGGGTTATATTTTTATCCAAATGATGTTGTAAAAAAAGCTAAAAATGTAAAACCAAGTAATCGAGGAGAACTTGAAATCACAACTTTAAATCAAGACTATTTGAGTGAGAATAGATTAAAAGTAGAACTTATGGGAAGAGGTTATGCTTGGCTTGATACAGGGACTCATGAAAGTTTACTTGAAGCTAGTTCTTTTATCCAAACTATTGAGAATAGACAAAGTTTAAAAGTAGCGTGTTTAGAAGAAATAGCTTATGAGATGGGATATATTTCAAAAGAGAAACTTTTAGAACTTGCAGAACCACTAAAAAAGAATCAATATGGTCAATATTTAATAAGTAGAGCAAATCAGCCAAGAAGGATGAAATAATTATGATATTTTTAAAAACTTCTATTCCAGATGTAGTAATTATCGAACCTAAAGTTCATGGTGATGCAAGAGGTTATTTTGTAGAAACTTTTAGAGCTGATAAATTAGAAGAATTTTTAGGATATAAAATAAATTTTTGTCAAGATAATGAATCAAAAAGTTCTAAAGGAGTTCTTCGAGGACTTCATTATCAACTTCCACCTCATGCACAAACAAAACTAGTGCGAGTTATTCAAGGAAGAGTTCTTGATGTTGCAGTTGATATACGAAAAAATTCTCCTACTTTTGGAAAATATGTTGCAGTTCTTTTAAGTGCTGAAAATAAAAAACAATTATTAGTTCCAAGAGGCTTTGCTCATGGATTTGTAGTACTTGAAGATGATACAGTATTTGCTTATAAAGTTGATAATTATTATAGTCCTGAATGTGATAGGGGAATAGCATATGATGATGAGAGTTTAAATATTGATTGGATTTTAAAAAAAGAAGAATTGAATCTATCAGCAAAAGATACAAAACAACCAAAATTAAATGAAACAAATGATTTATTTGAATTTGGAGTAAATTATTATGGCTAATAATCTTTTTAATATTTTAGTAACAGGTTCAAAAGGGCAACTTGGAAGTGAAATAAAAGAGTTGTCTTCAAATTACTCTTATAATTTTTTTTTCACAGATAGATTAAATATTGATATCACAAATAAAGATAATATAAAAGATTTTTGTCAAACTAATAATATAAATGTGATAATCAATTGTGCAGCTTATACAGCTGTTGATAAGGCTGAATCTGATATAGAAAATGCAGACTTAGTAAATAGAAAAGCTGTAAAAAAATTAGCAATTGTTTCAAGTAAATTAAATATAAAACTTATACATATTTCAACTGATTATGTATTTGATGGTAGAAATTTTAAACCATATAAAGAAGAGTTTCAGGTAAATCCACAAGGAGTTTATGGTAAAACAAAACTTGAAGGTGAGCTTGAGCTTATAAATATAAATCCAAAAAATTCTTTAATAATAAGAACTTCTTGGGTTTATTCTTATTATGGGAATAATTTTGTAAAAACAATGCTTCGTTTAGGAAAGGAAAAAGATTCTTTAGGAGTGGTTTTTGACCAAATAGGAACACCTACTTATGCTTTGCATCTAGCAAAAATTATTTTAGATATTATTCCTCAAATAGAAAATGAAAAAGTAGAAATAGTGAATTTTTCAAATGAAGGAGTTGTTTCTTGGTATGATTTTGCAAAAGAGATAATGAAAATGGCAAAAATAGATTGTAAAATAAATCCAATAGAGAGTTTTCAATATCCAACACCAGCAGTTAGACCACACTTTTCTGTGTTAAATAAAGCAAAAATAAAGGCAATGTTTAATATACAAATACCATATTGGAAAGATGGTTTAGATGATTGTTTAAAAAGATTAGATGAAAGAAAATAGTGGGGGAAAATAGATGTTTAATAATGATAATAAAATAATATTAGTAACAGGATGTGCAGGATTTATTGGTTCAAACTTTGTGCCATATTTTTTAGATAAATATCCAAACTATAATTTGGTAAACCTAGACCTTTTAACATATGCTGGAGATTTGGAAAATCTAAAAGAGTGTGAAACAAATCCAAGATATAAATTTATCAAAGGTGATATCTGTAATAGAGAATTAGTTGAATTTATATTTAGTGAATACGATATAAGAGGTGTTATCCACTTTGCAGCTGAAAGTCATGTAGATAACTCTATCAAAAACCCAGGAGTATTCGTCCAAACAAATGTAAATGGAACATATACTTTAGTAGATGTAGCGAAAAACTATTGGATGGAAAAACCTTTTGTTTACAAAGAAGAGTATAAAGATTGTAGATTTCATCACATAAGCACAGATGAAGTCTATGGAACACTTAGCCTTGACCCAAATGATTTGTTTACAGAAACTACACCTTATTCTCCAAACTCTCCATATTCCGCTTCAAAAGCTTCAAGTGATATGATTATAAGAGCTTATCATGAGACTTATGGACTAAATACTGTTATCACAAACTGCTCAAATAATTATGGACCAAAACAACACGATGAGAAACTCATTCCTACAATTATCAGAAATGCCCTCAAAGGAAACCCCATCCCAATTTATGGTGATGGTAAAAATATCAGAGATTGGCTCTATGTACTTGACCACTGTAAAGGGATAGATATCGTGTATCATACAGGTAAAACAGGAGATACTTATAATATCGGTGGGAGAAACGAAAGAACAAACCTTCAAATCGTAGATAGAATATGTACGATATTAGATGAAGTTCATCCAATTAAAAATAATTCAAAATTCAACATTCAAAATTTAACATTATCCTCATACAAAAGTTTAATAACTTTCGTAGAAGATAGAGCAGGACATGATAGAAGATATGCTATAGATGCTACAAAACTTGAAAATGAGCTTGGATGGAAAGCAGACAACGATTTTGATAGTGGAATAGTTAAGACAATTGAGTGGTATATGAGAAAATACAGAATCTATAAAGAGGTTGAATGA
Protein sequences of DBSCAN-SWA_2 >NC_021878|639288:648410|645867_646443_+|WP_020847556.1|DBSCAN-SWA MIFLKTSIPDVVIIEPKVHGDARGYFVETFRADKLEEFLGYKINFCQDNESKSSKGVLRGLHYQLPPHAQTKLVRVIQGRVLDVAVDIRKNSPTFGKYVAVLLSAENKKQLLVPRGFAHGFVVLEDDTVFAYKVDNYYSPECDRGIAYDDESLNIDWILKKEELNLSAKDTKQPKLNETNDLFEFGVNYYG >NC_021878|639288:648410|642739_643933_+|WP_020847553.1|DBSCAN-SWA MTKNEQNIKYKIAIAGTGYVGLSNGLLLSQHNEVVALDIVRQKVEMLNNKKSPIEDKEIEEYLKKDNINFKATLDKNEAYNGADFIIIATPTDYDEKTNYFNTKSVEAVIKDVLEINPNATMVIKSTVPVGYTKEVRERFETSNIIFSPEFLREGKALYDNLYPSRIIVGEQSKRAETFAKLLEQGAIKKDIPVLFTDSTEAEAIKLFSNTYLAMRVAYFNELDSYASAHNLDTKQIIDGVGLDPRIGTHYNNPSFGYGGYCLPKDTKQLLANYSEVPSNLIEAIVKSNSTRKDFIADSIIRKNPKIVGIYRLVMKTGSDNFRSSAIQGIMKRIKAKGIEVVVYEPVLNEDTFFNSRVIKDLSEFKKISDVIVANRLSDILKDVQDKVYTRDIFGND >NC_021878|639288:648410|643943_644978_+|WP_192813839.1|DBSCAN-SWA MKYMKILITGTAGFIGYHLAKKLLNRGDEVVGLDNINDYYDVNLKYARLNELGILKEEIIENELISSKTYPKHKFVKMDLSDTENIYKLFETEKFDTVCNLAAQAGVRYSIENPHAYIDSNIKGFMNILEACRHNDVKNLCYASSSSVYGLNKSQPFKTTDKTDTPISLYAATKKSNELMAHTYSHLFGISTTGLRFFTVYGPWGRPDMAPMLFTNAILNDEEIKVFNHGDMSRDFTYIDDIVDGIIKVIDNPVKTKSNLAPYKIYNIGNNSPIQLLDFIKTLEKSIGLEAKKNFLPMQDGDVESTYADVEDLMKDFNYKPNTKLADGIDEFVKWYKSFYGENI >NC_021878|639288:648410|646435_647314_+|WP_020847557.1|DBSCAN-SWA MANNLFNILVTGSKGQLGSEIKELSSNYSYNFFFTDRLNIDITNKDNIKDFCQTNNINVIINCAAYTAVDKAESDIENADLVNRKAVKKLAIVSSKLNIKLIHISTDYVFDGRNFKPYKEEFQVNPQGVYGKTKLEGELELININPKNSLIIRTSWVYSYYGNNFVKTMLRLGKEKDSLGVVFDQIGTPTYALHLAKIILDIIPQIENEKVEIVNFSNEGVVSWYDFAKEIMKMAKIDCKINPIESFQYPTPAVRPHFSVLNKAKIKAMFNIQIPYWKDGLDDCLKRLDERK >NC_021878|639288:648410|647327_648410_+|WP_020847558.1|DBSCAN-SWA MFNNDNKIILVTGCAGFIGSNFVPYFLDKYPNYNLVNLDLLTYAGDLENLKECETNPRYKFIKGDICNRELVEFIFSEYDIRGVIHFAAESHVDNSIKNPGVFVQTNVNGTYTLVDVAKNYWMEKPFVYKEEYKDCRFHHISTDEVYGTLSLDPNDLFTETTPYSPNSPYSASKASSDMIIRAYHETYGLNTVITNCSNNYGPKQHDEKLIPTIIRNALKGNPIPIYGDGKNIRDWLYVLDHCKGIDIVYHTGKTGDTYNIGGRNERTNLQIVDRICTILDEVHPIKNNSKFNIQNLTLSSYKSLITFVEDRAGHDRRYAIDATKLENELGWKADNDFDSGIVKTIEWYMRKYRIYKEVE >NC_021878|639288:648410|639288_640590_+|WP_020847550.1|DBSCAN-SWA MDSILDISNFQKFLKDEEEIIIDEFLRKYIINFRKIEDEESQKIENFFTLIIKSICSGDIKSATSIYKDLIDYNIELDIPYIMLTYELINLKKIILQKLLYKDVRDELMQLYKMHMFFEDMIAKTYLNKYIVDLNKKNNFSLSNLSGISQSNIIYYYKMHLEWLEDLAKAIVLADINIFPEINHNLCTFGKWLDKEGLEIIKNSSKYKNISKLHENLHFFAKQIKNCLIETQGNNHIILIYLEKCEMISLSLGTELALIDNTLINSEASKDPLTGALNRQRLSQLYQNQLEISFATFEPFVIAMCDFDHFKNINDTFGHLAGDKMLKSFVHIAKKHLRTSDIIIRYGGEEFMIILPAINTKKAKDILNKIREDIANFVLNLDGNKISATISIGMIEIYPENGNNSYFKDFENTISLVDKKLYEAKNSGRNTIC >NC_021878|639288:648410|640652_642095_+|WP_020847551.1|DBSCAN-SWA MDSVYSINIERAVLSSIFFNPEELEDILGILKPKDFYLPAHKKIFEVMVKLHDEGMPIDEDFIRNKVNSKDVDDSILLEILSANPITNTLAYVREIKDSSVKRELASLATTIKKVAIEDGVSANEALDTIQGELYKISTDSATSELKDMQSITHSTLSYIEKMKKLGNKHLIGETTGFDALDRRTTGFNEGDLVIIAARPAMGKTALVLNMALKNVERGKGVIFFSLEMPAEQLMLRMLSVKTSIPLQNLRKGDMDDAQWSNLSSAFDSLNTKKLFVDDGGSVNINQLRARVRKLAQNEDNNIKLVIIDYLQLMQGIGTKDRHQEVSDISRGLKMLARELKIPIIALSQLNRGLESRPDKRPMLSDLRESGAIEQDADIIMFVYRDDVYKERDEARKEKEAKDKGEDYKSKFINKPIEEAEIIIGKQRNGPIGTVKLDFHKNLTKFLDKENEHGAAPIEVIFENVADIEKETNIDIPNIL >NC_021878|639288:648410|642158_642740_+|WP_020847552.1|DBSCAN-SWA MQNQKYLQEDEIDLKELFKTLWKYKMFILIFTSMITFIALIYVLLKNPIPIYQGKMYLEIGQIQNKNFAPISIEKVSDLAYILNLEFKVNSNIPKNTSNLMEITFDNVDKNIINETLTRVKGFVIEKHKKQTSFYESVIMTEQIGDIIISNEPINKPKKTLIIIVAFVTAFILSIFLVFFIEFVRSLKKKEIK >NC_021878|639288:648410|644974_645865_+|WP_020847555.1|DBSCAN-SWA MKGIILAGGSGTRLYPITKGVSKQLTPIYDKPMIYYPLSVLMLAGIKEILIITTPEDQSNFINLLGDGSDLGIKFSYVIQPSPDGLAQAFILGEKFLDGDDACLVLGDNIFYGHGLTNLLAQSVKNIKDENKATVFGYYVKDPQRYGVAEFNDNGDVISIEEKPKEPKSNYAVVGLYFYPNDVVKKAKNVKPSNRGELEITTLNQDYLSENRLKVELMGRGYAWLDTGTHESLLEASSFIQTIENRQSLKVACLEEIAYEMGYISKEKLLELAEPLKKNQYGQYLISRANQPRRMK |
9 | Enterobacteria_phage(25.0%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1936065 : 1942990
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NC_021878|1936065:1942990|DBSCAN-SWA ATCATTTGAACTGTCCTAATAATCTTGTGTCACTTTCAAACAGTGATCTTAAATCTCCGATATTATGAATAAGCATTGCAAATCTTTCAATACCTAATCCAAAAGCATATCCAGATTTATTTTCATAACCAACTGCTTTAAATACATTTTCATCTACAACACCACAGCCTAAAACTTCAAGCCAACCAGTTTGTGAACAAACTCTACATCCTTCACCTTTACAGAAAACACAAGAGATATCAACTTCTGCTGATGGTTCTGTAAATGGAAAAAACGATGGTCTAAATCTAACTTCAACTTCACCAAACATATGTTGTAAAAACTCAACTAAAACATGTTTTAAATTAGCAAAAGATACTTTATCTGCTTCATCAACAACTAAAGCTTCAATTTGGTGAAACATTGGTGTGTGCGTAATATCAAAATCTCTTCTAAAAACTGTTCCTGGAGCAATCATTCTAATAGGAGATTTTTGACTAAGCATAGTTCTAATTTGAACAGGAGAAGTATGAGTTCTTAAAAGTGTAAAATCTTTATTATAAAAAGTATCTGCCATCTCACGTGCTGGGTGATATTTTGGTAAATTTAATGCTTCAAAATTATGAAAATCATCTTCAACAAGAGGTCCTTCTTCCACTGCAAAATTTAAATTTTGGAAATAAGTAATAATTTTATTCATTGTTTCAACAACTGGATGAGTCGCACCACAAGATAGTTCATTGTTAAATTTTGTTACATCTATTTTTTCCGCTTCTAATTTTTCATTTAAAGCATCTTTTTCTAAAACTAATTTTTTTGTATCTAAAGCTTGTGTTATTAAAGTTTTTTGTATATTTAAATTTTCTGCAAAAGCTTTTTTATCTTCATTTGGAACACTTTTCATTTTAGCAAATTCTAAAGTTAATACACCTTTTTTCCCCAAAGTGTCAATTCTTAAATTTTCTAACTCTTCAAGTGATTTCGCATTGTTAATTTTTTCAATCCACTGAGTCACTTTTTCTCCTGACTTTTATAAAAATTTTATCGAATACTATAAGGTTGCGATTATACATAAGATTTTATTAGAGTTTGGTTATAATCGCTTTTAATCCAATTTTTAAGGAAAAAACATGTGTATATTTTGCAAAATTGTAAAAGGTGAAATTCCAAATCAAACTGTATTAGAAGATGAAAAATTTTTAGCTTTTAATGATATAAATCCAACAAGAAAAATTCATGTACTAATCATTCCAAAAGAACACTATGATTCATTTCAAGTAACACCTACAAATATCATGTCTTCAATGAGTGAATTTATTCAAAAAGTAGCTACAAAACTTAATATTGATGAAAGTGGTTATAGATTAATTACAAATATAGGAAATCATGGCGGACAAGAAGTACATCATTTACATTTTCATATGATTGGTGGAGAATCAGTTGGAAGATTGGTAAGAGACAAAGAAGATATTTAATCTTTTTTGTCTATTTTGTAAATGAACCTAAATTCATAAGTTTTTGATATTTTTTATCTAATCGTTCTTGAGGAGTTAGTTTTTTTAACTCAGCTAAAGATTTTAAAAAATACTCTTTTAAAGCAAAAATTGCTTGTTCTTTTTGTCTATGAGCACCAATTAAAGGCTCATTTATAACATCATCTATTAAATTTAATTCTTTTAAATTTTCAGCTGTTATTTTTAAAGCATTTGCTGCTGTTTCAACTTTTGTTGGGTCATTCCATAAAATTGCACTACAGCCTTCAGGAGAAATAACTGCATAAACTGAATATCTCATCATTGCTAATTTATCAGCAACTGAAATAGCTAAAGCTCCACCTGAACCACCTTCTCCAATAACAACAGATATAGTTGGTGTTGTTAAATCTGCAAATTCAAATAGATTTTTTGCTATAGCTTCAGATTGATTTCTCTCTTCAGCTCCAATACCAGGATATGCACCCGGAGTGTCAACTAACATAAGAATTGGAATTTGAAACTTATCAGCCATCTTAGCTGCTCTTAAAGCTTTTCTATATCCTTCAGGACTTGGCATACCAAAATTTCTTTGAAGTTTCTCTTTTGTTCCTCTTCCTTTTTGTTCACCAATTACTAATACTTTTTGATTATCAATAAAACCAAAATAACATACTATTGCATGGTCATCAACATAATGTCTATCTCCATGAACTTCATAGGCATTTTTTAAAAGTCCTGAGATATAATCAAGAGCATAAGGTCTATCAGGATGTCTTGCTAATTGTAATTTTTGATAGTCATTTAAATTTTTAAAAGTTTTTTCAACTTCTTTTTCTAATTTTTTTTCTAAGATATCTACAGCAGGTTCATCAGCTTTTGTTTTTGCTACAATAATATCTTCTTCTATTTTTTTGATTTTTTCTTCAAATTCTAAGTAAGTCGCCAAAGTTTTTCCTTAAAAAAGAGCTAAACAACTTAGCTCTTTAATGGTTAGGTTTATAAATTATTTTGTATATTTTTTAAAAATTACGGAACCATTTGTTCCACCAAAACCAAAGTTATTACTCATAACAGTAGTTAACTCTAATTTTCTTGCAACATTTGGAACTACGTCTAAATCGCATTCAGGATCTTGATTTTCAACATTTATCGTAGGAGGAATAATTCCTTCATCTAATGCTTTAATTGCAAAAACTGCTTCAATAGCACCAGCAGCCCCTAAACAATGACCAATTTGACCTTTTGTTGAAGAAACTGGAGGACATTTTTCTTTTCCACCAAATAATTCTTTTATTGCTGATGTTTCATTTTTATCACCAACTGGTGTTGAAGTACCATGCACATTGATATAATCAATTTTTGGATATTCTCCAGTTATATTTTTAGCCATTTCAAAAGCAGCTTTCATTGCTCTTAATGGTCCATCAATTACAGGAGAAGTTATATGATTTGCATCACCTGACTCTCCAAAACCTATAATTTCACAATAAATTTTTGCATTTCTAGCTAATGCAGATTCTAAAGTTTCTACAACTAATGCTCCTGCACCTTCACCCATAACAAAACCATCTCTATCGATATCAAATGGTCTTGATGATTTTTTAGGATTATCATTTCTTGTTGATAATGCTTTCATTGCAGCAAATCCACCAACACCTGCTCCACAAACAGCAGATTCAGCTCCAACAACTAAAATTCTATCCGCACCACCTAACATAATTGTTTTAACTGCATCATTTAAAGCATGAGTTGAAGCAGCACAAGCTGTAACATGTCCTAAAGATGGTCCTTTTAAATTATGCTCGATTGAGATAAAACCACTTAGCATATTTGCTAAAGAAGATGGAATAAAAAATGGCGAAATTTTTCTAGGTCCTTTATTTTCACAAGTTACAGAATTTTTTTCTATTGTAGATAATCCACCAATTCCTGAACCTGAGATAATTCCAAATCTATCTGCAATAGAAGAATCAACTTTTTTATCTTCTTGTGTTACGTAACCAGAATCAATCATCGCTTCTAATGCAGCTTTAATTCCTAATTGAATAAACCTATCAGCTTTTTTTACTTCTTTTTTATCCATTACAGTTTCAGGGTCAAAATTTTTAACTTCACCTGCTATTTGTACAGGAAATTCACTCGCATCAAATAATGTTATTGTATCAATACCGCAAACACCATTTGTAACTGCTTCAAAAGATTCTTTTACATTGTGTCCTGTTGAATTTATAGTACCCAAACCTGTAATAACAATTCTTTTCATCTAAATATGCTCCAATATAAATTAATTATTCGAATTATTCAATTTTTATAATAAAAAAACTCAATATTTTAAATATGTAAATAGAAGATTTAATCTTCTATTTAAAAGCGTTAAAATTACGCGTTATTTTCGATGTATTTTATAGCATCTGCAACAGTTAAGATTTTTTCAGCATCTTCATCAGGGATTTCGATGTCGAATTTTTCTTCTAAAGCCATTACTAGTTCAACTACATCTAGTGAATCAGCACCTAAATCTTCAATGAATTTTGAATCTTCTTTTACTTCAGCTGGATCACAATCTAATTGCTCTACAACTACCGCTTTTACATCATCTAATAATGCCATATTTATTTCCTTTTATAAAATTATCGCTGTATTATAGCAAAAAAGTTTTTAAAAACTCTTTTAAACTATAAAATTATATTTTTTTGATTATAGTAATTAAACGTATAATCCACCATTTACTTTTAAAATTTCCCCTGTAATATAAGAAGAATGATCACTCAATAAAAATGCTACTGCATCAGCAATTTCGCTTGGTTGTCCAAATCTTGAAAGTGGAATATTTTTTTCATATTCAGCTTTTACTTCCTCTTTTAATTCATCTGTCATATCAGTTTGAATAAATCCAGGAGTTACTGCATTGTATCTAATACCTCGAGAAGCTGCTTCTTTTGCAAAAGATTTAGTCATTGCATTTAATCCACCTTTTGATGCTGAATAATTTGTTTGACCAGGATTTCCCATTTCACCAACAATTGAAGAAATATTTACAACAGAACCAAATCTTTTTTTACCCATAACTTTTAAAGCTTCTTTACATCCAATAAAAGCTGAAGTTAAATTTGCATTTATAACATCAGTAAAATCTTGTACACTCATTCTTAAAGCTAATTTATCTTTTGTAATTCCTGCATTATTTACTAAATATGCTAATTCTCCATCAGCATCACTAATCGTTTTAATAGCATTTACAAACTCTTCTTCATTTGTAACATCAGCTTTAATTATTGCAGCTTTCCCACCAGCTTTTTCAATCTCTTCTTTTATTGCTTCAGCAGCTTGTGCACCACTTCTATAATTTATCCAAACTTTTAATCCGAAACTTGCAAGTGTCTTTGCAATTTCAGCTCCAATTCCTCTGCTTGCACCTGTAACTAATACATTTGAACCAGTAAATTTCATCTTAATCCTTTTATTTTTTACATTTGATACTTATTATATCAATATTTTTATTAGAGTTTAAACTCCTCTTTTATTATTCCAAACTCTGATGTGTAACCTATCACAATATTTAAAACCATTTTCTATTGCCATATTAATAACATCTTCACAATTTTTATTTATTTCATCAGCTGTATCACCTAATGGCATTAAATAAACTTCACATTTTGGAATATCTTTTAATATTTCAATAATTTCAGCTTTTGCTTTATTCAAAAAATCTTTTCCAATTACAAATTTCATATAAGAATCTTTTGTATTTTCTAAAATTTTTACTAAAGTATTTTTATTTATTCTTTTATTTAAAGGTTCCAAAGAATTACTTAATTTTACACTCATTGAAAATAAAATTTCTTTTTGGTAATCAAATTCAAAATTTATATTTAAAGAAGCATTTGTCTCAATAGTAACTTTATGCCCATTTTCTATATAGTGTTTCAATAATTTCTGAAACTCTTTTTTATTCCAATATAAAAGAGGTTCTCCTCCAGTTATTACAATATCAATTTTGTAATTATAATTATATGTTGAAATTAAATTATCAACTTCAGCCACAATATCATTATAACTTTGATATTTCGTCCAAGTATCTTTAAACTCTTTATCTACAGCATAATAAGAATCGCAAGCACACTTTTTTATACCACTTGGAGTTTCATAAATAACCCCAAAACCAGTACAACTAAAATTGCATTTTCCAAATCTTATAAAAATAGAAGGTGTTCCAACAAGTTTTCCTTCTCCTTGAATTGTTGGTCCAAATATCTCATTTATTTCAAGCATAAAATGTACTTTTACTTTTTGGTGTTTCTAAAAATTCAATTTTTGATACTTTAATATTTAATCCATTCATTTTTTCTTGTACGATTTTTAAAAACCATGCTGATAAATTTTCACTTGTAGGTACAAAATCAACGACTACATAACTTTCATACAATTCTAATTCTTCATTTTTGAAATTTGTTAAATTTATTGAAAAATAACCTTCTTCAAATTTTATTAAATCTTCTTTTTTTATATTTGGAACCAAAGTAGAAAACAATGGATCATTAATATCTAAAATAAATTTATGGTCAAGTACATCATCTAAAAAAGCTTTAAACCAATTTAAATGTTTAAAATCTGTAACCATTGAATTATTTAATTCATTTGATTCTAAATATACAATGACTTTTCCTTGATGACCATGAAGATGTCTACATTTCAAACAAGCATCTAAAGAAAAATCAATATTTAAAGTTTGAGACCAAACTCTATGTCCATAACAAAAGTCAAACTCTTTTGAAATTTCCCATTTCATTGAAATTCCTTATATTTTATTGGATCTTTTTTTCCAGCTTTTTCAAATCCATTTAATCTTAATCTACAAGAATCACAAACTCCACAAGCTTCTTCTTCCTCTTTATAACAAGACCAAGTAAGTTCAAGAGGAACATTTAGTTTTATAGCCTCTTGCACAATTTGAGCTTTTGATAGATGAACTAAAGGTGTAATTATCTCTATTTTTGTATCTTCTTTAGTTCCTTGATTTATTGCTTTTTTCATATCTTGAATAAATTCTTCTGTACAATCTGGATAACCAGAACTATCCTCTTGTACAACACCAATATACATAGCAGTTGCTCCTTCTTTTTCAGCAATTGCTGCAGTAATTGCTAAAAAAATACCATTTCTAAATGGGACATAAGTTATAGGAACACCAGCTTCTAAACCACCAGTTGGAACATCAATACTCATATCTGTTAAGGCATTTGCTCCAATTTGAGTAAAAAACGGAATATCAATTTCATATTTATTTTTTATATCTAGTTCATTACAAATATCTCTAAATGCTTTTAATTCTCTATTTTGAGTTCTTTGTCCATAATTAAAATGTACAGCAATTATTTCAAAACCATCTTTTTTTGCAATATATGAACTTAAAGTAGAATCCATTCCTCCACTTAAAATACATATTGCTTTTTTTGTTGATACTTTATTCAT
Protein sequences of DBSCAN-SWA_3 >NC_021878|1936065:1942990|1941782_1942307_-|WP_020848502.1|DBSCAN-SWA MKWEISKEFDFCYGHRVWSQTLNIDFSLDACLKCRHLHGHQGKVIVYLESNELNNSMVTDFKHLNWFKAFLDDVLDHKFILDINDPLFSTLVPNIKKEDLIKFEEGYFSINLTNFKNEELELYESYVVVDFVPTSENLSAWFLKIVQEKMNGLNIKVSKIEFLETPKSKSTFYA >NC_021878|1936065:1942990|1942303_1942990_-|WP_020848503.1|DBSCAN-SWA MNKVSTKKAICILSGGMDSTLSSYIAKKDGFEIIAVHFNYGQRTQNRELKAFRDICNELDIKNKYEIDIPFFTQIGANALTDMSIDVPTGGLEAGVPITYVPFRNGIFLAITAAIAEKEGATAMYIGVVQEDSSGYPDCTEEFIQDMKKAINQGTKEDTKIEIITPLVHLSKAQIVQEAIKLNVPLELTWSCYKEEEEACGVCDSCRLRLNGFEKAGKKDPIKYKEFQ >NC_021878|1936065:1942990|1936065_1937058_-|WP_012147935.1|tRNA|DBSCAN-SWA MTQWIEKINNAKSLEELENLRIDTLGKKGVLTLEFAKMKSVPNEDKKAFAENLNIQKTLITQALDTKKLVLEKDALNEKLEAEKIDVTKFNNELSCGATHPVVETMNKIITYFQNLNFAVEEGPLVEDDFHNFEALNLPKYHPAREMADTFYNKDFTLLRTHTSPVQIRTMLSQKSPIRMIAPGTVFRRDFDITHTPMFHQIEALVVDEADKVSFANLKHVLVEFLQHMFGEVEVRFRPSFFPFTEPSAEVDISCVFCKGEGCRVCSQTGWLEVLGCGVVDENVFKAVGYENKSGYAFGLGIERFAMLIHNIGDLRSLFESDTRLLGQFK >NC_021878|1936065:1942990|1939897_1940128_-|WP_004510944.1|DBSCAN-SWA MALLDDVKAVVVEQLDCDPAEVKEDSKFIEDLGADSLDVVELVMALEEKFDIEIPDEDAEKILTVADAIKYIENNA >NC_021878|1936065:1942990|1941025_1941790_-|WP_020848501.1|DBSCAN-SWA MLEINEIFGPTIQGEGKLVGTPSIFIRFGKCNFSCTGFGVIYETPSGIKKCACDSYYAVDKEFKDTWTKYQSYNDIVAEVDNLISTYNYNYKIDIVITGGEPLLYWNKKEFQKLLKHYIENGHKVTIETNASLNINFEFDYQKEILFSMSVKLSNSLEPLNKRINKNTLVKILENTKDSYMKFVIGKDFLNKAKAEIIEILKDIPKCEVYLMPLGDTADEINKNCEDVINMAIENGFKYCDRLHIRVWNNKRGV >NC_021878|1936065:1942990|1938521_1939781_-|WP_004510943.1|DBSCAN-SWA MKRIVITGLGTINSTGHNVKESFEAVTNGVCGIDTITLFDASEFPVQIAGEVKNFDPETVMDKKEVKKADRFIQLGIKAALEAMIDSGYVTQEDKKVDSSIADRFGIISGSGIGGLSTIEKNSVTCENKGPRKISPFFIPSSLANMLSGFISIEHNLKGPSLGHVTACAASTHALNDAVKTIMLGGADRILVVGAESAVCGAGVGGFAAMKALSTRNDNPKKSSRPFDIDRDGFVMGEGAGALVVETLESALARNAKIYCEIIGFGESGDANHITSPVIDGPLRAMKAAFEMAKNITGEYPKIDYINVHGTSTPVGDKNETSAIKELFGGKEKCPPVSSTKGQIGHCLGAAGAIEAVFAIKALDEGIIPPTINVENQDPECDLDVVPNVARKLELTTVMSNNFGFGGTNGSVIFKKYTK >NC_021878|1936065:1942990|1940224_1940968_-|WP_020848500.1|DBSCAN-SWA MKFTGSNVLVTGASRGIGAEIAKTLASFGLKVWINYRSGAQAAEAIKEEIEKAGGKAAIIKADVTNEEEFVNAIKTISDADGELAYLVNNAGITKDKLALRMSVQDFTDVINANLTSAFIGCKEALKVMGKKRFGSVVNISSIVGEMGNPGQTNYSASKGGLNAMTKSFAKEAASRGIRYNAVTPGFIQTDMTDELKEEVKAEYEKNIPLSRFGQPSEIADAVAFLLSDHSSYITGEILKVNGGLYV >NC_021878|1936065:1942990|1937528_1938464_-|WP_020848499.1|DBSCAN-SWA MATYLEFEEKIKKIEEDIIVAKTKADEPAVDILEKKLEKEVEKTFKNLNDYQKLQLARHPDRPYALDYISGLLKNAYEVHGDRHYVDDHAIVCYFGFIDNQKVLVIGEQKGRGTKEKLQRNFGMPSPEGYRKALRAAKMADKFQIPILMLVDTPGAYPGIGAEERNQSEAIAKNLFEFADLTTPTISVVIGEGGSGGALAISVADKLAMMRYSVYAVISPEGCSAILWNDPTKVETAANALKITAENLKELNLIDDVINEPLIGAHRQKEQAIFALKEYFLKSLAELKKLTPQERLDKKYQKLMNLGSFTK >NC_021878|1936065:1942990|1937173_1937518_+|WP_020848498.1|DBSCAN-SWA MCIFCKIVKGEIPNQTVLEDEKFLAFNDINPTRKIHVLIIPKEHYDSFQVTPTNIMSSMSEFIQKVATKLNIDESGYRLITNIGNHGGQEVHHLHFHMIGGESVGRLVRDKEDI |
9 | Campylobacter_virus(33.33%) | tRNA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|