Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NZ_CP007754 | Prochlorococcus sp. MIT 0801, complete genome | 1 crisprs | csa3,cas3 | 0 | 0 | 4 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP007754_1 | 71995-72077 | Orphan |
NA
Consensus repeat of NZ_CP007754_1
|
1 spacers
spacers of NZ_CP007754_1
>1.1|72018|37|NZ_CP007754|CRISPRCasFinder GGTGATGGGGTTATGACTAGGTTTCGGGCGGTTTTAA |
CRISPR arrays and Neighbor proteins around NZ_CP007754_1
The CRISPR arrays of NZ_CP007754_1 >merge|NZ_CP007754|1|71995-72077|CRISPRCasFinder CATAAATAAAACACTAATAAAACGGTGATGGGGTTATGACTAGGTTTCGGGCGGTTTTAACAGAAATAAAACACTAATAAAAC >NZ_CP007754|1|1|71995-72077|CRISPRCasFinder CATAAATAAAACACTAATAAAAC GGTGATGGGGTTATGACTAGGTTTCGGGCGGTTTTAA CAGAAATAAAACACTAATAAAAC
>NZ_CP007754.1|WP_156095698.1|71488_71689_-|hypothetical-protein MSSKIKTSKIVLISQLEDKKEELYEAWSIITNLIDLMESKLPEKDIEEIRTQHRKWKNGECWINEY >NZ_CP007754.1|WP_038650515.1|70600_71419_-|hypothetical-protein MIDLKRHPKKGFAKATGKRVKKKSIYSPRQSSDFQMSRSKFSDFLTCLRCFYLDRVSGLETPKTPGWTLNSTVDNLLKKEFDESRKNKKPHRLFKENGLGHLVPFDHPEMDNWRDALHHGLRLRYKNTNIILSGGIDDIWQDTKTKKLIVVDYKSQAKNGVVTKQDYLDDAFHDGYKIQMDFYAYLLSGMGFDVDPTSYFLVCNAKTDENGFHATMHFDEYLIPYNWNKEWIEDKIEQMLVLINQHEIPESHPSCRNCAYADQYSKILKVTR >NZ_CP007754.1|WP_052041135.1|69468_70587_-|zinc-ribbon-domain-containing-protein MLQEKVIVGVNDLLTLHPEVAAEADGWDASTVVSGSSKRLSWKCIKGHKWEASVYKRTRVGSVCPVCSNQHKICRGFNDLLTKFPEIAKEADGWDPSYVTAGSSKRLSWKCIKGHKWINTPAQRTRAKKSSCPFCANRKVWIRFNDLLTKFPKIAKEADGWDPSTVLAGALKKMPWQCAKGHKWEASVYKRTKNGNSCPFCAGKKLCVGFNDLQSKSPEIAKEADGWDPSTVLFGSKKKMPWKCLKGHTWEAAVDKRTREGTGCRTCAEYGFDPDKPTWFYLMKREGEQQFGITNHIKERIRYHSDRGWSELQTKGPHDGNELEAIEKKLKKWLRTEVGLVKGKTENWYTSKIEVHSLAELKEKSGIETSFF >NZ_CP007754.1|WP_052041134.1|68085_69348_+|bifunctional-glutamate-N-acetyltransferase/amino-acid-acetyltransferase-ArgJ MKNALLNLSLLTSSVWSPISGGITAPDGFLAAGISAGLKPSGRKDLALLYAPDGACCSGTFTQSVTRAYCVDLCIDRIKASEGKIRAVIINSGHANACTGNRGKIDSELITHELAKRLGLSNEEVLICSTGVIGEAIPVEKVHSHLDQLVNSLDKEAYLDAANAILTTDLQVKQIAYQAVLGGRRISIGGMAKGSGMIHPSMATMLSYLTCDAGVDHVLWSDMIKRVAESSFNSITVDGDTSTNDTFLAFSSGAELDPRYLSILEEGLYLTAQHLARAIARDGEGANCLIEIKVEGASSDLDARVIARTIASSSLVKTAVNGSDPNWGRIIAALGRAGTSFNFNDVKLWIGPYEIFSNGTPLDFDKQIVSKFMKARLTGKYLIDDLIRIRLRIGKGIGSATAWGCDLSEQYVHINADYTT >NZ_CP007754.1|WP_038650514.1|67425_68070_-|dephospho-CoA-kinase MIDQKQTNKLCLRWKGRQRRIGITGGIASGKTIIGDFLFQAKQWPILDADLYAHEALSAESQIAKKVFLRYGSKIIKNSSQNDQIINRKALAKIVFQNEIEKKWLEGVIHPFVNKRIEEELEKLKSNSIVILIIPLLFEKNYTGLCSEICYIECPRNMQLKRLQSRDNLSLKEANQRIDAQWENSLKKQFADYVINNSNDDETWKVQLKKLYNF >NZ_CP007754.1|WP_038650511.1|65953_67429_+|Asp-tRNA(Asn)/Glu-tRNA(Gln)-amidotransferase-subunit-GatB MTESNVSWEVVIGLETHVQLGTNSKIFTSASTNFGDDPNTHIDPVVCGLPGTLPVLNKKVLEYAVKAAMALNLNIASHSKFDRKQYFYPDLPKNYQISQFDEPIAEDGWIEVEVAEKGKETYVKKIGIERLHMEEDAGKLVHAGSDQLSGSTHSLVDYNRAGVALAEIVSKPDLRTGREAAEYAAEIRRIMRYLGVSDGNMQEGSLRCDVNISVRPTVNDPFGTKVEIKNMNSFSAIQKACEYEIKRQIKAYESGEEVKQETRLWDEGKQLTKSMRSKEGSSDYRYFPDPDLGPIEVSNDLKEKWRSELPELPAAKRNRYSAELGLSIYDARVLTDESSMAKYFEKVVNEGGAAKSSANWITGDIAAYIKSNKLSFDQLTFKPNELAEMLKMIDSGEISGKIAKDILPELLNNGGSPKQLVQERGLGMIGDPKVIEEIIDQLIVRHPNEVESFRAGKKKLLGFFVGQLMKETKGKADPKLANQILNKKLQG >NZ_CP007754.1|WP_038650508.1|64750_65854_-|glycine-oxidase-ThiO MGGLNEKPLLILGGGLMGLAIAHELAQRGKHVEVLSRSRNEAAGFVAAGMLAPHAEGLQGNLLNLGQTSLRRHPAWIKSIESNSKMSCGLKTCGIVVPFENQKECESYPTYKFGEKLKKNELLREVPGLSEKWKAGLLFRQDGQIDNRRLLMRALEKACVELGVHFQEGVEVIEILKESGAFHGVKIKDINGNIKHLKSEKGVLCCGAWSKQIFKTLPIFPVKGQMLSIQGPKQILKRIVFGPGIYLVPRDDGLIIVGATSEREAGFQKGLTPKGQSDLKKGIQSLIPELNQLPHMERWWGFRPCTPDEEPLMGMSSINGLWLATGHHRNGVLLAAITSELIGKSICSIPLNNEESTFMSQFSWDRF >NZ_CP007754.1|WP_038650506.1|64256_64712_+|nucleoside-diphosphate-kinase MTLERTFVAIKPDGVQRGLIAEILGRFETKGFKLVGLKQLKPSKELAEKHYGVHKDRPFFSGLVDFITSGPVIAMVWEGEGVIASARKLIGATKPLEAEPGTIRGDLAVNIGRNVIHGSDGSETAVFEINLWFQENELVDWTPSDQVWRVE >NZ_CP007754.1|WP_038650503.1|62170_64114_-|biosynthetic-arginine-decarboxylase MAVKNTNQSLSWTIQNSSELYGIDRWGKGYFTINEKGNISICPNGSKNKSHDLMELLDELESRKLKFPLLIRFDDILEDCLKNLHKAFEKAINDYQYQGKYQGVFPIKCNQQRHVVEELITCGSKWNFGLEAGSKPELLIALSILEDPQALLICNGYKDQRYIETAILARQLGRQPIVVIEQASDVDLIIKSSNLLGASPLIGMRAKLSSQSSGRWSSSIGDKSKFGLSIPEILKTIKRLKEANLLNELKLLHFHLGSQINDIGVLKDALQEAGQIYAELINLGAPMGYLDVGGGLGIDYDGSQTASIASTNYSLQNYANDVVATIKECCESKKIPLPTLITESGRAIASHFSILIFNILGKNSLPSDIPKEDEKECLSVRNLRETLVHINSLELKQEEDLAKLQEAWNDSLKFKADALAAFRLGYIDLVERAKAEQLTWACAKTIVNQLPKNILLPKELKKLSESLAVTYYANLSVFRSAPDTWAIDQVFPIMPIHRLSKEPKKLGHFADLTCDSDGKLDQFIDNGKIKNLLPLHEFNQDEKYLIGLFLGGAYQEVMGNLHNLFGSTNAVHIRFTEKGNYKVEHVIRGNTKSNVLEYLEHDPEILLERLRKSSELAIQGGHLKIHDAQKLIEHVEASLRQSTYLQS >NZ_CP007754.1|WP_038650501.1|59508_62169_+|alanine--tRNA-ligase MEKSSSSLINPPSLSGDEIREAFINFFVQHNHKKLASSSLIPDDPTVLLTIAGMLPFKPIFLGLKESSTPRATSSQKCIRTNDIENVGRTARHHTFFEMLGNFSFGDYFKKEAIQWAWELSTEVFRLNPQNIVISVFKEDLEAEQIWKEVVGVDAKRIIRMGAADNFWSSGATGPCGPCSELYFDFKPELGSDEIDLEDDSRFIEFYNLVFMQYNRDLKGNLEPLANCHIDTGMGLERMAQILQGKSNNYETDLIFPLIEAAALLAQIKYETIDEKNKTSLKIIGDHCRAVTHLICDGVSASNLGRGYILRRLIRRMIRHGRLVGINQPFLPQLAEIAIELMKNAYPQLLEKKKIILNELKIEESRFLETLERGEKLLAEITAHECDLISGAQAFELYDTYGFPLELTEEIANEKGISVDTNGFENEMAQQRKRAKEASVSIDLTEEGSIEREISLFDETRFQGYEKLETISTVIGIFKNNESVKQAVQGDLVKIIVNRTPFYAESGGQIGDKGLITSKNLEVSIENVRKKKNIYIHSGCVNTGVLKVNSSVQMNVTPSFRQRTTSNHTATHLLQSALKLSIDSSISQRGSLVSNHRLRFDFNAPQPLTIKELEDVEVRINQWINEDHPIQIKTMPIKKAMAIGALAMFGEKYGDVVRVVDVPGVSMELCGGTHVTRTSQLGTFKIINETGIASGVRRIEAIAGPSVLDYFNERDLVVKELSKSFKVQSYEIVERVSSLQLELKDKTKELIKVKNELALAKALGLASYAKSVGKSKLLIRRLDGIDGSGLQSAASSLIDHLGKYSAVIFGGIPNQEIDNKLVFVAAFSPDLVSDGLHAGKFISGVAKMCGGGGGGRPNLAQAGGSQPQSLDLALEKANEDLTQQFS >NZ_CP007754.1|WP_038650521.1|72325_72658_-|hypothetical-protein MPVLIIGWSIYDKLPMEEQKEFALVERYRTDYFYECYEYENAKGNKNYEWSDRCFKNQEELLEFFGYEMIEDLNADAVYARRVETFTDEYENELMKLSDAGNQIKVIGAN >NZ_CP007754.1|WP_052041136.1|72645_72882_-|hypothetical-protein MTEEIDWKQELLDSEKFNKKQENQLNNGTKSLIKSWLLGALYIRWKKLKGIREQPAPDSNSSFQGWNKKVEDVNTCQS >NZ_CP007754.1|WP_038650523.1|72874_73057_-|hypothetical-protein MSLPPHFIDAKKKEVVFHIKGGYPVTMSIPTWMKSFPDEYKGISCRCEETFYKLRAKVND >NZ_CP007754.1|WP_156095699.1|73069_73213_-|hypothetical-protein MKVEVSCFVGGMVIKEIVHVDKFEDADKVAKSRNPFCRVVNRKVLMK >NZ_CP007754.1|WP_038650526.1|73471_73915_-|cyanase MSFPESTQLLLKAKKEKRLTFADIGILLGLDEVWVASLLYGQSTASDEEADKLLTTLGLGTELKEILTTPPVKGSLDPVIPTDPLIYRFYEIMQVYGMPMKDVIQEKFGDGIMSAIDFTINVDKVEDPKGDRVKVSMCGKFLPYKKW >NZ_CP007754.1|WP_038650529.1|75546_76179_+|hydantoin-utilization-protein MTFPYFGRKQFLAAFLPLLFWLTFLVAPVFAHHPFGMGDSAGLSAWQALLSGIGHPLLGPDHLLFMLGIALLGIKKTKQWVFPLLVVGLLGSALVQLQPLPDVMSAWAEAVVSLSLAIEGLIVLNLLSSKWLLPMFALHGYLLGSTIVGAEPTPLIGYFFGLLLAQGSLLLVVTATSQKVIKKFDINSRNLVAGIWIGIGLAFSWVAIIP >NZ_CP007754.1|WP_038650532.1|76195_76387_-|hypothetical-protein MNNFVIVALTTALLLPKPSQSDTNHFSTGGVFELDLCDIEIPLPPKQEREQKLLEEQLKKKQN >NZ_CP007754.1|WP_052041137.1|80854_82546_-|DUF4214-domain-containing-protein MTWSLKNIQELDTLGVSPHLENDVDNSGEAYQLYYTGNGGVTIAAMSTNLKLTQEGQINFIQDLTIVTTTEGIRRAYYIEVDPNSGKHEIFTALISKDGLSLSGVSSTGISHNGDEAWGVPDSVVLPDGRVRIYWVKSDTEATTLANEVILSATSTTTKGTNFLVDSGKRVEGGYVDFEVLKAEDNDWIAIMSSSPVTLPDQSQGIYVGVSNDGLTWEINETNLAPPEKSYLDPTGLLFSNSANKWRLIMSSSLSILGDREYSLVAAELTFTSNSATDSSDIINGTSEANEINALDGADSITGSGGNDVIDGGAGSDTCIYSSKFADYSFTRSTDTLQIADQRTTATNDGTDTLKNIEYIQFSDQTVEESKVDVIKNYSGIFSDYKFYNKGNGSYEIKSNSGTTDDITGLPLLTFTGESTTSSFRDISAIVDIKGTFDQVTGLNTKDAKMFRLYNAAFKRLPDSDGLKYWIGKYTSGENDDRAVASSFLVSAEFKQRYGEDVTNAKYVETLYVNVLGREYDQEGYNYWLGNLNSGLETRYELLLGFAESAENKALFTEMTGFG >NZ_CP007754.1|WP_038650534.1|82639_82864_-|hypothetical-protein MNRINELIDGFTFAEDIGAGGVFELNLGDSEIPLTTKREREQKLFEEKLKKKEKMHFNELIKLFQNAIYIPQDY >NZ_CP007754.1|WP_038650536.1|83218_83809_-|hypothetical-protein MSLGITELELTDTSTISIPTDAILILFLLTVFAFIGYYFHNILDNQTNQLVEKVDDNLHLELVKEKPEDQLTLESATVNHEKSEKPNIKKLNFIPPSKFWGIGSLVVVAIGGSSLLRIPTIQNLYKGVNTSHVNIKTENQSTKSLLSIAQIKSSNQSQTKIKKISYNDPLLSTNNSSENNNFLQVQQKRTEDFFTF |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
177788 : 189630
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NZ_CP007754|177788:189630|DBSCAN-SWA TTTAGAGGTACTCTTTCCCTTTTACTGGGTTTGCGGGGATGCCAGTAAACATTGTTGTTGATAGATATCTTTCACCAAAGCTAGGAAGGATAACAACCAATCGCTTATGAGCAAACTCAGGTTGATTTCCTACTTTTAAAGCAGCGGCGACTGCAGCACCACTGCTGACACCACTAAGTAATCCCTCTTCTTTGGCAAGTCTTCTTCCTATGTCCATTGCTTCATTATCATTGATTCTTATGATTTCATCAATTTGATTCATATCTAATACGTTAGGAATGAAACCAGCACCAATGCCTTGTATCGCATGAGATCCAGGATTCCCTCCTGACAGAACTGGGCTGGATGAAGGTTCTACCGCAAAAACTTTTATTTTTGGATTTTTTTGTTTTAAAAATCTTGCACAACCTGTGATTGTTCCCCCTGTTCCTACTCCTGCAATTAATGCATCAAGTTTGCCTTCGCAATCTTCCCAAATTTCTTCAGCGGTCGTTTTTTCATGAATTTCAGGATTGGATAAATTATCGAATTGCTGAAGCAAATATGCATTAGGTATAGAAACTACCAATTCCTTTGCGAGCTGAATGGCGCCTTGGATTCCTTCTTTGCCAGGGGTTAGTTGAAGCTCTGCTCCAAAAGCTCTTAACATTGAGCGTCTTTCAGTACTCATTGTGTCAGGCATTGTAAGTATGAGCCGATAACCTTTTGCTGCCGCAACCATGGCTAATGCAATTCCTGTGTTCCCGCTAGTTGGTTCAATCAGTACAGTATGTCCTGGTTTGATTGTTCCCTCCTTTTCCGCTGATTTCACCATTGCGCCAGCTATTCGGTCTTTTACGGATGCTGTTGGGTTGAAACTTTCTAATTTTGCGATGATCTCTGATCTACAATTAAATTCATTAGGTAATCGATTCAGTTTGACCAAAGGTGTTTGGCCAACTAAAGATGTTATGTCATTAGCAATTGGCATGATCTTATTTTAAAAACTTGAATCAATTGCGAGGTAAAAGTTATTTAATAATTCAATTCTCTTTTAATAATGCTTGAAATTTTGTTATTCAAAAGCTTTATTGGCCTTTTAGAGATATAAATAGATGGAATAATTTTTTGATATTGACCGAGAGCATTTCCCATAACTGTAAGCCTCCAATTTTATGGATTTTTCTTTTTTGGACCATAGCTTGCGGAATTGCAATTGTCTCTCTGGGAAATTTGCCTTTAAGAGATTTTGATGAAGCAACTGTTGCAAGAGTTGCATTGGAATTAAACCAAAAAAGTGGACTTGAGCGATTGCTTCCTTCTATCTGGGATAAGCCTTATTTGAATAAACCTCCTGGATTACATTGGATAATCTCTTTTGCAATTGGAATAAGTCGAAATTTCCAAAATAATTTTGATTTTTTACCCTCGGAGTTTTGTATAAGATTTTTTCCAGCACTTTTTTCGACTTTTGTTATTCCATTGGGTGGTCTGATTCAGTGGAACTTGCGCCCTAAAGATCGAATAGCATGTTTAACCACATCAGCAATTTTATTGACTTTATTGCCAATTATTAGATACGGGCGAATGGCAATGTTAGATGGTACTCAGCTTAGTGCCATTGCACTTTTATGGTTTTGCTTGTCATCTATAAAAAATAATAGGTCTACTAAATTTAATTTTTTAGGAGCTGGATTTGCCTGCAGTTTCATGCTTTTACTTAAAGCCCCTGTAATTATCCCTGCACTATTTGCATCTTTGTTACCTTTGATTTGGGAATATAAATCAAAAAATTATTCAAATAATCTTTCATGGGCCTGGTTCTTCTATGGATTAATTCCTGGTTTTGCTTGGCATTTATGGAATTTCGTTTCCTATGGTTCAGGAGCTTTCTGGTTGTGGTGGGGAGATGGAGCAGGAAGAGTTTTATTTGAAAAAGGCTCAGGTAGTGAGCTAGGAGTTTTGGTACCAATAATTGAAATATTTGAAGGGGGATGGCCTTGGATTCTTGTATGGCCAATTGGTTTTTTGTGGGCATGCTTTAGCCTTAATACTCGTTGGGGAGTTTGGGCTTTTAGTACTCAGATAATTATTGCAGGAAGTATTTTACCTCTAAAGATGCAACTTCCTTGGTATATACATCCATTTTGGTTGCCTTTTGCTTTGGTCTGCGGCCCCCCCGTCTCTTGGTTAATTCAAAGAGAAGAGAATGGTTATTTTTTCACTAAAAAAATATTAAGAAAGATTCCGTACATACTTTCTTTGATTGGACTATGCTTATTTGCTTTTTCTTTATTAATTAAGTTAAAGATTCTCAACGTTGGAGAAGGTTACTTTTATGCAATTTTTTTTATTAGTTTAGCTTGGTTTTTTGGGGGATTATCATTATCTAATTCAAGAAAGAATATTAGAAAGATGGGTTTTATTGGTTTGATTTTTGGAAGCATAATAGGTTTATTCTTTTTTGTGAGTTCTAAATTTTGGTTATGGGAAATAAATGAAAACTGGGATGTAAGACCTGTAGCTGAATTTATACATGACTTTCCTAATCAAAAAATTTTTATTAGAAATAGCTTTGAGCGTCCAAGTTTAAATTGGTATTCAGGAAAACAAATCAAAAGTTTCGACGAAGAAAATAAAAGTAAATGCAAAGTAATTAAGAAAACTAATGATTGGGATCTATATACATGTAATGATTAAATAAAATATTATTATTAACATATTTTTCTCTTCTTCTGCTTTTATTTGTAAGAATAAATTAGTAATAACGTTCTTCTGAAAAGTGTATTGTATTGAGCTTACTATTAAACTAAGTCCTATGCCTTTGGTGGTTCAGAGAAAAGAGCATGGAGATGCAAAGAGGCTTTATTCTGAAGTAATAGATTCTATCAAAAATGGTAATCCAAGGCTCCTAGAATTGACTTGTGAAAAAGTAGAAGATAAAAGAATTACTTTTCTTGTAAGCGAAATTACAGCTGTACAAATTTATGAAAAGACTAGTAGCAGCACTAGCAAACGGCCTGGATTTTCACTCCAGAATTAAGAAACAATAGGAGTCATTCAATTTTGGAACGAACCAATTCGTCTGGCTATTTGGAATTTGATCAAGTCTCTTTTTCTTGGCCCAATGGAGTCAAAGTCATAGATCAATGCTCTTTTTCAATTGTAAAACCTGGTTTGTGGATGCTGGTTGGTGAAAACGGAAGCGGTAAAAGCACCTTGTTTCGCTTGATAAATGGAGGGATTCGACCTAAGAGCGGAAAAATTTTCTGTTCTCTCAGCCCAACAATGGTTTATCAAAATCCAGATCACCAATTGCTTATGCCAACATGTAAAAGTGAGTTGATGCTTAGCGTTCCTAAAACCATTCCCAAAACTAATCTATTGGACTTAATTCATTCTGCTCTTGAAAAAGTGGACTTGTGTGAAATGTTGGATAGGCCTATTCATACTTTAAGTGGTGGCCAAAAGCAGCGTTTAGCTCTTGCTGGAGCAATTGTTAGCAATTCAAATTTACTTTTACTTGATGAGCCCACAGCTCTATTGGACCCTCAAAGTCAAAATTCAGTTTTGAAAGTTATGAAAAAATTGACAAGTTCCTCTGCTGATCCAATTACAGCAATATGGGTTACTCATCGATTGGAAGAATTATATTTTTGTGATGGAGCGGCAATTCTTAAAAATGGAGCTATCAGCAGTTGGAATTCTGGTTCAAAAGTGTTCCAAGAAATAAAATCACTTGCCCTTAGGTAGCTGGCAAGGGTAAGTTCTTAATGTTGTAATCCTCGGTAGCTCAGCGGTAGAGCGATCGGCTGTTAACCGATTGGTCGCAGGTTCGAATCCCGCCCGGGGAGTTTTTAAAGGTAAATGTAAATTTGTTTTTACATAAGAATAAATTTGTTGATTTTTAAGTTTGAAAAAAAAGTTTCTTTATCTTTAATTTAAAATTTTTTATAGAATTTTTTTAGATTTTTTATGAAAGTTTTGAGAATTCCTTAACAGTAAAGCCTTGGAATCGGAAGACTTTCTAAAGACAGTGCAATGACTTTTCGCCTTTTCAGGGATAAAAAACCAGTGATACTAGTTATAGTTGCTGATTAACCTATGGAAAACCAAGTTTGTCGAATTCTGCAATAAAAACAAAATTTTGAGAGAATCATATGAATCTTGAGTAGTCGCAACTGCGGGTACTTTTTAATTTGGGCAATTATTAATGAAGCCTTGCATTTTACTCATTGAAGACGACCAAGACATGAGAGATCTGGTTGCAGGGCATCTTGAGCACACTGGTTTTGATGTCCAAAAAGCTGAGGACGGAATCAAGGGTCAAGCTCTCGCTTTGCAATACGCTCCTGATTTAATTCTTCTTGATTTGATGCTTCCTAAAGTTGATGGTTTAACTCTTTGTCAGCGTTTAAGAAGAGATGAGAGAACATCCGCAATACCTATTCTTATGATTACAGCTTTAGGTGGAATCAAAGACAAAGTTACGGGTTTTAATTCTGGTGCAGATGATTACATCACAAAACCATTTGAACTCGAGGAATTACAAGTAAGGATAAAGGCGTTATTAAGAAGAACTAATCGAGCACCATTAGGAAGTAATAATCAGCAAGAAATACTCAATTACGGCCCTCTTACACTTGTTCCTGAAAGATTTGAGGCGATATGGTTCGAATCTCCAGTTCGTTTGACTCATTTAGAATTTGAATTGCTCCATTGTTTAATGCAAAGGCATGGTCAGACAGTTGCCCCTTCATTAATCCTAAAAGAAGTGTGGGGTTACGAGCCTGACGATGATATTGAGACTATTAGAGTCCATGTAAGACATTTAAGAACCAAGCTTGAACCTGACCCAAGAAAACCAAAATTCATCAAAACTGTTTATGGTGCTGGATATTGCTTGGAGTTACCAACAGGGGAAAAAATAAGGGAAATTCAACCATTAATAACTCAGGCGAGAGAAAATAACTCTTTAAAAAATAATAAGGATGAAAGAGTGATTGCTTAATCAAGCAAATTTATTTCTAATAAAGTTACTTCCCAAGCAAGTCTAGGTTGAACAAATTTCAATAATTGTTTTCTCAGTTCTTCAAGTTGTATGACAATACTGGAATTTTTTTCTTTTATCCAAGCCCTATTTTGTTGAAAATCAATAAGCCATAGTTGTTGCTCTATGTCAAGTTCATCAGTGATTTCCTTGGCTAATTTCAATAACTCAATTGGATTATTTAATTTGATTTCTAACTTTTGTCTTAATGGAGTTGAAAAGGATAACCAAAATTGAAGATTTACGATACTGCGTCCAGGAGATCCATATGAAAAATTGATTAATTCTCTAATTTTGTCACTAGGAATATCATCTGTTTTTTGAACAACTTCTGATTTCTCAATAATTTTCTTTAATTGATAATCATCCAGGCGTATAAATGGAACTATTTGACATCTGGATCTAATGGTTGATAATAATTTCTCTGGTCTTTGAGTGATAAGAATAAATAATCCTTTATATGTCTCTTCAAGAGTTTTTAATAATGCATTTGATGCAGATTCATTTATTCTTTCAATATCTTCAATTATTACTATGCTTCTTTCTGATTCAAATGGCTTTTTCCCTAGAAATTCTATTATTTCTTTAATTTGATTTAGTCTTATTTGCGGAGGCGACTTCATATTGATACCATCTAACCTTGCTTTTGTCTGAGAAATACTTTGACCTTGGACTATGTAAGATGGCTCGACCCATAATAAGTCAGGATGATTATTACTATTTATTCTTCTTTTTGTACTTTCTTTTTCTTGATTTTTGTCAAGAATAGCTTTGATGAATATTTTAGCAGTTTTTTTTCTTCCAACTCCCTCTGGACCAGAAAATAAATAAGCTTGAGAAATATGTTCTTTTGAAATAGCAGATTTTAAAATTTTAATTGCTAACTCTTGCCCATATATATTTTTAAAATCGTCCATTTTATTTGTCTTTTATTAATTTCTTGATCTCAGATTTAATCTCGGACATGATAATTTCTTTAGAGTTAATAGCAGATATTTTTTTCCAGTTACTGTCCTCGGACAATGCTTGAAAGCCTAGAGAAACATTTGATAAAAACTCTCTACCTTCTTTTTCTATGCGATCATCTTTTCTATTTATTCTTCTTCTTATACTTTCTTCAATAGGTATGTCTAATAGAAATGTAATATCTGGAGCAATGCCCTGTGTGGATATGGCTTCGAGATCTTTAATTAAATTGATATCTAACTTCCTTCCATAACCTTGATACGCAAGTGTTGATCCACAAAATCTATCGCTTATTAACCAATCCCCTCTATCCAAAGTTGGGCGAATAATTTCATTTATATGTTGTGATCTATCTGCGGCATAAAGCAAAAGCTCAGTAATAGAATCTGGACTTTTTTCTATAGAAGTATCTAGTAGAAGCGATCTTATTGATTTTCCTAATTTAGTTCCTCCTGGCTCTCTAGTGATAACTAATTTATTGTTTTCAGGTATGAGGTTGGTACTAATAAGCCATTTGGATAATTGATTGATTTGAGTAGTTTTGCCTGAGCCATCAATACCTTCAAAAACAATAAACTTTCCTTTCATTTTGACTTCAAAGATAAAGCATTAAGTACAACACTTATAGAGCTCAAAGCCATAAGTAAAGCCGCTAAGGGAGGAGATAGTAATAAGCCAGAAGACGGTAAAAGTAATCCTGCAGCAATTGGTAAAGCAATTAAGTTGTATCCAAATGCCCATGCAAGGTTTTGTTTTATTTTGAGCATTGCTTGCTTGGATAGATTTAAAGCATTTGGAAGAGATTCCAAGTTTTCTCCAAGTAGAACAAGATCAGCAGAATCTTGAGCGATTTGAGTTCCGGTTCCTATCGCTACTCCCAAGTCTGCAGCGGCAAGAGCTGGAGCATCATTAATTCCATCACCGATCATCGCGACTAAACCATTATTCTTTAATAAGTTCAACTTATTAAGCTTGTCTGAGGGTAACATTTGCCATCTAATTTGATTTGCACTAAATCCCAATTTTTCCCCTATAGATAAAACGGCTGAATCTCTATCACCACTAAACAAACTTAATGAAAAACCTCTTGAGCGTAATTTATTAATTGAAAGAAAAGCATCTTTTCTTATTTGGTCTTCAATCAAGAAAAAACCTAATAATTTTTTATCCAAAGCAACTGCAACTATAGATTGAGCTTTTGTTTTTGAAAGCTTGAAATTATTTTCAATCATTTCATTCCATTCAATTCCTTCGCTTTTGATCCATTCCGGAGTGCCGACTCTTATGAGTCCTTCTAAATTATTAAGTTTGCCAGCTAAGCCTTTACCTGGATACGTGGATGACCTTGACACTTTTTCTAGTTTGATTTCTTTTTTATGTGCTTCTTGAATAATTGCTTGGGCCAGCGGATGCCGACTTTCTTGTTCAATGCTTGCCGCCAATTTGAGCATGAAATTTCTTTCTGACTCCTTGTTATTCCAGTAGCCAACAACTAAAGGCCTTCCAATCGTGAGAGTACCTGTTTTATCAAAAATAATTTGACTTATTTTTGATGCCATTTCTATGACATCTCCACCCTTGAACAGCCATCCTCGTTTAGCAGCTTCCCCAGAGGCAACTGTTATTACCGTTGGCGTGGCAAGTCCTAGTGCACATGGACAGGCCACAACTAAAACAGCTATTGACAATTGAAACGAGAGTCCAATAGGTGTTTGAGATATATTCATTAAATGATCATGCAAGTTATGGCTATGCATGAAACCTGTATTAGATACTTCTAAAACTTCTGGCCATATCCTCGTCCCTATTTTCCACCAAAAAAGAAAAGTTATTAAAGCAAGAGTTGTTACCCCATAGCAGAACATACCTGCCACCTGGTCTGCTAATCCCTGAATTGGTGCTTTTCTAGATTGGGCTTCTTCAACTAAACTTATTATTTTAGCTATTGCCGTTTCAGCTCCAATTCTTTGAACTTCTAAAGTAATTGTTGACTCTAAATTTAGGCTGCCTGAGGGCAGCTCGACCCCTGGTGTTGCTTCTAGCGGTAAAGACTCGCCAGTTAAACTAGATATATCTATTGCCGAATTTCCTTTTATAACTAAGCCATCTACTGGGATTCTATCCCCAGCTAATAATTGAATTTTTTCTCCTGGTCTTAGAGCACCTATTCTAATTTCACGAATTTCGTCATTGTCTAAGATTAGATTGGCTGTTTCGGGTTGTAATTTTGCTAATTGTTTTAACGCTGTGCCAGTGTTGACTCGTGCTCTTTCCTCTAAAAAACGTCCCAATAGAACAAATCCAAGCAGCATAACCGGTTCATTGAAAAAACATGGCCAGCCAACTGTCGGCCAAATTAAAGCAATTATGCTTGCTATGTAAGCACTCATCACACCAAGACTAACTAAGGTATCCATAGTCGGCGTAAGCATGATTGCGGACTTTAGTCCTGCTCTTAGGATCGCTTTACCCGGTCCAAATAAAGCAAATGTTGCAAGTGCAGCATGAAAAGGTAATGAACCAATAAGTGGAAAAGATATTTGTTGACCCTCTACTAAATGTCCCAACCCTGAAAGGATTAATAATGAAATAGCAATTATTAGTTGTCGCCATTTATTCCATAAATTTTGATTTTCGTTTCTCTCTAACTCTGTATCTTTTAAAATTGTTTGATTAGGTCTTTCCCTGGATGGAAAACCCTTGGAGGTAAGAGTTTGTATTACATCGTAAAGGGGATTATTAGGATCTTTAATTTCTAAAAAAGCCGTTTTTGTAACTAAATTAACGCTTGCACTATTTATGTTTGGGTGGTTTTTAAGTATTTTTTCAACTGCCTGTACGCAACTTCCGCATTTCATTCCATCTACATCCAGCAGAATTGTATTTTTGCTTTGGGCAATCTTTTTGTTGCTCAAGGGAATATAAATTTTGGATACCTATTCTAAATTTAATAAATAAAAAGCATGTTGCATTTATTTAATAATTTATTAATACAAAAAAATTAGTTTCATTATTTCTATACATTTTTTTTATTTTCAGGCAGGATAGAATTGTATGTATTGATATTTGTTCAATCGTGCCTAGAAGTCAAAACAAAGACAATTTTCTTGATAAGGCCTTCACGAAGATGGCTGAGGGAATAGTGAAAGTGATGCCAATCGACTCCAAAGAAAAAGAAGCCTATCTTTATTACAGAAAAGGTTTGGCAGCTCAAAATGATGGAGATTACTCAGAGGCTCTGGAGTATTACGAAGAGAGCTTAAAACTTGAGGACAATCAAGTTGATAGAGGAGAGACATTAAAAAACATGGCAATAATTTATATGAGTAATGGAGATGAAGAGAGAGCTCTAAATACATATAAAAAAGCTTTGGGACAAAATCCCAAACAGCCATCTTGCTTAAAAAATATGGGATTAATCTATGAAAAAAGAGGAAGAATGGCTCAAAGAAATGGTAATCAAGATGAGTGTGATATCTGGTTCGATCAAGCAGCTGAAGTTTGGAGTAAAGCTGTTCGTTTATACCCTGGAGGATATTTAGATATAGAAAATTGGCTGAAGACTACTGGCAGAGGAAATGTTGATGTTTATTTATAAGTCATTAAAACGTGGATTAACTATTATCTAAAGCATAGATTAAAGCTTGATTAATATTCGAAGCTTTTAATATTTTTAATTTTTGATTCGTTTCAAACTCACTCGTATCTATTCCTTCTGGGATAATTAATGTGTGATATCCAAGTCTTATAACTTCATTAATTCGTTGTTGCATTTGTCTTACTAATCTTAATTGACCAGCTAAACCTATTTCTCCTATAAAAACTACACCTTCCTCAAGTTCAATATCTTTATAGCTTGAAACTATTGCAGCAGCTATTCCTAAATCAGCACCAGGTTCTTCGACTTCTAATCCCCCAGCTACAGCTAAATAACAGTCATATCTTGAGAGTGAAAGATTCATATTTTTTTCTAGAACTGCCAAGATTTGATGAAGCCTGTTTATCTCAATACCAGTTGTGGTTCTTCTTGGACTTGCATAACTCGTGGGATTTAACAGTGCTTGTATATCGATGGCTAATGGTCTTGTTCCCTCACAAGTAACAATTGTTGAAATTCCAGGTGCAGAGGTTTTGCTTAAAAATAATTCACTTGGATTAGGTACCTCCGATAATCCATCTGCTTGCATTTCAAATACTCCAAGCTCAGAAGTGGCACCAAAGCGATTTTTCACCCCTCTTAGAAGTCTGTGAGAAGCGAATCGATCTCCCTCAAAAGTAAGTACTGCATCCACAAGATGCTCAAGAACTTTTGGTCCGGCTAACATTCCATCCTTCGTTACGTGCCCGATGATCAAAAGAGAAATGTTTTGTCGCTTAGCAATTTGCTGCAAAGCTGCTGAACATTCTCTCACTTGGGCTACTGAGCCCGGTGAACTTGATAAATTTTGATCATGCAAAGCTTGAATACTATCAATCACTGCAACGTCAGGTTTTAAATGATCAAGCTCTTTAATAACTAGCTCTAGATCTGTTTCTGAGAGTAAATGAAGATTGGACTCAGAATCCTCAATTCGATTCCATCTAAGTTTTACTTGTTGAGCAGATTCTTCAGCAGCCACATAAAGGACTGATCTTTGACGAGCCATTTCAGTCGCACTTTGCAAAATGAGAGTGCTTTTCCCAATACCTGGATCTCCCCCAATTAGTACAAGTGATCCAGGCACTAAGCCACCTCCAAGTACCCTGTCTAATTCCTCATATCCACTTGAAATGCGTTCAATAAGTTGGTTTTTTGTTTGGCTTATTAGTTCTGAACGATAGGGAGATTTTTCCTTAGAAGAATTAATCTTTGTGTAAAAAGATTTATCTGATTTTTGATTAATTTTTTCCTCTATTATTGAGTTCCATTCTCCACAATTGTTGCAGCGGCCAAAGAATTGCCTGGTTTGTGCACCGCAACTTTGACAGACATAAATAGAGACAGAACGAGACACTTATTTGTAAAAAGGAAGTTGGCTGTAGTTGAATAAAGATAGTGATCTTTAAATGTTGGTGAACCTTCGCTTAAGATCTTGTCGCAGCCGCCAAAGCTAAGGAACAAATGACGGCCACAAGTCCCTCAAAGGAAACCATCCTCGTAGCTGATGATGAGGCAAGTATTAGGAGGATCCTAGAAACTCGCCTATCCATGATTGGCTATCAGGTAGTGACTGCTTGTGATGGAAATGAGGCTTTAGATCTTTTCAGGAATTGTGAGCCTGATTTGGTTGTACTAGATGTCATGATGCCTAAATTAGACGGATATGGAGTTTGCCAGGAACTAAGAAAGGAATCAGATGTTCCAATAGTCATGCTGACAGCCTTGGGAGATGTTGCAGATAGAATTACTGGTCTAGAGCTAGGTGCTGATGATTATGTTGTTAAACCATTTAGCCCAAAAGAATTAGAAGCTAGGATTAGATGTGTATTAAGAAGAGTAGAGAAAGAACAAATAGCAGGACTACCTAATTCAGGTGTCATTGCAGTTATGAATTTAAAGATTGATACAAATAAGCGTCAGGTTTATAGAAACGATGAACGAATTCGATTAACAGGTATGGAATTTAGTCTTTTAGAATTGTTGGTTAGTCGTTCAGGAGAACCTTTTAGTCGAGGTGAAATTCTTAAAGAAGTGTGGGGATATACACCTGAAAGACATGTTGATACGAGAGTAGTGGATGTTCATATTTCTAGACTTAGATCAAAACTTGAAGATGATCCTGCAAATCCAGAACTGATACTTACTGCAAGAGGAACAGGTTATCTTTTTCAAAGAATTGTTGACTCTATGATTCCTGAAGGATCATAA
Protein sequences of DBSCAN-SWA_1 >NZ_CP007754|177788:189630|178894_180466_+|WP_038650812.1|DBSCAN-SWA MILTESISHNCKPPILWIFLFWTIACGIAIVSLGNLPLRDFDEATVARVALELNQKSGLERLLPSIWDKPYLNKPPGLHWIISFAIGISRNFQNNFDFLPSEFCIRFFPALFSTFVIPLGGLIQWNLRPKDRIACLTTSAILLTLLPIIRYGRMAMLDGTQLSAIALLWFCLSSIKNNRSTKFNFLGAGFACSFMLLLKAPVIIPALFASLLPLIWEYKSKNYSNNLSWAWFFYGLIPGFAWHLWNFVSYGSGAFWLWWGDGAGRVLFEKGSGSELGVLVPIIEIFEGGWPWILVWPIGFLWACFSLNTRWGVWAFSTQIIIAGSILPLKMQLPWYIHPFWLPFALVCGPPVSWLIQREENGYFFTKKILRKIPYILSLIGLCLFAFSLLIKLKILNVGEGYFYAIFFISLAWFFGGLSLSNSRKNIRKMGFIGLIFGSIIGLFFFVSSKFWLWEINENWDVRPVAEFIHDFPNQKIFIRNSFERPSLNWYSGKQIKSFDEENKSKCKVIKKTNDWDLYTCND >NZ_CP007754|177788:189630|188883_189630_+|WP_011294133.1|DBSCAN-SWA MTATSPSKETILVADDEASIRRILETRLSMIGYQVVTACDGNEALDLFRNCEPDLVVLDVMMPKLDGYGVCQELRKESDVPIVMLTALGDVADRITGLELGADDYVVKPFSPKELEARIRCVLRRVEKEQIAGLPNSGVIAVMNLKIDTNKRQVYRNDERIRLTGMEFSLLELLVSRSGEPFSRGEILKEVWGYTPERHVDTRVVDVHISRLRSKLEDDPANPELILTARGTGYLFQRIVDSMIPEGS >NZ_CP007754|177788:189630|180548_180809_+|WP_038650815.1|DBSCAN-SWA MYCIELTIKLSPMPLVVQRKEHGDAKRLYSEVIDSIKNGNPRLLELTCEKVEDKRITFLVSEITAVQIYEKTSSSTSKRPGFSLQN >NZ_CP007754|177788:189630|177788_178757_-|WP_038650809.1|DBSCAN-SWA MPIANDITSLVGQTPLVKLNRLPNEFNCRSEIIAKLESFNPTASVKDRIAGAMVKSAEKEGTIKPGHTVLIEPTSGNTGIALAMVAAAKGYRLILTMPDTMSTERRSMLRAFGAELQLTPGKEGIQGAIQLAKELVVSIPNAYLLQQFDNLSNPEIHEKTTAEEIWEDCEGKLDALIAGVGTGGTITGCARFLKQKNPKIKVFAVEPSSSPVLSGGNPGSHAIQGIGAGFIPNVLDMNQIDEIIRINDNEAMDIGRRLAKEEGLLSGVSSGAAVAAALKVGNQPEFAHKRLVVILPSFGERYLSTTMFTGIPANPVKGKEYL >NZ_CP007754|177788:189630|186858_187380_+|WP_011822992.1|DBSCAN-SWA MPRSQNKDNFLDKAFTKMAEGIVKVMPIDSKEKEAYLYYRKGLAAQNDGDYSEALEYYEESLKLEDNQVDRGETLKNMAIIYMSNGDEERALNTYKKALGQNPKQPSCLKNMGLIYEKRGRMAQRNGNQDECDIWFDQAAEVWSKAVRLYPGGYLDIENWLKTTGRGNVDVYL >NZ_CP007754|177788:189630|187396_188776_-|WP_038650835.1|DBSCAN-SWA MSRSVSIYVCQSCGAQTRQFFGRCNNCGEWNSIIEEKINQKSDKSFYTKINSSKEKSPYRSELISQTKNQLIERISSGYEELDRVLGGGLVPGSLVLIGGDPGIGKSTLILQSATEMARQRSVLYVAAEESAQQVKLRWNRIEDSESNLHLLSETDLELVIKELDHLKPDVAVIDSIQALHDQNLSSSPGSVAQVRECSAALQQIAKRQNISLLIIGHVTKDGMLAGPKVLEHLVDAVLTFEGDRFASHRLLRGVKNRFGATSELGVFEMQADGLSEVPNPSELFLSKTSAPGISTIVTCEGTRPLAIDIQALLNPTSYASPRRTTTGIEINRLHQILAVLEKNMNLSLSRYDCYLAVAGGLEVEEPGADLGIAAAIVSSYKDIELEEGVVFIGEIGLAGQLRLVRQMQQRINEVIRLGYHTLIIPEGIDTSEFETNQKLKILKASNINQALIYALDNS >NZ_CP007754|177788:189630|181979_182777_+|WP_038650821.1|DBSCAN-SWA MKPCILLIEDDQDMRDLVAGHLEHTGFDVQKAEDGIKGQALALQYAPDLILLDLMLPKVDGLTLCQRLRRDERTSAIPILMITALGGIKDKVTGFNSGADDYITKPFELEELQVRIKALLRRTNRAPLGSNNQQEILNYGPLTLVPERFEAIWFESPVRLTHLEFELLHCLMQRHGQTVAPSLILKEVWGYEPDDDIETIRVHVRHLRTKLEPDPRKPKFIKTVYGAGYCLELPTGEKIREIQPLITQARENNSLKNNKDERVIA >NZ_CP007754|177788:189630|183734_184370_-|WP_038650827.1|DBSCAN-SWA MKGKFIVFEGIDGSGKTTQINQLSKWLISTNLIPENNKLVITREPGGTKLGKSIRSLLLDTSIEKSPDSITELLLYAADRSQHINEIIRPTLDRGDWLISDRFCGSTLAYQGYGRKLDINLIKDLEAISTQGIAPDITFLLDIPIEESIRRRINRKDDRIEKEGREFLSNVSLGFQALSEDSNWKKISAINSKEIIMSEIKSEIKKLIKDK >NZ_CP007754|177788:189630|184366_186697_-|WP_038650830.1|DBSCAN-SWA MSNKKIAQSKNTILLDVDGMKCGSCVQAVEKILKNHPNINSASVNLVTKTAFLEIKDPNNPLYDVIQTLTSKGFPSRERPNQTILKDTELERNENQNLWNKWRQLIIAISLLILSGLGHLVEGQQISFPLIGSLPFHAALATFALFGPGKAILRAGLKSAIMLTPTMDTLVSLGVMSAYIASIIALIWPTVGWPCFFNEPVMLLGFVLLGRFLEERARVNTGTALKQLAKLQPETANLILDNDEIREIRIGALRPGEKIQLLAGDRIPVDGLVIKGNSAIDISSLTGESLPLEATPGVELPSGSLNLESTITLEVQRIGAETAIAKIISLVEEAQSRKAPIQGLADQVAGMFCYGVTTLALITFLFWWKIGTRIWPEVLEVSNTGFMHSHNLHDHLMNISQTPIGLSFQLSIAVLVVACPCALGLATPTVITVASGEAAKRGWLFKGGDVIEMASKISQIIFDKTGTLTIGRPLVVGYWNNKESERNFMLKLAASIEQESRHPLAQAIIQEAHKKEIKLEKVSRSSTYPGKGLAGKLNNLEGLIRVGTPEWIKSEGIEWNEMIENNFKLSKTKAQSIVAVALDKKLLGFFLIEDQIRKDAFLSINKLRSRGFSLSLFSGDRDSAVLSIGEKLGFSANQIRWQMLPSDKLNKLNLLKNNGLVAMIGDGINDAPALAAADLGVAIGTGTQIAQDSADLVLLGENLESLPNALNLSKQAMLKIKQNLAWAFGYNLIALPIAAGLLLPSSGLLLSPPLAALLMALSSISVVLNALSLKSK >NZ_CP007754|177788:189630|180832_181519_+|WP_038650818.1|DBSCAN-SWA MERTNSSGYLEFDQVSFSWPNGVKVIDQCSFSIVKPGLWMLVGENGSGKSTLFRLINGGIRPKSGKIFCSLSPTMVYQNPDHQLLMPTCKSELMLSVPKTIPKTNLLDLIHSALEKVDLCEMLDRPIHTLSGGQKQRLALAGAIVSNSNLLLLDEPTALLDPQSQNSVLKVMKKLTSSSADPITAIWVTHRLEELYFCDGAAILKNGAISSWNSGSKVFQEIKSLALR >NZ_CP007754|177788:189630|182773_183733_-|WP_038650824.1|DBSCAN-SWA MDDFKNIYGQELAIKILKSAISKEHISQAYLFSGPEGVGRKKTAKIFIKAILDKNQEKESTKRRINSNNHPDLLWVEPSYIVQGQSISQTKARLDGINMKSPPQIRLNQIKEIIEFLGKKPFESERSIVIIEDIERINESASNALLKTLEETYKGLFILITQRPEKLLSTIRSRCQIVPFIRLDDYQLKKIIEKSEVVQKTDDIPSDKIRELINFSYGSPGRSIVNLQFWLSFSTPLRQKLEIKLNNPIELLKLAKEITDELDIEQQLWLIDFQQNRAWIKEKNSSIVIQLEELRKQLLKFVQPRLAWEVTLLEINLLD |
11 | Bacillus_phage(28.57%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
502519 : 507824
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NZ_CP007754|502519:507824|DBSCAN-SWA TTTACTTGTTTTTTGTTGGGTCAGGCAAAATAAAAGGAGGACAATCATTTAGTGAAGATTCACCATAACTAGCATATTCTTTATAACCACCCATTTTTCCGTTGGTTTTCATTAAAGCGCTTGTAAATGCTAATAAAAGAAATACTGTTGGAGCACCAATAATTAAAGCAGCACCAAATAAATATCCAATTAAAAACTCTGGAAAAGTGTGATTACCAAGAAACTCATGAGTTCCTAGCAAAAAGTCAATCATTTTAAACTGGTCTAATGAAGCTGATAGTAAGTCATTGAAGTTCACTTCTGGTGGAAATATTTCGCAGCTCTCTCAGCTTTTCCCCACAGGACCTTCCCACCCCTATGACTAACAGTGCCAGGTAAGGATCCTGATATCCTTTGTAGATTCTCAATTGGAACCATAATTATTGGTGTAAGTTTGTTGCCTCTCGCACGGCTAAAGAAAGAAGCAAGATCAGCAGCCAATTCAATATCTTTATTATCAAAAAGTCCATTGGATGATTTAAGTACGACATGGCTTCCAGGTGTCTCTTGGGCATGAAACCAAAGATCTCCTTTTTTTCCTTTCCTTAGACTAATTAATTCGTTTTGCCTATTGTTGGAACCTATTTGAATCTTTAGACCGCTAGGACTTTGAATCTCTTTTATAGTCGAAACCTGTTCATTTTTTCTATTTGATTTAAACTTCGATGAATTTTTTTTAATGCATATATATTCTTCTACTTCTTCTTTAAGTTCAATAATTGAATCTAGTTTATTTTTATTAGCCTCATTATCCTCATACATTAATGAATCAAGAAATAACTCACAATAGTCAATCTCAGATATTTTCTTTTTGTGAAATTCGACTCTATGCATGATTGACTCTCTAGATCTTTTTTTTCTTTTAGCTTCTTTGAATAGATTCTGAGCCTCAATTATTTGCTTCTTCGTTGGAGATTTTAAAGTAAGAATATTATTAGCTTTGCTTTGCATGGATATATATTCAGAAATATTTTTAATTAGTAAACTTTGCTCGTCTAGTTTTCTAATTTCATCATCTTTTGACTTTTGGAGATCATATTTTAATTTATCTCTAATAGAATTTATTTTCTTATCTATAATTTTATTTGAATAATATATGCCAAGTCTAAGACCAATTTGTGTATTCTCAACCCTTGATTTCACTTCTCCCCATACTATAAAATCAGTTGGTCCTTTGAAATTGATAGTATAATTATTATTCTCAATATCTACTAGCCACTTCTTCCATCTTTTATATATTGCCTCCCATGTATTTAATTCAATACTGGTTACTGATTGGTTAATTATATTAATTGCTTCATTGTAATCATTGCTTGCAATTTGTAATGTAAGAGCTGGACTTATTCCTTGATAAGTGTCTTTAAGACAATTCTTAAATGTTGATGGAACCAAGCATATATTCTCTTTCCATGAATGAAATGATTCAGAGAGGTTAGGAGCTAATCCTTTAAGGGCTGGAGGAGATTTGTAATTATCTCCAGTTCCTATTGGCCTTAGTCTTGAGTGGTTTTCTTTTATTTTTTTCCCAAGAGTAACTACTTTGTTTGATTTGTCTAAAAGTAAAATATTACTGTGTTTCCCCATTAACTCAACTACCAACTCTTTCTCAATTTCTTTACCAGGTCTGCTAGAGAATTTAAACTTAACTATTCTTTCAAAACCAGTTTGTTCTATTTTTACCAAAGCTAAATTGAATAATAAATGTTTTAGTTGTTTCGCTAATGTACTTTTTTCGCCATATCTTTTTGGAGGTTGTATTTGGACAATTCTTGGGGACTCGGCAAGCCAACTGATTTCAATCCATGTAAGTTTTTCAAGTGTTCTAAATCCTAATTGAAGAGTATGTGAATCAATTTGCTGTGCATTCTCAAATCTACTTGGAACGATGAGTTCGCAAAGTTCAAAAACAACCGCTTTGAGCGTTGTTAAGTCCATTATTTGAATTGGAACTTTGTTCATTTATCATCCTTTTAACTTTATAAATAATGGAATCAACCTTTATTAGGTAAATTCGATAGGATTTAATTATGTCGACTTTAGGAAATCTTACTGTTCTTACTGGCCCAAGTGGGGTTGGTAAAGGAACAATTGTTAGGAAAATCCTTGATAGCCATAGTGATGTATGGCTGTCTATTTCTGCCACTACTCGTAAACCAAGATTGGGGGAAATTGATGGGGAGCATTACTTTTTCTTAGACAAGAAAATTTTTCAAAACATAATAGATAATGAAGGTTTTCTTGAGTGGGCCTCATTCTCTAATAATTTTTATGGAACTCCCAAAAAAATAGTTAATGAAAAAATAAAAGAAGGAACTAATGTTCTTCTTGAAATTGAATTAGAGGGGGCTCGACAAATTCGAAAGTCTTTTCCTGAAGCATTGCAAATATTTATAGCACCACCAAATTTATCTGAACTTGAAAAAAGAATCAGAGGTAGGGGAACTGAAACTGAAGAATCTATTAGAGATCGCTTGGCAATAGCAAATAAGGAACTTATTGCGAAAAAAGAGTTTGACGCTGTAGTTGTTAATGAAGATATAGAAAAAGCCTTCAAAGAAATTGAAGGCTTAATGGGATTAAAAACTTAAATTTAATTAATAATTTGTATTTTTAAAAAGACATTGGATGAAAAAGCAAGTCTGGCACAAATCTATTAAATTCAACAATAATACCTGCTGTTAGAGTAATCCAAATAGCTGATACGACTGGGGCTGATCTAAACCATTTAGTACGAAATAATTGAAACATGATTGGAAAAGATTAAGTGATTTAAGGAATTAATAATTTTTTAGCCTCTTGGACCATTAAGGGAAACATTATTGTCTTTTTCCCTAAGCTCTCCATTTTTTCCCTCTCTATTAGCTTGTAGAGGCCAAGCGGCTCCTCTTTTTAAGCATTGCCAAGCCAGATCAGTGTCGATAATGATTTCATATTCTGCAGCGTTCTTTTTGCCTCTAACAGCTCTTACATATTCCCTTCCAGACCAACCAATAATACCTGCAATATAGATAAACATTACACCTGGAATCAGTAGATCTCCTTCATGACCTCTGTTAATCCATGCACCCCAAGGTTCAATAGGCGGTCCAATTATTAAGTGAGGTAGTCCATCATCTCCGCATAAGGCTTTGCTGTATCTTTCAAATCTTTTTATTGCCTGATCTGTTGAGGCTGTGCTTGCTCTTTCTTGGAAACGGGGATTATCAGCACAAGATACCAAAGCGGAAGCAGTGAAATCTGTAGGAGCTCTATCAGCGTTTAGTGCTGGGCCTGGTCTTGCATTAGCTATTGGAGCTATTCCTAAGAAAAGAAATGCTGAAAGTAAAATTGATAAAAGACGACTCATGAGTTCTGATTTTTATCTGTTTCCCTGTTTTAATGGGATTTCAATACTAAACTTAGTTGATCAATAGCGATAAATGTCAATAATTTTATCCCTCGAAACAAGTTGTGACGAGTCTGCAGCAGCTTTAGTTTCTGATGAAAAAGGAAAAATTGATTTAATAGCTAATGAAATAGCTTCACAAATGGAAGAGCATGCTAATTGGGGTGGTGTTGTTCCGGAAATTGCTTCAAGAAGACATGTGGAAAATCTTCCATTTTTAATTGAAGAAGTTTTTGCAAAATCAAAATTACAGATTGAAGATATAGATGCAGTAGCCGCAACTGTTACTCCAGGATTATCAGGTTCACTTTTGGTCGGATCAGTTACTGCAAGAACTTTAGCAAATTTGCATCACATTCCATTTTTAGGAATTCATCATTTGGAGGGACATCTTTCATCAATATATTTGTCAGAAAATCATCCTAAACCTCCTTTCTTAGTCTTATTAGTTAGTGGAGGACATACTGAATTGATAAAAGTAGATGTTCAACACAAGTATCAACGCCTTGGTAGAAGTCATGATGATGCAGCCGGAGAAGCTTTTGATAAGGTCGCAAGACTACTGGGACTTTCCTATCCAGGTGGGCCAGCAATTCAAAAAATAGCTAAATCTGGAGATCCAAAAAAGTTCTTTTTCCCAAAAGGGAGAGTCTCTAAACCTGAAGGTGGTTTTTATCCATATGATTTTTCTTTTAGTGGATTGAAAACGGCTGTATTTAGAAAGATAGAAAAAATCAGGTCAGAAAATAAAAACTTCCCAGTAGAGGACATTGCTGCAAGTTTTGAATACGTAGTTGCGGAGGTCTTAGTGGAGAGGAGTCTTCGATGTGCCCTTGATCAAGGTCTGAATTCTCTAGTTCTAGTGGGAGGAGTTGCTGCAAATTTGCGTTTAAGGGAAATGATGCTTGCAAAAGCATCTGAAAATTCAATTAATATTGCTCTTGCACCAATGGAATTTTGTACTGATAATGCGGCAATGATTGGAGCGGCAGCTTTGTTAAGATTTTCTAATAATTTTCAAAGTTCAATGGAACTTGGTGTTTCAGCCCGATGGCCATTAGAAAAATCTGATTTACTTTATGACTTTAATCCCCCTTTTTAATCAATATTTTTTTAAGCTTTAATTTTTTATTATGCCACTAAAAAATGCAAATGAAGCTAATAAATCCACTAAGATTGCAAGCTCAAGTGAACTTAATTCATGGAAGAGAGGATTCACTCCTCAAGCTGAGATATGGAACGGCAGAGTAGCAATAGCAGGTTTAATTATTGTCATAATTACTCTTTTAGTATCAAACTTAATTTTTTCTGGTTAAAAAAAAAATTGGTTTTATAATTAATTTTAATTCTAATTTTTTGGTTGTCATTCTGCTTGTTTAGTGAATGCAGGTCTTATCGATGGATTTTAAAAAGAGAGTTATTAAGTGGTAAAAAGACGATATTGTTTATTGGCTTGAATCCTTCTAAAGCCAATACATCAAATAATGATAAAACTCTAGTAAGGATAATTAATTTTTGTTCGAGATGGAATTATAAAAATATCTATATAATTAATCTCTTTGGACTGATTTCCAAGTCTCCTGATCAATTATCAAAAAGCAATGATCCAATAGGAGAAAATAATGATTTAATTACTTTAAAATCATTACAATTTTGGCGCGAAAATAACAATTGTGATTTGTGGTTAGGATGGGGTGATAAAGGTCAATTAAAGGGACGTGATCGTAAAGTTCTAAAATTAATTAAGAAATTTTCAAATTTGAAATCAAACGAAAATAATTTTTCCAAACGTATTTTAAGTCTTGGCCTTAGTAAAAAAGGTAACCCTCGTCACCCTCTCTATATGCCTAATCAATCTTTCTTAAGAAAGTTTGACCTATAG
Protein sequences of DBSCAN-SWA_2 >NZ_CP007754|502519:507824|505167_505305_-|WP_038651554.1|DBSCAN-SWA MFQLFRTKWFRSAPVVSAIWITLTAGIIVEFNRFVPDLLFHPMSF >NZ_CP007754|502519:507824|507075_507258_+|WP_038651563.1|DBSCAN-SWA MPLKNANEANKSTKIASSSELNSWKRGFTPQAEIWNGRVAIAGLIIVIITLLVSNLIFSG >NZ_CP007754|502519:507824|504584_505145_+|WP_038651551.1|DBSCAN-SWA MSTLGNLTVLTGPSGVGKGTIVRKILDSHSDVWLSISATTRKPRLGEIDGEHYFFLDKKIFQNIIDNEGFLEWASFSNNFYGTPKKIVNEKIKEGTNVLLEIELEGARQIRKSFPEALQIFIAPPNLSELEKRIRGRGTETEESIRDRLAIANKELIAKKEFDAVVVNEDIEKAFKEIEGLMGLKT >NZ_CP007754|502519:507824|505345_505903_-|WP_038651557.1|DBSCAN-SWA MSRLLSILLSAFLFLGIAPIANARPGPALNADRAPTDFTASALVSCADNPRFQERASTASTDQAIKRFERYSKALCGDDGLPHLIIGPPIEPWGAWINRGHEGDLLIPGVMFIYIAGIIGWSGREYVRAVRGKKNAAEYEIIIDTDLAWQCLKRGAAWPLQANREGKNGELREKDNNVSLNGPRG >NZ_CP007754|502519:507824|502812_504516_-|WP_038651548.1|DBSCAN-SWA MNKVPIQIMDLTTLKAVVFELCELIVPSRFENAQQIDSHTLQLGFRTLEKLTWIEISWLAESPRIVQIQPPKRYGEKSTLAKQLKHLLFNLALVKIEQTGFERIVKFKFSSRPGKEIEKELVVELMGKHSNILLLDKSNKVVTLGKKIKENHSRLRPIGTGDNYKSPPALKGLAPNLSESFHSWKENICLVPSTFKNCLKDTYQGISPALTLQIASNDYNEAINIINQSVTSIELNTWEAIYKRWKKWLVDIENNNYTINFKGPTDFIVWGEVKSRVENTQIGLRLGIYYSNKIIDKKINSIRDKLKYDLQKSKDDEIRKLDEQSLLIKNISEYISMQSKANNILTLKSPTKKQIIEAQNLFKEAKRKKRSRESIMHRVEFHKKKISEIDYCELFLDSLMYEDNEANKNKLDSIIELKEEVEEYICIKKNSSKFKSNRKNEQVSTIKEIQSPSGLKIQIGSNNRQNELISLRKGKKGDLWFHAQETPGSHVVLKSSNGLFDNKDIELAADLASFFSRARGNKLTPIIMVPIENLQRISGSLPGTVSHRGGKVLWGKAERAAKYFHQK >NZ_CP007754|502519:507824|505976_507044_+|WP_038651560.1|tRNA|DBSCAN-SWA MSIILSLETSCDESAAALVSDEKGKIDLIANEIASQMEEHANWGGVVPEIASRRHVENLPFLIEEVFAKSKLQIEDIDAVAATVTPGLSGSLLVGSVTARTLANLHHIPFLGIHHLEGHLSSIYLSENHPKPPFLVLLVSGGHTELIKVDVQHKYQRLGRSHDDAAGEAFDKVARLLGLSYPGGPAIQKIAKSGDPKKFFFPKGRVSKPEGGFYPYDFSFSGLKTAVFRKIEKIRSENKNFPVEDIAASFEYVVAEVLVERSLRCALDQGLNSLVLVGGVAANLRLREMMLAKASENSINIALAPMEFCTDNAAMIGAAALLRFSNNFQSSMELGVSARWPLEKSDLLYDFNPPF >NZ_CP007754|502519:507824|507302_507824_+|WP_052041156.1|DBSCAN-SWA MSFCLFSECRSYRWILKRELLSGKKTILFIGLNPSKANTSNNDKTLVRIINFCSRWNYKNIYIINLFGLISKSPDQLSKSNDPIGENNDLITLKSLQFWRENNNCDLWLGWGDKGQLKGRDRKVLKLIKKFSNLKSNENNFSKRILSLGLSKKGNPRHPLYMPNQSFLRKFDL >NZ_CP007754|502519:507824|502519_502771_-|WP_011294430.1|DBSCAN-SWA MIDFLLGTHEFLGNHTFPEFLIGYLFGAALIIGAPTVFLLLAFTSALMKTNGKMGGYKEYASYGESSLNDCPPFILPDPTKNK |
8 | Cyanophage(16.67%) | tRNA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
888471 : 899704
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NZ_CP007754|888471:899704|DBSCAN-SWA GTTATCCAAATTTTCCAGAGATATAGTCTTGAGTTGATTTTTGCTTTGGTGAATTGAACATGTTTTTTGTTTTATCAAACTCAACTAAAAATCCAATTTTTCCACCTAAATCCTTCTCTTTTTTCTCTGTGTTGAAAAAAGCTGTGTAATCACTGACTCTATTGGCTTGTTGCATATTGTGCGTAACAATAATGATTGTAAAATTCTTCTTTAATTCGTGAATTGTCTCTTCAATTTTTAAGGTAGATATTGGATCAAGTGCTGAGCATGGCTCATCCATTAAGATCACATCAGGTTCAATAGCAATTGTCCTTGCTATGCATAATCTTTGTTGTTGACCACCAGATAATGAATAACCACTTTCGTTTAATTTATCCTTGCACTCATCCCAAACTGCTGCCTTTCTAAGAGATTCTTCTACTAATTGATCCATATTACCTTTATATCCATTAACTCTTGCACCAAAGGCAATATTTTCGTAAATACTTTTAGGAAAAGGATTGGGTTGTTGAAAAACCATTCCAATTCTCCTTCTGACTTCAACTGGATCTATATCCTCTGCATATATATCTATACCTTCAAAAATAACACTGCCTGATAATTTGCAACCTTCTATTAAATCGTTCATTCGGTTGATTGCTCTGATAACAGTTGATTTACCACATCCTGATGGACCAATAAAAGATGTAACTTGATTCTTTTCAATATCACAAAATACATTTTTAACTGCAACTGAATTGCCATATGTAATTGATACATTATCTAGTGAGACTGAAGATGTAGATTTTAAATTTTTTTTATTCATTAGAATATTATATTATTAGCTTTGCTCATAATTATACTCTTTTTTTTGAAAAAGTACCAAGCGTGCCTATCCATCTTGAAAGGACATTAAGACTTAAAAGTACAACAACTAATATGAATGATGCTGCCCATGCTAGTTGGTTTTGAGCTTCATATGGTTCAAGAGCGAAATTGTAAATTAAGACTGACAATGAACCCATCTCATAGAAAAGATCATCAAAACTTGTAATATAATAACGGGAGAAAAGAGCTGTAAATATTAAAGGAGCTGTTTCTCCTGCTGCCCTGGCCAGTGCTAATAATACTCCTGTAGAAATTGAACTAAATGCAGCTGGTAATGTGATATTTGTTATCATTGTGAATTTTGAGGCACCAACTCCAAATGCAGCTCTTCTCATATCATTTGGAACTAATTTAAGTGCTTCATCAGTAGTTTTAATTATTGTTGGAAGCATTAAAATTGACAGTGATATTCCGCCTGCTATGCCGCTGAACATTGATCCAAATAATATTTTGGTGGAGACTATAATTGCATATATAAATACACCAGCAATTATAGAAGGAACCCCTGCAAGTACATTTGATCCAAACCTTATAAATTTTGCAAACTTTCCTGATTTTGAATATTCGGCAAGATATATTCCACCTCCTACTCCAACAGGTATTGATATTATTGAAGCAATAACTGACATTATAAAAGTTCCAGTTATTGCTGGTCCAATACCTCCAGCTGAGAGAAGATCGTCTCCTGGTGGCTCAGGTTCAAGAATTAAGGTATCTAAGTTTATATAACTTCCACCCTTAATTAGTACATAGCTTATGACTAATATTAAAGGAAGTACAGAAATGATAGCAAAAATAGCAGAAATAAAAGTTAAGGCTTTGTTCCCAATATTTCTAGTTAGAGTGGGATTATAAATTAGAGATTTTTGTGAAGTGTAATTCATTTATTAATATTTTAAGCTTAATTTTTTTACAATCCACTGGGCAAATACATTAACCAATAAGGTTAATATCATTAGGATTAATGCTGCATACATTAGAGAAGAGACTTGGCTTCCATCAGCTTCACCAAATTGATTAGCAAGCATTGATGAAATTGTATATGAAGGAGCAAATATTGACCAACTAAAGTTATTTGAATTGCCAATAATCATAGTAACTGCCATTGTCTCACCCATAGCTCTTCCTAGAGCAAGTAAAACTCCTCCTGTTATCCCAGAAATTGCGGCTGGAATAATAACTTTAAAAATAGTAGTCCATCTTGAGGCTCCAATTCCATAGGCAGCTTGCCTAAGCTTAGATGGAACTTGATTTAGTGAATCTTTTGAAATCGATGTAATTATAGGTAATATCATTACCACAAGTATTAATATTGCGGGTAGCATTCCAGCACCCAAAGGTTGGGTGCTGAAAAATGGGATAAATCCAAATACTTCGTAGATTATGTTCAAAAATGGTCTAATAAAAGGTTCCATAATAAATACTGCCCATAGTCCTAAAACTACTGATGGAATAGCAGCTAAAAGTTCAACCATTATTCCAATTACATTTCTTATATATTCGGGAATTATATTTTCAGTTATAAATATTGCAGTGCCGACACCCAATGGAATGGCAATTAATAATGAAGCAATCGATGTTAAAAGGGTTCCATAAATAGCTGTGAATGCACCATACTCGTCTGTAACTGGATTCCATGCAGAGCTAAAAAGAAACCTCAGTCCATATCTTGAAATCGATTCAGTAGATTCATAGTAAACTACTGCAAATATAGAAAAAAGGACTACGGCTACCATTGAAGCCATGGCAACAACAATATTTTTAAAACCAAAATCTACCAACTTCTCTGAAGTTGGTCTTGTTCTCAGTGAAAATTTCGGTGTACTTGCTTTGTCCACTCGCTAAAGCAATTTACTTTATGAATCTATATCTATTTTCAAATTTTTCATTAACAGAGGGTTAATGATTGGCTTTAAGTGTTGAAGGGTACATAATAAGTATTGAATACCCTTAAATGCTAGTTACTGTGGGGCTTAAATAAGTATTGCCATGGGGAGAATAGTTGGCATTGACTTGGGAACGACTAATTCCGTTGTAGCGGTGTTGGAGGCTGGTAGGCCTGTTGTTATTGCTAGTGCTGAAGGTGCTAGAACTACACCATCTGTTGTTGGCTTTACTAAGGAATCTGAATTGTTAGTCGGTCAACTTGCTAGACGGCAATTAGTTCTTAATCCCAAAAACACTTTCTCCAATTTAAAAAGATTTGTTGGCAGAGCATGGGATGAGCTTGAAGAAGCAAGCCTTTCAGTTCCTTATAGTGTCCGCTCAAATGATCAGGGGAATGTTCGTATCACCTCTCCTATAACAAAAAGGGAATATGCACCTGAAGAACTGATTGGAAATATCATTAGGAAGTTAATAGATGACGCTGAAACTTACTTAGGAGAAAACGTTGATGCTGCTGTAATCACTGTTCCCGCTTATTTCAACGATTCACAAAGACAAGCTACTCGCGATGCTGCGATTTTGGCTGGCATATCTGTTGAAAGGATTCTAAATGAACCAACCTCCGCGGCTCTTGCTTATGGATTTGATAAAAGCTCCTCTAGAAAAGTTCTGGTTTTTGATTTAGGTGGTGGCACATTTGATGTGTCTTTAATGTCCATTTCTAATGGTGTTTTTGATGTAAAGGCAACTTCAGGTGATACACAATTGGGTGGTAATGATTTTGATCAAAGAATTGTTGATTGGCTTGCTCAAGATTTTTTAGAAAAGAATAAAATAGACCTTAGAAGAGACAGGCAATCATTACAAAGACTTACTGAAGCGGCTGAGAAAGCTAAACAAGAACTTTCTGGTGTTCAAACCACACCCATTTCATTGCCTTTTATTTCTACAGGAAAAGATGGTCCACTACATATAGAAACTACCCTTAGTAGAAAAAAATACGAGAGTCTTTGCAATGACCTTTTAGATAGATTATTTGATCCTGTTAATACTGTTATTGATGATTCAGGTTGGAATCCTGAGGATATCGATGAAGTTGTTCTTGTAGGTGGAAGTACGCGTATGCCAATGGTAAAGCAATTAGTTAAAACCTTAGTTCCAAATCCACCTTGTCAATCTGTTAACCCTGATGAAGTTGTGGCTATTGGTGCGGCAATTCAAGGTGGCATTCTTTCAGGAGAGTTGAGAGACCTTTTGTTGAATGATGTCACTCCTCTTTCGTTAGGACTAGAAACTGTTGGAGGTTTAATGAAAGTTCTAATTCCACGTAATACCTCTATACCAGTAAGACAATCCGATGTTTTTAGTACATCTGCCTCAAATCAATCATCAGTTGAGATTCATATCTGGCAAGGAGAAAGGCAAATGGCCTCAGACAACAAATCACTGGGAAAATTTAAATTATCTGGTATTCCTCCTGCTCCAAGAGGTGTTCCTCAAGTTCAGGTGGCTTTTGATATTGATGCTAATGGTCTATTAGAAGTCAGTGCCACTGATAGAACTACAGGGAGAAAACAATCAGTAAGTGTTACCGGCGGTTCAAATCTGAATCAAAATGAAGTGAATAAGTTGATTGAGGAGTCCAAAGTAAAGGCCTCTGAAGATAGAAAAAAGCGAGCTTCTATTGATCAGAAAAATAATGCATTAACACTTGTTGCTCAAGCTGAGAGACGGCTAAGAGATGCTTCTCTTGAGTTAGGACCCTATGGCGCAGAAAGACAACAAAGATCTGTAGAGGTTGCGATGCGGGACGTTGAAGATTTGCTTCAAGATAATGATTTGCAAGAACTCGAATATGCAGTCGGTTCTCTACAAGAAGCATTATTTGGTTTGAATCGTCGCTTGTCAGCAGAAAGAAAAACAGAGTCAAATCCCATACAAGGTATTAAAAATACTTTTGGGTCATTAAAGGACGAATTATTTTCAGACGATTATTGGGATGATGATCCTTGGGATTATTCTCAAGGACGTCAAAATAGAAATGGTGATAATAATTATGGGAGAAGGGATGTAGATCCTTGGGATAATGACTACTACCGTTGATCCTAATTATTGGTCTCTATTAGGAGTCTCTCCAGAATGTGATTCTAATGAGCTTAAATCTGCCTTTAGGAAAGAGGCAAGAAAGTGGCACCCTGATTTAAATAAGAATGATGTCAATGCAGAGGAAAGATTTAAATTAATTAATGAAGCCTATGCGATACTTAGCGATCCAAAAAAGAGAAGGGAATGGGAGAAGCAAAATAATAAACATGAAGATATCTTTGAAAATAGATTTCCAACCTATGAGGAATATATAAATATTGTATTAGGAATAAGAATAGATTTAAAAAAAGAAAGTGATGAACAATATTCAGAACCTTCTGAAGATGAATACGAAGACTTTGAACAAACTAATTTTAATGAATATATTCCTACCACCAGTGAGCCAGTACCACCTCCAACTTTAATTTATGAAGATCAAGAGTCAATTGTAGAAATCTCACCAGATCAAGCTCTTTATGGTTCTTCAGTAGATATTCAGTTGCAAGACGGCACCCTTGTTGAGGTTTTAACTCCGCCATTTGCAGGTGATGGATGGAGATTACGAATAGAAGGTGCTGCAATCGGTTGTCGCGATCATTTTGTTCAATTAAAAGTACAAACGAAAGAAGGTCTAAGAATAGATGGATTAAGAGTTACATATCGTCTTGAATTGTTTCCACATGATGCTTTATTGGGTTGTGCTGTTGATATTCCAACTTTAAATGGATCTGTAACATTACAAGTACCTCCTAATTCTTCTACAGGGAGGTTATTAAGACTTAGAGGACGTGGATTGGAATACGAGGAATATCGTGGTGATCAAATAGTTGAAATAATTATTGTGTTACCGGATAATTTAAGTGATTCTGAACTAGCATTATATCAACGTCTAAATGAAATATCTATGGAGAATTATTAGAATTATATTTTTTATTCAATTTATCGATTTATAATTAAATTGGTTATTTATTTACTATGTTAGTTAATGTCCTTTTGTATGAGGCGGGGACTGAAAGTGAAGGCATACATTCCCTCGAACTTAAGGGAACGACAGTAATCCTTATGTTCGAAGACAAGGACGATGCTGAGAGATATTGTGGACTTTTAGAAGCTCAAGACTTTCCTACACCATCTGTTGAGGAGTTAACCAAGACGGATATTGAAGCATTTTGTATTGAAGCTGGTTATGAATCCCGCTTTGTAGAAAAAGGCTTTATCCCAAGAACCGATGAAGAGCGCCTTATGATTTCACCACCTCTTTCAAATTTAGAAGTAGGAAATTGGCAAAATCAAGATAATTTAAATGAACAAACATCTTCTAATGATCAACTCCAAGATATAAAAAAACGTTTAGAAAATCTTTTATGAGTGATATAAATAAAGATTCAAAAAATATTATTAATCGAATACTAACTGAGCAGATTAATTTAACTTCTAATGAATTGGATACTAAGTCGACAAATGAAATAGTTAATATTTTTTCAGAAGCTGATAAAGAACCCCAAAAAGCTGTGGAGCGAGTTATTCCAGAATTAGTTAATGCTATTGATGAAATCACTGCAAGACTTAAATTAAATGGCAGATTATTTTATATTGGTACTGGTACTTCAGGAAGATTGGGAGTACTTGATGCCTCAGAATGTCCCCCAACTTTTTGCACGAATCCTGATTTGGTTCAAGGAATAATCGCTGGAGGTGTACCATCTCTAACAAAAAGTTCTGAATATCTAGAGGATTTATCTGAGATTGCTATTGCTGATCTTAAAGATAGAGATTTCTCATGTAGAGATGTCTTAATAGGTATAACAGCAAGTGGTAGAACTCCTTATGTTCTAAGTGCATTAAACTATTCCAAAAGTTTAAATGCACTAACTATTTCTATTTCATCAGTTCCAGAAAGTGATTCAACTTTAGATAATAATATCGATATTAGGCTGATTACTGGACCTGAAATTCTTGCGGGTTCTACAAGATTAAAAGCTGGAACAGCTACAAAGATGGCTTTAAATATAATTTCTACATCTGTGATGATTAAATTAGGTAAGGTTTATGGCAATAGAATGATTGATTTATCAGTATCCAATGACAAATTATTGGATAGAGCAATCGGTATTTTATTTGATATTGGATCGGTTGATAAAGAAACTTCTATTCGACTTTTAAAGAAGACAAATGGATCTGTAAAATTGTCTTTATTAATTGCTTTGTCTGGAATGGATGTTATAGATGCCAAGCAATTACTTAATGATTCAAAGGGTAATTTAAGAACTGCACTTATTAAATTTAAAGATAATTGAATTATGATCAATTAAATCTTAGGTATTCTTATTGTACTTTCTGCATTAAACTTTAAAAGAAGTTATTATGAGAAAAATTAACTTGAGTTATGTCTAAAGTATTGATGGAAACAGATAAAGGCCAATTGACTATTGACCTCTTTGATAATGATGCACCAAAAACAGTAGAAAACTTTTTGAAACTTGTTAAAGAAGGTTTTTACAATGGCCTATCTTTTCACAGAGTCATTAATGGGTTTATGGCTCAAGGCGGATGTCCAAATACAAGAGAGGGCTCAAGAGGTATGCCTGGCACTGGAGGCCCTGGTTATTCCATAAATTGTGAAATTAATCCAAACAAACATGAAGCTGGTTCTCTTTCTATGGCCCACGCAGGAAAGGATACTGGTGGTAGCCAATTCTTTTTAGTTCATTCTCCACAGCCACATTTGGATGGAGTACATACTGTTTTTGGTAAAACTAATGATATTAAAACTCTTCTATCTATCACTAATGGTACTAAAATTAATAGTGTAAGTATTATTTAATAACTTAAGACATAAATTTATTATCTAATCTTGTAATTAACTCCATTCAATAGTTCTGTTCTTATCTTTTAAATTCCAATCAAATAACGGCGAATTTTCAAAATTTGAAAGTTCGCTAATATTTTTTTCCTCAATCGATATATTTGAGGAAGGATGTAAAAGTCTTTCATAATTATCAGTTTTAATTATTCCAATTCTTTCTGTATTTTTCCAATTGCTTAGTTCCTTAAGTAGTGACTCAAGTAATCTTTTATCTATCAAGTTACCTTCCAAATGTGCTTTGATATCTCTATGTCTAACATTCCAAATAAATAATGGGTTTTCACATAGAGCTATTAACCTTTGAGCAGTTTGAATAGAAATATTTAAAAAATGGTTTTCTGACCACTTACATGCTTTATCTTCAAAATGTTTTAATTCTCTGTTGTCAACTTTTCCATCCCAATAGACAACAATATTTTGTCTTTCATTGATTAAGTTTGTCTGAATATTATTATCAATTAAGTGTCCAAGTTTTTCTCTTTTCACCTCAAGATAAGCTGCATTATGATCTCCCGGACAAATAACTAATGGAACTCTAGATTCAACCTGAAGACCATATCCACCAAGACCAGCTATTTTTCTAGGATTATTTGTTAGTAATTTAAGTCTATTTATTCCTAAATCTGTCAATATTTGCGCCCCTACTCCATAGTTTCTTAAATCTGCAGGAAAACCTAACTTCTCATTTGCTTCAACAGTATCTAATCCTCCATCTTGTAGATTATAGGCTTTTAATTTGTTAACTAAACCTATACCTCTCCCTTCCTGCCTTAGATAGACAACAACTCCTTCTCCTTCTTCAGAAATTCTTGACAAGGCAGCTTCTAATTGAGGCCTACAATCGCACCTTAATGATCCAAACGCGTCTCCCGTTAGACACTCTGAGTGCATTCTTACTAATACTGGCTCTTTTAAATTTTCTGGATTTCCTTTTATTATCGCTACATGTTCTGATCCATCCAATTCATTCTTATAACCGATTGCCTTGAAATCTCCAAATAGGCTAGGCAACTTTGCTATTGCTTGTCTGTACACAAATCTCTCATTTTCAAGTCTGTAGTGAATTAAATCTGCAATACTGATTAACTTTAAATTTCTTTCTTGCGCATACTTTTTTAACTCAGGCAATCTTGCCATTGAGCCATCCAGATTTTGAATTTCACATATAACGCCTGCAGGAGATAAGCCTGCTAACAAAGATAGATCTACTGCCGCTTCCGTATGTCCAGCCCTTTTCAAGACTCCTCCAATTTTTGCTCTTAAAGGGAAAATATGACCCGGTCTTCTTAAATCAATTGGTTTTGTTTGACTATTAAGAGCAACTTGAATTGTTTTAGCCCTATCTTCAGCCGAAATACCCGTAGATACTCCAAATTCTGGACCTGCATCGATACTTACTGTGAATGCGGTTTGGTTTGAATCGGTATTTCTGTCAACCATTAATGGAAGATCTAATTCGTCTAATCTTTCGCCTTGCATTGCTAGACATATCAAACCTCTAGCCTCTGTTGCCATGAAATTTATTTGCTGGGGAGTCGCAAATTGAGCAGCACATATTAAATCGCCTTCGTTTTCTCTCTTTTCATCATCAACCACAACAACACATTCACCATTTCTGATAGCAGCTAGAGCATCTGCTATATCATCAAATTCAATTTCATAACAATCTTCTGATTTCAACTTATTCCTCGTGTTTGTGGTGAAATGGTTCTTTGCTAATTATTCTCAAATGAATATCTGCTCATTCTACGAAATAACATTGATGTTATGGCAATTAGTACATCGAAAACTGGGAGGATCGCAATTATTGGAGCATCTGGATACGGTGGACTTCAGCTTGTTAAGTTGATCAATGAGCATCCTGATTTTAAGATTTCAACTTTAAATGGTGAGCGATCAGTAGGTAAAAGCTGGAATGAAATAAATCCTTTTATGAAAATTTTGGGAGATAAAAAGATAACTAAAAGCAATATTGATGAAATCGCTCATGATTCTGATTATGCAATATTGAGTCTCCCTAATGGTTTATCATCACAGTTAACACCTTTATTATTAAAAAAAGGTGTTAAGGTCCTCGATTTGTCAGCTGATTATAGATTTAAATCTCTAGATAAATGGAAAGAAGTCTATAAAAAAGAAGCAGCGAAATATCCAAGATTTGACTACGAATTATGTGAAGAGGCTATTTATGGTTTTTCAGAAGAATTTAATAGCGAAATTTCAAATTCTAGATTAATTGCATGTCCAGGTTGCTATCCAACTGCTTCACTTAGCTTACTTATTCCATTTTTAAAACAAGGCTTAATAGAAAGTGAAGGAATTATTATTGATGCAAAATCTGGTACATCTGGTGGCGGGAGAAATCCAAGTGAGCAACTTTTATTGTCTGAATGCTCTGAATCAATTAGACCCTATGGAGTTATTGGACATAGGCATACGGCTGAAATAGAAAGGATTGCAAGTCATTTTGCTGGTCACGAAGTCAATTTACAATTCACTCCTCATTTAGTGCCAATGGTTAGAGGGATTTTGTCGACAGTTTATGCTCGTTTAAGAGATCCCGGATTAACAGCTGAAGACTGCAAAATTGTAATTGAAGCTTTTTATAAAGATCAACCATTTATTGATATCTTGCCTGTAGGAACTTATCCAGCAACTAAATGGGTTAAAAATACTAATAAAGTTATGATCTCTGTCGAAGTTGATAAACGTAACGGAAGAATTGTTCTAATGAGTGTTATAGATAATCTACTAAAAGGTCAAGCAGGTCAGGCAGTTCAAAATTTAAATATTATGCATGGACTTGAATCAGATATTGGTCTTCCTAAGATTACTTTTTATCCTTGAAACTAGTTCTAATTTCTATTGCTACTTTAGCAATAGCTAAAGGTAATATTATATGTTCCATATCTTGAATTCGTTTTTTTAAGGTTTCTATACTATCTTTTTCTTTTATAGGAACTGCCGCTTGAATAATTATTGAGCCTGAATCAACCTCCTTTTGAACATAGTGAACTGTACAGCCAGTAATAGTTACCTTTGTATCCATTGCCTGCTGTATTGCATCAATGCCTTTAAAAGATGGTAGAAGTGATGGATGTATATTAATTAGTCTCTTATTAAACTTATTAATTATTTCTTCACCAACAATTCTCATCCATCCAGCCATGACAACTATATCTACAGATATTTCCTCTAGTTTATTCATAACCAATATATCGTGTTCTAATCTCGAATTACAATCTCTATGATTAATAATTATATAGGGTATATCATATTTAATTGCCTTTTCTATTGCTAAGCAATTAGGATTATTAACAATTAATATTGAAATTTCTGCATTAAGTTCCTTGTTTTGAATAGATTTAATAATGTATTCAAAATTTGATCCATTACCAGAGGCAAGGATACCTAATCTAATCTTTGGCTCAACTAAATTGTTTACTGATTCAATTGGACTTATTAGACTCTGTCCATTTAAACCATTAAATAAATTTCTTTCAGCATATTCTTTATTATCTTGATTCAT
Protein sequences of DBSCAN-SWA_3 >NZ_CP007754|888471:899704|891326_893327_+|WP_038652544.1|DBSCAN-SWA MGRIVGIDLGTTNSVVAVLEAGRPVVIASAEGARTTPSVVGFTKESELLVGQLARRQLVLNPKNTFSNLKRFVGRAWDELEEASLSVPYSVRSNDQGNVRITSPITKREYAPEELIGNIIRKLIDDAETYLGENVDAAVITVPAYFNDSQRQATRDAAILAGISVERILNEPTSAALAYGFDKSSSRKVLVFDLGGGTFDVSLMSISNGVFDVKATSGDTQLGGNDFDQRIVDWLAQDFLEKNKIDLRRDRQSLQRLTEAAEKAKQELSGVQTTPISLPFISTGKDGPLHIETTLSRKKYESLCNDLLDRLFDPVNTVIDDSGWNPEDIDEVVLVGGSTRMPMVKQLVKTLVPNPPCQSVNPDEVVAIGAAIQGGILSGELRDLLLNDVTPLSLGLETVGGLMKVLIPRNTSIPVRQSDVFSTSASNQSSVEIHIWQGERQMASDNKSLGKFKLSGIPPAPRGVPQVQVAFDIDANGLLEVSATDRTTGRKQSVSVTGGSNLNQNEVNKLIEESKVKASEDRKKRASIDQKNNALTLVAQAERRLRDASLELGPYGAERQQRSVEVAMRDVEDLLQDNDLQELEYAVGSLQEALFGLNRRLSAERKTESNPIQGIKNTFGSLKDELFSDDYWDDDPWDYSQGRQNRNGDNNYGRRDVDPWDNDYYR >NZ_CP007754|888471:899704|894284_894677_+|WP_038652550.1|DBSCAN-SWA MLVNVLLYEAGTESEGIHSLELKGTTVILMFEDKDDAERYCGLLEAQDFPTPSVEELTKTDIEAFCIEAGYESRFVEKGFIPRTDEERLMISPPLSNLEVGNWQNQDNLNEQTSSNDQLQDIKKRLENLL >NZ_CP007754|888471:899704|889306_890221_-|WP_038652538.1|DBSCAN-SWA MNYTSQKSLIYNPTLTRNIGNKALTFISAIFAIISVLPLILVISYVLIKGGSYINLDTLILEPEPPGDDLLSAGGIGPAITGTFIMSVIASIISIPVGVGGGIYLAEYSKSGKFAKFIRFGSNVLAGVPSIIAGVFIYAIIVSTKILFGSMFSGIAGGISLSILMLPTIIKTTDEALKLVPNDMRRAAFGVGASKFTMITNITLPAAFSSISTGVLLALARAAGETAPLIFTALFSRYYITSFDDLFYEMGSLSVLIYNFALEPYEAQNQLAWAASFILVVVLLSLNVLSRWIGTLGTFSKKRV >NZ_CP007754|888471:899704|897942_899022_+|WP_038652563.1|DBSCAN-SWA MAISTSKTGRIAIIGASGYGGLQLVKLINEHPDFKISTLNGERSVGKSWNEINPFMKILGDKKITKSNIDEIAHDSDYAILSLPNGLSSQLTPLLLKKGVKVLDLSADYRFKSLDKWKEVYKKEAAKYPRFDYELCEEAIYGFSEEFNSEISNSRLIACPGCYPTASLSLLIPFLKQGLIESEGIIIDAKSGTSGGGRNPSEQLLLSECSESIRPYGVIGHRHTAEIERIASHFAGHEVNLQFTPHLVPMVRGILSTVYARLRDPGLTAEDCKIVIEAFYKDQPFIDILPVGTYPATKWVKNTNKVMISVEVDKRNGRIVLMSVIDNLLKGQAGQAVQNLNIMHGLESDIGLPKITFYP >NZ_CP007754|888471:899704|894673_895606_+|WP_038652553.1|DBSCAN-SWA MSDINKDSKNIINRILTEQINLTSNELDTKSTNEIVNIFSEADKEPQKAVERVIPELVNAIDEITARLKLNGRLFYIGTGTSGRLGVLDASECPPTFCTNPDLVQGIIAGGVPSLTKSSEYLEDLSEIAIADLKDRDFSCRDVLIGITASGRTPYVLSALNYSKSLNALTISISSVPESDSTLDNNIDIRLITGPEILAGSTRLKAGTATKMALNIISTSVMIKLGKVYGNRMIDLSVSNDKLLDRAIGILFDIGSVDKETSIRLLKKTNGSVKLSLLIALSGMDVIDAKQLLNDSKGNLRTALIKFKDN >NZ_CP007754|888471:899704|896169_897855_-|WP_038652559.1|DBSCAN-SWA MKSEDCYEIEFDDIADALAAIRNGECVVVVDDEKRENEGDLICAAQFATPQQINFMATEARGLICLAMQGERLDELDLPLMVDRNTDSNQTAFTVSIDAGPEFGVSTGISAEDRAKTIQVALNSQTKPIDLRRPGHIFPLRAKIGGVLKRAGHTEAAVDLSLLAGLSPAGVICEIQNLDGSMARLPELKKYAQERNLKLISIADLIHYRLENERFVYRQAIAKLPSLFGDFKAIGYKNELDGSEHVAIIKGNPENLKEPVLVRMHSECLTGDAFGSLRCDCRPQLEAALSRISEEGEGVVVYLRQEGRGIGLVNKLKAYNLQDGGLDTVEANEKLGFPADLRNYGVGAQILTDLGINRLKLLTNNPRKIAGLGGYGLQVESRVPLVICPGDHNAAYLEVKREKLGHLIDNNIQTNLINERQNIVVYWDGKVDNRELKHFEDKACKWSENHFLNISIQTAQRLIALCENPLFIWNVRHRDIKAHLEGNLIDKRLLESLLKELSNWKNTERIGIIKTDNYERLLHPSSNISIEEKNISELSNFENSPLFDWNLKDKNRTIEWS >NZ_CP007754|888471:899704|893310_894228_+|WP_038652547.1|DBSCAN-SWA MTTTVDPNYWSLLGVSPECDSNELKSAFRKEARKWHPDLNKNDVNAEERFKLINEAYAILSDPKKRREWEKQNNKHEDIFENRFPTYEEYINIVLGIRIDLKKESDEQYSEPSEDEYEDFEQTNFNEYIPTTSEPVPPPTLIYEDQESIVEISPDQALYGSSVDIQLQDGTLVEVLTPPFAGDGWRLRIEGAAIGCRDHFVQLKVQTKEGLRIDGLRVTYRLELFPHDALLGCAVDIPTLNGSVTLQVPPNSSTGRLLRLRGRGLEYEEYRGDQIVEIIIVLPDNLSDSELALYQRLNEISMENY >NZ_CP007754|888471:899704|899005_899704_-|WP_038652565.1|DBSCAN-SWA MNQDNKEYAERNLFNGLNGQSLISPIESVNNLVEPKIRLGILASGNGSNFEYIIKSIQNKELNAEISILIVNNPNCLAIEKAIKYDIPYIIINHRDCNSRLEHDILVMNKLEEISVDIVVMAGWMRIVGEEIINKFNKRLINIHPSLLPSFKGIDAIQQAMDTKVTITGCTVHYVQKEVDSGSIIIQAAVPIKEKDSIETLKKRIQDMEHIILPLAIAKVAIEIRTSFKDKK >NZ_CP007754|888471:899704|888471_889275_-|WP_038652535.1|DBSCAN-SWA MNKKNLKSTSSVSLDNVSITYGNSVAVKNVFCDIEKNQVTSFIGPSGCGKSTVIRAINRMNDLIEGCKLSGSVIFEGIDIYAEDIDPVEVRRRIGMVFQQPNPFPKSIYENIAFGARVNGYKGNMDQLVEESLRKAAVWDECKDKLNESGYSLSGGQQQRLCIARTIAIEPDVILMDEPCSALDPISTLKIEETIHELKKNFTIIIVTHNMQQANRVSDYTAFFNTEKKEKDLGGKIGFLVEFDKTKNMFNSPKQKSTQDYISGKFG >NZ_CP007754|888471:899704|895695_896133_+|WP_038652556.1|DBSCAN-SWA MSKVLMETDKGQLTIDLFDNDAPKTVENFLKLVKEGFYNGLSFHRVINGFMAQGGCPNTREGSRGMPGTGGPGYSINCEINPNKHEAGSLSMAHAGKDTGGSQFFLVHSPQPHLDGVHTVFGKTNDIKTLLSITNGTKINSVSII >NZ_CP007754|888471:899704|890224_891175_-|WP_038652541.1|DBSCAN-SWA MDKASTPKFSLRTRPTSEKLVDFGFKNIVVAMASMVAVVLFSIFAVVYYESTESISRYGLRFLFSSAWNPVTDEYGAFTAIYGTLLTSIASLLIAIPLGVGTAIFITENIIPEYIRNVIGIMVELLAAIPSVVLGLWAVFIMEPFIRPFLNIIYEVFGFIPFFSTQPLGAGMLPAILILVVMILPIITSISKDSLNQVPSKLRQAAYGIGASRWTTIFKVIIPAAISGITGGVLLALGRAMGETMAVTMIIGNSNNFSWSIFAPSYTISSMLANQFGEADGSQVSSLMYAALILMILTLLVNVFAQWIVKKLSLKY |
11 | Bacillus_virus(14.29%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
1748203 : 1753930
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >NZ_CP007754|1748203:1753930|DBSCAN-SWA TATGAAAATCTCAAATCACAGAGTAGAAGAAATAATTAATTTTATTAAAGGTCTAAATTTAGATCAAAAATTTAAAAAAGAGTTTACGAAAGAAAAAATAAAAAATATTTTATATATTAATGAATCACTTACTCATAGTTCAGCAAATAGTGAAATTAATTATGAAAATCTTGAATTTCTTGGAGACGCAGTTCTCAGACTCGTTGCATCAGATTTCATAAAAAATAAATATCCATATATGCAAGTAGGAGAAAGATCTGAACTTCGTTCACATCTGGTAAGTGATCAATGGCTAGAAGAAGTTGGTAAAAAAATAGAAATCAACAGTGTATTAGTTATTGGGAATAAAGCCCTTAGAGATAAATCAGCAAACGCAACTATTCAAGCGCAAGCAACTGAAGCACTAATAGGAGCTTTGTATGAAAGTCTTAATATTGTTGAACCTATAAAAGATTGGCTTATTCCGTTCTGGGATGAGAAAAGTAATGAAGTTCTAGCTGATCCTCATAAGAAAAATTACAAATCAGCACTTCAGGAATTGACTCAAAGTAAAGGCTTATCAATTCCCAGATATAAAACAATTGAAATTGATAAAAAGCATAACAATCCTAAACGATTTTTGTGTAGTGTTTTTGTCAAAAATCGATCGATTGCTGAAGGAACTGGAAAGTCAATAAAGCAAGCCGAAAAAGATGCTGCAAGTAAAGCATTGAAGTATTTCGAGAAAAATGTAATTGATCAGTAATTAGTTTCCTTAGAAAAATGAATAATCAATTTTTCATAAGATCTTTAAGAGGTATTGTTAATAATTTATCCCAATTCCCCCCCTCAAAAAGCACTGCCGCTTTATCACCACTTATTCTTTGAACAAATCCTTCATAACCATTGTAAATTGACTCTTGGTTATTAACAGTTACTGTTGTACCAGGAAGAATAGGATCTTTTGTATCAGTCATAATTAACCATATTCAAATAAACTTTGAAAAAGTCTACTCATAAAAATGATCGAAAAAGATAAATGGATGTCAATAGGTGAAATTGTTGCTCCGCAAGGTTTAAAAGGAGATATTCGAATTAAACCTAATAGCGACTTTCCTGAAAGATTTACACAACCTGGGAAACGATGGATTCAAAAAACTGACGAATTACCTACTGAAATCAATTTAACAAAAGGAACGCTTATTCCAGGCAAATCAATCTATGTACTTTCTATCGAGGGAGTATCTACTAGAAGTTCTGCGGAAGAAATTATTGGTTGGAAAATAGTTATACCAAGTGATAGCAGACCGATGTTGAGTAAAGATGAGTACCATTACTATGATTTAATTGGTCTAGAGGCAAGAAGCGGTCCCAAAAAAGCTTTAATTGGTCATGTAACTGACTTAATGAAGGGAGGGAATGACCTTCTAGAGATAGAGTTAGTGGAAGGTAAAAAAGTTTTGGTACCTTTTGTTAAAGAAATTGTCCCAGAAATAGACATCAAAGAAAAATGGTTGCTAATCAATCCACCCAATGGCTTATTGGAACTCTAATAATTATTGAGGTTTTTAAACAAAACTTCAAAAATAAATTACAAAGTTCTTTATGAGAATAACTGATAACTCCATAATTCCTGTAATTCTTAGTGGTGGATCAGGAACAAGACTTTGGCCACTTTCTAGAGAAAGTTATCCTAAGCAATTTCTAGCGTTAGATACACGAACAAAGAAAACACTTTTGCAGAAAACTTATGAAAGGCTTCTGGGTTTAGAGGGACTTGAAAATCCCATTTTAATATGTAATGAGGATCATAGATTTATAGTTGCAGAGCAATTTAGAGAAATAAATACTGATCCTCAGGCAATTATTCTGGAACCCGTAGGACGTAATACTGCACCAGCAATTGCAGTTGCTGCTCTTCAAGCAATTTCTTTAGGTAAAGATCCTTTACTGTTAATTTTGGCAGCCGATCACTTGATAGAAAATATCATTGAATTTCAAAGAGTAATTCAATCAGCAAAAACATATGCAAAGCAGGGTAGATTAGTGACCTTTGGTATTGTTCCAACTTCTGCAGAAACTGGTTACGGTTACATTGAAGCAAAAGAATTAGATAATAATGAAGATCAAATAAGTGGTCTAGAAATAAACAAATTTATAGAAAAACCTAATAAAGAAATAGCTGAAAAATTAATCAAAGATTCTCGCTATACTTGGAATAGTGGTATGTTTCTTTTTAAAGCAAGTTCAATAATAAGTGAATTAGAGAAATTCTCTCCAGAAATCATAAATTATTGCAAAATTGCAATTGAGAAAGATGTAGAAGATCTTGATTTCCTACGATTAGAAACAGAGTCATTCAAGAAATGTCCAAAAATATCTTTAGATATAGCAGTTATGGAAAAAACAAACTTAGGTACCGTTCTTCCCTTAAATGTAGGATGGAGTGATATAGGAAGTTGGAAATCTTTGTGGGATATTAGTCAAAAGAATAAGGATGGAAACTACATAAATGGGAGAATAATCGCTGAACAAAGTAGAAATTGTTATCTAGAAAGTGAACAACGTCTAATTGTGGGAATAGGAATAGAAGATCTAATAGTTATAGATACAAATGATGCTATATTAATTGCTAATAGAGATCAATCTCAAAATATTGGAAATATAATCAAAAGCCTTTGCTCAAAAGACTTCCCAGAAGGTAAAGTTCACAGAAAAATTTATAGACCTTGGGGAAATTACACTACAATAGTTGAGGGGGATAGATGGCTAGTCAAGCTCATAGAAGTAAAGCCAAATGCTTCTCTTTCTTTACAAATGCACCATCATAGAGCTGAACATTGGGTTGTAGTTAACGGAACAGCCTTGATAGAAAAAAATGGAGAAAAGCAACTTTTAAGTGAAAATGAAAGCACATTCATTCCTTTAGGCTGCAAGCATAGATTAAGCAATCCAGGGAAAATGAAACTTGAGCTTATTGAAGTTCAAAGCGGAGCGTATTTAGATGAAGAAGACATCATTCGCTTTGAAGATTCTTATGGCAGAATAAAAAATCTTAGTTGATGAAAAACTATATTTTATTTTTCAAATTACAGGTAATTAATTAAATAAAATGATTGAGAGTTAAGAATCTTTATTCCACGGTTACACTTTTGGCTAAATTCCTAGGCTGATCAACATCTAAACCTTTATGTGCTGCTATGTGATAACTAAATAACTGCAAAGGTACAACGGTCAATAGAGGACTCACCCATTCACTAACTTTTGGAATAGTAAATAATTCATCAAACATTTCCGATTCAGATCGATGAGTAGACACCCCAATCAAACGGGCATCTCTAGCTTTAGCCTCTTGCGAGTTACTAAGTACTTTTTCATAGACGATTCCAGGGACAGCAATAGATACCACTGGAACATGTTGATCTAAAAGTGCTATTGGTCCGTGTTTTAGCTCTCCAGCTGGATAGCCTTGCGCATGGATGTAGCTTATTTCCTTTAATTTAAGAGCACCTTCAAGTGCAATTGGATAATTTATTCCTCTACCTAAAAAAATTACATCCTTTGTTTCAACAAACAAATGTGCTATTTCCTTAGAGAGAGAATCATGTTTTTTTATAAGATTTGTTAGCTGTTTAGGGATTAATCTCAAATCATTGGAGAGATCTAAAATTTCTTGAGAGTTTCTTTTTTGTCTATGTGATGCAAATAAAAGTGTTAAACCATAAAAGGACAACATTTGTCCCAGAAAGGTTTTGGTTGCTGCAACACCTATTTCGATGCCTGATCCAATATCAATAACATTATCTAGCTCACGACCAAATGAACTATCAATTCTATTAGTAATGCCCAATTGATGAAAAGAAAAATGAGGATCTTTAGTCGAATCTCTTCTCTCCTTTTCCATCCTTAAGGCAGCTAAAGTGTCTGCAGTTTCACCTGATTGACTTACTCCAATTGTCAAAGTATTGGGAGAAAGTGGAGGGGGAGCATAACGAAATTCACTCGCGAAATATACCTTTGTAGGAACTCCTGCAAACTGTTCCAACAAATAAGCACCAACCATACCTGCATGTCTGCTTGTGCCACAGGCAAGTATTTGAATCTGTTCTATTTTCTCAAGGATAGATTTAGAAACCTGCAAAGCTACTGGTTTTTCGGAGGGCAAATCCATAGGCAAAAATCTATCTATCCATTGTTGTGCCGTCTCTGGCTGCTCATAAATTTCTTTAAGCATGAAATGACGAAAATTTCTTTTATCGGCAAAAAATTCCGTGCCCTGCAAGATCGATGGTGCTCTATGCTGCCTCTTTCCATCATCATCATATAGTTCAATTCCTAGTGGGGTTAAAAGTGCACTTTCGTGATCCCTTAAAGGTAAAAATGTACGGGTAAATCCTATTAATGCTGGTGTATCACTTGCACAAAAAAACTCACCCTCGCCAAAGCCAAGAACTAATGGAGCTTGCCCTCTAGCTACTACCAAGGCATTTGGTGCCTTAGACCAAATCACTGCGATGGAATAAGTCCCTTCTAATAAAGTCAAAACTTTTTGAACAGCGATTAATAGTGTTTGTTCATCAGGGCAAAGTCCATTTGCCAGAGACTGTTCTATCTCAAGACCGATTAAGTGTGGAATTATTTCAGTGTCAGTTTCCGAGGTTAATTTGATTCCTTTAACTTTCAGGCTGCTAGATAACTCTCTGTAATTCTCGATAATCCCATTTTGCACAACTGCAATTTGCCCTGAGAAATCAAGATGAGGATGAGCATTTCTCTCGTTAGGCTTTCCATGAGTAGCCCATCTAGTATGGGCAATACCAACATGACCTTTTGGAGGCTTTTTTTTAATTAAGTTTGATAGATTAACAAGCTTTCCTTTTGCTTTTGTGACATTTAGTTGTCCAATTTGATCGTTATTTAAATTGTCAATTGTTGCTATACCTGCAGAGTCATAACCGCGATATTCCAATTTTCTTAATCCATCAATAAGTAAAGAAGAAACTTCTCTTGATCCAATAACAGCAAAAATGCCACACATATATTTAAATTTACATCAAAAATTATTTTTTAAAATAAACCTTCCTCAAGCAAAATACCAAATTTTTAGTAAGCCAAACCCAAATTTTTAGTAAGCCAAACCCATACTTCTAGTTGTTTCGTCACCTAAGTAAACCCTAATACTAAGGAAATCAGTTGGACAAGCAGTTTCACATCGCTTACATCCAACACAATCTTCAGTTCTTGGAGAGGAAGCTATCTGTGAAGCTTTGCAGCCATCCCAAGGAACCATTTCAAGAACATCAAGTGGACAAGCCCTGACGCATTGGGTGCAACCAATACAGGTGTCATAGATTTTTACGGCGTGTGACAAGTTACAGCACAGGTTTCTTGATGTATAAAACTATACCCAAAGATTTGCTTCATAAAAAAAATTAGTTGCAATCTAGTCACTTTTGTTAACTCGACACTTTAACCCGTAGGATTAGAACTCAGGTCTAAGAAGGTTATGTCCCAGGAAGCAATCCTTGAAAAAGTTCGTTCTATCGTCGCAGAACAACTTAGTGTTGAAGCTGGTGAAGTTAAACCGGATTCAAATTTCCAAAACGATCTCGGTGCAGACTCTCTCGACACTGTCGAGCTAGTGATGGCTCTGGAAGAGGCGTTTGACATAGAGATCCCTGACGAAGCTGCAGAAGGCATTGCCACTGTGGGGGATGCAGTCAATTACATCGAAGAAAAACAGTCTTGA
Protein sequences of DBSCAN-SWA_4 >NZ_CP007754|1748203:1753930|1749786_1751244_+|WP_038654508.1|DBSCAN-SWA MRITDNSIIPVILSGGSGTRLWPLSRESYPKQFLALDTRTKKTLLQKTYERLLGLEGLENPILICNEDHRFIVAEQFREINTDPQAIILEPVGRNTAPAIAVAALQAISLGKDPLLLILAADHLIENIIEFQRVIQSAKTYAKQGRLVTFGIVPTSAETGYGYIEAKELDNNEDQISGLEINKFIEKPNKEIAEKLIKDSRYTWNSGMFLFKASSIISELEKFSPEIINYCKIAIEKDVEDLDFLRLETESFKKCPKISLDIAVMEKTNLGTVLPLNVGWSDIGSWKSLWDISQKNKDGNYINGRIIAEQSRNCYLESEQRLIVGIGIEDLIVIDTNDAILIANRDQSQNIGNIIKSLCSKDFPEGKVHRKIYRPWGNYTTIVEGDRWLVKLIEVKPNASLSLQMHHHRAEHWVVVNGTALIEKNGEKQLLSENESTFIPLGCKHRLSNPGKMKLELIEVQSGAYLDEEDIIRFEDSYGRIKNLS >NZ_CP007754|1748203:1753930|1751314_1753219_-|WP_038654511.1|DBSCAN-SWA MCGIFAVIGSREVSSLLIDGLRKLEYRGYDSAGIATIDNLNNDQIGQLNVTKAKGKLVNLSNLIKKKPPKGHVGIAHTRWATHGKPNERNAHPHLDFSGQIAVVQNGIIENYRELSSSLKVKGIKLTSETDTEIIPHLIGLEIEQSLANGLCPDEQTLLIAVQKVLTLLEGTYSIAVIWSKAPNALVVARGQAPLVLGFGEGEFFCASDTPALIGFTRTFLPLRDHESALLTPLGIELYDDDGKRQHRAPSILQGTEFFADKRNFRHFMLKEIYEQPETAQQWIDRFLPMDLPSEKPVALQVSKSILEKIEQIQILACGTSRHAGMVGAYLLEQFAGVPTKVYFASEFRYAPPPLSPNTLTIGVSQSGETADTLAALRMEKERRDSTKDPHFSFHQLGITNRIDSSFGRELDNVIDIGSGIEIGVAATKTFLGQMLSFYGLTLLFASHRQKRNSQEILDLSNDLRLIPKQLTNLIKKHDSLSKEIAHLFVETKDVIFLGRGINYPIALEGALKLKEISYIHAQGYPAGELKHGPIALLDQHVPVVSIAVPGIVYEKVLSNSQEAKARDARLIGVSTHRSESEMFDELFTIPKVSEWVSPLLTVVPLQLFSYHIAAHKGLDVDQPRNLAKSVTVE >NZ_CP007754|1748203:1753930|1753687_1753930_+|WP_038654514.1|DBSCAN-SWA MSQEAILEKVRSIVAEQLSVEAGEVKPDSNFQNDLGADSLDTVELVMALEEAFDIEIPDEAAEGIATVGDAVNYIEEKQS >NZ_CP007754|1748203:1753930|1748203_1748947_+|WP_038654499.1|DBSCAN-SWA MKISNHRVEEIINFIKGLNLDQKFKKEFTKEKIKNILYINESLTHSSANSEINYENLEFLGDAVLRLVASDFIKNKYPYMQVGERSELRSHLVSDQWLEEVGKKIEINSVLVIGNKALRDKSANATIQAQATEALIGALYESLNIVEPIKDWLIPFWDEKSNEVLADPHKKNYKSALQELTQSKGLSIPRYKTIEIDKKHNNPKRFLCSVFVKNRSIAEGTGKSIKQAEKDAASKALKYFEKNVIDQ >NZ_CP007754|1748203:1753930|1753306_1753552_-|WP_011295528.1|DBSCAN-SWA MSHAVKIYDTCIGCTQCVRACPLDVLEMVPWDGCKASQIASSPRTEDCVGCKRCETACPTDFLSIRVYLGDETTRSMGLAY >NZ_CP007754|1748203:1753930|1748972_1749158_-|WP_038654502.1|DBSCAN-SWA MTDTKDPILPGTTVTVNNQESIYNGYEGFVQRISGDKAAVLFEGGNWDKLLTIPLKDLMKN >NZ_CP007754|1748203:1753930|1749203_1749734_+|WP_038654505.1|DBSCAN-SWA MIEKDKWMSIGEIVAPQGLKGDIRIKPNSDFPERFTQPGKRWIQKTDELPTEINLTKGTLIPGKSIYVLSIEGVSTRSSAEEIIGWKIVIPSDSRPMLSKDEYHYYDLIGLEARSGPKKALIGHVTDLMKGGNDLLEIELVEGKKVLVPFVKEIVPEIDIKEKWLLINPPNGLLEL |
7 | Prochlorococcus_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|