Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
CP019820 | Streptococcus agalactiae strain SA195, complete genome | 1 crisprs | cas3,cas5,cas7,cas4,cas2,cas9,cas1,csn2,csm6,DEDDh | 0 | 0 | 4 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP019820_1 | 817249-817343 | TypeII |
II-A
Consensus repeat of CP019820_1
|
1 spacers
spacers of CP019820_1
>1.1|817278|37|CP019820|CRISPRCasFinder CCAAAACTTATTCTATTGTTAAATCGTGTGTTGATGA |
csn2,cas2,cas1,cas9 |
CRISPR arrays and Neighbor proteins around CP019820_1
The CRISPR arrays of CP019820_1 >merge|CP019820|1|817249-817343|CRISPRCasFinder GTTTTAGAGCTGTGCTGTTTCGAATGGTTCCAAAACTTATTCTATTGTTAAATCGTGTGTTGATGAGTTTTAGAGCTGTGCTGTTTCAAATGGTT >CP019820|1|1|817249-817343|CRISPRCasFinder GTTTTAGAGCTGTGCTGTTTCGAATGGTT CCAAAACTTATTCTATTGTTAAATCGTGTGTTGATGA GTTTTAGAGCTGTGCTGTTTCAAATGGTT
>CP019820.1|AUP12847.1|816482_817148_+|CRISPR-associated-protein-Csn2 MIKINFPILDEPLVLSNATILTVEDVSVYSSLVKHFYQYDVDEHLKLFDDKQKSLKATELMLVTDILGYDVNSAPILKLIHADLESQFNEKPEVKSMVERLAATITELIAFECLENELDLEYDEITILELIKALGVKIETQSDTIFEKCFEIIQVYHYLTKKNFLVFVNSGAYLTKDEVIKLCEYINLTQKSVLFLEPRRLYDLPQYVIDKDYFLIGENMV >CP019820.1|AUP12846.1|816154_816496_+|CRISPR-associated-endoribonuclease-Cas2 MSYRYMRMILMFDMPTETAEERKAYRKFRKFLLSEGFIMHQFSVYSKLLLNNTANNAMIGRLKVNNPKKGNITLLTVTEKQFARMVYLHGERNTSVANSDSRLVFLGDSYDQD >CP019820.1|AUP12845.1|815288_816158_+|CRISPR-associated-endonuclease-Cas1 MAGWRTVVVNTHSKLSYKNNHLIFKDSYQTEMIHLSEIDILIMETTDIVLSTMLIKRLGDENILVIFCDDKRLPTAMLMPYYARHDSSLQLSRQMSWIEDVKADVWTSIIAQKILNQSFYLGECSFFEKSQSIMNLYHDLESFDPSNREGHAARIYFNTLFGNDFSREQDNPINAGLDYGYSLILSMFAREVVKCGCMTQFGLKHANQFNQFNLASDIMEPFRPIVDRIIYENRQSDFVKMKRELFTMFSETYNYNGKEMYLSNIVSDYTKKVIKSLNSDGNGIPEFRI >CP019820.1|AUP12844.1|811174_815287_+|CRISPR-associated-endonuclease-Cas9 MNKPYSIGLDIGTNSVGWSIITDDYKVPAKKMRVLGNTDKEYIKKNLIGALLFDGGNTAADRRLKRTARRRYTRRRNRILYLQEIFAEEMSKVDDSFFHRLEDSFLVEEDKRGSKYPIFATMQEEKDYHEKFPTIYHLRKELADKKEKADLRLVYLALAHIIKFRGHFLIEDDRFDVRNTDIQKQYQAFLEIFDTSFENNHLLSQNVDVEAILTDKISKSAKKDRILAQYPNQKSTGIFAEFLKLIVGNQADFKKHFNLEDKTPLQFAKDSYDEDLENLLGQIGDEFADLFSAAKKLYDSVLLSGILTVTDLSTKAPLSASMIQRYDEHREDLKQLKQFVKASLPEKYQEIFADSSKDGYAGYIEGKTNQEAFYKYLSKLLTKQEDSEYFLEKIKNEDFLRKQRTFDNGSIPHQVHLTELKAIIRRQSEYYPFLKENQDKIEKILTFRIPYYVGPLARGNSDFAWMTRKTDDSIRPWNFEDLVDKEKSAEAFIHRMTNNDLYLPEEKVLPKHSLIYEKFTVYNELTKVRYKNEQGETYFFDSNVKQEIFDGVFKEHRKVSKKQLLDFLAKEFEEFRIVDVTGLDKENKAFNASLGTYHDLKKILDKDFLDNPDNESILEDIVQTITLFEDREMIKKRLENYKDLFTESQLKKLYRRHYTGWGRLSAKLINGIRDRESQKTILDYLISDGRANRNFMQLINDDGLSFKSIISKAQSGSHSDNLKEVVGELAGSPAIKKGILQSLKIVDELVKVMGYEPEQIVVEMARENQTTNQGRRNSRQRYKLLEDGVKNLASDLNGDILKEYPTDNQALQNERLFLYYLQNGRDMYTGEALDIDNLSQYDIDHIVPQAFIKDDSIDNRVLVSSAKNRGKSDDVPSIDIVKARKAFWKKLLDAKLISQRKYDNLTKAERGGLTPDDKAGFIQRQLVETRQITKHVARILDERFNNKVDDNNKPIRKVKIVTLKSNLVSNFRKEFGFYKIREVNNYHHAHDAYLNAVVAKAILTKYPQLEPEFVYGDYPKYNSYKTRKSATEKLFFYSNIMNFFKTKVTLADETVVVKDDIEVNNETGEIAWDKKKHFATVRKVLSYPQVNIVKKTEVQTGGFSKESILAHSNSDKLIPRKTKDIYLDPKKYGGFDSPIVAYSVLVLADIKKGKAQKLKTVKELIGITIMERERFEKNPSAFLESKGYLNIRTDKLIILPKYSLFELENGRRRLLASAGELQKGNELALPTQYMKFLYLASRYNESKGKPEEIEKKQEFVNQHVSYFDDILQLINDFSKRVILADANLEKINKLYSDNKDNTPVDELAKNIINLFTFTSLGAPAAFKFFDKSVDRKRYTSTKEVLDSTLIHQSITGLYETRIDLGKLGED >CP019820.1|AUP12843.1|810144_810711_+|Membrane-protein MKDKLLVVLTWIWIISLATLATIYIAWLIYPIEIQFLKLEKVVYLKAETIYYNFNKLMIYLTHPFISDLNMPSFPSSEDGLKHFADVKYLFTLAHGLFVILTFPVIYFLRRGWKQKSIFLYEGFFKIAIMLPIFIVVCAFLLGFDQFFTLFHEVLFPGDSTWQFNPLTDPVIWILPETFFLHCFIIFC >CP019820.1|AUP12842.1|809384_810155_+|HAD-family-hydrolase MAYKGYLIDLDGTIYKGKSRIPAGERFIEHLQEKGIPYMLVTNNTTRTPESVQEMLRGFNVETPLETIYTATLATVDYMNDMNRGKTAYVIGEEGLKKAIADAGYVEDTKNPAYVVVGLDWNVTYDKLATATLAIQNGALFIGTNPDLNIPTERGLLPGAGSLNALLEAATRIKPVFIGKPNAIIMNKALEILNIPRNQAVMVGDNYLTDIMAGINNDIDTLLVTTGFTTVEEVPDLPIQPSYVLASLDEWTFNEG >CP019820.1|AUP12841.1|808646_809384_+|Acyl-ACP-thioesterase MGLLYRETYEVPFYESDTNHYMKLPQLLALALQISAKQSLKLGIGDDIVFKRYGLVWVVTDYIIDIERLPKHAEKIVIETEAKAHNKLLCYRYFYIYGEDGQKIITISSAFVLMDFKTRKIHPVLDDITSIYQSQRIKKVIRGPKYHPIGDSKVKQYHVRYFDLDMNGHVNNSKYLEWMYDVLDLDFLSSHIPKKIDLKYIKEIQYGTDIKSHWYQDGLVTRHDIIGGDAIHAQARIEWQEKKED >CP019820.1|AUP12840.1|807512_808643_+|Coproporphyrinogen-III-oxidase MLKKPTSAYVHIPFCTQICYYCDFSKVFIKNQPVDAYLQALIREFRSYDITDLRTLYIGGGTPTSISAVQLDYLLTELSRDLNLNTLEEFTIEANPGDLTVDKIEVLQKSAVNRVSLGVQTFNDKHLKRIGRSHNEAQIYSTIDALKTAGFQNISIDLIYALPGQTMDNVRSNVAKALSLNIPHLSLYSLILEHHTVFMNKMRRGKLHLPTEDLEAEMFEYIISEMERNGFEHYEISNFTKPGFESRHNLMYWDNVEYYGVGAGASGYLDGIRYRNRGPIQHYLKGVSEGNARLSEEVLSKNEMMEEELFLGLRKKEGVSIGKFEQKFGTSFEKRYGQIVQELQSDGLLKENNGFIQMTKKGLFLGDTVAEKFIVE >CP019820.1|AUP12839.1|807039_807420_+|Pyrimidine-dimer-DNA-glycosylase MRLWHQDIIELLPRQQLLGQHRECCALRGNGWGRKHETIDYVFRYSPYRLFAYHQLVMEEMMERGYRVSKEWLVAEYRGMKCPRYDTLNPVDLETPIYPEHNQDYLQECLWNLKAKGIDLPINKIK >CP019820.1|AUP12838.1|806643_807015_+|hypothetical-protein MTKEAELLWAKHKYLVLSKSQKIYLDIRQTLKSPNCTVLDVQSLIDQAVLLEESPSQVTNAYMHIWGYFKNKAERQEKEEFLILLEKYRKTGYQRRKLLAFLKQLFAKYPNSYLQNSSIFEEE >CP019820.1|AUP12849.1|817671_817833_+|hypothetical-protein MKDYNSNLMVKGLGCSTLYLIISLTALVLLVIAGVSLSLILASLQGKQRRTYP >CP019820.1|AUP12850.1|817973_818390_+|Nucleoside-diphosphate-kinase MEQTFFMIKPDGVKRGFIGEVISRIERRGFSIDRLEVRHADADILKRHYAELTDRPFFPTLVDYMTSGPVIIGVISGEEVISTWRTMMGSTNPKDALPGTIRGDFAQAPSPNQATCNIVHGSDSPESATREIAIWFNN >CP019820.1|AUP12851.1|818525_820358_+|Elongation-factor-4 MNIEDLKKRQEKIRNFSIIAHIDHGKSTLADRILEKTETVSSREMQAQLLDSMDLERERGITIKLNAIELNYTAKDGETYIFHLIDTPGHVDFTYEVSRSLAACEGAILVVDAAQGIEAQTLANVYLALDNDLEILPVINKIDLPAADPERVRAEVEDVIGLDASEAVLASAKAGIGIEEILEQIVEKVPAPTGEVDAPLQALIFDSVYDAYRGVILQVRIVNGMVKPGDKIQMMSNGKTFDVTEVGIFTPKAVGRDFLATGDVGYIAASIKTVADTRVGDTITLANNPAIEPLHGYKQMNPMVFAGLYPIESNKYNDLREALEKLQLNDASLQFEPETSQALGFGFRCGFLGLLHMDVIQERLEREFNIDLIMTAPSVVYHVNTTDSEMLEVSNPSEFPDPTRVDSIEEPYVKAQIMVPQEFVGAVMELAQRKRGDFVTMDYIDDNRVNVIYQIPLAEIVFDFFDKLKSSTRGYASFDYEISEYRRSQLVKMDILLNGDKVDALSFIVHKEFAYERGKLIVDKLKKIIPRQQFEVPIQAAIGQKIVARSDIKALRKNVLAKCYGGDVSRKRKLLEKQKAGKKRMKAIGSVEVPQEAFLSVLSMDDDDKK >CP019820.1|AUP12852.1|823139_823799_+|Phosphohydrolase MTMVKREDVILNATENMVYHKLKNDPSGHDWFHIVRVRNLAVELAHKEGANTFICQMAALLHDIIDDKICQDSEQASYELTQWLYSQDLAIAEVEHILDILQNISFKAGTGLTMKTLEGQIVQDADRLDAMGAIGIARTMAYSGSKGRLIHDPNLKPRENLTLEEYRNGQDTAIMHFYEKLLKLKDLMNTKQGKMLAQKRHDFLELYLAEFYAEWNGKR >CP019820.1|AUP12853.1|823807_824272_+|GNAT-family-acetyltransferase MIRRAKEKDLPAIAELLQQILVLHHGVRPDIFHTRGSKFSKEQLKEMLIDESKPIFVYESDEGKVVAHLFLQLQEKRDLPRKSFKTLYIDDLCIDEEVRGQQIGQKLMDFARQYAKKHGCYNITLNVWNDNQRAVSFYEKLGFKPQQTQMEEIL >CP019820.1|AUP12854.1|824271_824706_+|Peptide-methionine-sulfoxide-reductase-MsrB MKETQEELRQRIGHTAYQVTQNSATEHAFTGKYDDFFEEGIYVDIVSGEVLFSSLDKFQSGCGWPAFSKPIENRMVTNHQDHSHGMHRIEVRSRQADSHLGHVFNDGPVDAGGLRYCINSAALDFIPYDQMAKRGYGDYLSLFD >CP019820.1|AUP12855.1|824857_827650_+|Haloacid-dehalogenase MASTNNVSDTNTRFAKEELEEVFEELGTTQGGLSDEEVAVRQKKYGLNLLSEVKQESIILLFLKNFTSLMAILLWVGGFVAIVSNSLELGLAIWMVNVINGIFSFIQEYRASQATQALKKMLPSYSRVLRKSSEEKILSEQLVPGDIVLIEEGDRISADGRLIKTTDLQVNQSALTGESNPIYKDSNVENDQSKTLIECDNMVFAGTTVSSGSATMVVTAIGMQTQFGQIADLTQGMKSEKSPLQRELDRLTKQISIISITVGIIFFLAATFFVKEPVSKSFIFALGMIVAFIPEGLLPTVTLSLAMAVQRMAKEHALVKKLSSVETLGATSVICSDKTGTLTQNEMTVNHLWQNGKSYQVTGLGYAPEGQVLFEGDNICFGNSDRGDLEKLIRFAHLCSNAQVLPPNDDRSTYTVLGDPTEACLNVLLEKSGINRQENRKFAPRLKELPFDSVRKRMTTIHSLGGDEKDKKISITKGAPKEILDLSDYVLSDGKVIPLNKEERNKIQLANDTFAKDGLRVLAVSYCDIEGFSKEQWTQENLEQHMVFIGLIAMSDPPREGVREAIDKCHAASIRIIMVTGDYGLTALSIAKNIGIIRNDDAKVISGLELSEMTDSQLKKELSGEVVFARVAPEQKYRVVTILQEMGEVVAVTGDGVNDAPALKKSDIGVAMGVTGTDVAKESADMILTDDHFASIVDAVEEGRAVYQNIKKFLTYIFNSNTPEAVPSAFFLFSKGFIPLPLTVMQILAVDLGTDMLPALGLGVESPETDVMNRPPRRLTDRLLDKGLLIKSFLWYGTIESVLAMGGFFWAHYLRYGNFTFFVANGIPYREATTMTLGAIIFSQIGMVMNSRTSYQSIKTLSIFGNKLINFGIIMEILAFLVLVYVPLFHNLFNTASLGLSHWLYLISCPFIMIGLDEVRKLFSSRKNKR >CP019820.1|AUP12856.1|827649_828693_+|hypothetical-protein MSNIITYLKNNSNLTFDELALNDVDILCLNEFGYISFEKLINTTEMKSVLVCELYHEYLQTMAKSYSFMFTSQRHDLCQLMMTSKRFKNLTLSYYQAEISLEFEKQFAAMVFTIPNIDYHQVVFRGTDANLIGWKEDFKLTYMREISAHRSAIKYLNTILPHFDKVVLSGHSKGGNLALYAAMFTKPDLKAKIDLIWLIDSPGLQKTLLPTTEYKTTKQKCIRLLPEESIVGMMLYSDIEPLIISSNARGILQHDVTTWEIQEPAILKTGTGLSLKSICFEKTFQQWMAELKSQERKLFFDLLFDSFLSSGVSSLDDFNLASRAKMMKAFHSFRELDDDKKGYLTNL >CP019820.1|AUP12857.1|828725_829295_-|Chloramphenicol-acetyltransferase MSTGASYPKYGFSVGKYTYGYQQFFYEGVNLKEIGAFCSIAQNVTITGMNHPTDHITTNPFIYYKSRGFINEDRADLIDEKKNGKVIIGNDVWIGTNVTILPSVTIGNGAIIGAGSVITKDIPDYAVVAGTPAKIIKYRFSEEEITLLNASQWWNWSDEAIKEHISEFSDKKEFFNTLKSIEENKNHKL >CP019820.1|AUP12858.1|830074_830686_+|Membrane-protein MNMKLSKRYRFWQKVIKALGVLALIATLVLVVYLYKLGILNDSNELKDLVHKYEFWGPMIFIVVQIVQIVFPVIPGGVTTVAGFLIFGPTLGFIYNYIGIIIGSVILFWLVKFYGRKFVLLFMDQKTFDKYESKLETSGYEKFFIFCMASPISPADIMVMITGLSNMSIKRFVTIIMITKPISIIGYSYLWIYGGDILKNFLN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
191509 : 199615
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >CP019820|191509:199615|DBSCAN-SWA AATGACATACGAAGTAAAATCTCTAAATGAAGAATGTGGTGTATTTGGTATCTGGGGGCATTCTCAGGCAGCTCAAGTCACTTACTTTGGGCTTCACAGTCTTCAACACCGCGGTCAAGAAGGTGCTGGTATTGTTTCGAATGATAATGGGAAACTCTATGGTTATCGAAATGTTGGTCTCCTTTCTGAAGTTTTTAAGAATCAATCTGAATTAGATAATTTAACTGGGAATGCGGCTATTGGACATGTTCGGTATGCTACTGCAGGTTCTGCAGATATTCGCAATATTCAGCCTTTTCTTTATAAATTTCATGACGGGCAATTTGCTTTATGCCATAATGGTAATTTGACAAATGCTATTTCTTTAAGGAAAGAATTAGAAAAGCAAGGTGCAATTTTCAATGCCTCCTCAGATACTGAAATTTTGATGCACTTGATTCGTCGAAGCCATAACCCAAGTTTTATGGGGAAGGTAAAAGAAGCTTTAAGCACTGTAAAGGGAGGCTTCGCCTATCTACTGATGACAGAAGATAAATTAATTGCTGCTCTTGACCCTAATGCCTTTCGTCCTTTGTCAATTGGACAAATGCAAAATGGTGCCTGGGTTATTGCCAGTGAGACCTGTGCTTTTGAGGTGGTAGGCGCAAAATGGGTTAGAGATGTTGAACCTGGCGAAGTTATTCTTATAGACGATAGTGGTGTTCAATGTGATCGTTATACTGATGAAACGCAGTTGGCAATTTGTTCGATGGAATATGTCTATTTTGCAAGGCCGGATTCGACTATACATGGTGTTAATGTTCATACGGCTCGAAAAAATATGGGAAAGCGTCTTGCACAAGAATTTAAACAGGATGCTGATATTGTAATTGGTGTCCCAAATTCGTCCTTATCGGCTGCTATGGGCTTTGCTGAAGAATCCGGATTACCAAATGAGATGGGTCTTGTAAAAAATCAGTATACGCAGCGAACCTTTATTCAACCGACACAAGAATTAAGGGAACAAGGTGTTCGTATGAAACTATCAGCGGTATCTGGTGTTGTCAAAGGAAAGCGCGTTGTTATGGTTGATGACTCAATTGTAAGAGGAACGACTTCTAGAAGGATTGTAGGATTATTAAGAGAAGCAGGAGCTAGTGAAGTACATGTTGCTATAGCTAGTCCAGAATTAAAGTATCCTTGTTTTTATGGTATTGATATTCAAACAAGACGAGAATTAATTTCAGCAAATCACGCTGTTGACGAAGTGTGTGATATTATTGGCGCAGATAGTCTAACTTATCTATCAATCGATGGGTTGATTGAATCAATTGGACTCGAAACAAAAGCACCAAATGGTGGTTTATGCGTAGCTTACTTTGATGGACATTATCCAACACCGCTTTATGATTATGAAGAAGAATACCTCAGAAGTCTAGAAGAAAAAACAAGTTTTTATATTCAAAAAGTGAAATAAGCTCTGCTAATTATATAAGGAGAAAATATGTCTGAAAAGAATGCTTATGCAAAATCTGGTGTTGATGTTGAAGCTGGTTATGAAGTGGTTGAAAGAATAAAAAAACACGTTGCTCATACAGAACGTGCGGGAGTCATGGGAGCTCTAGGTGACTTTGGTGGTATGTTTGACCTGTCACAAACAGGTGTTAAAGAACCTGTCTTGATTTCAGGTACTGACGGTGTCGGAACAAAACTTATGCTTGCTATCAAGTACGACAAGCACGACACAATCGGTCAAGACTGTGTTGCCATGTGTGTCAATGATATTATTGCAGCAGGTGCTGAGCCATTATATTTTTTAGATTATATTGCGACAGGAAAAAATAACCCAGTCAAACTTGAAGAAGTTGTTTCTGGCGTTGCAGAAGGTTGTGTTCAAGCAGGAGCAGCACTCATTGGAGGTGAAACCGCTGAAATGCCTGGGATGTATGGCGAAGATGATTATGACCTTGCTGGCTTTGCTGTTGGTGTGGCTGAAAAATCTCAGCTCATTGATGGTTCCAAAGTAAAGGAAGGCGATATTCTTTTGGGACTTGCTTCAAGTGGTATCCACTCAAACGGTTATTCGCTGGTCCGTCGTGTCTTTGCTGACTACACTGGTAAAGAGCTGCTTCCAGAGCTTGAAGGCAAACAACTCAAGGATGTCCTTCTTGAGCCAACTCGTATCTATGTTAAAGCAGCTCTGCCATTAATCAAGGAAGTACTGGTCAACGGTATCGCCCACATCACGGGTGGTGGCTTTATCGAGAATGTTCCTCGTATGTTTGCGGATGATTTGGCTGCGGAAATCGATGAGGATAAGGTGCCAGTACTTCCGATTTTCAAGGCGCTTGAAAAATATGGTGACATCAAGCACGAAGAAATGTTTGAAATCTTCAATATGGGTGTCGGTCTTATGCTAGCTGTTAGTCCTGAAAATGTTAACCGCGTCAAAGAGCTCTTGGACGAACCAGTTTATGAAATCGGTCGTATCATCAAGAAAGCAGACGATAGTGTGGTGATTAAATAAGTCACTAAATTTTATAAGAAAGGAGTGTTTAGTTAGTTTGCCTAACTGAACACGGGATTAAATTTCTAGGAAAAAAGATAAAACGACTTAGACGCAAGTGTCGTTGTTTGTTTTCCTATTTTTCTACGAAATTTTTCGGCAAGCCGAATCATCCCTTTGTATCGAATATGAAAATCGCTGTTTTTGCTTCTGCTAATGGTTCCAACTTTCAGGTCATAGCAGAGCAGTTTCCAGTTAGTTTTGTCTTTTCAGATCATCGTGATGCCTATGTTTTAGAGCGTGCTCAGAACTTAGCCATTCCAAGCTTCGCTTTTGAACTCAAAGAGTTTGAGAATAAGGCGGCTTACGAGCAAGCCATCGTTGATTTGTTGGACAAACACGAGATTGACTTGGTCTGTCTGGCGGGCTACATGAAGATTGTCGGAGAAACCTTGCTCTCAGCCTATGAAGGGCGTATCATCAATATTCACCCAGCCTACCTGCCTGAATTTCCAGGTGCCCACGGTATCGAGGATGCTTGGGAAGCTGGTGTTGACCAGTCTGGTGTGACCATCCACTGGGTTGATTCTGGTGTGGATACCGGTCAGGTCATCCAACAAGTGCGCGTGCCACGCCTAGCAGACGATAGCCTAGAAAGCTTTGAAACCCGTATCCACGAAACTGAATATCAACTCTATCCAGCTGTTTTGGATAGTTTGGGCATAAAGAGAAAATAGTAAAATTTGTTATAATAAGCTAATGAAACTAGTGAAAAATTTAGAGATAGTAGAATCTATTTTTGGTGATTGGGACGAGACCATAATCTGGTCGTGTGTCCAAGGTATTATGGGTGAAGTTTTTGTAGATAGTTTAGACCAACCAAAATCTTCTTTGGCAAAATTGGGAAGGAAATCATCTTTTGGCTTTCTAGCAGGTCAGCCTACTTTATTTCTACTAGAAGTTTGCTCTGGGGAGGATATTATCCTTGTTCCTCAGCATAAAGGATGGTCAGATTTGATTGAATCAACTTATGGCCAGAATGCCCATTCTTTTAAGCGTTATGCGACGAAAAAAGATACTTTGTTTGAGCGAAGTAGGTTAGAGAAGTTTGTTACTCAGTTGCCAAATGGTTTTGAATTACGTGCTATTGATGAGAAAGTTTACAACTCTTGTTTAGAAAAGGAATGGTCACAGGATTTAGTAGCAAATTACGCTACTTATCAGTACTATAAAAAACAAGGTATAGGTTATGTTGTATATTATCAGGGGAATATCATTGCAGGAGCTTCATCTTATTCAACCTATAAAAATGGGATTGAGATAGAAGTAGATACGCATCCAGATTTTCGTCGGCGTGGTTTAGCAACAATAGTTGCAGCTCAGTTAATACTAACTTGTTTAGATAAGGGAATTTATCCTAGCTGGGATGCTCATACAAGGACTTCATTGAATTTAGCTGAAAAACTCGGTTATGAATTTTCTCATGAATACATAGCCTATGAAATAGATTGAAGTAAGAAAAGGAGAACTCATGACTAAACGTGCTTTAATCTCAGTTTCTGAAAAGTCAGGAATTATTGACTTTGCAAAAGAATTGAAAAACTTGGGTTGGGATATTATCTCAACTGGTGGGACTAAGGTTGCCCTTGACGATGCTGGTGTTGAGACCATTGCCATCGACGATGTGACTGGTTTCCCAGAGATGATGGATGGTCGTGTTAAGACCCTCCACCCAAACATTCACGGTGGGCTTTTGGCTCGTCGCGACGCTGACAGCCACCTTCAGGCTGCTAAGGACAACAATATCGAGTTGATTGACCTCGTGGTTGTCAACCTCTATCCCTTCAAGGAGACTATCCTTCGTCCAGACGTGACCTACGATTTGGCGGTGGAAAACATCGATATCGGCGGTCCATCAATGCTTCGCTCAGCCGCTAAAAACCACGCTAGCGTAACCGTAGTGGTTGACCCAGCGGACTATGCCACTGTTTTGGGAGAATTGGCTGACGCTGGTCAGACGACATTTGAAACTCGTCAACGCTTGGCAGCTAAGGTCTTCCGTCATACAGCAGCCTACGACGCTTTGATTGCTGAGTACTTCACAGCTCAAGTGGGAGAGGCTAAGCCTGAAAAATTGACTATCACTTACGATCTTAAACAGGCTATGCGCTACGGAGAGAATCCACAACAAGACGCTGATTTCTACCAAAAAGCCTTGCCAACAGACTACTCAATCGCTTCAGCTAAACAGCTCAACGGTAAAGAATTGTCCTTCAATAATATCCGTGATGCTGATGCAGCAATCCGTATTATCCGTGATTTCAAAGACCGTCCGACAGTGGTTGCCCTCAAACACATGAACCCATGTGGTATCGGACAGGCTGATGATATTGAGACTGCTTGGGATTACGCTTATGAAGCTGACCCAGTTTCAATCTTCGGTGGAATTGTTGTCCTTAACCGAGAAGTTGACGCAGCGACAGCTGAGAAGATGCACCCTATCTTCTTGGAAATCATCATCGCACCATCTTACTCAGAAGAAGCGCTAGCTATTCTCACAAATAAAAAGAAAAACTTGCGTATTCTTGAGTTGCCGTTTGATGCCCAAGCTGCCAGCGAAGTGGAAGCTGAGTACACTGGCGTAGTTGGTGGACTTTTGGTGCAAAACCAAGACGTTGTGGCTGAAAATCCATCGGACTGGCAAGTGGTGACAGACCGCCAGCCAACAGAACAAGAGGCGACTGCCCTTGAGTTTGCCTGGAAGGCTATCAAGTATGTTAAGTCTAACGGGATTATTATTACTAACGATCACATGACGCTTGGACTCGGTGCAGGTCAAACCAACCGTGTCGGCTCAGTCAAGATTGCTATCGAGCAGGCTAAGGACCACCTTGACGGTGCCGTTCTAGCATCAGATGCCTTCTTCCCATTTGCGGACAACATTGAAGAAATCGCTGCCGCAGGCATCAAGGCAATCATCCAGCCAGGCGGCTCAGTCCGTGACCAAGAATCTATTGACGCTGCAAACAAACACGGCTTGACTATGATCTTCACAGGCGTGAGACATTTTAGACATTAAAAAATAGTAGTTTAGGTTTTCTTAAGTTAACTCAGGTATACTACGTATATCCTAAAAACTTTTCTTTTTATTAAACCTCCTAAGTACTCATCAAGGTGAGTACTTTTTTTGATATTTTGATTTAAATTTTCGAATAAGTTAATTGCAAGTGTTTGGGCACTTCATTATATTAATTCTATTTGGAGGTTTTTCTTGAATAAATGGTTAGTTAAGGCAAGTTCCTTAGTTGTTTTAGGTGGTATGGTTTTATCTGCGGGTTCCCGAGTTTTAGCGGATACTTATGTCCGTCCAATTGATAATGGTAGAATTACAACAGGTTTCAATGGTTATCCTGGACATTGTGGGGTGGATTATGCTGTTCCGACTGGAACGATTATTGGGGCAGTGGCAGATGGTACTGTGAAATTTGCAGGAGCTGGAGCCAACTTTTCTTGGATGACAGACTTAGCAGGAAATTGTGTCATGATTCAACATGCGGATGGAATGCATAGTGGTTACGCTCATATGTCACGTGTGGTGGCTAGGACTGGGGAAAAAGTCAAACAAGGAGATATCATCGGTTACGTAGGAGCGACTGGTATGGCGACGGGACCTCACCTTCATTTTGAATTTTTACCAGCTAACCCTAATTTTCAAAATGGTTTCCATGGACGTATCAATCCAACGTCACTAATTGCTAACGTTGTGACCTTTAGTGGAAAAACGCAAGCATCAGCTCCAAGCATTAAGCCATTACAATCAACTCCTGTACAGAATCAATCTAGTCGATTAAAAGTGTATCGAGTAGATGAATTACAAAAGGTTAATGGTGTTTGGTTAGTCAAAAATAACACCCTAACGCCGACTGGGTTTGATTGGAACGATAATGGTATACCAGCATCAGAAATTGATGAGGTTGATGCTAATGGTAATTTGACAGCTGACCAGGTTCTTCAAAAAGGTGGTTACTTTATCTTTAATCCTAAAACTCTTAAGACTGTAGAAAAACCCATCCAAGGAACAGCTGGTTTAACTTGGGCTAAGACACGCTTTGCTAATGGTAGTTCAGTTTGGCTTCGCGTTGACAACAGTCAAGAACTGCTTTATAAATAGTTTGAGGTATTGATTCATTGTTTTAAATGACAGTTTTGTTACTAACTAAGAACAATTTCTTTAAACCGTCTGAAAATAATTTTATAGTCCAGTAAAGTGTGATATTATAGTCTCGGACTAATAAAAAGGAAATAGGAATTGAAGCAATGAAAATGAATAAAAAGGTACTATTGACATCGACAATGGCAGCTTCGCTATTATCAGTCGCAAGTGTTCAAGCACAAGAAACAGATACGACGTGGACAGCACGTACTGTTTCAGAGGTAAAGGCTGATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAAATATGGTGATACACTAAGCGTTATTTCAGAAGCAATGTCAATTGATATGAATGTCTTAGCAAAAATTAATAACATTGCAGATATCAATCTTATTTATCCTGAGACAACACTGACAGTAACTTACGATCAGAAGAGTCACACTGCCACTTCAATGAAAATAGAAACACCAGCAACAAATGCTGCTGGTCAAACAACAGCTACTGTGGATTTGAAAACCAATCAAGTTTCTGTTGCAGACCAAAAAGTTTCTCTCAATACAATTTTGGAAGGTATGACACCAGAAGCAGCAACAACGATTGTTTCGCCAATGAAGACATATTCTTCTGCGCCAGCTTTGAAATCAAAAGAAGTATTAGCACAAGAGCAAGCTGTTAGTCAAGCCGCAGCTAATGAACAGGTATCACCAGCTCCTGTGAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAGAGGAAGTTAAACCAACTCAGACGTCAGTCAGTCAGTCAACAACAGTATCACCAGCTTCTGTTGCCACTGAAACACCAGCTCTAGTAGCTAAAGTAGCACCGGTAAGAACTGTAGCAGCCCCTAGAGTGACAAGTGCTAAAGTAGTCACTCCTAAAGTAGAAACTGGTGCATCACCAGAGCATATATCAGCTCCAGCAGTTCCTGTGACTACGACTTCAACAGCTACAGACAATAAGTTACAAGCGACTGAAGTTAAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCGGTAGCACAACCAGCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCAGGGCTCCAACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGAGTTAATGAATTCAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAAAGGTTTAGCAGTTGACTTTATTGTAGGTACCAATCAAGCACTTGGTAATGAAGTTGCACAGTACTCTACACAAAATATGGCAGCAAATAACATTTCATATGTTATCTGGCAACAAAAGTTTTACTCAAATACAAATAGTATTTATGGACCTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTACTGCCAACCACTATGACCACGTTCACGTATCATTTAACAAATAA
Protein sequences of DBSCAN-SWA_1 >CP019820|191509:199615|191509_192964_+|AUP12306.1|DBSCAN-SWA MTYEVKSLNEECGVFGIWGHSQAAQVTYFGLHSLQHRGQEGAGIVSNDNGKLYGYRNVGLLSEVFKNQSELDNLTGNAAIGHVRYATAGSADIRNIQPFLYKFHDGQFALCHNGNLTNAISLRKELEKQGAIFNASSDTEILMHLIRRSHNPSFMGKVKEALSTVKGGFAYLLMTEDKLIAALDPNAFRPLSIGQMQNGAWVIASETCAFEVVGAKWVRDVEPGEVILIDDSGVQCDRYTDETQLAICSMEYVYFARPDSTIHGVNVHTARKNMGKRLAQEFKQDADIVIGVPNSSLSAAMGFAEESGLPNEMGLVKNQYTQRTFIQPTQELREQGVRMKLSAVSGVVKGKRVVMVDDSIVRGTTSRRIVGLLREAGASEVHVAIASPELKYPCFYGIDIQTRRELISANHAVDEVCDIIGADSLTYLSIDGLIESIGLETKAPNGGLCVAYFDGHYPTPLYDYEEEYLRSLEEKTSFYIQKVK >CP019820|191509:199615|194181_194730_+|AUP12308.1|DBSCAN-SWA MKIAVFASANGSNFQVIAEQFPVSFVFSDHRDAYVLERAQNLAIPSFAFELKEFENKAAYEQAIVDLLDKHEIDLVCLAGYMKIVGETLLSAYEGRIINIHPAYLPEFPGAHGIEDAWEAGVDQSGVTIHWVDSGVDTGQVIQQVRVPRLADDSLESFETRIHETEYQLYPAVLDSLGIKRK >CP019820|191509:199615|192991_194014_+|AUP12307.1|DBSCAN-SWA MSEKNAYAKSGVDVEAGYEVVERIKKHVAHTERAGVMGALGDFGGMFDLSQTGVKEPVLISGTDGVGTKLMLAIKYDKHDTIGQDCVAMCVNDIIAAGAEPLYFLDYIATGKNNPVKLEEVVSGVAEGCVQAGAALIGGETAEMPGMYGEDDYDLAGFAVGVAEKSQLIDGSKVKEGDILLGLASSGIHSNGYSLVRRVFADYTGKELLPELEGKQLKDVLLEPTRIYVKAALPLIKEVLVNGIAHITGGGFIENVPRMFADDLAAEIDEDKVPVLPIFKALEKYGDIKHEEMFEIFNMGVGLMLAVSPENVNRVKELLDEPVYEIGRIIKKADDSVVIK >CP019820|191509:199615|195524_197072_+|AUP12310.1|DBSCAN-SWA MTKRALISVSEKSGIIDFAKELKNLGWDIISTGGTKVALDDAGVETIAIDDVTGFPEMMDGRVKTLHPNIHGGLLARRDADSHLQAAKDNNIELIDLVVVNLYPFKETILRPDVTYDLAVENIDIGGPSMLRSAAKNHASVTVVVDPADYATVLGELADAGQTTFETRQRLAAKVFRHTAAYDALIAEYFTAQVGEAKPEKLTITYDLKQAMRYGENPQQDADFYQKALPTDYSIASAKQLNGKELSFNNIRDADAAIRIIRDFKDRPTVVALKHMNPCGIGQADDIETAWDYAYEADPVSIFGGIVVLNREVDAATAEKMHPIFLEIIIAPSYSEEALAILTNKKKNLRILELPFDAQAASEVEAEYTGVVGGLLVQNQDVVAENPSDWQVVTDRQPTEQEATALEFAWKAIKYVKSNGIIITNDHMTLGLGAGQTNRVGSVKIAIEQAKDHLDGAVLASDAFFPFADNIEEIAAAGIKAIIQPGGSVRDQESIDAANKHGLTMIFTGVRHFRH >CP019820|191509:199615|198310_199615_+|AUP12312.1|DBSCAN-SWA MKMNKKVLLTSTMAASLLSVASVQAQETDTTWTARTVSEVKADLVKQDNKSSYTVKYGDTLSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSHTATSMKIETPATNAAGQTTATVDLKTNQVSVADQKVSLNTILEGMTPEAATTIVSPMKTYSSAPALKSKEVLAQEQAVSQAAANEQVSPAPVKSITSEVPAAKEEVKPTQTSVSQSTTVSPASVATETPALVAKVAPVRTVAAPRVTSAKVVTPKVETGASPEHISAPAVPVTTTSTATDNKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGLQPHVAAYKEKVASTYGVNEFSTYRAGDPGDHGKGLAVDFIVGTNQALGNEVAQYSTQNMAANNISYVIWQQKFYSNTNSIYGPANTWNAMPDRGGVTANHYDHVHVSFNK >CP019820|191509:199615|197264_198164_+|AUP12311.1|DBSCAN-SWA MNKWLVKASSLVVLGGMVLSAGSRVLADTYVRPIDNGRITTGFNGYPGHCGVDYAVPTGTIIGAVADGTVKFAGAGANFSWMTDLAGNCVMIQHADGMHSGYAHMSRVVARTGEKVKQGDIIGYVGATGMATGPHLHFEFLPANPNFQNGFHGRINPTSLIANVVTFSGKTQASAPSIKPLQSTPVQNQSSRLKVYRVDELQKVNGVWLVKNNTLTPTGFDWNDNGIPASEIDEVDANGNLTADQVLQKGGYFIFNPKTLKTVEKPIQGTAGLTWAKTRFANGSSVWLRVDNSQELLYK >CP019820|191509:199615|194752_195505_+|AUP12309.1|DBSCAN-SWA MKLVKNLEIVESIFGDWDETIIWSCVQGIMGEVFVDSLDQPKSSLAKLGRKSSFGFLAGQPTLFLLEVCSGEDIILVPQHKGWSDLIESTYGQNAHSFKRYATKKDTLFERSRLEKFVTQLPNGFELRAIDEKVYNSCLEKEWSQDLVANYATYQYYKKQGIGYVVYYQGNIIAGASSYSTYKNGIEIEVDTHPDFRRRGLATIVAAQLILTCLDKGIYPSWDAHTRTSLNLAEKLGYEFSHEYIAYEID |
7 | Synechococcus_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
944263 : 954115
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >CP019820|944263:954115|DBSCAN-SWA AATGACTTACACAGAAAATTTTCAAAAATGGTTAGATTTTGAGCAGCTTCCTGACTATCTTCGTCAAGAATTACTATCAATGGATGAAAAAACAAAAGAAGATGCTTTTTACACAAACTTAGAATTTGGTACTGCTGGTATGCGTGGTTATATTGGTGCTGGTACAAATCGTATTAATATTTATGTTGTCCGTCAAGCAACCGAAGGATTGGCAAAATTAATCGAAACTAAGGGAGAGGACGCTAAAAAACGTGGTGTAGCCATTGCTTATGATTCACGCCACTTCTCTCCAGAATTTGCTTTTGAGTCTGCACAGGTCTTGGCACAGCATGGAATTAAATCTTACGTATTTGAAGCTCTTCGTCCAACACCAGAACTCTCTTTTGCTGTTCGCCATTTAAATGCCTATGCTGGTATTATGGTTACTGCAAGCCACAATCCAGCACCTTTCAATGGTTATAAAGTCTATGGACAAGACGGAGGTCAACTACCACCAGCTGATGCTGATGCACTAACAGACTTTATCCGTGCTATTGAAAATCCATTTGCAGTTGAACTTGCTGATTTAGATGAAAGCAAATCAGCGGGTCTTATTCAAGTTATCGGTGAAGATGTTGATATTGAATATCTTAGAGAGGTTAAAGATGTTAATATCAATCAAGATTTAATCAATAACTTTGGAAAAGACATGAAAATTGTCTATACTCCTCTCCACGGAACTGGTGAGATGTTGACACGCCGTGCCCTTGCTCAAGTCGGTTTTGAATCTGTTGTTGTAGTAGAATCACAAGCTAAGGCAGATCCAGACTTTTCTACTGTCAAATCTCCTAACCCTGAAAGCCAAGCTGCCTTTGCTCTTGCTGAAGAACTCGGACGAGAAGTTGATGCAGATGTCTTAGTAGCTACTGATCCTGATGCAGACCGCCTAGGCGTTGAAATTCGCCAACCAGATGGTTCTTATAAAAACCTTTCTGGAAATCAAATTGGAGCGATTATTGCGAAATACATCCTGGAAGCTCATAAAACAGCAGGAACACTTCCAGAAAATGCTGCTCTCGCTAAATCAATCGTATCAACAGAATTAGTAACAAAAATTGCCGAAAGTTATGGCGCTACAATGTTTAACGTTTTAACTGGATTCAAATTCATCGCTGAGAAAATTCAAGAGTTTGAAGAAAAACATAACCACACCTATATGTTTGGTTTTGAGGAAAGCTTCGGATACCTTATTAAACCATTTGTCCGTGATAAAGACGCTATTCAAGCAGTTCTTTTGGTTGCTGAGATCGCAGCTTATTACCGTTCGCGTGGATTAACACTTGCAGATGGTATTGATGAAATTTACAAAGAATATGGTTTTTTTGCTGAAAAAACGATTTCAGTAACACTTTCAGGTGTAGATGGAGCTGCTGAAATTAAGAAGATTATGGACAAATTCCGTGAAAATGGTCCAAAACAATTTAACAATACTGATATTGTATTATTAGAAGATTTCCAAAAACAAACCGCTACTAAAAATGATGGAACAATATCTAACTTAACAACTCCTCCAAGTAATGTTTTGAAGTACACATTAGCTGATGATTCATGGATTGCAGTTCGCCCTTCAGGAACTGAACCAAAAATCAAGTTCTATATTGCCACGGTCGGTAATGATTTAGCAGATGCAGAAACAAAAATCGCCAATATTGAAAAAGAGATTACAACATTTGTAAATTAATAAAAAAAGCTAGGAAGGCACTGCACCCCATTAGTGGGACAGAAGAAAAACACTCTTATGAAGCCAATTTCCTGAATTGAACAGGAGATTGGTTTTTTAAATGACGTTGAATTCTAGTTTCATTATAAAATGTAATGTAATTTTTAACAATATTTGTTATACTATCTTTGTTGTATTTTCTCCTATCATGGAGATAAAAGGTTTCAGTCTTTAGGACGGAGTGAAACCATTCAATACAGGCGTTATCTGCAGGTGTTCCTTTTCGGGACATTGAGCGGATAATGCCTTTTTCCGTGCAAGCTTGATAGTAAGCCTTAGAAGTATACACTGAGCCTTGATCGCTGTGTAAGACTGCCCCTTTAGGTAATTTTAACTGATTAAGGGTGTCTATTACAAAATCTGTGTCCTGACAATCTGAGATAGTATAAGCTAAAATCTCTCGGTTATAGAGGTCCATAATTGAAGAGAGATACAATTTACAGTTACCGAAATATAGATAAGTAATATCTGTTACAAGCTTTTCCAATGGCTTATCGGCATGGAAATCCCGATTCAATTTGTTATCTGTTAAATAATAAGTTTTACCAAGATTGGGCGATTTCTTTGGACGTGTCCGACAAAGCCAACCATTGTCTTTCATGATACGATAGACTTTCTTTGCATTAACAGTCAATTCGTGGATCTTTTTGAGCAATCGTGTAATGGTACGATATCCATAAATAAAGTGATTCTCCATGCAGAGCTGTTCAATTAATTCAATGACTTCATCTGTTTCTTGTGGTTTCTCGTACTTCTTTTTCCAACGATAATAGGTCGATCGCTTAACATCAAAACAGTCTAGAATGACAGAAATCGGGTAGTTGTTTTTATAGTCTTCCACAAGCTTGATAAGACTTACTTTATCGATTTCCTTATCAAGCCTCGATACTTTTTTAAGAGGTCAACCTGTAATTGTAACTGTTCCACTTCAGACAGATGTTCCAAGCCTTTACCATAGGTATATTGCTTGCCAACACCTTGATGGAAACGATAAAGTTCCTCATTTTCGTGCCATTTTACCCAAGTATAGATTTGACTATCATTCTTGATACCTAGAGTCTCCATAATAAATCTGTTAGACTTGCCTGCTTTTTTCATCTCGATGCAGGCCAACTTCGTTTCCCATGAATATGCTTTTTTAACCATAATAAAACACTCCTGATTCTATTTTACTAGAATTCTCCAGGAGTGTTTTTCTTGTGTCTCACTTTAGGGAGACAGTGCCGAACTTACTCCTAGCTTTTTTTATATCTATCTAACGATGTTCTATTATTTTCAATCATGAAATATAACTGCAATTAACTTCACGATCAAATAATAGAGCAGACTTACAATTAACCACATTATCCCAATAACTGCAACTAAACCTATTAAAACAGATAATACCGTATTCTTAGTTGCTAGTTGGTTACTGATAAACCATGAAACTGCAAAAATAAATATCAGTAATAATAGTTGAAGCCTTTTTTTCATATAATTCCTCTTACTACTTTTGTGCATTTTGCATTTGATAATAAATACCTTTTTGAGCCATTAATTCAGAGTGGTTACCCACTTCTACAATTTCACCAGATACCATAACTAAAATAATATCTGCTGTTTGAATGGTAGATAAGCGATGTGCAATAATAAAGCTTGTTCTCCCCTTCATCAACATTTGGAATGCTTCTTGAAATAGACGATGTCGCCTCATCTAATATCAATATTCTAGGTAATTTAAGAAAAATACGAGCAATTGTCAATAGCTGACATTGCCCCTGTGATAACGAATCTCCAGCATCTTCTAAATACGTATCATATCCATTCGGTAATTGTTTGATAAAGAAATCTGCATTAGCTGCTTTTGCAGCCTCTATCACTTCTTCACGGCTAGCTTTAGGATTGGCATATGCAATGTTATCGTGAATCGTAGCACTTTTTAACCACGTTTCTTGTAATACCATTCCAATTTCTTGCCTTAATTGTGATGGCTCATAATCAGTAATAGGCTTACCATCTAAAAGGATATTTCCCCCGTCAACTTCATAGAAACGCATTAATAAATTGATTAAAGTAGACTTCCCAGCACCTGTTGGTCCTACAATAGCGACCTTAGCTCCTGCTGGAATGTGTAAATTAATACCATTCAATAGTGGTTTTGATTTATTATAACCAAAAACAATGTTTTTAAAATCGATTTGACCTTTGACCGTTGATGAATCAAGTTTTTCTGTACCTGTTATATTTGGTGACGATTCTTCTAAAATAGAGTAAAGGCGTTCTGCACAAGCCAGAGTACTTTGCATCTCAGACAGGACGGAAGAGATGTCATTAAATGGCTTAGTATATTGATTGACATAATTTAAGAAAGTGATTAATTGACCAACACTAAAAGCCCCTGACATAATACGAAGGGCACCAATCCCTGCTAAGAAGCCATAAATCAAACTATTGATAATTGCTCCGTATCGGTAGTCACACGACTAATCAAGTCACCTATGCCACGTTTATCAAGGTAAGCTATAGGCAATAGATTCAACTTTTCCATTACAACCTTTCTTAAAGAAGCAACATAATGAAAAATTAAGCGGTTATAGAGCAGAGGATTAATCCATTGAATAATAGTATTTGCTAAAATAACTGCAATCATCTTCCACATTATAGGTAACAATAATATCATAGAATGAGGCGATAATACAACGTCTACCGCTTGTCCAATTAGAACAGGCAAATAAACAGTGAGGCAAACTTGTACAACCGTCCCTAATAATGCCATTCCTACTAAGCTTTTTTTAGAAAGAAGATCTTGAACAAGCTTTTTTTGTATCTTTTTAGGATGACTTGCTTTCATTTACTCCTCCTCCTTAAAATTTTGTGAATGGTAAATGGACTTATAAACTTTGTTATGAGCTAATAAAGATTGATGATTATCAAAACCAACTTGTTTCCCCTTATCAAGGAGTAAGATTCTATCTGCATTTTGTATACTATTAATTCTCTGTGATACAATAATAAGATTAGTTTGGTTGAAATGTTTAGTTATAGCTTTAAATAAACGAGCTTCTGTTAAATAATCCAATGCAGATGTTGCATCGTCTAAAATCAAAAATGGTATCTTATCTTGAACTAAAGCTCTTGCAATCGTCAACCTTTGCCTTTGACCACCAGAGAAATTCCTACCAAAACTCTCTACAGAGGCATCAAGTTGACCATCTTTTTCTTTTACAAAATCACTAGCTTGTGCTATTTCTAAAGCAGTCCAAAGTTTTTCCTCACTAACTTTACCAAGTCCCAAAGAAAGGTTAGAACGAATAGTTCCTTTAAACAACTGAGCATTTTGAGGAACAACTCTTACCAGGGTACGCCAATTTGAAATTGTATCTGGACTTTTTCCCTGATGATATATATCAATATCCCCTTCTTGCACTTTATAAATATGAAGCAGTAAATTAACCAAGGTTGATTTCCCAGAGCCAGTTCCACCAATTATCCCTAAAGTTTCTCCTACATTCATAGAAAAAGTAATATCAGATAAAGCTTTTTCAGAGGAGTTTGGATAAGAAAATGCTATTTCTTGCACTTCTAAAGCCTTATTCGAATATTTTGGCTCAAGTTTGTCATCAATTATTTCAGACGGTCTTTCAAAAACGGCTATAATTCGCTTAGCACTGATATAACTTTGGTTCAGTGATGTCACCAACATTGTCATTTTTAACAATTCAACAAGAATTTGCAATAAGTAATTAATTAAAGCAACCAACATTCCTTGTGATAAAAGATGATTAGCTATATTTAAATTACCACGCCAAATAATCACAACCAAAGTGATATTAACAACTAGAAATGTTAGAGGCGTTACTAAACTAGAAAGCCTACCTGCTTTTAATTGTAAATTCGTATAATGATAATTGATATCATTAAATGCTTCACTCTCTCTATCTACTTGATTAAAGGCACGGATAACTCGTACACCTTGAAGTTGTTGCCTAGTCAACTTTACCAAATAATCGGTTGAAGTTCTGATTTTAAGGTAAATAGGATTTAATAGTCGAGACATTACAAAAACAATGATAAATAACGTGACAACCATTACCAAGAACCAAATAGTCAATGAGGGGCTAATGGAAAAAGCCATAATTATGGCACCAAAAACAATAATCGGAGCCCTCAAAAATAAACGTAAAAATTGATTTAAACCAGTTTGGATTTGAAATGTATCAGCAGTCAAACGAGTAATCAAACTAGCAGTTCCCAATTCATCTCTGTCTTTTTTACCCAGTGACATGACTTTTTGATAGAGATCCTCTGTCAATTGTCTCGTATAACCAACTGCAGCTTTTGAAGAATAATATTGAGCAGTTATCGCTACTACAACACCCACCGCAGCCAAAAAGAAAATCAATCCAATTTGCAACAGTAAACTACTTCTATCCCCTCGTGGAATGGTCTCGTCAATCATTTTTGCAATAACGATTGGTACCAAAAGTTCAAAAGAGGCTTCTAATAATTTGAAAAGGGGTCCAAAGATAGTTTCTTTGATATACCCCTTAAAATAATAAGTTAGTCTTTTCATACTTACCCTTCTTAAAACAACTCCATTATTTTTATCAAATAAAGGTTGAATTGAACTTCACGTGAGTAGTAAATATTACCACCATTTTTATAGAGCTTCCCTCCTGAAATTAAGGCGAGAGGATGATAGTAAAAGTAAGTGTCCCCGTTATAATTTCCTAGGCTGGGAGCTACAACATTTTTAGAGTAATTTTTGGCCAACTCAATGGAATTTTCACCCCCATGATCCGCTACATAATCAATATAAGAAGAACCAAAATTATATGCTTGGACAGCAGTCCATACATCAACCTTAGCTTTTTTAGCTTGACTTATATTTTGTGACAACAGAGTGACGCCATGTTTAATACTGGTGTGACTATCCGTAATACTGTTCGTAGTTCCACTGATACTTTCACTTGATTGCATCACATCTATAGCATCTCCCTTAGTTTCAGTATAAATCATAGATAATACTAAGTGCACATTAGCCTCTGAACCATTCTCTGCAAGAGTATTCTGCACTAAATCATGATATTGAAGCACTTTTTTAACATTTTCATGGATGATAACCAGACGGTACCCAATGAAAATAATAATAATTAATGCTATCAAACGTTTTTAAAAATTTAAACATATTATTTATTTTGAATATCCTGTATGTTTTTGATTAGTATTGAGTATGTACCATCAGGGTTTTGGATAAATTCAACTGATTCGGCATCTTGGTAGACATTGTTGGGTACAATCAATTCAATACCATTTGAAAGAGATAGCTTCTAATTCTCTAACTTCTTAATTTGACGGGAATGATCAATATCACTTACTTGAACAGGTCCAGGTATTGCGTCTTTCAATTCATCAACAAAAGTCAGCCTGGCTGTTAAATTATCATCAAATAATTGATCTGCTAATTTTTCTGGAGACAATTCTTGCTCTTCTTCTAAATTCTTATAAATAGCCGATTTCATTTTTGATTGGAAAGAAAAATCATCTTTGTTGAAATTTTCAGCAATTTTTTGAGCTGTCTGTTCAACCATTTTGATAGATTTTTTAACAGACTGTTCTGGTTCTACTTGTAATAAATTTTCAGAAAAATAATTAGCAAATGAACCATTGTGTTTGATACGCTTTTCAATTAAATAGTATTGCTTTGATGACTTGTTAACAACCAAAGCTTCATCTGGAGTTTGAGCAGCACTTGGAAGGTTATTCTGTGTTATTGTAATTGGCTGCTCTTGATTTTCAGAAACATGAGCAAATTGTTCCTTTAATGAGATTCGAAGGAAAGCAAAATGTTCCATTCCATCCTTGTCAAATTGAATAAAAACTAAGTCATTCGTTTTTTGATCTTCCGATATGACAAACTCTTCTTTCCAAAGTTGCGCAATTTGACAGGAAGAAACATATAAATCATCTTGTAAATGACTCATAAATACATTATCCTCTCCAAAATAGCCACGCTTAGCTTCATCAGAAAAAACTTTACTTAATTTTTTACGAAAGTAGTCATCAATCCTTGGAGTTAGGGTTAACGGAGTATCTGATAGCACTAACTCTGTGTCGTTAGGAGAAAACTGATGTATAATAATCTGTTTGATATAAAAATCCATCATAACATTAATTCTCATACAAGGGGAAAGCGTCCGTTAATGATTTAATTTCTTGACGAACTTCTGTGAGGACATCTTGATTTTCATGATTTTTGAGTGCCTTAATCATTAATTCAGCGATTCTTCGAGATTCTTCAACTCCCATTCCTCGACTAGTAATCGCTGGAGTACCAATTCGAATACCTGATGTTTTAAATGGTGATAGTCGCTCAAACGGTATAGAGTTCTTGTTAAGGGTGATATTGACTTCTTCAAGAACATTTTGTGCCTTTTTGCCATTCTCAATAACTTTTGTGACGTCTACTAAGAACAAATGATTATCAGTACCATCAGAAATCAAATGAAAGTCATCATCTTCTTTAAAAACTTTAGCCATGGCTTGAGCATTTTTAATAATATCCTCACCGTATATTTTAAAGGAAGGATCTAGGGCTTCTTTCAAAGCTACAGCTTTTGCAGCAATTACATGTTCTAATGGTCCACCTTGGAGTCCTGGAAAGACTGCAGAATTAATTTTTTAGCAATTGCTTCATCATTGGTTAAAATCAAACCACCTCTAGGTCCACGTAGAGTCTTATGGGTTGTCGTTGTCGTTACATGAGCATAAGAAATAGGACTAGGGTGATGACCAGAAGCAACTAAACCTGCAATGTGAGCCATATCAACCATTAAGTAAGCATCTACTGCGTCTGCTATTTGACGAAATTTTTCAAAATCAATAATGCGAGAATAGGCCGACGCCCCTGCAACAATTAATTTAGGTTGCGTTTCCTGTGCTATTTTCAAAATGTTATCATAGTCTAGCATCTCCGTCTTAGGATCAACAGAGTAAGAAACAAAATGATAAGTTTTTCCTGAGAAGCTAACTGAAGCGCCATGTGTTAAGTGCCCACCTGCTGCTAAGTCCATCCCTAAGACAGTATCTCCTGGCTCGATTAAAGCCATGTAAGCTGCTGCATTAGCCTGACTACCAGAATGTGGTTGAACATTAGCAAACTCAGCATTAAATAACGTCTTAGCTCGTTCTATAGCTAAACTTTCAACTACATCAACACAATCTGTTCCTCCATAATAACGATGACTAGGATACCCTTCGGCATATTTATTTGTCAAAACAGAACCTTGTGCTGCCATAACAGCTTTTGAAACAACGTTCTCTGATGCAATTAATTCAATATTATTTTGTTGGCGAATTTCCTCATCATGAATAGCCTGCCAAAGTTCTTGGTCAAATTCTTTAAAATTGTCTTTATCAAAAATCATTTTTTACTCCTTAAGCTCGTTATAACTTTTAAATAATGGTTTCAATCATTATATTTATCACATTTTTACTATTAGTTGCAAGATGATTAAATTAATTTTCAAAAATTAATTCAGATATCGTAGCCGTTAGTACCTCTTGCGTGATTGCACCTTGCCTTAAAATCTTAACTCTATCACCAGACAAATCAATAATAGTAGAATCCACACCTGTCAATGCTTTATCATCTTCAATACCTAAAACTTGATGATTAAACTGTTTTTGAATTTCTGAGAATACACGACCACTATCACATCCAGAAATATTAGCAGAAGGACCAATCAATGGACCATGGTTAGCAATCATATCAAGGGTTACAGGGTGCTTAGGCATCCGAAATCCTACGCTTGATAACCCAGAATTGATCCAATGCGGAACTTCTTGTGAAGCTTCCAAAATAATGGTTAGCGGTCCTGGTAAAAAGGCATCGTACAATTGCTTCAAATAGGTCGGTTGATTTTTAGAATATTTTAAAACAGTCTCAAAATCACATATATTTAAGTTCATAGCCTTATCACGAGGCCTTTTTTTAAGCTCATAGACGTGGTTCACAGCTTCTTCACTCAAAGCTTTGGCAAAGATTCCGTAGACTGTTTCTGTTGGCATAATAACTGCGCCATGATCCTCTAAAATCTGTCCCAAATCATTCAT
Protein sequences of DBSCAN-SWA_2 >CP019820|944263:954115|947296_947494_-|AUP12954.1|DBSCAN-SWA MKKRLQLLLLIFIFAVSWFISNQLATKNTVLSVLIGLVAVIGIMWLIVSLLYYLIVKLIAVIFHD >CP019820|944263:954115|951330_952167_-|AUP12957.1|DBSCAN-SWA MMDFYIKQIIIHQFSPNDTELVLSDTPLTLTPRIDDYFRKKLSKVFSDEAKRGYFGEDNVFMSHLQDDLYVSSCQIAQLWKEEFVISEDQKTNDLVFIQFDKDGMEHFAFLRISLKEQFAHVSENQEQPITITQNNLPSAAQTPDEALVVNKSSKQYYLIEKRIKHNGSFANYFSENLLQVEPEQSVKKSIKMVEQTAQKIAENFNKDDFSFQSKMKSAIYKNLEEEQELSPEKLADQLFDDNLTARLTFVDELKDAIPGPVQVSDIDHSRQIKKLEN >CP019820|944263:954115|953518_954115_-|AUP12958.1|tRNA|DBSCAN-SWA MNDLGQILEDHGAVIMPTETVYGIFAKALSEEAVNHVYELKKRPRDKAMNLNICDFETVLKYSKNQPTYLKQLYDAFLPGPLTIILEASQEVPHWINSGLSSVGFRMPKHPVTLDMIANHGPLIGPSANISGCDSGRVFSEIQKQFNHQVLGIEDDKALTGVDSTIIDLSGDRVKILRQGAITQEVLTATISELIFEN >CP019820|944263:954115|950584_951166_-|AUP12956.1|DBSCAN-SWA MIALIIIIFIGYRLVIIHENVKKVLQYHDLVQNTLAENGSEANVHLVLSMIYTETKGDAIDVMQSSESISGTTNSITDSHTSIKHGVTLLSQNISQAKKAKVDVWTAVQAYNFGSSYIDYVADHGGENSIELAKNYSKNVVAPSLGNYNGDTYFYYHPLALISGGKLYKNGGNIYYSREVQFNLYLIKIMELF >CP019820|944263:954115|944263_945982_+|AUP12951.1|DBSCAN-SWA MTYTENFQKWLDFEQLPDYLRQELLSMDEKTKEDAFYTNLEFGTAGMRGYIGAGTNRINIYVVRQATEGLAKLIETKGEDAKKRGVAIAYDSRHFSPEFAFESAQVLAQHGIKSYVFEALRPTPELSFAVRHLNAYAGIMVTASHNPAPFNGYKVYGQDGGQLPPADADALTDFIRAIENPFAVELADLDESKSAGLIQVIGEDVDIEYLREVKDVNINQDLINNFGKDMKIVYTPLHGTGEMLTRRALAQVGFESVVVVESQAKADPDFSTVKSPNPESQAAFALAEELGREVDADVLVATDPDADRLGVEIRQPDGSYKNLSGNQIGAIIAKYILEAHKTAGTLPENAALAKSIVSTELVTKIAESYGATMFNVLTGFKFIAEKIQEFEEKHNHTYMFGFEESFGYLIKPFVRDKDAIQAVLLVAEIAAYYRSRGLTLADGIDEIYKEYGFFAEKTISVTLSGVDGAAEIKKIMDKFRENGPKQFNNTDIVLLEDFQKQTATKNDGTISNLTTPPSNVLKYTLADDSWIAVRPSGTEPKIKFYIATVGNDLADAETKIANIEKEITTFVN >CP019820|944263:954115|946037_946862_-|AUP12952.1|DBSCAN-SWA MEDYKNNYPISVILDCFDVKRSTYYRWKKKYEKPQETDEVIELIEQLCMENHFIYGYRTITRLLKKIHELTVNAKKVYRIMKDNGWLCRTRPKKSPNLGKTYYLTDNKLNRDFHADKPLEKLVTDITYLYFGNCKLYLSSIMDLYNREILAYTISDCQDTDFVIDTLNQLKLPKGAVLHSDQGSVYTSKAYYQACTEKGIIRSMSRKGTPADNACIEWFHSVLKTETFYLHDRRKYNKDSITNIVKNYITFYNETRIQRHLKNQSPVQFRKLAS >CP019820|944263:954115|946876_947167_-|AUP12953.1|DBSCAN-SWA MVKKAYSWETKLACIEMKKAGKSNRFIMETLGIKNDSQIYTWVKWHENEELYRFHQGVGKQYTYGKGLEHLSEVEQLQLQVDLLKKYRGLIRKSIK >CP019820|944263:954115|948851_950573_-|AUP12955.1|DBSCAN-SWA MKRLTYYFKGYIKETIFGPLFKLLEASFELLVPIVIAKMIDETIPRGDRSSLLLQIGLIFFLAAVGVVVAITAQYYSSKAAVGYTRQLTEDLYQKVMSLGKKDRDELGTASLITRLTADTFQIQTGLNQFLRLFLRAPIIVFGAIIMAFSISPSLTIWFLVMVVTLFIIVFVMSRLLNPIYLKIRTSTDYLVKLTRQQLQGVRVIRAFNQVDRESEAFNDINYHYTNLQLKAGRLSSLVTPLTFLVVNITLVVIIWRGNLNIANHLLSQGMLVALINYLLQILVELLKMTMLVTSLNQSYISAKRIIAVFERPSEIIDDKLEPKYSNKALEVQEIAFSYPNSSEKALSDITFSMNVGETLGIIGGTGSGKSTLVNLLLHIYKVQEGDIDIYHQGKSPDTISNWRTLVRVVPQNAQLFKGTIRSNLSLGLGKVSEEKLWTALEIAQASDFVKEKDGQLDASVESFGRNFSGGQRQRLTIARALVQDKIPFLILDDATSALDYLTEARLFKAITKHFNQTNLIIVSQRINSIQNADRILLLDKGKQVGFDNHQSLLAHNKVYKSIYHSQNFKEEE |
8 | Staphylococcus_phage(33.33%) | tRNA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1349193 : 1359871
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >CP019820|1349193:1359871|DBSCAN-SWA TATGAAACTCATTTCATGGAATATTGATTCCCTCAATGCGGCATTAACAAGTGAATCAACACGTGCTTTAATGTCACGCCAAGTTATTGATACTTTAGTTGCTGAAGATGCCGACATCATTGCGATTCAAGAAACTAAACTGTCTGCCAAAGGGCCTACTAAAAAACATTTGGAAGTACTTGAAACTTACTTCCCAGCATATGATTTGGTTTGGCGATCATCAGTCGAACCTGCTCGTAAGGGCTATGCTGGTACAATGTTTTTATATCGTAAAGGGTTAAATCCTATTGTTAGCTTCCCTGAAATCGATGCTCCTACTACAATGGATAATGAAGGTCGCATTATTACTCTCGAATTGGAAAACTGCTATATCACACAGGTCTATACTCCAAATGCAGGTGATGGCCTAAAGCGCTTAGCTGACCGTCAAATATGGGATATTAAATATGCTGAGTATTTAGCAACATTGGATAGTCAAAAACCTGTTCTAGCAACAGGTGACTATAACGTAGCCCACAAGGAAATAGACCTAGCTAATCCTAGCAGTAATCGTCGTTCTGCTGGATTCACAGATGAAGAGCGCCAAGGCTTTACAAATCTACTAGCTAAAGGTTTTACAGATACTTTTCGTTACCTTCATGGCGATGTTCCAAATGTTTATAGCTGGTGGGCACAACGAAGTCGTACATCCAAAATCAACAATACAGGGTGGAGAATTGATTATTGGCTAACAAGTAACCGTGTCGCAGATAAAATTACCAAGTCAGAAATGATTCATTCTGGTGATCGTCAAGATCATACACCAATTATTTTGGAGATTGAACTATAAACCAAAAAAGATGATTGAGTTATAACTCAATCATCTTTTTATACTAAGTTGAGGTCTTTATACTTAGTACGGTAGCCAATCTGAAGAATTTTATTATCTTTAACTAGCAATGGACGCTTAATAAGCATCCCATCCGATGCCAATAAGTCCAAAGCTTGGTCAAGAGTTAAATCATCAAATTTATCTTTTAAGCCTAATTCTCTGTAAGAATTTCCTGAAGTATTGAAAAACTTTTTAAGGTCATAAGGCGAATTCTCTAACAATTCTTTTAATAACGAAGCTTTGGGAGGATTGCTTTTTATATCAATAGCTTCAAAAGTTAAGCCGAGTTCAGTTAACTCTTTTTTGCTGAACGACAAGTGGTACATTTGGGGTATTCATAAAACGTATACATATTATTTCTCCTTTTCGTATTCTAATAACCAAGATTTTCTTTCTAAGCCACCAGCATAACCAGTTAATTGACCATATCTTCCTAAAACACGGTGACAAGGTATGATTAGAGAAATAGGATTTTTACCTATTGCTCCTCCAACAGCCTGTGCAGATTGACAATTTAGCTCTTTCGCTAATTCTCCATAAGTTTTTGTATCTCCAAAAGGGATTTTCTGTAATTCCTGCCATACTCTCATCTGAAATGCTGTCCCTCTCAATGATAATGGAATACTAGGTAAATTTTGCTGTGAAAAATAAGCATCTAACCACTTCTTACCAAGTAAAGTATAGGAATTTGACATATTAACAATTTCCTCTTGGTTGACTGCTAGCATATCATATTTTTGCCCAACAAAATAAAGCCCTGATAAACCTAGATTGTCTGCTAGAAGGCGAATTTCTCCAAGAGGGGACTGATAGAATTCTTGATATAACATATGATAAGCATAACTTAAAAAGCCATGAAAAGCAATTCATGACTTTTTTTAGTTCTTTATTGTTGTTTTGCAATTAAACGTACACGGACGATATTCTCATCACCTTCAAATTCTTCAATTAAAGTAGAAATCTTGTTATTATCCGTTTCATCTAAATCTATTAGTGTGTAGGCGTAGTCACCCTTTGAACGGTTAATAATGTTATCAATATTTATACCTAACTCTGATACAGCAGTTGAAATTTTAGCCACAATGTTAGGAACATTCTTGTTAATTAAAGTAATACGAAATGGTGCGGTTTGAATTTGATGTACATTGGGGAAATTAACTGAATTAGTGATTTCTCCTGTCTCCATAAAACAACGAATGGTTTGACTTGCCATAATAGCACAATTTAGCTCTGCCTCATCTGTTGATCCGCCTACATGAGGAAAGACTGTAATTCCTTTTTGGTTTAATAATTCTTTGTCTCCAAAATCAGTAATATAGCGCTTGACAACACCAGTTTCTATCGCTTCAAATAGCTCTTGGTTATTGACTAATTCTGCACGAGCAAAGTTGATAATCGTCGTTCCTTTTTTCATGATTGAAAAAGCTTCCGCATCAAAAGTATGCTTAGTTTCATTTGTTAAGGGAACATGAATTGTGATATAGTCACAAGTTTCAAAAATATCCTTAATCTCTTTAACCCTTTGAACATGGCTTGAAATATTCCAAGCTGTTTCAATTGAAACATAGGGATCATAACCAAGAACTGTCATTCCTAAGCGTCTAGCATCATTCGCAATTCTAGCTCCAATGGCACCAAGGCCGATAACTCCCAATTTTTTTCCTGCAATTTCATTACCAGCAAAAGCTTTCTTTCCTGCTTCAATTTGTTTGGGAATATCTGTTCCAGTTAGAGTATTAACCCATCGGTTAGCTCCTAAATAATCACGAGCTGAAAGTAATAAGGCAGCAATGACCGCTTCTTTTACAGCATTAGCATTTGCACCTGGGGTATTAAAGACGACTATTCCCTGTGCACTTGCCTCTTCAATAGGAATATTATTTGTTCCTGCACCCGCCCTAGCAATAGCTTTGAGGTTACTTGGGAAATCTTGATTATGCAAATTTTGACTACGAATAATATAGGCATCAGGATTTTCTGACATATCCCCATCAATCTGGAAACGATTCCCTAACTCTTGTAAACCAATTTGATTAATATTATTAAATGTTTTGACACTAAAAACCATTCTTTTTCACTAAGGTTATCTCTTTAGTCATCATTGACTAAAATAACCCCTTTCTTTTTTTCTTACATGGGATTTCTTTCATCAATCTCACGATAGATGCTCGTTTCTCCCTTTTCTTTTATCTTCTGATAAGCCAATCGTACCCCATCTAGAGGTACTTTACCACAATATTGATAGCCTAATTTATTTAGAATATGCTGCATAGTGACATTTTTTTCATGAGTATCGCAACGAAAATCAGGTCCTTTGTGACCTTCAATTAACCCTTGAAGGAATGTCTGTGCTAGTCCTCTACCACGAAATTGATTTGAGATAGCAATACGATGAAATGTAAGATAGCGATGGTTATCATGGAGCCATTTTCCCTCATAAATAGCATCATAAACCTCTTCATGACCATCAATGACAGCCGCATAAGTCGCTAGCATCCCATCTTCAATACCAACCCAAGCATAACCGTTCAAGATATCATCAATAATATCGTTACGATTAGGGTATCCATCTTCTTTTTGCCATTGATCACTTCCTGTTTTAGCAATTTCGGCACGCGCTTCCTCAATAAGAAGCATAATTTGGTCAATTTCATTTGGAAAAGCTAATCTGATTTGCATTATATTACCCACTTTTATATATTATAGACTATAATAACGGTTTAATTTTCTTTCGTGATAACATTTACTATGCATTTTCTGCTTCAAATGTTTTCATAAAATCAATTAATTCGATGACACCTTGTTTAGGAAAGGCATTATAAAGGCTAGCCCTCATACCACCTACCGAACGATGCCCTTTAATATTTTTAAATCCACGTTCTGTCGCTTCCTTTACAAATTTTTCATCTAAATCTTTATTAATAGTTATGAAAGGAATGTTACATAGAGAACGACTCTTTTTATCTCTGACAGGATTACTATAAAATTCTGAGGAATCAATATAATCATAGAGAAGTCCTGATTTTTCACGGTTAGCTTTTTCCATAGCATCAACACCACCTAGACTTTTCACCCATTCAAAGACTAATTTAGCAATGTAAATACTGTAAGCAGGCGGCGTATTATAAAGAGAACCAGCATCTGACTGAATCTTATAATCCAACATTGATGATAAAGTTGGTTCCTCATTAATCATATCTTCACGGATAATAACTACCATTACACCAGCAGGTCCAATATTTTTTTGAGCTCCTGCATAAATCATTGCAAAATCTTCTACTTTATATTTTACAGCTAAGATATTAGAAGACATATCCGCAATAACAGGCACTCCATTAGTTTTAGGAGTATCATAAAGCGATGTTCCTTCAATGGTATTATTTGTTGTCACATGAACATAGGCAGCTTCAGGATCAATCTCTTTTTCATCAAACTCTGGAATATAATCATAAACTGATTCTTCTGATGAGGCTAATAGAATTGGTTCAAAAGGAATTGTTTTTGATAGTTTTACAGCCTCTGTATAAGCTTTTTTCCCCCACGAACCAGCAACATGATAGTAAGCTTTACGCCCTCTGGCAATATTCAAGGGAATCATACTAAACTGTAAGGATGCACCACCTTGTAAAAAGATTACTTTATAATTATCCGGAATTCCCATCAAATCTCTTAAGTAACGCTCAGCACCTTTGATAATATCATCAAACTCTTTGGAGCGGTGCGATACCTCCAAAACACTCATACTGGACCCTTGATAATTAAGGAGTTCAGATTGGGCTTTTACAAGCACTGGTTTTGGTAAGACTGCAGGACCTGCAGAAAAATTATAAATTGTCATATAACACCTCCATATAATAGTGTAAGATTATAGCACAGTATTTTGAATATTGTAAAGATTTTTTTGATTAATTTTGCTTTTTATTCGTGATATAATGGTAAAGGCGAACAATCAAGTTTAAAGGAGTAATTTATGATTTTGAGGGAATTTTGTGCAGAGAATTTAACAGACTTAACCAGATTAGATAAAGCTATTATTTCACGTGTCGAGCTTTGTGATAACCTTGCTGCTGGAGGCACTACTCCTAGCTACGGTGTTATCAAAGAAGCTAATCAATATTTACATGAAAAAGGTATTAGTGTCGCTGTTATGATTCGTCCCCGTGGAGGAAATTTTGTATACAATGATTTAGAATTACGTATTATGGAAGAGGATATCCTACGTGCTGTTGAGTTAGAATCAGATGCTCTTGTTTTGGGAATATTAACTTCAAATAATCATATTGATACTGAAGCCATTGAACAACTTCTACCTGCTACCCAAGGTTTGCCACTTGTTTTTCATATGGCATTTGATGTTATCCCGAAATCTGACCAAAAAAATCAATAGATCAATTAGTTGCTTTAGGCTTTACAAGGATTCTCCTACATGGTTCATCTAATGGCGAACCAATTATAGAAAATATCAAACATATCAAAGCATTAGTTGAATATGCTAATAATCGTATTGAAATTATGGTTGGCGGCGGTGTGACTGCTGAAAACTATCAATATATTTGCCAAGAAACTGGGGTTAAACAAGCCCATGGTACTAGAATAACTCAATAAAAAATTCGAAACAGGGCTATAAGTTTCTTTAGTATATTTACTACTAAGTTCTTTCATGTTTTGTAAAACCTGAAAGAACCGGAATAAGAGCATACCATCTTTTATAACCTGCTCTCAGAAATAAAATCCAATTTGTAATGGTATTCAAAAGAGCTGAAATTAAAAATCTTAAGGAAATTGGAAGCACCTTACTTCTTTATTCCAATAGCTAAATCGGAGATTATAAATCATGGAAACTAGCATAGAGTTCTTGTCTATTGAGATTAAGTTCTTTTGCTACTTTTTTTATCGCTTGATTAGTTTTATCACCATTAGCGATATATTCTTTTACTAATACTAGTGGATCTTGTTGGCTACTGTCTTTCACTCGCTCAGTATCTCTCTTACCATCAACAATAATTAAGCATTCACCTTTGAGAGGGACTTTTTCAATATGCCATAAAAGTTGACTAATGGTTCCTCTTTGATACTCTTCATAGAGTTTCGTCAATTCGCGTACTAAAACAACTTGGCGATCTCCGTAAATCTCTTTCATGTGTTTTAGCGTATCAGAGACTCGAAACGGTGACTCATAAAAGATTTGTGTTTCAGGGTAATCTTTCTTTGTTTCAAAAAAAGTTATTTGTTGACCTTTCTTACGCGGTAAGAAGCCATAAAAAATATGAGGTTGTGGAGCTAAACCTGAAGCGATGAGAGCAGTAATACCAGCGCTAGCTCCTGGTATAGATACGACCGGGATATCCCCTTCAATAGCAGCCTTGACAAGGTCATGTCCTGGGTCAGAAATAGAGGGCATTCCTGCATCAGATACTTGGGCTAAAGATCTCCCTTCTTTTAACAAATCAATTAACCCAGAGATTTTATCGTAAGCATTGTGTTCGTGAAAACTAATTTGTTTAGTAGTAATATCAAAGTGCTTGAGTAAAAGTCCCGTATTTCGTGTATCCTCTGCACAAATAAAATCAACTTCTCTTAAAATCCTAATGGCACGAAAAGTCATATCATCTAGATTACCAATTGGAGTTGGGACTAGATAGAGTGTCCCGTAATGTGTATTTGATTTAAAACTTTTTTGAACTTGCATTTCCATCAATCTCTATATAATAATTCAATACAAAAAGCACATTCTTCGTCATTTTCACGACGTTGACCATAGAAAGTATTACAAATGTGAAAGCCATCATTGTAAATTCCTTCGAGTAGTTCTCTTCCTTGTTTAGAATTTTTAACTGCTGTTTCTGTTTCTGCTTCAATAACGCTCAGACGCTCACGAAGTTTACCATTTTCAATGCGTAGAACAGTATTCTCCTCCAATAATTTTTGGATTTGTTTTTTCATAGTCTCAATTTCAGACAACCCAACTAATAAATTTTGTGAAAAATCATCAAAGGCATCAAACAAGTCTTTTTTATCCATTCACTCTTCCTCTCTGCGCGTATTATTTTCTAAGAAAGCACCATATATTCTAAACTATTTTGAAAACTAACATTGCTCTTCCACATTTGCTGAGCTCTATAAGTATTTTCTAAATCATAAAGTTGGCCTTCTTTAGCCAGCATTATTGTCAGCCATTGAAAAACAAATGCCTGATCATTTTTATCTACAACTTGCGATGTCAAGCGAGATACTTCTAAATAAGCAGTTTGCCTATCTTTTGCCAAAGTCGTCACAAACTGTTGACTTAAATTCAAGTAATCTAATAACTTTTTGTTAGTCAACAATATTTCTAAATGTTTAGGATCGTCTGCTACTTGAGCTAATAAGCTAGCTTGTGATTTTAGCAATCCTGCTTGTTCAGCTTGATGAACCAACATGTCCAATTGTTTTGGAAAACGAAAAATTTGCGTTCTACTCTTAATTGTTGGCAAAACATTGTTTTCATCATTAGTCAATAAGATTACATAAGATGAACTTTGAGGTTCTTCAATAAATTTCAAAAGGCTGTTGGCTGCATTGACATGCATTTTTTCGCAATCTTTGATGATAAGGACCTGTGATTTCCCTTCGAAACCTGATCTTGAAAAATCTTTAGTCAGCTCTTTTATAGTCTCTGTCTTAATAAGTTGCCCCTGTGGTTCTATGATTTTAACATCTGAAAATTCCCCATTAGCGATTAAACGACAGGCTCTACACTCTTGACATGGTAAACCACTCTGGCGCTTTTCACAGAACTGACTTTGTGCTAAATAAAGTGCCATATCTAGACTTGCAAAATTTCCCGAAAAAAGATAGGCATGACTCATCCTATCTGACTGTAAAATAGTATTAAACTTTTCCAGCAATTTGGGTTGTGTTCGCTTTAAATCCATGACCTTTGTACTTCCTGATTCATTGGTTGATACGATCTAAAATAATAGAGAATGTCTCAGCTATTACTTCATCTAGCTGTTGGGAGGCATCAATCGTCACAATGCGGTTTGGCTCCGAATCCGCCAATTCAAGGTAACCTTGACGGACGCGTTGATGCATATCTAATTGCTCGAGATCTAGACGATTTACCTCCCTTTGAACACTTTTTTGAATACGCTCTAAACCTACCTCAGAAGGAACATCAAAATATAAAGTTAAATCAGGTTTATGACTATCAGTCGCATAGTCATTAAGCCATTTTATATGTGACTTATCTAATCCTCTTCCTGATCCCTGATAGGCAACAGAACTATCAATAAAACGATCCATTAGGACTATTTTCCCTTCTTCTAGAGCTGGGAGTACCTTTTCCACTAGATGTTGGCGTCGAGCAGCCATGTAAAGCAATAGCTCTGTTTTTTTATCCATTTGTGTGTGTTTAACATCTAAAATAATATGACGAATTTCTTCTGAAATAGTTACGCCACCAGGCTCTCTGGTGGTGAGAATATCTTGTGATAATTTTTCTCTGAGCAAGGGTAAAACAGCTTCTAAAACGGTTGTTTTACCCGCACCATCTGGGCCCTCAAAAGAAATCATTAGTCCTTTTTTCATGGTACATCCTTTATTTATAATTACTACCATTCTATCAAAATTTATCAAAAAAAGACACCCACAACTTGATTGTGCATGTCTGATATTTTTAAGAAAGTGGTTTTTTCACGGTCTTTTCTAAAGTTTCCACAATAACATCATCAAATACTAGTTCTTGTTTTAAAACATCCTTGTCAGCGTATCCTTCTAGTTGTATCTCGACCGCTTTCTTACCTGCTTTTCGTTCAATAATGACTAAACGTTTAACACTTAAATTTGCACTAGAAAGACGATTTAGGACTTTTGATAGTACCCCTATCCCCTCATCAGCTAATATAACCAAGCGATAACCTTCTTGACCATACCCCGCAATTTCAAGGAAGGCTTTAAAAACATCCCTATCCGTGACAATCCCATAAAGTTGTCCATTATCAACTACTGGTAAAACACCGATCTTTCGAGACATCATCAAATAAATAGCGTCCTCAAGGCTAGCATACTGTGAAACAGTCACAATATCTTTAATCATAATATCTCGAATTTTTGTCTTATTAAGAAGATAGTTCATCTCATATATAGAAAGACTGGTTGCTTTAGAAGGTTGTGCTTCTGCCATTGTCCCTTCTGTCACTAACCCCACTAGCTGATCATTTTCAACAACTGGCAAACGCCTTAAGTGGTGTTCTCTCAATAAATCAGCAGCTTCTGCAACTGTAGTGTCTGGAGAGACATAAACTAATTTTTGTCATAAAATCTTTCACTGGCATACCTGACTCCTCTAAATATTATCCACCTAAGTAAGCTTTACGAACTTGATCTGAAACTAGTAATTCCTTACCTGTCCCTGATAAAACAACCTTCCCAGTCTCTAGAACATATGCTTTATCAGCAATCGTCAGAGCTTTATTTGCATTTTGTTCAACTAAAAGAACTGTAGTCCCTTGTTTTTTGATGTCTTCAATGATATTAAAAATTTCTTGAATAAAAATTGGAGCTAGGCCCATTGACGGTTCATCTAAAAGTAATAATTTAGGACGACTCATCAATGCACGCCCCATAGCGAGCATTTGCTGCTCACCACCTGATAAGGTTGCTGCATCTTGGTTTTTACGTTCTTCTAAGCGAGGAAAACGATCAAACACTTTTTTTAACATTTTTTGATTTTGTTCACGATCCTTTTGAAGAAAGGCTCCCATTTCTAAATTTTCCATAACAGGCAAACTTGAGAAAACGTGGCGCCCTTCTGGAACCTGAGCTAAACCATTGCCAACAATTTTTCTAGCTGCTAACTTATGTATAGGTTTCCCCAAAAAAGAAATAGAACCCTGACTTGGTCTTACTAAACCAGAAATTGTCCTCAAAATTGATGTCTTTCCTGCACCATTGGCTCCAATTAAGGTTACAACCTCACCTTGGTTAACTTCAAACGAGACATCATTCACCGCTTGAATAACACCATAGTGAATAGATAGATTTTCTACTTTCAACATGGTCATTATACCTCACTCCCCAAGTATGCTTCTATAACACGTTTATTATTTTTAATTTCTTCAGGTGTCCCGTGAGCAATCAGACGACCATATTCCAATACATAAATTCTCTCTGTTACTTGCATAACCAAGTTCATATCATGTTCAATCAGCATAATAGTAATATCAAAATCATTCTTTATTTGACTAATTAACTGCGTCAATTCTGCAGTTTCTTGAGGATTCATTCCTGCTGCGGGCTCATCCAAAAACAATATTTTCGGTTCTGTTGCTAAAGCACGAACAATTTCTAAACGCCGTTGTTTTCCATAAGGGAGGTTCTTAGCAAGAGCATCTTGATATGCTTTCAAACCAAAAATCTCTAATAGCTCTAGGGCCTTTTTCCTTAAGGCTTTTTCACTATGATAGTATTTGGGTAATCGTAAAAAACTAGCAATAGAATGTGATAAGTGATGATTACTGAGTCCTACTAGTACATTATCTAAAACAGTCATATTTTTAAAAAGTCGGATATTTTGAAAAGTTCTACCTAAACCTAAAGAAGCTATTTTAGCTGGTTTCCTCCCATTTAATATCTTATCATCAAGTGATATTGTCCCTTTACTAGGAAGGTATACTCCTGTTAAGAGATTAAAAAGCGTTGTCTTACCCGCACCGTTGGGGCCGATTAAGCCAATTAATTCACCTTTATGTAATTTCATCGAAACATCACCTACAGCAGTTAGGCCACCGAAATGTTTACTTAAATTTTTTACTTCAAGAAGTGCCAT
Protein sequences of DBSCAN-SWA_3 >CP019820|1349193:1359871|1350059_1350389_-|AUP13306.1|DBSCAN-SWA MYHLSFSKKELTELGLTFEAIDIKSNPPKASLLKELLENSPYDLKKFFNTSGNSYRELGLKDKFDDLTLDQALDLLASDGMLIKRPLLVKDNKILQIGYRTKYKDLNLV >CP019820|1349193:1359871|1352193_1352742_-|AUP13309.1|DBSCAN-SWA MQIRLAFPNEIDQIMLLIEEARAEIAKTGSDQWQKEDGYPNRNDIIDDILNGYAWVGIEDGMLATYAAVIDGHEEVYDAIYEGKWLHDNHRYLTFHRIAISNQFRGRGLAQTFLQGLIEGHKGPDFRCDTHEKNVTMQHILNKLGYQYCGKVPLDGVRLAYQKIKEKGETSIYREIDERNPM >CP019820|1349193:1359871|1352809_1353901_-|AUP13310.1|DBSCAN-SWA MTIYNFSAGPAVLPKPVLVKAQSELLNYQGSSMSVLEVSHRSKEFDDIIKGAERYLRDLMGIPDNYKVIFLQGGASLQFSMIPLNIARGRKAYYHVAGSWGKKAYTEAVKLSKTIPFEPILLASSEESVYDYIPEFDEKEIDPEAAYVHVTTNNTIEGTSLYDTPKTNGVPVIADMSSNILAVKYKVEDFAMIYAGAQKNIGPAGVMVVIIREDMINEEPTLSSMLDYKIQSDAGSLYNTPPAYSIYIAKLVFEWVKSLGGVDAMEKANREKSGLLYDYIDSSEFYSNPVRDKKSRSLCNIPFITINKDLDEKFVKEATERGFKNIKGHRSVGGMRASLYNAFPKQGVIELIDFMKTFEAENA >CP019820|1349193:1359871|1358396_1359107_-|AUP13316.1|DBSCAN-SWA MTMLKVENLSIHYGVIQAVNDVSFEVNQGEVVTLIGANGAGKTSILRTISGLVRPSQGSISFLGKPIHKLAARKIVGNGLAQVPEGRHVFSSLPVMENLEMGAFLQKDREQNQKMLKKVFDRFPRLEERKNQDAATLSGGEQQMLAMGRALMSRPKLLLLDEPSMGLAPIFIQEIFNIIEDIKKQGTTVLLVEQNANKALTIADKAYVLETGKVVLSGTGKELLVSDQVRKAYLGG >CP019820|1349193:1359871|1356113_1356977_-|AUP13314.1|DBSCAN-SWA MDLKRTQPKLLEKFNTILQSDRMSHAYLFSGNFASLDMALYLAQSQFCEKRQSGLPCQECRACRLIANGEFSDVKIIEPQGQLIKTETIKELTKDFSRSGFEGKSQVLIIKDCEKMHVNAANSLLKFIEEPQSSSYVILLTNDENNVLPTIKSRTQIFRFPKQLDMLVHQAEQAGLLKSQASLLAQVADDPKHLEILLTNKKLLDYLNLSQQFVTTLAKDRQTAYLEVSRLTSQVVDKNDQAFVFQWLTIMLAKEGQLYDLENTYRAQQMWKSNVSFQNSLEYMVLS >CP019820|1349193:1359871|1354888_1355752_-|AUP13312.1|DBSCAN-SWA MQVQKSFKSNTHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHFDITTKQISFHEHNAYDKISGLIDLLKEGRSLAQVSDAGMPSISDPGHDLVKAAIEGDIPVVSIPGASAGITALIASGLAPQPHIFYGFLPRKKGQQITFFETKKDYPETQIFYESPFRVSDTLKHMKEIYGDRQVVLVRELTKLYEEYQRGTISQLLWHIEKVPLKGECLIIVDGKRDTERVKDSSQQDPLVLVKEYIANGDKTNQAIKKVAKELNLNRQELYASFHDL >CP019820|1349193:1359871|1359106_1359871_-|AUP13317.1|DBSCAN-SWA MALLEVKNLSKHFGGLTAVGDVSMKLHKGELIGLIGPNGAGKTTLFNLLTGVYLPSKGTISLDDKILNGRKPAKIASLGLGRTFQNIRLFKNMTVLDNVLVGLSNHHLSHSIASFLRLPKYYHSEKALRKKALELLEIFGLKAYQDALAKNLPYGKQRRLEIVRALATEPKILFLDEPAAGMNPQETAELTQLISQIKNDFDITIMLIEHDMNLVMQVTERIYVLEYGRLIAHGTPEEIKNNKRVIEAYLGSEV >CP019820|1349193:1359871|1355757_1356084_-|AUP13313.1|DBSCAN-SWA MDKKDLFDAFDDFSQNLLVGLSEIETMKKQIQKLLEENTVLRIENGKLRERLSVIEAETETAVKNSKQGRELLEGIYNDGFHICNTFYGQRRENDEECAFCIELLYRD >CP019820|1349193:1359871|1350949_1352131_-|AUP13308.1|DBSCAN-SWA MVFSVKTFNNINQIGLQELGNRFQIDGDMSENPDAYIIRSQNLHNQDFPSNLKAIARAGAGTNNIPIEEASAQGIVVFNTPGANANAVKEAVIAALLLSARDYLGANRWVNTLTGTDIPKQIEAGKKAFAGNEIAGKKLGVIGLGAIGARIANDARRLGMTVLGYDPYVSIETAWNISSHVQRVKEIKDIFETCDYITIHVPLTNETKHTFDAEAFSIMKKGTTIINFARAELVNNQELFEAIETGVVKRYITDFGDKELLNQKGITVFPHVGGSTDEAELNCAIMASQTIRCFMETGEITNSVNFPNVHQIQTAPFRITLINKNVPNIVAKISTAVSELGINIDNIINRSKGDYAYTLIDLDETDNNKISTLIEEFEGDENIVRVRLIAKQQ >CP019820|1349193:1359871|1350416_1350893_-|AUP13307.1|DBSCAN-SWA MLYQEFYQSPLGEIRLLADNLGLSGLYFVGQKYDMLAVNQEEIVNMSNSYTLLGKKWLDAYFSQQNLPSIPLSLRGTAFQMRVWQELQKIPFGDTKTYGELAKELNCQSAQAVGGAIGKNPISLIIPCHRVLGRYGQLTGYAGGLERKSWLLEYEKEK >CP019820|1349193:1359871|1354033_1354450_+|AUP13311.1|DBSCAN-SWA MILREFCAENLTDLTRLDKAIISRVELCDNLAAGGTTPSYGVIKEANQYLHEKGISVAVMIRPRGGNFVYNDLELRIMEEDILRAVELESDALVLGILTSNNHIDTEAIEQLLPATQGLPLVFHMAFDVIPKSDQKNQ >CP019820|1349193:1359871|1349193_1350021_+|AUP13305.1|DBSCAN-SWA MKLISWNIDSLNAALTSESTRALMSRQVIDTLVAEDADIIAIQETKLSAKGPTKKHLEVLETYFPAYDLVWRSSVEPARKGYAGTMFLYRKGLNPIVSFPEIDAPTTMDNEGRIITLELENCYITQVYTPNAGDGLKRLADRQIWDIKYAEYLATLDSQKPVLATGDYNVAHKEIDLANPSSNRRSAGFTDEERQGFTNLLAKGFTDTFRYLHGDVPNVYSWWAQRSRTSKINNTGWRIDYWLTSNRVADKITKSEMIHSGDRQDHTPIILEIEL >CP019820|1349193:1359871|1356996_1357632_-|AUP13315.1|DBSCAN-SWA MKKGLMISFEGPDGAGKTTVLEAVLPLLREKLSQDILTTREPGGVTISEEIRHIILDVKHTQMDKKTELLLYMAARRQHLVEKVLPALEEGKIVLMDRFIDSSVAYQGSGRGLDKSHIKWLNDYATDSHKPDLTLYFDVPSEVGLERIQKSVQREVNRLDLEQLDMHQRVRQGYLELADSEPNRIVTIDASQQLDEVIAETFSIILDRINQ |
13 | Streptococcus_phage(83.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
1811149 : 1818353
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >CP019820|1811149:1818353|DBSCAN-SWA ACTAGTAACCCCAAGCTGATAAACCTTGAGCACGATAAGCTTTAATAGCTGAATTAACTTGATCCTGAACTGTAGCTGTTGAACCCCAACCTGGCATCGTTTGGAAAAGTCCTGAAGCTCCTGAGGCATTAGCAACATTAGGATTACCATTTGATTCACGGGCAATAATATGTTCCCAAGTAGACTGAGGGACTCCTGTTGCAGCAGCCATTTGTGCTGCAGCTGCTGAGCCAATAGCCCCTGCAGTATTTCCATTACTCAATACTTGGCCACTCGTCTGGTGTTGAGCAGGTCTATAAGTTGTCTCAGTAACAGCATAAGCTTGTTGTGCCTGACTGGTAGCAGGGGTGTTTTCTGTTACAACTGCTTGTTCTACAGCTGCCTCTTCACTCGCAGTAACTTGTTGCTGAGAATTAGCTTCTGTAGATTGAGAACTTGATTTTGGGGCTTCATTAGATGCCTGAGAAGGTTTTGGAGCCTGTTTTACATCTTCTACTTTTGATTTAGATGTCGCCTTAGTCATTTTTGATTTTTTGGCTACGCGAACTTTATCTGCTTTTGACAAAGATTCAGTAGTAACTTGTGAACTTTTAAAGATGACCGTTACAGCCAAAATACATGAAAAAAGGGCTACTAAAGTGATAGCTCCATAAGCTAAATGTTGTTTTTTTACATTCAATTTTGATAATTTTCTTCTTTTATTCATGTTACCTATATTATACTTTATTTGTTACCTTGCAATTGAATAGATGTTAAAAATATTACAAAGAGATTTAATTTTAAGTAAATCTCTTTGTTTTATCAACTTTTATTAATACCAGCCGTTACTATTCCAAAATGATAGCGCTGCCGACCAAGATCCGTAACGAGAAGCCACATAATTGTCCGCTACTTTTTCTTGATTTTCAGGAGATAAGTCGCCATTTAGGTAAGATTGAGACAGTTGATATCTTCCATAATATTGTCCATTCTGTGCAGTATAACTACCATTTGATTCACGACGAGCTATTTCTTCTTTTGCAGCTGAATCACTTGAACTCAAATTTGATGAAGAATTCATTGAATTTTCAATTGTTGGTTGAGATTTTGCTTCTGCTTGACTAGTTGTAGAATTATCCAATTTTAAAACATCACCTATACTGATGACATCAGCGTTACTGATACTATTGAGAGACACTAACTCTTGTACCGTAGTTTTATGATTTTTAGCAATAGCTGATAAGGTATCACCTGATTTCACGGTATAAGATGCTGCGCTTACTGAAAGTGGTAAAGCTAATGAAGCACCCACTAAAAGACCTGCCACTCCTAATTTAAATGGTTTTGATTTTTTAACCGAGGTTATTGACATAATATATGCTCTCTTTCATTAATTGATACGCGTACTATCATACCTTGTAAATATTACTAATTGTTTTGCCTTAGATGAAATTTATTACAAATAAATTGTAAATTAATAAAGAAAAGGCCTCCAAAAAACAATTTTTAGTTTTCTTTAAGTAAAGTTGTTGAGCTTTTCACATTATATAAATGAAAAGGCTAAGACCATAAACTGACCTTAACCTTTTAATTTTTTAATAGAAACAAACTCAAACCCAATAATAACATAAGTAATATACTAAAAGTATCCCGAACAGTCCACTTCAATAAACGGTACTTACTACGATTGGCTCCGCCTTGATAACCTCTTGCTTCCATAGCAATTGCCAACGCATCTGCTCTTTTAAAACTAGAAGCAAATAATGGAATCAAAATAGGGATAATGGACTTAACCTTATGAATTAGGTTTTCCTCTCCAAAATCAACTCCACGAGCTCTTTGAGCATTCATGATACGTGTTGTATCATCCATTAAAGTAGGAACGAAACGTAAGCTAAGGGATAACATCAAACCAATCTCGTGTGCTGGTACTCTCAGTACTTCCAATGGTTTTAACAAAGATTCAACAGCATCTGCTAAACTTAACGGAGTAGTAGTTAAGGTAAGTAATGTCGAAAAGAAGATAATTAAAACAAATCTCATAAAAATAAGTGCTGCTTGTTGTAACCCAAGGCTAGTGATGCTAAAAATCCAAAACGAGAAGATAACCTGCCCGCCTTGTGCAAACAGCATCTGGAACAGGGTTGTAAATAAAATAATACCAACCATCGGTTTAATACCATTGAAAAAATAGGAAAATTTTATCTGAGATAAACCCACAATAACCAACGTAAAAATGAATACGATCACATTTGTCACTACATTATTTGCCCAAAAAACAATAATGATAAAAAGCAACATGGCTAGTAACTTACTTCGAGGATCTAATTTATGAATGAGAGAATTACCTGGTATGTAACGTCCCAAAATCAATTTATCCATGCTTAATAGCCTCCACAAATTCGTTAATAGTAATTGGTAAACTAGGTAAATTTAATCCCTTATGAGATAGTCTTTGAGCAAACTTGGTGATTTTGGGAACTCCTAATTGTTTACTTTCTAGAAGTTCTACTTCTTGAAAAATCTGTTTTGGTTGTCCTGATAGGGTTACTTTCCCTGCTTCTAAAACATACACATAGTCAGTATAATCCGCTACATCGTCCATTAAGTGAGTCACTAAGACGATGGTCATTCCTTTTTTATGAAGATTTTTAAAAAGAGTCATTAATTCTTTTCTTCCCTTAGGATCAAGTCCAGCAGTTGGCTCATCTAGTACTAGTACTTTGGGTTCCATCGCTAAAATACCAGCTATAGCAACCCGCCTCATCTGCCCTCCAGAAAGTTCAAATGGATTTTTATCGAATAAATCCTCACTAATACCAACTAACCTTAATTTTTCTTCAGCCAGCCTTTCAGCTTCAATCTGAGAAATACCAAAATTTTGTGGTCCAAAAGCAACATCCTTTAAAACTGTCTCTTCAAAAAGCTGACTTTCTGGAAATTGAAAAACTAAACCAACTTTTTGCCTTATAAATTTGATTTCTTTGTTCTTGTCCCCTGCTTTAATAGAAAAATCATCGACAATTACCTCACCTTTTGTAGGAATATGTAAACCATTCAAAAGTTGCATAATAGTTGATTTTCCAGAACCTGTGTGCCCAATGAACGCGGTATAGGAAGCATCTTCAATTTTCAGATTGACGTCAAAAAGGGCACGCCCTTCAAAAGGAGTGCCGGCTTGATAGGTATAACTTACATTTTTAAATTCAATTCCCATAATTGTTCTTCTAATTCCTTCTCTGTAAGATACTCTGTCCCTATATCAAGACCATTAGCAGCCAGTGCTGCCATTAACCTACTTGTAAAGGGAACATCTAAACCTAAACTAATCAAATGATTTCCACGACCAAATAACGCTTTTGGAGTGGATGTTGACTCAACTTTACCATTTTTCATAACGATGACACGATCACTCAATGCAACTTCATCTAAGTCATGTGTAATTGAAATAACAGTAAGATTATATTTTTGACGAATAGCTCGTATCGTTCTTATCAGTTCCAATCGTCCCTCAGGATCAAGCATACTAGTCGCCTCATCCAAGATGATAACTTGTGGACGCATAGCTACAGCTCCTGCAATGGCTACACGCTGCTTTTGTCCTCCAGATAAACGTGCAGGCTCCCTCATTTTAAATTCAGACATTCCTACCAAATCAAGTGCTTGGTCCACTCTTTCTTTCATGTCTTTCAAAGAAATACCTTTATTTTCCAAACCAAAGGCAACGTCATCTTCAACAGTTGCCCCTACAAATTGGTTATCTGGATTTTGAAATACCATGCCAATCTTGTGACGTAACTCCCAGACATTATCTTCGGTTAACTCTTGTCCATCAATGATAATCTGGCCAGACTCCGCCTCTAAAAGCCCATCTATTAAACGAACAGTAGTGGATTTCCCAGAACCATTATGACCAATAATAGATAGCCATTCTCCTTGTTTCACATGAAACGATACATTCTCCAATTGATAATGTGTTTGATTACTATCATATTTAAAAAAGAGATTATTAACGGTAATAATATTTGTCATTATTTAAAAGTATCCTTAAATAAGAAGCCTGCACCTTTAAAATAGTCGTAGCCTGAATACAAGGTAAAGAATAAAGCAATGTATAACATGATGTTACCAAGTGTCATCCAATGTACTAACAAAAAAATAACTGCAAACATTTGAGTAGCCGTCTTTATTTTCCCTGGCATAGCTGCCGCAAGTACTGTTCCACCTGTTTCAACTAAAAGTAAACGCAAACCTGTAACTGCTAGCTCTCTACAAATGATAATAGCTGAAACCCAAGCCGGTGCTAAGTCTAGTCCAACTAACATAATAAAAGCACTCATAACTAGCATTTTATCAGCTAATGGATCTGCAAATTTCCCAAAATTTGTTACTACTTGCCATTTACGTGCTAGATAACCGTCTAGGTAATCGGTCAAGCTTGCAATAGCAAATACAATAGCTGCAACAATATGCCAAGTTGTACTTGTTGTTACTGAAGTTAATACTATAAATAACGGAATCATTAAAATTCTGACTACAGTTAATAGATTCGGAATATTTTCTTTCTTCACCATAAATTCTCCTTTTGGAAACATAGTATTCCTATATTATGTTATTTCAAAACTAGTAAAAGACTTTTGACATACCAACTTTATAGATGTCTAAGCTTCCTTATTATATCAAAATTTCAGATTATTTACGAAGATTTTGGAAAAATAACGAAGTCAGATGTGTCAGCGTTATCTAAGAAATCCTTACCAATCGTAATGACATCTTCCAAGTCTAATTCTTCAACGATAGATGGCAAATCCAAATACATCGTTTTTCCATCATATAAATAGGTGACGAATTGCATTGCGAGATTTTCAATAGAATCTAAGCCCCTTAAAAAATCGCCATAGAGCTCTCTCTTAACGTTTTGTAAGTGGCTTTCGGTAAGATCAGATGATTGCAAAGCATTTTTTAGCAATAACCTCAACTGAGTTGAAAAAGCAATTGGCTCTGTCGTATCTAAAGAAATAATAACGCACTCAAAATCTGGATGAACTTCAATTTCTATATCAAAAGAGTCATCAATTTGACCAGATTCGTACCAGTCTTGGTTAATTGTAGAAGTCCATCCTAAAAGCATTGCAAAAAATAGCTGTAATCCGATTTTCTCTTTTAAGTAAGAACCATGTATCATATGATTTGATTTTCGATAACCAATAGCTAATTTAGGTTTTGTCACTGTCATATGGCAAGAGTTGTTTTTTATAACAGGTTCAAGACTAATAGAATCTCGGTCAATATTCTGTGAGTAACTTGTGAAATGAGATTTTTTTTGAAGGTAAGTTATAATTTCTTGTGGACTAAATTGTCCAACAAGAACTAAATTCATATTAGACAACTGATAAAAATCTTTGTGATTTTCTTGTAAATCGGTTAAGGTTATTTGAGAGATTGATTGGTAATCTCCAGCGATATCAAATGCTAATGGAGAGTTGGGGTAAAGGTTCGATAACACTCCTTGATAAAGCCTATATTCTGGGTCATCTTGATACATTTCAATTTCTTGTTTGATAATGTCTTTTTCTTTAGTAATTGACTCTTCTGTAAAGTTTGTTGTCAATACAAAGTCAAGTAGTATATCTAAGCAGTTTGTAATGTGACTTATAGTTGAAAAATAAAAACTAGTTTTATCAAAAGTTGTAAAAGCATTACTCTCGGCGCCATATTTAGTAAATTGAGTTGCAGCGTCTTGTCCTTTATCCAGTTCAAATAATTTATGTTCTAAGAAGTGAGCAATTCCTGCCGGATAATGTTCTACACAACCATTCCTCGTATATCTTGTATGGAGTGATCCAAAATTTGCTGTCAATACTCCAACAGTTTCCTTAAATGATGGTTTTGGAATAAGGTATACATTTAGTCCGCTCTCTAATGTTAACTTATATACTTCCTCCTGAAGGTTCTGATAAGTTATTTTATTAACTGTCATCCTAGTTTCCTTCCAAAAAATAAAAAGCTTGTAATTTTAATTTTGTTGCTACGCTGACAATATCTGATTTTGTTACATCGTCTACTTTGTCAATGAATAGTGCTGAAGTATGAAACTGATCTAAATAATGTTCATGATAAATGTGGTCAACTATGACCTTAGGGTTATCAGAAGCTAAAACATAGTTCATTTTCAATATATCTTTTGTTTGTTTCAATAATGTAGAAGAGAACCTGCCCATCTTAATATTATTGAATTGCTTATTAATAAGCTTCAAAAAACGCTCACGATTCTCTTTATCAATACCTGCATATATCGTAAAGAGACCTGTAAAGCTGTTAAATTGACTACCTATAGTATAGGCTAAACCTTGCTTTTCTCGAATTTCTGTAAACAACAAGGAGTGGGCAAAAGCACCAAATAAACCGTTAAATACTATTAAAGCAAAATAATCTTCATCTTTATAAGTTATTGGAAGATGATAAGCCAATTGCATAATAGATTGATTAACGTCCTTATCTTCTACTTGACTTCTCGTTATATTTTCATAAGTCTGCGTATAATCAAAAGCTAATACTTTGTGACGTGGCTCAAATGCCATACGATTAAATGCCTGAATCATTCGATAGTCATCAAAATCTCCTACGACAAAAATATCTAATTGATCTTCCTTAAGCATCTTCTGAAATTCTTGATAAGCTGTAAATGAATTTTCTGATTCCACTAAAGATGCTGTACCATACTTAGGTAAACGAAGTGTCTTATTATTGTAGAATAAAGATTTTAGTGCTAAGTCACTGCTATAAAAATTATCTTCAATATCGGCCTCTAAATATTGAATAAGGTTTTTCTTCTCAGTATCAAAAATAGATGTTTGATACTGTTCTAAAGAAATTAAAGGAGAAAACAGCATATCCTCCAAGAATGTAATAATTTGTTCAACGATATTTTCTTGTTCTAAAGTAAAGGTATTTTTAACAAATACAATATCAATATCAACAATGTGAACAAGACCCTTAGTAGAAATCTTAGTTGATAAACTAGCACCATATAAGGAAGCTAACTTTTCTCGAAATTCTTGTACCTTAGGGTACTTAGCATTTGCAGTAACTAACATTTGAGCAACGAGCGATCTACGTGCTACTGTTTTATTATTAAAATCACCTGAAAATCGAAAAGTAAGATGATTAGTCTTAAATTGTTGGTTTTTAATTAAATGTAGAGAAACGCCTTCAACTATTTTCAT
Protein sequences of DBSCAN-SWA_4 >CP019820|1811149:1818353|1812714_1813509_-|AUP13721.1|DBSCAN-SWA MDKLILGRYIPGNSLIHKLDPRSKLLAMLLFIIIVFWANNVVTNVIVFIFTLVIVGLSQIKFSYFFNGIKPMVGIILFTTLFQMLFAQGGQVIFSFWIFSITSLGLQQAALIFMRFVLIIFFSTLLTLTTTPLSLADAVESLLKPLEVLRVPAHEIGLMLSLSLRFVPTLMDDTTRIMNAQRARGVDFGEENLIHKVKSIIPILIPLFASSFKRADALAIAMEARGYQGGANRSKYRLLKWTVRDTFSILLMLLLGLSLFLLKN >CP019820|1811149:1818353|1813501_1814344_-|AUP13722.1|DBSCAN-SWA MGIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTKGEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEAERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGRKELMTLFKNLHKKGMTIVLVTHLMDDVADYTDYVYVLEAGKVTLSGQPKQIFQEVELLESKQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG >CP019820|1811149:1818353|1811149_1811854_-|AUP13719.1|DBSCAN-SWA MNKRRKLSKLNVKKQHLAYGAITLVALFSCILAVTVIFKSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTASEEAAVEQAVVTENTPATSQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAIGSAAAAQMAAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAIKAYRAQGLSAWGY >CP019820|1811149:1818353|1814319_1815159_-|AUP13723.1|DBSCAN-SWA MTNIITVNNLFFKYDSNQTHYQLENVSFHVKQGEWLSIIGHNGSGKSTTVRLIDGLLEAESGQIIIDGQELTEDNVWELRHKIGMVFQNPDNQFVGATVEDDVAFGLENKGISLKDMKERVDQALDLVGMSEFKMREPARLSGGQKQRVAIAGAVAMRPQVIILDEATSMLDPEGRLELIRTIRAIRQKYNLTVISITHDLDEVALSDRVIVMKNGKVESTSTPKALFGRGNHLISLGLDVPFTSRLMAALAANGLDIGTEYLTEKELEEQLWELNLKM >CP019820|1811149:1818353|1815158_1815722_-|AUP13724.1|DBSCAN-SWA MFPKGEFMVKKENIPNLLTVVRILMIPLFIVLTSVTTSTTWHIVAAIVFAIASLTDYLDGYLARKWQVVTNFGKFADPLADKMLVMSAFIMLVGLDLAPAWVSAIIICRELAVTGLRLLLVETGGTVLAAAMPGKIKTATQMFAVIFLLVHWMTLGNIMLYIALFFTLYSGYDYFKGAGFLFKDTFK >CP019820|1811149:1818353|1817108_1818353_-|AUP13726.1|DBSCAN-SWA MKIVEGVSLHLIKNQQFKTNHLTFRFSGDFNNKTVARRSLVAQMLVTANAKYPKVQEFREKLASLYGASLSTKISTKGLVHIVDIDIVFVKNTFTLEQENIVEQIITFLEDMLFSPLISLEQYQTSIFDTEKKNLIQYLEADIEDNFYSSDLALKSLFYNNKTLRLPKYGTASLVESENSFTAYQEFQKMLKEDQLDIFVVGDFDDYRMIQAFNRMAFEPRHKVLAFDYTQTYENITRSQVEDKDVNQSIMQLAYHLPITYKDEDYFALIVFNGLFGAFAHSLLFTEIREKQGLAYTIGSQFNSFTGLFTIYAGIDKENRERFLKLINKQFNNIKMGRFSSTLLKQTKDILKMNYVLASDNPKVIVDHIYHEHYLDQFHTSALFIDKVDDVTKSDIVSVATKLKLQAFYFLEGN >CP019820|1811149:1818353|1815823_1817107_-|AUP13725.1|DBSCAN-SWA MTVNKITYQNLQEEVYKLTLESGLNVYLIPKPSFKETVGVLTANFGSLHTRYTRNGCVEHYPAGIAHFLEHKLFELDKGQDAATQFTKYGAESNAFTTFDKTSFYFSTISHITNCLDILLDFVLTTNFTEESITKEKDIIKQEIEMYQDDPEYRLYQGVLSNLYPNSPLAFDIAGDYQSISQITLTDLQENHKDFYQLSNMNLVLVGQFSPQEIITYLQKKSHFTSYSQNIDRDSISLEPVIKNNSCHMTVTKPKLAIGYRKSNHMIHGSYLKEKIGLQLFFAMLLGWTSTINQDWYESGQIDDSFDIEIEVHPDFECVIISLDTTEPIAFSTQLRLLLKNALQSSDLTESHLQNVKRELYGDFLRGLDSIENLAMQFVTYLYDGKTMYLDLPSIVEELDLEDVITIGKDFLDNADTSDFVIFPKSS >CP019820|1811149:1818353|1811959_1812499_-|AUP13720.1|DBSCAN-SWA MSITSVKKSKPFKLGVAGLLVGASLALPLSVSAASYTVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSTTSQAEAKSQPTIENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEKVADNYVASRYGSWSAALSFWNSNGWY |
8 | uncultured_Caudovirales_phage(16.67%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|