Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
CP017459 | Staphylococcus nepalensis strain JS9 chromosome, complete genome | 1 crisprs | csa3,WYL,DEDDh,cas3,DinG | 16 | 18 | 9 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP017459_2 | 1204753-1204836 | Orphan |
NA
Consensus repeat of CP017459_2
|
1 spacers
spacers of CP017459_2
>2.1|1204779|32|CP017459|CRISPRCasFinder TGCTCTTTAGCGAAGAAAGTGTTATATTTAAA |
CRISPR arrays and Neighbor proteins around CP017459_2
The CRISPR arrays of CP017459_2 >merge|CP017459|2|1204753-1204836|CRISPRCasFinder TTGTGAAATAAATCACAATAAACGATTGCTCTTTAGCGAAGAAAGTGTTATATTTAAATTGTGAAATAAATCACAATAAGCGAT >CP017459|2|1|1204753-1204836|CRISPRCasFinder TTGTGAAATAAATCACAATAAACGAT TGCTCTTTAGCGAAGAAAGTGTTATATTTAAA TTGTGAAATAAATCACAATAAGCGAT
>CP017459.1|AWI44259.1|1203709_1204534_+|lysophospholipase MWKWETENEAKGVIVIAHNMLEHTGRYAYVITMLRRNGYHVIMGDLPGQGQTTRSNKGQIENFEVYHEHVLEWIRIANEYKLPTYFLGVGLGGLIILNLLEKVEVPIEGLMLISPLLEFKKNNKTRKDKILSNVGKLTKDTRFKVGITVEDLTRNDEVIEEAKEDQLMLQKVTYHWYKQIIEIMKETVTHLKDIKPLPVLLMYGLEDKVSDIPTMHLVKDNIETEELYFKAWKGLYHEIHNEPERDEVMRYILAFLNNSTSNIGFIVHDEHELS >CP017459.1|AWI44258.1|1202439_1203441_-|proline-dehydrogenase MPIVKNFFIGLSNNPFLNKTAKEIGPMFGAKKVVAGNTITDLVDTIERLNNKGITVTVDCLGEFVLNEGEAIQAKDQILEVMYAIYNHSLDGHMSIKLSQLGSEFDIDLAYRNLREILLKANEFGNMHINIDTEKYDSLFDITQVLDRLKGEFKNVGTVIQAYLYKADALIDKYPELRLRMVKGAYKENENIAYQTKEDIDENYIRLIKKRLLNANNVTSIATHDDKIITHIKQFIKDNNIEKDKYEFQMLYGFRSDLAGLLAREGNHFCIYVPYGDDWFSYFMRRLAERPQNLNLMFLELMKPEILKKTGFVASLLTAIGVSSALIYKVLKK >CP017459.1|AWI44257.1|1201724_1202183_+|6,7-dimethyl-8-ribityllumazine-synthase MNFEGKLIGSNLKVAIVVSRFNDFITNRLLDGAKDTLIRHEVSAGNIDVAYVPGAFEIPLVAKKLAQKGEYDAVITLGCVIRGSTSHYDYVCNEVAKGVSKANDVTDTPVIFGILTTENIEQAVERAGTKAGNKGSEAAVSAIEMANLLSEI >CP017459.1|AWI44256.1|1200531_1201713_+|bifunctional-3,4-dihydroxy-2-butanone-4-phosphate-synthase/GTP-cyclohydrolase-II MQLDSIEKALKALKNGESIIVVDDENRENEGDLVAITEWMYENTVNFMAKYGRGLICAPISKKIAQDLELNPMVNHNSDIYGTQFTVSIDHIDTTTGISADERMLTAKALIDEQTKANDFNRPGHLFPLIAQDNGVLARRGHTEASVDLALLTGAKPAALICEIMNEDGSMAKGDDLEAFKNKHQLVMISIEDLENYRKNTDAPLEAKAKVQLPTDYGNFDMYGFSTQNNEEEIVAIVSGEIKETENVRIHSACLTGDIFHSQRCDCGEQLAASMEYISENGGIILYLPQEGRGIGLINKLKAYELIEQGYDTVSANIALGFEEDLRDYQNAAKILKYLGVKRVNLLSNNPKKFGSLENYGIDIAKRIDLIVPTNKYNQDYMKTKKEKMGHLI >CP017459.1|AWI44255.1|1199888_1200521_+|riboflavin-synthase-subunit-alpha MFTGIVEEIGTIKKMTTQQSIVNLTIDCQTILSDMHIGDSISVNGVCLTVVCFDNQTFSVQVIKGTENKTYLNRLNQSDEVNLERAMSGQGRFGGHFVLGHTDEVAKITRIQNSDNSKIVTIKPSKSIINQMVQQGSITIDGVSLTVFQLKESEFDIHLIPETRKSTILNQKRVGDPVHIETDMLFKYVEKIVGNNDSGLSSEKLKSFGF >CP017459.1|AWI44254.1|1198838_1199882_+|riboflavin-biosynthesis-protein-RibD MSQYLNYAIQLAKMVDGQTGINPPVGAVVVNQGRIVGIGAHLQKGDKHAEVQALDMANETAAGGTIYISLEPCSHYGSTPPCVNKIIDFGIKQVVYAVKDTTLTSRGDEVLQHAGVKVEFRHKPEAEALYKDFFITKRQGIPEVTVKVSCSLDGKQATDKGESKWITNKSVKNDVFMLRHKHDAVITGTGTLNADNPQYTTRIEEGKHPIRIILSKSGRIDFDLDMFNQSNVPIWIYTEQEKLKSDIEHVEVIHCSNCSLENILKDLYQKGIGRVLVEAGPTITSEFLQSNYTNELILYYAPKMIGGSGDYQFFKTENVFNLSEAPQFEIVNSQVLEQNIKLELRKK >CP017459.1|AWI44253.1|1196674_1198156_+|pyridine-nucleotide-disulfide-oxidoreductase MRIAIIGMGTAGVSLLKELVKYDEFDQMKVDVYDNPKNMGQGIPFQNDSDQLLINLPAKQMSLNLKNEREFYEWYQQQSIFKFSNPEYLPRFIFGHYMKDYLETYHKQYKNIQMIKKEVLEVFIDADIGETNIKYVVCTSEKPDCQQQYDIVFLTVGTLSYHDPYQLKGTPGYIQTPYPTYDTLNEVDSTDRIAIIGTGLASLDVIRFVTAHHPNLPISVTSRKGHLPSVRGDMPEIQFKYVTPENFNKIKKENLGNVPLEDALTLFRKDCTYYDIPVEKLVHRRKGDPIADLTYDLEHKEILGKFQSILELAKENLNWIWNSFSRDDQKTFLRNYQSILKENSNPMPPRTARLIINHIQNGQIEIKKGLEDVKHDGQHFWFKYEDDFKAIDKFDVVINATGSKSHLSELDNDDQLILNLENRQVVQAHPLGGIQIIPETNQIISPRYGTLKNMFALGQLTNGINQSRNGVTMIVKQAVSVVENLLNRDQNKC >CP017459.1|AWI44252.1|1194210_1195065_+|autolysin MTKHKKGSILSVIGLLIVLVVAAVIVFSMISDQIFFKEVNQQEKVEQLNITLDKAAKKQIDNYTSQQVSSKNNDTWRDASSTEIKAAMNSSNFIESDTQKYQFLELDKYQGIDENRIKRMLIDNPILLEHSDDFIKAAKEKHVNEVYLISHAILETGSAKSELSSGVEIDGKKYYNFFGVGALDEDPVKTGAEYAKKHGWDTPEKAISGGANFIHGHFLSNKDQNTLYSMRWNPKKPGEHQYATDIKWAESNASLMADFYKDMKTEGKYYKYFVYKDDKKHQDT >CP017459.1|AWI44251.1|1193822_1194047_+|hypothetical-protein MDYAHLNLEHFFARHNDLDTIKDKSDFVMINNLTKEMMYRDGEIEGTIDLNRYYYKNRSQAVSFIIMEYNKSQE >CP017459.1|AWI44250.1|1193126_1193600_-|hypothetical-protein MPFEQLYFQFKHIIFILLNKYRIKYNREEYTQLLTIKMWELTQNYLPHHTYSLGQFLYNRLNYYLIDLFRCQNQKTNILYLTEQIDEQTNNTDITNNHLMYQHFLQQLTEKERQWLILKLSGYKQSELACMLNCSISTVKNYRKKVQKKYYKFYSPK >CP017459.1|AWI44260.1|1204867_1205824_+|L-lactate-dehydrogenase MKYSKGNKVVLIGDGAVGSSYAFALVSQGIADELVIIDLDETKVHGDVADLNHSAPYGGSPIKIKAGSYKDCSNADLIVITAGAAQKPGETRLDLVEKNTRIFKEIVSTIMQTGFNGIFLIATNPVDVLSYVTQKVSGLPKAQVIGSGTILDTARFKYELAREFNVSPWSVDAQIIGEHGDSELAVWSQANIAGQSLYDILKDNPDKQHRIDEIFINTRDAAYDIIKAKGATYYGIAMGLIRITQAILKNQNVVLPVSSYLNGEYGQNDVYIGVPTLINRNGAVKVYETQLNSSESKLFENSAIILKEMQNKINQLIA >CP017459.1|AWI44261.1|1205973_1206375_+|repressor MGKTITDMVDSVLRLEHVLNDIDDIFEKVQKQYKMSKEEILILLTLWQEGSMTLKEMDDFVQIKSYKRTRTYNDLVEKEWIIKERPVNDERTVIIHFNEDLEAQREALLDYFKEEIDEKSSSIQSSLKSILDL >CP017459.1|AWI44262.1|1206731_1207292_-|16S-rRNA-(cytosine(1402)-N(4))-methyltransferase MKIERILPFSKTLIQQHVSADSIVIDATCGNGNDTEFLAQQVPDGKVYGFDIQDIAIQNTKTKTKTFRHVHLIHDSHANIKQYIPREERGHIDAAIFNLGYLPKGDKSIVTNPNSTLAAINSIFDILAPEGIIVLVIYHGHEEGKTERDALLNYLQHFDQNKAHILQYQFINQQNHPPFICAIEKR >CP017459.1|AWI44263.1|1207288_1208242_-|TIGR01212-family-radical-SAM-protein MGQFFPYAFENKRYHTWNYHLKNKFGQKIFKVAIDGGFDCPNRDGTVAHGGCTFCSAAGSGDFAGNRVDPIDVQFQQIKDRMHEKWHEGQYIAYFQAFTNTHAPVEVLREKYETALKEPGVVGLSIGTRPDCLPDDVVEYLAELNERTYLWVELGLQTVHQKTSDLINRAHDMETYYEGVAKLRKHNINVCTHIINGLPEEDYDMMMETAKEVAQMDVQGIKIHLLHLLKGTPMVKQYEKGMLEFMSQDDYTNLVCDQLEILPKEMIVHRITGDGPIDLMVGPMWSVNKWEVLNEIDDELARRNSYQGKNYESIIKS >CP017459.1|AWI44264.1|1208351_1209521_+|multidrug-MFS-transporter MNMPKSVWWLVIGMALNITGSSFLWPLNTIYMNEVLDKSLTMAGLVLMINSFGMVIGNLLGGNLFDKLGGYPTIMIGTVICLSSTTLLNFFHGWPWYAVWLVCLGFGGGMIIPAIYALAGAIWPKGGRQTFNAIYLAQNLGVAIGAASGGFVAELSFNYIFIANLLMYIAFAIVAVSQFNIKLDVKVKSNDAMSLLSKAYRPQFIALSLICVMFSICWIAYIQWESTIASFTQVLNISMSQYSLLWTVNGIMILVAQPLIIPIIRLLKGNLKHQMYVGIGIFIISFFVTSFAEQFSVFMVGMIILTLGEMFVWPAVPTIANQLAPKGKEGSFQGYVNSAATVGKAFGPLIGGVVVDMFNMQVMFLSMISLLAIALIFLTFYDRQLPKDI >CP017459.1|AWI44265.1|1212344_1212656_+|sulfurtransferase METISVDELKSKILNSNPIQIIDVRTDEETAMGVIPEAETIPMDQIPDNLNHFNSNDTYYIICKAGGRSAQVVQYLERNGVHAVNVEGGMDAWGDEALDIRSI >CP017459.1|AWI44266.1|1213171_1214431_-|hypothetical-protein MYQTIIIGGGPSGLMAAAAASQNSNKVLLIEKKKGLGRKLKISGGGRCNVTNRLPYEEIIKNIPGNGKFLYSPFSVFDNESIIHFFESRGVSLKEEDHGRMFPVSNKAQDVVDALIHTIEKNNVTVKQETVVHGIEHTQKQTFKITTDNQETIESHSLVIATGGTSVPKTGSTGDGYKFAKQLGHTITELFPTEVPITSPEPFIKDRRLKGLSLKNVALSVLKKNEKKRITHQMDMIFTHFGVSGPAALRCSQFVYKEQKNQKQQNIKMQIDVFPDLSQAQVEAKIRKLLKDTPDKYVKNSLHGLIEERYLLYMLELANISEELTAHHISNEQFNKLVNLFKAFTFTVNGTLSIEKAFVTGGGVSLKEIEPKTMMSKHVPGLFMCGELLDIHGYTGGYNITSALVTGHISGTNASKFQL >CP017459.1|AWI44267.1|1214560_1216198_+|polysaccharide-biosynthesis-protein MSESKELVRGTFLITLSILITKVLGVLYIIPFYAIIGGEEKLAPFNYAYTPYNIAIAVATAGVPLAASKYVSKYNALGAYKVSEKLYKSSFIVMTITGFIGFFILYLLAPTIATITLANKSGAKGGWSVEDITWIIRIISMVVIFIPLLATWRGVFQGYKSMGPTAVSEVIEQIARILFILIGSYLVLNVFNGSVLQANGIATFAAAIGAVAGIFTLWYYWKKRKPNIEKMVATDVSGINVSYGKMYKEIISYSIPFVIVSLNFPLFNLVDQFTHNGALDLAGVPSRLHDYFFTILNMTTNKIVMIPTSLSAGFAVSLIPFITKTYESGELSEMHRQIRTSLGVLMYITVPASLGIMALALPLYTVFYSYNIDGSQLLFYYAPVAILIGLLSVTASMLQGIDKQKLTVFVILVAVVLKVVLNTPLIMAFHTAGAILSTAIALLFAVLCNFYILKKYANFDFSETWLHFCKIFLYGLIMMVAVELSSFLLQMFISPETKFGALSILIISVIIGMLVYGGITMKTKLADQFLGEIPNKVRRKLGIIK >CP017459.1|AWI44268.1|1216194_1216896_+|16S-rRNA-pseudouridine(516)-synthase MRIDKFLANMGVGTRTEVKQLLKSGSVFINEQKEKSPKKQIDPNNDIIKINNEIIQYIDKVYLMLNKPKGYISATADNQHQTVIELVKSYQFLEIFPVGRLDKDTEGLLLITNDGAFNHELMSPTKHVSKTYEVISEKNITNNDINSFKMGIELNEGLAMPATLVKSDEPYKSFVTIYEGRYHQVKRMFHAIDNEVLALKRVSIGELKLDESLGPGEYRHLTQQDFKQLGLNL >CP017459.1|AWI44269.1|1216908_1217310_+|hypothetical-protein MSKLLKAIIGVGGAAAAVVLSKKENRDKLKDEYSKYKSNPESYKQNAKDIASQISSKAGETYNEVKQDPKGYASRVKQDPKGFINEQKDRFKGVNEKEEEHVEEARFTDEGAAAPSNNLRVVTEEELKNNKNK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|
CP017459_1 | 1.13|72832|18|CP017459|CRT | 72832-72849 | 18 | CP017459.1 | 71926-71943 | 0 | 1.0 |
CP017459_1 | 1.36|74176|18|CP017459|CRT | 74176-74193 | 18 | CP017459.1 | 71926-71943 | 0 | 1.0 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | CP017459.1 | 71938-71967 | 1 | 0.967 |
CP017459_1 | 1.10|72658|24|CP017459|CRT | 72658-72681 | 24 | CP017459.1 | 71938-71961 | 1 | 0.958 |
CP017459_1 | 1.13|72832|18|CP017459|CRT | 72832-72849 | 18 | CP017459.1 | 71878-71895 | 1 | 0.944 |
CP017459_1 | 1.15|72916|18|CP017459|CRT | 72916-72933 | 18 | CP017459.1 | 71926-71943 | 1 | 0.944 |
CP017459_1 | 1.17|73018|18|CP017459|CRT | 73018-73035 | 18 | CP017459.1 | 71926-71943 | 1 | 0.944 |
CP017459_1 | 1.19|73126|54|CP017459|CRT | 73126-73179 | 54 | CP017459.1 | 71938-71991 | 1 | 0.981 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | CP017459.1 | 71938-71967 | 1 | 0.967 |
CP017459_1 | 1.23|73360|18|CP017459|CRT | 73360-73377 | 18 | CP017459.1 | 71926-71943 | 1 | 0.944 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | CP017459.1 | 71938-71967 | 1 | 0.967 |
CP017459_1 | 1.36|74176|18|CP017459|CRT | 74176-74193 | 18 | CP017459.1 | 71878-71895 | 1 | 0.944 |
CP017459_1 | 1.39|74308|42|CP017459|CRT | 74308-74349 | 42 | CP017459.1 | 71926-71967 | 1 | 0.976 |
CP017459_1 | 1.12|72772|42|CP017459|CRT | 72772-72813 | 42 | CP017459.1 | 71926-71967 | 2 | 0.952 |
CP017459_1 | 1.15|72916|18|CP017459|CRT | 72916-72933 | 18 | CP017459.1 | 71878-71895 | 2 | 0.889 |
CP017459_1 | 1.17|73018|18|CP017459|CRT | 73018-73035 | 18 | CP017459.1 | 71878-71895 | 2 | 0.889 |
CP017459_1 | 1.23|73360|18|CP017459|CRT | 73360-73377 | 18 | CP017459.1 | 71878-71895 | 2 | 0.889 |
CP017459_1 | 1.29|73684|48|CP017459|CRT | 73684-73731 | 48 | CP017459.1 | 71938-71985 | 2 | 0.958 |
CP017459_1 | 1.46|74794|24|CP017459|CRT | 74794-74817 | 24 | CP017459.1 | 71938-71961 | 2 | 0.917 |
CP017459_1 | 1.47|74836|30|CP017459|CRT | 74836-74865 | 30 | CP017459.1 | 71938-71967 | 2 | 0.933 |
CP017459_1 | 1.51|75040|30|CP017459|CRT | 75040-75069 | 30 | CP017459.1 | 71938-71967 | 2 | 0.933 |
1. spacer 1.13|72832|18|CP017459|CRT matches to position: 71926-71943, mismatch: 0, identity: 1.0
tagtgacgcagatgcgga CRISPR spacer tagtgacgcagatgcgga Protospacer ******************
2. spacer 1.36|74176|18|CP017459|CRT matches to position: 71926-71943, mismatch: 0, identity: 1.0
tagtgacgcagatgcgga CRISPR spacer tagtgacgcagatgcgga Protospacer ******************
3. spacer 1.8|72538|30|CP017459|CRT matches to position: 71938-71967, mismatch: 1, identity: 0.967
tgcggatgccgacagtgatgcggatgctga CRISPR spacer tgcggatgccgacagtgatgcggatgcgga Protospacer *************************** **
4. spacer 1.10|72658|24|CP017459|CRT matches to position: 71938-71961, mismatch: 1, identity: 0.958
tgcggatgcagacagtgatgcgga CRISPR spacer tgcggatgccgacagtgatgcgga Protospacer ********* **************
5. spacer 1.13|72832|18|CP017459|CRT matches to position: 71878-71895, mismatch: 1, identity: 0.944
tagtgacgcagatgcgga CRISPR spacer tagtgacgcagacgcgga Protospacer ************.*****
6. spacer 1.15|72916|18|CP017459|CRT matches to position: 71926-71943, mismatch: 1, identity: 0.944
tagtgacgcagatgccga CRISPR spacer tagtgacgcagatgcgga Protospacer *************** **
7. spacer 1.17|73018|18|CP017459|CRT matches to position: 71926-71943, mismatch: 1, identity: 0.944
tagtgacgcggatgcgga CRISPR spacer tagtgacgcagatgcgga Protospacer *********.********
8. spacer 1.19|73126|54|CP017459|CRT matches to position: 71938-71991, mismatch: 1, identity: 0.981
tgcggatgccgacagtgatgcggatgcggatgcagacagtgatgcggatgcgga CRISPR spacer tgcggatgccgacagtgatgcggatgcggatgccgacagtgatgcggatgcgga Protospacer ********************************* ********************
9. spacer 1.20|73198|30|CP017459|CRT matches to position: 71938-71967, mismatch: 1, identity: 0.967
tgcggatgcagacagtgatgcggatgcgga CRISPR spacer tgcggatgccgacagtgatgcggatgcgga Protospacer ********* ********************
10. spacer 1.23|73360|18|CP017459|CRT matches to position: 71926-71943, mismatch: 1, identity: 0.944
tagtgacgcggatgcgga CRISPR spacer tagtgacgcagatgcgga Protospacer *********.********
11. spacer 1.35|74128|30|CP017459|CRT matches to position: 71938-71967, mismatch: 1, identity: 0.967
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgccgacagtgatgcggatgcgga Protospacer ******************.***********
12. spacer 1.36|74176|18|CP017459|CRT matches to position: 71878-71895, mismatch: 1, identity: 0.944
tagtgacgcagatgcgga CRISPR spacer tagtgacgcagacgcgga Protospacer ************.*****
13. spacer 1.39|74308|42|CP017459|CRT matches to position: 71926-71967, mismatch: 1, identity: 0.976
tagtgacgcagatgcggatgccgacagtgatgcggatgctga CRISPR spacer tagtgacgcagatgcggatgccgacagtgatgcggatgcgga Protospacer *************************************** **
14. spacer 1.12|72772|42|CP017459|CRT matches to position: 71926-71967, mismatch: 2, identity: 0.952
tagtgacgcggatgcggatgccgacagtgacgcggatgcgga CRISPR spacer tagtgacgcagatgcggatgccgacagtgatgcggatgcgga Protospacer *********.********************.***********
15. spacer 1.15|72916|18|CP017459|CRT matches to position: 71878-71895, mismatch: 2, identity: 0.889
tagtgacgcagatgccga CRISPR spacer tagtgacgcagacgcgga Protospacer ************.** **
16. spacer 1.17|73018|18|CP017459|CRT matches to position: 71878-71895, mismatch: 2, identity: 0.889
tagtgacgcggatgcgga CRISPR spacer tagtgacgcagacgcgga Protospacer *********.**.*****
17. spacer 1.23|73360|18|CP017459|CRT matches to position: 71878-71895, mismatch: 2, identity: 0.889
tagtgacgcggatgcgga CRISPR spacer tagtgacgcagacgcgga Protospacer *********.**.*****
18. spacer 1.29|73684|48|CP017459|CRT matches to position: 71938-71985, mismatch: 2, identity: 0.958
tgcggatgcagacagtgatgcggatgcggatgccgacagtgatgccga CRISPR spacer tgcggatgccgacagtgatgcggatgcggatgccgacagtgatgcgga Protospacer ********* *********************************** **
19. spacer 1.46|74794|24|CP017459|CRT matches to position: 71938-71961, mismatch: 2, identity: 0.917
tgctgatgccgacagtgatgctga CRISPR spacer tgcggatgccgacagtgatgcgga Protospacer *** ***************** **
20. spacer 1.47|74836|30|CP017459|CRT matches to position: 71938-71967, mismatch: 2, identity: 0.933
tgcggatgcagacagtgatgcggatgctga CRISPR spacer tgcggatgccgacagtgatgcggatgcgga Protospacer ********* ***************** **
21. spacer 1.51|75040|30|CP017459|CRT matches to position: 71938-71967, mismatch: 2, identity: 0.933
tgcggatgcagacagtgatgcggatgctga CRISPR spacer tgcggatgccgacagtgatgcggatgcgga Protospacer ********* ***************** **
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
CP017459_1 | 1.10|72658|24|CP017459|CRT | 72658-72681 | 24 | MH617210 | Microviridae sp. isolate ctdb759, complete genome | 14-37 | 3 | 0.875 |
CP017459_1 | 1.14|72868|30|CP017459|CRT | 72868-72897 | 30 | NZ_CP032923 | Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence | 490018-490047 | 3 | 0.9 |
CP017459_1 | 1.14|72868|30|CP017459|CRT | 72868-72897 | 30 | NZ_CP032923 | Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence | 490174-490203 | 3 | 0.9 |
CP017459_1 | 1.37|74212|30|CP017459|CRT | 74212-74241 | 30 | NZ_CP032923 | Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence | 490018-490047 | 3 | 0.9 |
CP017459_1 | 1.37|74212|30|CP017459|CRT | 74212-74241 | 30 | NZ_CP032923 | Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence | 490174-490203 | 3 | 0.9 |
CP017459_1 | 1.46|74794|24|CP017459|CRT | 74794-74817 | 24 | NZ_CP043499 | Rhizobium grahamii strain BG7 plasmid unnamed, complete sequence | 231429-231452 | 3 | 0.875 |
CP017459_1 | 1.46|74794|24|CP017459|CRT | 74794-74817 | 24 | NZ_CP046573 | Rhodococcus sp. WAY2 plasmid pRWAY01, complete sequence | 566524-566547 | 3 | 0.875 |
CP017459_1 | 1.46|74794|24|CP017459|CRT | 74794-74817 | 24 | CP003676 | Staphylococcus warneri SG1 plasmid clone pvSw7 genomic sequence | 2897-2920 | 3 | 0.875 |
CP017459_1 | 1.66|76114|24|CP017459|CRT | 76114-76137 | 24 | NZ_AP019659 | Vibrio ponticus strain DSM 16217 plasmid pVPon1 | 4885-4908 | 3 | 0.875 |
CP017459_1 | 1.10|72658|24|CP017459|CRT | 72658-72681 | 24 | NZ_CP042500 | Enterobacter sp. E76 plasmid pE76_001, complete sequence | 113503-113526 | 4 | 0.833 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | MH617210 | Microviridae sp. isolate ctdb759, complete genome | 14-43 | 5 | 0.833 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | NZ_CP012185 | Pseudonocardia sp. EC080619-01 plasmid pBCI1-2, complete sequence | 280871-280900 | 5 | 0.833 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | NZ_CP012182 | Pseudonocardia sp. EC080610-09 plasmid pBCI2-1, complete sequence | 204242-204271 | 5 | 0.833 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | MH617210 | Microviridae sp. isolate ctdb759, complete genome | 14-43 | 5 | 0.833 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | MH617210 | Microviridae sp. isolate ctdb759, complete genome | 14-43 | 5 | 0.833 |
CP017459_1 | 1.5|72364|30|CP017459|CRT | 72364-72393 | 30 | KC117377 | Halovirus HVTV-1, complete genome | 89400-89429 | 6 | 0.8 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | NZ_CP022140 | Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence | 33677-33706 | 6 | 0.8 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | CP053317 | Salmonella enterica subsp. salamae serovar 6,8:a:z52 strain 62-3163 plasmid unnamed, complete sequence | 202555-202584 | 6 | 0.8 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | NZ_CP042500 | Enterobacter sp. E76 plasmid pE76_001, complete sequence | 113497-113526 | 6 | 0.8 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | NC_012858 | Rhizobium leguminosarum bv. trifolii WSM1325 plasmid pR132502, complete sequence | 390632-390661 | 6 | 0.8 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | NC_007766 | Rhizobium etli CFN 42 plasmid p42f, complete sequence | 559091-559120 | 6 | 0.8 |
CP017459_1 | 1.24|73396|30|CP017459|CRT | 73396-73425 | 30 | KC117377 | Halovirus HVTV-1, complete genome | 89400-89429 | 6 | 0.8 |
CP017459_1 | 1.25|73444|30|CP017459|CRT | 73444-73473 | 30 | KC117377 | Halovirus HVTV-1, complete genome | 89400-89429 | 6 | 0.8 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP024924 | Sphingomonas sp. Cra20 plasmid unnamed, complete sequence | 104157-104186 | 6 | 0.8 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP050100 | Rhizobium leguminosarum bv. trifolii strain 9B plasmid pRL9b3, complete sequence | 114943-114972 | 6 | 0.8 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP053443 | Rhizobium leguminosarum bv. trifolii strain CC275e plasmid pRltCC275eC, complete sequence | 91054-91083 | 6 | 0.8 |
CP017459_1 | 1.47|74836|30|CP017459|CRT | 74836-74865 | 30 | MH617210 | Microviridae sp. isolate ctdb759, complete genome | 14-43 | 6 | 0.8 |
CP017459_1 | 1.51|75040|30|CP017459|CRT | 75040-75069 | 30 | MH617210 | Microviridae sp. isolate ctdb759, complete genome | 14-43 | 6 | 0.8 |
CP017459_1 | 1.56|75364|30|CP017459|CRT | 75364-75393 | 30 | LT598654 | Phage NCTB genome assembly, complete genome: monopartite | 9430-9459 | 6 | 0.8 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | CP052500 | Klebsiella pneumoniae strain B17KP0021 plasmid unnamed | 2462-2491 | 7 | 0.767 |
CP017459_1 | 1.8|72538|30|CP017459|CRT | 72538-72567 | 30 | NZ_CP012887 | Mycobacterium chimaera strain AH16 plasmid unnamed2, complete sequence | 24505-24534 | 7 | 0.767 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | NZ_CP021084 | Deinococcus ficus strain CC-FR2-10 plasmid pDFI3, complete sequence | 90973-91002 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NC_014310 | Ralstonia solanacearum PSI07 plasmid mpPSI07, complete sequence | 1439808-1439837 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022762 | Ralstonia solanacearum strain T95 plasmid unnamed, complete sequence | 1306080-1306109 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022140 | Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence | 33002-33031 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022118 | Salmonella enterica subsp. enterica serovar Macclesfield str. S-1643 plasmid unnamed1, complete sequence | 197207-197236 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022118 | Salmonella enterica subsp. enterica serovar Macclesfield str. S-1643 plasmid unnamed1, complete sequence | 197882-197911 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NC_011366 | Rhizobium leguminosarum bv. trifolii WSM2304 plasmid pRLG202, complete sequence | 169983-170012 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP014703 | Ralstonia solanacearum strain KACC 10722 plasmid, complete sequence | 1305102-1305131 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022760 | Ralstonia solanacearum strain T98 plasmid unnamed, complete sequence | 1350519-1350548 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022789 | Ralstonia solanacearum strain SL3175 plasmid unnamed, complete sequence | 1350510-1350539 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022771 | Ralstonia solanacearum strain T51 plasmid unnamed, complete sequence | 1306072-1306101 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022777 | Ralstonia solanacearum strain T11 plasmid unnamed, complete sequence | 1305426-1305455 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP022799 | Ralstonia solanacearum strain SL2064 plasmid unnamed, complete sequence | 1306063-1306092 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | CP053317 | Salmonella enterica subsp. salamae serovar 6,8:a:z52 strain 62-3163 plasmid unnamed, complete sequence | 201880-201909 | 7 | 0.767 |
CP017459_1 | 1.35|74128|30|CP017459|CRT | 74128-74157 | 30 | NZ_CP045959 | Salmonella enterica subsp. enterica serovar Birkenhead strain AUSMDU00010532 plasmid pAUSMDU00010532_01, complete sequence | 113715-113744 | 7 | 0.767 |
CP017459_1 | 1.47|74836|30|CP017459|CRT | 74836-74865 | 30 | MF754113 | Vibrio phage vB_VpaS_KF3, complete genome | 74168-74197 | 7 | 0.767 |
CP017459_1 | 1.47|74836|30|CP017459|CRT | 74836-74865 | 30 | MF754114 | Vibrio phage vB_VpaS_KF4, complete genome | 19572-19601 | 7 | 0.767 |
CP017459_1 | 1.47|74836|30|CP017459|CRT | 74836-74865 | 30 | NZ_CP029776 | Deinococcus actinosclerus strain Deinococcus actinosclerus SJTR plasmid unnamed2, complete sequence | 96470-96499 | 7 | 0.767 |
CP017459_1 | 1.49|74944|30|CP017459|CRT | 74944-74973 | 30 | MW117966 | Synechococcus phage S-H9-1, complete genome | 82655-82684 | 7 | 0.767 |
CP017459_1 | 1.51|75040|30|CP017459|CRT | 75040-75069 | 30 | MF754113 | Vibrio phage vB_VpaS_KF3, complete genome | 74168-74197 | 7 | 0.767 |
CP017459_1 | 1.51|75040|30|CP017459|CRT | 75040-75069 | 30 | MF754114 | Vibrio phage vB_VpaS_KF4, complete genome | 19572-19601 | 7 | 0.767 |
CP017459_1 | 1.51|75040|30|CP017459|CRT | 75040-75069 | 30 | NZ_CP029776 | Deinococcus actinosclerus strain Deinococcus actinosclerus SJTR plasmid unnamed2, complete sequence | 96470-96499 | 7 | 0.767 |
CP017459_1 | 1.56|75364|30|CP017459|CRT | 75364-75393 | 30 | MW117966 | Synechococcus phage S-H9-1, complete genome | 82655-82684 | 7 | 0.767 |
CP017459_1 | 1.7|72490|30|CP017459|CRT | 72490-72519 | 30 | NC_021911 | Rhizobium etli bv. mimosae str. Mim1 plasmid pRetMIM1f, complete sequence | 650305-650334 | 8 | 0.733 |
CP017459_1 | 1.7|72490|30|CP017459|CRT | 72490-72519 | 30 | NZ_CP009619 | Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence | 143662-143691 | 8 | 0.733 |
CP017459_1 | 1.7|72490|30|CP017459|CRT | 72490-72519 | 30 | NZ_CP050090 | Rhizobium leguminosarum bv. trifolii strain 23B plasmid pRL23b4, complete sequence | 124630-124659 | 8 | 0.733 |
CP017459_1 | 1.7|72490|30|CP017459|CRT | 72490-72519 | 30 | NC_007766 | Rhizobium etli CFN 42 plasmid p42f, complete sequence | 347108-347137 | 8 | 0.733 |
CP017459_1 | 1.7|72490|30|CP017459|CRT | 72490-72519 | 30 | NZ_CP020911 | Rhizobium etli strain NXC12 plasmid pRetNXC12e, complete sequence | 476047-476076 | 8 | 0.733 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | MF754113 | Vibrio phage vB_VpaS_KF3, complete genome | 74168-74197 | 8 | 0.733 |
CP017459_1 | 1.20|73198|30|CP017459|CRT | 73198-73227 | 30 | MF754114 | Vibrio phage vB_VpaS_KF4, complete genome | 19572-19601 | 8 | 0.733 |
CP017459_1 | 1.21|73246|30|CP017459|CRT | 73246-73275 | 30 | NZ_CP012656 | Lactobacillus plantarum strain HFC8 isolate Lactobacillus plantarum plasmid pMK08, complete sequence | 8225-8254 | 8 | 0.733 |
CP017459_1 | 1.21|73246|30|CP017459|CRT | 73246-73275 | 30 | NZ_CP012656 | Lactobacillus plantarum strain HFC8 isolate Lactobacillus plantarum plasmid pMK08, complete sequence | 196-225 | 8 | 0.733 |
CP017459_1 | 1.21|73246|30|CP017459|CRT | 73246-73275 | 30 | NZ_CP009619 | Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence | 143662-143691 | 8 | 0.733 |
CP017459_1 | 1.47|74836|30|CP017459|CRT | 74836-74865 | 30 | NZ_CP042500 | Enterobacter sp. E76 plasmid pE76_001, complete sequence | 113497-113526 | 8 | 0.733 |
CP017459_1 | 1.49|74944|30|CP017459|CRT | 74944-74973 | 30 | NZ_CP043762 | Paenibacillus sp. 37 plasmid pART37, complete sequence | 473642-473671 | 8 | 0.733 |
CP017459_1 | 1.49|74944|30|CP017459|CRT | 74944-74973 | 30 | NZ_CP009619 | Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence | 143662-143691 | 8 | 0.733 |
CP017459_1 | 1.50|74992|30|CP017459|CRT | 74992-75021 | 30 | NC_021911 | Rhizobium etli bv. mimosae str. Mim1 plasmid pRetMIM1f, complete sequence | 650305-650334 | 8 | 0.733 |
CP017459_1 | 1.50|74992|30|CP017459|CRT | 74992-75021 | 30 | NZ_CP009619 | Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence | 143662-143691 | 8 | 0.733 |
CP017459_1 | 1.50|74992|30|CP017459|CRT | 74992-75021 | 30 | NZ_CP050090 | Rhizobium leguminosarum bv. trifolii strain 23B plasmid pRL23b4, complete sequence | 124630-124659 | 8 | 0.733 |
CP017459_1 | 1.50|74992|30|CP017459|CRT | 74992-75021 | 30 | NC_007766 | Rhizobium etli CFN 42 plasmid p42f, complete sequence | 347108-347137 | 8 | 0.733 |
CP017459_1 | 1.50|74992|30|CP017459|CRT | 74992-75021 | 30 | NZ_CP020911 | Rhizobium etli strain NXC12 plasmid pRetNXC12e, complete sequence | 476047-476076 | 8 | 0.733 |
CP017459_1 | 1.51|75040|30|CP017459|CRT | 75040-75069 | 30 | NZ_CP042500 | Enterobacter sp. E76 plasmid pE76_001, complete sequence | 113497-113526 | 8 | 0.733 |
CP017459_1 | 1.56|75364|30|CP017459|CRT | 75364-75393 | 30 | NZ_CP009619 | Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence | 143662-143691 | 8 | 0.733 |
CP017459_1 | 1.56|75364|30|CP017459|CRT | 75364-75393 | 30 | NZ_CP043762 | Paenibacillus sp. 37 plasmid pART37, complete sequence | 473642-473671 | 8 | 0.733 |
CP017459_1 | 1.56|75364|30|CP017459|CRT | 75364-75393 | 30 | HQ634174 | Cyanophage MED4-213, complete genome | 164081-164110 | 8 | 0.733 |
1. spacer 1.10|72658|24|CP017459|CRT matches to MH617210 (Microviridae sp. isolate ctdb759, complete genome) position: , mismatch: 3, identity: 0.875
tgcggatgcagacagtgatgcgga CRISPR spacer agcggatgccgaccgtgatgcgga Protospacer ******** *** **********
2. spacer 1.14|72868|30|CP017459|CRT matches to NZ_CP032923 (Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence) position: , mismatch: 3, identity: 0.9
tgcggatgcagatagtgacgcggatgcgga CRISPR spacer cgcggatgcagatgctgacgcggatgcgga Protospacer .************. ***************
3. spacer 1.14|72868|30|CP017459|CRT matches to NZ_CP032923 (Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence) position: , mismatch: 3, identity: 0.9
tgcggatgcagatagtgacgcggatgcgga CRISPR spacer cgcggatgcagatgctgacgcggatgcgga Protospacer .************. ***************
4. spacer 1.37|74212|30|CP017459|CRT matches to NZ_CP032923 (Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence) position: , mismatch: 3, identity: 0.9
tgcggatgcagatagtgacgcggatgcgga CRISPR spacer cgcggatgcagatgctgacgcggatgcgga Protospacer .************. ***************
5. spacer 1.37|74212|30|CP017459|CRT matches to NZ_CP032923 (Agrobacterium tumefaciens strain 1D1108 plasmid pAt1D1108a, complete sequence) position: , mismatch: 3, identity: 0.9
tgcggatgcagatagtgacgcggatgcgga CRISPR spacer cgcggatgcagatgctgacgcggatgcgga Protospacer .************. ***************
6. spacer 1.46|74794|24|CP017459|CRT matches to NZ_CP043499 (Rhizobium grahamii strain BG7 plasmid unnamed, complete sequence) position: , mismatch: 3, identity: 0.875
tgctgatgccgacagtgatgctga CRISPR spacer cgctgctgccgacggtgatgctga Protospacer .**** *******.**********
7. spacer 1.46|74794|24|CP017459|CRT matches to NZ_CP046573 (Rhodococcus sp. WAY2 plasmid pRWAY01, complete sequence) position: , mismatch: 3, identity: 0.875
tgctgatgccgacagtgatgctga CRISPR spacer tgctgataccgaccgtgatgctgc Protospacer *******.***** *********
8. spacer 1.46|74794|24|CP017459|CRT matches to CP003676 (Staphylococcus warneri SG1 plasmid clone pvSw7 genomic sequence) position: , mismatch: 3, identity: 0.875
tgctgatgccgacagtgatgctga CRISPR spacer cgctgatgccgacgctgatgctga Protospacer .************. *********
9. spacer 1.66|76114|24|CP017459|CRT matches to NZ_AP019659 (Vibrio ponticus strain DSM 16217 plasmid pVPon1) position: , mismatch: 3, identity: 0.875
tgctgatgcagacagtgatgctga CRISPR spacer tgatgatgcagacattgatgctgc Protospacer ** *********** ********
10. spacer 1.10|72658|24|CP017459|CRT matches to NZ_CP042500 (Enterobacter sp. E76 plasmid pE76_001, complete sequence) position: , mismatch: 4, identity: 0.833
tgcggatgcagacagtgatgcgga CRISPR spacer ggcggatgcaaacagtgatgcgtt Protospacer *********.***********
11. spacer 1.8|72538|30|CP017459|CRT matches to MH617210 (Microviridae sp. isolate ctdb759, complete genome) position: , mismatch: 5, identity: 0.833
tgcggatgccgacagtgatgcggatgctga- CRISPR spacer agcggatgccgaccgtgatgcgga-gcgggc Protospacer ************ ********** ** *.
12. spacer 1.8|72538|30|CP017459|CRT matches to NZ_CP012185 (Pseudonocardia sp. EC080619-01 plasmid pBCI1-2, complete sequence) position: , mismatch: 5, identity: 0.833
tgcg-gatgccgacagtgatgcggatgctga CRISPR spacer -gcgcgccgccgacagtgtggcggatgctga Protospacer *** * .********** ***********
13. spacer 1.8|72538|30|CP017459|CRT matches to NZ_CP012182 (Pseudonocardia sp. EC080610-09 plasmid pBCI2-1, complete sequence) position: , mismatch: 5, identity: 0.833
tgcg-gatgccgacagtgatgcggatgctga CRISPR spacer -gcgcgccgccgacagtgtggcggatgctga Protospacer *** * .********** ***********
14. spacer 1.20|73198|30|CP017459|CRT matches to MH617210 (Microviridae sp. isolate ctdb759, complete genome) position: , mismatch: 5, identity: 0.833
tgcggatgcagacagtgatgcggatgcgga- CRISPR spacer agcggatgccgaccgtgatgcgga-gcgggc Protospacer ******** *** ********** ****.
15. spacer 1.35|74128|30|CP017459|CRT matches to MH617210 (Microviridae sp. isolate ctdb759, complete genome) position: , mismatch: 5, identity: 0.833
tgcggatgccgacagtgacgcggatgcgga- CRISPR spacer agcggatgccgaccgtgatgcgga-gcgggc Protospacer ************ ****.***** ****.
16. spacer 1.5|72364|30|CP017459|CRT matches to KC117377 (Halovirus HVTV-1, complete genome) position: , mismatch: 6, identity: 0.8
tgcggattcagatagtgacgcggatgcgga CRISPR spacer tgcggactcagatagtgacgaggtggaggc Protospacer ******.************* ** * **
17. spacer 1.8|72538|30|CP017459|CRT matches to NZ_CP022140 (Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatgccgacagtgatgcggatgctga CRISPR spacer gggggatgccgtcagtgatacggatgccgt Protospacer * ******** *******.*******.*
18. spacer 1.8|72538|30|CP017459|CRT matches to CP053317 (Salmonella enterica subsp. salamae serovar 6,8:a:z52 strain 62-3163 plasmid unnamed, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatgccgacagtgatgcggatgctga CRISPR spacer gggggatgccgtcagtgatacggatgccgt Protospacer * ******** *******.*******.*
19. spacer 1.20|73198|30|CP017459|CRT matches to NZ_CP042500 (Enterobacter sp. E76 plasmid pE76_001, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatgcagacagtgatgcg---gatgcgga CRISPR spacer ggcggatgcaaacagtgatgcgttcaatgc--- Protospacer *********.*********** .****
20. spacer 1.20|73198|30|CP017459|CRT matches to NC_012858 (Rhizobium leguminosarum bv. trifolii WSM1325 plasmid pR132502, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatg--cagacagtgatgcggatgcgga CRISPR spacer --ccgctgcccagacagtgatgcgcatgcggc Protospacer * * ** ************** ******
21. spacer 1.20|73198|30|CP017459|CRT matches to NC_007766 (Rhizobium etli CFN 42 plasmid p42f, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatg--cagacagtgatgcggatgcgga CRISPR spacer --cagttgcccagacagtgatgcgcatgcggc Protospacer *.* ** ************** ******
22. spacer 1.24|73396|30|CP017459|CRT matches to KC117377 (Halovirus HVTV-1, complete genome) position: , mismatch: 6, identity: 0.8
tgcggattcagatagtgacgcggatgcgga CRISPR spacer tgcggactcagatagtgacgaggtggaggc Protospacer ******.************* ** * **
23. spacer 1.25|73444|30|CP017459|CRT matches to KC117377 (Halovirus HVTV-1, complete genome) position: , mismatch: 6, identity: 0.8
tgcggattcagatagtgacgcggatgcgga CRISPR spacer tgcggactcagatagtgacgaggtggaggc Protospacer ******.************* ** * **
24. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP024924 (Sphingomonas sp. Cra20 plasmid unnamed, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer accttatgccgacagtgacgccgatccgga Protospacer * **************** *** ****
25. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP050100 (Rhizobium leguminosarum bv. trifolii strain 9B plasmid pRL9b3, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer ggcgtcggccgacagtgacgaggatgcggt Protospacer *** ************* ********
26. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP053443 (Rhizobium leguminosarum bv. trifolii strain CC275e plasmid pRltCC275eC, complete sequence) position: , mismatch: 6, identity: 0.8
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer ggcgtcggccgacagtgacgaggatgcggt Protospacer *** ************* ********
27. spacer 1.47|74836|30|CP017459|CRT matches to MH617210 (Microviridae sp. isolate ctdb759, complete genome) position: , mismatch: 6, identity: 0.8
tgcggatgcagacagtgatgcggatgctga- CRISPR spacer agcggatgccgaccgtgatgcgga-gcgggc Protospacer ******** *** ********** ** *.
28. spacer 1.51|75040|30|CP017459|CRT matches to MH617210 (Microviridae sp. isolate ctdb759, complete genome) position: , mismatch: 6, identity: 0.8
tgcggatgcagacagtgatgcggatgctga- CRISPR spacer agcggatgccgaccgtgatgcgga-gcgggc Protospacer ******** *** ********** ** *.
29. spacer 1.56|75364|30|CP017459|CRT matches to LT598654 (Phage NCTB genome assembly, complete genome: monopartite) position: , mismatch: 6, identity: 0.8
tgctgatgcagacagtgacgcagatgctga CRISPR spacer ttctgatgaagacagtgatgcagatggtct Protospacer * ****** *********.******* *
30. spacer 1.8|72538|30|CP017459|CRT matches to CP052500 (Klebsiella pneumoniae strain B17KP0021 plasmid unnamed) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgatgcggatgctga CRISPR spacer ctctgacagcgacagtgattcggatgctga Protospacer . * **.. ********** **********
31. spacer 1.8|72538|30|CP017459|CRT matches to NZ_CP012887 (Mycobacterium chimaera strain AH16 plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgatgcggatgctga CRISPR spacer cgaccatgccggcattgatgcggatgctgg Protospacer .* ******.** **************.
32. spacer 1.20|73198|30|CP017459|CRT matches to NZ_CP021084 (Deinococcus ficus strain CC-FR2-10 plasmid pDFI3, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgcagacagtgatgcggatgcgga CRISPR spacer cgtcgttgaagaccgtgatgcggatgcggg Protospacer .*. * ** **** ***************.
33. spacer 1.35|74128|30|CP017459|CRT matches to NC_014310 (Ralstonia solanacearum PSI07 plasmid mpPSI07, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
34. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022762 (Ralstonia solanacearum strain T95 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
35. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022140 (Salmonella enterica subsp. salamae serovar 55:k:z39 str. 1315K plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer gggtgatgccgtcagtgacacggatgccgt Protospacer * ******* *******.******* *
36. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022118 (Salmonella enterica subsp. enterica serovar Macclesfield str. S-1643 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer gggtgatgccgtcagtgacacggatgccgt Protospacer * ******* *******.******* *
37. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022118 (Salmonella enterica subsp. enterica serovar Macclesfield str. S-1643 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer gggtgatgccgtcagtgacacggatgccgt Protospacer * ******* *******.******* *
38. spacer 1.35|74128|30|CP017459|CRT matches to NC_011366 (Rhizobium leguminosarum bv. trifolii WSM2304 plasmid pRLG202, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer caccgtttgcgacggtgacgcggatgcgga Protospacer ..* * * ****.****************
39. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP014703 (Ralstonia solanacearum strain KACC 10722 plasmid, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
40. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022760 (Ralstonia solanacearum strain T98 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
41. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022789 (Ralstonia solanacearum strain SL3175 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
42. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022771 (Ralstonia solanacearum strain T51 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
43. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022777 (Ralstonia solanacearum strain T11 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
44. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP022799 (Ralstonia solanacearum strain SL2064 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer tgcggatgcggacagcgacgcgggattggg Protospacer ********* *****.*******. .**.
45. spacer 1.35|74128|30|CP017459|CRT matches to CP053317 (Salmonella enterica subsp. salamae serovar 6,8:a:z52 strain 62-3163 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer gggtgatgccgtcagtgacacggatgccgt Protospacer * ******* *******.******* *
46. spacer 1.35|74128|30|CP017459|CRT matches to NZ_CP045959 (Salmonella enterica subsp. enterica serovar Birkenhead strain AUSMDU00010532 plasmid pAUSMDU00010532_01, complete sequence) position: , mismatch: 7, identity: 0.767
tgcggatgccgacagtgacgcggatgcgga CRISPR spacer gggtgatgccgtcagtgacacggatgccgt Protospacer * ******* *******.******* *
47. spacer 1.47|74836|30|CP017459|CRT matches to MF754113 (Vibrio phage vB_VpaS_KF3, complete genome) position: , mismatch: 7, identity: 0.767
tgcggatgcagacagtgatgcggatgctga CRISPR spacer agatgatgcagacggtgatgcgggtgcttc Protospacer * *********.*********.****
48. spacer 1.47|74836|30|CP017459|CRT matches to MF754114 (Vibrio phage vB_VpaS_KF4, complete genome) position: , mismatch: 7, identity: 0.767
tgcggatgcagacagtgatgcggatgctga CRISPR spacer agatgatgcagacggtgatgcgggtgcttc Protospacer * *********.*********.****
49. spacer 1.47|74836|30|CP017459|CRT matches to NZ_CP029776 (Deinococcus actinosclerus strain Deinococcus actinosclerus SJTR plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.767
-----tgcggatgcagacagtgatgcggatgctga CRISPR spacer tcgtctg-----gcagaccgtgatggggatgctga Protospacer ** ****** ****** *********
50. spacer 1.49|74944|30|CP017459|CRT matches to MW117966 (Synechococcus phage S-H9-1, complete genome) position: , mismatch: 7, identity: 0.767
tgcggat--gcagacagtgacgcagatgctga CRISPR spacer --cagactagcagacagtgaagcagatgctct Protospacer *.**. *********** *********
51. spacer 1.51|75040|30|CP017459|CRT matches to MF754113 (Vibrio phage vB_VpaS_KF3, complete genome) position: , mismatch: 7, identity: 0.767
tgcggatgcagacagtgatgcggatgctga CRISPR spacer agatgatgcagacggtgatgcgggtgcttc Protospacer * *********.*********.****
52. spacer 1.51|75040|30|CP017459|CRT matches to MF754114 (Vibrio phage vB_VpaS_KF4, complete genome) position: , mismatch: 7, identity: 0.767
tgcggatgcagacagtgatgcggatgctga CRISPR spacer agatgatgcagacggtgatgcgggtgcttc Protospacer * *********.*********.****
53. spacer 1.51|75040|30|CP017459|CRT matches to NZ_CP029776 (Deinococcus actinosclerus strain Deinococcus actinosclerus SJTR plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.767
-----tgcggatgcagacagtgatgcggatgctga CRISPR spacer tcgtctg-----gcagaccgtgatggggatgctga Protospacer ** ****** ****** *********
54. spacer 1.56|75364|30|CP017459|CRT matches to MW117966 (Synechococcus phage S-H9-1, complete genome) position: , mismatch: 7, identity: 0.767
tgctgat--gcagacagtgacgcagatgctga CRISPR spacer --cagactagcagacagtgaagcagatgctct Protospacer * **. *********** *********
55. spacer 1.7|72490|30|CP017459|CRT matches to NC_021911 (Rhizobium etli bv. mimosae str. Mim1 plasmid pRetMIM1f, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttc Protospacer ********.********.***** .*
56. spacer 1.7|72490|30|CP017459|CRT matches to NZ_CP009619 (Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer taacgatgcagaaagtgccgcagatgcatc Protospacer *. .******** **** *********.
57. spacer 1.7|72490|30|CP017459|CRT matches to NZ_CP050090 (Rhizobium leguminosarum bv. trifolii strain 23B plasmid pRL23b4, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttt Protospacer ********.********.***** .*
58. spacer 1.7|72490|30|CP017459|CRT matches to NC_007766 (Rhizobium etli CFN 42 plasmid p42f, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttc Protospacer ********.********.***** .*
59. spacer 1.7|72490|30|CP017459|CRT matches to NZ_CP020911 (Rhizobium etli strain NXC12 plasmid pRetNXC12e, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttc Protospacer ********.********.***** .*
60. spacer 1.20|73198|30|CP017459|CRT matches to MF754113 (Vibrio phage vB_VpaS_KF3, complete genome) position: , mismatch: 8, identity: 0.733
tgcggatgcagacagtgatgcggatgcgga CRISPR spacer agatgatgcagacggtgatgcgggtgcttc Protospacer * *********.*********.***
61. spacer 1.20|73198|30|CP017459|CRT matches to MF754114 (Vibrio phage vB_VpaS_KF4, complete genome) position: , mismatch: 8, identity: 0.733
tgcggatgcagacagtgatgcggatgcgga CRISPR spacer agatgatgcagacggtgatgcgggtgcttc Protospacer * *********.*********.***
62. spacer 1.21|73246|30|CP017459|CRT matches to NZ_CP012656 (Lactobacillus plantarum strain HFC8 isolate Lactobacillus plantarum plasmid pMK08, complete sequence) position: , mismatch: 8, identity: 0.733
tgcggatgcagatagtgacgcagatgcgga CRISPR spacer agcggatgcagatcatgacgcagacaacaa Protospacer ************ .*********.. .*
63. spacer 1.21|73246|30|CP017459|CRT matches to NZ_CP012656 (Lactobacillus plantarum strain HFC8 isolate Lactobacillus plantarum plasmid pMK08, complete sequence) position: , mismatch: 8, identity: 0.733
tgcggatgcagatagtgacgcagatgcgga CRISPR spacer agcggatgcagatcatgacgcagacaacaa Protospacer ************ .*********.. .*
64. spacer 1.21|73246|30|CP017459|CRT matches to NZ_CP009619 (Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence) position: , mismatch: 8, identity: 0.733
tgcggatgcagatagtgacgcagatgcgga CRISPR spacer taacgatgcagaaagtgccgcagatgcatc Protospacer *. ******** **** *********.
65. spacer 1.47|74836|30|CP017459|CRT matches to NZ_CP042500 (Enterobacter sp. E76 plasmid pE76_001, complete sequence) position: , mismatch: 8, identity: 0.733
tgcggatgcagacagtgatgcggatgctga CRISPR spacer ggcggatgcaaacagtgatgcgttcaatgc Protospacer *********.*********** .. **
66. spacer 1.49|74944|30|CP017459|CRT matches to NZ_CP043762 (Paenibacillus sp. 37 plasmid pART37, complete sequence) position: , mismatch: 8, identity: 0.733
tgcggatgcagacagtgacgcagatgctga CRISPR spacer tttcaatgtagacagtgacgcagatgaagc Protospacer * . .***.***************** *
67. spacer 1.49|74944|30|CP017459|CRT matches to NZ_CP009619 (Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence) position: , mismatch: 8, identity: 0.733
tgcggatgcagacagtgacgcagatgctga CRISPR spacer taacgatgcagaaagtgccgcagatgcatc Protospacer *. ******** **** *********
68. spacer 1.50|74992|30|CP017459|CRT matches to NC_021911 (Rhizobium etli bv. mimosae str. Mim1 plasmid pRetMIM1f, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttc Protospacer ********.********.***** .*
69. spacer 1.50|74992|30|CP017459|CRT matches to NZ_CP009619 (Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer taacgatgcagaaagtgccgcagatgcatc Protospacer *. .******** **** *********.
70. spacer 1.50|74992|30|CP017459|CRT matches to NZ_CP050090 (Rhizobium leguminosarum bv. trifolii strain 23B plasmid pRL23b4, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttt Protospacer ********.********.***** .*
71. spacer 1.50|74992|30|CP017459|CRT matches to NC_007766 (Rhizobium etli CFN 42 plasmid p42f, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttc Protospacer ********.********.***** .*
72. spacer 1.50|74992|30|CP017459|CRT matches to NZ_CP020911 (Rhizobium etli strain NXC12 plasmid pRetNXC12e, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagatagtgacgcagatgcgga CRISPR spacer agctgatgcggatagtgatgcagaaacttc Protospacer ********.********.***** .*
73. spacer 1.51|75040|30|CP017459|CRT matches to NZ_CP042500 (Enterobacter sp. E76 plasmid pE76_001, complete sequence) position: , mismatch: 8, identity: 0.733
tgcggatgcagacagtgatgcggatgctga CRISPR spacer ggcggatgcaaacagtgatgcgttcaatgc Protospacer *********.*********** .. **
74. spacer 1.56|75364|30|CP017459|CRT matches to NZ_CP009619 (Vibrio coralliilyticus strain RE98 plasmid p380, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagacagtgacgcagatgctga CRISPR spacer taacgatgcagaaagtgccgcagatgcatc Protospacer *. .******** **** *********
75. spacer 1.56|75364|30|CP017459|CRT matches to NZ_CP043762 (Paenibacillus sp. 37 plasmid pART37, complete sequence) position: , mismatch: 8, identity: 0.733
tgctgatgcagacagtgacgcagatgctga CRISPR spacer tttcaatgtagacagtgacgcagatgaagc Protospacer * ...***.***************** *
76. spacer 1.56|75364|30|CP017459|CRT matches to HQ634174 (Cyanophage MED4-213, complete genome) position: , mismatch: 8, identity: 0.733
tgctgatgcagacagtgacgcagatgctga CRISPR spacer ctgtgatccagacagtgacacagatggaaa Protospacer . **** ***********.****** .*
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
1039986 : 1047928
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >CP017459|1039986:1047928|DBSCAN-SWA AATGTTAAAACCATTAGGTAACCGAGTAATTATTCAAAAAATAGAACAAGAGCAAACAACAAAAAGTGGTATCGTATTAACAGATAGCGCTAAAGAGAAGTCAAACGAAGGTACGATAATTGCAGTAGGTGCAGGGCGTATTTTAAAAGATGGTTCTCGAGTTGCTCCTGAAGTAAACGAAGGCGATAACGTTGTATTTCAACAATTTGCCGGTACTGAAGTTAAACGTGGAGACGAAACTTATTTAATCCTTAATGAAGACGATATTTTAGCAATTATTGAATAGAAAATAAAAAATTAACTTTATAAAATACTAACAACATGGAGGTACGAGAAATATGGCTAAAGATTTAAAATTCTCTGAAGATGCACGTCAATCTATGCTTAGAGGTGTAGACAAATTAGCAAATGCTGTCAAAGTTACAATTGGACCAAAAGGACGTAACGTTGTATTAGATAAAGAATATACATCACCATTAATTACAAATGATGGGGTAACAATCGCTAAAGAGATTGAATTAGAAGATCCATATGAAAATATGGGTGCGAAATTAGTACAAGAAGTAGCTAATAAGACAAATGAGATTGCTGGCGATGGTACTACTACTGCAACTGTATTAGCACAAGCAATGATTCAAGAAGGTTTGAAAAACGTAACAAGTGGTGCTAACCCAGTTGGTTTACGCCAAGGCATTGATAAAGCTGTTGACGTTGCAATTGAAGCATTACATGAAATTTCACAAAATGTGGATAATAAAAATGAAATTGCACAAGTTGGTTCTATTTCGGCAGCAGATGAAGAAATCGGTAAATATATTTCTGAAGCAATGGAAAAAGTTGGCAATGATGGCGTTATTACTATTGAAGAATCAAGTGGTTTTAACACAGAACTAGAAGTGGTTGAAGGTATGCAATTCGATAGAGGTTATCAATCACCATATATGGTAACTGATTCCGATAAAATGGTTGCTGAGCTAGAAAGACCATACATTTTAATTACAGATAAAAAGATTTCATCATTCCAAGATATCTTACCGCTATTAGAACAAGTAGTTCAATCTAATCGTCCAATTTTAATTGTAGCTGATGATGTAGAGGGCGACGCATTAACAAATATTGTTTTAAACCGTATGCGCGGCACGTTTACTGCAGTAGCTGTAAAAGCACCCGGATTTGGTGATCGTCGTAAAGCAATGTTAGAAGATTTAGCAATCTTAACAGGTGCGCAAGTTATTACAGATGATTTAGGTTTAGAGTTAAAAGATGCATCACTTGATATGTTAGGTACATCAAATAAAGCTGAAGTTACTAAAGACAATACTACAATCGTCGATGGTGATGGCGATCAAAATAATATAGATGCAAGAGTAAGCCAAATCAAAGCTCAAATTGAAGAAACTGATTCAGATTTTGATAGAGAAAAATTACAAGAACGTTTAGCTAAATTAGCAGGTGGCGTTGCAGTAATTAAAGTGGGCGCAGCAAGTGAAACTGAATTAAAAGAACGCAAATTACGTATTGAAGATGCTTTAAACTCTACTAGAGCTGCTGTGGAAGAAGGTATCGTAGCAGGCGGTGGCACAGCATTTATGAATATTTATGATAAAGTATCTAAAATTGAAGCTGATGGCGATGTAGCTACAGGAGTGAATATTGTCCTGAAAGCTTTAGAAGCACCAGTTCGTCAAATAGCAATAAACGCTGGTCTAGAAGGTTCAATTATAGTTGAAAGACTTAAAAATTCAGAAGTAGGTGTCGGTTTTAATGCGGCAACTAACGAATGGGTTAATATGCTAGAAGCTGGAATTGTGGACCCAACAAAAGTGACACGTTCATCGCTTCAACATGCAGCAAGTGTTGCAGCAATGTTCTTAACTACTGAAGCAGTTGTAGCTAATATCCCAGAAGAAAGCGGTAATGACCCACAACCAGGCATGGGTGGTATGCCAGGCATGATGTAAAATAACCGTTGAACGTTGATATGACAACATAAAGATTATCCGATGGTCATAATTTGGTCATAGAAATTTTAAAATAAATTATTTGAGACGTTTTCCATAAGTTTACTGAACTTTTGGGAGGCGTCTTTTTTATATGATTCAGTAATCTTTGCATAGATATTCATTGTAGTATTTATGTCCTTATGGCGTAATCGTTCCTGAATCTCTTTTATATGCACACCAGCTTCTATTAAAAGGGCACAATGTGTGTATCTGAACGAATGAGTAGTTATATTTTTATCAATGTTAGTCTTAGTCATAATGGCTTGTATCCACTGTGACAATTTCTTAATCACAAGGGGGTAACCGTTATTGTCTGTGAAAATAAAATTGTTATCAACGTACAACTCATTTTTCCATTTGTCTTGTACATTTACTTTATAATCTTTAAGTAATTGAATTACATTAGGATCTATCGAAATTTTGCCAATAGATGATTCTGTTTTTGGTGTGAGTATCTGATAATTTTTCTTATTGTTATTCGGATTATAATACGTTTTCGTGATACTTACTGTACATTCTTCAAAGTCTATATCAGACCATTTAAGCGCTAGTAATTCGCCAGCCCTTAATCCAAGATATGCAAGACTTACGAACACTTCAAAGCTATTTTGTGGTGAATGGTGATTCTTAGCAACGCTTAAAAACTCAAATAATTCTTCTTTTTCAAGGAATTTCTGATGTATCGTATTTTCTTCCAAATCCTCAACAGTAGGCTTATACTTTGCACGTTTCACACCTTCAGTAGGTAATTTAGATATTATCTTCATATCTTGTGCATACTTAAATACAAGGTTAGTTGAGCTTACAATACTATCAACATAATTTTTACTGAATTGTGTTGTCACATCGTCCACAAATGCTTGATAGTCGCGTTTTGTAATGGTTTGTATACTTCTATTACCAAATTGCTGCCTAGCGTGATATATTGCCTTCTCTCTTGCTCTCACACTACTTACTTTCGCATCTTTACTATAATGATTTATCCATTCATCCGCTACAAAATTGAATGTGTGTGTTGATGGTGCGATATACTCGCCATTTCTTATTTGTCTTTCAACCATTTCAGCGTGATTCTTAGCATCAGACTTACGAGCAAAACCCGACTTAGATATATATTCATATTTACCAGTATTAGGATTTTTACCTAGAGATATGCGATAGCGCCAGTTGTTACCACGTTTTTCATAGTTTGCCATTTAATCACCTTTATTTGATATAAAATTTCTTCAATGTTTCAAATTTACTGTTTTCAAATAATTTTAAAGCGATATAATCATTCTTCTTCAGTGAAACCTGTTCTCTTTCTATTGTTTCTATTTCTGCATCGATAGAAAAAATACCTATTAATTGATTTTTTACACCTGTTATAAGTCTGTTTATAAATTCAGTTCTAAAAGAAATACTTAAATTGTCTACAAAGTCAAAAAATTCACTGTCAGTATAATGGTCAGAGGATTTTAACTGAACGGATAAGTACCAATCAAAATCTCCAGTTTTTACAGGTATATTGTAAGAATCACCAGAATACACGTGTATATCTATATAAAAATCTTTTTCGTAATTTTGGTTTTTAATAGTAATATCAAAAGATTTTAAAGCGTCTTTATTTTTTTCGCTATTTATCATTTTATAATTAATTAAATAAGGTGAGTACTCAAAGAATTCGCAAGGTGTTACACCTAGAAAATTACATAATTTATCAACTGTATCAAATTGTACACCTTTTCCGGTGTTTTCTGATATAGCCATCAATGTAGTTTTGGAAATACCAGTTTCTTCATATATATCAGAAATCTTTAATCCTCTTTCAGCCATAAGTATCGATAATCTACTTTGAATCATTTTCAAACCTCCATTTTTATTATATTCGTATCATACTATAACTCACTAAAAAATAACAGTATAAACTAATATATTAGCGATGTTTGACATTTGGTATTTAGTAGTGTAGTATGTTATTTATAACAGACATCGAAAAAATATAACAAACATCTGTTATAAAGGAGGGGGAAAATGAACAATCAATTTAGAGTTATATTAGCTCAAAAAAAACTCAATATTTCAGAAGTATTTAAAAATACTGGTATAGCTAAAACAACTTTATATGGTTTGTATTACGAGAGAACTAAAAACCCTGATACTTCTACTATTATGAAGATTTGTAGATATTTAGAAATTACTCCTAATGAATTTTTAGGGATTGGTAACAAAGTAAAGGAGGCATAACAAATGTTCAATATCGATATTAATGAAGATGAAGCACGTGAGATGCTGCAACATGCTATTGATGAGCGTATCGAAGAATTAGCGAAAGAAAAGTATTTTATGACTTACAAGGAATTAGCAGATTATCTTAATCTATCAAAACCAACTATAGATGATTTACTAATCAAAAATGGTATGCGCTATTACCGAGTAGGAAGCACTTACCGTTTCAAAAAGTCTGACGTAGATGGTTTTATGGATAACATTACTTCGCAGATGGATATCACTAACAATGATCTGAAAAGTTTGAAGAAGGTAAAACAATGAGAATGCTAATGACTTTTATAACTGTGCCATTTACCACAATTACATTCAGCACATTAATTCAAGATTTCTACATTGCACTGGTATTAGTTATATTTGCGAGCTTTGTATGTTATATGTTTTTTGATAGACACTTTAATGAAATCGAAAATAATAAAATGGAGGTTAAATAAGATGACAAAAGATGAATATATCGAACAAACAGAAAAAATACATCACATTTTAGGTCAAAGTGATTACTCAAACGAATTAATGCAGTGGTTAGTTGATTACTGTAATTCAAAACCACTTGAAAAAGAAATTAGCGAAGATTTGGGAGAATTGCTTTTTAATTTAAATAACAAGTTAACTATCGATTTAACAGATTTAAAAATGCAAATGACAAATATTAGAAAAGGGAGTAACTAATTATGACATATTCAGAAAAAGTAGAAGAAAGCGTTGAGTTTGCAGATTTGATAAATAAGGTTCAAAGTGTATTAGATTTTGTTTGTTCAGAAAATGACGAATTAAAAATTGAAAGAGACTGTGCAATCAGAAATAACGACCCTTATTATTACCAAGCTATTAATAATAATATGAAAGCGAATTATATCGTTACAAGCACTTTATTAGCGATTAGAAATGATATTGAGACAATGCATGATGACATCCGAGCAGATATTAATCAAGAAAAAAACGCACTATCTACTGCCGACCAAAGCGAAGATAATGCGTAAATAATTAATACATGAGGTAATCATGCAAAGATATTTTATCATGGTTGCCTCTCATATAGAAAGGAGTAAAACTAATGAATACTTTCAACAAAATAAAACTAGATAATAATTTCGATATTTCCATTATACAATACGACAATCTTTATGCCAACTCATTTAGAAATTTTGATACGTGGAAATGGTCTGATTGGTTGAATAAATTACAAATACCGATGAATAGTGCAGATAAATATAAACGTGGTTTAGTCCTTTATGGTGATGTTGAAGATGGAAAAGATGATGACGGCGTTTTTTACCAAAAATATCGTAATGATGCTAACGTTATTAATCGTTCTGTGATTGCTCTTGATTATGATGATATTAATGATTTTAAAGGGCTATACAAAGCCATTTGTAAGCAATTAGAGGGTTATTCTTGGGCGTTTCACACCACTTATAACCATACTACAGAAAAACCGCGTATACGTCTTATGGTGCCTTTGAATGAGCTTGTGAGTGCAGATAATTATAGGAAGTATACGCGAGCGCTCACTCATAAAATAGGTTACAAAATAGATGAAGGTAGTTACCAGCCATCAAGAGCTATGGCATTACCAGTTAAACGTGATAAAGATACAATTTATATTTTTAAATATAATGATGCGCCTGCAATAACTATTGAAGAATTAGAAAGGTTGTCTACAAATCTAGACAGCGTTCAAAAAGATAATCCAATCACCATTAATTATTCAAACCAGTATAAAAAACGTGATTCGTCCTATTGGCGTGAAATTGCGTTTGGTGTTAGTGAGGGTGAACGTAATCAAACATTAGCATCATTAATTGGATACTTATTGCGAAGATATGTAGATGCCAACCTTGTATATGGGCTAGTAAGCGCATGGGCGCAGATTGTAATCCACCTTTAGAACAAAAGGAAGTAAATCAAACATTTAAATCCATATTAAAAAAGGATAGTAAAAGCAACTAGAAGGGAGGGTGTTTTTATTTGGAAGTAACAAACGAAGATGTTTTTGAAGCAATTCAAGAATCCGAAAATTTACAAGAAATAAGTAAAGATAAACCAACAATTCCAAAACCTTATTTAATCAAAGGTAAATGGCTATACTATCGTAAAATCACTGAATATGCACAAAAAGAAGATAAAATTGAAGATATTTATATCACGAGTACACCACCGTATGTAACAGATCGTTACCGAGATATCGAGTCTAAAGAATTTTATTATGAGCTAGAATTTGAGGACGCGAAACGTAAATATAAATTACCAGTTTCTGCTCAAGATATTACACAGGCAAAATTTCTTGTTGAGTTAGCAAGTAAAGGATTAGAAGTTACTCAAAATGAGGCAAGCAGTCTTGTGAAGTATCTAAGTGCATACAGACGTTTTAATAACATACCTGATTACGATGTTGCTACACGTTTAGGCGATGTAGAAGGTCATTTCATATCACCTTATAAAGAAGATACTGAAAGCAATAAATATAAATTGTTTAATGCAGACAGAGGATACCAAGCGCTAATTGATTCGTTTGAAACTAAAGGGAATATTGATGATTATAACAAAGGTGTCTTTCAACATATCAAAGACAAACCAATGGTTATGATGATGTTTTATAGCGCATTAGGTTCTGTTCTATTAAAAGATTTTAATGTAGATCCGTTTGTAAGTGAAATATCAGGCAAAACTTCAAGTGGTAAGACATTTACGTTGAAAATATGTGCAAGTGTTTGGGGCAATCGTAAGCTAGTTACGGAATGGAACGCAACTAATGTAAGTGTAGAGCGTATGGCATCGTTTTTAAATTCATTTCCACTTATAAAAGATGATACACGTAAAGCAGATAAGCCATTTAAGATTCCTGGCATTGTATATCAATTTTCAGGTGGCCAATCTAAAGGAAGAGGTAATTCTGACCGTTCGATAGATTACTTAGAGCCATGGAATAATATTATGCTTTCCAGTGGTGAGGTGGCTATACCAGATATTGCACCAGATAAGGCAGGGATAGCAGGTCGAGTAATTACATTACAAGATAATCCTTTCCCAGACATGAAGCAAGAAGTGTTCGATGAAATAGCTGAGGCTATAGAAGAAAACCACGGTCTACTAGGTAAGTTATTTATAGAGCAGTATGAAAGCGAGAAAGATAAGTATAAAAATTCTTTCAAAGGCGCAGTGAAATATTTTATTAGAAAAGCTGAAGGTAATGAAGTCATGGCTAGGATTGCACGTAGTTTCGGATTGTTACAGGTAGTCGGTGAAATTTTAAATGATATTGAAGGATTTGAACATGACCCATATATCCTTACTAATCAAGCACATTATAGCATGATGAAAAACAATAAAAATATTGATAAGCCACTTCAAATGTTAGAGGAACTACTTGAAAAGCTAAATGCAAACCGTGGACGTATTGCATATAACAAACATCATTTTCACGATAATACAGAATTAATGGCTATATACAGAAATGATTTTATTCTTGTTATGGCTCCAACAATTAAAGATATGTTAGGTGCTGAGTTTAATTCCATTGTTAAACAATGGGATGAAAGAGGATATCTTGAAACGAATAATTACGGTAAACAAAAAAATATAACATTTGCTGGTGAATCTCAAAAAGGTTACGCCATTAAAACAACAATAATTAAAGAATTAGGATTTAACTTTGAAAAAATAAATTACTAG
Protein sequences of DBSCAN-SWA_1 >CP017459|1039986:1047928|1044217_1044520_+|AWI44123.1|DBSCAN-SWA MFNIDINEDEAREMLQHAIDERIEELAKEKYFMTYKELADYLNLSKPTIDDLLIKNGMRYYRVGSTYRFKKSDVDGFMDNITSQMDITNNDLKSLKKVKQ >CP017459|1039986:1047928|1044691_1044925_+|AWI44124.1|DBSCAN-SWA MTKDEYIEQTEKIHHILGQSDYSNELMQWLVDYCNSKPLEKEISEDLGELLFNLNNKLTIDLTDLKMQMTNIRKGSN >CP017459|1039986:1047928|1042014_1043184_-|AWI44120.1|DBSCAN-SWA MANYEKRGNNWRYRISLGKNPNTGKYEYISKSGFARKSDAKNHAEMVERQIRNGEYIAPSTHTFNFVADEWINHYSKDAKVSSVRAREKAIYHARQQFGNRSIQTITKRDYQAFVDDVTTQFSKNYVDSIVSSTNLVFKYAQDMKIISKLPTEGVKRAKYKPTVEDLEENTIHQKFLEKEELFEFLSVAKNHHSPQNSFEVFVSLAYLGLRAGELLALKWSDIDFEECTVSITKTYYNPNNNKKNYQILTPKTESSIGKISIDPNVIQLLKDYKVNVQDKWKNELYVDNNFIFTDNNGYPLVIKKLSQWIQAIMTKTNIDKNITTHSFRYTHCALLIEAGVHIKEIQERLRHKDINTTMNIYAKITESYKKDASQKFSKLMENVSNNLF >CP017459|1039986:1047928|1039986_1040271_+|AWI44118.1|DBSCAN-SWA MLKPLGNRVIIQKIEQEQTTKSGIVLTDSAKEKSNEGTIIAVGAGRILKDGSRVAPEVNEGDNVVFQQFAGTEVKRGDETYLILNEDDILAIIE >CP017459|1039986:1047928|1044927_1045236_+|AWI44125.1|DBSCAN-SWA MTYSEKVEESVEFADLINKVQSVLDFVCSENDELKIERDCAIRNNDPYYYQAINNNMKANYIVTSTLLAIRNDIETMHDDIRADINQEKNALSTADQSEDNA >CP017459|1039986:1047928|1043194_1043830_-|AWI44121.1|DBSCAN-SWA MIQSRLSILMAERGLKISDIYEETGISKTTLMAISENTGKGVQFDTVDKLCNFLGVTPCEFFEYSPYLINYKMINSEKNKDALKSFDITIKNQNYEKDFYIDIHVYSGDSYNIPVKTGDFDWYLSVQLKSSDHYTDSEFFDFVDNLSISFRTEFINRLITGVKNQLIGIFSIDAEIETIEREQVSLKKNDYIALKLFENSKFETLKKFYIK >CP017459|1039986:1047928|1046224_1047928_+|AWI44126.1|DBSCAN-SWA MEVTNEDVFEAIQESENLQEISKDKPTIPKPYLIKGKWLYYRKITEYAQKEDKIEDIYITSTPPYVTDRYRDIESKEFYYELEFEDAKRKYKLPVSAQDITQAKFLVELASKGLEVTQNEASSLVKYLSAYRRFNNIPDYDVATRLGDVEGHFISPYKEDTESNKYKLFNADRGYQALIDSFETKGNIDDYNKGVFQHIKDKPMVMMMFYSALGSVLLKDFNVDPFVSEISGKTSSGKTFTLKICASVWGNRKLVTEWNATNVSVERMASFLNSFPLIKDDTRKADKPFKIPGIVYQFSGGQSKGRGNSDRSIDYLEPWNNIMLSSGEVAIPDIAPDKAGIAGRVITLQDNPFPDMKQEVFDEIAEAIEENHGLLGKLFIEQYESEKDKYKNSFKGAVKYFIRKAEGNEVMARIARSFGLLQVVGEILNDIEGFEHDPYILTNQAHYSMMKNNKNIDKPLQMLEELLEKLNANRGRIAYNKHHFHDNTELMAIYRNDFILVMAPTIKDMLGAEFNSIVKQWDERGYLETNNYGKQKNITFAGESQKGYAIKTTIIKELGFNFEKINY >CP017459|1039986:1047928|1040323_1041946_+|AWI44119.1|DBSCAN-SWA MAKDLKFSEDARQSMLRGVDKLANAVKVTIGPKGRNVVLDKEYTSPLITNDGVTIAKEIELEDPYENMGAKLVQEVANKTNEIAGDGTTTATVLAQAMIQEGLKNVTSGANPVGLRQGIDKAVDVAIEALHEISQNVDNKNEIAQVGSISAADEEIGKYISEAMEKVGNDGVITIEESSGFNTELEVVEGMQFDRGYQSPYMVTDSDKMVAELERPYILITDKKISSFQDILPLLEQVVQSNRPILIVADDVEGDALTNIVLNRMRGTFTAVAVKAPGFGDRRKAMLEDLAILTGAQVITDDLGLELKDASLDMLGTSNKAEVTKDNTTIVDGDGDQNNIDARVSQIKAQIEETDSDFDREKLQERLAKLAGGVAVIKVGAASETELKERKLRIEDALNSTRAAVEEGIVAGGGTAFMNIYDKVSKIEADGDVATGVNIVLKALEAPVRQIAINAGLEGSIIVERLKNSEVGVGFNAATNEWVNMLEAGIVDPTKVTRSSLQHAASVAAMFLTTEAVVANIPEESGNDPQPGMGGMPGMM >CP017459|1039986:1047928|1044001_1044214_+|AWI44122.1|DBSCAN-SWA MNNQFRVILAQKKLNISEVFKNTGIAKTTLYGLYYERTKNPDTSTIMKICRYLEITPNEFLGIGNKVKEA |
9 | Staphylococcus_phage(71.43%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
1177740 : 1193600
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >CP017459|1177740:1193600|DBSCAN-SWA AATGAGATGGAGGAATGACAAAGTGGAATTTTGGTTGAAAACACAAGCAAAACAAAATGGAGATAAAGTATTTATAGATGACGGAACAGTTCAAGTTACTTTTGCCTCCATGTATAAATATGCTTCACGATTGGCACAGCAGTTGAAAAAATTAGATAGAAGACGTATAGGTTTATACATTGAAAACAATATTGAATCAATTACATTGATAAATGCAATGTGGTTAGCAGGAATTGAAATTGCAATGTTAAACACACGTTTAACTAAAGATGAGATGCAAAACCAATTGTCGTCTATCGAAGTAGATACGGTCGTTGCTACCAGCCAAATCAATTTAAAAGCTATATCCGTAATTAAAATATCAACATTGCAACAAGGATGCAATGATATGACATATGAAAGCTTATTTGACATGAACCAAATCGCTTCGATTATGTTTACTTCTGGGACTACTGGTCCACAAAAAGCAGTCCCTCAAACATTTGATAACCATTACGCAAGTGCAATAGGCTGCAAAGAGAGTCTTGGTTTTGACCAAGAAACGAAATGGTTATCTGTTTTGCCGATTTATCATATTTCAGGATTAAGTGTTATTTTAAGAGCATTAATTGAAGGATTTACTGTTCGTATAGATACGAAATTTAATGCCCATACAATGTTAAATATTATACAAACAGAACTGCCAACGCATGTTTCATTAGTACCACAGACGCTTAAATGGTTGATGGATGAAGGGTTAAACCAACCTTACCATATTGAAAAAATATTGCTAGGCGGGGCAAAACTATCAAGTTCATTAATTGAAACAGCATTAGCTTCAAAACTACCTATTTATAATTCTTTTGGTATGACTGAAACATGTTCTCAATTTTTAACAGCATCACCTGAAATGTTATCCAAACGCTATGATACTGTAGGGAAGCCAAGTGCGAATGTAGCTGTCAAAATAAAAGACCCTAACGCTGAAGGACATGGAGAATTATTAATTAGAGGCGCTAATGTAATGGATGGTTATTTATACCCTGAAAATTTATTAGACACATTTGAGAATGGTTATTTTAAAACAGGAGACATTGCTGAAATTGATAAAGATGGCTATGTTATGATTTATGATAGACGTAAAGATTTAATCATTAGCGGTGGTGAGAATATATATCCGTATCAATTAGAATCTGTGGCCAAAGATCATGAAGCAATTTTAGATGCAATGTGTATTGGTGTTGAAGATAATACATGGGGAGAAGTCCCTTATTTATACTATGTTTCTAACACTTCATTATCGTATGAAACGTTAATGAATCATTTCAAAGCACATGTAGCTAAATATAAGATTCCTAAATACTTTGAACAAGTAACTGAATTACCATATACTTCTACAGGGAAACTTCAAAGAAAACATATAGAAAAATAGGTGTGAATAATATATGAAAATATGCGAAATGAACCTTTATATTTGTAATAATCATTTCAAGCATTTAATTGTTACACCAAAGGTAAAATTGGAAAAACGTAAAGCGCTTATTATTGAATTTATAACAGATAGACAGGTGCGTTATTTTGGAGAATGCAATGCTTTTGAAACGGATTGGTATGATGATGAAACGATTGAAATTGCGCGTGAACAAGCAATTAAATGGTTTGAGTCTTTTAAAAATTATGAGTTCTATCATTTCGAAGAGATACAACATGCATTACAAAACCTAGAACAATTTCCAGCGACACGTAGTATGATTGTTATGGCATGTTACCAAGCATTTTATAAATTAGAAGCGTTTCACGTTCCTTATGGTGCAACTGTGAGTGGTGTAACTGATGAAAATGTTAGGAATTTAATTAACACGAAACCACAGCGAGTTAAAGTAAAATGGTCTGAAACTATTTTAAAAGATGTGAAACAGTTGCAACAGTTACCCTTTAAAACTGAAATTGTGGTAGATGCAAATGAATCAATTCAAGAGGATGAAGCTAAGAAATTAAAACTGCTTTCGGAAAATGACATCCTTTATATTGAAGAACCATTTAAAAATATTGAAAAAATAAAAAATTTTAAGTATGACGAAATACCGCCAATCGCTATTGATGAAAAAGCAACCTCTTTAGAAAAGATTTTGAACTATGTTAAAAATAATGACGTGGACGTTGTGGTATTAAAGCCATTTAGACTTGGTGGTATTGATAAAGTAATTCAAATTATTGATATATTAAGCGATAGAAATGTGAAATTTGTTATTGGTGGTATGTATGAGTATGGACTGAGTCGTTATTTTACTGCGTTGTTAGCTCAATATGCAACGTACCCGAGCGATATTACACCTCAAGGTTTTTATTTTGAAAATGATATTGTAGCGTGTTCAGGCATATTAAAAAGAGGTTCAATTTATTTTGAACCTCCTCATGTTAATAAGCTTGAATTAGATCAAATTGATTAATGTTTATGGGTTTTATCTTTTTTTAAAGGTACTGGATCAAACCCACCTTTATGGAGTGGATGGCATTTGGAAATACGTTTTATACCAAGCCAAGTGCCTTTAATTGGTCCATATACTTGTATTGCTTCTCTAGTATACTCTGAACACGTAGGATAGAAGCGACATGTAGCCGGAGTCATAGGTGAAATCAAGTGTTGATATATATGGATGAGTCCTAGAAACAGTTTTTTCATAAAATCTTTGCCTCCAACAATTTACATAGCATGGATAGTTTAACATATTTAAAGGGAGGTTGATGTGCGTGAAGTTTAAAGATAGAGAAAATGACGACGTTTTTTTATCATTTAAAGATGATAATGCTGTCCCAAACGGTGATCACGTTCTGGTCATCCCGGTTTATCACAATCAATTGCTTTTTACCAAACATAAAATAAGAGGGGTTGAATTTCCTGGAGGCAAAAGAGAAAATGGGGAATCTAGCGAAGCAGCTTGTGAAAGAGAACTGTTTGAAGAGACAGGAGCGCTTATAAAAACTAAAGAGAAACATTATATTGCTCAATATCGTGTTGCAAGACAAAATGGTAAACCATTTACTAAAGATGTATTCATGGTTGACGTAGACAAATTACCGATACAAGAAGATTATTTAGAAACTGAAGGTCCACGCCTTTTTGATAGACTTTCAGATATTCCTGAACTAGACAAAAGTTATTTATTGAAAGATGCTGCTATCTTACAATGTTTAGAGAGAGTGATTGAACTTGGATTTTATCAATAAAAAAAGAATGCCAGTAGAGGTTCCTGAACATGTATTTGAAGAAGTTACTTACAAAGTAGATGGGATAAATGTAAGAGGCTTATTGATGACACCTCAAAAAAGTGTTGAAAGAATCGTTATTTATTTGCGTGGTGGCAAAGGCCAAGTTGGGAAAGTGAGAGCAGCTCGTTTAATGCAGTTTTCAGACCCAAACACGCTTGTATTCGGACCTTATTACAGAGGTAATAATGGAAGTGAAGGTAAAGATGAATTTTATGGGAGAGACCTAAATGACGTGGCAGTTGCAATTCGTATATTAAATATGATGTATCCTAAGGCGTATATTCATATGGTCGGTTTTTCTAGAGGGGGATTACAAGGATTGCTCACATACCAAGATTTACCTGTGTCGAGTTATATTATTTGGGGCGGCGTTTCCGATATTAAGCTAATGTATGAAGAACGTGTCGATTTACGAGGGATGTTAAAAAGAATGATAGGTCACCCTAGAAAAAATGAAATGGCATACAAAGAAAGAGATGCGGTTGTAACTATTCATGCGGATAGTCCGCCTATACTGATTGTGCATGGTGGAAAAGATGTTCAAGTTGGTATCCATCAAGCTTATTATTTAGAAAAACAATTAAAGCGTATTGGTACTTTTTTTAAGACATTTTATCAAATGGATGAGGGACACGTACCTAGACCATACGCAATGAAAGAAGCATTATCCACGGTTAAGCAATGGATGACTGATATTGAACGGCAAAACTTAAAAGCAGAATATAATAAATAAAAAGAGGCCGGGACATAAAGTTCTTGGACAAGTGAGAAAAGGCAATTTCTATTGAAATAATATAGAAATGGCCTTTTTCATTATTGTTTTGATTATAGTTAGCTCGTTGAGCTACTACTTTTCTTATATTAAGTGCCATTAATACAAAGCCCAGTTCGCTTTTGACTTTATTTGTGCCTCTAACCGACATTCGAGTGAAACCCAAAATAGCCTTCATAAACCCAAAAACAGGTTCTACATTCCATTTTTCTTTGATTGTAGATTTCTTTTGTTTCTGGTTTCGAAAGCTTTTGATTGATCTGGGCTTTGAAATATTCCCAGTTATAATTTCTCATTATTTTTTATTCGATTGTGAATTTGATTTCATACAATCGTTCTTCAGTGGACATTCTGAACAATCATCGCATTCATATAATTTAAAATCTCTCCTAAACCCATATTTATCATGGCGATAGGCATATCTTTTAAAACCAAGTCTTTTATGATTCGGGCAAATAAATTCATCATTGATTTCATCATATTCCCAATTGTGAGTATTAAAAATGTCACTTTTATATTTGTTAGTTTTATCTTTAATAAACATGCCATAAGTTATGAGCGGTGTTCGATTAAATTCATCTATAATTGCCATATAATTAGGTTCACTACCATAACCAGCATCAGCTACAATATATTCAGGTAAATGACCGTAGGTCTCTTTAATTAAAGTTAAAAAAGGAATCATTGTGCTTGTGTCTGTCGGATTTTGATACACATCATATGATAAAACAAATTGAGAATTTGTCGCTATTTGTAAATGATATCCTGGCTTAAGTTGTCCATTTTTCATATGGTTTTCTTTCATTCTCATGAAAGTCGCATCATGGTCTGTCTTAGAATAACTATTTCTATCTTGGAGTATGGCTTTTTGTGTTTTATATTTATACTTTCGTTCTGAATAAGCAGCGAATTTCTTTTTATATCTTTTGATTTCAGTTCGCTTTTGACGTGTTTGCTTTCTTAACCGAGTAGATTTTTCATGTTCAATGTAATGATTTAAATCTTCGATTTCTTTATCCAAATGAGTACCAATTAAATCTATTTATTTTTGTGTTAATTCATGATCATTATCTTCTTTAATCTTAGGTATGATTTTGTCTTTCACTAATTCATGATATAGGGCTTTAGAATCTTCATTCATTTTTGATTCATAGTTTTGAATACTCTTTTTCCAAACAAATGTATATCTATTGGCATTAGCTTCCAGTTTTGTACCATCAATAAAAATAGTTTTATCATCTATAAGATTTTGTTTCAGACATTGGCTGTGAAATTGAATAAATAAAGGTTCTAATAAGGCGTCTACTTTAGGGTTTACTCTAAAACGATTAATTGCTTTATAAGAAGGTGTTTGATTTTGTGACAGCCACATCATTCGGATACGATTATTAAGCAGTTTTTCTATTTTACGACCAGAAAATACGGATTGTGTGTAGGCATATAGAATAATTTTCAACATCATTTTGGGATGATATGATGTAGCACCACGATGATGTTTGAATTCATCGAATTCATTTTCAGGTATTGTTTCAACGATTTCATTAACATGTCGTGACATATCATTTGTGGGGATAAGAACTGAAGTTTCCATTGGTAGTGTGTTGAGCCATGTTATAATCTTTATACATAAGGCACCTCGTTAATTTAGTTTAGTTGTGTTTATTAAATTATACGTAAGGGCCTTATTTTTTTAAAGTATTTTAATGTAAAATTACATATAAATGTGAGGTATTTTGGCGAGACTCTTGAGGGAATAGGACAAGCTGAAGACTACAGGCTGAAGCTATCCCCTAAGAAAGCGAGCCAACAATACGAAGTATTGAATCAAAAGAAGCACTCAGATGAATTGAATTAAATCATCTGAGTACTATTTTTCTGGGATTTATGTCCCAGGGACTTTTAAATATGACACGATAGCGAGAAGCATACTGATATAACGTTTATTTAAATCCGCCATTTTCAGCTAAATCTGAAACTTCATCGCCGAATTTTTCAAAGTTATGTTTAAATCTATCAATTAAATCTTGTGCTTGTTCTCTATAAGCTTCTGGCTTACTCCATGCATTAATAGGATTAAGTAGCGTTTGTGGCACATCTTTAATTTCAACTGGTATATTTAAGCCAAACATATCATCTTTGATGTATTCCGAGTCTCTCAATTGGCCAGTGATAGCTTGTTCAACCATTTGTCTTGTGTAATTTAAACTAATACGACGTCCTGTCCCGTATTTACCACCAGTCCAACCAGTGTTGACCAAGTAAACGTCCACATCGTGTTTATCTATCAGATTACCAAGTAAATCAGCATATACTTTTGCGTGTAATGGTAAGAAAGGTGAACCAAAACAAGTTGAGAATGATGGTTCAGGTTCTGTTACACCGCGTTCAGTCCCTGCTAATTTAGCTGTAAAACCGCTTAAAAAATGATACATTGCTTGATCTTTATTTAATTTAGAAATAGGTGGTAAAACACCAAAAGCATCAGCAGTTAAGAAAATAATGGTATTAGGATGCGCTGCTTTAGAAGGTGTAACAATATTTTCTATGTGATTGATTGGATAAGCGGCTCTGGTATTTTCTGTGTAGTAGTTATCATCAAAGTCGATATCACCGTCTTCGTCTACAACCACATTTTCTAAAATAGTCCCGTATTTAATTGCGTCATAAATTTGTGGTTCTTTTTTATAAGAAAGATTAATAGCTTTGGCGTAACAACCACCTTCGATATTGAATATGCCATTTTCATTCCAACCATGTTCATCATCACCGATTAACTTTCGGTTGGCATCTGCAGAAAGTGTTGTTTTACCTGTACCTGATAAGCCGAAAAATAGCGCCACATCACCTTTTTCACCGACATTAGCTGAGCAGTGCATACTCATGATATCATCTTTTGGCAATAAGTAGTTCATAACTGAGAAAATACCCTTTTTCATTTCACCAGCATATTCAGTACCACCAATTAAAATAAGTTTGTGCTTAAAAGAAGTAATAATAAATGTTTCGGAATTTGTACCGTCTTGAGTTGGGTCTGCTTTGAAATGGGGCGCTGAAACAATAGTGAAATCTGATTTGATTTCTTCTGCTTCTTCTTTTGAATCTGGACGAATAAACATATTTTGTGCGAATAAGTTATGCCAAGCGAGTTCATTAACTACTGTTAGTTTGAGTTGTGAATCTTCATCACTACCTGCATAACCATTGAAAACGTACAATTCATCTCTTTCATTTAAGTAATTTAATACTTTTTCATATAAGTTTAAAAATGTCTCTTCGTCAATTGGTTGATTGATATTGCCCCAATCGATATCATCTCTGTAGGATGGTTCATTAACAATGAATTTATCTTTTGGTGAACGTCCAGTGTATTTGCCTGTTTTAGCGTTAATTGCACCTAGTTCAGTTAGTTCGCCTTCATTATTATCAAGAATTTTTTTATACAACTGTGTTGTAGATAGTTGAAATAATGAAGATTGCTTGTCCAAAATACTTTGGATTTTATTTGTGTAAGTGTATGTATCTACTGCCATACTAAATCCCTCCAACGCTATATTAAATGTAAGCCTTTACAATTAAAGAGTATAACACATATGATTTAATAGTCCACACCATTTTAAAAGGAATTTTAATTAATCCTAAATTGACAATGTTACTTAGTTTAGGTACTATAGTGATTAACGGATTCTCTTATCCTGAGTGGCGGAGGGACATGGACCCAATGAAGCCCAGCAACCTCTTCTTATAATGAAGAAAGGTGCCAAACCGTTTGCAGACAAATAGCGTCTGAACGATAAGAGCGAATGGACGTATAAAGGCCTTCTCTCTATTCATAATAGTGACGAAGGCTTTTTTTAATGAGCTCAATAAAAGAGAATTTTCGTAATTTAAAACTAAAGGAGCAAGTTAATTATGACTTATAATAGAAGGTTATTTACTTCAGAATCAGTTACAGAAGGGCACCCAGATAAGATTGCGGATCAAGTATCGGATGCAATTTTAGATGAAATTTTAAAAGATGATCCAAATGCAAGGGTCGCTTGTGAAACAACAGTAACAACAGGTATGGCATTAATTTCCGGGGAGATTTCAACGGCGACATATGTAGATATCCCTAAAGTGGTAAGAGAAACAATTAAAAATATTGGTTATACACGTGCGAAATTCGGTTATGATAGCCAAACAATGGCTATATTAACAGCTATTGACGAACAGTCACCTGATATTGCTCAAGGCGTGGATAATGCCTTAGAGTACCGAGATCATCTTACAGAAGAAGAGATCGAGGCCACAGGTGCAGGAGATCAAGGCTTAATGTTTGGTTACGCAACAAATGAAACTGATACTTATATGCCATTACCTATCTTTTTATCACATCAACTTGCTAAGCGATTATCAGATGTACGTAAAGATGAAATTTTAAAATATTTACGCCCTGATGGTAAAGTCCAAGTTACAGTTGAATATGACGAGCAAGACAAACCGCAACGTATAGATACGATCGTAGTTTCAGCACAACATGCTGAAAATATTACTTTGGAACAAATTCAGACTGATATCAAAGAACATGTTATTTATCCTACTGTCCCTGAAGGTTTAATTGATGAGCATACAAGATTTTATATCAATCCTACAGGGCGATTTGTAATTGGTGGACCACAGGGCGACGTAGGACTTACAGGCAGAAAAATTATCGTAGACACATATGGCGGTTACGCACGTCATGGTGGTGGTTGCTTTAGTGGGAAGGACCCTACAAAAGTAGATCGTTCAGCAACTTATGCTGCACGTTATGTAGCTAAAAATATAGTTGCAGCAGAACTTGCAGAAAAATGTGAAGTTCAACTTGCATATGCAATTGGTGTTGCAGAACCGGTTTCTATTGCGATTGATACTTTTGGAACAGGTAAAGTAAGTGAAGCAGAATTAGTGGAAGCGGTCAGAGCACACTTTGATTTAAGACCAGCGGGTATAATTAAAATGTTAGATTTAAAACATCCAATTTATAAACAAACTGCTGCCTATGGTCATTTTGGGCGTACAGATATACTTCTACCGTGGGAAAAACTAGATAAAGTTAATTTATTAAAAGATAGTGTGCAAGTATAGGTGAAAAGAACCTTGTTTTTTTAAGTTTACTATCGAATGATGAGCTCATATCTATTATAATTAAGTTACTGAACATATAAAGGAGCGTTGTTGTTATGAATTCATTTGGACCGATAGAAATTGGTTTAATCGTGGCAATTATCGTAGCAGTTATTTGTTTAATCCTATTTTTAGTAGCCTTGAAAAGTAAGAAAAAAGCACAGCAAACAATCGAGGAACAATATAAATCTAGAGAACAAAAACTTAGCGATGAACATGGCGAGGAGCTAGAAAAAGAAAGAATTGAGAATAAAAAGCAAGTAACTAAGCAAAAAGAAGAATATGAAGCCACAGTTAATTCTAAAAATCAAGAAATAGATGCTTTAAAATTATTCTCTAAAAATGAAAGTGAATATGTGACGGACATGCGATTAATTGGTATCCGTGAACGTTTAGTAAATGAAAAACGGATCCGTCCAGAAGACATGCATATAATGGCTAATATTTTCTTGCCAAAGAATAATTTTAGTGACGTTCGCCGTATTAGCCATTTAGTACTTACACGAACTGGTTTGTACATTATTGATTCACAATTATTAAAAGGTCATGTATTTAATGGAATTAATGCTACACAATTTAAAGAACAACCGATGATGGAACAAGTATTTGAAACGTTAGATCTTGACAAACAAACGCCGCAAACATTAGCGATGGATCAAAATGAGGATAAAGATACGTTATCATTTGTTAATTACACGAATTATTTAAATGAAGTTGAAAAACTTGCTGGTGATTTACAAACTGAATTGAATTTGAAATTCACTCCAACTTCAATCCTTTATTTTAATCCAAAGGAAGAAGGCGCAGTGACAATTTCAAATTACGCACAAAGTACAAATTCGAAAGTTCTAGTAGGACCAGAACAACTTGATGAGTACTTTAACAAGTTTGTTTTCCACGGCAGAATTCAATATAATGTTGAAGACTTGCAACGTGTTATGGAAGAAATAGAAATGTTTAATTAATAAAGTTATATAAATAAGCATCTGAATTTGAGTTTGAGTTATAAATAGCCATATTCAAAATAGAATGCATCTTCATTTTTGAATGGAGATGCATTTTTACATTTAACGCTACCTGATAACCTATGAGTATACCTCGAACTTTTTTGTTATTAATAAAAATTATAAATTACATTAATATATAGTTGCCGTTACAAATATTTATAAATTACATTTAAAAATATAGGCATTTTAATTTATTAGTTTGCCGATTTTGATTATTATAAAAGTTAGCTTAATAGAAGAGGGGTTTTTAAATTTGGAACATGTAACTTTTTATAATGGCAATGAAATGCCAATTATTGGTTTAGGTACATTTCGTGTAGAAAACAACGACGAGTGTAAAGCAGCAGTTAAACATGCTATTGAAAGTGGTTATAGACATATAGACACAGCTATGGTTTATGAGAACGAAGAAATGGTTGGCCAAGGTATAGCTGAGGGATTGGCTTCAACAGGATTGAATCGAAGTGACTTGTTTATCACATCTAAACTATGGCTTGCGGATTATGGTCGCGTTAACGTAGCAGATGCTTATGAGACTAGTTTAAATAAATTAGGGCTAGATTATTTAGATTTATATTTAATGCATTGGCCTGGTCTTGATGAAGCGTTAATGATTGATACATGGCAGGGTATGGAAGATTTATATAAAAACGATAAAGTTAAAAATATTGGTGTAAGTAATTTTAATACTGAACATCTTGAAGCGTTATTAGCACAAGTTTCGATTAAACCAGTCATCAATCAAATTGAATTCCATCCATACTTAACTCAGTCCCAATTGAGAAGATATTTGGAAGTGCAAAATATACAGGCTGAATCATGGTCTCCCTTAATGAACGCCCAAATTTTAGAAGACGCTACCGTTAAAGCAGTAGCTTCAGAAATTGGTAAAACGCCTGCGCAAGTCATTATAAGATGGAATGTTGAACACGGCGTAGTTGTAATTCCTAAATCTGTAACGCCATCAAGGATAGAAGAAAACTTAAACGTGTTTGATTTTGTATTAACAAAAGGACAAATTGAACGTTTAGACCAATTAAATGAAGATAAAAGAATTGGTCCAGACCCTTTAGAATTTAGCGGGAATTAAAAAATATATATTGGTATAATACTAAAGACCGTAAGCGAATGCTGACTAATAGCAAAGCTTACGGTCTTATTAATAAAAAATTATACTATTATATAACCTAATAAACATGCAATAAAAGCTACTACATATTGTATTAATGAATAGGTAATAAAATTAAGGATATTTTTTTCTGGTGTTAACATCTTAACTAATTCTGAAGAAAGCGTTGAAAAAGTAGTTAGCCCTCCAAGTATACCAACTACTAAAAATGAATCTACCCATGGAATATTGAGTGACATACCCATGATTAAACCAATAATAAAACTACCTAAGATATTTACAAAAGGTGTAGCTACAGGTAAAGTACTATTTATTTTGTTGGCAAACACGTTAGTAAGAAATCCTCGAATGACTGCACCAATACCGCCACCTAACATCACCAAAATAACTTGAGTCATGAGAAACGTGCCCCCAATCTTACGCCAATATAACAAACTAATACACCTAGTATATAGCTAACCAACGCATAGATAATTAGCATTGCGTAAGCTTGCTGGTGTAAAAATCCAATAAGTTCAAATTGGAAGGTAGAGAACGTTGTAAGGGCCCCTAGTAATCCAGTAGTAATACCCTTTTTAAGTTGAGGGTTGTTGTTAAAATATTGTATTGCCATGGTTCCTAGTAATCCCATTAAAAAAGCGCCCAAGATATTTGCGAGGAATGTCCCGGTCGGGAAACCATCAGTGTAGTTTAATATTGAAAAAGTATAGCGGATCAATGCACCAATAGCTCCTCCAACGAAAATATATACATATTGCACTATTATAACTTCCCTTCAAAAAATAAAACTACAAAAGTATTATAACTTTTGTAGTGAATATTAGAAAATAATACCAAAAGTGGAAAGTGAAGCAATAATATGAATCACTAACACAACTAATATGATATATGGTAAAGCTTTACTAGCTGGTCTAATCCAACCCGAATTTTCGTGTAAATGTTTTATGGATTTATCAGAAAATATAATTGAAATAATTAATATAATAGCATTGATAATACTACAAACAAAAATAAGTTTAACCATTGAATTAAAGTGCATATTTAGTAGAGGGTTTCTAGTATTAAAATAAAAACTAATAATAATTAAAATGCATGATAAATAAAAATAAAGTTTTGAGCGTGCCATAATAACCTCCTAGTGCAATTCATTTAGTAATAATATCATATATTAACTTAAATTTAACTAAATTTACAATAAGTAAAATAATTTAATATATAAATCAAGAGTTTGAAAGTTGTCACTATAGGGTTTACAACAACTGTAGCATTAATGTTTATTCTGAAAAATTTTTGATTATAAGCAGATAAATAGAATTTATTAAAAAAAGATGGTATAAATAAACTGTATGGTTATTGACCGTTATAAAAATAATTCTTTATAGAATTATTTATTTTAGTCAGGAGGAATTAGTAATGGCAAAATTAAATGTTGAAGTGTTTGCAGACGGTGCAGATATTGAAGAAATGAAAGCAGCTTATAAAAATAAACAAGTAGATGGTTTTACAACTAATCCAAGTTTAATGGCAAAAGCAGGTGTAACAGACTATAAAGCTTTCGCTGAAGAAGCTGTTCGTGAAATTCCTGATGCTTCTATCTCATTTGAAGTATTTGCTGATGATTTAGAAACTATGGCAAAAGAAGCTGAAATTTTAAAACAATATGGCAGTAACGTATTTGTTAAAATTCCAGTTGTGAACACAAAAGGTGAATCAACTATTTCTCTAATCAAAAAATTATCAGCAGAAAATGTTCGCTTAAACATCACTGCTGTTTACACTTTAGATCAAGTTAAAGAAATTACAGACGCTATAACAGAAGGTGTACCAACTTATGTATCAGTATTTGCTGGTCGTATTGCTGACACTGGCGTTGACCCAATCCCAATGATGAAAGAGGCTGCTGAAATAACGCACAGCAAAGCAGGGGTAAAATTATTATGGGCAAGTTGTCGTGAAGTCATCAATGTGATTCAAGCTGACGAAGTTGGCGCTGATATTATCACATGTCCTGCAGATGTTGTTAAAAAAGTAAACAATAATCTTGGCCGTGACATCAATGAACTATCAGTTGATACAGTTAAAGGATTTGCAAAAGACATCCAATCTTCAGGACTTTCAATTTTATAATAGACAGAACGAAACAGAAATTTATTTTCTAACAGGTTTCGTGATTTTATCTAGCAAGGGTGGCTAAGAAAAATGCCAGAACTGCAGCGCTTTTTAGCCCAGTCATCCATTGTTAACAATGAAGATGAGCCTAGGATATTAATTTATCCTAGGCTCTCATTTTCTATTAAATGGTATAATGCTTATTTTACTCAGCGATTAGCATCATTTACATTTAAAATTTGAATTTATATTAACGTATGGATTATATTAAAAATAATTTAAAATAAAAGGGTGAAACGAGGTCGTGCGTAACAGTGAAATTACAACAACCAAAGATAGCAATGAATTTAGATACAGGGTTATTAGATGATGTTTTTAAATATGATGGCGTCATTGAGAGGGCAGATATAACTGAATCTCAGTTAAGTAATGTTACATTAGATAAATTAATGATTTACAGTTCAGTAATTAAAAATTGTGATTTATCTCATTCACATTTTAATCGGGTAGACTTTACAGATGTTATTTTTGAAAATTGTGATTTGTCTAATGTAAAAATCGATTTTGGTTCAATACATAGAGTGATTTTCAAGGGTTGTCGTCTTACTGGTGTTCAATTTAAAAAGGTAAGTATTGGGCACGTCTGGTTCGAAGAAGTAAAAGCTGATTTTATAGGTTTTATCGATGCTAAAATTGATAGTTTTTTAACAAGTGACAGTTTTTTAGGTAGTGCGGTTTTTTATAATACAAAACTAAACGATATACAATTAGAAGGTGCTAATTTAGAAGATGCCTCATTTTACCAAACCCCACTTAAACACTGTGATATAAGCCAAGCATTTTTTAAATCCATACAAGTTAATAAAGAAGACTTGTTCGGATGTAAAGTTTCTAGAGAACAGGCACTACAATTTGCAATATTAATGGGCTTAGAAATTATCGACTAAAGTAGTTGAAAATACAAATTATTTTAGACGTATTTAGTTTTAAAAATATGAATAATATGATTGAAACCGTGAAATAAATAACTTATTCTTTATAAAGGTAGTATACGTTTAATATATTTAAGGAGAAACTTTTAATGAAGGCAAATATTTTTAAACAAAAAGTAAAAAAGCATTTATGGTTTTTAAATAAAAAAGAAAAACAACAACTAGACCAAGTATTATCAGAAGTTACGAAAATGGATCATGGTGAGGAACTTAATCGTCCAATCGCATTTTCAAATCAGTTTTTAAACAATTATATTTTTAAAGAAAAAGTAGCTCCATCATCTTATTTCTTTATGTTATTACTTGGCATTTTATTTACATATATCGTTTTATTAGGTGTATTCTTGTTTGCTTTACTATCAAGCTTATCATCAGTTCAATATTTTATTAAACCGGAAGTACAGTTATCTAGCACTGTAGTTATTTTAACGTTAGTTGGGTCAGTATTATTACTAATTATTAGTATCTACTTGATTCAAAAGGTGACTGGTTATTTTACGAAAAAATTATTAGAGTATAAACATAATAGGTCATTATAATTATATTTTATTGCATTAGGTGAGACAGTGTTATACTTTCTTGCCATTTTTTATATACAAATGTATATGGAACATCAACTATAATAAATGTTGCATTTTCAAAATAGATGATTGACTTATTATTGTGTGATTTAATCCCAACAATAGCATTTGCGTTGATATAGTATTGCAAAGGGGCGCGCTTAGCTTTAAGTGGGAATAAGGTTATATGTGAATTAATAAATATGGGGACCATTTTTCGGATTTTTAATATTTGCTTGGCTTCCTTAATTTGATGAGGGAGCGATAATCGATATGTGTCTAATAAATAGTGAACCGTTGGCATCATTGAAGTAGGATAGTTAAATTGATGTGTTGTATATTGGCCAATAGTCATAAGTTCATCACTAATAACTGTTTTAAGGTACAATAATTTTGATATTTGTGTCATTTTAGGCTCCTAATCTTATTTTGGTGAATAAAATTTATAATACTTTTTTTGAACTTTTTTTCGATAATTTTTTACTGTAGAAATGGAACAATTTAGCATACATGCTAACTCACTTTGCTTATAACCAGAAAGTTTTAATATCAGCCACTGTCTCTCTTTTTCCGTTAATTGCTGTAAAAAATGTTGATACATTAGATGGTTATTAGTAATATCAGTGTTGTTAGTTTGTTCATCTATTTGTTCTGTTAAATATAGGATGTTTGTTTTCTGATTTTGGCATCGGAAAAGGTCTATTAAATAGTAGTTTAAGCGGTTATAAAGGAATTGACCCAAAGAGTAAGTATGATGTGGTAAGTAATTTTGCGTTAACTCCCACATTTTGATAGTGAGTAATTGAGTATATTCTTCTCGATTATACTTAATACGGTATTTGTTTAGTAAAATAAAAATAATATGTTTGAATTGAAAATAGAGTTGTTCGAAAGGCAT
Protein sequences of DBSCAN-SWA_2 >CP017459|1177740:1193600|1192688_1193111_-|AWI44249.1|DBSCAN-SWA MTQISKLLYLKTVISDELMTIGQYTTHQFNYPTSMMPTVHYLLDTYRLSLPHQIKEAKQILKIRKMVPIFINSHITLFPLKAKRAPLQYYINANAIVGIKSHNNKSIIYFENATFIIVDVPYTFVYKKWQESITLSHLMQ >CP017459|1177740:1193600|1189082_1189439_-|AWI44245.1|DBSCAN-SWA MTQVILVMLGGGIGAVIRGFLTNVFANKINSTLPVATPFVNILGSFIIGLIMGMSLNIPWVDSFLVVGILGGLTTFSTLSSELVKMLTPEKNILNFITYSLIQYVVAFIACLLGYIIV >CP017459|1177740:1193600|1190454_1191168_+|AWI44247.1|DBSCAN-SWA MAKLNVEVFADGADIEEMKAAYKNKQVDGFTTNPSLMAKAGVTDYKAFAEEAVREIPDASISFEVFADDLETMAKEAEILKQYGSNVFVKIPVVNTKGESTISLIKKLSAENVRLNITAVYTLDQVKEITDAITEGVPTYVSVFAGRIADTGVDPIPMMKEAAEITHSKAGVKLLWASCREVINVIQADEVGADIITCPADVVKKVNNNLGRDINELSVDTVKGFAKDIQSSGLSIL >CP017459|1177740:1193600|1192231_1192681_+|AWI44248.1|DBSCAN-SWA MKANIFKQKVKKHLWFLNKKEKQQLDQVLSEVTKMDHGEELNRPIAFSNQFLNNYIFKEKVAPSSYFFMLLLGILFTYIVLLGVFLFALLSSLSSVQYFIKPEVQLSSTVVILTLVGSVLLLIISIYLIQKVTGYFTKKLLEYKHNRSL >CP017459|1177740:1193600|1180953_1181721_+|AWI45763.1|DBSCAN-SWA MPVEVPEHVFEEVTYKVDGINVRGLLMTPQKSVERIVIYLRGGKGQVGKVRAARLMQFSDPNTLVFGPYYRGNNGSEGKDEFYGRDLNDVAVAIRILNMMYPKAYIHMVGFSRGGLQGLLTYQDLPVSSYIIWGGVSDIKLMYEERVDLRGMLKRMIGHPRKNEMAYKERDAVVTIHADSPPILIVHGGKDVQVGIHQAYYLEKQLKRIGTFFKTFYQMDEGHVPRPYAMKEALSTVKQWMTDIERQNLKAEYNK >CP017459|1177740:1193600|1191491_1192097_+|AWI45765.1|DBSCAN-SWA MNLDTGLLDDVFKYDGVIERADITESQLSNVTLDKLMIYSSVIKNCDLSHSHFNRVDFTDVIFENCDLSNVKIDFGSIHRVIFKGCRLTGVQFKKVSIGHVWFEEVKADFIGFIDAKIDSFLTSDSFLGSAVFYNTKLNDIQLEGANLEDASFYQTPLKHCDISQAFFKSIQVNKEDLFGCKVSREQALQFAILMGLEIID >CP017459|1177740:1193600|1180463_1180946_+|AWI44240.1|DBSCAN-SWA MCVKFKDRENDDVFLSFKDDNAVPNGDHVLVIPVYHNQLLFTKHKIRGVEFPGGKRENGESSEAACERELFEETGALIKTKEKHYIAQYRVARQNGKPFTKDVFMVDVDKLPIQEDYLETEGPRLFDRLSDIPELDKSYLLKDAAILQCLERVIELGFYQ >CP017459|1177740:1193600|1186961_1187870_+|AWI44243.1|DBSCAN-SWA MNSFGPIEIGLIVAIIVAVICLILFLVALKSKKKAQQTIEEQYKSREQKLSDEHGEELEKERIENKKQVTKQKEEYEATVNSKNQEIDALKLFSKNESEYVTDMRLIGIRERLVNEKRIRPEDMHIMANIFLPKNNFSDVRRISHLVLTRTGLYIIDSQLLKGHVFNGINATQFKEQPMMEQVFETLDLDKQTPQTLAMDQNEDKDTLSFVNYTNYLNEVEKLAGDLQTELNLKFTPTSILYFNPKEEGAVTISNYAQSTNSKVLVGPEQLDEYFNKFVFHGRIQYNVEDLQRVMEEIEMFN >CP017459|1177740:1193600|1193126_1193600_-|AWI44250.1|DBSCAN-SWA MPFEQLYFQFKHIIFILLNKYRIKYNREEYTQLLTIKMWELTQNYLPHHTYSLGQFLYNRLNYYLIDLFRCQNQKTNILYLTEQIDEQTNNTDITNNHLMYQHFLQQLTEKERQWLILKLSGYKQSELACMLNCSISTVKNYRKKVQKKYYKFYSPK >CP017459|1177740:1193600|1177740_1179150_+|AWI44237.1|DBSCAN-SWA MRWRNDKVEFWLKTQAKQNGDKVFIDDGTVQVTFASMYKYASRLAQQLKKLDRRRIGLYIENNIESITLINAMWLAGIEIAMLNTRLTKDEMQNQLSSIEVDTVVATSQINLKAISVIKISTLQQGCNDMTYESLFDMNQIASIMFTSGTTGPQKAVPQTFDNHYASAIGCKESLGFDQETKWLSVLPIYHISGLSVILRALIEGFTVRIDTKFNAHTMLNIIQTELPTHVSLVPQTLKWLMDEGLNQPYHIEKILLGGAKLSSSLIETALASKLPIYNSFGMTETCSQFLTASPEMLSKRYDTVGKPSANVAVKIKDPNAEGHGELLIRGANVMDGYLYPENLLDTFENGYFKTGDIAEIDKDGYVMIYDRRKDLIISGGENIYPYQLESVAKDHEAILDAMCIGVEDNTWGEVPYLYYVSNTSLSYETLMNHFKAHVAKYKIPKYFEQVTELPYTSTGKLQRKHIEK >CP017459|1177740:1193600|1185669_1186866_+|AWI44242.1|DBSCAN-SWA MTYNRRLFTSESVTEGHPDKIADQVSDAILDEILKDDPNARVACETTVTTGMALISGEISTATYVDIPKVVRETIKNIGYTRAKFGYDSQTMAILTAIDEQSPDIAQGVDNALEYRDHLTEEEIEATGAGDQGLMFGYATNETDTYMPLPIFLSHQLAKRLSDVRKDEILKYLRPDGKVQVTVEYDEQDKPQRIDTIVVSAQHAENITLEQIQTDIKEHVIYPTVPEGLIDEHTRFYINPTGRFVIGGPQGDVGLTGRKIIVDTYGGYARHGGGCFSGKDPTKVDRSATYAARYVAKNIVAAELAEKCEVQLAYAIGVAEPVSIAIDTFGTGKVSEAELVEAVRAHFDLRPAGIIKMLDLKHPIYKQTAAYGHFGRTDILLPWEKLDKVNLLKDSVQV >CP017459|1177740:1193600|1183700_1185290_-|AWI44241.1|DBSCAN-SWA MAVDTYTYTNKIQSILDKQSSLFQLSTTQLYKKILDNNEGELTELGAINAKTGKYTGRSPKDKFIVNEPSYRDDIDWGNINQPIDEETFLNLYEKVLNYLNERDELYVFNGYAGSDEDSQLKLTVVNELAWHNLFAQNMFIRPDSKEEAEEIKSDFTIVSAPHFKADPTQDGTNSETFIITSFKHKLILIGGTEYAGEMKKGIFSVMNYLLPKDDIMSMHCSANVGEKGDVALFFGLSGTGKTTLSADANRKLIGDDEHGWNENGIFNIEGGCYAKAINLSYKKEPQIYDAIKYGTILENVVVDEDGDIDFDDNYYTENTRAAYPINHIENIVTPSKAAHPNTIIFLTADAFGVLPPISKLNKDQAMYHFLSGFTAKLAGTERGVTEPEPSFSTCFGSPFLPLHAKVYADLLGNLIDKHDVDVYLVNTGWTGGKYGTGRRISLNYTRQMVEQAITGQLRDSEYIKDDMFGLNIPVEIKDVPQTLLNPINAWSKPEAYREQAQDLIDRFKHNFEKFGDEVSDLAENGGFK >CP017459|1177740:1193600|1189435_1189759_-|AWI45764.1|DBSCAN-SWA MIRYTFSILNYTDGFPTGTFLANILGAFLMGLLGTMAIQYFNNNPQLKKGITTGLLGALTTFSTFQFELIGFLHQQAYAMLIIYALVSYILGVLVCYIGVRLGARFS >CP017459|1177740:1193600|1188165_1189002_+|AWI44244.1|DBSCAN-SWA MEHVTFYNGNEMPIIGLGTFRVENNDECKAAVKHAIESGYRHIDTAMVYENEEMVGQGIAEGLASTGLNRSDLFITSKLWLADYGRVNVADAYETSLNKLGLDYLDLYLMHWPGLDEALMIDTWQGMEDLYKNDKVKNIGVSNFNTEHLEALLAQVSIKPVINQIEFHPYLTQSQLRRYLEVQNIQAESWSPLMNAQILEDATVKAVASEIGKTPAQVIIRWNVEHGVVVIPKSVTPSRIEENLNVFDFVLTKGQIERLDQLNEDKRIGPDPLEFSGN >CP017459|1177740:1193600|1179163_1180168_+|AWI44238.1|DBSCAN-SWA MKICEMNLYICNNHFKHLIVTPKVKLEKRKALIIEFITDRQVRYFGECNAFETDWYDDETIEIAREQAIKWFESFKNYEFYHFEEIQHALQNLEQFPATRSMIVMACYQAFYKLEAFHVPYGATVSGVTDENVRNLINTKPQRVKVKWSETILKDVKQLQQLPFKTEIVVDANESIQEDEAKKLKLLSENDILYIEEPFKNIEKIKNFKYDEIPPIAIDEKATSLEKILNYVKNNDVDVVVLKPFRLGGIDKVIQIIDILSDRNVKFVIGGMYEYGLSRYFTALLAQYATYPSDITPQGFYFENDIVACSGILKRGSIYFEPPHVNKLELDQID >CP017459|1177740:1193600|1189861_1190167_-|AWI44246.1|DBSCAN-SWA MARSKLYFYLSCILIIISFYFNTRNPLLNMHFNSMVKLIFVCSIINAIILIISIIFSDKSIKHLHENSGWIRPASKALPYIILVVLVIHIIASLSTFGIIF >CP017459|1177740:1193600|1180164_1180401_-|AWI44239.1|DBSCAN-SWA MKKLFLGLIHIYQHLISPMTPATCRFYPTCSEYTREAIQVYGPIKGTWLGIKRISKCHPLHKGGFDPVPLKKDKTHKH |
17 | Staphylococcus_phage(92.31%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1196674 : 1203441
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >CP017459|1196674:1203441|DBSCAN-SWA AATGCGTATAGCTATCATTGGCATGGGAACTGCAGGCGTTAGTTTATTAAAAGAATTAGTGAAATATGATGAGTTCGACCAAATGAAAGTAGATGTTTACGATAATCCTAAAAATATGGGGCAAGGTATACCATTTCAAAATGACAGCGATCAATTGCTTATCAATTTGCCGGCTAAACAAATGTCTCTCAACTTGAAAAATGAACGCGAATTCTATGAATGGTATCAACAACAATCTATATTTAAATTTTCCAATCCAGAATATTTACCTAGATTTATATTTGGCCATTATATGAAAGACTATTTAGAAACATATCATAAACAATATAAAAATATTCAAATGATTAAAAAAGAAGTTTTAGAAGTGTTTATAGATGCAGATATAGGCGAGACAAATATAAAATATGTCGTCTGTACATCTGAAAAACCAGATTGCCAACAACAATACGATATTGTATTTTTAACAGTTGGTACGTTATCGTATCATGATCCTTATCAATTAAAAGGAACGCCGGGATACATACAAACGCCATACCCGACTTATGACACATTGAACGAAGTTGATAGCACAGACAGAATAGCTATTATTGGTACGGGGCTAGCAAGTTTAGATGTTATTCGATTTGTAACTGCGCATCACCCAAATTTACCTATTTCCGTGACTAGCCGAAAAGGTCATTTACCTAGTGTAAGAGGCGATATGCCAGAAATTCAGTTTAAATACGTTACACCTGAAAACTTTAATAAAATCAAAAAAGAAAACTTGGGGAATGTGCCTTTAGAAGATGCTTTAACATTATTTAGAAAAGACTGTACGTATTATGATATTCCAGTAGAAAAATTAGTTCATAGAAGAAAAGGCGACCCTATTGCGGATTTAACATATGATTTAGAACACAAAGAAATATTGGGTAAATTTCAAAGCATTCTTGAATTAGCAAAAGAAAATCTCAATTGGATATGGAATAGTTTTAGTAGAGACGATCAAAAAACTTTTTTACGAAATTACCAATCTATATTAAAAGAGAATTCTAACCCAATGCCTCCACGTACAGCAAGATTAATTATAAACCATATTCAAAACGGACAAATTGAAATAAAAAAAGGGCTAGAAGATGTAAAACATGATGGCCAGCATTTCTGGTTTAAGTATGAAGATGATTTCAAAGCGATTGATAAATTTGATGTTGTAATCAATGCAACGGGTTCAAAATCACATTTGTCAGAGTTAGATAATGATGATCAATTGATTCTAAACTTAGAAAATAGACAAGTTGTTCAGGCACACCCATTAGGCGGCATACAGATTATTCCTGAAACAAATCAAATTATAAGCCCACGGTATGGTACTTTAAAAAACATGTTCGCTTTAGGTCAATTGACAAATGGGATTAATCAATCTCGTAACGGCGTAACAATGATTGTAAAACAAGCTGTTAGTGTGGTAGAAAATTTATTAAACCGCGATCAAAATAAGTGCTAGTCTAAATAATATATGAACTGAAACCTATCTTTACTATTTATATAAATATGTTTAGCAAACACTTGATCATATACATGTGACCTTACTAAATAGTTTGTATTGGTTATTTTAATTATAATACGTAAAAGTAATTTGGCTTTTTAACAGATTAATATTTAAGTAAACACATAAAAGTTTTAATTAGTTTATTAATGATGTTTAACGTTTAGTTGTTTTAATTTTTTATAAAAAATTTCTTGAAAATCTTGTTGTCACAAGGAATTGAAGTGTTTTCAACAGATAAACAAAACCGACTTAAGTAATAAGAATTGTTTTTTACCATAAAATATAGTACGATAACGTTGTAGCTTTAAAAAGTTACTTGACTCAATCATCAATTACAATTTCATAAATGTTCTTTCGGGGCAGGGTGAAATTCCCAACCGGCAGTAAATAAAGCCTGCGACCTGCATTTGTTTTTACAAATGTGGCTGATCTAGTGAGAATCTAGAGCCGACAGTATAGTCTGGATGGGAGAAAGAATGGAGTATAACAAACAGCACTGCTTAGAGTGTTTATTTAGTGTACATTTTTCTATCATTTGGAAAAGTGTATTTAATGTTAAACAAATCATGTTATATCGAAATATATCCCACACCTGAAAACCATTTCAGGTGTTTTTTATTATTTAGAGGTGATTATTATGAGTCAATATTTAAATTATGCAATTCAATTGGCAAAAATGGTAGACGGTCAAACAGGAATAAATCCGCCTGTTGGTGCTGTTGTAGTTAATCAAGGTAGAATCGTTGGCATAGGTGCCCATTTACAAAAAGGTGATAAACATGCTGAAGTTCAAGCTTTGGACATGGCAAACGAAACAGCTGCAGGTGGCACAATCTATATATCTTTAGAGCCCTGCTCTCATTATGGTTCAACGCCACCATGCGTTAATAAAATTATAGATTTTGGTATTAAACAAGTAGTCTATGCTGTTAAAGATACAACTTTGACATCTAGAGGTGATGAAGTCTTACAACATGCTGGAGTCAAAGTGGAATTTCGTCATAAACCTGAAGCAGAAGCCTTATATAAAGACTTTTTTATAACTAAAAGACAAGGTATTCCGGAAGTTACAGTGAAAGTATCTTGTAGTTTAGATGGTAAACAAGCTACTGATAAAGGTGAAAGTAAATGGATTACAAATAAATCAGTCAAAAATGATGTGTTTATGCTTAGACATAAACATGACGCTGTGATAACAGGAACTGGCACATTAAATGCTGATAACCCTCAATATACTACCAGAATAGAAGAAGGTAAGCATCCTATCCGTATTATACTTTCAAAATCAGGTCGAATTGACTTTGATTTAGATATGTTTAACCAATCTAATGTGCCTATTTGGATTTATACAGAACAAGAAAAATTAAAATCAGATATTGAACATGTAGAAGTCATTCATTGTTCAAACTGTTCTCTTGAAAACATTTTAAAAGATTTATATCAAAAAGGGATTGGGCGTGTCTTAGTTGAAGCCGGCCCTACGATTACTTCTGAATTTCTTCAATCTAATTATACGAATGAACTTATCTTATATTATGCCCCGAAAATGATAGGTGGTTCTGGTGATTATCAATTTTTTAAAACAGAAAATGTATTTAATTTATCAGAGGCACCACAATTTGAAATTGTAAATTCTCAAGTGCTTGAGCAAAACATTAAATTAGAATTGCGAAAGAAGTGAATTAATATGTTTACTGGCATTGTGGAAGAAATAGGTACGATTAAAAAAATGACAACCCAGCAATCAATTGTTAATTTAACCATTGATTGTCAGACAATTTTATCTGATATGCATATTGGCGATTCAATCAGTGTGAATGGTGTTTGTTTAACAGTAGTATGTTTTGATAACCAAACATTTTCAGTACAGGTGATTAAAGGCACTGAGAATAAAACATATTTAAACCGGTTGAATCAATCCGACGAAGTGAATTTAGAACGAGCGATGAGTGGTCAAGGAAGATTTGGTGGTCACTTTGTGCTTGGTCACACAGATGAAGTAGCTAAAATCACTAGAATACAGAACTCAGATAATTCTAAAATTGTAACAATTAAACCATCTAAATCCATTATAAATCAAATGGTACAACAAGGTTCTATCACTATAGATGGTGTGAGTTTGACTGTTTTCCAGTTGAAAGAGTCAGAATTTGATATTCACCTTATACCGGAAACAAGAAAATCCACTATATTAAATCAAAAACGTGTTGGTGATCCAGTTCACATAGAAACGGATATGTTATTTAAATATGTAGAAAAAATAGTTGGAAATAATGATTCAGGTTTGAGTTCTGAAAAACTAAAATCTTTTGGGTTCTAGGAGGGGTAATATGCAATTAGATAGTATAGAAAAAGCATTAAAAGCGCTTAAAAATGGCGAAAGTATCATAGTGGTCGATGATGAAAATAGAGAGAATGAAGGAGATTTAGTAGCCATAACAGAATGGATGTATGAGAACACGGTAAATTTTATGGCTAAATATGGCAGAGGACTTATTTGCGCGCCCATAAGTAAAAAAATAGCGCAAGACTTAGAGCTTAATCCAATGGTTAACCATAACTCAGATATTTATGGTACTCAATTTACAGTCAGTATTGATCACATCGATACAACAACTGGTATTAGTGCCGATGAAAGAATGCTTACAGCTAAAGCTTTAATTGATGAGCAAACTAAAGCTAATGATTTTAACAGACCAGGGCATTTATTTCCGCTCATTGCTCAAGATAATGGTGTGTTAGCTAGACGTGGTCATACAGAAGCATCTGTTGATTTAGCTCTTTTAACGGGAGCGAAACCGGCAGCACTCATTTGTGAAATAATGAATGAGGACGGTTCAATGGCTAAAGGAGACGATTTAGAAGCATTTAAAAACAAGCATCAGCTTGTAATGATATCTATTGAAGACTTAGAAAATTACAGAAAAAATACTGATGCGCCGCTTGAAGCTAAAGCTAAAGTACAACTACCTACAGATTACGGTAACTTTGATATGTATGGATTTTCAACTCAAAACAATGAAGAAGAAATAGTAGCCATTGTTAGTGGTGAAATCAAAGAAACCGAAAATGTACGTATCCATTCTGCTTGTTTGACTGGAGATATCTTTCACAGTCAAAGATGTGATTGTGGAGAGCAACTTGCTGCCTCAATGGAATATATTAGTGAAAATGGTGGTATCATTTTATATTTACCCCAAGAAGGCAGAGGCATTGGTTTAATTAATAAATTAAAAGCTTATGAATTGATAGAGCAGGGATATGATACAGTTTCTGCGAATATTGCTTTAGGTTTTGAAGAGGATTTAAGAGATTACCAAAATGCTGCAAAAATCTTAAAGTATTTAGGTGTAAAACGCGTTAATTTATTAAGTAATAACCCTAAAAAATTCGGTAGTTTAGAAAATTATGGCATCGATATTGCCAAAAGAATTGATTTGATAGTTCCTACAAATAAATATAACCAAGATTATATGAAAACAAAAAAAGAAAAAATGGGTCATTTAATATAGGAGGCAAAAAAATGAATTTTGAAGGTAAATTAATAGGATCAAATTTAAAAGTAGCAATTGTAGTAAGTAGATTTAATGATTTCATCACGAATCGTTTGTTAGATGGTGCAAAAGATACCTTAATAAGACACGAAGTTTCGGCTGGAAATATTGATGTGGCATATGTACCAGGTGCTTTTGAAATTCCATTAGTGGCTAAAAAGTTAGCTCAAAAAGGTGAATATGATGCAGTAATCACTTTAGGATGTGTAATCAGAGGATCAACTTCTCACTATGATTACGTGTGTAATGAAGTAGCAAAAGGCGTGTCAAAAGCAAATGATGTAACAGATACACCAGTAATATTTGGAATATTAACGACTGAGAATATTGAACAAGCTGTAGAACGTGCTGGTACTAAAGCTGGAAACAAAGGTTCTGAAGCGGCAGTAAGTGCAATCGAAATGGCTAATTTATTAAGCGAAATATAATCAGCATTAGCATACTTCTATAGTAATAGCGTTTACTAAGACTTCTTATTATGGAACGATATCCCATAAGTTAAGATGAATTTAATTTATAATATAAAAAATGGTGAAAAACTTTTTGAATTTTAAATCCTTTTGTTGTTTTTCATAGGCAAATGTAATGATAATAATATTTAGAACCGAGAGATTTGCTGTTAATACTAAATGAGAGCCTGAGACATAAATGTTTCTGGCTCTCATGCTTGTTAAGCGGCATAAATCATTTTTTTAATACTTTATATATTAATGCACTAGATACGCCAATAGCTGTTAACAAACTGGCTACAAAGCCTGTTTTTTTCAATATTTCAGGTTTCATTAATTCTAAAAACATTAGATTTAAGTTTTGTGGACGTTCTGCTAATCTTCTCATAAAGTAGCTGAACCAATCATCACCATACGGAACATATATACAAAAATGATTTCCTTCACGTGCAAGTAATCCTGCTAAATCTGATCGGAAACCGTACAACATTTGAAATTCGTATTTATCTTTTTCAATATTATTATCTTTAATAAACTGTTTAATATGTGTGATTATTTTATCATCGTGTGTAGCAATAGAAGTGACATTATTAGCGTTTAATAATCTTTTTTTAATTAAACGTATGTAATTTTCGTCAATGTCTTCTTTAGTTTGGTAAGCAATATTTTCATTTTCTTTATATGCACCTTTTACCATACGTAAACGCAGTTCTGGGTATTTATCGATAAGTGCATCTGCTTTATATAAATAAGCTTGAATAACTGTACCTACGTTTTTAAATTCACCTTTTAGTCGATCTAACACTTGAGTAATATCAAATAAGCTATCGTATTTCTCAGTGTCTATATTAATATGCATATTACCAAATTCATTTGCTTTTAGTAATATTTCGCGTAAATTACGATAAGCAAGGTCAATATCAAACTCCGAACCGAGTTGGCTTAGTTTAATAGACATGTGACCATCTAAGCTGTGGTTGTATATTGCATACATCACTTCTAATATTTGGTCTTTGGCCTGTATCGCTTCGCCTTCATTTAAAACAAATTCTCCAAGACAATCCACAGTAACAGTGATTCCTTTGTTATTTAAACGTTCAATTGTGTCTACTAAGTCAGTAATCGTATTTCCAGCAACGACTTTTTTAGCCCCAAACATAGGACCTATTTCCTTAGCTGTTTTATTTAAAAAGGGATTATTAGATAACCCTATAAAAAAATTTTTCACAATTGGCAT
Protein sequences of DBSCAN-SWA_3 >CP017459|1196674:1203441|1199888_1200521_+|AWI44255.1|DBSCAN-SWA MFTGIVEEIGTIKKMTTQQSIVNLTIDCQTILSDMHIGDSISVNGVCLTVVCFDNQTFSVQVIKGTENKTYLNRLNQSDEVNLERAMSGQGRFGGHFVLGHTDEVAKITRIQNSDNSKIVTIKPSKSIINQMVQQGSITIDGVSLTVFQLKESEFDIHLIPETRKSTILNQKRVGDPVHIETDMLFKYVEKIVGNNDSGLSSEKLKSFGF >CP017459|1196674:1203441|1198838_1199882_+|AWI44254.1|DBSCAN-SWA MSQYLNYAIQLAKMVDGQTGINPPVGAVVVNQGRIVGIGAHLQKGDKHAEVQALDMANETAAGGTIYISLEPCSHYGSTPPCVNKIIDFGIKQVVYAVKDTTLTSRGDEVLQHAGVKVEFRHKPEAEALYKDFFITKRQGIPEVTVKVSCSLDGKQATDKGESKWITNKSVKNDVFMLRHKHDAVITGTGTLNADNPQYTTRIEEGKHPIRIILSKSGRIDFDLDMFNQSNVPIWIYTEQEKLKSDIEHVEVIHCSNCSLENILKDLYQKGIGRVLVEAGPTITSEFLQSNYTNELILYYAPKMIGGSGDYQFFKTENVFNLSEAPQFEIVNSQVLEQNIKLELRKK >CP017459|1196674:1203441|1202439_1203441_-|AWI44258.1|DBSCAN-SWA MPIVKNFFIGLSNNPFLNKTAKEIGPMFGAKKVVAGNTITDLVDTIERLNNKGITVTVDCLGEFVLNEGEAIQAKDQILEVMYAIYNHSLDGHMSIKLSQLGSEFDIDLAYRNLREILLKANEFGNMHINIDTEKYDSLFDITQVLDRLKGEFKNVGTVIQAYLYKADALIDKYPELRLRMVKGAYKENENIAYQTKEDIDENYIRLIKKRLLNANNVTSIATHDDKIITHIKQFIKDNNIEKDKYEFQMLYGFRSDLAGLLAREGNHFCIYVPYGDDWFSYFMRRLAERPQNLNLMFLELMKPEILKKTGFVASLLTAIGVSSALIYKVLKK >CP017459|1196674:1203441|1201724_1202183_+|AWI44257.1|DBSCAN-SWA MNFEGKLIGSNLKVAIVVSRFNDFITNRLLDGAKDTLIRHEVSAGNIDVAYVPGAFEIPLVAKKLAQKGEYDAVITLGCVIRGSTSHYDYVCNEVAKGVSKANDVTDTPVIFGILTTENIEQAVERAGTKAGNKGSEAAVSAIEMANLLSEI >CP017459|1196674:1203441|1200531_1201713_+|AWI44256.1|DBSCAN-SWA MQLDSIEKALKALKNGESIIVVDDENRENEGDLVAITEWMYENTVNFMAKYGRGLICAPISKKIAQDLELNPMVNHNSDIYGTQFTVSIDHIDTTTGISADERMLTAKALIDEQTKANDFNRPGHLFPLIAQDNGVLARRGHTEASVDLALLTGAKPAALICEIMNEDGSMAKGDDLEAFKNKHQLVMISIEDLENYRKNTDAPLEAKAKVQLPTDYGNFDMYGFSTQNNEEEIVAIVSGEIKETENVRIHSACLTGDIFHSQRCDCGEQLAASMEYISENGGIILYLPQEGRGIGLINKLKAYELIEQGYDTVSANIALGFEEDLRDYQNAAKILKYLGVKRVNLLSNNPKKFGSLENYGIDIAKRIDLIVPTNKYNQDYMKTKKEKMGHLI >CP017459|1196674:1203441|1196674_1198156_+|AWI44253.1|DBSCAN-SWA MRIAIIGMGTAGVSLLKELVKYDEFDQMKVDVYDNPKNMGQGIPFQNDSDQLLINLPAKQMSLNLKNEREFYEWYQQQSIFKFSNPEYLPRFIFGHYMKDYLETYHKQYKNIQMIKKEVLEVFIDADIGETNIKYVVCTSEKPDCQQQYDIVFLTVGTLSYHDPYQLKGTPGYIQTPYPTYDTLNEVDSTDRIAIIGTGLASLDVIRFVTAHHPNLPISVTSRKGHLPSVRGDMPEIQFKYVTPENFNKIKKENLGNVPLEDALTLFRKDCTYYDIPVEKLVHRRKGDPIADLTYDLEHKEILGKFQSILELAKENLNWIWNSFSRDDQKTFLRNYQSILKENSNPMPPRTARLIINHIQNGQIEIKKGLEDVKHDGQHFWFKYEDDFKAIDKFDVVINATGSKSHLSELDNDDQLILNLENRQVVQAHPLGGIQIIPETNQIISPRYGTLKNMFALGQLTNGINQSRNGVTMIVKQAVSVVENLLNRDQNKC |
6 | Staphylococcus_phage(100.0%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
1343325 : 1352430
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >CP017459|1343325:1352430|DBSCAN-SWA AATGGATGATAGAATGGTAGATCAATCTATGCACGAAGAGGAATCATCATTTGAATTATCTTTAAGGCCAGAAAGATTGCGTCAATATATAGGACAATCAACGATTAAATCAAATTTAGAAGTTTTTATAAAAGCAGCTAAAATTAGGCAAGAACCGTTAGACCACGTTCTATTATTTGGCCCCCCTGGATTAGGAAAAACGACTTTATCTAATATTATTGCCAATGAAATGGAAGTTAATATTAGAACAATTTCTGGTCCCTCTATTGAACGCCCAGGTGACTTAGCAGCTATTCTTTCTAGTTTGCAACCCGGAGACGTATTGTTCATCGACGAAATCCATAGATTAAGTAGCGTAGTTGAAGAAGTGTTATACCCAGCTATGGAAGATTTTTTCTTAGATATTGTTATTGGCAAAGGGGAAGAAGCACGAAGTATACGTATAGATTTACCGCCTTTTACATTGATTGGTGCCACGACTAGAGCGGGTAGTTTAACAGCACCTTTACGTGATAGATTCGGCGTTCATCTCAGATTGGAATATTATAAAGAACCTGAATTAAAAGAAATTATCATTCGTACAGCAGAGGTATTAGGCACATCTATTGATGATGAAAGTGCAATAGAATTAGCTAAGAGAAGTAGAGGTACCCCAAGAGTTGCTAATCGATTATTAAAGCGTGTAAGGGATTTCCAACAAGTTAAAGAAGATGAATTGATTAGTATCGGTACGACGAAACAATCACTAGCATTGCTACAAGTAGATGATGAAGGGTTAGATTATATCGATCATAAAATGATGAATTGTATATTAGAACAATATAATGGTGGACCTGTTGGTTTAGATACAATTGCTGTTTCTATTGGTGAAGAACGCGTTACAATAGAAGATGTTTATGAACCGTTTTTAATACAAAAGGGATTTATCGAACGTACACCTAGAGGGCGTAAAGCAACAGCTTATGCCTATGAACACTTTAGTAAGGATAGAAAGAAGGAATAGTTTTGGATATTGAATCTTTTGATTACCATTTACCAGAATCATTAATTGCACAAACCCCTTTAAAAAATAGAGATGAGAGTAGATTGCTTGTCCTTGGAAGAAAAACGGGAGATATTGAACATAAATACTTTAAAAATGTAATTGACTATTTACAAGCTGGAGATACATTAGTACTCAATGATACGAGAGTTATGCCAGCGCGCTTATTTGGCTTAAAAGAAGAAACTGGTGCGAAAGTAGAAATGTTGATGCTTACACAACTTGAAGACGATGATTGGGAAGTATTATTGAAACCAGCGAAAAAAATAAAAACAGGGGATAAATTATCATTCGGTGATGGTAAAATAATAGCTGAATGTGTGGAAGAATTAAATCAAGGCGGACGCATTATGCGCCTTGATTATGATGGTATATTACAAGAGCGATTAGATGAACTAGGTGAAATGCCATTACCACCATATATAAAAGAGCGGTTAGATGACCCAGATCGTTATCAGACAGTATATGCTAAAGCCTCAGGATCAGCTGCTGCTCCAACGGCTGGACTCCATTTTACAGATGAATTACTTGAACAGATCAAAGCTAAAGGCGTGAATATAACTTTTATTACGTTGCATGTAGGATTAGGTACATTTAGACCTGTAAGTGTTGAAAATATAGATGATCATGAAATGCATAGCGAATATTATCAGATGGATCAAGAAACAGCTGATTTGTTAAATGAGACAAAAGCGAAAGGTCATCGTGTCATTTCAGTAGGTACGACATCTACTAGAACTTTAGAAACAATAAGAGCATCTCATAATGAATTTGTAGCAGATAGTGGTTGGACTGATATTTTTATTTTTCCTGGCTTTGAATTTAAAGCGATAGATGGATTAATCACAAATTTCCATTTACCGAAATCAACGTTAGTCATGTTAGTTTCTGCATTTAGTACAAAAGATTATATTTTAAATGCGTATCATCAAGCCGTGAAATCTGAGTATAGATTCTTTAGTTTTGGCGATGCAATGTTAATTATTTAGGGAATGAAAGGAGCATTTGTATGCCTGCGGTAACATATGAACATATTAAAACATGTAAACAATCTGGAGCTAGATTAGGCATTGTACATACGCCACATGGGTCATTTGAAACACCCATGTTTATGCCCGTAGGTACAAAAGCTACAGTTAAAACGATGAGTCCAGAAGAACTACATCAGATGGAAGCGAAAATTATATTAGGAAACACATATCATTTGTGGTTACAACCAGGAAATGATATTATCAAAAAGAGTGGGGGATTACATCAGTTCATGAACTGGAATGGTCCAATACTGACAGATTCAGGTGGTTTTCAAGTATTCAGTTTAAGTAATTTACGAAAAATTACTGAAGAAGGTGTTGAATTCCGTCATCATACAAATGGTTCTAAACTATTTTTGAGTCCTGAAAAATCAATGCAGATTCAAAATGATTTAGGTTCAGATATTATGATGGCATTTGATGAATGCCCGCCTATGCCAGCTGAATATAAGTACGTGAAAGATTCAATCGAAAGAACAAGTAGATGGGCCGCTAGATGTTTACAAGCACATCAAAGACCTGAAGATCAAGCATTATTTGGTATTATTCAAGGCGGAGAATATAAAGATTTAAGACAACAAAGTGCCGAAGAATTAGTAGCATTGGATTTTCCTGGATATGCCATTGGAGGTTTATCAGTAGGGGAACCAAAACCTGTAATGTACGATATGGTATCACATACACAACAATTTATGCCTAAAGATAAGCCACGTTATTTAATGGGTGTGGGATCGCCAGATGCATTAATAGAATGCAGCATTAGAGGTATGGATATGTTTGACTGTGTTTTACCAACACGTATTGCACGTAATGGTACATGTATGACTTCACATGGCCGTGTGACTATTAAAAATGCTAAATACGCAGAAGATTTAGGCCCGCTTGATGAAAATTGTGACTGCTATACTTGTAAAAATTATAGTAGAGCTTACATAAGACATTTGATAAAAGCAGAAGAAACTTTTGGTATCCGTCTTACTACTTATCATAATTTACATTTCTTGCTGAAATTAATGGAAAACATTCGACAAGCTATTCGCGATGATCGTTTACTTGATTTTAAAGAAGAATTTTTTGAACAGTATGGACTTAATGTAGAAAACCCAAAAAACTTTTAAAAAGGGAGAAATAACTTTATGCAATTTACTTCATTGATATTACCGATTTTATTATTAGTATTAATGTGGTTCTTCTTAATTAGACCACAACAGAAAAAGGCAAAAGAGCATCGTGAAATGATAAGTCAAATTTCATCTGGTCAACATGTAACAACTATTGGTGGCATCAAAGGCACTGTACGTAGCGTCGATGAAACAACTGTTGTATTAACTTTAAATGGTAATGGCACTGAAATTACTTTAGAAAAACCAGCAATTAAACAAGTTGATCCATCATAAAATTGATAATTACGAACTGATATTTACTATCAGTTCGTTTTTTGTTTAATAAAAACCTAAAGTTATTGGACTTTGGAGTCATAGTTGGTGTTATAATAAAAGATAGACAAAATCGCATAAATAACGAAACTAAATAAACATTACATATGAAGCACTTACATTTAAAAAGTAATTACAAATAGGTTAAGTTTGTTTTTACACTAAATGTAATATGTTAAAATATGAAAGGTTATTTAGAAAAGTTTAATCAATTTATTAAACGTAGAGAAACGCGATTGAATTTGAATTGATAACATAAGCTTACAATGAGGTGTTCAAGTGAAGAAAAGTAGTAGAATAGTTGCATTTATATTACTTGTAGTTCTATTGTTAGGCGGAATAGGACTTACATATAAAAATGTAGTTAAGAATGTCAGCCTCGGTTTAGACTTACAAGGTGGCTTTGAAGTCTTATACCAAGTTGATCCTTTACAAGAAGGAGATAAAATTGATGATAAAGCGGTAAAAGCCACAGCAAAAACACTTGAAAACCGTGTGAATGTTTTAGGAGTCTCAGAACCTAAAATTCAAGTGGAAGACAAAAACAGAATTCGGGTACAATTAGCAGGCGTGAAAAACCAATCTCAAGCCAGAGAAATTTTGTCTTCGCAAGCTAATTTAACAATTCGTGACGCAAATGATAACGTCAAATTAACGGGTAAAGATATTCAACAAGGTTCCGCAAAACAAGAGTTTAAACAGAATACAAATGAACCCGCAGTTACATTTAAATTAAAAGATAGTGATAAATTTAAAAAAGTAACTGAAGAAATTTCTAAAAAAGATGAAAATGTCATGGTTGTATGGTTAGATCACGAAAAAGGTGACACTTATCATAAAGAAATGAATAAAGAAGACCCTAAATATGTATCTGCTGCATCAGTAGATAAGCCGATTAATTCAGATAGTGTAGAAATTTCTGGTGGTTTTAAAGGGGAAGAAGGTATTGAAGAAGCTAAACAAATAGCTGATTTATTAAATTCTGGTTCTTTACCTGTAGACTTAAATGAGATTTACTCTAACTCTGTAGGCGCTCAGTTTGGTCAAGATGCGCTAGATAAAACGATACTTGCAGCAGCAATTGGTATAGCTGTTATTTACTTATTTATGCTAGGCTTTTATCGTTTACCAGGTTTAGTTGCAGTTATTGCGCTAACTGTTTATATTTATTTAACATTGGTAGCATTTAATTTCATATCAGGCGTATTAACTTTACCAGGTTTAGCCGCATTAGTACTAGGTGTTGGTATGGCAGTAGATGCTAACATTATTATGTACGAGCGGATTAAAGATGAGCTTAAAATTGGGCGAACCCTTAAACAAGCTTATAAAAAAGCGAATAAGAGTTCCTTCTTAACTATAGTAGATGCGCAACTTACAACAGTAATTGCAGCTGCTGTACTGTTTTTCTTTGGTGAAAGCTCAGTTAAAGGTTTTGCCACAATGTTATTACTTGGTATCTTAATGATATTTGTTACAGCTGTATTCTTATCAAGATGGTTGCTATCACTTCTAGTTTCTTCAAATTACTTTAAAAAATCTACTTGGTTATTTGGAGTTAGTAAGAAAAACATTGCAGATATAAATGAAGGCAAAGAAGTTCATGACCTCAAAACACCATATGAACGTTGGGATTTCATGAAGTTAGCTAAGCCATTACTATCTTTAAGTATTATCATATTGATTATTGGTGCAGTTATATTATTTGTTTTCAAATTAAACTTAGGTATAGATTTTACAAGTGGTACAAGAGTTGACTTCGAATCAAACGATAAAGTCTCTGAAGCAAAAGTGACCCAAACATTGGAAGATGAAAACTTTAAACCAACACAAGTATCATTAGGTGAAAACGGTAAAAACGTTACAGTACAATTTAAAAATGATTTATCAAAAGACGAAGTTTCAAAAATCAAAAATACCATTGATGATTCATTTGGCAATGACCCAACGGTTAACACTGTTTCCCCTGTAATTGGTCAGGAATTAGCTAAAAATGCAATGATGGCCTTATTATATGCCGCGATTGGTATTATCATTTATATTACCTTTAGATTTGAATGGCGCATGGGATTATCATCAGTGCTCGCGTTACTACACGATGCATTTATGATTATCGCTGTGTTCAGTCTGTTTAGACTTGAAATCGATATTACATTTATCGCTGCAGTATTAACAATTATTGGTTATTCCATCAATGACACAATTGTAACGTTTGATAGGGTACGTGAGAACTTGCATAAAATTAAAGTAATCACCAAACCTTCACAAATAGACGATATCGTTAATAGATCGATTCGACAAACAATGACACGCTCCATCAATACAGTATTGACTGTTATAATTGTAGTTGTTGCATTACTTGCATTTGGTGCACCAAGTATCTTTAATTTCTCATTAGCATTGTTAATTGGTCTCATAAGTGGTGTATTCTCATCTGTATTTATTGCCGTGCCACTGTGGGGCATTATGAAAAAACGTCAACTTAAAAAATCAGATGATCATAAACTTATAGTTTATAAAGAGAAAAAATCAAACGATGAAAAAATCTTAGTATAATAACTTGAGTTTTAATTAAAGCGACTAAATTCCAATTTGGAATCTAGTCGCTTTTACTTTTTATGAAACAGGTCAAATCAAATAATTGTATTTAAAAAATTATGGTAAGATTTCATAGATATACCTTAACAGTTAATAAGAAGCTCAAATCTATATCTAAATTAAAGGTTACTACTTTTTATTTTTGAATTTCTTTTGTATAATTGCTTGTGGAAATGAGGGAGAATAGTATGATTAAATCAAAATATAATTGGGACGTTAAATTACCTGAAGTTGAAATTACAGAAGATGTTTCAACAGATTTAAAGCTAACTCCTATTGTAAAAAAAATTCTGGAAAGTAAAGGGATAACAGAAGAAACTGCAATTCGTGAACTTTTAAACGGTACACAAATTGCGCACGATCCGTGGACAATGAGTGATATGCATAAGGCTGTGGAGCGTATTAATCTAGCTATAGATCAAAACCAAAAAATTTTAGTATATGGTGATTACGATGCTGATGGTGTCACTTCTACAACAATATTAGTTTCTACACTTAAAGCACTTGGAGCGCATGTAGGTTGGTATATTCCAAACCGTTTTTCTGAAGGCTATGGACCTAACGAGATGGCCTTTAAAAACGCTTATGAGGAAGGCATTTCACTAATTATAACAGTAGACAATGGCATTCAAGGCCATGATGAAATCCAAATGATTCAAGAATTAGGTGTAGATGTAATTGTTACAGATCATCATGAGATTGGTCGTACAATGCCTAACGCATATGCAATTGTACATCCAATGCATCCTGGGTTTGATTATCCTTTTAAATATTTGTGCGGTGCTGGCGTGGCGTATAAATTGGCACAGTGTTTATTGACTGAACCACCAACCCATTTTCTTGGTTTAGTAGCTATTGGAACGATTGCAGATTTAGTATCATTAACGGATGAAAATCGTTCACTTGTTCAACGCGGTTTAGACGTGTTAAATCAACACTGTCCATTATCAATAAAAGCGATTTTAAAACAAGCAGGTTGCAATGATGAAATCAATGAAGAAACTGTTGGTTTTGTTATCGGCCCGCGTTTAAACGCAGTAGGTCGTTTAGAAGATGCTGCACTAGCTGTCGAGTTATTAATGACAGAAACTGAAGAAGAAGCGGAATTTTTAGCTGAACAAGTTGAATTTTTTAACCAAGAACGTAAAGATATCGTCTCACAAATTACCGAAGAAGCATTAGTAATGGCAGAGCAACAGGTGCAAGATGGTTCTAAGTTCTTATTGTTAGCACAACCGGACTGGCATGAAGGCGTACTCGGAATTGTAGCTTCAAAAATTGTAGAAACATACAGTCTTCCTACATTAATTTTAAACATTGATCAAGCGCAAAACCATGCGAAGGGCTCAGCTCGTAGTATTGACCAAGTTTCGATGTTTGAAATTTTAAGTGCACATTCAGAGTTAATTTCTAAATTTGGCGGTCATCATATGGCAGCGGGTGTTACGATGCCAATCGAAAATATACAAGATCTACAACATGGTTTAAACGGTTGGATGGCTCAATTAGCAGAAACGACTTCTTTAGAACCGCGGAAAAAAGTGGATGTAAAAATATTAGAAAGTGATATTACAATAAAAAATATTAAAGATATTCATAGGCTCCGTCCATTTGGAACAGATTTTTCCAGCCCTTGTTTTGAATTACAAGATATTATTGTTCAACAAGCAAAAGGTATTGGTCAAGACAAAAATCATTTAAAACTTGTATTAGGGGATAGTCAATTACAGGCTATTTTTTGGCAAAATGGCTATTTAGTTAAAGAACTAGGTGTACAACAGCCGATTAATTTAATAGGTACTTTACAAATTAATGAATGGAATGGATTTCAATCTCCACAATTTATGGTTGCAGATTTAGCGAGTAATAATTTGCAGATATTGGATTATAGAAGTAAACGTAAAGTGAGCGAGTTAAATGCTGATGCTGAAGACGTTGCTTATTTAATTCATAAAAAAAGTGAAAAATTAGGTGAGAATTATTACTATTATGGTGAGGACATTATTAATAAATATGATAAATATGTATTTAGAGATTTACCTACATCAATCACTGAATTAAAAACTACTTTAAAAACAGTTGACGTATCTCAAATTTATCTTGTGCTAAATCATGAACGTTCTATATATTTTGAAGGTATGCCAAAAATGGAGACGTTTAAACAATGTTTTAAAGCACTAGCGTCTAAGAAAGAAATAAATTTAGCTAAGGAAGGTATGCAATTAAGCCAGTTTCTTAATATTCAACCGAGTATGCTTAAATTTATCTTAAAAGTTTTCTTAGATTTAGAGTTTATTAAAGATGAAAATGGTATAATAATGCTAAACAGTGTTTCGACAAAACGTGACATTGCAACAAGTAAATATTATCAAAATCGTCTTGATAGGATAGAAGTTGAAAAGTTATTGCTTTATGAAGATTTTAATCGCTTGAAGCAATGGTTTAAGGCTGAATTGGTAGAATAATAGGAGGAAGTTTGAATGGATTTAAAACAATATGTATCTGAGGTTTCAGACTGGCCGCAACCAGGTGTTAACTTCAAAGATATTACTACTATAATGGACAATGGTAAAGCTTATGGCTATGCTACAGATCAAATTGTGGAGTATGCAAAACAAAGAGATGTAGATGTTGTGGTTGGGCCAGAAGCGAGAGGTTTTATCATTGGCTGTCCTGTAGCATATTCAATGGGGATTGGATTTGCGCCAGTTAGAAAAGAAGGCAAACTTCCAAGAGAAGTGATTCGTTATGAATATAACTTAGAATATGGTACTAATGTACTAACAATGCATAGAGACGCAATTAAACCGGGACAACGCGTTTTAATAACAGACGATTTATTAGCAACTGGTGGCACAATAGAGGCAGCAATTAAATTAGTTGAACAATTAGGTGGTATTGTTGTAGGTATTGCTTTTATTATAGAATTGAAATATTTAAAAGGTATTGAAAAAATTAAAGATTACGATGTCATGAGTTTAATATCTTACGACGAATAA
Protein sequences of DBSCAN-SWA_4 >CP017459|1343325:1352430|1344329_1345355_+|AWI44371.1|tRNA|DBSCAN-SWA MDIESFDYHLPESLIAQTPLKNRDESRLLVLGRKTGDIEHKYFKNVIDYLQAGDTLVLNDTRVMPARLFGLKEETGAKVEMLMLTQLEDDDWEVLLKPAKKIKTGDKLSFGDGKIIAECVEELNQGGRIMRLDYDGILQERLDELGEMPLPPYIKERLDDPDRYQTVYAKASGSAAAPTAGLHFTDELLEQIKAKGVNITFITLHVGLGTFRPVSVENIDDHEMHSEYYQMDQETADLLNETKAKGHRVISVGTTSTRTLETIRASHNEFVADSGWTDIFIFPGFEFKAIDGLITNFHLPKSTLVMLVSAFSTKDYILNAYHQAVKSEYRFFSFGDAMLII >CP017459|1343325:1352430|1351911_1352430_+|AWI44375.1|DBSCAN-SWA MDLKQYVSEVSDWPQPGVNFKDITTIMDNGKAYGYATDQIVEYAKQRDVDVVVGPEARGFIIGCPVAYSMGIGFAPVRKEGKLPREVIRYEYNLEYGTNVLTMHRDAIKPGQRVLITDDLLATGGTIEAAIKLVEQLGGIVVGIAFIIELKYLKGIEKIKDYDVMSLISYDE >CP017459|1343325:1352430|1343325_1344327_+|AWI44370.1|DBSCAN-SWA MDDRMVDQSMHEEESSFELSLRPERLRQYIGQSTIKSNLEVFIKAAKIRQEPLDHVLLFGPPGLGKTTLSNIIANEMEVNIRTISGPSIERPGDLAAILSSLQPGDVLFIDEIHRLSSVVEEVLYPAMEDFFLDIVIGKGEEARSIRIDLPPFTLIGATTRAGSLTAPLRDRFGVHLRLEYYKEPELKEIIIRTAEVLGTSIDDESAIELAKRSRGTPRVANRLLKRVRDFQQVKEDELISIGTTKQSLALLQVDDEGLDYIDHKMMNCILEQYNGGPVGLDTIAVSIGEERVTIEDVYEPFLIQKGFIERTPRGRKATAYAYEHFSKDRKKE >CP017459|1343325:1352430|1345375_1346515_+|AWI44372.1|tRNA|DBSCAN-SWA MPAVTYEHIKTCKQSGARLGIVHTPHGSFETPMFMPVGTKATVKTMSPEELHQMEAKIILGNTYHLWLQPGNDIIKKSGGLHQFMNWNGPILTDSGGFQVFSLSNLRKITEEGVEFRHHTNGSKLFLSPEKSMQIQNDLGSDIMMAFDECPPMPAEYKYVKDSIERTSRWAARCLQAHQRPEDQALFGIIQGGEYKDLRQQSAEELVALDFPGYAIGGLSVGEPKPVMYDMVSHTQQFMPKDKPRYLMGVGSPDALIECSIRGMDMFDCVLPTRIARNGTCMTSHGRVTIKNAKYAEDLGPLDENCDCYTCKNYSRAYIRHLIKAEETFGIRLTTYHNLHFLLKLMENIRQAIRDDRLLDFKEEFFEQYGLNVENPKNF >CP017459|1343325:1352430|1346533_1346794_+|AWI44373.1|DBSCAN-SWA MQFTSLILPILLLVLMWFFLIRPQQKKAKEHREMISQISSGQHVTTIGGIKGTVRSVDETTVVLTLNGNGTEITLEKPAIKQVDPS >CP017459|1343325:1352430|1349619_1351896_+|AWI44374.1|DBSCAN-SWA MIKSKYNWDVKLPEVEITEDVSTDLKLTPIVKKILESKGITEETAIRELLNGTQIAHDPWTMSDMHKAVERINLAIDQNQKILVYGDYDADGVTSTTILVSTLKALGAHVGWYIPNRFSEGYGPNEMAFKNAYEEGISLIITVDNGIQGHDEIQMIQELGVDVIVTDHHEIGRTMPNAYAIVHPMHPGFDYPFKYLCGAGVAYKLAQCLLTEPPTHFLGLVAIGTIADLVSLTDENRSLVQRGLDVLNQHCPLSIKAILKQAGCNDEINEETVGFVIGPRLNAVGRLEDAALAVELLMTETEEEAEFLAEQVEFFNQERKDIVSQITEEALVMAEQQVQDGSKFLLLAQPDWHEGVLGIVASKIVETYSLPTLILNIDQAQNHAKGSARSIDQVSMFEILSAHSELISKFGGHHMAAGVTMPIENIQDLQHGLNGWMAQLAETTSLEPRKKVDVKILESDITIKNIKDIHRLRPFGTDFSSPCFELQDIIVQQAKGIGQDKNHLKLVLGDSQLQAIFWQNGYLVKELGVQQPINLIGTLQINEWNGFQSPQFMVADLASNNLQILDYRSKRKVSELNADAEDVAYLIHKKSEKLGENYYYYGEDIINKYDKYVFRDLPTSITELKTTLKTVDVSQIYLVLNHERSIYFEGMPKMETFKQCFKALASKKEINLAKEGMQLSQFLNIQPSMLKFILKVFLDLEFIKDENGIIMLNSVSTKRDIATSKYYQNRLDRIEVEKLLLYEDFNRLKQWFKAELVE >CP017459|1343325:1352430|1347160_1349389_+|AWI45768.1|DBSCAN-SWA MLGGIGLTYKNVVKNVSLGLDLQGGFEVLYQVDPLQEGDKIDDKAVKATAKTLENRVNVLGVSEPKIQVEDKNRIRVQLAGVKNQSQAREILSSQANLTIRDANDNVKLTGKDIQQGSAKQEFKQNTNEPAVTFKLKDSDKFKKVTEEISKKDENVMVVWLDHEKGDTYHKEMNKEDPKYVSAASVDKPINSDSVEISGGFKGEEGIEEAKQIADLLNSGSLPVDLNEIYSNSVGAQFGQDALDKTILAAAIGIAVIYLFMLGFYRLPGLVAVIALTVYIYLTLVAFNFISGVLTLPGLAALVLGVGMAVDANIIMYERIKDELKIGRTLKQAYKKANKSSFLTIVDAQLTTVIAAAVLFFFGESSVKGFATMLLLGILMIFVTAVFLSRWLLSLLVSSNYFKKSTWLFGVSKKNIADINEGKEVHDLKTPYERWDFMKLAKPLLSLSIIILIIGAVILFVFKLNLGIDFTSGTRVDFESNDKVSEAKVTQTLEDENFKPTQVSLGENGKNVTVQFKNDLSKDEVSKIKNTIDDSFGNDPTVNTVSPVIGQELAKNAMMALLYAAIGIIIYITFRFEWRMGLSSVLALLHDAFMIIAVFSLFRLEIDITFIAAVLTIIGYSINDTIVTFDRVRENLHKIKVITKPSQIDDIVNRSIRQTMTRSINTVLTVIIVVVALLAFGAPSIFNFSLALLIGLISGVFSSVFIAVPLWGIMKKRQLKKSDDHKLIVYKEKKSNDEKILV |
7 | uncultured_Mediterranean_phage(50.0%) | tRNA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_5 |
1835786 : 1870197
Sequences of DBSCAN-SWA_5
Nucleotide sequences of DBSCAN-SWA_5 >CP017459|1835786:1870197|DBSCAN-SWA ATTATTTAACATCCCCCTCGTATTTCACTTGATTACCATTGAGATCTCTTACTCCATAGAAATTACTATGAGGTTTATCTTTAGGGTTTAAGATAGTGATTGTTGAACCGCCAGCATCTATATTCCATACACGAACATCTATACAGTCATCGGAAATACGCACTGCATCCAGATATTTCTCATTAGCATTTCTTACCATGTTATCTGTGACAATACTATTTTTGCATTCAACCAAGTATATCCCAGCTATAATCCAAGATTGGCTGGCGTTCAAACCATATGAGAATACAGAGTTATTTGTTACCTTAATGTACATCGCTCCTAAAGAAACTCTTATCCCGTCTTGACCTGAATTATAAACTTGGTTATTAGAAACAATGGCGTGTGTTTGGGCACTTCCTGTTTCTAACTGTTTATTATTCGAAATAAAAACACCTATCGTGTCTGTGTTACTAACATTGTTATTAGAAACCATCAAATGCCATGTACCGTAACATTGAATACCCATACTACATTGTTCTACTGTATTACCATGTATTTTCACACGTCTTGCCTCTGGAACATAAATCCCAACTTGTTTAGTGTTCCGTATTGTATTGTTCGCAATATCTACTGTTTCGAACGATTCGTTTTTATATGGTATTTTTTTATTAGGATATGCAGATATGTGAATGCCTAGCTTTTCAATATTCGTAATTGTATTGCCAATAATTTTTAAATTCTCACCAGACTGTGCAGCGCCCATTTGAACACCTTCTGCATTGATTGAAGATGTGTAGCCACCTGGTGTAGGTGTTGCAAAAATACCGCCCGAACAATCTTGAATGATGTTGTTACTCACTAAAGTATTTTTAAATTTATAAACTCTCAAACCAAAATTCGTTGTTTTTTCTATAAAATTATTTTGAATAACCACATTCGAAACCCATTGGTCATAGACAGAAAAATGGTCACCAACTGCAGTAGCATAACTTGGATAGTTTCTTGAAGGACCGAAATAACAATTTTGAACTATTACGTTTTTAGATGGTGTACTATCATATGATGATCCTGGTAAATTACCAATACCAATTTCAGCTGCTAAAGATATTTGAATAGCTTCTTTTTCATTGTCGCCTGGATTCTTTTGTCCTTTAAATAAACAATGGTCTATCAAAACATCTTTACAACCATTGAGATCAATAGCATGTGTTGTGTGAACATCAAGAAATAAACATTCTTGGAATGTTACGTCTTCTGCATGGCCTAATACAATGCCGTCCATGCCTTTATCTAGTTCGCTGTTGCCGTCAAATGTTAAACCATAAAATTTAATGTTTCCGTTACCTTCATATTTGATTGGTGTTTCGCCATCAGCTAAATTGGTAAACCAACCATTACCATCGATACGTTTTAAGGTCGCCCCGTGACCATATAATGTTGTATTAGGTGGTATAACTAAATAATCATCTAAACAGTATTGCCCAGGAGGCAAAATTAATGGACCACCACCGCGCTTTTTATTCCAATCTAGCCAGTTTTGTAATCCTTCTCTTGAAGATTTGTTTTCATTAACATACACACCGTCAAAGTCGTATGCACTTCTAATTATTTTAGATTTTTCTAATTCATTACTTATTACTTCTTTACTTTCGACATGATCTAAATAATCTTCACGTAACCGTTCAGAGAGCAAGTCTTTTTTGACTCCTTTAAATGTAACTCTTGAATCACTAACTTCAGCAATACCATCACCGTTGTTTGCGATGATTATATTGTTATAAGCTCTTTTCATTCTATCTATTTCTGTTTTTACATTACTTCTCTCATAATCGATTTGAAAAGCATGGTGCGCATGTTTTTCTTCTTTTTTATGATATTCAAAATCTCGTTTAAAATATTTAAAATTATCTATTAAATACTTAAAGTTACGAATCATTTTAAATCTATAATCTTGTCCGATTTGAATAGGGAAATTTAAAAAATAATTACTCATTTAGTTCCCTCACTTTCTCTTTGGTTTACTTTTGCTTTAAGTGTTTCTATTTCTTTACCTTGTGATTTAACAAGTTCTTCAAGATCATTGATTTTAGTGTTTATTTCTACAATATTATTTGCATTATTTATTTTATCTATGTCTATAATGCACTCAGTGCTTGTCATTGGGAGGTAAATATCTCCATCAGAATCTTTTAAATATCTGTTGTTATATGTCTTACTCATCTAGTATCGTCACCCCAACAATGTCTGAATAATTTTCGGTAATAAAATAAGGCGATGCCCCTATGGACTCGCCTTTACCAATGTTACTTATTTTTTTAATATTTCTACTTAAGCGCTGTTGTATTTTAATAATGTCAGTTGGAGAGTTACTGAAATCGACTTCAACGGGTTGATTAACTAACGGATGTGATTCAGTTAATTTAACTACTTTTAAATCTAAGTCATAACCTAGAGGTCTGTGTATGAAATGAATCATATGGTTTTCATTTATATCATCATTCCTCAAGTAATGTTTTTCTTCAAAACTACCTAGATAGTTAGTTGAAACTTCAACGGTTGGTTCATCGTTTAATTCTGTTTTTAACTTTTCTTTTAACTCGTTTTCATCTAATGCATTATCATCAAACACTGTCGGTGCTTCTGAAAGACCAAAAATTTCATAGTTAGGTGATTTATATTCAGCGTATGCGTGATAAACATCTGTCCCTTTCAAAACTGCTGTTAAATTTAACACTGTTGATTTCTCTGTGCCCACATACATGCATGGTTTAGATTTCTTATAATCGACACCACTCTTTGCACCTCTAAATACTGCTTTGAATGTGTGATTACCTTTTGATAGGCGTTGAGCAATGATAATCTTTTCAGATGTTGCAGTTTTGCTATAGCATTCATATCTATCTATATGTTCATCATCTAAATAAACGTCTAACACGCCACCTTTAGCCATTTTCTTTAATGTCCATTCAAGTGTTTCGTTCCCCCACTTACAGTTAAATGTTTTCGTGTAACTAGCACCAACGCTTTCAGTACGCCAAGTACCGTCTTTGATGAATGTGCCAGAATAATTTAAGTCTTTAGGTTTCATAGGATTATAATTTTTGGTCTCAGCTTTAGTTTTCTTTTTACCGTAACCCTGTATATAGGTTTTGATTTCTGTAGTAGAAGTAGTTGCTTGCACTTCGCTAGAGTTGTATTTATATATTAATGGTAAGTCAGACATTTGATAGAAAGTTTCATCATCATAAATATGAATTTTCTTATTATCTGCAAAGTAAATATAATTGAATAACTCTGCGCCTTCTGTAAGAAATTCCAAACCATTTTTATTGCCTAATTCATCTATAGCAATTCGTTGGTTAAATGTTCCTTTAACTTCAAATGAGAAACCTAATTTATTTCCTTTAAAGCCAAAGTCTAAATATTGTTCTAACGTCATTGTAGGTTTATTTTCTTCAGTATCACTTTCATCGTTATTCATTTCCTCTTTTTCCAAATCTTTCTGGATATAATGATTTTGAAACTCCATAAATATATGTTTCGCAGTAACTTCATTTGTTACAACTGAACCATCATATTTAATAGATGTTGATTTTATAACATAATCTTGCCCTTTCCACTCTAACAACATTTCATTAATTAAAACATCGAATATATCCTCATTCTGTGTTGTTTTATATATGGTAAAACTAACAGATCGTTCATTATTTTTTTCATATTCATATTTGAAAGAGTCAAAATCAAAATCAGTTACAATCTCTCCAAAAGTACCTTTTTTATTTTTTAAAATTAAAGGTTCCACTAATTTCACCTACCTATATATAAATGGGAAAACCCATTTAGTAGTTACATTTTTTATACTCACACCAGTTATTTCTATATGATTAAATCCAGGCGCTAACGTCAACCAACCCCAATTTGTGTCTATCCCTATACGTTTTTGGTCTTTTATTGGATGGACACCACTTAAAGTTATCGTTTCACTGTATGTGATAGGTTTTTTGTATTCAAAAACATTGGTTTCTTTTCCATCTTTTAATACTTCATGAGTGGTGTGGTTGATAATTTTAAACCCTTTAGGAGCATCAATATTAACTAGTAATTTAAATTGATGTCTTAATAATGGGTTGATTGTATCTGATGAACCATTGTAAATTTTAAAAGCTGTTGTATCGTGTGTGTATTTAATTTCATCATCTGATAAAACACCTGCTTCAAATTGCCAATCACCACTTGATAAACTAAATTGACTTGTATCTCTTAATGATTCTGAATAACCATCTTTGACACTAAAAGTCATTTCAAAACGAGTTGTCGAAAAATCTGCATAGTCTGGATTCATGTCTGGATTATTAACTTTATACTTTATGCCTGGATTGTCAGACGTTACGATATAATAAGGTGTTCTTTTGTAAAATATACTTCTAAGTTTTTGTTCCATTAAATTAATATCTATTTCATCGATACCATCAAAACCAAACTTAACCACTAAATTAAAAGGAGCAAATGAAGCTACACCTGGTAGCTCACCATCTACTCCTTTCATAGTTATACTGTCTTCGACTGATACAGGGTAAGAGGCTTTAGCATCAAGAAAAATAAAGTTATTTATATACTCATTGATATCCTTTGTTCCATTTTCATCAATAATTTTTAACCATCTGCCGTCTATCATCATTAACCTCCTTGATTAAAGCTAGCCATTCTCATATCTTCTCCTAAAATTTGAGAAAGGATATTCGCTGCATCTTTAGGTGAACCTTGTTTTTGATTACTTAACAGTTTGATAATTGTCTGTGTAAGTTTATTATTTTGATCATTCACTCTTACCAGCTGACTTAGCATTTTCTCAATTGTTGAATTGTCATTGTTCACTGTGACATTTGCGGAACCATTATCCATGCCAATCGCTGTCATTGCTTTTTCCATCAAGCCAACCGCACGATTACGTTTAGATTTATGAAGTGGAATAATAGCTTCTGCTCTATTACGCTCACTAATTTCAGCAAGTTTATGTGTTGTAGAGATACCACCATTTTCGTATTTTCTTGGACCTGTTGGTGACCAACCGCCGTTAGGGTTGAATTGTGTCCGCCAATTCTTGTTGTTAAAGAAAGCGAGTAATTGATCATAGCCATTTTTAATATTGCCATGGCCTTTAACTTTATAATTGTAAAATGTGCTAGGCACATATTGAAGTAATCCTTGCGCAGGATTACCATTTCTAGAATTGACGTCATCAACGCCACTTTGAACAGCACCAGCGTTCCCACTAGATTCTGCATTGATTAACGAAATAATATTATTTAAATCGTTACCTTTTAATTTAACGTTCATTTGTTTAGCTGCTTTTTTAATATCGCCTGACCATTGTTTCGCTGATTTGTTTGTAGATTTTAAACTCTTCAGCCAGCCCATAGGATTAACAGCCGTCTCATTAGAAGGGTAACCTTTCATACGTTGAATGTGTAGGTGAGGTGTTGTTGAATTACCTGTACTACCTGATAAGCCAATGACATCACCGGCGCTCACTTTTTGCCCTTTTTTAGCAATAATTTTACTCATATGCATGTACCATTGATACCACTTACCGCCAGGCTCATCAAGTGTGATTTGATTACCACCGCCACCAGCAACTGCACCTGCTTGTGATATCTTACCGTCAGTTAAAGCTTTGATTTTAGTCCCTGTTGGCATACCGAAGTCAATACCATAGTGTTTACCACCATTGAACATTAAGCCACCTGTATAGTTACCAAATGTTTGTAAGATATTATCCCATGGCAACCAACTAGCATCGCCGTCGCCACCTTCAGCTTCTGTGAACCAGTCTTTCACCTTGTCTACTAGTGAAGATTTCATTTTGTTATAGGCAGCCGTAACCAAATTAACGGTAGCATTATCACCACCGCCAAAGTTAATACCTATACTATCCATGACTTTATTGACTAATTTACCAGGATGTTTAACATAAGCCCAAACATCGCCGATTTTATCGCCAAGCCATGATGCACCATCTTTAACTTTTTCTAAACCTTTACTTCCTAAGTCTTTAACAGAATCTTTGGCATCTCTACCTGCTTTTTTCACGCTATGGTAGCCATCAGATATTTTGTTACCCATATTTTTACCTGCTTTAGCTGTACCATCAAGCAAATCATCGTACCAATGTTTACTACCTTTAGAAAAGCGAGGAATTTGAACCCCTGTACCTGTTGATAAGCGTTTAGGTATCACACCTTGTTCTTGAAGTTTGTGTGTATGTTTAGCGTTAATAACGCCATCACCTTTACCTAAATCAACAATCGTGTTTTTACCTTGTGGCGCATCAATTGAGCCATCTTTACGTTGGATTAATTCTTGTGTGCGTCCGCCTGGGCCATTGCCTGGTCCTTTATCGTTAACCATCGCAACTGTTGGTTGTCTTAAACCACCATTTGAATCCGTAGAGAGAGCTGAACCGTCATAAGTACCTGTAGCTAAATGAGGTATTTCTTTAATAAGTTTATCTTTACCTGTAATGGCTTTTGATATCTTATTAACACCACCAATCATGCCGTTCAAACCGTCTACGGCTTTGTTGGCAACCGTTTTACCTAAATCACTAGCAGCACTACCCATGTCTTTACCAATATCTTTAATCCATTGAAGCGTTTCATCTAGCCATTTTTTGAACCCACTATAAACAGATTTTGCTTTTTTCCAACCTTCACCAGCAATATTGCCAAAGCTTGACTTCGCTTTGTTCCACATATTACTTACGTTAGATTTAACAGAACCATAAGCTTTACCAAAATACTTACTTGTGCCTTTCCACAAGGACTTAGATTTATCCCAAGCTATGCTTGCCGTATCACCGAATTTACCTTTCGCTTGGTTATAAACGCCCGTGACTTTGGTTTTGGCTTTCTCATACGTTTCGCCGAACCATTTTTTGGTGCCGTTATAAGCTGATTTGGATTTATCCCATACTTTGCCAGCGGCGTTCGTGAAATTATCACGTGTTTTATTATATACACCTGTTACTTTATCTTTCGCTGAATTGTAAGTATCTCCAAACCATTTAGATGTATTTTTCCAAATACCTTTTGTTTTATCGGTCGCAGTACCTTTAGCTTCTTCGAGTTTGTCACGGGTTGATGTCTTCACATTTTCCCAGGTATCAGATACATCTTTCGTCACTTTGCCCCAAATATTACCTGCTGTATCCCAAGCTGAATTCCAACCATTTTTGAATGATTGTTGAATATTTTGACCTTTTTCACTAAACCAACCCTTGGTATTTTCCCAACTTTCACCGAGTTTGTTAGTAATCGATGACCATAGATTACCGCCAGTTTCAAGCGCATTATTCCATCCTGATTTAATATTCGACCAAATATGACCGCCTTTTTGAGAGAACCACGTTTTAGTTTCCTCCCACTTTTCACCGAGCCAACTTGTCAATGAAGACCAGAGATTGCCTCCAATTTCAAGCGCGTCATTCCAACCTGTTTTAATATTAGACCAGATATGATGACCTTTTTGAGAAAACCATTCTTTCGTATCTTCCCATTTTTCGCCAAGCCAACCTGTTAAATAAGACCAGAGATTACCGCCCGTCTCTAAAGCATTGTTCCAGCCAGTTTTAATGCCAGACCAGATGTGGCCGCCTTTTTCTGAGAACCATTCTTTCGTACTTTCCCACTTCTCAGATAACCAACCTGTTAAGGATTGCCACAAATCACCGCCGGTTTCAATCGCTGTATTCCAACCATTTTTCAAACTTGACCAGATATTGCTGCCTTTTTCAACAAACCAACCAGAAACATTTTCATAAGTCTCACCTAACCAGCCAGTTAAAGAGTTCCAAAGATCTCCGCCAGCTTCTATAGCAATATTCCAACCTTCTTTAAGGGCATCCCAGAATTCTTGACCTTGTTCAGAGAACCAACCAGTGATAGTATCAAAACCACTCTTAATATCTTCGCCAGCTTCAGAAATATTTTCTTTCCAAGAAGAAACGGCATCGCCAATATCTTCACCTATCGCTTTAAATGGGGAAGCAATCCATTCACCGATGTTCTCAAACCAACCATTAACAAGCTCTTTCCAATCCGTTTCTGTAAAGAAATCTTCAACTTTGCCCCAACCTTTTTTGAAAGCTCCAATAATTTCATCGGTTTGATCGCCTATCCAAGTGCCAATTCCAGAAGCTTGTGAACCTACATCTTGCCAAAAACTATTCCAATCATCTTTTATAAAATTTTTCGTTTTTTTATACCATTTTTCAGAATTAGAATAAACATGACCACTAGATAAATCTATGTCATCCGCTATATCTTTATTGTTCTTTTTAACTGATTTACGTATGTCACCAGTTTTGCCTTCAGCAGTATCTATCGCTTCATCATAAGCATCTTCGATTTCTCTAACTCGCTTATCGTGTTCTTTTTGATCAATTTCGCCGTAAGCAAGTAAATCATCAGCTTGAACAACATCATCTTCACGTTGTTTTTTAGCTTCTTTTTTAGCTTTTTTCTCTGCTTTGACTGCATCTTTAATAGCCTCACTTGCTTGTTGTGTATCAATAGCACCTGTGTTAGCGTTCATTCTTGATAAAATAGCTTGTTGCTCTTTTTGTCCTTTCGCAATACTTTCGGTTGTGATACGATTACGTTCATCCAATTTAGCTTTTAGGTCTTTTTCTTCTTGAGCTGTAAGTTTCCCGTCGTTAAATTGTTTTAGTTCTAATTCTTCGATTTCTTGGTTTAGCTCTTCAAGTCGTTTAATTTTTTCATCAGATGCCTCTTGATTTTTTTGAATCATATCTTGTTTTTCTTGGGCAGTAAACGCTTCACTGTTTTCAAGCATATCATTCAATTCATCGGATACTTTTTTATTACGTTTTTGAATTTGCTTTAAGGCTTCTTCTCCACCTTTTCGAACTGAAGTTTCAAGTTTTTCACGCATATCATCTGTGATTTTGCCATGATTTAGTTTGATATCTGATAAAACACGCGTTGTATCTTCTGAATACTTAACATATTTATCTAAAGCATTTTTAGTTTCTTTAGAAACGTCTTTACCTAAAACTTTAGTTGTATCGGTTGCTTTATCTGAGGCTGTACCAACTTTATCCATGAATTTTTTAAAGCCATCGCCAGCTTTTTTTAATAAATCGTCATCGTCTAAGTCTTTATAGCCTTGTTTCATTTCATCAAAGAAAGTTTCTTTGATTTTACTTCCTGTTTTCGAGAACCAACCACCTAAGTTTTTAAGTTGATCAATAGCGCCGCCACCAAACGTTTTGATGACATCAAATAAACCATCAACACCCTTTTTAAACCAGTCAACATTATTGTATGCTTTAATAAAGGCGCCACCTAATAACGTAACACCTGTAATAATCCAGCCAATTGGACCGCCCAAAATTTTAATACCATTACCTAAAACTTTACTCGCTTGACCTAATAAACTAACTTTTCCAGCTGCTTTACCTGTTGATTTACCGAAACGTCCAAATAAACCTGCAGAACCTTTAGCACTCTTACCTGACGCAGTAATTGCGCCTGCATTCGCTTTAGTTGCTCCTGCATTAATTGCAGCTTCTGCAGAGTTTTCAGCCATACGTCGATTAAGTTGTGCGTAACCACCAGCTGCTGCTTGAACCGCTCTTAATAATAGGCCTACACCTAAAGTTACGGGACCAATCGCGGCAGCTACGCCTGCAATAGCTACACCTGCTACTTTTGCACCTTTAGGTAAATCATTTAAGAAATCAACCGTTGATTTCAAACCGCCAACCATACCCGATAAAGCAGGTTGAATAGTTTCAAAAACAGATAACCCAAGCTCTTCGGCAGCAGATTTTAATTCTCTTAAACTACCACCTAAGCCTTTTTCCATTGTGTCGCCCATTTTCTTAGCCGAGCCTTCACTGTTATCAATAGATTTAGATAGTTTGTCATAGTCTTCTTGAGAAGCATTAATAACAGCCAATGCACCACTCATTGCTTCTTTACCAAATATTGTACTTGCAGTTGCAGCTTGTTGGTCCTTAGATAAACCACCCATTTTATCTCTCAATTGATCCATAACGTCACGCATTGGCAACATTTCACCTTTGCTATCTGTTATAGATATACCGAGTTCATCCATCTTGTCTTTCATGCCTGCCGTTGGTTTTGATAGGTTTGTAAACATCGTACGCAATGCTGTACCAGCTTTTTGCCCTTTGATACCCGCATTACTCATCAACCCAATAGCTGTTGAAGTATCTTCGATACTATAACCTAATGCGCCAGCTACAGGGGCAGCGTATTTAAAGCCTTCACCCATCATTTGAACATTAGTATTCGCATTTGCACTAGCTGACGCTAAGACATCCGCAAAACGGCCACTATCTTTAGCTTCAAGCCCAAATGCTGTTAATCCATCAGTAACAATATCAGAAACAGTCCCTAATTCTTCACCTGATGCAGCAGCTAAATCCATAATCCCAGGCAAACCACTCATCATATCTTGCGATTTCCAACCAGCCATAGCCATGTAGTTCATAGCTTCAGCACTATCACTCGCACTGAATTTAGTAGTCGCACCCATTTCACGGGCTTTCGCTTTCAACGCGTCTAAATCTTTACCTGTAGCGCCAGAGATGGCTTGTACCTTACGCATGCCATCGTCAAATTCAACGCCAAGTTTACCTGCGTATCCCATAGCGCCAGCAATCGGTGTTGTCACATACATAGACATATTACGTCCTACTGAACGCATATTTTGAGACATCTTGCCATACTTCTCTGACATTTTGTCTAAATGGTCTGCTTGTTTTGTATATGAGCTATTAGCAATCATTTGTTGTTTGTTCATTTGCTTTAGCTCTTGTTCAGCTTTATCAATACTTTTTTGCAAACCATTCATTGAAGCTTTTTCATTATTAACAGCTTTTTCGGCTTTCGCTAAGTCTTTTGGATAATCTTTGATTGTTTTAGAAAGTTTGTCATATTCTTTTTCTGCAGTTTTAACTGCGTCATTTGATTGTTGGTAAGAAGCTTTAACCTTTTTATTTTCTTCTGTAATGCTTTTATTAGATTGGGTTAACTTCTTAACATTTGCAGTTTCTTCTTTGTGGCTAGCAATTAATTTTTGATGGACTTCACGTTGTTGTTTGGTCGCATTAGAAGCTTGTTTAATTTGTTCAGTAGAGGCTTTGCCTGATTCTTTTAAACGTCTTTCTGCAGAACGTAAGTCATCGAGTTTTGTTTTAGCTTTGGCCTTTTCAGCACTTAATACAGATTGTTTCATTTTAGCGTTATCTAATTCCTTATTAGATTTTTTCATCTCTTGATTAGATTTACGCATCGCATTATCTTGTTTCTTGTGTGCTTCGGCAAGTTCTTTAACTTTTTGTTCTTGTTGTTTAATACTGTTTGAAGCTTTCTCATAAGAACTCTTAACGTTATTTAAATCTGTTTTGGCTTGATCGTACATTTTCTTTTGGACTTTCATTTTATTATTAAGTCCATCAAGCCGTGTTTGATACTTTTGTACAGACTTCTCAGCTTTGCCAAAACTAGACATATTCGCTTTCACTTCTGAACTTAATACACCCATCTGGCGTTTAAGACCTTTCATGCCTTGTTCTATGCCTGTGTTATCCATAGTATTCTTTATCGCGTAACCTTGAATATTATCCAAATATGTATACCTCCCTTCTTACCTATCCATTCAATAGTTTAATTATGCCTTTACCTTTGATAACTTCTTGGTCTTTTTTAGACTTATCTTGTTTTTTATCTTCGTTATCATTGCCACTTAGAAAAGCAAATAATTCTAAGTAAGGCTGTTCTTTAGCTTCTGTTAAAGTCCAACCAAAGTTTTTCATACAAAATTCATACGCATTTCTAAATCTTGATAAAATTTCTTTTATTGAGCTTGTTCTTCTGTCTTTCCCTCTTCGCTTGTTTCATCTTCTGAATCTGTTTCATCTTCACCGCTGATTTCTCGAAATATTTCACCTAATACATAAGAATATGTTTTTGTACCCATGTTGTTTAAAACGTCTTCTTCTGTTAACCCTTGTTTTTCAAACAAACTAACTAAGTAATCACGTTCCATTTTTCTAACTTTTTTCATATCTGGTTTCTCTTTTTTTACTTCTTTTTCACGGCTTTCCATCCATTCATAAAAACGTTCTGCCTCTCCCATTGTGATAACTTCTTTCGAATAACTTTCTACTTTGCCCGTTTCTTGGTTTTTAATTTCAAATTTAATCATATTATTGACTCCTTTAAGTGAATTATTTTTGTATACAAAAATAGGCGACCGAAGTCGCCTGATTTATTTATTCTGCTGATACATCTGCATCATTTTTGTTCGCTTCTACTTCTACATTTTGTGGTGTTTATGGGTTTTGTTCTTGTTCTTCAACAATCACTTTACAAGTAGCTTTTTTATTACCGTCGTTCGTTGTTGCTTCGATATCAGCTGTGCCTGCAGCAACCGCAGTTACTTTACCGTTTTCGTCTACAGTTGCAACTGCTTTGTTTGATGATGCATAAGTTACACCTTTATTAGTCGCAGTCGATGGCGCAACCGTTGGTTGAATATTTTCTGTATCTCCGACGTTTAGCGTTAAACTTTCTTTATCAAGGGAAACGCCTGTTACTTTAATTGGATTTGTTTTAAATCCTGGTACATCTGTTTTGTCAGATTCGCCGTTATCATTACTAAAAGTAGCTTGATACGTGCCTACTTCATATTCTATGTCTGCGTCCAGACCTTCAATCGTAACGTTAGCCTTGCTATCTTCACCACGTTCAGCACTTGCGACTACTTCATCATTTTTATAAATCTTTAAAATGTCTGCCATTTAAAAGCCTCCTAGTAATTTAATTTAAAAAACCCCTATTCTGCAGAAATAACAGCCGATTTACTTTTAGCTATTATCGCTACATTTTGGGGTGCCTTAGGGTGTTTCTACTTCTTCGTTATCATTTGAATTGTCATTGTCTGGCATTTCGCCTTCTCCAACATTTTCGTAACCAGGGAATACACTTTGGAATAATTCATCTGACCCTTCTTTACCAACATGATAACCATAAGTACGTGATTCACCATTAATAGTACGTGCAATCCAATCACCTGTAAGTTGTTGTGGTTCTGGTTCTTCTGCTTCTTTTGGCGTTGTCTTCCATTCAATAGATTCAAGACTCATTGTCCCTTTAGTTAACGCAAGATACACAGGTTCGCCTGATAATAAATCTTCTGATTCACCAATTAACGCAACATAAGGCGCACGTGTTTTTTCGCCAACCCATGAAGTACCGTTTTCATCTGAATCACGACCTAAAACGGCATCTAAATCTTTATCTGGCACATTAAATACATCCAGTTCTGATTGTACTTCTCCTGTCCCTTGTTTCTTAGATCATACCGTCTTATTTGAAGCACGCATTTCTACTTTTTCAGGTGCTAATCCTGAAATGTTAAGATTGACCGTACCACCTTTTACGTCTTTCCATGTCATTAACTGTTTAATTTTTTCCTTTTCATCAAAAATACCTACGTGTACTTTTTCAAATCCTACTACTGCCATAATTTTTTCCTCCTTGAATTAAAAAGAACGCATCTATTCGACACGTTCACCTTTGTAATATTTGTTTTTAGGTATCCCACGATATCTACGTGACATCACATACCTTTGTGTTGCTTTAAAATAGTCATCTAATTGTGATGATGCTTGATTTAAATTTACGTTTGATAGTAAATAGCGAATCCGTTTGGTTATATCTATCGTTTGTTGATGATTATAAGCTTCAACATCAACTTGAAAAAAATAAGTTTCTGATAGATATTTATCAGAAACATATGTGCTTGGCCGATCTAATATCGGGGTTAAAACAACAAATGCATCGCTTGTATCATCCACTTCTGTTACTTCGTAATAATAAATGCGATTGTTTACTTCTGATGCAAGTATAGGGTCGTTAATAATGATATTCTTAATATATTTGAGTATATTCATTTTTTGTTCAACTCTCTTCGGATGATGCCACGGTATTTGGTTTGTGATGCATCTAATGTTTTGGCAATGACACCGTAACCTTGAGGTGTATACTTTTTACCATTACGTGTATAGCCATGTTCATTAAGATGAATGATATTCTTTCTTTCCTTCGGTCCTTCCCAATGAATCATAATGCGCCGTTGACCACCAACGGTTTCAGGATTACCTCGTTTCATTTCTTGGATCGTGGCCCCCGTGTCTCTAAATTCTTCGAATTGATATTTTAATTCTTGTTTTAAAAAGTCAGATGCTTCTATTAAAGCTTTATCATTCTTTTCTTGCATCGCTTTTTGACCAAATTTGGCTTCCATCTTTTTCATTATTTCTTCTTCGCCTTCAACTTTCACATCATATAAACCATTCACTTTAGATTTACTCATTTTTCACCTAACACCACCGTTATAAATCCCCTTTCAGGTTTATCAAAACGTACATCGTATATATTGAATAAATTCTTTTCTAATCTGAAATCTTCAACTTCAACACTATGTTTATTATTAGGTGTATAAGATTGTAAAGGGTCTCTGATTGCAATTGTAAGGCCGTATTGAGTTTCATTTACATTTAGCACTTCTCTATCTTTCATTGAAGGGCTATAAGTCTCTGCCATACATGAATGTAATTCACTTTTTTCTAAATCATCTGGATAAGGTCCTTTTTTAATATATTCATAAAATGTCACAGGCGTTCTTAAATCGCCGTTACCTAATTCAGGAGGTTTAAAATTATTCTTCATAATCTTCCTCCTCCATGTTTTCTAAAGCAAAAGAAGTTATTTGAGATATAAAGTTCTCGTGAAAGTATTCAAGCAAATCATTATACGCATACCTTGTACGTTCATAAACAAGTTCAGTACCTCTTAATGATTCACCCATAACAAAACTTTGACAACGATAACTAATATCTTTGTATGATTGCTTTAGTAATGATTCTATATGTTTATTTTCAGCAGTATGAAATATTTTCAAACGTCTTTTCATTTCTTCTATATGTTCATCCGCAATCAATTAACCACCTCTTTCACTATTTATTACTGAACCCCTATTCAGCAGTAATAGAGATAGATTTTGCTCTAGTCTCTACTTCTACTTTTTGGGGACGATTAGGGCGTTTCGTTTTCTGAATCTTTATTAGGCTTACCATCCAATTTCAAGTCATATAATAAAGCTACTTTATTATCATCTGGTAAACCATGAGCATTTTGTTTAGCAATAAAGACATCTGCATCTTCTAGAGCTAACGTTTGGTCATAAGATTTATTGTTTACCTGGCCTGTCTGAACAGCATAATAACGATTACCTACTACAAATAATGCTTTATCTTCCTGGATAAATTCAGAAGTAGTAACATCAACGTTAAAAGGTAATGAAGTTACCCAAGCACCGTTTACTGTTTGCATTGTATTTTGTGCTTTAACGTAGAATTGGTCTGCAGGGTTAACTACTAAAGCTACACCAGAGGATACATCGACTTTCGCACCATTTTCCTTAGTAGAAAGTGTAGTTAACGCTCCAGCTAACTCATTTGCCGTTGTTTTAGCGTCTTCAAAAGTTAAAGTTCCAGTTGTTTCTTTGTCTTTTGCACCTGTAATTTTACCCTCATCATCAAGAATAAGGTCTTTAGTTAAACCGTATGGTTCGTTAGATGCAGCACCTTTACCTAAAACAATACCTTCTTCCAATTTCAACGCCATTGCTTCAGATAATTGTGTACGAACATAACGCTCAACCCATTGCGGTCCAAAGTCAAGCATATCTTTAGGTACAATTGCAAAAGCCGTTAATTTATTTTGAGAAAAGTTTAATTCTTTAAAGTTCGCTTGAATTTGCCCTTGAATTTTACCGAAAATTTCTCCCCAAATTGCTGCGCCGCTTGGATCACCTACAATCATACGTGTTTTAATACCAGCTAAACGGAAATTGATTTTTGATAATAACGGACGAGCCTTTTGCATATCTTCAAAAACACGCACAACGGTAGTCTCTGGTAAAATAATACCTTCTTTGTAAGTATCTAAATCTGCATCATCTTCAACTAAATTAGTGAAGAATCTATTTTCTTCAGCAGTTAAAACATTATTTCCACGGTTCATTCTAATTTGGTTATCACTAGTAGTATTATTCACTTCATCACGCGCTTGTTTTAATACTTCATCACGTAATCCGTCTGAAAATGCTGACATATAGTTGTTATATTTTTGTTCGACTACCTCTTGTTCTGCTTCATTGCGCACTGCTTCAAAATATTCTTCGCGCAAGTTTTTCACGTTTTTATCAACGTCATCTTTAAATTTAATTGTCATAATTATCCACTCCTATAAGTATTTTGCTTTCTTTTTGTTTTCTGTAGGTAACTTCTCTTTTAAAGAGGCAAATTCATTAGTCAAATTAACAATTGCATCTCTCATCTCATTGTTAAATTGCTGATTTGTAATGTTTTGCTTGTTATTACTATTTCCTTTAGATATATCAGACACATCTTTAGTACGATTGGCAAATCCTTTTTCAACTGCTTTTTGTGCCGTGAACCAAGTTTCTTCTTCCATAAGATTTACAATTTCATCACGCGATAAATTTGTTTTTTCTGCATAGACATCAACGATAGATTCATCAATAGTTTCTAATGCATTCAGTGTTTTTTTTACTTCTGATTTATTACCTATCGCTATAGTTGAAGCTTCATGAACCATAATTGAAGCGCCTTTACCCATAACAGTTTCATCAGCAGCCATTGCTATAATAGATGCTGCGCTTGCTGCTAAAGCAGTGATTTCAACAGTTATGTTAGATGGGTGGTTTTTCAAGTAGTTGTAAATCTCTATGCCTTCAAATGCATCTCCGCCTGGAGAATTAAGACGAATAGTAATATCTTTATCCACGTCATCTAATACTTCAGCTATATCAGCGCTATTTATTGTTTCATCAGCAAAAATTGAAGGTTTTGCAATTGGTCCTGAAAGAGTGAGTATGACACCACCGTCTTTTGCTTCATTTTTAAATTGATACTTAGCGCTTGCTTTCATCAATTCTTCCTTCGTTGTCATTTTTCTCACCCCCTTTCGATGTATTTTCTCCTTCTTTCTCATAGTTTTTCGTCAAAATAAAACGGTCTCCACCTTCTACAGGTTCGAGACCGAGCATTTCTCTAACTTCATTTTGTTTTGCTGCACTTGAAGATATTAACTTATCAACTTTTTCTGCATTCTTAATAGGGTCAACTTTGTTAATACCAGCAACTTCTATACGCTTTCCTTTTAAAAATTCATTTTCAGTAAATAATTTGCTATTTAATTCATCTTCTATTTTTGAAATAAGAGGATTTATACAAAAATCGATATATGCTTCCATAGCATTAGCTAAATCTGAAACATCTCCATGTATTAAATTAGGCGGAATCCCAATAATTTTAGCTACATCATCAATGAATAGTTTTTTAACTTTTTGAATATTCTCTGCTCCATTATCAGTTCCTTTTGAACCATCACTTTTAGTCAGGTCTTCATATTGAAATCCTGATACTTCTGGAACAATAGCCACATTATTATTTTTAAATTTATCATATATTTTATTAGCAAATTTTTGTAATCTACTCATTTGTTTTTCTGATATTTCGCCGCCGCCATTCTCTACTCTTAATAGCCCTCGAATTTGATTTTTTCTTAGTTGTGTATCCATCATACGACCAAATAATTCGCCGTAATCAGAAAACAGACTATTAACAAACTTTTGTAATTTATCATTATTATAATTCATATAAATAACTTCACTCATTTTAAAAGACCTTTTAAATTGATAATCTTTTATAACAACATCTTTAAACAAGTCTTCATATAATGCGTATTCTTCTCTATAAAAATCATCGGCTACCACTAAATCATCTGAATCGGTTTTAATAATTAAAACTTCATTGTCATATACCAGTTTATATATAACTTTATGCCAAAAATCAGTTGCACTTGAATCTGTATTCGGCTTAACGTTTAATTTATAATAAATTTTATTTTTTAATAACTTATTTTTATCTTTAACCCAAAATTCAGATTGGCTAAATGTTCTTGCGATGAAATTTATGCATGTTTCTAAAGCGATTCTTTTTAAATATGACCTACTGGCAGGGTCATCAGCTAAATCTAAATCCAAAGCATCTCTAAGCTCTATATTTCTTTTAAACGCATCTGCAAATATGCCCAATTAACCACCTCCTAACTAGAAATCAAGTTTATCTAATAAATCAAATGCTTTATCTAAATCAACTTCTTGTAATTCATCTAATTTATACAAAGCGTGCAGAAAAGCATGAAATCCATCAGTCTTACGACGGTGTTCATCTTTTTTAACAAATTCTTTATTTCCATCTTTTTTAACTTCAACAGCAACATTATTTGTATACCAACGCATTAATGGATTATCTCCAAATATTACTCGATGATTTGCAAATAACGTTTCTATTCGTGGTGCTAAAAGACTGTGAACACCTCTAGGGTTTCTTAATACTTCTATATCAAAACCTGCACCTTCAAAATATGGTCTTAACAAATCCATTCTAAAGTTATCTGCTACAACCATTTGAATGGCGTATTTTTCACGCATTTTTTTAAACCAATCAATAATATGAATCGGGTTAATAGAAGGTTCGTCTACAATAGTTAATAAACCTTGTCTTTCCCATTCTTTTATTGGCGGTTGAAGATTGGCTTGATCTAAATATTGCTTTCTAGCAAAAGAATGGCTAATCCAGATGACGTCGTCACCTTGTTTAAATAACAATCCAACAGCTGCAAAATCTTTAATACTACCAAAGTCTAAACCAGCAATAGCCGTTTTATTTTTTAATAAAGGAATTTCTTGATTAGTAGCATATATATCTTCATAGCTTGCTACCACTTTCGCTAAATCAACTTCTGGATAATTCATTCTCTTAGTCATGAAATTTTCACGACCACTTGGACTATGTTCTAAATCATGATATTGATTTAGAACTTTACGATATAACCGTTTACCATAGTCACTTATTGGTTCTTCAAACATAGGATTTGCTTTGCTCCATGCTTCTGGTGTCGACATTTCTTCTTCATCATCTATACGACAAATGAAAGGGAACAGTCTATCATTAGGAGATTGACCTTTTAGAATAGCCATAGAACGATCTTTTAACTTATCTAAAAAGCCTTCTCTAACAAAACCATCAGTACCAATAAAAAATTCCCTAGGGTGTTTGACCTTACCAAGACCACTAGAGAATACATCTACAATATCGTTATTTTCATATCTATGAACTTCGTCATATATTATAAAACCTTCACGCCCACCGTCTTTACTACCTGCGTTACTTGTAGCATATTCAAACTTACTATCTGTAACTTCTGAGGTAATACGTTGCTTAGTTAAATCGAAGAAACCTTCGCCTTCGACATCATTTATTCTTCCGGTATATAAATTATGCTTAGTTATTTGCCTATGCATCTCCTCAAATGATGTTTTAGCTTGTTTTTCAGTGTTAGCAACAACTGTACCATCGTAATTATCTATGCCATGTAATTCGCTTATAAGATAATTAGACAATCCACTTATCAAACCATTTTTACCAGCACCACGAGCAACTAACCAGAAAAATTGTTCGAAATAAAGTTCATCTTCCTCATCAAATAAAAATACAAATGCAATTAGAAATTTTTGGAAAGGTTGTAACTTAAAATAAAACTTCTCAATAAATTTAATACAACGTTCTATTTGCTCTTCATCAAAATATAAATCTTCACGATAAAGTATGTTTAATTCCAAATGTTCGACCAACCATTGTCGCTCTTTGTTAAATGTTATCTCACCATTTTTATATTTATCTATATAGCGTGTTACATATTTATTTACAGAGGTCATAACAGGCTTTTCCTTTCTTCTTTAGTTTCTTCTTTTACATCTTCTGGTAATAATTTAGTTAGTTGCATAACTACTTTTTGATAAGAACCATCTCTTTGATTAAAATGTTTAGCTACTGGTCTCTCTCGTTCATATGGAGGTGTGTTTTCTGATTGAGTAAATAATTCATAATCGCCATTAGTTTGTATGTCTAGCCAAGCATCATCTAACAACACTCTTAGCCTAGCAGCTTGAATAATAAGCCCCTGTGCTACTTTCATTCTATCTTGGGGTATATCTTTAAATATCTTGTTTAATCGCTCTGTTTCAGCCTTAACGCGTTCTTCTTGGTGTTCTATATGCTTTTCATCATTCTCCAAATTAATCACCTCTTTCTCTTTCATATAGGGGTGGGGGTTATGTGTGAAATAAACACTTCAAATGTGGAATATAGACTACCTATCACCGGTTCCCTTATCTCTTTTCAAACGAAAAATTTTTGGGCGGGGGATTTATAATTAAATAATTATTTTGTCTAATTTAATTTTTGATTCACCAGAATTCGTCATCCCATTTTTTCTTTTTTGGTTGATACCAATTTTTAAAATTTCTTCCATGAATTTCGTTGTGGCATTCAACACAAAGCGTTTCTAAATTATCATCTTCAAGTGCTAACTTAGGATAATGTTCTAATTCTTTTTTATGATGAACAACAAGTTTTATTTTCTTTCTATCGTTCTTGTTCTTTTCATAGTAATCTATATTCACTTTGCCTTGAGCCTTACACCTTTGACATTCATAATTGTCTCTTCGTTTTATTTCTTCTCTTTTATTTCTCCATGACTTATTGTTATAAAATATTCTTCTTTCTTCTTTAGTTAATGTCATAGATGCATCACCTTACACAAAAAGAAACACACCACTCAATGTGATGTGTCTCGATATAATATAGTATTGCTTATTTATAATAACCAATTTACTTTGTTTGAGGTTGTATTCTCATTTCCTAAATCAATTATATCAATTCAATAATTTAAAGAAAATTCGTTACGGGTTGTACTGATTGTACTGATTGTACTGATGATACTGATGCTATTGATTGTACTGATTGTACTGATTGTATTGGTCAGACGCTTGATGTTGGTATAGCACACGAATGATATCATCTATTCTACTATCTAAATTAGTTTGACCTATATCAAATATCTCCTGTATTTCTTTCTTTCTAACATTTTCTTTAAGTAACTGTAATATATTAAAGTTCTTATCATTATCAATATATTGTTCATAGCTATCAATAAAGTTAACCACCTCTACGTGCTTATAATACATACGTTCTATCTTACTATTACCAATAACTATGTTTGACACTTTGTCTCCTTGACTACCTTGTGCTTTAGGCATAACAGACTCTATACCGTATTGAGCTGTTGAATTACTATCGTATTCATAACCTTGTTTGAGTAATACGTTCTTTCTCCAATGGTATTCAAATATCATTGTTTTAATATCTTGTGTATGATACATCCAATTCCTCCAGTTACTTTCTATTCAGGTTATTGTGTACATCTCATTCATCTACATATTATTCATGAGTATGTATGTTATCAGTGTTATACTTTTTCATTTGTGATCTCTCGCGTAATGATTCACTTAATTTCTTAGGTTTTGTATACGGCTTACTGCTAAGTTCTCTCTTAATCTCTTGTTGTAGCAATACATTTTGTTTAGATAAATTAAATATCTTCTCGTTCTTTCTGTCGTTCAATACAATTAAACTAATAATTAACGCTATGATTACTATACTGAATACAAACGTTAAGATTACCCACATGTTATTTATTCTCCTTGTTTATTTCGTATTTCTCTGAACCTTTTTCTTCAATCACAACATCGCTGTTCATTACTTGAACACGTTTGCCATCAATGTTAACTACTAATGCGCCACCATCATTGTATTTAGTTCTTACATTGTCTCCCTTATATTGTTTCACTACATCACCTGTTTTACTATAAACAGTGACCGTTCTTTCTAATCCCTTTGTGTCACTCTCATGATCTTTCTTTGCATCATCTAACCAAGTGCAACCACCTAAGAATACTGTTAATAATAATGTTGCTGCTAATAATAATTTTTTCATCTTCTAGTCTCCTTAATATCTTTTCCATCCACCTATTTCATAACCCATTGGTGTGTTATTTACTATGTCATTTGCTTGCTTTCTTATAATCATTTCATATGCTACCTCTTTACTTAGTTCGTATAGTGCTATGATTAATAATGTTTTAAATATACGTTTCATTCACTCACTGTCCTTTCTATATATGCTACCTTTTAATGCCTTACTAATTGGATCGTTATTAAAACTAGATGGTACATAACTTAATAATCCTTTAGGTTTCTTCGCCATCTTCTCAGCCTCTTCCTTACTCTCTGCTTCAACCACAGTAAACGTTTCATTCTCTCGTGGCTTGATGACTTCTACGAAAGTGTGGTTGGTAGAGTCGGTTATGTGTCGGATTAGGTATTGCATTACACGACACCCTTTTGCATTTTTGCTATATTCAATAAAATCAAATAATTATATAATATTCGTTTGCTTTGTTGTTCTTCGTTAAAGCTATTTAAATCCATTAAATAGTTAATAGCATAACCTAGTCCATTCACTTCATCTTGAATTGTATTTTCTTCTTCTATATACACATCGATTAAGCTATTTAAATCTTTACTTGTTTGGTCATGACACATAAGAATCAACGTTCCTATTAATTTATTTAATACATTTTCATTAAATGGATTTACCAGTAATTTCTCCAAATTCTTTTTATAAAAGTTAATTTGCTTATCATAGCCTGTTGGTATATCTTGTCTTAACATCGTTACCATTACACTTTCCATCCACACTCACTCCTTGCCTAAGATTATTCGTACACGTTCAAGTATGTCTTTAATATTTCTTTTTAAATTTCAAAGTCACTACGTTTCTAAAATGTTCGTTCCTCGTATGTGTATCTGATAATTTAAAATTCGTAATTGTTTCAATAACCTCATAATTTACATGATTTAAATTAGAGATGTGAATATTGGTTTCATTTTTACCTTCAAACAATCTTTTTAATATTTTTATAGTAGGCTGTTCAAATTCATTCATTTACCTAGCACCTCTTTAACTTTTTGTAGTATGTCTTTAGTATCCTGTACTTCCGAATCCTTTATCTCCTCTTGCTGTTTCATTACTAAACTCCTTAACTGGTTCTAACTCTGGTGTCCATATAGGCACGATAACTAACTGTGCTAGTCGGTCGCCTTTGTGAATAATATAACTTCCATGTTTTTGTAAATCGCTATTATGATATTTACCATTGTTGTTTAAATCTATTACTTCATTTGTAGTATAAAAACTAGGCGAAAATATAACGAGTTCATTCTTAATATTAATCTTCATATGACCTTGAAACCCTGCATCAATCTTCCCTGTCTCAACTACAAGATGTGTCTTACTACTCACACCACTTCTACTTGTAAGTAATCCCACATAACCTTTAGGAATATTCACTGCTAGATCAGTAGCAACTAATGCTTTCTGTTGTGGTTCAAGTATTATTGTTTCTGCTGCATATATGTCGTAGCCTGCGTCTGTATCATGATGGCGTTCTGGCATTGTTGCGTTGTCGCTTAGTAGTTTTATTTGTAATGTGTTAGTCATTTTCATTCTCCTTGCCCTGTATATTTAACATCCACATATCTCATATCAATATCTAAGTAATGTTCACGAAACGTTTCTTCTGGCTCATGCGAACGTCTCATATCGTCATTTTGTGCAATGTTTACATCACAATGTATCAACGCATTATTTCTGTTCTTCTCATAGAAATTAATTAACTCTTGTACTGCGTTTAAGAAGTGAACGTTTTCTCCCCACTTCTCTATCACAATTTTATTTTTATCTTCTTTAATCATCTACTCGTCCTCCAAATCGCTTAGTAAGTTGCTAAATTCGTTTGTTCCGTCTATTTCATCCATTTTTCTTAGTATATTTCTATAAGTTTGATGTTTAACCTTAATATCAACAGTTGGTTCTTTTACCTTGTTTTGCATTACATATACTCTAATAAATTTTTCTTTCAACTCTTGCCATGCGTCTTTATATTCTCTATCTTTCATCGTCTGCACGCTCCAATTCCTTAATAAAGTTAACCAAGTGTATATAGTTATATGAATAAGGTGATGCAAACTTCATATCTCTTATGTGGTTGGTTAGGGTGGTGTATAGGTTATGATATTTATTAAATTCTTTAACAAAATATCTTTCTTGTTCTTCTGACTCCTCCCATAACTTATAATTTTTGATACTTTCATTTCTTAATTTCTCATTCTCCCGTTCCAACCTACTAATATTTACTTTCAACACTGCTATATCATCGATTAGTGTGTCGCGTTCTGATTTTATTTTGTTATATTTAAAAGTTAACCTTTCTTTTTGGCGTTCTAACCACGGTATATAATCTACTTCATAACTCACTCGCCATCACTCCTTTAGTAAATATTTTGTATAATCGTCAACTAACTCTATACTTCTATTTGCAAATCTTTTGTCAGAAGATAACCACGCTCTAAACTTCAGTGTCATCTACTCCACCAGCTTTCCATCACGCCAGATTAAAGTATGCGTACCATCATCATTCACAATGTGTAGTGTTTCTATTGGTTCTCTATGTGCTTCTGCTTTATTCAACATAAGTTTAATTGGATAGTTTTCATCAATTCTCACTCGTTGATAACCAATACCACCTTCTAAATAAGTCTTTTTAAAAGTTGTCATTAACTTAGACACCACTGTATCTTCCGTAATTTCTTCCTCAGCTTCGACTGTGAAAGTGTTGCTATATTTAATATAATCTGCGTTACTCATCATGAAATCCCTATTTGTAGCGATGTATATTCCTGCTTCTTGATTTTGATCTGTTGGAAACATTTTCCCTCTCACATCGTTATCCCACGCCCACTCAATCAACTGTGGTAAGTTCAGTTGTTTCTTAGTTTTAATTTTCATTTTCTCAACCCCTCCATCGCTTTCCTGTTATGTTCCTTATCTTCTGGCAACACTGCCATGACAATGCTGTGTGCATTTATGGATATCAAAAATCCTTTAACTCCATAATCTTTTAGTAGCTTTGCCATTTCGACAGTATTTCTGCCTTTAGTATCAAGTTTGTATTTAGTTTTGATAGTGTCAGAAAGTATCATAGCGACAACTCTGTTTCTATTTCTGCAATACTTACTTTTTCACCGTAATACCAATTTTCCTTTGCATGCTTTTTGTAGCTGTCTGATGAAATCTTAGTTATAGTTTCAGGACTTATACCTAATTTTTCTGCACACTCTATCCTAGAACCACCACATACAACTTCTTCTCCACGATATATAACATACTCGTATTTAGGTTTTGGCATAGAAATCACTCCTTTACGCTAGTTGTACATTTCCATACATATCGACTTTAACTTTTGCTATTGCGTTATTTCTCATTAACTCCTTAGTATATTTACCTCTGCCATGTTTCTGCTTTGTACCGTCATACAACCAAGGACGTTCTTCTCTATGCTTTTCGTCTCTCAATCTTTCTCTAGTCTTTCTTGCCTTACTTTGTAAGTAATTAATATTCTGCGCTTCTCGATAATCTTCTAATCTAACGCCTCTCGGTACAGAGTAAGCCTCTTGAACTGTCCAACCGTTTTTCAACCTTGTACGAATATATTTAATTCCTAAACCTAATGCTTCTGCTTTAGCTTCATGCTCTGGGTGAACAAAAAATGTATATCCTGCTACTGTTATTTTTTTCATTCTCAATACTCCTTTACTTGTACGTCTGACACGTCTCTAAACTTAATATCTTCAAAGCCTAATAGCTCTGGATTGTTTGCATACTTCTCATACGCTTTATCTGCTTCTACATCTTTTATATCTTCTAAGTCATAGTTGCCTGCTACTGGTACAACCACTTCCTGTTCAACCTCTACTCTAATTTGAAGTGTGATTGTTTCTTCATTCATGTCTTATCACCTTCTATAAATAACTCACTAGGCTTGATATTTAAAACCTCTGCTATCTTAGATATACTTCGCAAATTAACCATTTGCATATTTCCTTTTCGATATTCAGTTATAGAACTCCTAGATACTCCACTTAATAAATGTAATCTCGTAACACTTATATTGCGTTTAGCCATTGCTACTCTTAAATTAGTCGCAAATATATTGTTCAACGTTTCTTCTCCCACGTTAGATCACTCCAATACTCTAATTCCATAATCACTTTCGGAGTTTCTGCATACTTTTTAAAACTTCTTATCTCTACTATTTGATTATCGTCTTGCCAAACATGACCGTTTGCAGCATCCAATACAGTTTTAATTAGATTATCTATATCTGGTTTCGTTCTCTTATACTGCCCTACCATTGCCACGTGTTTCTTCTTACTCCACGACTTGAGCAGTGGAAAGTGAAACTCAATTGTTAATCTAATTGGCTTATCTATCATCATGTATGGCATCTGTTGTCTTAACATTTTCTTATGGTTTGTATATTTAGCAGGCATGTACGTTTGTACAAACTTCCCTGCGTTTCTAAATCTCGGTCTAGGTGATGCCATAGGAACATCTACCGTTAGTTCTATGCGTTTCATTTGTCCACTCCTACATGTAGTCAAATATGCTTGTTTGATCTGCACGTTCTAATCGGAATGTGCGCTTGATTGCTTCTAATCTCTCGTCACTTACAATGTATTCATCTATGTCGAAATGCTTATGCAATCCAAATACACGGTTTCTATTATTATCTAATGGGATAACGTCGATAGTTATATTGCTATTGTTCTGTTTCAATCTGTATTCTGTACTCAATCCCATTTAACTCACCTCGCGAATAGCGTTTGTTGTAGCGCGTTTTACTTTCTCTGCGAACAATAATTCATCTAACGTTATTTCGTCTCCGTGCGCCCCATCTATGAACTTCTGTGCGTACATATCACTTAAATTAGGTGTTCCTAAAAAGTCTTTTACATATTGAATTGTTTTTACCATGCGTCTCTCTCCCTGTAGTCATCACCAAGTACTCTCACTTGGCGTGAATTATGTTTCATTCTTGAATTAATACGTTGCCAATTCATGTTTTGATTTAGCTCTTTATCACTAAAGTTAGTAGTGAATATGTTATTTTTACCTACTCTGTTATCTACAATGCTGAATAGTTTGTTTAATGTATGTTCAGTGTTCTCTACACCTATATCATCTAGCACAAGTAAATCTATGCTACTTAGTAACTTAACGAGTTCATCTGTCGTTTCATCTGCGTTTTTATTGTAAGTAGCTTTGATACGATCCATTAACATTGGTATGTGCATAAATGCTACGGAATAACCTTGTGCCTTAATTGCTTTCGCTATAGCATAGGCTAGGTGCGATTTACCAGTACCGTATGAGCCTTGCATGATTAATGACTTAGGTTTATCTATAGAAAACGTTTTGACGTACTCTATGGCTGTTTGTTTAGCATCTGTTTGTGATTGGTTCTGTGGTTGATAGTTATTTACTGTGGCATCTTGTAATGAGTAATTAACATTAGATTGATTAAATATATTATTGATTGCTTTCTGCTTACGTTTCTTCTCTGCTTCTATCCCTGCTGCAATCATGCTACATTCACAACCGTCCCGGTATTCGTAACCACTACCAAACTTGTGCAAATCATACTTGTTACCGCACTTCTCACAATACAAACCTCTTTCTATCTCATTAGCTTCATATTGCTTAAGTGTTTCCGTAATTTTAGGGCTTAACATTTGTTTCATTTAATCACTCCTAATCCCAATAACTAGGGTCGTACTTCATACGTTCTAGTTGGTCTTGTCCTGTCGGTTGTGTTTCTTCTGTAAAGTCATTCATATAGCTTTCTTGACTTAAAAATGTTTTAGGGTACTTTTGATACTGTTTATTAGTTATAGTCTTTAGGTACTCTCTTGTGCCGTTCATGATAGTTTCATAACTATGTTTCTTGAGCGCTGACTTAAATAAGCTAAATGCTTTTTTCTTATCTAGCTTTTTATCATAAAGCTTCCACCAATTCTCAAAACGTTCACGCGTAACGTCAGTTGCGCTAGTATTAATTGTCCGACTGTTATTTGTAATACTGTTAATTGTAGAACTGTTAATTGTAGTACCTACGTTTTGTCCCGGTAGATTTCTTCCCGGTAAGTTTTGTACCGGTACGAAATGACCTGATACGGGGTTGTGTTCTATTGTATAAATGTTTTTACTAAAGCCATTGTTTGTTCGTTCTCTTTTTATTGATAAGTAACCATTATCTTCAAGTTGTTTTCTGTACTTCTGAAACCTTTTATCACTTATATTAAGCTCGTGACATATTAAACTTACTCCAGGAAAGGCTGTTTCATTTGCTCCAGCATATGCAGACAAGTAACTATACAACGCTTTAGCTTCTATACTTATACTTGTATCTTTCATTACTCGTTTGAATACTAAGCCGTAACCAGTAATGGAACTCTTGATACTATCGTTCATTGTTTCTCACCTCTTAACATGCTATTTAATTTGTCATCAACTGCTATCCAGCTATTCTGTAAGTGATATAAATCATCGAATGATTTAACACCTATATCATGCTGTTGATTATGATGCTTTCTACATAACGCAAGTACATGTTTACCATGATGATTCATTGTTTTACGGTTCATTCCACGTCCTACGGTTTCATAATGAGCTAAATCACTTCCAGGACTACCGCATATCACACAATTACGATTGACTGTTGCCCAGTACAACATTGCTTTTTCACCTTGCAATAGTTTGCTTGTTTCAACTCTCATAGGTATTTGATGGTGAAATATGAAGGCTATGATTAATTCGATTAATTCACTCGCTACCTTCTTAGTACAATTTCTTAAACTAATTCGTTCATATCCATTCATCATTGCTAACTCTGATTGGAATAGCTGCCTTGAAGCTTCTACTGGTTCGCCCCAATGCAGTTCTATATCTCTACACAATGCGAATATCTTTTTCCGTTGGTCATTAGAAAGTAATTTATTATCTGGTACAGTCACATCTGCGTTTACGGTATAACCGTTATCCATTAGCTCTGTATGACTAGTCTCTAATTCAACACCAGTGGCAACGACGGAATAAGTACCGTCGTTATCCTTTTGGTATCTTGTAATTCGTTGCATTTAATCACGTCCTAGAAAGGGAGATCATCCGAACTAATATCAATTGGACCGTTTGCATTAGCAAATGGATTATCTTCGTCATTTAATGAAGCTTTAGGTTGACTTTCTCCATTTTCCTCAGCTTTCATTTTTTCGTCTTTTGGAATTGGTTTATTAACTACACCATCGCCATTTTTATATGGTTTAATATATGAAAAATCACTGAAATATTTACCTTCATTTTCATTGAATTTCCATTTCAAAATTAGATGACAAGGCTTCTCTATTAATTCATTAGTATCAAAATCTAAACTAGGAAGATTTAAATTAACCCCTAAACGTGTTACTAATTCAATTAATTGTTTTTCTTGGAAATCGTATTTGTATGGCGGTACAAATTGATTATGTTTATATTGTTTACCTTCATCATTTCCAAATACGATTGTGAAGTATCTATTTTCTCTGTCGTTATATTCAATATTTTTAACTCTCACTGTAAATTCACCAGCCGGTAGCCCAGTTGAACCATTTAAAAATTTATCTTGGTTAGTTTCTTTGATATATTGCGTTTGTCCTGTGATTTTCATAATTGAATTGCTCCTTTTTGTTTAAAATATTTATTGATACAATTTATTTAGTTTGGTTTAGAAAGGGGTGAAACCTTTTGAATGTTTCTATGTTTTTTAAACTTCGAAAAGCATTAAAAAAAGATAAAATATTATTAACTAATGAATATAAACACTTAGATTTCATGGTTGAAAACGAATGGATAGTGGGAGAGATAATTGATTATAAAGAAATAGATGATCCTGTCGTCCCTATGTTATTGCCAGTTTATAGTGGTTATGTGTCCATCACTCCCAAAGGCAAAGAACAGTATTATTCAGTTAGAAATAAATGGGGCTGATAGTATTACTTCCAGTCTTATTAACTGGGATATTTACTCTTATAGCAACAATGCTATAACTACTGATAAAATGGTTATACATATAATAATCAAATTTAAATAATCTATTTGTATTTCATAATGTCTATACTTGTTTGTGTTATTTAATTCCTTGTATTGTTCTAATAATTTACTCAACTCATCATCAGCTCTAAAATTTGGTGAGTTGTTTCTTTTGTATAACTCTTTATAAATATATTCTTCTAATTGTTTTTTTATCGCTGTTTTCATATTTACCTCTCCTTTAATTTCCGTTTCTAATTGCTTCTACTACGTCGTTAATACTTGGGTTAACAAATCGTTTGTCGTTAATCGTTACATTTTGTGAGTGTCTAATTTTCGTTTCGAATAAACTTGAAGGTTCTGCATTTAATACATAGTCGTAATTTTTTTGACCGTCTACTTCTGTTTCTTCAATAGTCATTCTTGCTAATACATCTGATTGGCTAACAACTGCCTTTTTAATCTGTTCTTGAGCTTCTATGGTGATAGTTGGATTAATTGTTCCACCTTCATCATCTTTGTCTTTATTGATGCCCTCATGACCACTGATGGCTAAGTGAAATTGAAATTGTTCTTGTAATTTAGAAATGTAGCGATACATACTAACAATTCGTGTAGCAGTTTCCCCCCAATCGTTAAAAGTAGGCTTTCTATTTTTGCCATTCATAACATCGTCAATTGTTATATCTCTTAGTTTTTGTATGGTTTCAATCACAACTACATCAATTTCTTTACCGTTACTTCGTAATTGCTCTAATATTTGTGGCAACATTTTAATTACATATGAAAAGTGTTTGTAGTTTTTTATCGCTACAACTGCTCCATCTTCTGTAACTGTTGTCCCATCTTCATTAATATCAAGTACAAGAGCATTGTTATCTTTAGTTAAAAAAGTTGTTTTACCTGTTCCAAACTTCCCGTATATAGCAAATTTATAAAACTTATTGGCGTTCTGTTTACTAATATCTTTTACACCTAGTTGAGCCAAAACATCTTGTTCTTCAGTCATCTTGTACCTCCTTCAACTGATCTACACTGTATGTTTTATAATATTTTTTTGTCACTGTAGTTTCCGTTTCAATAAGATGTTCGTTCCATTGAATGTTTATTTCTTCTAATCCATTTAAACGCCTAGCATTTCTACGCTGAATGTTATAAGTTGCATCTTCTGGATGGTTAGGTTTATTTGTTAGGTATCTACGTTTTCCGTCTTGTTCTTTGATTAGATAGGCTACTTCTTTTGTTTCGTATTCTTCTGCCATTTGACGAAACCTCCTATATCGTTGTATATTTATGGAAGTAAATTATTTAAATTATCACTTCCATTTTGACTGTTAGCAACTTCCCTTGCTTTCAGTCTTTTTTATTGTGTTAAGGAACCAGTCCCAACACAGATATGATAAGAAACTTAGTAATACTGATAATGTAATACCTAGGAAAAACTCTTGTACTGTCAAAGCTATAATTAATGTGATGACTGGCATTGTTAGTATTGTTAAAAACATCCTCATGCTTATCTCTCCTTATAAATGTTTTTTATGTCTTGTTTTCAAAAATTCAATAAACTTCTCAATGTCGATTAAGCACATAGTTGCTGAATAACTAATGTATAAATCTTTAATCCCTTTATCGTCCTTTTTATAGTCATTTAAGATGTTGTAAGTTGTGGCTTGGCTAAAATCAAAAAGTTTATGAATATTTGTAGCTCTTGCATATAAAGGTTTAACGAATACTTCATTACCTGTTAAAGTATTTTCTGATGTTGGTGGCGTTATTATTTTTGGCATTGTCTATCTCTCCTTTTAAAATTTATTATTCGGTCATACAATAATGTTTGGTACAATGTTCACATCTCCATTGAAAGGAGGTGATACGCATGAGTAATCAAATCGATCCAGAAAAATTCGCTTCTGCTTTAATATCTTCTACCGATTGGAAAACTACTGACCCTACGTCTAATCTTGGCGACTACTTCATTAAAAAGGCGCTTGAAACCTATACTAGCGCTGTAAATAAAGCTGTTGAATATAACAAGGAAGTTCAAAAACAACTTGACCAAGAAAAAGAAGAAGCAGCAGAAAAAAACCTTGAGATGTTAAATGATATCGACTTCTAATTTTTTGTATTGTAATAAGCGTTGAGCATGCGAGCTAATACCTTGCATTCTTCTTCGCTTATTTTATTTTCTAAGAAGAATTTTTGAATCTGAATTAATCTTGCTGGTATTCTTATTGAATCCATATCAGAATTCATTAAAATATCGATATCTTTTTTATTATCATTCATTCCGTTTCCTCCTTCTCTTTTCAGCACCCACATACAACATTCAGTCGTGGCAATGACCGTGCATGTATTATGGTGTGGCTCATATCATCGCCTACTCTCGCTCTTAAATGCTCTATGTGAGCGCTGAAAATCGATTTAATTATTTAATTTAGAATTTATTTGCTATCTTACCGAGTTCTATATTTCGAATTGGCTAATATCTACACCGTATTTGATTGCCATGTTCTTAATTACTGAGATATAAATTTCAATTAATCTTGGTTCATCATTAATTACATCTAATTTAGATAATTTGTTAATTTGTGATTTAGTGGCGCCTTCAGATAACATTTTTGCTCTACGATTATTTAATCGCTGATCTAACTTGCAACGCCCTTTTTCTTCTAATAATTTGTATGCTTCTGTACGAATTGATTTATGTTTATCTCCTCCACCTAAGTGTTGAGCAATTGCACCCAAAATTTTGTTAGTGTCGTTTCTCCAATTCTTTGTTTCAATACCAACAATATTACGAATGCCTGTAACTTCCGTTTCAATACGTTTGTTGAATTGTTCTTGTTCTTTTTGCACGCTGAACATCATTTCAAGTGCTTGCATTGGTGTTTGAGGTACTTGATATTGTTGTTTAAGTTGTTCTTCCATCTCATTAAACATATTAATGTAAGCCATTTTGAAATCGTTATGACCTTGAATGTTGAACATGTATAAAGTGAAACCGTCTTTAGTTAAAAGGTATTCTTTCAAATTTCTACCTGTGCTATCTTTATATTCACTAGGGATAATTACTGAATCCACATTTGGGCTGAGTAATATTTTTTCTAAATCTCTCAGTACGTGTGTGTGTCTTCTGTTAATTTCTTCTGCTACAGTTCTACTTGAAACCACCGGTCCAAGTTCTGAATTTTTTTCTATGTTGATTGTTAATAAGTCTTGCATTTTAAAACCTCCTAATATTAATTGTGCATTTTTGGAACTTGTTGTTCAAAAAAATATTCTGGAAATAAAATATGGATTGGCACTTCCAAATCTTTCGAAAAGGTTAGCGCCTCATCTAAATCTATAGACATTTCTCCTCGTTCTCTTTTTCCATATTGCTGACCGGTAATTCCGATTAATTCCCCCATGTACTCTTGTGTTTTTTTAGCTCCTTTTCGGAAACTGTACAAATCTTTGTGCATTTTTGGAACACCTCCTGACTAATACTATACACATGCAGTTCCTAAATTGCAAGTAGCAAAAGCATATTTTTAATTTTTTTTCATTATTTGAATTTTTATTTGCATTTTTGGAACTTTTTATATACTATTGAAGTATAAAGTAATTAAAAACAGGAGGTATTAATGAATGAGTGCTTTTTCGAATAATCTTTCTTATTTAATGAACAAACATGATATAGATGATACTAAACTTGGTGAACTTGTTGATGTCAATAGAACTACAATTACTAGATGGAGAACAGGTATTAGAAGTCCAAAATTAGAAAAACTACCTGAAATAGCAAGTGTTTTTAATGTTACACCTATAGATTTGTTAAAAGACAATATGAGTAAAGTTTCGAATGAAAATATTATAACTCAAATAAATGAAGTCTCGAGTAAACTAGAAGAAAAAAGACAAAAACGCGTTTTAGCATATGCGGAACATCATTACTCAGTACAACAACAAGGTGAGAGTATTATTTACCTACAATCATATAAAGATTCTAAGACTGAGGAAGTAACTGTAAATGGTTACGTGTCGGCAGGTACCGGTGAAACTTTAGTAGATGATATAGAATTCACAGTGAACTACCCTGCTGGCGTTGTTCCACCTCATGATTTTGCTTTACAAGTTAATGGTGATTCTATGGAACCACTTTTTGAACACAAAGAAATTATATTTGTTGAAGAAAATACAAGTATTAATAGCGGGCAATTGGGTGTATTCGTTGTAGACGGAGAAGCATATGTTAAAAAGGTATTTATATATCAAGATCACATAAGGTTAGTTTCTTTAAACCCTAAATATGGAGATATGAATTTTTACGGGGATTCTGATGTAAGATTTGCAGGCAGAGTTATCCTCTAA
Protein sequences of DBSCAN-SWA_5 >CP017459|1835786:1870197|1862367_1862580_-|AWI44827.1|DBSCAN-SWA MGLSTEYRLKQNNSNITIDVIPLDNNRNRVFGLHKHFDIDEYIVSDERLEAIKRTFRLERADQTSIFDYM >CP017459|1835786:1870197|1861519_1861726_-|AWI44825.1|DBSCAN-SWA MNEETITLQIRVEVEQEVVVPVAGNYDLEDIKDVEADKAYEKYANNPELLGFEDIKFRDVSDVQVKEY >CP017459|1835786:1870197|1858205_1858571_-|AWI44815.1|DBSCAN-SWA MESVMVTMLRQDIPTGYDKQINFYKKNLEKLLVNPFNENVLNKLIGTLILMCHDQTSKDLNSLIDVYIEEENTIQDEVNGLGYAINYLMDLNSFNEEQQSKRILYNYLILLNIAKMQKGVV >CP017459|1835786:1870197|1859826_1860195_-|AWI44820.1|DBSCAN-SWA MSYEVDYIPWLERQKERLTFKYNKIKSERDTLIDDIAVLKVNISRLERENEKLRNESIKNYKLWEESEEQERYFVKEFNKYHNLYTTLTNHIRDMKFASPYSYNYIHLVNFIKELERADDER >CP017459|1835786:1870197|1866845_1867106_-|AWI44835.1|DBSCAN-SWA MAEEYETKEVAYLIKEQDGKRRYLTNKPNHPEDATYNIQRRNARRLNGLEEINIQWNEHLIETETTVTKKYYKTYSVDQLKEVQDD >CP017459|1835786:1870197|1848152_1848620_-|AWI44801.1|tail|DBSCAN-SWA MADILKIYKNDEVVASAERGEDSKANVTIEGLDADIEYEVGTYQATFSNDNGESDKTDVPGFKTNPIKVTGVSLDKESLTLNVGDTENIQPTVAPSTATNKGVTYASSNKAVATVDENGKVTAVAAGTADIEATTNDGNKKATCKVIVEEQEQNP >CP017459|1835786:1870197|1857507_1857813_-|AWI44813.1|DBSCAN-SWA MKKLLLAATLLLTVFLGGCTWLDDAKKDHESDTKGLERTVTVYSKTGDVVKQYKGDNVRTKYNDGGALVVNIDGKRVQVMNSDVVIEEKGSEKYEINKENK >CP017459|1835786:1870197|1865841_1866072_-|AWI44833.1|DBSCAN-SWA MKTAIKKQLEEYIYKELYKRNNSPNFRADDELSKLLEQYKELNNTNKYRHYEIQIDYLNLIIICITILSVVIALLL >CP017459|1835786:1870197|1860722_1860920_-|AWI44822.1|DBSCAN-SWA MILSDTIKTKYKLDTKGRNTVEMAKLLKDYGVKGFLISINAHSIVMAVLPEDKEHNRKAMEGLRK >CP017459|1835786:1870197|1869474_1870197_+|AWI44840.1|DBSCAN-SWA MSAFSNNLSYLMNKHDIDDTKLGELVDVNRTTITRWRTGIRSPKLEKLPEIASVFNVTPIDLLKDNMSKVSNENIITQINEVSSKLEEKRQKRVLAYAEHHYSVQQQGESIIYLQSYKDSKTEEVTVNGYVSAGTGETLVDDIEFTVNYPAGVVPPHDFALQVNGDSMEPLFEHKEIIFVEENTSINSGQLGVFVVDGEAYVKKVFIYQDHIRLVSLNPKYGDMNFYGDSDVRFAGRVIL >CP017459|1835786:1870197|1867720_1867960_+|AWI44837.1|DBSCAN-SWA MSNQIDPEKFASALISSTDWKTTDPTSNLGDYFIKKALETYTSAVNKAVEYNKEVQKQLDQEKEEAAEKNLEMLNDIDF >CP017459|1835786:1870197|1869083_1869308_-|AWI44839.1|DBSCAN-SWA MHKDLYSFRKGAKKTQEYMGELIGITGQQYGKRERGEMSIDLDEALTFSKDLEVPIHILFPEYFFEQQVPKMHN >CP017459|1835786:1870197|1850919_1852119_-|AWI44805.1|DBSCAN-SWA MTIKFKDDVDKNVKNLREEYFEAVRNEAEQEVVEQKYNNYMSAFSDGLRDEVLKQARDEVNNTTSDNQIRMNRGNNVLTAEENRFFTNLVEDDADLDTYKEGIILPETTVVRVFEDMQKARPLLSKINFRLAGIKTRMIVGDPSGAAIWGEIFGKIQGQIQANFKELNFSQNKLTAFAIVPKDMLDFGPQWVERYVRTQLSEAMALKLEEGIVLGKGAASNEPYGLTKDLILDDEGKITGAKDKETTGTLTFEDAKTTANELAGALTTLSTKENGAKVDVSSGVALVVNPADQFYVKAQNTMQTVNGAWVTSLPFNVDVTTSEFIQEDKALFVVGNRYYAVQTGQVNNKSYDQTLALEDADVFIAKQNAHGLPDDNKVALLYDLKLDGKPNKDSENETP >CP017459|1835786:1870197|1856224_1856560_-|AWI44810.1|DBSCAN-SWA MTLTKEERRIFYNNKSWRNKREEIKRRDNYECQRCKAQGKVNIDYYEKNKNDRKKIKLVVHHKKELEHYPKLALEDDNLETLCVECHNEIHGRNFKNWYQPKKKKWDDEFW >CP017459|1835786:1870197|1866085_1866853_-|AWI44834.1|DBSCAN-SWA MTEEQDVLAQLGVKDISKQNANKFYKFAIYGKFGTGKTTFLTKDNNALVLDINEDGTTVTEDGAVVAIKNYKHFSYVIKMLPQILEQLRSNGKEIDVVVIETIQKLRDITIDDVMNGKNRKPTFNDWGETATRIVSMYRYISKLQEQFQFHLAISGHEGINKDKDDEGGTINPTITIEAQEQIKKAVVSQSDVLARMTIEETEVDGQKNYDYVLNAEPSSLFETKIRHSQNVTINDKRFVNPSINDVVEAIRNGN >CP017459|1835786:1870197|1860916_1861126_-|AWI44823.1|DBSCAN-SWA MPKPKYEYVIYRGEEVVCGGSRIECAEKLGISPETITKISSDSYKKHAKENWYYGEKVSIAEIETELSL >CP017459|1835786:1870197|1850542_1850797_-|AWI45790.1|DBSCAN-SWA MKRRLKIFHTAENKHIESLLKQSYKDISYRCQSFVMGESLRGTELVYERTRYAYNDLLEYFHENFISQITSFALENMEEEDYEE >CP017459|1835786:1870197|1864927_1865482_-|AWI44831.1|DBSCAN-SWA MKITGQTQYIKETNQDKFLNGSTGLPAGEFTVRVKNIEYNDRENRYFTIVFGNDEGKQYKHNQFVPPYKYDFQEKQLIELVTRLGVNLNLPSLDFDTNELIEKPCHLILKWKFNENEGKYFSDFSYIKPYKNGDGVVNKPIPKDEKMKAEENGESQPKASLNDEDNPFANANGPIDISSDDLPF >CP017459|1835786:1870197|1840444_1847446_-|AWI44799.1|tail|DBSCAN-SWA MDNIQGYAIKNTMDNTGIEQGMKGLKRQMGVLSSEVKANMSSFGKAEKSVQKYQTRLDGLNNKMKVQKKMYDQAKTDLNNVKSSYEKASNSIKQQEQKVKELAEAHKKQDNAMRKSNQEMKKSNKELDNAKMKQSVLSAEKAKAKTKLDDLRSAERRLKESGKASTEQIKQASNATKQQREVHQKLIASHKEETANVKKLTQSNKSITEENKKVKASYQQSNDAVKTAEKEYDKLSKTIKDYPKDLAKAEKAVNNEKASMNGLQKSIDKAEQELKQMNKQQMIANSSYTKQADHLDKMSEKYGKMSQNMRSVGRNMSMYVTTPIAGAMGYAGKLGVEFDDGMRKVQAISGATGKDLDALKAKAREMGATTKFSASDSAEAMNYMAMAGWKSQDMMSGLPGIMDLAAASGEELGTVSDIVTDGLTAFGLEAKDSGRFADVLASASANANTNVQMMGEGFKYAAPVAGALGYSIEDTSTAIGLMSNAGIKGQKAGTALRTMFTNLSKPTAGMKDKMDELGISITDSKGEMLPMRDVMDQLRDKMGGLSKDQQAATASTIFGKEAMSGALAVINASQEDYDKLSKSIDNSEGSAKKMGDTMEKGLGGSLRELKSAAEELGLSVFETIQPALSGMVGGLKSTVDFLNDLPKGAKVAGVAIAGVAAAIGPVTLGVGLLLRAVQAAAGGYAQLNRRMAENSAEAAINAGATKANAGAITASGKSAKGSAGLFGRFGKSTGKAAGKVSLLGQASKVLGNGIKILGGPIGWIITGVTLLGGAFIKAYNNVDWFKKGVDGLFDVIKTFGGGAIDQLKNLGGWFSKTGSKIKETFFDEMKQGYKDLDDDDLLKKAGDGFKKFMDKVGTASDKATDTTKVLGKDVSKETKNALDKYVKYSEDTTRVLSDIKLNHGKITDDMREKLETSVRKGGEEALKQIQKRNKKVSDELNDMLENSEAFTAQEKQDMIQKNQEASDEKIKRLEELNQEIEELELKQFNDGKLTAQEEKDLKAKLDERNRITTESIAKGQKEQQAILSRMNANTGAIDTQQASEAIKDAVKAEKKAKKEAKKQREDDVVQADDLLAYGEIDQKEHDKRVREIEDAYDEAIDTAEGKTGDIRKSVKKNNKDIADDIDLSSGHVYSNSEKWYKKTKNFIKDDWNSFWQDVGSQASGIGTWIGDQTDEIIGAFKKGWGKVEDFFTETDWKELVNGWFENIGEWIASPFKAIGEDIGDAVSSWKENISEAGEDIKSGFDTITGWFSEQGQEFWDALKEGWNIAIEAGGDLWNSLTGWLGETYENVSGWFVEKGSNIWSSLKNGWNTAIETGGDLWQSLTGWLSEKWESTKEWFSEKGGHIWSGIKTGWNNALETGGNLWSYLTGWLGEKWEDTKEWFSQKGHHIWSNIKTGWNDALEIGGNLWSSLTSWLGEKWEETKTWFSQKGGHIWSNIKSGWNNALETGGNLWSSITNKLGESWENTKGWFSEKGQNIQQSFKNGWNSAWDTAGNIWGKVTKDVSDTWENVKTSTRDKLEEAKGTATDKTKGIWKNTSKWFGDTYNSAKDKVTGVYNKTRDNFTNAAGKVWDKSKSAYNGTKKWFGETYEKAKTKVTGVYNQAKGKFGDTASIAWDKSKSLWKGTSKYFGKAYGSVKSNVSNMWNKAKSSFGNIAGEGWKKAKSVYSGFKKWLDETLQWIKDIGKDMGSAASDLGKTVANKAVDGLNGMIGGVNKISKAITGKDKLIKEIPHLATGTYDGSALSTDSNGGLRQPTVAMVNDKGPGNGPGGRTQELIQRKDGSIDAPQGKNTIVDLGKGDGVINAKHTHKLQEQGVIPKRLSTGTGVQIPRFSKGSKHWYDDLLDGTAKAGKNMGNKISDGYHSVKKAGRDAKDSVKDLGSKGLEKVKDGASWLGDKIGDVWAYVKHPGKLVNKVMDSIGINFGGGDNATVNLVTAAYNKMKSSLVDKVKDWFTEAEGGDGDASWLPWDNILQTFGNYTGGLMFNGGKHYGIDFGMPTGTKIKALTDGKISQAGAVAGGGGNQITLDEPGGKWYQWYMHMSKIIAKKGQKVSAGDVIGLSGSTGNSTTPHLHIQRMKGYPSNETAVNPMGWLKSLKSTNKSAKQWSGDIKKAAKQMNVKLKGNDLNNIISLINAESSGNAGAVQSGVDDVNSRNGNPAQGLLQYVPSTFYNYKVKGHGNIKNGYDQLLAFFNNKNWRTQFNPNGGWSPTGPRKYENGGISTTHKLAEISERNRAEAIIPLHKSKRNRAVGLMEKAMTAIGMDNGSANVTVNNDNSTIEKMLSQLVRVNDQNNKLTQTIIKLLSNQKQGSPKDAANILSQILGEDMRMASFNQGG >CP017459|1835786:1870197|1858620_1858824_-|AWI44816.1|DBSCAN-SWA MNEFEQPTIKILKRLFEGKNETNIHISNLNHVNYEVIETITNFKLSDTHTRNEHFRNVVTLKFKKKY >CP017459|1835786:1870197|1856764_1857199_-|AWI44811.1|DBSCAN-SWA MYHTQDIKTMIFEYHWRKNVLLKQGYEYDSNSTAQYGIESVMPKAQGSQGDKVSNIVIGNSKIERMYYKHVEVVNFIDSYEQYIDNDKNFNILQLLKENVRKKEIQEIFDIGQTNLDSRIDDIIRVLYQHQASDQYNQYNQYNQ >CP017459|1835786:1870197|1859633_1859837_-|AWI44819.1|DBSCAN-SWA MKDREYKDAWQELKEKFIRVYVMQNKVKEPTVDIKVKHQTYRNILRKMDEIDGTNEFSNLLSDLEDE >CP017459|1835786:1870197|1847674_1848025_-|AWI44800.1|DBSCAN-SWA MIKFEIKNQETGKVESYSKEVITMGEAERFYEWMESREKEVKKEKPDMKKVRKMERDYLVSLFEKQGLTEEDVLNNMGTKTYSYVLGEIFREISGEDETDSEDETSEEGKTEEQAQ >CP017459|1835786:1870197|1867367_1867631_-|AWI44836.1|DBSCAN-SWA MPKIITPPTSENTLTGNEVFVKPLYARATNIHKLFDFSQATTYNILNDYKKDDKGIKDLYISYSATMCLIDIEKFIEFLKTRHKKHL >CP017459|1835786:1870197|1852822_1854007_-|AWI44807.1|portal|DBSCAN-SWA MGIFADAFKRNIELRDALDLDLADDPASRSYLKRIALETCINFIARTFSQSEFWVKDKNKLLKNKIYYKLNVKPNTDSSATDFWHKVIYKLVYDNEVLIIKTDSDDLVVADDFYREEYALYEDLFKDVVIKDYQFKRSFKMSEVIYMNYNNDKLQKFVNSLFSDYGELFGRMMDTQLRKNQIRGLLRVENGGGEISEKQMSRLQKFANKIYDKFKNNNVAIVPEVSGFQYEDLTKSDGSKGTDNGAENIQKVKKLFIDDVAKIIGIPPNLIHGDVSDLANAMEAYIDFCINPLISKIEDELNSKLFTENEFLKGKRIEVAGINKVDPIKNAEKVDKLISSSAAKQNEVREMLGLEPVEGGDRFILTKNYEKEGENTSKGGEKNDNEGRIDESKR >CP017459|1835786:1870197|1865559_1865802_+|AWI44832.1|DBSCAN-SWA MNVSMFFKLRKALKKDKILLTNEYKHLDFMVENEWIVGEIIDYKEIDDPVVPMLLPVYSGYVSITPKGKEQYYSVRNKWG >CP017459|1835786:1870197|1837756_1837987_-|AWI44797.1|DBSCAN-SWA MSKTYNNRYLKDSDGDIYLPMTSTECIIDIDKINNANNIVEINTKINDLEELVKSQGKEIETLKAKVNQRESEGTK >CP017459|1835786:1870197|1861139_1861517_-|AWI44824.1|DBSCAN-SWA MKKITVAGYTFFVHPEHEAKAEALGLGIKYIRTRLKNGWTVQEAYSVPRGVRLEDYREAQNINYLQSKARKTRERLRDEKHREERPWLYDGTKQKHGRGKYTKELMRNNAIAKVKVDMYGNVQLA >CP017459|1835786:1870197|1839578_1840442_-|AWI44798.1|tail|DBSCAN-SWA MIDGRWLKIIDENGTKDINEYINNFIFLDAKASYPVSVEDSITMKGVDGELPGVASFAPFNLVVKFGFDGIDEIDINLMEQKLRSIFYKRTPYYIVTSDNPGIKYKVNNPDMNPDYADFSTTRFEMTFSVKDGYSESLRDTSQFSLSSGDWQFEAGVLSDDEIKYTHDTTAFKIYNGSSDTINPLLRHQFKLLVNIDAPKGFKIINHTTHEVLKDGKETNVFEYKKPITYSETITLSGVHPIKDQKRIGIDTNWGWLTLAPGFNHIEITGVSIKNVTTKWVFPFIYR >CP017459|1835786:1870197|1860303_1860726_-|AWI44821.1|DBSCAN-SWA MKIKTKKQLNLPQLIEWAWDNDVRGKMFPTDQNQEAGIYIATNRDFMMSNADYIKYSNTFTVEAEEEITEDTVVSKLMTTFKKTYLEGGIGYQRVRIDENYPIKLMLNKAEAHREPIETLHIVNDDGTHTLIWRDGKLVE >CP017459|1835786:1870197|1857257_1857506_-|AWI44812.1|DBSCAN-SWA MWVILTFVFSIVIIALIISLIVLNDRKNEKIFNLSKQNVLLQQEIKRELSSKPYTKPKKLSESLRERSQMKKYNTDNIHTHE >CP017459|1835786:1870197|1852131_1852860_-|AWI44806.1|DBSCAN-SWA MTTKEELMKASAKYQFKNEAKDGGVILTLSGPIAKPSIFADETINSADIAEVLDDVDKDITIRLNSPGGDAFEGIEIYNYLKNHPSNITVEITALAASAASIIAMAADETVMGKGASIMVHEASTIAIGNKSEVKKTLNALETIDESIVDVYAEKTNLSRDEIVNLMEEETWFTAQKAVEKGFANRTKDVSDISKGNSNNKQNITNQQFNNEMRDAIVNLTNEFASLKEKLPTENKKKAKYL >CP017459|1835786:1870197|1861722_1861902_-|AWI45791.1|DBSCAN-SWA MAKRNISVTRLHLLSGVSRSSITEYRKGNMQMVNLRSISKIAEVLNIKPSELFIEGDKT >CP017459|1835786:1870197|1863531_1864251_-|AWI44829.1|DBSCAN-SWA MNDSIKSSITGYGLVFKRVMKDTSISIEAKALYSYLSAYAGANETAFPGVSLICHELNISDKRFQKYRKQLEDNGYLSIKRERTNNGFSKNIYTIEHNPVSGHFVPVQNLPGRNLPGQNVGTTINSSTINSITNNSRTINTSATDVTRERFENWWKLYDKKLDKKKAFSLFKSALKKHSYETIMNGTREYLKTITNKQYQKYPKTFLSQESYMNDFTEETQPTGQDQLERMKYDPSYWD >CP017459|1835786:1870197|1854022_1855693_-|AWI44808.1|terminase|DBSCAN-SWA MTSVNKYVTRYIDKYKNGEITFNKERQWLVEHLELNILYREDLYFDEEQIERCIKFIEKFYFKLQPFQKFLIAFVFLFDEEDELYFEQFFWLVARGAGKNGLISGLSNYLISELHGIDNYDGTVVANTEKQAKTSFEEMHRQITKHNLYTGRINDVEGEGFFDLTKQRITSEVTDSKFEYATSNAGSKDGGREGFIIYDEVHRYENNDIVDVFSSGLGKVKHPREFFIGTDGFVREGFLDKLKDRSMAILKGQSPNDRLFPFICRIDDEEEMSTPEAWSKANPMFEEPISDYGKRLYRKVLNQYHDLEHSPSGRENFMTKRMNYPEVDLAKVVASYEDIYATNQEIPLLKNKTAIAGLDFGSIKDFAAVGLLFKQGDDVIWISHSFARKQYLDQANLQPPIKEWERQGLLTIVDEPSINPIHIIDWFKKMREKYAIQMVVADNFRMDLLRPYFEGAGFDIEVLRNPRGVHSLLAPRIETLFANHRVIFGDNPLMRWYTNNVAVEVKKDGNKEFVKKDEHRRKTDGFHAFLHALYKLDELQEVDLDKAFDLLDKLDF >CP017459|1835786:1870197|1855689_1856052_-|AWI44809.1|DBSCAN-SWA MENDEKHIEHQEERVKAETERLNKIFKDIPQDRMKVAQGLIIQAARLRVLLDDAWLDIQTNGDYELFTQSENTPPYERERPVAKHFNQRDGSYQKVVMQLTKLLPEDVKEETKEERKSLL >CP017459|1835786:1870197|1868307_1869066_-|AWI44838.1|DBSCAN-SWA MQDLLTINIEKNSELGPVVSSRTVAEEINRRHTHVLRDLEKILLSPNVDSVIIPSEYKDSTGRNLKEYLLTKDGFTLYMFNIQGHNDFKMAYINMFNEMEEQLKQQYQVPQTPMQALEMMFSVQKEQEQFNKRIETEVTGIRNIVGIETKNWRNDTNKILGAIAQHLGGGDKHKSIRTEAYKLLEEKGRCKLDQRLNNRRAKMLSEGATKSQINKLSKLDVINDEPRLIEIYISVIKNMAIKYGVDISQFEI >CP017459|1835786:1870197|1862747_1863521_-|AWI44828.1|DBSCAN-SWA MKQMLSPKITETLKQYEANEIERGLYCEKCGNKYDLHKFGSGYEYRDGCECSMIAAGIEAEKKRKQKAINNIFNQSNVNYSLQDATVNNYQPQNQSQTDAKQTAIEYVKTFSIDKPKSLIMQGSYGTGKSHLAYAIAKAIKAQGYSVAFMHIPMLMDRIKATYNKNADETTDELVKLLSSIDLLVLDDIGVENTEHTLNKLFSIVDNRVGKNNIFTTNFSDKELNQNMNWQRINSRMKHNSRQVRVLGDDYRERDAW >CP017459|1835786:1870197|1849379_1849775_-|AWI44802.1|DBSCAN-SWA MNILKYIKNIIINDPILASEVNNRIYYYEVTEVDDTSDAFVVLTPILDRPSTYVSDKYLSETYFFQVDVEAYNHQQTIDITKRIRYLLSNVNLNQASSQLDDYFKATQRYVMSRRYRGIPKNKYYKGERVE >CP017459|1835786:1870197|1850193_1850553_-|AWI44804.1|DBSCAN-SWA MKNNFKPPELGNGDLRTPVTFYEYIKKGPYPDDLEKSELHSCMAETYSPSMKDREVLNVNETQYGLTIAIRDPLQSYTPNNKHSVEVEDFRLEKNLFNIYDVRFDKPERGFITVVLGEK >CP017459|1835786:1870197|1849771_1850197_-|AWI44803.1|DBSCAN-SWA MSKSKVNGLYDVKVEGEEEIMKKMEAKFGQKAMQEKNDKALIEASDFLKQELKYQFEEFRDTGATIQEMKRGNPETVGGQRRIMIHWEGPKERKNIIHLNEHGYTRNGKKYTPQGYGVIAKTLDASQTKYRGIIRRELNKK >CP017459|1835786:1870197|1861934_1862357_-|AWI44826.1|DBSCAN-SWA MKRIELTVDVPMASPRPRFRNAGKFVQTYMPAKYTNHKKMLRQQMPYMMIDKPIRLTIEFHFPLLKSWSKKKHVAMVGQYKRTKPDIDNLIKTVLDAANGHVWQDDNQIVEIRSFKKYAETPKVIMELEYWSDLTWEKKR >CP017459|1835786:1870197|1864247_1864916_-|AWI44830.1|DBSCAN-SWA MQRITRYQKDNDGTYSVVATGVELETSHTELMDNGYTVNADVTVPDNKLLSNDQRKKIFALCRDIELHWGEPVEASRQLFQSELAMMNGYERISLRNCTKKVASELIELIIAFIFHHQIPMRVETSKLLQGEKAMLYWATVNRNCVICGSPGSDLAHYETVGRGMNRKTMNHHGKHVLALCRKHHNQQHDIGVKSFDDLYHLQNSWIAVDDKLNSMLRGEKQ >CP017459|1835786:1870197|1859381_1859633_-|AWI44818.1|DBSCAN-SWA MIKEDKNKIVIEKWGENVHFLNAVQELINFYEKNRNNALIHCDVNIAQNDDMRRSHEPEETFREHYLDIDMRYVDVKYTGQGE >CP017459|1835786:1870197|1835786_1837760_-|AWI44796.1|DBSCAN-SWA MSNYFLNFPIQIGQDYRFKMIRNFKYLIDNFKYFKRDFEYHKKEEKHAHHAFQIDYERSNVKTEIDRMKRAYNNIIIANNGDGIAEVSDSRVTFKGVKKDLLSERLREDYLDHVESKEVISNELEKSKIIRSAYDFDGVYVNENKSSREGLQNWLDWNKKRGGGPLILPPGQYCLDDYLVIPPNTTLYGHGATLKRIDGNGWFTNLADGETPIKYEGNGNIKFYGLTFDGNSELDKGMDGIVLGHAEDVTFQECLFLDVHTTHAIDLNGCKDVLIDHCLFKGQKNPGDNEKEAIQISLAAEIGIGNLPGSSYDSTPSKNVIVQNCYFGPSRNYPSYATAVGDHFSVYDQWVSNVVIQNNFIEKTTNFGLRVYKFKNTLVSNNIIQDCSGGIFATPTPGGYTSSINAEGVQMGAAQSGENLKIIGNTITNIEKLGIHISAYPNKKIPYKNESFETVDIANNTIRNTKQVGIYVPEARRVKIHGNTVEQCSMGIQCYGTWHLMVSNNNVSNTDTIGVFISNNKQLETGSAQTHAIVSNNQVYNSGQDGIRVSLGAMYIKVTNNSVFSYGLNASQSWIIAGIYLVECKNSIVTDNMVRNANEKYLDAVRISDDCIDVRVWNIDAGGSTITILNPKDKPHSNFYGVRDLNGNQVKYEGDVK >CP017459|1835786:1870197|1858860_1859379_-|AWI44817.1|DBSCAN-SWA MTNTLQIKLLSDNATMPERHHDTDAGYDIYAAETIILEPQQKALVATDLAVNIPKGYVGLLTSRSGVSSKTHLVVETGKIDAGFQGHMKINIKNELVIFSPSFYTTNEVIDLNNNGKYHNSDLQKHGSYIIHKGDRLAQLVIVPIWTPELEPVKEFSNETARGDKGFGSTGY >CP017459|1835786:1870197|1857975_1858206_-|AWI44814.1|DBSCAN-SWA MQYLIRHITDSTNHTFVEVIKPRENETFTVVEAESKEEAEKMAKKPKGLLSYVPSSFNNDPISKALKGSIYRKDSE |
47 | Staphylococcus_phage(53.85%) | tail,terminase,portal | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_6 |
2002561 : 2011037
Sequences of DBSCAN-SWA_6
Nucleotide sequences of DBSCAN-SWA_6 >CP017459|2002561:2011037|DBSCAN-SWA CTTATTGAATAATTTTCGAAATAACTTCTGGATATAATGTATGTTCTAATGCTTTAATTCTTGTTTCTAATTGCTCTTTTGTGTCGCCCGGTTTAATATCACATGTACGTTGTTCAATAATTTCTCCTGTATCCATCCCACTGTCTACATAATGTACTGTCGTACCTGTAATACTTTCTCCACTATTTAAAGCTTGCCCAACCGCATCTTTGCCACGATATTTGGGCAATAGTGAAGGATGGATGTTAATAATACGTTTTGGATACGCGTTTAAGATGTTTGCGCCGATTAATTTCATATATCCCGCTAAAACGATCCATTCTACCTTTTCAGCAGTTAACCATTCTATTATTTTACGTTCATAATCTGCTTTAGAATCAAAATTTTTAAGTTCGTTAATATGTACATCTAAATTGTACTTTCTTGCACGCTCTATACAATAAGCATCCACTCTATCTGTATATAAAGCAGTCACTTCAATTTGAGGTAATTTGCCTGCTACAACTTGCGACATGATACTTTCAAAATTACTTCCTGATCCTGAAGCAAAAATGGCTATGTTAGTCACTTTTATACCCCCATTAAGCGAATTGGCTCTTCGCCTTTAACTATTTCTCCGATTTTATAAGCATTTATCTGTTCGGCTTTTAATGCATCCAACACTTTAGATTCATCCTGAGCATCTACAATTAATGTAAAACCGATACCCATATTAAACACGTTATACATTTCTTCTTTTGTTATATCACCCTGGTTTTGTAGCCATTCGAATATTTTCGGCGTCGGGAACTGCGTTACGTCAATCATAGCAGTTACACCGTTTGGCAATGCTCTAGGTATATTCTCAATAAATCCGCCACCAGTGATGTGTGTCATGGCATGTATTTGTATTTGTTTTTTTACTGTTAATACAGGTTTGACATACAAGCGTGTAGGCTCTAGAAAAACATCTAAATACGTGCGATCTACATCAAATTTATCTTGTAAATTAACACCAGATTTTTTAATGATATTTCTAACTAAACTGTAACCATTTGAATGTATCCCACTCGATTCAAGTCCAATAATCACATGACCTGGTTTTACCGTAGAACCATCTATATAAGCCTCTTTTTCAACTGCACCTACTGCAAAGCCAGCTAAATCATATTCACCTTCGTGATACATTTCTCCCATTTCTGCAGTTTCACCGCCGATAAGCGCTGTATTCGTTTCTTCACAACCGTCGCTAACCCCTTTGACGATTTGTTCTATCACTTCTGGAATTACTTTGTTTGTAGCAATATAATCTAAAAAATATAAAGGTTCTGCACCAGTCGTTAAAATATCGTTAACGCACATCGCAACTGCATCGATACCAATCGTATCGTGTTTGTCATTATCAATTGCTAACTTTAATTTAGTACCAACGCCATCGGTACCTGAAACGAGTAACGGCGCTTTCATATTTAATTGAGATAAATCAAACGTAGCACCAAAACCGCCTAATCCACCTAATACTTCTTTTCGCATTGTTCTTTGAACGTGACTTGACATACGTTCAACTGCTTCATATCCTGCGTTAATATCAACACCTGCTTGTTGGTATGCTTTAGACATTTAAATTACCCTCTCTATCAAAGTATTGTTTATGATTTGCTAAATATTCTTTTTGGCGTTCGCTTAAATTTTCAAGATAATCCTTTTCATAATCATAAAGACCAGCAGGGTAATCACCAGTAAAGCTTTCCACACATAGCCCCTTGTATGGCGCGTCTACTTCAAGGCCGATAGAATCGATTAAGCCATCTACTGTTAAATAAGCTAAAGAGTCAGACCCAATGTGATTACTAATTTCTTCTGGTGATTTGTTCGCTGATATAAGTTCAGCTGTTGTTGAGACATCTATGCCATAAAAACTTGGAAACATAAACTCAGGAGAAGCTATACGTACATGCACTTCATTTGCGCCAGAATCTTTAAGCATCTGAACGATGCGTTTACTTGTAGTACCTCTTACAATTGAATCATCTACCAGTACAATATTTTTGCCTTGCACAATATCTTTTACAGCTGATAATTTAACTCTCACGCCTTGTTCGCGTAACTCTTGTGTCGGTTGAATAAACGTGCGTGCTACATATTGATTTTTCACTAAGCCCATTTCATAAGGTAAACCACTCTGCTCAGCATAACCTGAGGCTGCTGAAAGCGAGGAATTGGGGACGCCAATAACCATGTCTGCATTTTCAACTGGGCTTTCTAAAGCTAATTGCTTACCTGATTGTTTTCGGATTGCATGAACATTTTTTCCTGCGATGGTAGAATCTGGTCTAGCAAAATAAATATATTCCATAGCTGATATTGCTGTATTTGTATGTCTCGTATATGATTCCACGCGAATACCTTCGTCGTCGATAACAACATATTCACCATCATGAATATCTCTCACAAACTCTGCACCTAAAACATCAATAGCGCATGTCTCACTTGCAAGGATATATGAGCCTGTTTTCATCTTGCCTACTACTAATGGTCTGATAGCATTTGGATCAACAGCACCATATAAAGCATCTTTTGTTAACAATGCAAATGTAAAACCACCTTTGATTTTACGTAAACTCTCTTGTAATGCCGCTTCAAATGTAGGCGCTTTACTTCTACGAATTAAATGCATAATTACTTCTGTATCTGATGAAGAATGGAAAATAGAACCTTGATGTTCAAGCGATCTTCTTAAACTTTGTGCGTTAATTAAGTTTCCGTTATGACAAACTGCAACGCTCATATCGTAAAAATGATATAAAAATGGTTGAATATTTTCTATACCTTTATTACCTGATGTTGCATATCGTACATGGCCAATCGCATGTTGATAGGATTTAAATGATTCTAATTGTGTGTCTGAAATAGCCTCAGTCAAAAGACCAAGTCCTCTTTCTCCAATAAGTGTCTCTCCATTTGAACACACCATTCCTGCGCCCTCTTGACCTCTATGTTGTAAACTATGTAGCCCCATATAAGTCAGTTGTGCTGCTTCATGGTGATTCCAGATGCCAAAAACACCACACTCTTCGTTTAATCCGTTGTAGTCATACATTTAGGAATAGCTCCTTCCCATAGTTCATTCAATTCATTAACATCACGTGTTACTTTAGTATTTTTGTTAGAAACTACAAATTTTCCATCTTGTGTAAATGACCCAACCTTGATTGCGCAATCAAGATCTAATGATTGGTTCTCTTTTACGGAAACAATATAACGCCCTTGCGTTTCGCTGAACAGTTGTTCATTCGTAAGCGCTAGTTCTACTTCTAGCCCTAATTGATAATGCGCACTTAAACGAGCAAACGTCATTAATAATCCGCCTTTTCCAACTGTTTGAACATGAGAAGCTACACCGTTACGAATTGCAGTTTTAATTGCTTCACCTTTACGTACCTCACCTGATAAATCTATCGCTTCAAATTCATGATTTACTTTACTATATAGCAATTTCTCAATTTGACTGCCACCAAAATCATCATTTGTATCACCCACGATATAAAGTGTGTCGCCTGCTTTTGGTGAGAAATCAGTTAAATAATCAATGTCTTCAATTAATCCAACCATACCAACTACTGGTGTTGGGAATATTGACGTTTCTTTTGTTTCATTATAAAGTGAAACATTTCCAGACACTACTGGCGTACTCAATATTTCACAAGCTTCTGACATACCTTTTGTAGAATCAGCTAATTGTTGATAAATTTCCTTTTTCTCTGGCGAACCGTAATTTAGGCAATCAGTCATAGCTAAAGGCGTAGCACCAACAGAAATTAAATTGCGATACGCTTCTGCAACAACCATTTTCCCCCCTTCATAAGGGTTGTTGAACACATAACGCGCTTCACCGTCAATCGTAGATGCGATTGCTTTATTAGTGCCTTCTACTCGAACTACAGATGATTGTAATCCTGGTTTCACAATTGTATTAGCACCGACTTGTTGATCATATTGTTCATATAAATATCGCTTTGAAGCAATCGTTGGATGTTGTAATAAACGTTCAAATACATCTTCTACATCAATATGACTGTAATCATTCTTACTAGCATTATATTGTGGCGCTACTCCTTCTAAGACATAAACAGGCGCTTCATCAGATAAAGGTTGAACAGGTATATCAGCGAAAACGTCGCCTTTATATGTAAGTACAAAACGATCTGTATCTGTCACCTCTCCAATTACAGCGCTATCTAATTCATGTTTATCAAAAAGGTCTAAGAATTTGTCTTCCGTACCTTTTTCTACTACTAAAAGCATGCGTTCTTGTGTTTCTGATAACATCATTTCATACGGAGAAATACCTTGTTCTCTCGTTGGCACCTTCTCTAGTTGTAAATGTAAACCGCTACCACCTTTTGCTGCCATTTCTGAAGAAGATGACGTCAAACCGGCTGCTCCCATGTCTTGGATACCTACCAATTCTTCGAAAGTTATCGCTTCTAAAGTTGCTTCCATTAATTTTTTACCAACAAATGGATCACCAATTTGTACTGAAGGTCGCTTACTTTCACTATCTTCACTTAATTCTTCAGATGCAAAAGTTGCCCCGTGAATACCATCACGTCCTGTTTTTAATCCAACATAGATAACTGAATTTCCGTTACCTTTAGCGGTGCCTTTTTGAATTTTATCGTGGTCAATAATACCTACACACATAGCATTTACCAATGGATTACCATCATATCTGTCGTCAAACTCTATTTCACCAGCTGTTGTTGGTATGCCAATACAGTTACCATAACCACCAATGCCAGCTACCACACCACGTAATAAGCGACGATTTTGCTTTTCTGTTAATTCGCCAAAACGTAAGCTATTTAACAAATTAATTGGTCTAGCGCCGATTGAAACAATATCTCTGATAATACCCCCAACACCAGTGGCAGCACCTTGATACGGTTCTACAGCTGATGGATGGTTATGAGATTCAACTTTGAAAACTACCGCTTGATTATCCCCGATATCAACGACACCAGCACCTTCACCAGGCCCCATTAATACATGTTCCCCTGATGTTGGGAATTGAGTTAAAAACGGCTTGGAATGTTTATACGAACAATGTTCACTCCACATTACAGAAAAAATACCAATTTCAGTAAAATTTGGCTCACGTCCTAAAATTTCACAAACTTTGTCGTATTCTGCCTCTGACAAGCCCATATCTTTGTATAATTTTTCTAATTTAATTTCTTCAACACTCGGTTCGATAAACTTAGACATTTTGTTCCCTCCAACTATTCACCATTGCTTCAAATAATCTTACGCCACTGTCTGTTCCTAATATAGTTTCAATTGCACGTTCAGGATGAGGCATCATACCACAAACATTACCTTTTTCATTTACAATTCCTGCAATATCATTATACGAACCATTTGGATTATCCATATATTTTAAAATAATTTGATTATTCGCTTCTAATTTGTCATACATTTCAGATGTGCAGTAGTAATGTCCTTCGCCATGTGCTACTGGATAAACAACAACCTCATTCTCACTATATAAATTTGTATATGGCGTTTGGTTATTAACCACTTTCAAAGACTCATTTCGGCTTACAAATAAATGTGAATCATTGTGCAATAAAGCGCCAGGGAGTAAACCAATTTCAGTAAGTATTTGGAAACCATTGCAAACACCTAATACTGGTTTACCTTCTTCTGCAAAACGTTTCACTTCTTCAGTAATAGGAGCAACACTTGCCATGGCACCTGATCGTAAGTAGTCACCAAATGAAAAGCCTCCAGGAATAAGCACACCATCATACCCCTCTAACGATATATTCCTATAATCTACATACTCCGCTTGGACTCCTGATTTTACTGCTGCATTATACATATCTCTATCACAATTGGAACCTGGAAATTTTAGCACTGCAAATTTCATTATGCTTTCTCTCCTTCTTCCAATACTTTATAGCTATATTCTTCAATTACTGTATTTGCAAATAGTTTTTCACTTAAAGTAGTAACAACGTTATGTACCGCAGCATCTGTCGCTTCATCTACTGTCATATATAGTACTTTACCAACACGAATATCATTCACTTGTGTGTAGCCTAAATCATGTACTGCACGATTTAACGCTTGTCCTTGTGTATCTAAAACCTGTGGTTGTAATGTGATATGCAATTCAATTGTCTTCATTTTTAAAGTTCCTCCAATTTATTAAGAAAAGTTTGATAAGTTTCTATGATTGAGCCAGTATCCTCACGATAAACATCTTTATCGAAGTTAGTATCACTGTATTTATCCCAAATACGGCATGTGTCTGGTGAAATTTCATCTGCTAAAATAATTTGACCACTTTTATTTCGACCAAATTCTATTTTGAAATCGACCAATCTCAATTCCATTTCATCCATTAATTGAACTAACACAGCGTTTATTGCTTTTGCTGCATTTTTTAATAATTCAATATCTTCTTCACTTGCTAAATGTAATAATTGGATATGATCTTCTGTAATTAAAGGATCATTTAAGTTGTCATTCTTATAGAAGAATTCCACAAGCGGGCTTTCAAATTCATGTCCTTTTTCAAACCCTAAACGCTTAGTGATAGAACCTGCAGCGATATTTCTCACTACTACTTCCAAAGGGATAATATCAACTGATTTTACAAGTTGCTCCGTTTCTGATGTCTGCTCGATAAAATGACTCTCTATACCACGTGCTTTAATAAAATTGAAGATTCTAGAAGTAATTTGATTATTCAAGCGTCCTTTACCTTCTATATAATCTTTTTTTGCACCATTACCTGCTGTCACTTCATCTTTATATTCGACACGAAGTACACCAGGTTGCTCTGTTGAAAAGATTCGTTTAGCTTTCCCTTCATATAATAAAGACATTATTTATGTCTCCCTTCAAAATGATTTAACAAAGCCTGTTCAGTTTGATCTACATCATTCGTTAGCATCGTGAGATGTCCCATTTTTCTATCAGGCTTACGGTTTATTTTTCCATATATGTGTACATGCCATTCAGGATGGTCCCCAAACTCATTTTCTAGTAAATCTAAGTCTCTACCTAATAAGTTCATCATTACGCTAGGTTTTAATAAATTAATCTTTTCTGGTAGGCGTTGACCTGTAACCGCCAATATATGTGTATCAAACTGCGAATAATCACACGCTTCTATGGAATAATGTCCAGAATTATGCGGTCGTGGTGCAATCTCGTTTACAAATAAATGATTGTTTGAATCTATGAAAAATTCCACCGTAAATGTCCCAATAAAGTGTACATGTTCAATTATTTTTTCAACTTCATTTCGCGCCTCTTGTTCTTTTTGGACATCGACACGTGCAGGAACAATCGTCTTAAATAATATTTGATTTTGATGTTCATTCTCTTGTAGAGGAAAATAAGTAATTTGGTTATTATTACCAATTGTTACTGTAAGCGAAACTTCCTTTTGCAAATCTAAAAATTGTTCAGCAACACATTCTTGCTTTTCAACTAATACTTTTGCTTTATTCAAATCTGATTCATTAGTAATAAGTGCTTGACCTTTGCCATCATAACCACCAAATCTTGTTTTTATGATAAATGGAAAACCAATTTCTTCTATAGCACGAGTTAAATCATTTGGGTCTGATAACTTTATAAATGGCGCTATTTGCGTTTGAGCATTTTGCAACGTTTGTTTTTCAACTAATCTATCTTGTAATAATTGAATCGCTTGGTAACCTTGAGGAATATTATATTTAGAGACTAGCGTTTGTAATTGACTAGCCGAGATATTTTCAAATTCATAAGTGATCACGTCAGACAATTCACCTAATTGCGCAAGTGATTGTTCGTCATCATAGTTGGCATTTATAAATTGATGTGCTACATATTGACACGGACAATTTTCATCAGGATCTAGCACAATGACTTTATAACCCATCTTCTGTGCTGATTGTGCCATCATTTTCCCTAATTGTCCTCCACCGATAATGCCAATCGTTGATCCAAATGGTAATTTACTGAAGTTCATGTTGCATTTCACTCACTTTCTCAATCAGTGATTTTTCGTAATTTTCCAAATTCTTTTGGATATCTTTATTACCAATACTGAGCATTCTGGCAGCTAAAACACCTGCATTTTTAGCTCCTGCTTTACCTATAGCTGTTGTCGCAACTGGAATACCGCCTGGCATTTGTACAATAGACAAGAGAGAATCCAAACCTTTTAAACTTTTAGATTCAATTGGCACGCCTATGACTGGTAATGTTGTCATTGATGCAACCATACCTGGTAAATGTGCTGCACCACCTGCTCCAGCAATAATGACGTCGTAACCATTATCTCTGGCTCCTTTAGAAAACTCATACATTAATTGAGGCGTACGATGTGCTGAAACTACTTTCTTTTCGTACGGTATTTCTAGTTGTTCTAACATTTGGCAACTTTCTTTCATAGTCTCCCAATCGGAAGAACTACCCATTATGACTACCACTTTCAA
Protein sequences of DBSCAN-SWA_6 >CP017459|2002561:2011037|2009434_2010568_-|AWI44951.1|DBSCAN-SWA MNFSKLPFGSTIGIIGGGQLGKMMAQSAQKMGYKVIVLDPDENCPCQYVAHQFINANYDDEQSLAQLGELSDVITYEFENISASQLQTLVSKYNIPQGYQAIQLLQDRLVEKQTLQNAQTQIAPFIKLSDPNDLTRAIEEIGFPFIIKTRFGGYDGKGQALITNESDLNKAKVLVEKQECVAEQFLDLQKEVSLTVTIGNNNQITYFPLQENEHQNQILFKTIVPARVDVQKEQEARNEVEKIIEHVHFIGTFTVEFFIDSNNHLFVNEIAPRPHNSGHYSIEACDYSQFDTHILAVTGQRLPEKINLLKPSVMMNLLGRDLDLLENEFGDHPEWHVHIYGKINRKPDRKMGHLTMLTNDVDQTEQALLNHFEGRHK >CP017459|2002561:2011037|2005617_2007807_-|AWI44947.1|DBSCAN-SWA MSKFIEPSVEEIKLEKLYKDMGLSEAEYDKVCEILGREPNFTEIGIFSVMWSEHCSYKHSKPFLTQFPTSGEHVLMGPGEGAGVVDIGDNQAVVFKVESHNHPSAVEPYQGAATGVGGIIRDIVSIGARPINLLNSLRFGELTEKQNRRLLRGVVAGIGGYGNCIGIPTTAGEIEFDDRYDGNPLVNAMCVGIIDHDKIQKGTAKGNGNSVIYVGLKTGRDGIHGATFASEELSEDSESKRPSVQIGDPFVGKKLMEATLEAITFEELVGIQDMGAAGLTSSSSEMAAKGGSGLHLQLEKVPTREQGISPYEMMLSETQERMLLVVEKGTEDKFLDLFDKHELDSAVIGEVTDTDRFVLTYKGDVFADIPVQPLSDEAPVYVLEGVAPQYNASKNDYSHIDVEDVFERLLQHPTIASKRYLYEQYDQQVGANTIVKPGLQSSVVRVEGTNKAIASTIDGEARYVFNNPYEGGKMVVAEAYRNLISVGATPLAMTDCLNYGSPEKKEIYQQLADSTKGMSEACEILSTPVVSGNVSLYNETKETSIFPTPVVGMVGLIEDIDYLTDFSPKAGDTLYIVGDTNDDFGGSQIEKLLYSKVNHEFEAIDLSGEVRKGEAIKTAIRNGVASHVQTVGKGGLLMTFARLSAHYQLGLEVELALTNEQLFSETQGRYIVSVKENQSLDLDCAIKVGSFTQDGKFVVSNKNTKVTRDVNELNELWEGAIPKCMTTTD >CP017459|2002561:2011037|2003130_2004159_-|AWI44945.1|DBSCAN-SWA MSKAYQQAGVDINAGYEAVERMSSHVQRTMRKEVLGGLGGFGATFDLSQLNMKAPLLVSGTDGVGTKLKLAIDNDKHDTIGIDAVAMCVNDILTTGAEPLYFLDYIATNKVIPEVIEQIVKGVSDGCEETNTALIGGETAEMGEMYHEGEYDLAGFAVGAVEKEAYIDGSTVKPGHVIIGLESSGIHSNGYSLVRNIIKKSGVNLQDKFDVDRTYLDVFLEPTRLYVKPVLTVKKQIQIHAMTHITGGGFIENIPRALPNGVTAMIDVTQFPTPKIFEWLQNQGDITKEEMYNVFNMGIGFTLIVDAQDESKVLDALKAEQINAYKIGEIVKGEEPIRLMGV >CP017459|2002561:2011037|2010554_2011037_-|AWI44952.1|DBSCAN-SWA MKVVVIMGSSSDWETMKESCQMLEQLEIPYEKKVVSAHRTPQLMYEFSKGARDNGYDVIIAGAGGAAHLPGMVASMTTLPVIGVPIESKSLKGLDSLLSIVQMPGGIPVATTAIGKAGAKNAGVLAARMLSIGNKDIQKNLENYEKSLIEKVSEMQHELQ >CP017459|2002561:2011037|2008470_2008731_-|AWI44949.1|DBSCAN-SWA MKTIELHITLQPQVLDTQGQALNRAVHDLGYTQVNDIRVGKVLYMTVDEATDAAVHNVVTTLSEKLFANTVIEEYSYKVLEEGEKA >CP017459|2002561:2011037|2004151_2005639_-|AWI44946.1|DBSCAN-SWA MYDYNGLNEECGVFGIWNHHEAAQLTYMGLHSLQHRGQEGAGMVCSNGETLIGERGLGLLTEAISDTQLESFKSYQHAIGHVRYATSGNKGIENIQPFLYHFYDMSVAVCHNGNLINAQSLRRSLEHQGSIFHSSSDTEVIMHLIRRSKAPTFEAALQESLRKIKGGFTFALLTKDALYGAVDPNAIRPLVVGKMKTGSYILASETCAIDVLGAEFVRDIHDGEYVVIDDEGIRVESYTRHTNTAISAMEYIYFARPDSTIAGKNVHAIRKQSGKQLALESPVENADMVIGVPNSSLSAASGYAEQSGLPYEMGLVKNQYVARTFIQPTQELREQGVRVKLSAVKDIVQGKNIVLVDDSIVRGTTSKRIVQMLKDSGANEVHVRIASPEFMFPSFYGIDVSTTAELISANKSPEEISNHIGSDSLAYLTVDGLIDSIGLEVDAPYKGLCVESFTGDYPAGLYDYEKDYLENLSERQKEYLANHKQYFDREGNLNV >CP017459|2002561:2011037|2002561_2003074_-|AWI45793.1|DBSCAN-SWA MSQVVAGKLPQIEVTALYTDRVDAYCIERARKYNLDVHINELKNFDSKADYERKIIEWLTAEKVEWIVLAGYMKLIGANILNAYPKRIINIHPSLLPKYRGKDAVGQALNSGESITGTTVHYVDSGMDTGEIIEQRTCDIKPGDTKEQLETRIKALEHTLYPEVISKIIQ >CP017459|2002561:2011037|2008733_2009435_-|AWI44950.1|DBSCAN-SWA MSLLYEGKAKRIFSTEQPGVLRVEYKDEVTAGNGAKKDYIEGKGRLNNQITSRIFNFIKARGIESHFIEQTSETEQLVKSVDIIPLEVVVRNIAAGSITKRLGFEKGHEFESPLVEFFYKNDNLNDPLITEDHIQLLHLASEEDIELLKNAAKAINAVLVQLMDEMELRLVDFKIEFGRNKSGQIILADEISPDTCRIWDKYSDTNFDKDVYREDTGSIIETYQTFLNKLEEL >CP017459|2002561:2011037|2007799_2008471_-|AWI44948.1|DBSCAN-SWA MKFAVLKFPGSNCDRDMYNAAVKSGVQAEYVDYRNISLEGYDGVLIPGGFSFGDYLRSGAMASVAPITEEVKRFAEEGKPVLGVCNGFQILTEIGLLPGALLHNDSHLFVSRNESLKVVNNQTPYTNLYSENEVVVYPVAHGEGHYYCTSEMYDKLEANNQIILKYMDNPNGSYNDIAGIVNEKGNVCGMMPHPERAIETILGTDSGVRLFEAMVNSWREQNV |
9 | Synechococcus_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_7 |
2159737 : 2199789
Sequences of DBSCAN-SWA_7
Nucleotide sequences of DBSCAN-SWA_7 >CP017459|2159737:2199789|DBSCAN-SWA TTTAATATACTTCTACTATTCTTAATCGTTCGTGCCATACCCAACCATTATTGTTATGAGAGTATACTCGACACCAACCGTCTAACACTTCAAAAATGTAAAAGTCATCATAACCTGCACGGTAAGTTTCATTAGTGAGTGACCATTGATAATTACCTTTTTTACCACTACGTTTCGCTACAGTTGCACCGTAATGATCTACTTTACCTCTGAATTTGCATTTCTTACTCCAACCAAGTTTACTAGGTGGAATACTTCCTACCTTCAAACCACTTGTTTTCTTAGCGTTCGTTTTTTGATTGACAGTTTGTTTATCCGGTTTATTTTTTAAACTTTGTCCGCCGCCTGGCTTATAAACTTCTGTTATTCTTAATCTTTCATACCAAACAAAGCCATCGTTCGAAGGAGAATAAACTCTAGCCCAACCGTCACGTATTTCATAAACATAGAATACATCTCCTTGTCCGTACACTTCATTTGTAAGTACCATTACGTTATTGTGGTTAGGTCTACAAATTGTAGCACCTGCATTGTCTGCTACTGCTTTGAAATATGGTTGGTTAGACCAAGTTAATTTCTTAGGTGGAACACTGTTTAATTTCAATGTCTGGCCTTTTGATGGCGCTTTTGGTTTTACGTTTCCAATTGTAGTTAAATCAACACTGTCATCTGCAAAGTCTGGTACGATAAAGTGTGTTAAGCCACTATAATTATCTTCTCTTAATTTAGCCGGTGAATTAGCATTTCCATCATAGTTTTGTTCTAATATTGTGAATGATTTAGTACCACCACTGTTATCCCAAACTAGGCCTGTATGCCCCCATTTGCTATAGATGCCCTCTGTATATACAGCGATTGCTGTTACAGGTGGTATATAGTTGGGCGTGTTCTCTACCACTTTCCAGCCTTTAGGCATAACATTATTGATAAGGTCTTTTGCGTTACCCCAAAATCTGACACCTTTTGTAACTTGATGCACAAAATCAGTGATAACATCGACACACTGATAAGCAAACTCGTCGTCAAAATCAATATATTGACCTTTCATGCTGTGCATGTACTCGATAGCCTCTTTCAGCTCTACATGAGATCGTGGTGACTCTGTCGGTTTCTCAGTTGTCGGCTCTTTAACCTCATCGGGCATATTGTCATCTTCCTGTACACCGCCGATGTATTTGTTCACTAGCTTATCAAGATTGCTTATATTGCGGCTGTAACCTGCTGCCTCGAGTAAGTTGCCGGGGTCGATTTTACCTGCTTGAATGTCTTGGTGGCCTGGCATTTCTGTTTTATGGTCTATCTTCCAGTAATCGCAAAGGTACGCCAAGATACGCGCTAAGTTATCAAGTGACTTTTTAGAACGTGCCTTATCTGAGAAATATGACCCCTCAACGCCAAATGCGGCATCGTTTGAGTCTAGGCCGTACCAATTGTTATCTGTAACAGCATTATAAAGCACATGCCATGCTTTCTCTGTAACAGGTATGCAAATAATTGCCTCTTTATCATCAACGAAAATATGCGCACTTGCAACAAGCGCCCAGCTGATATTGTATGAGTTTCTGTAATAGTCCACGTTGTTTTGGGCTGTAGTGCCTTTATTGCCTGTATCGTGCGCTACAGCAAAGGCTGGTGTACCTGTTATGAGCTGTTGCCCACTGCGTCTTGTGCCAATCGGCAATAAGTCGAAATATACATCTACGCCGTTCCATTTACCTATATATTCTCTTGCCATTACTTAACGCCTCCGCCTCCGATTTTATTTACGTTTTTGCCTTCACGGTTTTTGAATGTTTCCCAAATACCAGTTGCCATTAAGCCACTAATCAAACCAGCCAATAAGCGACCACCAATAGACAATTCTGAAACTATTTCAGGAATGAAGTTTGTGACACCGCCAATAACTACACCGACAAACATACCTGCAACAGGTAGCCAATTTTTAGGTACTACATTCAATTTCTTTAACACTTGTACTAATGCTATTGTGATTACTGAAATCACACCTGCAAATGCGATAATTTGTTCCATTTATAATTCCTCCTAATTAATATAAAAAGGCCGTCACTGCTCTGTGACGACCTTACTTTTTAGTTAATTGATTATTTTGATGTGTATAAAATCGGTCTTCGAATTTATCAAAACGACTATTCAAACTATCAATCTTTGAACTAACTTCTAAGATAACCTTTGTATCTTCACGTTGTTGTTTTTGTTCTTCTTTGATATCTTTTAATGAAGCATTATGATCTTCAACCTCTGATTCTATACGTGTAATTCTATTTTCATTATCTTTTTTATCTTTACCTACTTTTGTAAACAGCCCCACTACAGTTACTGTTAGTGGTAAAACAGTAAAGATAATCCAATAAGTTAGTTCGCTTTCATTCAATATTGAACCTCCCACTTCCTATAAAATAAAACCACAAGCCTAAACCTGTGGTTGTTCTGGATATTTCTCGCCTGTTATAAACATGTATTGTGTCTTACTTATACAGTCATCATTAACATAAAAATACAAATCATCTTTATCGCACAATTTTTCTTCGTAATTGTAAGCTATCACATTAAAAAGAGTATCTTTATCTCTACTTTTCATTTTGCCTAATGTAAATCCAACAATGAAAATTATTATTTTTCTCATAAATACAACGCCCCCGTTATTGGTAATCCTCACCAGTGATTTGTTTGTATTGTTCTTTTGTTGTAACACCCAATTCAACATACGTTTTAATATCCTCGTTCGTGTAACAGTTGATATCGTAAAACCATTTAATGCTTTCAAATGATGGATACATACTAATTTCCCCCTTTCAATTTAGCAATTTCTAATAATGTGCTAGCTTGTTGTTGTTCTAACATTTGTATACGCTCATCTTTTTTTGAATTTTCAAGTATCATGTTAGAAAATTCTTTTTGAGTTACATGTAATTGTACTACTGTCTTTGTTAATTGCATTTGTGTTGATGCCAATTGCACTTCTACATTAGAAGGTGTGTATACGCCTGTATTTTCTTTATAATCTTCATTAGAGATAACTACGCCATTTACGTACATGTATTTTTTTGGTTTAAAATCTTCAAAAAACTCTGTTGGTACTAACATATCATCAATTTCTATTCCATCTTTTACGCCACCCACTTGAGCATAAGTAATGATGTATTTATCTTGTACTAATATTTCCATTAGTATACACCTACTATCTCAACGACCACAATATTATTATCATCATACATAGCTGTTGATTTTTTAACATCAAAACTGTTGTTGTGGGTTACTTTAAATTCAGTATCAGTATTAAAAATCAGCCCCATTTCAACCATCTTAGGATTATCTCCAGCAGAATCTGTCATATTGAAATCTTGTATAGGTATCTTTTTATCAGTATCAATATAAGCTGGTACCATTTTTCCTCCTCCAGAAAATCTATATCTCACTAATAAATATGAAAAGTTTTTGTAACTTTCTCCAATTGAGTAAACAGAACCTCTAGCTCGTGCATCTCCCGAAAACAACTGTTTATTTTTCTTCTTATATGTGGATGAAATAAAAGTTTTTAAATCATTATCATAAGCTGATAATGATTCAGTAAGATATTTTTCACTTAACAATTGGTCATCTTCAAAAAGTTGACCTACTTTCTTCCAACCTTTATCACTACCATCAGACTGTATTACTTTAATGAATAAAATGCCTGTATCAGTGTTTGTTATATATATGACTTTTTGATTGCTCGTATCATGAGATACATCAATAAAAGCATGGTATGCAGTATTTTCATTACCTATGTTTTTAGGTGTTCTAGCTATAGTTGTATCTGCAGGTATCGTAGTTGTGTATGCGCCAGCTGGTAAGTTAGCGACATTTTCTTTCAACTCTGTGATAACTTTTCTAGTGCCATCGCTATTAGTTAAATTATATTTTTGCCAATTATCTGTATCAGCTTTTTGAACAAATAAATTAGAATCAACTTGCTGTTTAAAATCACTTATCATACTACTAACTTCATTACTTTTATCATTTAAAATTTCTAATTGATTTTGAACGGTAGTATTAATACCATTTATTGATAACTCTTTAGAATCTTTCAATTCTAATAATGCACTGTTTTTAGTGTCGTTAAGTGATTTGATGCCATCTTCACTTGCTTTATTCACTTTAGTTACATAATCATCAATATTTTTATAAGCATCTTCAATGTTTTGTACTTTTTCTTTTAGACGATATTCAAGTTCAGAATATTTACGAATATAGAAAATTTTGTCAACTGCTGGTGTTTTATTAATAGATGCATCTTTAATTGTGAATGAAAACTCAACTTCTGTAACTGTATCTTCTTTTCGATCTACGCTAATGTAGACTTGGCCATTCACTTTTCCGGTATGATTTAAAAATCCATTTGGTATTTGGTACTCGCAAATGCCATTCAATTCATCAGTAACCCCTACATCGTCAATAACCCAACTACCATCTTCAGCAGTTAGATGAATCATTACATCTGTATTAACCTTACCGAGTGGCAATACATCATTGTTTCTTGTTACTATGAACCTTAATATCGAAGTGTTCTCATCTGTGTTGTAAAATGCGATTTTTGTATCTTGCTTTTGTTGATAGTAAGCAGATGTTTCAAGTTTGAGTTTTCCCACTTTTGTCATAGCCATTATTTAACATCCCCCTCGTATTTCACTTGATTACCATTGAGATCTCTTACTCCATAGAAATTACTATGAGGTTTATCTTTAGGGTTTAAGATAGTGATTGTTGAACCGCCAGCATCTATATTCCATACACGAACATCTATACAGTCATCGGAAATACGCACTGCATCCAGATATTTCTCATTAGCATTTCTTACCATGTTATCTGTGACAATACTATTTTTGCATTCAACCAAGTATATCCCAGCTATAATCCAAGATTGGCTGGCGTTCAAACCATATGAGAATACAGAGTTATTTGTTACCTTAATGTACATCGCTCCTAAAGAAACTCTTATCCCGTCTTGACCTGAATTATAAACTTGGTTATTAGAAACAATGGCGTGTGTTTGGGCACTTCCTGTTTCTAACTGTTTATTATTCGAAATAAAAACACCTATCGTGTCTGTGTTACTAACATTGTTATTAGAAACCATCAAATGCCATGTACCGTAACATTGAATACCCATACTACATTGTTCTACTGTATTACCATGTATTTTCACACGTCTTGCCTCTGGAACATAAATCCCAACTTGTTTAGTGTTCCGTATTGTATTGTTCGCAATATCTACTGTTTCGAACGATTCGTTTTTATATGGTATTTTTTTATTAGGATATGCAGATATGTGAATGCCTAGCTTTTCAATATTCGTAATTGTATTGCCAATAATTTTTAAATTCTCACCAGACTGTGCAGCGCCCATTTGAACACCTTCTGCATTGATTGAAGATGTGTAGCCACCTGGTGTAGGTGTTGCAAAAATACCGCCCGAACAATCTTGAATGATGTTGTTACTCACTAAAGTATTTTTAAATTTATAAACTCTCAAACCAAAATTCGTTGTTTTTTCTATAAAATTATTTTGAATAACCACATTCGAAACCCATTGGTCATAGACAGAAAAATGGTCACCAACTGCAGTAGCATAACTTGGATAGTTTCTTGAAGGACCGAAATAACAATTTTGAACTATTACGTTTTTAGATGGTGTACTATCATATGATGATCCTGGTAAATTACCAATACCAATTTCAGCTGCTAAAGATATTTGAATAGCTTCTTTTTCATTGTCGCCTGGATTCTTTTGTCCTTTAAATAAACAATGGTCTATCAAAACATCTTTACAACCATTGAGATCAATAGCATGTGTTGTGTGAACATCAAGAAATAAACATTCTTGGAATGTTACGTCTTCTGCATGGCCTAATACAATGCCGTCCATGCCTTTATCTAGTTCGCTGTTGCCGTCAAATGTTAAACCATAAAATTTAATGTTTCCGTTACCTTCATATTTGATTGGTGTTTCGCCATCAGCTAAATTGGTAAACCAACCATTACCATCGATACGTTTTAAGGTCGCCCCGTGACCATATAATGTTGTATTAGGTGGTATAACTAAATAATCATCTAAACAGTATTGCCCAGGAGGCAAAATTAATGGACCACCACCGCGCTTTTTATTCCAATCTAGCCAGTTTTGTAATCCTTCTCTTGAAGATTTGTTTTCATTAACATACACACCGTCAAAGTCGTATGCACTTCTAATTATTTTAGATTTTTCTAATTCATTACTTATTACTTCTTTACTTTCGACATGATCTAAATAATCTTCACGTAACCGTTCAGAGAGCAAGTCTTTTTTGACTCCTTTAAATGTAACTCTTGAATCACTAACTTCAGCAATACCATCACCGTTGTTTGCGATGATTATATTGTTATAAGCTCTTTTCATTCTATCTATTTCTGTTTTTACATTACTTCTCTCATAATCGATTTGAAAAGCATGGTGCGCATGTTTTTCTTCTTTTTTATGATATTCAAAATCTCGTTTAAAATATTTAAAATTATCTATTAAATACTTAAAGTTACGAATCATTTTAAATCTATAATCTTGTCCGATTTGAATAGGGAAATTTAAAAAATAATTACTCATTTAGTTCCCTCACTTTCTCTTTGGTTTACTTTTGCTTTAAGTGTTTCTATTTCTTTACCTTGTGATTTAACAAGTTCTTCAAGATCATTGATTTTAGTGTTTATTTCTACAATATTATTTGCATTATTTATTTTATCTATGTCTATAATGCACTCAGTGCTTGTCATTGGGAGGTAAATATCTCCATCAGAATCTTTTAAATATCTGTTGTTATATGTCTTACTCATCTAGTATCGTCACCCCAACAATGTCTGAATAATTTTCGGTAATAAAATAAGGCGATGCCCCTATGGACTCGCCTTTACCAATGTTACTTATTTTTTTAATATTTCTACTTAAGCGCTGTTGTATTTTAATAATGTCAGTTGGAGAGTTACTGAAATCGACTTCAACGGGTTGATTAACTAACGGATGTGATTCAGTTAATTTAACTACTTTTAAATCTAAGTCATAACCTAGAGGTCTGTGTATGAAATGAATCATATGGTTTTCATTTATATCATCATTCCTCAAGTAATGTTTTTCTTCAAAACTACCTAGATAGTTAGTTGAAACTTCAACGGTTGGTTCATCGTTTAATTCTGTTTTTAACTTTTCTTTTAACTCGTTTTCATCTAATGCATTATCATCAAACACTGTCGGTGCTTCTGAAAGACCAAAAATTTCATAGTTAGGTGATTTATATTCAGCGTATGCGTGATAAACATCTGTCCCTTTCAAAACTGCTGTTAAATTTAACACTGTTGATTTCTCTGTGCCCACATACATGCATGGTTTAGATTTCTTATAATCGACACCACTCTTTGCACCTCTAAATACTGCTTTGAATGTGTGATTACCTTTTGATAGGCGTTGAGCAATGATAATCTTTTCAGATGTTGCAGTTTTGCTATAGCATTCATATCTATCTATATGTTCATCATCTAAATAAACGTCTAACACGCCACCTTTAGCCATTTTCTTTAATGTCCATTCAAGTGTTTCGTTCCCCCACTTACAGTTAAATGTTTTCGTGTAACTAGCACCAACGCTTTCAGTACGCCAAGTACCGTCTTTGATGAATGTGCCAGAATAATTTAAGTCTTTAGGTTTCATAGGATTATAATTTTTGGTCTCAGCTTTAGTTTTCTTTTTACCGTAACCCTGTATATAGGTTTTGATTTCTGTAGTAGAAGTAGTTGCTTGCACTTCGCTAGAGTTGTATTTATATATTAATGGTAAGTCAGACATTTGATAGAAAGTTTCATCATCATAAATATGAATTTTCTTATTATCTGCAAAGTAAATATAATTGAATAACTCTGCGCCTTCTGTAAGAAATTCCAAACCATTTTTATTGCCTAATTCATCTATAGCAATTCGTTGGTTAAATGTTCCTTTAACTTCAAATGAGAAACCTAATTTATTTCCTTTAAAGCCAAAGTCTAAATATTGTTCTAACGTCATTGTAGGTTTATTTTCTTCAGTATCACTTTCATCGTTATTCATTTCCTCTTTTTCCAAATCTTTCTGGATATAATGATTTTGAAACTCCATAAATATATGTTTCGCAGTAACTTCATTTGTTACAACTGAACCATCATATTTAATAGATGTTGATTTTATAACATAATCTTGCCCTTTCCACTCTAACAACATTTCATTAATTAAAACATCGAATATATCCTCATTCTGTGTTGTTTTATATATGGTAAAACTAACAGATCGTTCATTATTTTTTTCATATTCATATTTGAAAGAGTCAAAATCAAAATCAGTTACAATCTCTCCAAAAGTACCTTTTTTATTTTTTAAAATTAAAGGTTCCACTAATTTCACCTACCTATATATAAATGGGAAAACCCATTTAGTAGTTACATTTTTTATACTCACACCAGTTATTTCTATATGATTAAATCCAGGCGCTAACGTCAACCAACCCCAATTTGTGTCTATCCCTATACGTTTTTGGTCTTTTATTGGATGGACACCACTTAAAGTTATCGTTTCACTGTATGTGATAGGTTTTTTGTATTCAAAAACATTGGTTTCTTTTCCATCTTTTAATACTTCATGAGTGGTGTGGTTGATAATTTTAAACCCTTTAGGAGCATCAATATTAACTAGTAATTTAAATTGATGTCTTAATAATGGGTTGATTGTATCTGATGAACCATTGTAAATTTTAAAAGCTGTTGTCTCGTGTGTGTATTTAATTTCATCATCTGATAAAACGCCTGCTTCAAATTGCCAATCACCACTTGATAAACTAAATTGACTTGTGTCTTTTAATGATTCTGAATAACCTTTGAAAACAACGAAAGTGACTTCGAAAGTAGCAAATGAATTAGTTAAATCATCATTATCATTGCTATCACAATATACTGCATATTTTTTACCAGGCGCATCACTATGCCACACATAATATGGTTCACGTTGGTATAAGATGTTTCTTATTTTCTGTTTATACAATTTCAAATCTTTAGTATCTAACCCTTTAAATGAAAAGTTTAAAACCAAATTAAAAGGACCGAACGTAGTCGGCCCCATTAGTACACCATCAGTACCATTAATTTCAGTTGTATTTGCGTTAACTTCCACGTCTTCTTCTATGTGATCTAAGAATAATAAATTAGGTGTATCGGTTAACTTAATATCAAAGTTATCATTAAATAACCTTACTTCTTTTTTCAAATTAGAAAGCACCTCCCATGTTGTATGCCATCATTTGCGCTCTTTTACCTTGTGCCTTACTCATATCTTGCTCGCTCACACCTGTAGGTTTCTGTTCTAAACGTTGGTTACTAGCCACAAGTTGTGTTAGCAATTCAACTTGTCTTTGCGTAGCTTCTAACTGTCTAGCCATAACATTTATCATTTCGTTGTCGTTATTGTTGTTAGTAGAAGGTGTACGCATTTGATTAGGGCGTTTGTTTTTCTTGTTACCTTCTATTCTTTGTGTAGCAATAGCGAGTAACTTCATTGCATCAGATTGTCTGCTTGGGTCTGTAGGTATTACAAACTCTGGGTATCCTTCTTCAGCTAAGTTATATAATCCGGATGAATTAATTAAGCCTCCTGTAGCGTATGGTAGACCATGCCCAATTTGGCTCAACATACCACTTTTACCGTATCTAGCTTTTGCATATCGCATACCTGCTATTAAGTTATCTAATGGATTCCAAATATTGCCATGACCAGGTAATTTATATTGATTGAACGTTCCTGGTTTAACTTGTACCAATCCAGACGCACCACTAGGGTTTTTAGCTTTTGGATTAAATGTAGACTCTGTCTTAGCTTGACTTTGCCATGCTTTAATGTATTTGCTAGTTTGTGGTAATCCGGCCATACCTAAAGCTTTTTTAATTGCGCTGCCGTACTTGCCACCAGATTTACCTTCACCGTTGTTTTTCTTCAACCATTTTAACGGGTCAATTGGAACTCCGTTTTTCTGCACCTCAAAGTGTAAGTGAGGTCCGGAAGATTTACCTGAGTTACCAGATACACCTAAGTAATCACCAGGTTTAACATTCTTACTACCACTAAATGCATGCTTACTCATGTGACCATAAATAACTTTAGTAGCTCCTTTTACAATATCAACCATGTTACCAAAACCACCGTTCCAACCTTTACGAGCCGTGGCTTTACCAGCTAGAACAGAATATAGTTTGTCGTAAATATAGTTAATATCCACACCCATGTGAGGGCCTGCAAATGGATATCCTGGAGCTTTACCGTTAGGACTGAATGGGAAGTTAATACCTTTAGAAAGGTCGATGTAACCTCCATCACCTTCTGCTGCGTCTGACATCCAAGAAGTAAATGTATCGATTGCAGCTTTTTTAAGTTTAGAGAACATACCTTTCATCATGTCAAATGGTAATTCTGCTGCTTTAGATATACCGAAACCGTCTAAATTTAAGCCAATACCTTCAAGTACTTTATCCAGTAATTTACCCGGCTTATCTATCCACTCCATAACGTCGCCGATTTTATCTTCCATCCACTTTTTACCTTTAACTGCTGTTTCAAGCGTTTTGTTTACAACAGCTTTACCGCCGTCGACAACTTTACCAGTAGCTACTTTTGCTCCTGCTTTAACTCCAGTTGCCACATCACCAAAGAAGTTATCACCTTTCTTTTTCTTCTTAGGTTTTTTGTTTGAAAGTGTACCACTAGCAAACTTAGGCATATTATTTAACATAGAATGTGTCTGCGCGCCATTCATAACAGATGATCCTTTAGGTAGGAACGCTGTTGTATCTTTGTTAGGTGTAAGTGCCATTTTGCCGTTAGGATATTTAATAGCTTCGTGTCTGAAACCACCAGGACCATTTCCACGTCCTTTATCTCCCACAGTAGCGAATGTATCACGATTAATTTTACCGTTTGTTACAACGTTTTGAGTAGTAGTGTGTTCTGTTCCAGTGTGGAGTTTGACTTTAGGAAGTTTATCCATACCAAGTTTTCCACCAACCCAGTTCACACCATCGATAAGTTTGTTTAAACCTTTTTTAACTTTGTCTACCATATCATCGATAAAGCCTTTAATTTTACCGATAATATCTTCAAGCACATCTCGCATTTTTCCAAATGTTCCAGTTACTTTGTCTTTCAAGGAAGTTGCAACATCTGTTACTTTGTTCCAAATTTTATCCCAAGTATCGTATAGGTTATTTTTTACTTTTCCTATAATTGACTTAATAGAATTTTTCAGATTGTTAAACTTATCTTTCACACCGTTCCATAATGATGTGGCAATTGAAACAACTTTATTTCTAACTTTATTCCAAATATCGTATAAGAAATTACGTACACTATTGAAAATTGATGTGATAGAATTCTTTAACGAATTGAATCTGTTACGAACACCATTGTATAAAGATACTGCAAGTGAAATAACTTTACTTCTTATCGACAACCACACTTTGAATAAGAAGTTCTTAACAATACCAAATATAATAGTTATAGAATTCTTTAACGAATTGAATCTAGATTTCACACCAGACCATAACGATGTGGCAAAACCCACTACTTTATCTTTAATCCAGTTCCAAACATTAATAGCAAATGCTTTAACGGAATTAAAAATTGATACTGTACTATTTTTTAACCAAGTAAAAGCGTTCTTAACACCGGTCCAAATACCTTTTGCTAATCCAACTATCGTATTTTTAATTACGCCCCAAATTGTCTTAGCTATACCTAAAATTCCAGCAAACGCTAATTGGAAAAGGTTTTTCAAAATACTTAGGAAACTTGTAGCAACTTGTTTCAATCCTTCACCAAATAGTTTCCAGTCACCTGTGAAAATACCAATGAACATTTTAACGAATCCCATTACTACATTTAACACGCCCATGATAATTCCTTTAATCGCATTAAACGCAATCATCACAGTATTTTTAACAATGTTAAATGCATGAACCAGACTACCCATAAGTAAATCTTTAAAGAAATTTATTATTGGTATAGAATCGCTAAACGTGCTCTTGAATAATCCACCAATGTAACCTAGTACTGGTGAAATGAAACTCCAGAATGCAAGGAAACCATTTTTAATATTCGTTATAGCTTGCATGAACTGTGCGCCGTACTTACTCCAAAAATCCCCGATAGCTGATTTAATTTGTCCGCCAAATTTCATAAATGCTTGACCGATAGGAGTTAATATTGTCATAATTCCTGACCACAGTAATTTAGCGCCATTTACTATACCAGTAAACGCACCATTCACAATATTTCTGAATGTTTCTGATTTTTTATATGCAATAACTAATGCAGTTCCTAATGCAACAACCCCTGCAATAATTAATCCTACTGGTCCAGTGGCAAAGGTAATAGCAGTACCTAATTTAGGAAATACTTGTGTTAAACCGCCAAGTATACTGCCCGCTTCTTTTGATGCAAACGCAACTTTTGCAATATTTCCGGTTAATTGTCCGAATGTTGTAAACATACCGCCTGTTACAGTAGCTAATTTGCCGAATATAGTAAGTAACGGCCCTATTGCAACTAAAGTTATCGCTAACCATTTAGCTATACTACCAAAAACTTTTTGTGTAGATCCGTCCAAACTATTCCACCAATTTATAACTGACTTAATGCCATTACCTATTGTAGTGAAAGCATTACCCAGTTTTTCACCTGTTTCTTTTGCCCACTGTTGAGCACCAGGAGATTTAAGTAACTTTTCAAATTCATGTAATGACCCTTTGGCTTGTTCAAATACTCCGCCTAGTAAACTTTCTCCTATTTGGCCAATATAAGCTTTGGTATTTTGTAGCATACCTTGCCAAGATTTAGAATAAGCTTTGGCCATTCCACCAGCGAAATCATCCATTACAGTTAAGAAGTCTTTTGAAGTAACTTCACCATTGGTAACCATTTCTCTAAACGCATCGTAAGAAACACCAAGGTGTTCTGCCATAGCATTACTAAAACCTGGCATACCTTCTTCAATCATATTCAGTTCTTGGGTCATGAGCTTACCTTGACCTTGTACACGGTTAAATATCATTGCCATATCAGATACTGGTCTATTACTCCCAACTGCAGCATCACCAACAAGTTTGATATATTTCTCTAACTCTTTGCCTTCTTTGACCCCTGCTGCTAAAGCACCTGCTGCAACATCAGTACCTTCTGCCATTGTAGTCATACCACCTTCAATAGCTTTCGCTACCTGATCAGTGATTGAGCCTACTTCTTTTGTAGAATAACCTAGTCCTTCAAGTTTAGCTTTAGCACTGTCTAGTCCTACTAATCTATCAAACCCTAATTTAGCCGTGATACCAGCCATAGCAGTACCAGCAATCAATGCAGGCTTAGTAATACTATTAGAGAGAGAACGCTCCATGTCTTGTGCTTTTTGTCCTACGCCTTGCAATCCAGAACCAATAGAACTAAATGAATTACTTAATTTACCCAACATTGAGAAGTTTTGTTGGTATTCTTTTGTGACGCTACTCAATTGACTTTTGTACATATTAAAAGCGTTAGTTTCTTTGTTAATCTGATTTGCTAAATCTAAGGCAGCTTTAGATCCTGCACCTTGTTCTGCAGATACTTCTGAATGCCTTCTTTTTAGCTGCTCTAAATGTTTAGAACTGCCATCTACAGCTGTCTGTAGTTCACTCATACGGTCTTTATAGGCTGCAGCAGATTTATTGCCATATTTAAAGTTATTATTAGATACCTTCATACTGCTATCTAAAGCTCTAAACTCTCGTTTAACGTTTGATAGTTTTTTACTAACATCCATATCATTAAGACTTAAATCTATCTGCAGCCCTTTTATTCTTTCTGCCATTACTCCACCTCCTTACTTGTGAGATGTATTACATGAACGCATTAATCATGCTGTCCGTTTTCTTGACGTTTTTCTTATTACTTTCGTCAACTAATTCCATGAAGAAAGCAAAGGGCATATCTAAAATGTCATTAATATCCTTGCCCCCATCTTTCATCATTTGTAGCATGAGTTTCTTCATGTTTTCTTTATGTTCTTTATAAGATAGAGATTTTAAATTATTCTCGCTAGTTCCTTTTTTCTTTCTTCGTCCATTTGTCCTTGTGCGATAAATTCGATTTGCCCTTGCAATTCTTCTACTGCATCTGGTGCGTGAAGTCTGTCTAGTAAGTCATCTTTAGTAAATTGGTTATTGTAAATATCAACCACCATATCTAACATTTGGTCGATATTTTCTTGCGCAGAAGTATTTTCATCTGATGCGCCGTCCATTAAATCAGCAGCGTCGTAAATTTTACGGAATGGAATTTGAGTAGGTGTGATATATGTGTCAAATTTTGCGTTACCTTCTGTATCTGTTACTGCGTTACCTTTTTTGTCGATTTGAATTAATTTAATAAAATTACGTTTAGCCATTTATAATTACTCCTTTAAATTTAATTTTTATTTGTTATTAATAGGTATGATGAATTATTGTTGCTCATTTTCAGCTATAGCATGTAAACCAGTTGTATATATTACTCCCTCAAGAAGTTCTGTTTTACTGGGATGCGTATAACATTCTGTAATTTGTGGATATCCTTCTTCAGCATCGTCTGTATATTGAACGCTAAATGCTATGCCATAAGGTTTATCTAGATCTTTCGTATTCCACTCAAAGTTAATTCTCTGTTTTAATGGGATTTTTTTACCTTGATAAATCACGGTTGGTACAGAATTAATATCCTTCTGAGTGATGACTAACAAATCAGTTTCTTTTTTCTTCTTTTTGAAAAAGTCGATTAATTTTTTCATAGCTAGTCTCCTTTAATTTTTATTTGCAAATAAAAAGAGGGCATAAAGCCCTCGTTAATAGTTATTCTTCTATTTCTTTAATTAACACCATGCCACGTTTATTATCACTTGTAGTAAGGTCTAATATGCGGTCATGAGTTATCTTTTTGTTTGCTGGTTTAGGATAAGTATCGCCAGCATTATAAACTTTGTTCTTATCTTCTAAATCAATGAATTTGTGTAATACTTCATATTTTTTCTTAGCCATAATCAAACCTCCTGTATGTTATGCGCCTAGTTCTTCTTCTGGTGTACTTGTTCCTTCATCTGAATTACTACTTTCTGCAGATTCACCAAAGATAGCTTCCCAAATAGCATCTTTCATAACTGATGTTCCTTTGGCATCATGCCCCATTAACATAGCTTTTTCTTCTTCAAATCCTTTAACTGGTGCTTGCATGAATTCTGCAGTAGTAGAGTCTGAACTGAATTCAACGCCATCTTCTTTAGTGTTACCTTCGACCTCTGGGAATGTGAATAAACCTTTTGGTAACCCAACATATTCACGAGAACCATCTTCCATAGTTTTAGCAAACATAACAGCCACATATGGTGGCGTATCGTTACCCACAGATACAATGCCATCTTCTGATTTTTCTAAGCCAAATAAAGCTACTCTATCTTCTAATGGAAGTTTATGGAAACCAGCTTCTACTTCAATTGTTCCGTTAGCAACCGCCATTTCTGCTACTTGGTTATCACCGTATGCTTTTTCAATTTCTTGGTCTTTTGATACTGAAATCTCTTGTAAATATTTAATACGTTCTGGGTCAGTAACTTGTTGTACATCTTCACCATGCACTTTGTAATAAAATTCTGTTAAACCTGTAAATGAACGGTAGTTTTTCTCTGCCATATTAAAACACTCCTATAATTTGAAATATTGTTTACCTTCAAACCTTTTTGCTTGTCGGTATATGTTGAAATCTTTGATATATTCGGGTTTCATTGAGGACGTTTCGCCGAACCCCAATTTTTCCCACATCATTCTTTGCAATAAAAAAACGAGCCTATCTGATAGGACTCGTCCGTTTACGCCTTGCTTTTGTTTTACAAATACATCTATTTGATAAAAATATTCGTAAGTTAAATTGTCATTATCTGCAAAATCAGAAGGTGTAGGTGTGTCTAATGGATCTATAACAATCACTACATCTTTGATTTCTTGTGCGTTTGGATAATCGAAAAATTTAATGTTGTTCTTAGGAACATGTTCCATAATTTCTTTATTATCTATAATCGCTTCATATATCTTCATTGTGATGTCATCCATTTACACCCTCCTAGCTAATTCTGATTTAACTGTGGCAAAATAAGTTTCCCTACCTTTTCTCATCGCGTTTTCTATAACACCCTTACCAGCAGTGTTGACCCACTTACCAGAACGGTCAAAATGACCATATTCGTTAAGGTGTATGATTCGGTAACGTTCACCAGGAACATTACTGTTCCAGTGAATTTTCACTTCACGAACACCACCCACAGTTTCGGGTTTGGATACAGTTGTTGATTTGAAAGACTTACCAGTGCCTGCAAATGAACGCATATCTCTAGCAATAATAGATGCAACCACGCCTCCGCCTTTTGTTAAGGCGTAATCAGTAATTTTTTGCATCTTACGTTTTCCAAGTCTACGTTCAAGTTCACTCTGTAATTCCTTTGCGCCGCGTAATGTTGCCTTCATTGTTCTTCACCCACCACTTTTACGTAATTAGGCGTCTTAGCAGGCGCCACATTTTTGACATTAAAAAACAACCCTGCATAAATACCATTTTGTATTTCAAACGTTTGATTTACGTTAGGTATAAATTGAGGTTGTGCATTTCTAATATTTAATGTGACTGACCTTTTGCTAAGCTCTAAATTGCCTAATTGAACATCTTTTTGAGTAGGTTCATATAGTCCACTGAAACAACTATATATAGGTTGAAAACCACCCATACCAGCTTCTGGACCATCATTAGTGTTCTCGTAAAACGTAACTCTGTAATCTAATTGGTTAAGATTCATCGGCTATCACCTCGATGTTATCTCTACGCCATTTAGCAAGATCACTACGTAATGTTTGCACTAATTTTATTGAAGATGCTGGTATATCGAAACTTTGCTCATTAGAAGTAATAGAACGGTTATCATTGTGATGAGCAATGATATTCAATACTGCTAAATTAAACGTTGGATTATCCTTATAAAAAGGCTCGTCCTCATTATTTAAAGAAACAGCCGTTTTCACTTCATTAATAGCGCCAGGCAAATAAACTTCCATAATTAAGTCATCGTCAAAATCATGGTCAACGCGTATTGCTTTCTTGATGGATTCAACGTTATCCAATTTGAACATTGAAATCACCTACTTTTCTTATGCGCCTAAATCGCCATCTGGCTCTTGTGCTGAATCTTCAAATGTTACGAAGAAACCAGCGTTTTTATCTGCTTGTTTAACATCGAAACGGAAAGCGCCCATCAAGTATTTACCATAGATTTCGTTTTCAATCCATTGAACTGATACGTCTGTACGGTCAGCAAATAGAACACCACGTTTGATATCACCAATAAACGCTTTAGCATCACCATTAGTACCTAATAAGTCATCACGCACAACCGTTACGTTCATGCCCAATACTGTGTTTCCTGCAGTATTAATAATGCTATCTTGTAATAAATAACGACCGTTACCATCTTTCAAAGTATCTAATTTTTGGTAGAAACTTTGTGTACAGATGATTTGACGGTCGTAACCTGGGTCTAATTTAACGTTAATGATTGCTTTTAAGTCATCCACATCAGAGATTGATGTAGGGTTAAATGCTTGTAACACTGCTCCAATTCTTTCATTTAAAGTATTAATTTTTTGTTCGTTAATATTTTCAGACACAATAGCAGTTAAGTTAACAACTGAATCGTCTAACGCTTCTTGTGAGATTGGAATAGATCCACGGTAAGTGTCTACTTCCCATGCAATCGTTTCGAATTCCGGACGCGCTAATTCTGGGTTTTTCTCTAGCTCAGCAACAGTATTGAACTTAGCATTAGCACGTTTTAAGATTGGGTATTTACCACTTGCAGTTGATACTGATGTTTTTTGTACTAATTCTGATAAGTCTTGTACTGTCTTAACTTCTTTCTCAGGAATATATTTAATATCCTCTGGAATTGTTACGCCAACATCATCAGACTTAACATTGTCACGTTTTGCTCCTTTAGATTTCATGTACTGTTCGAAACCTAAGATTTCCTCGTTTGTTTCTTGATTTTGATTTAATTTCGCCATAGAACGTTTCGCTCCTTCTTTTTTCTTTTTGTCTTTTTCTTCTTCCAACTCTTCTTCCGTAGGTTCTTCTACTTTCTCGATAGCTGGTGTTTCATCTTTCGCCTTATCATCAGACGATGGTTTATCATCCTCTGTGTCTAGCTTTTCTTCTTTGTCATCGGTTGGTTTATCCTCTGACTTGTCTTTCTCGGGTTCCTCTGTCTTGTTGTCCGTTTCTTCTGCACCTTCATCTTTAGGTGGTACAGCTTCTTCTTCTGGTGCTGATGCTTCGATTTCTTCAGAAAGTTGTTCAAGTTCTTCATATTCTTTTTTCTGTGCATCGATATCAGCTTTTAAATTACGAGCAGTTTCAAGGTCGCCCTTTTCGACTGCTTCTTGCGCTTTAGAAATCAAATTAGAGATTTCTTTTTTGCGCTCGTCTAAATTAGCCATGTGTATGCCTCCTTATTAAATTTGGGTATAAAAAATAGCCTTACGTTTTAAAACGTAGGCCGTCCAATTCAATCGCTATTTTCAATTTTTCTAACTCTTTAACTTGTGTTAGGTCTTGTGAACGTTGAGCAACTAACACGCCAGTATCTTTATAAGCAGGTGTGGTGACGATGCTTACATCAATTAACTTTTCAAACTTTTCAACATTCATGACGTAATCTCCATCTTCAACAGTCCAATAAAATCCAGTTGTTTTACCATTGTTATCTTTTAAATACCAAGCGTGAAAACTACATTCATTAACGTTTCCCACATCAATATTTTCGTATATATCCTTTGCGTAAGATGTTTGTGGCAGCCAACATTTAAATTTTAATCCTTTGTCGTCCACAGATAGTTCAAGCGTTCCAGCTTGTGTCCTACCAATAACATATCTATCTTCATGATTGATTAAACACTTAACGTCATCTATGTCCACATCGTCTAAAGCATTAGGTAAAACTCTTTCTTTAAACCCGCCTAAATCATTACTCAGTGTATTAAAAGTTAAAGCATAACCTTCAATAACCATATCCTGTGTAGTCTCAACGTTACTATTTGTCATATTCATCACCCCTTTCAACTGTGTTTTTTTCAACTTCTTTTTCTATCTTAGATTCTTGATAGCTTTGTAAAGTTGAAAGTGGCGCTCTGTTAAGGTCAACAAGTGGCTGTTCACCATATTCAATAGGTTGATAACCAAATATACTTCTTGCTTCATCTGTTGATATAATTCCTTTACCATGCAATTCTGTAATACGTTGCAATTGTAGTTCTGGGTCAATATCAATGAGACGAGAAGAATCAAATTCCAATTCATAACCAGAATCAATGAATTTGAATATCTTAGTTTCGAGTTCTGCAATCATCATTTTAAATATTGGATCTAATGTACTTTGCAGATATTCGAGATTAGCTTGTGTAATGGATGTATTAACCGTTTCTATACCTAATTTAGATACTGGTAATCCAAATGCTTTAGCGACTTGTGATGTGCTGAACTTATAACTATTTAAGAAATTTAATACCTCAGTCGGTATTTGTAACCGTTTAAAGTCCATCGTGTCATCTATAGCAACTAGTCCACCATTATTTTTTAATTGGCTGTTCGCAAAATCTTGTTTTAAATCTCTTAACTGTTCGGCATTGATGTGACCTTTTTTATACTGCAATACAGAAGTTGACGTACCACCATTGTCAAAGAAATTCCGTAAGAAACTTTTTGAACCTTGTGATATACCAATCTCATGTGCTAATGCATACAATGGGCTGTAACCTACATATCCATCTAACGTGATGTATCTAAAATGCAGTATATCCTCACTAGTAATTTTTACTGCATTACCTTCTACATCCTCACTGACGTTATAAATAACTTCCCCATCCTTTTCCTCAATCCCTACTAAATCGTTATGTAAGAAATGGAAACCAACAGGGAAATCATTTTTATCACGTACAATCTCAACGAACGATTGACCGTTGAGTAACATGTTCGCAATGATAATGAATTTGAAGTGCCAACCTGGTAAATCTGAATGTGGGTTATTATTGAACAAATCCAACACATCGTTCATTACCATGTTTGACTCATGACCCTTAACTTTTAATTTTGTACTAGCAATATCCGCTGAAATAATACGTGTCGCAGTGAACACATCACTGTTACGCAAAGCATTAATTCCAGTGTAACTAGCATGTGTTCCATGTTCTTGCCAATACAGTAACCGTTCTAAATCTTTATTCATTTTGTCTTGTTTACTTGTAAATCCTAAATCAAGTAATGGCATTTTTAATTTTCACCCCTTTCTGAGGTGTTATCGTACGCTTGATTTAACACTCCAGTTAAACCAATTAAAAATAAACCACCAACAATAAATGCTAATGGTTTCCAAAATATAAATAATCCATAGAATATACTGGTTATTCCGACTATAAATAATATAATCAATAATAATGCGTATAAGATTTTTTTCATTGCAACACCTCCCTATAAGAACATTGGCATAAACGTTTCTGTATCCCATTCATGTTCACTAGCTATTACATAAGCGAATATTGTAGCCATGAGTGGGTCAATTTTATGTCTATTCATTTTCTTTTCAATCATTATTGAGTCATTCACATTCTTAGCAATAGCATTTTTAACTGCTGTATCTAATAATGGGTTTTTATGATGTTTAACATCACCATTAATTACATTTAATCTGAAATCTAAGTTAGGATTAGATAATGTTTGCGGACCCTGTCTTATTTCATATAAGTCATAAAACCATTCTCTACGTTCAATCTCTGCTAACACACCGTGTATAGAATAAGGGTCGTAACAAATGGCTTGAACATCTAAATTGTGTCTATTCACATAATTTTCAATGTAATCTAAGACTTGGTCTGTATTTATAATCCCGCTAGACAAGTTTGTGATAGTACAATAGCCATCATTTGCTAACTGATGATAATCTATAAGGTCTCGCTCAATCTTTCCTTGTAACCCTCCTTTAGTGCCCACAAAGGAGTGAGAGGTTATATAATATTGTTTGTTAGTTTCATCTAGGTGTATAAAGGATATTGCTGTTAAATCATCTGCGCGAGATAAGTCTAAGCCGATATAAACTTTTGAATTATTAATGTCGAAGTCAGTTTCGTTTTTCTTCCAATCATTGAAATCAAGGTAAGATTCTTCACTAGCTTGCATCCAATAATTGAAGTTTTTCACTAACACTCTGAACATTGTATTTTTCTTAGTAGCTTCTGCTACACGCTTTTCAAGAAAATCTTCTATTTGTTCTTTCAATTCATCTGTTTCATTAATCAATGGATTAGATTTGGCCCAAGTTGACTTATCTTGCCATTCATCTTCTGAATCTTGTTCATAGATCACTGCGAAATATTCATCATCCGTATATACTTCTGCTAATATATCTTTTGCATATGGCCATTCATCTGTATACATAGGTGCGTTAAGATTAAAACCTGCTGTTGAGATAATAAAGATTAAACTTTGTAATAAGTTACCTTGACCAGACTGTATAAGTTCTAGCATTTCATTTGTTTTTGCTGCATGATATTCATCTATTACTGCTAAGAATGGTTCGAATCCGTCCACTGCTCCAGTATCACGAGAGAGAGGCATTACATATGAATCATCTTTAGTGTTTTGCAACAACTCGCGCACTTTCTTAACATCTTTTTTTAGTTCTGGTACCTTAGATACAAAGTACATCAATTGTTTAGCAACCATATTAAATACAATACTTGCTTGTTTTTTATCATTAGCTGCAGCAAACATTTGTCGTCCTTCTTTAGGTTCTTTATCAAATAGGAAAGCGTATAATACCAAACCACTTACCAATAAAGATTTACCAGACTTTCTTGATACAGAGATAAAAGCTTTTCTAAAACGCAACATGTCATTGTCTTTGGTAAACCAACCACGCACGCTAGCGATGATGAATTTTTGGAACAATCCAAGTTTATTTATATTACCTTTTGTATCGGGCAGTGCTTCAATGAATTTAATAACCTTTTTAGCGCGTTTAGGTTTGTAAGTATAATTCCATTCATCATTGTTTATTGACCGTTCTATGTCCTTTAAATGACGAATACAAGCCAATCTAGTATCCTTACACGTAACATAAGCTCCAGACAAGACCATGACACAATATTTATAAGCGTCATCTCTGTATTCGTTAGGTATATCTAATAACGTTTCATATGCTTTAGGTATTTTTACGCTAGTCATCGTCATCAACACCAAATTCATCGTACACAGATTGTTTAACTTCACTTTCAGTAGGTACAACCAACCTCATACGTGAATCGATTGTCATTCCTAATTGCCCACAAATAGAACGTAACTCTTTCAACGACTCCATATAAGCCATGAAGGCGCCTGTTTTACGATTAGTTTCCGGGTTAACCATACCTTCAATACCATTTTTCTCGCTTATTGAGCGATATAAAGTATCGTTCTGATCTAATACTTCACAATATTTCTTGATAAGCGAATAATCTAATTCGGCTATTGGCAATTGTTCAAGTAATGGTACTACCCTTAACCACTCTTTAGCAGCATTTTCAGTTAAACCATCAGGCACAGTTTCAACATTTATTTTTGTGAACTGTTGTAAGCCGTTTTCTTTAAGTTCTGATTGTTCTAATTCTTCTTTTGTTCTATTTCCTAGCTTATTTGCATTTAATTTCGGTTTTCTTCCTGCCATATCAGCACCTCCAGACGTTATATGACTTTGTGAAAGTTTTCATTTTGGGAATTTGGTCACAGAAAGGGGCGGCTCGTTGTTTGCCGTTACCAGAGTGACGGGGGTTTTCTTTCTCCCCCAAAAATATTTTTGAAAAATTAAAAATAAAATAAAAAAATTAATTAGAATGAATTTTGTTGTGGCATGAAATACACACCGCCTCTAAATTTTCCATATCCAGTCTTTTTGACCAGTCGTCTTTTAACTCCACGATGTGATGGACAATTAAATCCTTGTCATTCACAACACCTCCAGCTAAACAGTGTTGACACAAATAGTTATCACGTATTAACACTTGCACACGTAACTTACGCCACAATGTACTGTTGTAGAACGCTGTATACTCCTTATTACGTCTGTTCTGCCTAACCTGTTGGTTATACCTTTTGGTATTGCCTTTCCTATACCTTTGCAACTCGGTTTGAGTATAGTTCTTGTTGCCAAGTCGAACCTTTGGTTGAACAAACAAATGAATCAACTTCTTTCATTTGAATTTAATATTTAAAATTAATAATTATTTAAATTAGTTTTAAAAATAAAAAAAGAAAAGACAAAACAAAATCTAAAATAAAATTAAGAAATCATTTTGTCTTTCACTTTAGAAAATGTTTCATCAATCAAATGCAAATTAATCAATTAAGTTTATGATCAATAAAACATTTCTTTATTATTCAATTGTTAAAACAACAAACAAACTTTACTTTGATTTATTATTTAATGTTTCAATTAATCTTTTAAACTAACGAAACCTTTTAATGTAAATGAATGTTCATTGTTCTGTCTGTCATACACTCAATGGATAAGTGCTGACCTTAAACTGCATGACCTTAAATAGTGTGACCTTAACAACCCACCTTAATAAGTAGTGTCCTTTAATATGTGTGTCCTTATTGCATGGGTCATTAATGAATAGGCGCATACAAAAAGACACGCTACAAAAGTAACGTGCCTCATATAATATAGTACTAGGTTTCACACACCTACATTATTAATAGCTCTACCTCTAAAGCTACTATCCATTTTACCTATGATATAATATTAACCCATTGACAAGGCGCAATTCACTAATGTGGTAATTGCGGTTAGTCGAAATGTATCCATCCTATTCTTTCTGCAGTATCTCTCATTATTTGATTGCGCATTCTAATAGCAGAATGTTGGCTGATGACCTTATCATCTTCTCTACGTTTAGTTAACTCATGAGCTATATCTTCCCACTCATATATAAGCAGATCTTTCTCCCAATATCTATATTCGATAATCGCCTTCTGTTCTGGTGTAGCTCTGTTGTATACGTCTTCCACAGCTTGTATGGTTGATTGTAAGTTACGATACTTATCATCTTTATGTAGCTTGATGACTTCACTCTCTACTGGACTGCTAGGCAAATTAGACTTGCCACCACCTACATTTGTATCTTCTGGCTGGTATAACAGTTCATATCTTCTATATGCTAACTGTCCTTTCATCTCATCATACTTGCGATAAAACTGTTCTAATTTTGGAATATCTTCTTTACCTAAATTCATATGCTACCTCCAGTTACTTCATACGTTTATTAAACTCATCTTTAATCTTCCGTAAATCTTCATCGCTCAATTCTCTCTTAGGCAAATCCTTTTCAAATATCGTGAACAGTAGATAGGCTACTTCATACTCCAATGCATCTATCTTCATATCTTTAGCTGTGTTTAATATAAGCGAAACAATTGCTATACCTCCTAATACGATTGTTGCTATTATCCAGAACATTACTCATCCTCCTTTTAACCAAACGGTGTTTCTTCTACTTTTATAATTTCCATAGCTTGTTCATCTGTGAAGCCTTGTCTCTTTAAATTTGTATATCTTTCTCTTTGATATTCAGACTTCATTCTTGCTATTTCCATTATTATAGGTAATTGTGATTTCATTTCGTATAACTGATTCTGTACATTTATATTCTCTTTCTTTGAACCATCTACATTGAATACGTTATCCATCCTATACTCCTCCTTATAAGCGCGCCATTATATCTACATAATCCCTCGGTACATCCACCATATCGTTTGCTTGTTTCCTAACAATGATCTCGTACGTGATTGCTTTACTTAGTTCGTATAAGAATATAATTAATAATGGTTTGAGTATGTGTTTCATTCGTCGTCCTCCTCATTAACCATTGAAGAAAGTGAAACAGTTATTCTAATCATTTGTCTTATTTGGTCGTCCGTAAACTGTTGTGCTCTTTCATTATAATGTTCACTGTTTTCATCTCTCATATTTGTAATCACTTCATTTTCTAACTCTTGTATTTCCTCTTCTGACATCTCACTTAGATTTTTCATACCTTGCAACGCTTCGTTTGAAAATAAATTCATTCGTCATCCTCCTATAAGAATAATATTTTTATTTGCATATACAATTGAGACATAACACCTATTATTATCATCGTATATCCCAACACTTTCGTTTCTTTTGTAAGTCTGCTGCCGAATAAATCATTTACGATTAACCAAGCTATAAAAACCGCCATTAATAATATGCTATTGATTAGCATTCGTCGTCCTCCTTGAATTCCCATTTACTTATAACTTCTCCACATGTATTACATTTATATTCAGCTGATTTAGGATAATCAATACAATCCTCTATATAAACTGCACGTCTTGTACGATCATATTCATATTCTGTATTTATTTTTAAATTATCACTATGACATTGTGAGCATCTTCCATGCTTACTTTCATATAAACGTTTCCAATCGTTGTACTGTTTCCAACGGTTTTGCTTTTGTTCTTTTTTATGCTTATCGACAAGTGGTCTAATATATTTCACTTCGTCTTTTAATTTGTCGATTTCATCATTTAATATACGTGCTTCTCTTTGAGTTATAGGTATATCTGATAAAAATCCATTTTTCGATTGTTGGTATCTTCTTTCACTAAAAAATATCGCTACAGAATTACCAATAGTTGCTAATGCTACTAATATTATTGCTATGCTTGTTGTCATATTCACTCACTGTCCTTTCTAGGTGGTATAGCTTTATTTCTATTTGGTACCGGTTTACTTATAGACCGATAATTATTAAAACTAGATGGTACTACTTCCAATAATCCTTTAGGTTTCTTAACTTTTTCTTTCGCCTCTTCCTTATTCTTTGCATCCACTACAACAAATTCTTCATTCTCCTTAGCCTTAGTTGCATCCAGGAACACTTCATCTGTTGTGTGGTGTATTTTGCGTACTAGGTATTGGGTCATTTATTTCAATCTCCAATAATATTTAATTAAGATATATGTGCGTTTTAAATTTGTTTTCACGTTTCTTATAAGCCAAGGTTTTATAGGTAATACATTCATGTTCAGATTCATTGCGTAAGTCATTTTGCCTTCTTCGTTTTGGTTATTATTTATATTCAATCCGTACTTAGTAATAATTAGATCATTTTGAAAATTAATTACTAATTCCTGTTTATTTGTTCTTATTCTAGACATCCACACTCACTCCTTACCTAAGATTATTCGTACACGTTCAACGATGTCTTTAGATTCCTGTACTTCCGAATCCTTTTTCTCCTCTTGCTGATTCATTACTAAACTCCTTAACTGTCTCTAACTCTGGTGTCCATATTGGTACGACAACCAATTGTGCTAGTCGTTCGCCTTTGTTAATTTTGTATGTTTTAGCTAATAAATCATAATTTGATAACTCTAATGGTTTATCATCTATGCCTGAAAAATAAGGTATCGTTTCATTTGTTAATTCCATATCATTCTTAATATTAATCTTCATATGGCCTTGAAACCCTGCGTCAATCTTCCCTGTCTCAACTACAAGGTGTGTTTTACTACTCACACCACTTCTGCTTGTCAGTAATCCTACATAACCTTTAGGAATATTCACTGCTAGATCAGTAGCAATTTTAGCTTTCTGTTGTGGTTCAAGTATTATTGTTTCTGCTGCATATATGTCATAACCAGCGCTTTCATCATCTACTCGTTTAGGTTTAGTTGCGTTATTGCTTAGTAGTTTGATTTCTAGTTTAGTCATTTTGTTTGTCCTCACTTTCTAATTCTTTAATACGTTGTTTTAGCTTTATAATTTCTAAATCTTTTTCAATTGATTGTTTAGGACTGAAAATTAATTCTTCATCTTCAAAGTAGGCATTAGCTAAAACATAAGGTGTTAATAATCTATTTTCTTCTACGTATTCTTTATTAATTAATACAGGGTAACTAATTTTAGTAACTTCTATCTTTTCTACTTTTATATCAAGGTTGTTAAGCTCTTCTTCAAATTTTTTACCTTGTTTAATAAAGTTCATGTGACGTTCTTCTTCATATCTTCTTAATGTTTGTTCAAATGATTCAGCCATCTACTCGTCCTCCAAATCGCTTAATAAGTTGCTAAATTCGTTTGTGCCGTCTAGTTTGTCCATATCTTCTAATACTGGAGCTAAACTGATTTGCGCACCCTCTAAAATTTTATAAAATCCCACATTCTTATTTATGCGTTTCTGTCTTTCATAGTTTGCGTAAGATTCCAACATTTCTGACTTCAACTCTTGCCATGCGTCTTTATACTCTCTATCTTTCATCGTCTTCACGCTCCTTATATCCAATTAATGTTAGGCTTTCCTTCATACCCATGCTCCCACACGAACCAAGCGAAACACATTGTACTCGCCCATTTCTTTCCTTTCTCGTCAAACTCTGAACCATTTCGTAACGGGTTTTGTCTACGTGTAAACACATGAACTGTTCTTAACGGAGTATTTTCGAATAAGTCTTTTCTTTGTACTCCTTCAAGTAATTGTATTTTGCAAAACATTGCTACTTTACCTGTTGTTATTTCCAAGGCCTTTTCGATAAACTCTTTAGCATATTTATATGGTGGATTTGTAATCACATTGTCATACATAACAAAATCATCGTTTAGAAAATCTTTAAATGTTTCCCCATATCCTCTATCAATCAGGTCGTTGGAATAAACTTCAAAACCTTCATTTTTCAATACTTCTGATATATGACCTTCCCCACAACATGGTTCAAATATATCTCCATAAAACTTTTCATTTACCAATAATGATTGTGTACTTTCAATTGGTGTTGCGTAATAATCATTTTCTATTCTCTGTCTAGTAGTAGATGTACCGGACAAAGATGTGCCTGTTAAATTATTCATTATTTATGCTCCAATTCCTTAATAAAGTTAACCAAGTGTATATAGTTATATGAATAAGGTGATGCAAACTTCATATCTCTTATGTGGTTGGTTAGGGTGGTGTATTTGTCTTTCCAATATCTAACTTCTCCATCACAACTCATTAACTCGTCGTGTTGTATTTGACCATTTAAATTAAGGTTTCTCACTCTATTATTTAGATTTTCATTAGTAGCTTTCAACTTCTCATTCTCCCGTTTCAACTGCTCTAATTTTTTTGAAAGTGTTACACTTCTTTTGTTCTCATCTCTCCAACTGTCAAATAAATTATCTTTCCTTGAAAGTAAAAATCTATTCTCCCGTTCCAACCTCTCATTATTGGCACGTAGGACTGCTATATCATCGATTAGTGTGTCTCGTTGGGCTTTGTAATCGTCACGTTGTTTCTTAACTGCTTCGTAAGCCATTTTCCAAAAATTAATCACTCGCCATCACTCCTCTAGTAAATGTGGGTGTTCATATATGTTGCCTTCAATAGTCCCTTTAATATGATTCAATGAAATCCTTGTAGAATAATCACTTATTGGATTACCTCCACCTTCTTTATCTTCTAAATAAATTCCATATGTCGTATTATCCTCATGAAATACTACTTGAGTATATTCATCTTCCATTTTTAAAATGTCCCCAATGTATATTTCGTTACCATCTAAATCAAAAAGCCCTGTGGATTGCATGAGTTCGTAATAAGTGATTGAAGATTTCGTTGTTTCTCCTGGCAACTGTTCTATAATATGTGCTACTTCTCCATTTTCTAATTCAATTCCTGCAGGGTTAATCATGCACTCGTAAAATTTATCCCACGCTCTAAACTTAATCATCTACCATCACTCCTCTACTCACCTTTAGTCATAACCATAAAGCATATAATGAATATGATAATCACAGTCCCACTTGCTACTATGTCTACCATCTACTCCACCAGCTTTCCGTCACGCCATATTAAAGTATGAGTTCCATCGTCATTTACAATGTGTAGTGTTTCTACTGGTTCTCCATGCGCTTCTGCTTTATTCAACATGAGTTTAATTGGATAGTTATCATCAATCCTTACGCGTTGATAACCAAAGTTATCTTTTAAATATATCTTTTTGAATGTAGTTAATAATCTAGGTATTACCGTATCTTCTGTAATTTCTTCCTCGACTTCTATAACAACTCCTTTAAAACTACGTTCTATTACTGGGTTATCATCTTTCTTCATAGGTTTCAGTGTGAATGTTTGTTCAAATTCCATAGGCGCATCAATGATATTGTTATCAATTAACGCACTTTCATAACTGGTAATACCAAACCTATCAATCATATATTTAGCATATTCTTCTGGAGTCATTTCTACTTTACGTTTAATCTTTACCATCTTCTCAACCCCTCCATCGCTTTCCTGTTATGTGCTTTATCCTCTGGTAATACTGCCATGACAATGCTGTGTGGATTGAGAGAGTATAAGAATCCTTTAACTCCACAATCTTTTAGTAGCTTTGCCATTTCGACAGTATTTCTGCCTTTAGTATCAAGTTTGTATTTAGTTTTAATAGCTTCTGATAACTGCATTACTGTTCCTAATTCTCAAACGCTCTTTCGATATACCATCTAGCCTTATCCACATCTTCTTTACCATTCTTGTGTGGACTACGTGCTAAATATTTAATCGCATTACCAATGTGATAAGCTACGTTAGGATTGTAATGTTTGGTTACCTGCTCTATAAAATCTATCACTTCTATATCACCGTAGTTATAATGTGATGGGTGGTTGACTGTGTCTTTACGCTTACGTTGTTGTACGTCGTTGGATTGGCTGTGAGATATAATTTCTTCATTAGGGCCAACTGTTGAATTACTGTAACTATATATCTTACCTGGATTAGGCATGCTCACACTCTCCGTTTTACTCTCTATATAGTTACTCCACAAATCAAAGTAGTTGTCGTCTGTGATTACATATTCAATGTCTGGTATTGATTCAATCACTGCAACAGTATAACCATCTTCTTCGTTTTCATTTTCTGCCACTACATAATTTCTAAGTCTTGCTACTCTCCCCACTACCGTCATTCCTTCGCTATGCTCACTCTTGCCTAAGTCATACACAATAACGTAATCATTTATATTCAAGTCTCTTATCTTCATCTAACGCACCACCTTAGGAAAAATGCTCGTGTTCATTAAATACTGGCACCACTTACCTCTGTTATGCTTCTGCGGTGTACCGTCATACAACCAAGGTCGTTTTTCTCTTTGCTTTTCATCATGATAGTTTTGTTTTGCTTCTTCGTTATCTTCTTCATATTGTTTGGCATAGTTGATGTATACTAAATCTTGCCGATTAATTCCTTTTGGTACTTGGCAAGCTTCTTCTAACGTCCAATTTTTCAGTAATCTATCACGTATCATCTGGTTAGTGATGTTAAGTTCTTCCATCATTTCATGATTCTCACCTTCAATTTCATATATTGCATCGTGTATTCTGATTGTTTTTACCATCTCAATAACCCCTATCTATAATTTTTACGTCGTCAAACTCTAATGGTTTTGCGTCCATGTACTCATTTTTTAATGTCCACATTTGATTGTGTATCTTATCGGCAGCAGTGTTATCATCGTCATCGTGATTAACATACACTTTCTTCTCAACATATACTTTGTAGCGAATAGTCGCTGTTTCTTCATTCATTTAGATCACTCCAATACTCTAATTCCATAATCACTTTCGGAGTTTCTGCATACTTTTTAAAACTTCTTATCTCTACTATTTGATTATCGTCTTGCCAAACATGACCGTTTGCAGCATCCAATACAGTTTTAATTAAGTTATCAATATCTGGTTTCGTTCTCTTATACTGTCCTACCATTGCCACGTGTTTCTTCTTACTCCACGACTTGAGCAGTGGAAAGTGAAACTCAATTGTTAATCTAATCGGTTTATCTATCATCATGTAAGGCATCTGTTGTCTTAACATTTTCTTATGGTTTGTATATTTAGCAGGCATGTACGTTTGTACAAACTTCCCAGCATTTCTAAATCTCGGTCTAGGTGATGCCATAGGAGCATCTACTATAAGCTCTATGCGTTTCATTTGTTCACTCCTACATGTAATCAAATATGCTTGTTTGATCTGCACGTTCTAATCGGAATGTGCGCTTGATTGCTTCTAATCTCTCGTCACTTACAATATATTCATCTATGTCGAAATGCTTATGCAATCCAAATACACGGTTTCTATTATTATCTAATGGGATAACGTCGATAGTTATATTGCTATTGCTCTGTTTTAATCTGTATTCTGTACTCAATCCCATTTAGCACACCTCACGAATAGCGTCTGTTGTAGCACGTTTTGCTTTCTCTGTGAACAATAATTCATCTAACATTGTTTCGTCTCCGTGCGCCCCATCTATGAACTTCTGTGCGTATATATCACTTAAATTAGGAGCTTCTAAAAAGTCTTTTACATATTGAATTGTTTTTACCATGCGTCTCTCTCCCTGTAGTCATCACCAAGAACTCTCACTTGGCGTGAATTATGTTTCATTCTTGAATTGATACGTTGCCAATTCATATTTTGATTTAATTCTTTATCACTAAAGTTAGTAGTGAATATGTTATTTTTACCTACTCTGTTATCTACAATGCTGAATAGTTTATTTAATGTATGTTCAGTGTTTTCTACACCTATATCATCTAGCACAAGTAAATCTATGCTACTTAGTAACTTAACGAGTTCATCTGTCGTTTCATCTGCGTTTTTATTGTAAGTTGCTTTGATACGATCCATTAACATTGGTATGTGCATAAATGCTACAGAATAACCTTGAACTTTAATTGCTTTCGCTATAGCATACGCTAGGTGCGATTTACCAGTACCGTATGAGCCTTGCATAATTAATGACTTAGGTTTATCTATAGAAAACGTTTTGACGTACTCTATGGCTGTTTGTTTAGCATCTGTTTGTGATTGGTTCTGTGGTTGGTAGTTATTTACTGTGGCATCTTGTAATGAGTAATTAACATTAGATTGATTAAATATATTATTGATTGCTTTCTGCTTACGTTTCTTCTCTGCTTCTATCCCTGCTGCAATCATGCTACATTCACAACCGTCCCGGTATTCGTAACCACTACCAAACTTGTGCAAGTCATACTTGTTACCGCACTTCTCACAATACAGACCTCTTTCTATCTCATTAGCTTCATATTGCTTAAGTGTTTCCGTTATTTTAGGGCTTAACATTCGTTTCATTTAATCACTCCTAATCCCAATAACTAGGGTCATGTTTCATTCGTTCAAGCATATCTTGCCCTGTCAAAACCTTATCTTTATTTGAACGCTTATTATTTCGTGCTTTAACATCTTCTAGGTTTTTCACACCATCGTTGTACCAAGCTTTTAATATTGTGTTCACATAATTCCAATTAGTAACGTTATTGTTAACTGCTTCTTTCATAGCTTCGTTAACTATTTCATTGCCATTCTCTTCAAAATCATCTATCCAATAATTAATTTGTTCTGCTACATAAGGTTTGAGCATTCCAAATCCATTTTCTTGATAGAAATCAAATGGCGATGGCTGTGTACTACTACTGTCATTATCAGTATTGTTATTATTAGTTAATTCATTATTGGTAAAGTCATTATTAGTAGGGACGGGTTTTCCTACGTTGGATAATCCTGTGTTGGTTTTCCCTACGTTGGATAAACCTACGTTGGATAATCCGTTCTGGGTAGGTTGTTCATAAACAGAGTATTCATATTCTCTTAAACGCCCTTTGTCATCACGTTTACGTGTTCTAACAATATAACCAGTCGTCTCTAATTCTTTAATTCCATTCTTCAAACTATCTCTACCATCAAGACTGTGCTTTTCCAATTCTTTCTCATATACTTGCCAGTCATCTGGTCTACTAAGTAAATAAAGTAATATACCTTTAGCTTTCCAACTTATATTAGGGTCGTGTATAAAGTTTTTATGAACCGTTACAAAATTCCCGCTCTCTTTATAAACTCTAAATGTTGCCATCTACTTGCTCTCCTTTCAGCATCTTGTTTAGTTTCTCGTCAACATCCACCCAAGCATTTTCTAAATGATGTAGTTTATTAAAACTATCCATTCCCATATTGTGTTGTTGGTTATGGTGGAATCTACATAATGCTAATACTTTGTTTCCGTAGTGATTTATCTTGTTTCTGTTACGTCCTCTGCCTACTGCTTGATAGTGTGCTAAATCTGCATTTTTAGCGCCACAGACAACGCATATTCTGCTTATAGTAGATTTATATATAAAATAGTTATCGTTGCTCATAAGGTCGCTAGTAGCCTTATTCATAGGTATGTCATGAGTGAATACAAAGTCTAAAATTAACTCTATTAATTCACTGGCTTGTCTTCTGCTACAATTGCTTAATGAGATAGGTTCGTAACCATGTAGAAACTCTAATTGTTTTTGAAACATGTAACGTAGATAATCCATTGGTTGACCATAATGATTGAATATATCTCTTACCATTGCGAATACTTTTCTACGTTGCTTATCTGTTATCTTGTATGGATCATTCACGATTACATCGCACTCTACTTCTAGTCCGTTATCTAACAGTAAGAAGTCTTTGTTTTCTAAAGTCACACCCTTGATGACAGCAGTTATTGTGCCGTCATCTTGCTGGATGTAGTTTTTAATAAATGACATTACATCACCTTATTTATATTGCATACAATTAAAATGGTAAATCATCATCTTGAATATCTATTGGACCATTTGCATTGGCAAAAGGGTTATCATTTGCTGGTCTTTGTGTTTTAGTTTGACCGCTCTGATGCTGTGACTGTTTATTTTGTTGTTTACGTTCTACAAAGGTTACTTGATTAACTGCAATGTCAGTAGTGAATACTCGATTACCTTCTTTATTCTCATAACTTCCTGTTTGTACTGCGCCAGTGATACCTATTTTTTGGCCTTTGCTAAAATTATTAGCAATGATTTCGGCGGTTTTGCCAAATGCTACACAAGTTAAAAAATCTGATTCATACTCGTCTGTTTGCTTGTTCTTAAATGCGCGTTGTATAGCTATTCTGAAATTAACTACATTGTTGTTTTGTCCCTTTAACTCTGGATCTGCTACTAAATTTCCAACTCCATTAAATTGATTCATTATTCATTCTCCTTTGATTTTGATTGTTTACTCCATTTGTCTAATGTTGTTATCATTTTTGCTATTTGATCATTCGATAATCGGTTTACATCTGTTATTTTTAATTGTTGTTTCACTTGTGCTGTAGAGACATCTTTACCTAATGACTTCATTAATTCGCTAAACATTGTTATTTCATTTTCAAGTGTTTCTATGTTCTTAGGGTCTACTTTTGAATATTTATCTTGTTTTTCTTTTGCATCTGCATCGTCTTCATCAGTTGGTATGTTGAAAAATTTCATTAAGAAATAGCGTTCTGCATATGTTAATGCAGTGCCATGTGCTTTAGATACATCGTCTTGTTGCCCTATTGCAAAGAACGGAACATCTAGTCGTTCTTCAGGCTTATCTGCATTAATCCATGTGTACGTTAATTTTAGTCGTACAATATGTTCTGGTTTGCCTTTAGCATTTTTTGTTTCGATTACTTCTTCATCGTCTGTTTTTGGCACAAGTAGTAGTTTGTGTTCTAACATCTTAGCTCTAATTCTGTGCAACACTTGTGAGCCACTAACGTAAGTGTAGTTGTAACCTTTCGTATCTTTAGTAAAACCATCTATATTCGCCTTTACATCAGCTATTTTTTGATACAAATTTAATTCGCTACTCATTCACTTCAACCCTCTCACTTCTTTGTATTCTTATATGAGTTGATTCATATATAATTTTGTCGTGTAGTGACCAATCGATTTCCAACACTTCGAAATCTTCTTCGAAAAATTTACGTGCTGTTTCTTCTTCGTCTGTATACTCAACTTTGGGCGCTCGTTCAGTTGGACGATTGTTTACATAATGATCTACATTCTTGTGAACGATTCTGCAATATTCCTTTCTAGACATTGATTTTTCCTTCGCCATTTGACGAAACCTCCTATATTGTTGTATATTTATGGAAGTAAATTGTTTAAATTATCACTTCCGTTTTGACTGTTAGCAACTACCCTTGCTTTCAGTCTTTTTTTCGTCGAAAAACGCGTCCCAGAACATGTACACGCCGTAACTTGCAAGTACAGAAAGTACCATGCCGATAAAAAAGTCGTTTGTTATTAGTGCTATCGGTAAAGTTGTAAATGGTATTGTAAGAAATGTCATTATTATTGTCTTCATGCTATCCCTCCTTTCCTTTTAATACTTCTTCTGGTATCTCGTGATACGGGAATTTTTCCTGGAACATTTTAACTGGTACTCTACCTGAAATAGTGAAGTAACCTTGTTTTTCCATTTCTTCGTTCATTCGTTTGATATATTTACATGCAGTAGATGCAGAGACCTCCAATACATTCGCTACATCTTTTGAAGTTAGTACATTTTTAATCATTGCAATGACTCCTTTCTGGTATAATTGATTTATCGCTACTGCGATAGTGGGTGGTGATAATATGGGTAAAAAGTCTGGTTTTTCTATTGATTTCGATGAAAAGAAATTCAAAAAGGATTTAGAAAAAGCTACTCGCTATATTGAGATGCATTGTCCTAGTTGCGGTAAAAAGTTCAAAGTTGATACAAAAAAACGCATAGACAAATGTCCTAAATGTAAAGAACCTATCGAAATCAAGAAGTAACTTGTTATTAAGGGTTGGTGTTACAGCCCCGACTCTTATTTTTTCATGATTTTATATTTGAATTTTAAAGAATTGAACTCTTTTATTTTGTTATCAAGCAACTTAGTCTTGCTTTTTAACTCATTCTTTATAGTCTTATACTTTAAAGTGGAACTTTCTAATTGATCTGTTAAAGATTCAATTTCTTTTACTTTTCCGTGGAAATCTTCAATGTTAGTTTCTAATTCAAATTCATAATTGCTTTCTTTTTTCTTTCTTTTAAACATTCCGTTTCCTCCTATTTTTCAATTATTGGTAATACGTCATTTTCTTTTAATAATTCGTATATGAACAAACGTCCTTTTTGTGTCCATTTAGTGTTCATTCTTACTGATGTACTACCATCTTTATGTTCAATTTCAGTAGTAGATGAATGTGTATATCCTTTGTTATGATGCTTTGAATAAAGTAACCATTGACCAGATTGTTTATATTGCACTTTCAAATCATGTAACAATTTATTTAGTGATTGAGCTGACATCCCGTAATCTTTAGCAATTTGTCCTACTGTTACTAAACTTTTATTTTGTAAAATTGTATCTAAATACGAAGCCTTAGGTTCATATTCAGCAATCTTTTGTTTATTCATGCTGTTTTCTAGTTCTAATTGTTGTTTCTCTTTTTGTTCAGCTATCCATTGTTCTGCTCGTTTTACTGGATCTTCTATCATGTAACTAGCAATTGGTTGCTTAAGCTGTTCTTCCATTTTTTCAAATTTATCAATGTAAGCTTCCTTATAATCGTAGTAACCTTGAATATTAAACATGTACATATTAAATCCTTTTTTAGTTAATAAATATTCAACTTGAGTTCTGTTCATGTTGTCTTTGTAATTATTTTCAATAATAGATGCGCCGAGATTTTGGCGTATCTCCAGCATTTCTTTTAAAGTAGCTTTTATGTGTTTATGTTGTTTGTTTAATTGCTCTGCTAAAACTCTACTAGAAACCACCGGTCCAAGTTCTGAATTGTTTTCTATTTTAATTGTTAGTAAATCTTGCATTTTAATGCCCCCTTATTCAGTAGGTTGCGCGTTCGCAACTTCATAGTTAAAAAAATATTTGTTAATATTAACTCCGTATTTCAAGTGAATAATTTTAAAGTCTTTACCTTCAAAATCAGAATCATATCTACTTGTTCCGTTTAATATAGTATTTACTTTACTCCGACTATATCCAAGTAAATCTGCCAATTCTTGCTGTGAAATACCATTTCTTTTCATATATTTTTTAAATTCTGGATATCCACCAAGCATTTTATATTCACCTCACTTTCAAGTTGCGTTCTAGCAACTTTCTATAATTTAACACTATCTAGTTGCGAATGCAATACATAAATAGTAGTTATTTTTTGAAAAGTGTTGCGTATACGTAACATCTCCTATATAATACTATTCATAAAGTTTTTTTTAATTTGGAGGTTACAAACTATGGAATTCGCAGATAAAATTAAAAAATTAAGACTAGATAATGAATTGACAATGGAAAATTTAGCAGAAAAATTAAATAATATATATGGTTTAAATATCAATAAAAGCACAGTCTCAAGATGGGAAAAAGGTTCTGAACCTAGCGGGAAAACTTTATACTATCTTTCTGATTTCTTTAATACAACACCTTCTGATTTATTAGATTTACCAGAAGATTCTTTCATCGTTCCTACTAATAAAAGATTGCCAATAGTATCAGAAGTCTATTGCGGTTCTGGCGTAGTAACTTTCAAAGATATAGTAGGTTATGAGTTTGTACCAAAAGAATGGCTTAACGGTGGTGAATATTTTTTCCTTGAAGCGAAAGGTGATTCAATGACCGGCGCTAGAATATATGATGGTGATTTGGTTTTGATAAGAAAACAATCTAATTTTGAAAATGGTGAAATTATGTGCGTCTCTCTTAACGGAGAAACATTATTAAAAAAAGTTTATAAACAAGGTGATGTAGTTATTCTCCAATCGGAGAATCCGAATTTTCAACCTAGATTTGTAAGTGAAAATGATGATTTCTATATAGTAGGAAAATTAAAAAGAGTAGTAATTAAATACTAGTATATAATAATGCACGACTTTCTACATGTGTACTATCAAATAAGTTGTTCAGAATAAAATGTTATATGAATTAAATAATTAAACTACAACTTCAATAAACTGTATATTAATTATGTGATTGTGTAAAAAGTTAAAAAATATTTTGCTATATCTACTACAAATTATAATATATTTTATGTACACTAATATCAATGTGTTTTTATAGTACAAATATATTAGGAGGATTTTTAAATGAAATTTTATGAAAGAACATGGTTTGTAGTTATAATGTTAATCTTCTTTTTCCCTTTAGGTTTATTCTTGATGTGGAAATTTAAAGATTGGACAAAAGGTGTTAAATGGATTGTTACTGTTGTAGTAGTTTTAGTGGCTATAATAGGTTTTGCAACCGACGAGAACGACGGCGAAGAAAAGAAACAAGAAACAAATACAACAACAGATAGTAAAGAAGATAGCAAAGATTCTAAAGAAGATAAAAAGGATAACGCTGAAAAAAACAACTCTAAAAATGATACAAAAACTAAAGAGGAAAAACAAAAATCTGAGATTAAAAAAGATGATAAACCTTTAACTGATAAAGAAAAGTTAGATAAAAAATTAAAAGATGATGTGAGTTCAGCTGATATAAAAGGTGTAGAATTCGGCAATGGCCCATCTGACGTGACTATTAAATTAGATGGCAAAAGTGCTATGTCAGACAAGAGTACTACAAGAGGTTTTAAAATGGCAACGGCTGAAGCTCTGCTAGCGTTAAAAGAATCTAAAATCAACGTGAATAACGCTGATATATATGTATATCATGATTTGAATGACGGAATGAAAGACGAAGAAAAAATGGTAATGTCATCTAGATGGGATAAAGAAACTATAGATGAAATGAATGAAGATGCTTTATATACATTACCTGACCATATCGAAGCACAAGCAGAAAGTAGTTATATGCACCCAGTAATGAGAAAGAATGATAAATAATTTTTAAGGGCACCTCTTGTGCCCTATATATTTTTATCTTTTTTAGGAGGGAATGACTAAAATATGCCAATTTATAAAGATGAAATTACTAATAAATACTATTTTTCCACTCGTTATAAAGATGTTTATGGTAATAATAAACGAAAAGTAAAACGTGGATTCAGAACGAAACGAGAAGCTAAAGCAGCAGAAGCTAGCTTTTTAACAGAAATAGAAACGGGTTACAGTGATTCTAATACATTTGATTATATATTTAAACACTATTTAGATAACACTGATTTAAGAGAGAAAACAAGAAGAAGAAAAGAAAACGAATACAAGTTGCACATAAAAGAAAGGTTCGGCCATATTAAAATGAACCAAATCAAGCAAAATCAGTGCCAAGAGTTTAGAAGTTATTTAATGAAAAACATGCCTAGCCCTAACTCAGCACGTACTATTTGGTCTGGTTTTAAAGTTGTAATAAATCACGCTAAAAAACATTTTGGTTTGCGAATTGATCCAACTATTTCTATTACGCCGATACCACGTGTTAAACCAAAACCCAAATATATGTTAAGAGAAGAATTCGAAGATAAAATCGATAATATAGACAACCAAGATTATAGAGAGTTGTTAAAATTAATGTTCTACACTGGATTGCGCGTAGGAGAAGCAATGGCACTAACATGGAATGATTACAACAAATATAAAAAAGAACTATCTATAAGTAAGACAATGGATGTAACTAATAGAAAAATTTATAATCGCGCTAAAACCGAATCATCTGAAGATATTGTACCTTTGCCAATTTTCATAAATGATATTTTAATTGAAAGATATAACTTAATGTCTAACAATTACAAATACTTTGATGATAACTATTTTATATTTGGTGGAATGGAACCTAAACACTATAGTCACTTGCACAAAAAATATAAACAAGTATTTCCCAATTACGACATACACACATTAAGACATTCTTACGCATCATATCTAGCTAACAATGGCGTAGACATTTTTGTATTACAATCGCTTATGCGTCATTCACAAATAACCGAAACAATGCAAACGTATAGCCACTTATATACACAAAAAAAGCACGACGCAATACGCATATTCGACAACATTTAA
Protein sequences of DBSCAN-SWA_7 >CP017459|2159737:2199789|2193585_2194020_-|AWI45124.1|DBSCAN-SWA MNQFNGVGNLVADPELKGQNNNVVNFRIAIQRAFKNKQTDEYESDFLTCVAFGKTAEIIANNFSKGQKIGITGAVQTGSYENKEGNRVFTTDIAVNQVTFVERKQQNKQSQHQSGQTKTQRPANDNPFANANGPIDIQDDDLPF >CP017459|2159737:2199789|2184427_2184643_-|AWI45104.1|DBSCAN-SWA MDNVFNVDGSKKENINVQNQLYEMKSQLPIIMEIARMKSEYQRERYTNLKRQGFTDEQAMEIIKVEETPFG >CP017459|2159737:2199789|2173883_2174246_-|AWI45088.1|DBSCAN-SWA MAKRNFIKLIQIDKKGNAVTDTEGNAKFDTYITPTQIPFRKIYDAADLMDGASDENTSAQENIDQMLDMVVDIYNNQFTKDDLLDRLHAPDAVEELQGQIEFIAQGQMDEERKKELARII >CP017459|2159737:2199789|2195898_2196663_-|AWI45129.1|DBSCAN-SWA MQDLLTIKIENNSELGPVVSSRVLAEQLNKQHKHIKATLKEMLEIRQNLGASIIENNYKDNMNRTQVEYLLTKKGFNMYMFNIQGYYDYKEAYIDKFEKMEEQLKQPIASYMIEDPVKRAEQWIAEQKEKQQLELENSMNKQKIAEYEPKASYLDTILQNKSLVTVGQIAKDYGMSAQSLNKLLHDLKVQYKQSGQWLLYSKHHNKGYTHSSTTEIEHKDGSTSVRMNTKWTQKGRLFIYELLKENDVLPIIEK >CP017459|2159737:2199789|2185193_2185655_-|AWI45106.1|DBSCAN-SWA MTTSIAIILVALATIGNSVAIFFSERRYQQSKNGFLSDIPITQREARILNDEIDKLKDEVKYIRPLVDKHKKEQKQNRWKQYNDWKRLYESKHGRCSQCHSDNLKINTEYEYDRTRRAVYIEDCIDYPKSAEYKCNTCGEVISKWEFKEDDEC >CP017459|2159737:2199789|2185657_2185906_-|AWI45107.1|DBSCAN-SWA MTQYLVRKIHHTTDEVFLDATKAKENEEFVVVDAKNKEEAKEKVKKPKGLLEVVPSSFNNYRSISKPVPNRNKAIPPRKDSE >CP017459|2159737:2199789|2194019_2194670_-|AWI45125.1|DBSCAN-SWA MSSELNLYQKIADVKANIDGFTKDTKGYNYTYVSGSQVLHRIRAKMLEHKLLLVPKTDDEEVIETKNAKGKPEHIVRLKLTYTWINADKPEERLDVPFFAIGQQDDVSKAHGTALTYAERYFLMKFFNIPTDEDDADAKEKQDKYSKVDPKNIETLENEITMFSELMKSLGKDVSTAQVKQQLKITDVNRLSNDQIAKMITTLDKWSKQSKSKENE >CP017459|2159737:2199789|2186189_2186696_-|AWI45109.1|DBSCAN-SWA MTKLEIKLLSNNATKPKRVDDESAGYDIYAAETIILEPQQKAKIATDLAVNIPKGYVGLLTSRSGVSSKTHLVVETGKIDAGFQGHMKINIKNDMELTNETIPYFSGIDDKPLELSNYDLLAKTYKINKGERLAQLVVVPIWTPELETVKEFSNESARGEKGFGSTGI >CP017459|2159737:2199789|2187257_2187830_-|AWI45112.1|DBSCAN-SWA MNNLTGTSLSGTSTTRQRIENDYYATPIESTQSLLVNEKFYGDIFEPCCGEGHISEVLKNEGFEVYSNDLIDRGYGETFKDFLNDDFVMYDNVITNPPYKYAKEFIEKALEITTGKVAMFCKIQLLEGVQRKDLFENTPLRTVHVFTRRQNPLRNGSEFDEKGKKWASTMCFAWFVWEHGYEGKPNINWI >CP017459|2159737:2199789|2191338_2192112_-|AWI45121.1|DBSCAN-SWA MKRMLSPKITETLKQYEANEIERGLYCEKCGNKYDLHKFGSGYEYRDGCECSMIAAGIEAEKKRKQKAINNIFNQSNVNYSLQDATVNNYQPQNQSQTDAKQTAIEYVKTFSIDKPKSLIMQGSYGTGKSHLAYAIAKAIKVQGYSVAFMHIPMLMDRIKATYNKNADETTDELVKLLSSIDLLVLDDIGVENTEHTLNKLFSIVDNRVGKNNIFTTNFSDKELNQNMNWQRINSRMKHNSRQVRVLGDDYRERDAW >CP017459|2159737:2199789|2186688_2187021_-|AWI45110.1|DBSCAN-SWA MAESFEQTLRRYEEERHMNFIKQGKKFEEELNNLDIKVEKIEVTKISYPVLINKEYVEENRLLTPYVLANAYFEDEELIFSPKQSIEKDLEIIKLKQRIKELESEDKQND >CP017459|2159737:2199789|2190001_2190355_-|AWI45117.1|DBSCAN-SWA MVKTIRIHDAIYEIEGENHEMMEELNITNQMIRDRLLKNWTLEEACQVPKGINRQDLVYINYAKQYEEDNEEAKQNYHDEKQREKRPWLYDGTPQKHNRGKWCQYLMNTSIFPKVVR >CP017459|2159737:2199789|2174300_2174624_-|AWI45089.1|DBSCAN-SWA MKKLIDFFKKKKKETDLLVITQKDINSVPTVIYQGKKIPLKQRINFEWNTKDLDKPYGIAFSVQYTDDAEEGYPQITECYTHPSKTELLEGVIYTTGLHAIAENEQQ >CP017459|2159737:2199789|2182136_2182622_-|AWI45101.1|terminase|DBSCAN-SWA MAGRKPKLNANKLGNRTKEELEQSELKENGLQQFTKINVETVPDGLTENAAKEWLRVVPLLEQLPIAELDYSLIKKYCEVLDQNDTLYRSISEKNGIEGMVNPETNRKTGAFMAYMESLKELRSICGQLGMTIDSRMRLVVPTESEVKQSVYDEFGVDDDD >CP017459|2159737:2199789|2197089_2197704_+|AWI45131.1|DBSCAN-SWA MEFADKIKKLRLDNELTMENLAEKLNNIYGLNINKSTVSRWEKGSEPSGKTLYYLSDFFNTTPSDLLDLPEDSFIVPTNKRLPIVSEVYCGSGVVTFKDIVGYEFVPKEWLNGGEYFFLEAKGDSMTGARIYDGDLVLIRKQSNFENGEIMCVSLNGETLLKKVYKQGDVVILQSENPNFQPRFVSENDDFYIVGKLKRVVIKY >CP017459|2159737:2199789|2198739_2199789_+|AWI45133.1|integrase|DBSCAN-SWA MPIYKDEITNKYYFSTRYKDVYGNNKRKVKRGFRTKREAKAAEASFLTEIETGYSDSNTFDYIFKHYLDNTDLREKTRRRKENEYKLHIKERFGHIKMNQIKQNQCQEFRSYLMKNMPSPNSARTIWSGFKVVINHAKKHFGLRIDPTISITPIPRVKPKPKYMLREEFEDKIDNIDNQDYRELLKLMFYTGLRVGEAMALTWNDYNKYKKELSISKTMDVTNRKIYNRAKTESSEDIVPLPIFINDILIERYNLMSNNYKYFDDNYFIFGGMEPKHYSHLHKKYKQVFPNYDIHTLRHSYASYLANNGVDIFVLQSLMRHSQITETMQTYSHLYTQKKHDAIRIFDNI >CP017459|2159737:2199789|2187021_2187243_-|AWI45111.1|DBSCAN-SWA MKDREYKDAWQELKSEMLESYANYERQKRINKNVGFYKILEGAQISLAPVLEDMDKLDGTNEFSNLLSDLEDE >CP017459|2159737:2199789|2194662_2194899_-|AWI45802.1|DBSCAN-SWA MSRKEYCRIVHKNVDHYVNNRPTERAPKVEYTDEEETARKFFEEDFEVLEIDWSLHDKIIYESTHIRIQRSERVEVNE >CP017459|2159737:2199789|2162167_2162380_-|AWI45081.1|DBSCAN-SWA MRKIIIFIVGFTLGKMKSRDKDTLFNVIAYNYEEKLCDKDDLYFYVNDDCISKTQYMFITGEKYPEQPQV >CP017459|2159737:2199789|2161470_2161767_-|AWI45079.1|DBSCAN-SWA MEQIIAFAGVISVITIALVQVLKKLNVVPKNWLPVAGMFVGVVIGGVTNFIPEIVSELSIGGRLLAGLISGLMATGIWETFKNREGKNVNKIGGGGVK >CP017459|2159737:2199789|2196675_2196915_-|AWI45130.1|DBSCAN-SWA MLGGYPEFKKYMKRNGISQQELADLLGYSRSKVNTILNGTSRYDSDFEGKDFKIIHLKYGVNINKYFFNYEVANAQPTE >CP017459|2159737:2199789|2161819_2162128_-|AWI45080.1|DBSCAN-SWA MNESELTYWIIFTVLPLTVTVVGLFTKVGKDKKDNENRITRIESEVEDHNASLKDIKEEQKQQREDTKVILEVSSKIDSLNSRFDKFEDRFYTHQNNQLTKK >CP017459|2159737:2199789|2188300_2188690_-|AWI45114.1|DBSCAN-SWA MIKFRAWDKFYECMINPAGIELENGEVAHIIEQLPGETTKSSITYYELMQSTGLFDLDGNEIYIGDILKMEDEYTQVVFHEDNTTYGIYLEDKEGGGNPISDYSTRISLNHIKGTIEGNIYEHPHLLEE >CP017459|2159737:2199789|2174889_2175519_-|AWI45091.1|tail|DBSCAN-SWA MAEKNYRSFTGLTEFYYKVHGEDVQQVTDPERIKYLQEISVSKDQEIEKAYGDNQVAEMAVANGTIEVEAGFHKLPLEDRVALFGLEKSEDGIVSVGNDTPPYVAVMFAKTMEDGSREYVGLPKGLFTFPEVEGNTKEDGVEFSSDSTTAEFMQAPVKGFEEEKAMLMGHDAKGTSVMKDAIWEAIFGESAESSNSDEGTSTPEEELGA >CP017459|2159737:2199789|2184796_2185021_-|AWI45105.1|DBSCAN-SWA MNLFSNEALQGMKNLSEMSEEEIQELENEVITNMRDENSEHYNERAQQFTDDQIRQMIRITVSLSSMVNEEDDE >CP017459|2159737:2199789|2164399_2166373_-|AWI45084.1|DBSCAN-SWA MSNYFLNFPIQIGQDYRFKMIRNFKYLIDNFKYFKRDFEYHKKEEKHAHHAFQIDYERSNVKTEIDRMKRAYNNIIIANNGDGIAEVSDSRVTFKGVKKDLLSERLREDYLDHVESKEVISNELEKSKIIRSAYDFDGVYVNENKSSREGLQNWLDWNKKRGGGPLILPPGQYCLDDYLVIPPNTTLYGHGATLKRIDGNGWFTNLADGETPIKYEGNGNIKFYGLTFDGNSELDKGMDGIVLGHAEDVTFQECLFLDVHTTHAIDLNGCKDVLIDHCLFKGQKNPGDNEKEAIQISLAAEIGIGNLPGSSYDSTPSKNVIVQNCYFGPSRNYPSYATAVGDHFSVYDQWVSNVVIQNNFIEKTTNFGLRVYKFKNTLVSNNIIQDCSGGIFATPTPGGYTSSINAEGVQMGAAQSGENLKIIGNTITNIEKLGIHISAYPNKKIPYKNESFETVDIANNTIRNTKQVGIYVPEARRVKIHGNTVEQCSMGIQCYGTWHLMVSNNNVSNTDTIGVFISNNKQLETGSAQTHAIVSNNQVYNSGQDGIRVSLGAMYIKVTNNSVFSYGLNASQSWIIAGIYLVECKNSIVTDNMVRNANEKYLDAVRISDDCIDVRVWNIDAGGSTITILNPKDKPHSNFYGVRDLNGNQVKYEGDVK >CP017459|2159737:2199789|2176343_2176673_-|AWI45094.1|DBSCAN-SWA MNLNQLDYRVTFYENTNDGPEAGMGGFQPIYSCFSGLYEPTQKDVQLGNLELSKRSVTLNIRNAQPQFIPNVNQTFEIQNGIYAGLFFNVKNVAPAKTPNYVKVVGEEQ >CP017459|2159737:2199789|2175531_2175936_-|AWI45092.1|DBSCAN-SWA MDDITMKIYEAIIDNKEIMEHVPKNNIKFFDYPNAQEIKDVVIVIDPLDTPTPSDFADNDNLTYEYFYQIDVFVKQKQGVNGRVLSDRLVFLLQRMMWEKLGFGETSSMKPEYIKDFNIYRQAKRFEGKQYFKL >CP017459|2159737:2199789|2169047_2173670_-|AWI45087.1|tail|DBSCAN-SWA MAERIKGLQIDLSLNDMDVSKKLSNVKREFRALDSSMKVSNNNFKYGNKSAAAYKDRMSELQTAVDGSSKHLEQLKRRHSEVSAEQGAGSKAALDLANQINKETNAFNMYKSQLSSVTKEYQQNFSMLGKLSNSFSSIGSGLQGVGQKAQDMERSLSNSITKPALIAGTAMAGITAKLGFDRLVGLDSAKAKLEGLGYSTKEVGSITDQVAKAIEGGMTTMAEGTDVAAGALAAGVKEGKELEKYIKLVGDAAVGSNRPVSDMAMIFNRVQGQGKLMTQELNMIEEGMPGFSNAMAEHLGVSYDAFREMVTNGEVTSKDFLTVMDDFAGGMAKAYSKSWQGMLQNTKAYIGQIGESLLGGVFEQAKGSLHEFEKLLKSPGAQQWAKETGEKLGNAFTTIGNGIKSVINWWNSLDGSTQKVFGSIAKWLAITLVAIGPLLTIFGKLATVTGGMFTTFGQLTGNIAKVAFASKEAGSILGGLTQVFPKLGTAITFATGPVGLIIAGVVALGTALVIAYKKSETFRNIVNGAFTGIVNGAKLLWSGIMTILTPIGQAFMKFGGQIKSAIGDFWSKYGAQFMQAITNIKNGFLAFWSFISPVLGYIGGLFKSTFSDSIPIINFFKDLLMGSLVHAFNIVKNTVMIAFNAIKGIIMGVLNVVMGFVKMFIGIFTGDWKLFGEGLKQVATSFLSILKNLFQLAFAGILGIAKTIWGVIKNTIVGLAKGIWTGVKNAFTWLKNSTVSIFNSVKAFAINVWNWIKDKVVGFATSLWSGVKSRFNSLKNSITIIFGIVKNFLFKVWLSIRSKVISLAVSLYNGVRNRFNSLKNSITSIFNSVRNFLYDIWNKVRNKVVSIATSLWNGVKDKFNNLKNSIKSIIGKVKNNLYDTWDKIWNKVTDVATSLKDKVTGTFGKMRDVLEDIIGKIKGFIDDMVDKVKKGLNKLIDGVNWVGGKLGMDKLPKVKLHTGTEHTTTQNVVTNGKINRDTFATVGDKGRGNGPGGFRHEAIKYPNGKMALTPNKDTTAFLPKGSSVMNGAQTHSMLNNMPKFASGTLSNKKPKKKKKGDNFFGDVATGVKAGAKVATGKVVDGGKAVVNKTLETAVKGKKWMEDKIGDVMEWIDKPGKLLDKVLEGIGLNLDGFGISKAAELPFDMMKGMFSKLKKAAIDTFTSWMSDAAEGDGGYIDLSKGINFPFSPNGKAPGYPFAGPHMGVDINYIYDKLYSVLAGKATARKGWNGGFGNMVDIVKGATKVIYGHMSKHAFSGSKNVKPGDYLGVSGNSGKSSGPHLHFEVQKNGVPIDPLKWLKKNNGEGKSGGKYGSAIKKALGMAGLPQTSKYIKAWQSQAKTESTFNPKAKNPSGASGLVQVKPGTFNQYKLPGHGNIWNPLDNLIAGMRYAKARYGKSGMLSQIGHGLPYATGGLINSSGLYNLAEEGYPEFVIPTDPSRQSDAMKLLAIATQRIEGNKKNKRPNQMRTPSTNNNNDNEMINVMARQLEATQRQVELLTQLVASNQRLEQKPTGVSEQDMSKAQGKRAQMMAYNMGGAF >CP017459|2159737:2199789|2190537_2190948_-|AWI45119.1|DBSCAN-SWA MKRIELIVDAPMASPRPRFRNAGKFVQTYMPAKYTNHKKMLRQQMPYMMIDKPIRLTIEFHFPLLKSWSKKKHVAMVGQYKRTKPDIDNLIKTVLDAANGHVWQDDNQIVEIRSFKKYAETPKVIMELEYWSDLNE >CP017459|2159737:2199789|2195167_2195377_-|AWI45126.1|DBSCAN-SWA MIKNVLTSKDVANVLEVSASTACKYIKRMNEEMEKQGYFTISGRVPVKMFQEKFPYHEIPEEVLKGKEG >CP017459|2159737:2199789|2174685_2174871_-|AWI45090.1|DBSCAN-SWA MAKKKYEVLHKFIDLEDKNKVYNAGDTYPKPANKKITHDRILDLTTSDNKRGMVLIKEIEE >CP017459|2159737:2199789|2188782_2189229_-|AWI45115.1|DBSCAN-SWA MVKIKRKVEMTPEEYAKYMIDRFGITSYESALIDNNIIDAPMEFEQTFTLKPMKKDDNPVIERSFKGVVIEVEEEITEDTVIPRLLTTFKKIYLKDNFGYQRVRIDDNYPIKLMLNKAEAHGEPVETLHIVNDDGTHTLIWRDGKLVE >CP017459|2159737:2199789|2162535_2162922_-|AWI45082.1|DBSCAN-SWA MEILVQDKYIITYAQVGGVKDGIEIDDMLVPTEFFEDFKPKKYMYVNGVVISNEDYKENTGVYTPSNVEVQLASTQMQLTKTVVQLHVTQKEFSNMILENSKKDERIQMLEQQQASTLLEIAKLKGGN >CP017459|2159737:2199789|2166369_2166600_-|AWI45085.1|DBSCAN-SWA MSKTYNNRYLKDSDGDIYLPMTSTECIIDIDKINNANNIVEINTKINDLEELVKSQGKEIETLKAKVNQRESEGTK >CP017459|2159737:2199789|2185906_2186140_-|AWI45108.1|DBSCAN-SWA MSRIRTNKQELVINFQNDLIITKYGLNINNNQNEEGKMTYAMNLNMNVLPIKPWLIRNVKTNLKRTYILIKYYWRLK >CP017459|2159737:2199789|2180392_2182144_-|AWI45100.1|terminase|DBSCAN-SWA MTSVKIPKAYETLLDIPNEYRDDAYKYCVMVLSGAYVTCKDTRLACIRHLKDIERSINNDEWNYTYKPKRAKKVIKFIEALPDTKGNINKLGLFQKFIIASVRGWFTKDNDMLRFRKAFISVSRKSGKSLLVSGLVLYAFLFDKEPKEGRQMFAAANDKKQASIVFNMVAKQLMYFVSKVPELKKDVKKVRELLQNTKDDSYVMPLSRDTGAVDGFEPFLAVIDEYHAAKTNEMLELIQSGQGNLLQSLIFIISTAGFNLNAPMYTDEWPYAKDILAEVYTDDEYFAVIYEQDSEDEWQDKSTWAKSNPLINETDELKEQIEDFLEKRVAEATKKNTMFRVLVKNFNYWMQASEESYLDFNDWKKNETDFDINNSKVYIGLDLSRADDLTAISFIHLDETNKQYYITSHSFVGTKGGLQGKIERDLIDYHQLANDGYCTITNLSSGIINTDQVLDYIENYVNRHNLDVQAICYDPYSIHGVLAEIERREWFYDLYEIRQGPQTLSNPNLDFRLNVINGDVKHHKNPLLDTAVKNAIAKNVNDSIMIEKKMNRHKIDPLMATIFAYVIASEHEWDTETFMPMFL >CP017459|2159737:2199789|2178959_2180192_-|AWI45098.1|portal|DBSCAN-SWA MPLLDLGFTSKQDKMNKDLERLLYWQEHGTHASYTGINALRNSDVFTATRIISADIASTKLKVKGHESNMVMNDVLDLFNNNPHSDLPGWHFKFIIIANMLLNGQSFVEIVRDKNDFPVGFHFLHNDLVGIEEKDGEVIYNVSEDVEGNAVKITSEDILHFRYITLDGYVGYSPLYALAHEIGISQGSKSFLRNFFDNGGTSTSVLQYKKGHINAEQLRDLKQDFANSQLKNNGGLVAIDDTMDFKRLQIPTEVLNFLNSYKFSTSQVAKAFGLPVSKLGIETVNTSITQANLEYLQSTLDPIFKMMIAELETKIFKFIDSGYELEFDSSRLIDIDPELQLQRITELHGKGIISTDEARSIFGYQPIEYGEQPLVDLNRAPLSTLQSYQESKIEKEVEKNTVERGDEYDK >CP017459|2159737:2199789|2189222_2189423_-|AWI45116.1|DBSCAN-SWA MQLSEAIKTKYKLDTKGRNTVEMAKLLKDCGVKGFLYSLNPHSIVMAVLPEDKAHNRKAMEGLRRW >CP017459|2159737:2199789|2195656_2195887_-|AWI45128.1|DBSCAN-SWA MFKRKKKESNYEFELETNIEDFHGKVKEIESLTDQLESSTLKYKTIKNELKSKTKLLDNKIKEFNSLKFKYKIMKK >CP017459|2159737:2199789|2197935_2198676_+|AWI45132.1|DBSCAN-SWA MKFYERTWFVVIMLIFFFPLGLFLMWKFKDWTKGVKWIVTVVVVLVAIIGFATDENDGEEKKQETNTTTDSKEDSKDSKEDKKDNAEKNNSKNDTKTKEEKQKSEIKKDDKPLTDKEKLDKKLKDDVSSADIKGVEFGNGPSDVTIKLDGKSAMSDKSTTRGFKMATAEALLALKESKINVNNADIYVYHDLNDGMKDEEKMVMSSRWDKETIDEMNEDALYTLPDHIEAQAESSYMHPVMRKNDK >CP017459|2159737:2199789|2190958_2191171_-|AWI45120.1|DBSCAN-SWA MGLSTEYRLKQSNSNITIDVIPLDNNRNRVFGLHKHFDIDEYIVSDERLEAIKRTFRLERADQTSIFDYM >CP017459|2159737:2199789|2159737_2161471_-|AWI45078.1|DBSCAN-SWA MAREYIGKWNGVDVYFDLLPIGTRRSGQQLITGTPAFAVAHDTGNKGTTAQNNVDYYRNSYNISWALVASAHIFVDDKEAIICIPVTEKAWHVLYNAVTDNNWYGLDSNDAAFGVEGSYFSDKARSKKSLDNLARILAYLCDYWKIDHKTEMPGHQDIQAGKIDPGNLLEAAGYSRNISNLDKLVNKYIGGVQEDDNMPDEVKEPTTEKPTESPRSHVELKEAIEYMHSMKGQYIDFDDEFAYQCVDVITDFVHQVTKGVRFWGNAKDLINNVMPKGWKVVENTPNYIPPVTAIAVYTEGIYSKWGHTGLVWDNSGGTKSFTILEQNYDGNANSPAKLREDNYSGLTHFIVPDFADDSVDLTTIGNVKPKAPSKGQTLKLNSVPPKKLTWSNQPYFKAVADNAGATICRPNHNNVMVLTNEVYGQGDVFYVYEIRDGWARVYSPSNDGFVWYERLRITEVYKPGGGQSLKNKPDKQTVNQKTNAKKTSGLKVGSIPPSKLGWSKKCKFRGKVDHYGATVAKRSGKKGNYQWSLTNETYRAGYDDFYIFEVLDGWCRVYSHNNNGWVWHERLRIVEVY >CP017459|2159737:2199789|2192122_2192890_-|AWI45122.1|DBSCAN-SWA MATFRVYKESGNFVTVHKNFIHDPNISWKAKGILLYLLSRPDDWQVYEKELEKHSLDGRDSLKNGIKELETTGYIVRTRKRDDKGRLREYEYSVYEQPTQNGLSNVGLSNVGKTNTGLSNVGKPVPTNNDFTNNELTNNNNTDNDSSSTQPSPFDFYQENGFGMLKPYVAEQINYWIDDFEENGNEIVNEAMKEAVNNNVTNWNYVNTILKAWYNDGVKNLEDVKARNNKRSNKDKVLTGQDMLERMKHDPSYWD >CP017459|2159737:2199789|2187829_2188294_-|AWI45113.1|DBSCAN-SWA MINFWKMAYEAVKKQRDDYKAQRDTLIDDIAVLRANNERLERENRFLLSRKDNLFDSWRDENKRSVTLSKKLEQLKRENEKLKATNENLNNRVRNLNLNGQIQHDELMSCDGEVRYWKDKYTTLTNHIRDMKFASPYSYNYIHLVNFIKELEHK >CP017459|2159737:2199789|2175936_2176347_-|AWI45093.1|DBSCAN-SWA MKATLRGAKELQSELERRLGKRKMQKITDYALTKGGGVVASIIARDMRSFAGTGKSFKSTTVSKPETVGGVREVKIHWNSNVPGERYRIIHLNEYGHFDRSGKWVNTAGKGVIENAMRKGRETYFATVKSELARRV >CP017459|2159737:2199789|2195438_2195621_+|AWI45127.1|DBSCAN-SWA MGKKSGFSIDFDEKKFKKDLEKATRYIEMHCPSCGKKFKVDTKKRIDKCPKCKEPIEIKK >CP017459|2159737:2199789|2177022_2178366_-|AWI45096.1|capsid|DBSCAN-SWA MANLDERKKEISNLISKAQEAVEKGDLETARNLKADIDAQKKEYEELEQLSEEIEASAPEEEAVPPKDEGAEETDNKTEEPEKDKSEDKPTDDKEEKLDTEDDKPSSDDKAKDETPAIEKVEEPTEEELEEEKDKKKKEGAKRSMAKLNQNQETNEEILGFEQYMKSKGAKRDNVKSDDVGVTIPEDIKYIPEKEVKTVQDLSELVQKTSVSTASGKYPILKRANAKFNTVAELEKNPELARPEFETIAWEVDTYRGSIPISQEALDDSVVNLTAIVSENINEQKINTLNERIGAVLQAFNPTSISDVDDLKAIINVKLDPGYDRQIICTQSFYQKLDTLKDGNGRYLLQDSIINTAGNTVLGMNVTVVRDDLLGTNGDAKAFIGDIKRGVLFADRTDVSVQWIENEIYGKYLMGAFRFDVKQADKNAGFFVTFEDSAQEPDGDLGA >CP017459|2159737:2199789|2192876_2193557_-|AWI45123.1|DBSCAN-SWA MSFIKNYIQQDDGTITAVIKGVTLENKDFLLLDNGLEVECDVIVNDPYKITDKQRRKVFAMVRDIFNHYGQPMDYLRYMFQKQLEFLHGYEPISLSNCSRRQASELIELILDFVFTHDIPMNKATSDLMSNDNYFIYKSTISRICVVCGAKNADLAHYQAVGRGRNRNKINHYGNKVLALCRFHHNQQHNMGMDSFNKLHHLENAWVDVDEKLNKMLKGEQVDGNI >CP017459|2159737:2199789|2183743_2184190_-|AWI45102.1|DBSCAN-SWA MNLGKEDIPKLEQFYRKYDEMKGQLAYRRYELLYQPEDTNVGGGKSNLPSSPVESEVIKLHKDDKYRNLQSTIQAVEDVYNRATPEQKAIIEYRYWEKDLLIYEWEDIAHELTKRREDDKVISQHSAIRMRNQIMRDTAERIGWIHFD >CP017459|2159737:2199789|2168191_2169046_-|AWI45086.1|tail|DBSCAN-SWA MKKEVRLFNDNFDIKLTDTPNLLFLDHIEEDVEVNANTTEINGTDGVLMGPTTFGPFNLVLNFSFKGLDTKDLKLYKQKIRNILYQREPYYVWHSDAPGKKYAVYCDSNDNDDLTNSFATFEVTFVVFKGYSESLKDTSQFSLSSGDWQFEAGVLSDDEIKYTHETTAFKIYNGSSDTINPLLRHQFKLLVNIDAPKGFKIINHTTHEVLKDGKETNVFEYKKPITYSETITLSGVHPIKDQKRIGIDTNWGWLTLAPGFNHIEITGVSIKNVTTKWVFPFIYR >CP017459|2159737:2199789|2180194_2180380_-|AWI45099.1|DBSCAN-SWA MKKILYALLLIILFIVGITSIFYGLFIFWKPLAFIVGGLFLIGLTGVLNQAYDNTSERGEN >CP017459|2159737:2199789|2178406_2178970_-|AWI45097.1|DBSCAN-SWA MTNSNVETTQDMVIEGYALTFNTLSNDLGGFKERVLPNALDDVDIDDVKCLINHEDRYVIGRTQAGTLELSVDDKGLKFKCWLPQTSYAKDIYENIDVGNVNECSFHAWYLKDNNGKTTGFYWTVEDGDYVMNVEKFEKLIDVSIVTTPAYKDTGVLVAQRSQDLTQVKELEKLKIAIELDGLRFKT >CP017459|2159737:2199789|2162921_2164400_-|AWI45083.1|DBSCAN-SWA MAMTKVGKLKLETSAYYQQKQDTKIAFYNTDENTSILRFIVTRNNDVLPLGKVNTDVMIHLTAEDGSWVIDDVGVTDELNGICEYQIPNGFLNHTGKVNGQVYISVDRKEDTVTEVEFSFTIKDASINKTPAVDKIFYIRKYSELEYRLKEKVQNIEDAYKNIDDYVTKVNKASEDGIKSLNDTKNSALLELKDSKELSINGINTTVQNQLEILNDKSNEVSSMISDFKQQVDSNLFVQKADTDNWQKYNLTNSDGTRKVITELKENVANLPAGAYTTTIPADTTIARTPKNIGNENTAYHAFIDVSHDTSNQKVIYITNTDTGILFIKVIQSDGSDKGWKKVGQLFEDDQLLSEKYLTESLSAYDNDLKTFISSTYKKKNKQLFSGDARARGSVYSIGESYKNFSYLLVRYRFSGGGKMVPAYIDTDKKIPIQDFNMTDSAGDNPKMVEMGLIFNTDTEFKVTHNNSFDVKKSTAMYDDNNIVVVEIVGVY >CP017459|2159737:2199789|2176662_2177004_-|AWI45095.1|DBSCAN-SWA MFKLDNVESIKKAIRVDHDFDDDLIMEVYLPGAINEVKTAVSLNNEDEPFYKDNPTFNLAVLNIIAHHNDNRSITSNEQSFDIPASSIKLVQTLRSDLAKWRRDNIEVIADES >CP017459|2159737:2199789|2190356_2190545_-|AWI45118.1|DBSCAN-SWA MNEETATIRYKVYVEKKVYVNHDDDDNTAADKIHNQMWTLKNEYMDAKPLEFDDVKIIDRGY >CP017459|2159737:2199789|2184203_2184413_-|AWI45103.1|DBSCAN-SWA MFWIIATIVLGGIAIVSLILNTAKDMKIDALEYEVAYLLFTIFEKDLPKRELSDEDLRKIKDEFNKRMK |
57 | uncultured_Caudovirales_phage(52.27%) | portal,integrase,tail,terminase,capsid | attL 2160512:2160527|attR 2203535:2203550 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_8 |
2320065 : 2335637
Sequences of DBSCAN-SWA_8
Nucleotide sequences of DBSCAN-SWA_8 >CP017459|2320065:2335637|DBSCAN-SWA ATCATACAGATTCTACTAACGATAATTCTTGGTCTGTTGTTAATTCATCGAAATAAATACAAATACGTTGGCCTCGAATTTGTTCGATTTGGACTTCCATTTCATATAATTCTCTCAATGTGTCGCATTGAATCACATCATCCTTAGTACTCGCTTTAATGACTTCGCCATCTTTGAGCGCAATGATATCGTCTGAATAACATGAGGCAAAGTTAATGTCATGTATTACTACAACAATAGTTTTATTCAGTGACTTCGCAAGTTGACGTAGCGTCTGCATAATTTGAACTGAATGTTTCATATCTAAATTGTTTAGCGGTTCGTCTAACAATATATAATCAGTATCTTGGGCTATGGTCATCGCAACATATGCACGTTGGCGTTGGCCTCCAGAAAGTGTTTTTAAATAGCGATGTCTGATTTCTTTAAGCTGTAACAATTCTAACGCGTATTCAACTTGTTCTTTATCCTCTTGTTTTAAATGTCCTTTTGAGTATGGAAAACGCCCAAAATTAACTAATTGTTCGACCGTAATATTCAATTCTGTATGGTTAGATTGTTTTAAAATAGATAGTTTTTTAGCTAATTCATTACTTTTATAATCTGAAATAGATTTATTCTCTATTTCTATACCACCATCTTCAAAATCTATAAGTCGCGTAATAGCTGAGAGCAGTGTACTCTTACCAGCCCCATTAGGCCCAATTATAGAGGTCAATCGACCTTTATTTATATCAACATTTATCTCTTTTAAAATCGCTTTATCTTGAATCGTTTTATTAAGACCTTGTACACTAATCAATTTGCATGTCTCCTTTTTATCAATAAATAGATAAAGTAAGAACCACCTACTAAATCAATAATAATACTTACTTGCGTTGTTGCTTCGAATAAATTTTCTACGACACCTTGTGCAATAAATAAACTTAACCAACTAATACAAATTGTTGCAGGCAGTATATATTTATGTTCATACGTTTTCATCAATTCATGTGCTAAGTTTACTGTTAATAAACCTAAAAATGTAATTGGCCCTACAAGCGCAGTAGAAATTGATACTAATATTGCCACAAGAATGAGCAATAGCCGTGTTAACCGCTTATAAGAAATGCCCAAATTAATAGCCTGGTCTTTACCTAATAAAAGCACATCTAGGTAAGGTATGGCTATCACTGTAATGAACACCAATATAATTAATATGATGCCGCATAATGTTACTAATTTACTATTAGAAGCATCAAAGTTTGCAAACATAGCACTTTGGACTGCTAGAAAATCTTCTGGGTTAATGATAAGCTCTAAAAATCCAGTAATGCTTCTAAAGAAAGTACCTAGAATGACACCGACTAGCAAAATAAAATAAACTGATACGTTTCCTATTCTAAAAATGCCTTGGAATAATAATAATGAAAAAGCAACCATAACAATTAATGTAATCGCAAAGCTCAAATACAAGTTAGTTACTAAAGCTGATTGAACACCAAATACAAAAACAATTAGAACTTTAACAAACATATATACTGCATCCAGCCCCATAATTGAAGGCGTTAACAGTCGGTTATTGGTAATTGCTTGAAAGATAACTACTGATGCAGCTATTGCCCCTCCAACTAACACCATAAGAATAAGTTTTCTTAATCGACTAGAAAATTGATATTGGAAAATATCAAAATCAATACCTATAACAAGATAGAGTCCAGCTGCTAACAGCGTTATTGCTATTAAAATAAATAATTTTGTCTTAGCGCTAATTTGCATAATCATGTCGTCCTTTCATCAGCAAAATCAAGAAAATAATAGTGCCAAATACACCTATCGTTAATCCGATGTTAATTTCGTACGGATATACTATAATTCTGCCGATTATATCTGAAAACATAACAAAAACAGCGCCTAACATGCCCGTATGAGGCAATGCGTTTTTCAAGTGGTCTCCTCTAAAAATTGACACAATATTCGGAACTATTAATCCTAAGAAAGGTAAAGTTCCAACAGTAACAACTACTAACGCAGTAATCGTTGCTGTGATAAATAAACCAATATTAATTATTTTTTCATAATTAACCCCTAAATTATTGCTAAAATCTTTCCCCATGCCAGCAATTGTAAAATGATTGGCAAATATGTATGTAAGAATTAGTAATGGGATGCTTAAGTATAATATTTCATATCTTCCACTGGTGATGATTGCAAAATTGCCATTTAACCAGTTTCCAATACTTTGAACTGTATTGGTTTTTAACGCTGTAAATGTTGAAAAACTAGACACAATACCACCGAGCATAATACCTAATAACGGAATAAAAATAACATCTGTAAAACGTATATATTGAACTAATTTCACAAATATAAATGTTCCACCAATACTTAAGATCACAGCGAATATTAATTTAATGATAATATTTTCTTGTGGAAAAAAAATCATTGATATCAATATGCCTAACTTAGCCCATTCGGTCGTTCCTGCAGTCGTAGGACTTACAAATTTATTTTGCATCATCTGTTGCATAATGAGACCCGAAAGTGCCAAAGTGCTTCCTGAAATTAATATACTAACTGTTCTAGGTATTCTACTAGATACAATGATATTAATTTGCTCTTGGGATAAATGAAAAATATCAGTAATCGACACCTTACTTACACCGATAAATAAAGAAAGGATAGTTAAGATGAATAAAATAATAGATAAGACCACACCATTTAATAAAAATTTCATAGTGAGTATATAATCCTTTCATAAACTTTTATATTTCATTGGCGATGATAATCATTATCAACGTTTATAATTAAATTTTATCATCTTTATATGTAAATTCAATAGCTACTACTGAGTTTGTACAAATAATTAGCTTAATAAATGAATAATCTGCAATAAAAACCCATCCAATCTATTAATAGCCAATAGAAAGGATGGGTTTTTTAATTATTATAATTATATTTATGTGACTTTCACTTAATCTTCAAATATGAAATCTTCGTCTTGTAGTGCTTCAACATTTAGCGCTAAAGTATATCCATCGCCTTTAACAGAGAAGAAATCATGGTTTTTTGTGGATGTATCTAAAGCATTTTCGATAATTGGGTTAAATTCTTTTTCTTCAAAATACGGATCAAATCCAAGGTTAGATAGTGCTTTATTACCATTATATCTCACATAATTCAGCACATCTTCAGTTAAACCAATATCATCATATAACGACTGAGTATAAGAAACTTCGTTTTTATATAATTCATCTAGTAGTTTGTACATTTCTTGATCAGCTTGTTGTTTTTCACTTTCAGATAATTCATTACGTAAACTTTGTGCATCCATACCAGTAAACACACCGTGAATAGATTCATCTAATAAAATTTTACGAATGATTTCTCCTGACGTCGTCATTTTTCCTTGTCCAGCTAAATATAATGGATAATAGAAACCAGAATAGAATAAAAATGTTTCTAGAAAAACACTTGATACACGAGCGATGTATTGATCATAAATTGAGGCTTCTTTGCCCCAAAGTTTATGATAGTTATTTACAATTTTATCTGATTTAAATTTCAAGTGTGGTTCTTCTAACACCCATTTATCTAATAAATAATTAGTTTCGCTAGATGGTAATAATGTGGTAAAAATATGAGAATAACTTTTAGCATGAATTTGTTCCATCATTGCCATAAAAGAATACACAGCCTTTTTACGTAAATCTGTTGTATGTAACATGATTAAAGGCATACCATCATCTGCTTGATGTGTGTCTAAACCAGTTAAACCAGCTAATGCTTTTTTGAATGCATTTTTTTCTTCATCAGATAATGTCTTCCAACTTGCAATATCCTTTGATACTTTAAACTCAGTTTCTACCCACATTTGTGAAATATTTTGTCGCCAAAACATATTTGTCATATCTTCTTGAGTATTCCAATTGACTGCTTTCATTTAGATAATTCCCCTATCTAGTAAATATTTAATTAATAAGTGACTTACAGAAAACGGGGCAGAAATCTAAATTTAAATCTAGATTTCCTCCCCTTTGCAAAAAGAATAAATTTCGAAAAACTCGGTATATATTACTTTGAAATTCATTCTCTTAATACACTTTAACTTTACCTACTTAAAGCATATGCTATTTCCATTCTTATCAACGCTCGTTATCATTAACACAAAAGTTACATTTTATATTGAACAGCTCGTACATTCTTCAACACTTAATAATTTATTTCTAGTGTAATATAAAGATTTCAATCCTTTATGATGCGCATAAACGTATAATCTAGATAATTCACGTGTAGATATTTCTGAATTAACATAAAGAATTGTAGAAATGCCTTGATCCACATGTGTTTGAATCGTTGCAATTAAATCAATTAGCTTCATTTGATCAGTGTTAAATGCTGATTTATAGTACCACATTGTTTCTGGTGATAGGAATGGCATCGGATAAAATGTTTCCGCATTGCCATAAGTACGACGTTCAATTTGGTCTACAATAGGCATAACAGAGCTTGTAGCATTTTGCACATATGAAATACTTTGAGTCGGTGCAATCGCTAAACGATAAGCATGGAATAAACCGTGAGTTTCAACTTCTTTTTGCAATGCTTTCCAATCTTCAGACGTTGGGATTTCTAAACCATCAAATAATTTACGTACTTTTTCGTATTTCGGTTCAAATGATTGCGAAGTATAAAATTCGAAATATTTTCCATTTGCATAATCTGACTTATCAAAGTCTTTAAACGTTTCCTGTCTTTCTTTTGCTATTTGCATTGATCTTTCAAGTGAATAGTAATTCATCATCATAAAGAATATATTAGCAAAATCTTTAGCTTCTTCCGACTCATAGCCAATTTTGTTTTTAGCAAGATAGCCATGTAAGTTCATAACACCTAAGCCGACTGAATGAAGCTCACTATTGGCTTTTCTAACGCCCGGCGCATTTTGTATATCAGCTTCGTCACTCACTACAGTCAACGCGTCCATGCCTGTATGCACTGAGTCTTTAAACTTCCCTGATTCCATAACGTTAACAATATTTAAAGAACCTAAGTTACATGAAATATCACGTTTAATTTCATCTTCCATACCATAGTCATTAATGATAGAAGTTTCTTGTAATTGGAAAATTTCAGTACATAAGTTGCTCATTTTAATTTGACCAATATTAGAGTTTGGGTGCACTTTATTAGCATTGTCTTTAAACATTAAATATGGATACCCAGATTGTAGTTGTGTTTGAGCAATCATATTTAACATTTCACGAGCATCTTTTTTCTTTTTATCAACATTTGGATTAGCAACTAAATCATCATAATATTCATCTAAATTAATATCATCTAGTGTAACACCGTACTCATTGTAAACTGTATGCGGCGCGAACATATGAAAATCTTTACCTTCTTTAGCTAAGTCAAAGAATTTTGAAGGTACGATTAATCCAGTAGAAATCGTTGATAAACGTAAGTCTTCATCTGCGTTCACTTTTTTAGTATCTAAAAATTCTTCAACATCGTAGTGGAAGATATTTAAATATACAGCACCCGCACCGGGACGTTGGCCTAATTGATCTGCATAACTAAAGCCGCCTTCAAGAGATTTTGCAACTGGTAAGACACCTTTGGCTACGCCTTTAATGCCTTTAATCGCTTCACCTCTTGCACGTAATTTAGATAAGTTAATCGCAACGCCGCCACCAATTTTACTCAATTGTTTAGCTGTGGAATCGATAAAGTTAATTGAATTTAAACTATCATCTACTTCCAATAAGAAACATGATACGAGTTCACCACGACGCGCACGACCAGCATTTAAAAATGTAGGTGTTGCTGGTTGATAACGTTGTTCAATCATAGCTGAAATAAGTTGTCTAGCTGTAGGTTTATGTCCATTTGCTAAATAAAGCGCGACAATGACAACATGTTGCTTGTAATCTTCTAAGAATTGAGATTTGTCATTTGTTCTTAATGCATAATCTTTAAAGAATTTACTAGCTGACATATAGCTTGCAAAACGAAACGGGATACTTTTAGCATAATCTGTAATTTCCACCAAATCTGCTTCAGCGTATTTTTCGAAAACATCAAAATAAAAGTCATTATCTACAAGATAACGAAGGCGTTCAATTTCACTATCAAAATAAATTGTTTTATCTTGAATTTCTTCTAAATAAACTGCTAACGCTTCTTGATCTTTTTCTAAATTAAAGAAACCATTCTCTTTACGCTTTGTAACCTCATTATTTAATTCAATATGATTGTATTTCTTCTCGTCCATAATCTTCATTGAAATTACCCACCTTCTCTTTAAATTCATTTACATCATTTGCTGTACCTTGTACTTCAAACTTCAATAGCAATGGAACTTGATAGCGTTCCGAAATAGATCGTCCAGCTTTCGCGAAATTTTGTCCCCAGTTACGATTTCCGCTTGCTGCAACAGCTTTTAATAAATCTTCATTTACATCTAAAAATGATTGAACTGGTTGGGGCACTTCACCAAATCCTATTGTTCCAGTGACCAAAACGAATGGCTCCTCTATTCTCTCAGAACAATTATTCTGCGTGAGTTCCATAACGTCAGTTAGTTCAGTTCGTTTAATAAATCTACGCACGTTGCCGGAAAATGAAAAATATACCACTTTCATTGGATCACCTTCTTTCTAAATAGACATATGTAAAATGGAAAATCGAAAGGCTTTCGAGGTATAATATTAATATGTTTTAAATGATTGAAGTAACCACTATATATAGTAACTTTTAATTCTATTAAGCAGGTATGTAAAAACTCAACATTTAAGTATTAATGCCTTATTTGTCATTATTCAAAGCCTAAAACTGTGTGATTTTACTTTAAATTTGATTTATTATAAATAAATTGACTGTCTATTGAAACACAATATATAGTGTTTCGTCTCTAACAGTAATACTATATTATGTGTTTCATTATACATAACTCATCGACTGATTAAAAGCCTTTAATTTATGACAAAATGATGAAAAGAGAATGAAAATGGCACCAATTCAACCTTAAAATCATTTTTTCATTGTTCAAAAATTTTTTTATCATTTTTAGAGTCACAATGCTTGCTTTTTTCAATTCTTCTGTAGCCCTTGATGTACGCACGTTGATCCATTCAATGTGGTATATTGCGTTTTATATATTTTATTTTTTAATTGATGATACTTTTAAATAGCTTCGAGCTTTTTTCTCATTTCAACCTCAACAAAAGAACGTTTGTTCGTATTAGTAGCGTATTATATTTTTTCTCTCGTTTCAAGCATATATACATAATCTAATTAACTATGCTAATATAGATACGTTAAATTATTAAAATTGAGGCGATATATGTGAATCCAAAAATGAAAGGTATTATTGCTATTCTAATTTCTGCAATTGGCTTTAGCTTTATGTCTGTTTTTTTTAGATTAGCTGGAGATCTCCCTGTCTTTCAGAAGTCATTGGCTAGAAATTTAGTTGCAATGTTTATACCTTTATATTTTATTTTTAAATACAAACAACCGCTTTTTGGTAAATTAAGTAGCCAACCATTATTAATTTCTCGTTCTGCACTAGGATTAATTGGCGTACTATTAAATATATATGCAATTGACCATATGATTTTAAGTGATGCAGATACTTTAATGAAATTAAATCCTTTTTGGACTATTCTACTTAGTTTAATTTTCTTAAATGAAAAAGTTCGAAACTATCAATTTATTGCAATGATTGTAGCCATTTTTGGTATGTTATTCGTTGTAAAACCAGAATTTTCTTCATCAATGATACCAGCTATTGGTGGGTTATTCTCAGGTATTTTTGCTGCAAGTGCTTATACGTGTGTTCGCGCATTAAGTAATAGAGAAGCACCTTATACAATTGTATTTTACTTTTCATTCTTTTCTATTATAGTGCTCATTCCATTTACAATGTTCACATTCGAACCAATGTCTACTATGCAAGTCATTTATTTGATAGGCGCTGGACTAGCGGCGGCAGCTGGCCAAATTGGTATTACCTTAGCATATAGTTTCGCGCCAGCTAAAGATATTTCAATATTTACGTATGCGTCTATTATCTTCACAGCATTATTTGGCTTTATTTTATTCGGAGAATCTCCAGATTTCTATGCCATTCTAGGTTACGCTATTATCATAGGTGCAAGTTATTACATGTTTGAAAAAGCAAGACGTCAACCATTAACAATTCAAAAAAAAGAACAAAAATCTAAATATTAAAGGAGCGCGTATTATGTCTGAAGGACGCAATCAAGAAGATTTAACTGATATTACTTTACTAGGAAACCAAAACAATAAATATGATTTCGATTATCGCCCAGATGTTTTAGAGTCTTTCGATAACAAGCATCAAGGCCGTGATTATTTTGTTAAATTTAATTGCCCTGAATTTACATCTTTATGCCCTATTACAGGCCAACCCGATTTTGCTACAATTTATATTTCTTATATACCAAACGTTAAAATGGTAGAATCTAAATCTTTAAAATTATATTTATTTAGCTTCAGAAATCATGGTGACTTTCATGAAGATTGTATGAATATTATTATGAATGACCTTATCGAGTTAATGGATCCGCATTATATTGAAGTTTGGGGTAAATTCACCCCTCGCGGTGGCATCTCTATTGATCCTTATACAAACTATGGTCGTCCTGACTCTAAATACGAAAAAATGGCTGAACATCGTTTGATGAATCACGATCTTTACCCAGAGAAAATAGATAACCGTTAAAATAATATGAATAAGTAAACAAAATTGAACTCATATTTTAAATTAGTTTCGAGAGATTATCGCGGCAGAGGTGGCTAAAAACAGAAAGTTAAGTTATGTCCTTACACACGCTTAGGCTCATGCATAAACACTACTAGCTCAGGAATCAGGAATCCAAGAACCAAGACTCTTGAGTAAAAAATAGTACGTTAAAAATAGTTTTTAGAAAAGATAGTTTACATTTTAATTTTAGTCATCTACTGACTATACAATATTTATGGCCGAGACATTATGATTTACGTCTCGGCTTATTTTTTTCATCTCAGTTCATTTAACTATCAAATTCCTTGAATATATTTTAATTTATTTCATATTATACTTGTTATTTGAATAAATACAGTATAGAATGTATCCAATCGTTAAAGGGGAGGGAAATTATGAAGAAAACTAATTATACGCACGAAGAAATTATGAAAGATATTCCAAATAAAGGTTTCTTCGGGCATCCAAAAGGGCTAAGCACTTTATTCTTCACTGAATTTTGGGAGAGATTCAGTTACTATGGTATGAAGGCCATTTTAATTTACTACTTATATTACACAGTAGCAGATGGCGGTTTTGCGTTACCACAAAGCGTTGCCATGCAAATTGTTGCAATATACGGTACGTTAATTTATATGTCAGGCATTATCGGGGGTTGGATTGCAGACCGAATTACTGGTACCCAAAATGCGGTCTTCTACGGTGGATTCCTCATCATGATTGGCCATATTTTACTGTCATTACCGAATAATTTAACAGTTGTACTTATCGCTTTAGGCGTAATTATTGCCGGCACCGGATTACTAAAACCAAATATTTCAACAACTGTCGGAGAATTGTATGAACGAAATGATGTTAGAAGAGACGCAGCGTTCACTTTATTTTATATGGGGATCAACTTTGGTAGTCTATTTGCGCCATTAATCACAGGCTATTTACAAACTAGAATCAGTTTCCATGCTGGTTTTTTAGCAGCAGCCATTGGTATGTTCTGTGGGTTAGTAGTTTACGCATTAAAACGTAAAAAATATCTAGGTCTTGCAGGTCGTAATGTACCAAAACCGTTAACTAAACCAGAAATCAAAAAATTCACCTTAATTACTACTGTGGTCATCGTATTGTTTTTAATCTATTTATTTATACTACATTTAAACGACGCACTTACATTAGGTAACTTTAGCTTCTTAATCACAATTTTAGGGATTGTGTTACCGATATACATATTTATCAATATGATTGTGAGTAAAGATGTTACGAAAGATGAACGTTCTCGTGTATACAGCTATGTACCATTATATATTACATCTGTTGCATTTTGGATGATTCAAGAACAAGGAGCGACGATACTTGCAACATTTGCTGATAAAAAAACACAATTAGAAATGTCAGTGTTAACCAATGGATTAATTGATTTTTCAATACCAGCTTCATGGGCGCAATCATTAAACCCAATTTTTATTGTGCTATTAGCACCAGTGTTCGCAACATTATGGATGAAGTTAGGTAAACGTAACCCACCTACAGTTCATAAATTTGCTTACGGTGCTATTATCGCTGGTTTTTCATATTTAATCATGATAATCCCGTTGGCAACGGGTAACGAGTTAGTCAATCCATTATGGCTCGTATTAAGTTTCTTATTAATTACCATCGGCGAATTATGCATATCACCTGTCGGTTTATCAACTACTACGAAACTTGCACCACTCACTTTTACTGCACGTATGATGAGCTTATGGATGTTAAGTAATGCCACAGCTCAAGGCCTTAACGCTCAACTTGTTGTTGTATACACAAAAATAAATCAAAGTGATTACTTTATGTACTCAGGTTTAGTTGCCGTAGTCATTGGTGTTATTCTGTTGTTCATTTCTCCAATAGTAAAACGCGCAATGAAAGGTGTTTACTAATTATTGGTATATAAAGTGTGGCGTCAAATTGAATATAGCGTTATATCATAAATTTCAATTCAAGCTTCAATAATAGGCAAAGCAAAAAAATCATTTTTGCTTTGCCTATTTTTTTGTAACTATACTATTTAATAACTTTAATTTATATGAATATAAATTTATTATTATATTCCCTACATAAATAACTGAATATTTTGAATATTGTTGTTTTGAGAATATTATTGCAATTTAATTTGATTAAGCGTAAAATCATTTTTATACATTCTTATTGGGAGCAAGAAAGGACGGGGAATGTTGCTTATGCAAAATCAAGATAAAGCCCATGAACAAGCTGTTCAATCTATTCCACAGAAAGGATTTTTTGGACACCCTAAAGGGCTAGGCGTTTTATTCTTTGTTGAATTTTGGGAGAGGTTCAGCTACTACGGTATGCGTGCCCTACTTATTTTCTATATGTATTTCGCTATTAAAGATGGCGGATTAGGTATGGACAAAGGCACTGCCCAGTCTATTATGGCTGTATATGGTGCGTTAATTTATATGACATCTGTGCTTGGCGGATGGATTTCCGATAGGATTACTGGTACACGTGCTGCAACGTTTTATGGTGGTGTGCTCATTATTATCGGTCATATTTTCTTAAGCTTACCTTTAGATATTGCTGGATTATTTATTTCTATGTTCTTCATTATCGTAGGTTCTGGTTTAATGAAACCAAGTATTTCCAATATTGTTGGCAGATTGTATCCAGATAGAGATACACGTATCGATGCTGGATTTGTTATATTCTATATGTCAGTGAACTTAGGTGCATTAATTTCACCAATTATCTTAGATCAATTCGTGCAAACTGGTAATTTCCATGGTGGTTTCTTAATCGCTGCAATTGGTATGGCACTTGGACTTGTTTGGTATATGTTTTTTAACAAAAAAAATATTGGGCCAATCGGTACAAAACCATCAAATCCATTAAGCAAAAGTGAGAAAAAGAAATATGGACTTTTATTTGCCGCTATCATCGTTATTATAGCAGTGGTGGTATTAATTACTGGATTAACAGGTACACTGTCATTTAGCTTAGTCAGTACAACTGTACTTATACTAGGTGTAGCGTTACCTATCATTTATTTCACAATTATGATTCGAAGCAAAGAAGTAACTGATGACGAGCGTTCAAGAGTTATTGCGTTTATACCTTTATTTATTCTTGGTGTTGTATTCTGGTCAATTCAAGAACAAGGCGCTAACGTACTTAACTTATTTGCTTTTGAAAGCAGTGATATGAAATTAAATATATTTGGATGGACAGCAGACTTTGGTCCTGCACTTTTCCAATCCATTAACCCATTATTTATCGTGTTGCTCGCGCCAGTTGTTTCACTCATATGGGCTAAAATGGCTCGACGCCAACCAAGTCTTGCAACAAAATTTGTTTTAGGTGCACTGTTAGCCGGCGCTTCTTACATAATGATTGGCTCTATCGGTCATGCTTCAGGCGGTGCATCGATCAGCGTTAACTGGGTTATTTTATCTTATATCATTTGTGTCATTGGTGAGCTATGTTTATCACCAACTGGTAACAGTGCAGCAGTAAAACTTGCACCAAAAGCTTTCAACACACAAATGATGAGCTTATGGTTATTAACTAATGCTTGTGCTCAAGCAATTAACGGAACTTTAGTTAAATTAATTGATCCCCTTGGTTACAAAAACTATTTCTTACTCTTAGGTTGCATCGCAATCGTAGTCAGCTTAATTATTTTAGCTTTTGTACCAAAAATTGTAAAAGGCATGCGTGGCATTAAATAATAAGTTCGAGGGAGCGGTACAAAAATCACTTTTTCCTAAAATGATTTTTGACCTGCTCCTTCTTTTTATATTTACATCTAGTAAATTTGGGGTAAAGTTTAGGAGAAAACAAAATTCAAAGGAATATGGTGACTCAATTGGAAAGTAATAAATTCAAACACGGTGTCTTATTTTATCATGAACAAAGCGGTATTAAAGATATTTATAGAGGATTAGGAGATGTTGCAACGTCGTTAACTACATTTTGCAAACATCTTTCTATACAATTAAGTGAAAATGAAGGAGATATTATTCAATATTGTCAAAAGATTAAAAACCAAAGTTACAGTGATGATGTTGATATTATCTTTATTCTAGGTGGAGACGGGACAATAAATGAATTAGTAAACGGCATCATGCAACATGAATTGGATGTCCCTATCGGTATTATCCCTGGTGGTACATTTAATGACTTTGTTAAAACGTTAAACATAAGCCCACGTCATAAAACCGCTAGCCAACAACTTATCCAATCAGAGTTGCAATCCTACGATGTTATGAAAATTAATGACCAATACGCATTAAACTTTGCGGGATTGGGACTCATTGTGCAAAATGCTGAAAATGTTCAAAACGGTAACAAAGATCTCTTTGGTAAATTGAGTTATGTAAGTTCTACTGTTAAAACATTGCTTAACCCAGAACACTTTGACTACAAATTGACAGTAGATGATACAGTCATTGATGGTAATACAGCGATGCTTGTCGTTGCAAATGGCTTATTCATAGGTGGCAGTCGCATACCTTTAACAGACCTTTCTCCTAATGATGGGTATTTAAATTTATTTATTTTTGAAGAACATAGTTCAAGCGTCCTAAGTGATATATTTAAACAAAGAGACAGCATGAATTGGAATCATATGACAGACGGTATTCAACATCTCTTATCTAAAAAGATATCCATAGAAACTGAACCTCAAATAAAGGTCGATATCGATGGAGAAATTGCATTGAAAACGCCCATTAATATTGAAATAATACCTAACGCAATTAAAATTTTAACCTTGCCTGCTAATAAAAAAGAACAATATGATGATTAAACTTATTATCACATTAACAAGAGCGATAAAAACATCTACATTACAGATTGTTTCATCGCTCTTTGTTTGAGTTAGATAATAAATATCTTATAAAAAGTTAAATTTCTGTTTAACTGATATCTATTTGACTGGTTATAAAAAACTTCTATTTCTAGATAATGATTTATAACTACTTTTTATCTTGTCTATCTTAAATGTTATATTCACTATCGCCTAAGAAATATTGCTCCACATCATACCAATTATTCACCCGTGTAAACCTGTCATCATTCACGTTATGTGAAGCTGTGTACATGATTGATTTACCAGTAAATATCGCGAGTTGGCGCGGATTGTCATCGATTAAATAATCTGCATTAACGATATCTTTGCGACCGCAAAATACAAAATGCTGTGGGTCTAAAAACGGAAAATATTCTCTTAACCATGCATACTTGTCATGAAATGAAGTCGGGACATCCATCGCAGCAGTAGCAATAAATACATCGTAATGTTCAGTAAGTTTTTTAACTACTTTTTGCGAATGTGCCATTACTTTTAATTTTTTGAAAAAACCTGGCTCGCGTAAAATTTCATGTAGTAAGCCATCATGTTCTGGCATTGCGTGTCTTAATTTCTTGCCATCTAACATGTCATACGTAATTCCCAAATCTGTACGTTTATTTACATCTTCAATAAGTGCGCCTACTGTATCAGCAAGCACTTCATCCATATCAATAGCAATTGATTTTCTTGTCATCTAATACTCTACTCCCTTTTAAAATCTCATTCCTCAATTATTCTAATGTGCTAATCTTGTATCCTATCACATTATTGCGCTATGAATCACTAACAGTATAGCAAAAAACGCTCAACTAAACCAAATTTATATATAGCTTTCTCATATAATCTTACAGCAATTATATATCTATACTATGGCGTTAATATATTTGAGTTCGTTGAGCGTTTTATTTTTATATTTAAAGTTTTATAGATTAAAGTTATTTAAAACTTCAATCATTTTATCATTTTGTTCTGGGAATCCTATTGTAATTCTAACACCGTTAGGAAATTCTCTTGTAATACATCCTACTTTTAATAATGCTTCATATAATTCGTGTGGCTTAGATGTATGCACAAAAATGAAATTCGTTTGACTTGGGTTTAATCGATCACTTTTCACTAAATTAAAAAATTTAGTTCTTTCTCGTGCATTTTTTTCACGAATAGAAGTTAAATAATCTTGGTCTGCCAATGCTGCTAGTGCAGCATGTTCTGATAGACGCCCTACGTTAAATGGTGGACGAATGATATTCCATTTCTCAATAGCTTCTTGGGCAGCAACAACATAACCGATACGCATACCTGCTAAGCCATATGCTTTAGAGAAAGTTCTAAGTAAGAAGGCATTCGAGAATGCTTCTTGTAATGCTAATGAATTAGGAAAATCTTCAGCCGTTACGAATTCGACATAAGCCTCATCAATAATTACTGGAATATGACTTGGCACACGTTCTAAGAAACTTTTTAATTCATTATGTGTAAAATATGTACCAGTAGGGTTGTTCGGATTACATAGCCATACTAATTTGGTATTATCGTCAACTTCGGATAAGATACCTTCTAAATCAAATCCGCCTTCTTTTAAAGGTACTTGCACAACGTCTGCCGATTCTACAATTGCATTATGATAATATTGGCCAAAAGTCATCTCACTTGTGACGATTTTATCCCCTGCTGTTAGCACAGCACGCGAAATCATCAATATAACTTCATCTAGCCCTGCGCCAAATAAAAGACGTGCAGGATCAACGTTTAAATGCTTACTTATTGCTTCTTTAATTAACGGAGAACCCGTTTCAGGGTAAAATTGCAATTCATCTAAATGATTTTTAATTGCTTCTTTTACTTTTGGAGATGGTCCATACAAGTTTTCGTTAGAGGCTAATTTATACAACTCACCTTCAATCCCGTATTGTTCTTTTAATGCTCTAGGTGATAAGCCTGGTTGGTATGCTGATAATTGCTCAATTTGTTTTTTCAT
Protein sequences of DBSCAN-SWA_8 >CP017459|2320065:2335637|2331026_2332535_+|AWI45251.1|DBSCAN-SWA MQNQDKAHEQAVQSIPQKGFFGHPKGLGVLFFVEFWERFSYYGMRALLIFYMYFAIKDGGLGMDKGTAQSIMAVYGALIYMTSVLGGWISDRITGTRAATFYGGVLIIIGHIFLSLPLDIAGLFISMFFIIVGSGLMKPSISNIVGRLYPDRDTRIDAGFVIFYMSVNLGALISPIILDQFVQTGNFHGGFLIAAIGMALGLVWYMFFNKKNIGPIGTKPSNPLSKSEKKKYGLLFAAIIVIIAVVVLITGLTGTLSFSLVSTTVLILGVALPIIYFTIMIRSKEVTDDERSRVIAFIPLFILGVVFWSIQEQGANVLNLFAFESSDMKLNIFGWTADFGPALFQSINPLFIVLLAPVVSLIWAKMARRQPSLATKFVLGALLAGASYIMIGSIGHASGGASISVNWVILSYIICVIGELCLSPTGNSAAVKLAPKAFNTQMMSLWLLTNACAQAINGTLVKLIDPLGYKNYFLLLGCIAIVVSLIILAFVPKIVKGMRGIK >CP017459|2320065:2335637|2321811_2322780_-|AWI45245.1|DBSCAN-SWA MKFLLNGVVLSIILFILTILSLFIGVSKVSITDIFHLSQEQINIIVSSRIPRTVSILISGSTLALSGLIMQQMMQNKFVSPTTAGTTEWAKLGILISMIFFPQENIIIKLIFAVILSIGGTFIFVKLVQYIRFTDVIFIPLLGIMLGGIVSSFSTFTALKTNTVQSIGNWLNGNFAIITSGRYEILYLSIPLLILTYIFANHFTIAGMGKDFSNNLGVNYEKIINIGLFITATITALVVVTVGTLPFLGLIVPNIVSIFRGDHLKNALPHTGMLGAVFVMFSDIIGRIIVYPYEINIGLTIGVFGTIIFLILLMKGRHDYAN >CP017459|2320065:2335637|2320065_2320866_-|AWI45243.1|DBSCAN-SWA MISVQGLNKTIQDKAILKEINVDINKGRLTSIIGPNGAGKSTLLSAITRLIDFEDGGIEIENKSISDYKSNELAKKLSILKQSNHTELNITVEQLVNFGRFPYSKGHLKQEDKEQVEYALELLQLKEIRHRYLKTLSGGQRQRAYVAMTIAQDTDYILLDEPLNNLDMKHSVQIMQTLRQLAKSLNKTIVVVIHDINFASCYSDDIIALKDGEVIKASTKDDVIQCDTLRELYEMEVQIEQIRGQRICIYFDELTTDQELSLVESV >CP017459|2320065:2335637|2329211_2330726_+|AWI45250.1|DBSCAN-SWA MKKTNYTHEEIMKDIPNKGFFGHPKGLSTLFFTEFWERFSYYGMKAILIYYLYYTVADGGFALPQSVAMQIVAIYGTLIYMSGIIGGWIADRITGTQNAVFYGGFLIMIGHILLSLPNNLTVVLIALGVIIAGTGLLKPNISTTVGELYERNDVRRDAAFTLFYMGINFGSLFAPLITGYLQTRISFHAGFLAAAIGMFCGLVVYALKRKKYLGLAGRNVPKPLTKPEIKKFTLITTVVIVLFLIYLFILHLNDALTLGNFSFLITILGIVLPIYIFINMIVSKDVTKDERSRVYSYVPLYITSVAFWMIQEQGATILATFADKKTQLEMSVLTNGLIDFSIPASWAQSLNPIFIVLLAPVFATLWMKLGKRNPPTVHKFAYGAIIAGFSYLIMIIPLATGNELVNPLWLVLSFLLITIGELCISPVGLSTTTKLAPLTFTARMMSLWMLSNATAQGLNAQLVVVYTKINQSDYFMYSGLVAVVIGVILLFISPIVKRAMKGVY >CP017459|2320065:2335637|2326291_2326690_-|AWI45248.1|DBSCAN-SWA MKVVYFSFSGNVRRFIKRTELTDVMELTQNNCSERIEEPFVLVTGTIGFGEVPQPVQSFLDVNEDLLKAVAASGNRNWGQNFAKAGRSISERYQVPLLLKFEVQGTANDVNEFKEKVGNFNEDYGREEIQSY >CP017459|2320065:2335637|2320862_2321822_-|AWI45244.1|DBSCAN-SWA MQISAKTKLFILIAITLLAAGLYLVIGIDFDIFQYQFSSRLRKLILMVLVGGAIAASVVIFQAITNNRLLTPSIMGLDAVYMFVKVLIVFVFGVQSALVTNLYLSFAITLIVMVAFSLLLFQGIFRIGNVSVYFILLVGVILGTFFRSITGFLELIINPEDFLAVQSAMFANFDASNSKLVTLCGIILIILVFITVIAIPYLDVLLLGKDQAINLGISYKRLTRLLLILVAILVSISTALVGPITFLGLLTVNLAHELMKTYEHKYILPATICISWLSLFIAQGVVENLFEATTQVSIIIDLVGGSYFIYLLIKRRHAN >CP017459|2320065:2335637|2333804_2334353_-|AWI45253.1|DBSCAN-SWA MTRKSIAIDMDEVLADTVGALIEDVNKRTDLGITYDMLDGKKLRHAMPEHDGLLHEILREPGFFKKLKVMAHSQKVVKKLTEHYDVFIATAAMDVPTSFHDKYAWLREYFPFLDPQHFVFCGRKDIVNADYLIDDNPRQLAIFTGKSIMYTASHNVNDDRFTRVNNWYDVEQYFLGDSEYNI >CP017459|2320065:2335637|2327405_2328281_+|AWI45810.1|DBSCAN-SWA MKGIIAILISAIGFSFMSVFFRLAGDLPVFQKSLARNLVAMFIPLYFIFKYKQPLFGKLSSQPLLISRSALGLIGVLLNIYAIDHMILSDADTLMKLNPFWTILLSLIFLNEKVRNYQFIAMIVAIFGMLFVVKPEFSSSMIPAIGGLFSGIFAASAYTCVRALSNREAPYTIVFYFSFFSIIVLIPFTMFTFEPMSTMQVIYLIGAGLAAAAGQIGITLAYSFAPAKDISIFTYASIIFTALFGFILFGESPDFYAILGYAIIIGASYYMFEKARRQPLTIQKKEQKSKY >CP017459|2320065:2335637|2324223_2326329_-|AWI45247.1|DBSCAN-SWA MKIMDEKKYNHIELNNEVTKRKENGFFNLEKDQEALAVYLEEIQDKTIYFDSEIERLRYLVDNDFYFDVFEKYAEADLVEITDYAKSIPFRFASYMSASKFFKDYALRTNDKSQFLEDYKQHVVIVALYLANGHKPTARQLISAMIEQRYQPATPTFLNAGRARRGELVSCFLLEVDDSLNSINFIDSTAKQLSKIGGGVAINLSKLRARGEAIKGIKGVAKGVLPVAKSLEGGFSYADQLGQRPGAGAVYLNIFHYDVEEFLDTKKVNADEDLRLSTISTGLIVPSKFFDLAKEGKDFHMFAPHTVYNEYGVTLDDINLDEYYDDLVANPNVDKKKKDAREMLNMIAQTQLQSGYPYLMFKDNANKVHPNSNIGQIKMSNLCTEIFQLQETSIINDYGMEDEIKRDISCNLGSLNIVNVMESGKFKDSVHTGMDALTVVSDEADIQNAPGVRKANSELHSVGLGVMNLHGYLAKNKIGYESEEAKDFANIFFMMMNYYSLERSMQIAKERQETFKDFDKSDYANGKYFEFYTSQSFEPKYEKVRKLFDGLEIPTSEDWKALQKEVETHGLFHAYRLAIAPTQSISYVQNATSSVMPIVDQIERRTYGNAETFYPMPFLSPETMWYYKSAFNTDQMKLIDLIATIQTHVDQGISTILYVNSEISTRELSRLYVYAHHKGLKSLYYTRNKLLSVEECTSCSI >CP017459|2320065:2335637|2328294_2328795_+|AWI45249.1|DBSCAN-SWA MSEGRNQEDLTDITLLGNQNNKYDFDYRPDVLESFDNKHQGRDYFVKFNCPEFTSLCPITGQPDFATIYISYIPNVKMVESKSLKLYLFSFRNHGDFHEDCMNIIMNDLIELMDPHYIEVWGKFTPRGGISIDPYTNYGRPDSKYEKMAEHRLMNHDLYPEKIDNR >CP017459|2320065:2335637|2334581_2335637_-|AWI45254.1|DBSCAN-SWA MKKQIEQLSAYQPGLSPRALKEQYGIEGELYKLASNENLYGPSPKVKEAIKNHLDELQFYPETGSPLIKEAISKHLNVDPARLLFGAGLDEVILMISRAVLTAGDKIVTSEMTFGQYYHNAIVESADVVQVPLKEGGFDLEGILSEVDDNTKLVWLCNPNNPTGTYFTHNELKSFLERVPSHIPVIIDEAYVEFVTAEDFPNSLALQEAFSNAFLLRTFSKAYGLAGMRIGYVVAAQEAIEKWNIIRPPFNVGRLSEHAALAALADQDYLTSIREKNARERTKFFNLVKSDRLNPSQTNFIFVHTSKPHELYEALLKVGCITREFPNGVRITIGFPEQNDKMIEVLNNFNL >CP017459|2320065:2335637|2323017_2323986_-|AWI45246.1|DBSCAN-SWA MKAVNWNTQEDMTNMFWRQNISQMWVETEFKVSKDIASWKTLSDEEKNAFKKALAGLTGLDTHQADDGMPLIMLHTTDLRKKAVYSFMAMMEQIHAKSYSHIFTTLLPSSETNYLLDKWVLEEPHLKFKSDKIVNNYHKLWGKEASIYDQYIARVSSVFLETFLFYSGFYYPLYLAGQGKMTTSGEIIRKILLDESIHGVFTGMDAQSLRNELSESEKQQADQEMYKLLDELYKNEVSYTQSLYDDIGLTEDVLNYVRYNGNKALSNLGFDPYFEEKEFNPIIENALDTSTKNHDFFSVKGDGYTLALNVEALQDEDFIFED >CP017459|2320065:2335637|2332660_2333614_+|AWI45252.1|DBSCAN-SWA MVTQLESNKFKHGVLFYHEQSGIKDIYRGLGDVATSLTTFCKHLSIQLSENEGDIIQYCQKIKNQSYSDDVDIIFILGGDGTINELVNGIMQHELDVPIGIIPGGTFNDFVKTLNISPRHKTASQQLIQSELQSYDVMKINDQYALNFAGLGLIVQNAENVQNGNKDLFGKLSYVSSTVKTLLNPEHFDYKLTVDDTVIDGNTAMLVVANGLFIGGSRIPLTDLSPNDGYLNLFIFEEHSSSVLSDIFKQRDSMNWNHMTDGIQHLLSKKISIETEPQIKVDIDGEIALKTPINIEIIPNAIKILTLPANKKEQYDD |
13 | uncultured_Caudovirales_phage(41.67%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_9 |
2349084 : 2356517
Sequences of DBSCAN-SWA_9
Nucleotide sequences of DBSCAN-SWA_9 >CP017459|2349084:2356517|DBSCAN-SWA ATTATAATCTCTCCAATATTTTAGTCTTATCTTTAAATTCTTGTACTTCTGCTTCAGGATTGGAATCTATTGTAATACCTGCTCCCACACCATATACTGCTTCTCCGTTTATATATTGTATTGTACGAATTGGTACATTAAATATAGATTTCCCACTAGGTAACAACAAACCAATTGTGCCACAGTAGCCATTTCTAGATGTTTGTTCTAATTGTTTAATATAGGTCATTGTGTTGAGTTTCGGCGCACCAGTAATAGAACCGCATGGGAATATTGCTTTTAATATACTTTCTAAAGACAAATGGCGTCCCAACTGGCCAGTTACCATGGAGGTCATTTGATAGACTGTCTGGTATTTTTCAATATGAAATGGTTTGTAGACTTTCACCGTTCCAGTATTAGCAATTCTACTAATATCATTGCGTAATAAATCAACAATCATTACATTTTCAGCTCTGTCTTTCGTGGAACATATTAACTGATTTAAATTATCTCGATCTTCTAATTCTGTTTTACCCCTAGCAATTGTACCTTTCATAGGTTTGCTTAAAATGGTGTTAGATTGTTTTTTAAAAGGTCCGTATTGAAAGAAAAGCTCTGGAGACAATGATGCAATTTGCACTTCATCTGTGTCGATTAATGCAGAATAATAACCATGGTTGTCTCTTTGCAATACATGGTACAATTCAGAGATTGGCCCTCGTATATCGTCTTTTAGCCTTGTCGTATAATTGACTTGATATGTATTGCCTTCAGTTATAGCATGTTGTACCCATTTGATGTGTTTAATCATTTGTTCATGTGCATATTGGAAGGTAAAATGATGTTTCTTTTGATATCCATTACACACCTTTTTCCCTTCATTTTTTGCTTGTTTAAATACATAAGCGGCTGCATATATAAATGAAGATTCTGATTCGATAGTTGCCATTTGACTGTTGAAGTAAGTAGCTGCTTCATAAGGCAAATATAAAGCGACATAATCGCCATTATTTTGATGTGTCTCAGCAAAACGTACAACTTCTCCTACCTCTTCAATGTGGTATGCAATTTTTTTACGCAAATATTTTGTGAGTTGCAATTGATATGTTTCATTTTGTTCTTCATCTATGTAATAACGATAATTAAACTTTATTTGCATGATATGCCTCCACAATTTCAATAAATAATTTAATTTGTTCTATACCGTACTCACTTAAAATTGATTCAGGATGATATTGCACACCGTAAACAGCATCATCTTGATGTGCACATGCCATAATAACACCTTCATCATTGATAGCTGTAGCGCGTAGTATTGAAGGAAATGTATGTATGTTAGCCATTAAGGAATGATAACGCATGACCGAAAACGTCGTAGGTAAGTCTTTAAAAATGTCTGTACCTTTATGCGTAATGAAAGTTGTATGACCGTGAATTGGTTTTTTGTTTTTTATAATGTCACCGCCGAAATGTGTAACTATGAGTTGAAATCCTAAACAAACACCTAAAATCGGGACATGTTTGGCAAATCGGTCTATCACTTTGTTCAGTATAGGATAATCTATTGGCTTGCCTGGCCCTGGCGATATGACAATCGCTTCTGGTTTCATACCGAAAATCTCATCTATAACAACTTCATCAACATCAATAACAAACACTTCTCTTGCATAGCATTGTTTAAGATAATCTACAATATTATATGTGAATGAATCTTTATTATCGATTACAAGTAGCATTAAATCACCTCAATAGTATTTATATAAACATTTATTATGTTCATTATCCCAAATCCTAACTTGATTTTACAGCTTAAATGTATTATTCTAGTCACGGTATAAATGAAACAGAGGTTTCTAGCTGACACCCTCTATAAAAAACTAGACACCGGAACGACGTCTATCTTTTTTATAGAGATAGACGTTTTTTTATGGCGTCATAACATTTATATGAAAGCTAGTATATTTTAAGGAGTGTAAATTAGAATGACGCAACGCACATTAAACAATAATAAAGCCATCGTCGTATTTAGCGGCGGTCAAGATAGTACGACATGTTTATTTTGGGCTAAAGCACATTTTGAAGAAGTCGCTTTGGTCACTTTCGAATATGGTCAACGACATGATACAGAAATCCAAGTTGCTAAACAAATTGCTAAGGAACAACAAGTTGAACACCATGTACTCGATATGTCACTATTATCTCAACTCACTCCGAACGCATTAACACAACATGATATGGATATCGAAGAAGGAGAAGATGGCGTACCAAATACTTTTGTACCAGCACGTAACCTATTATTTTTATCTTTTGCTGGGGCTTTGGCATACCAAACTAATGCAAAACATATTATTACTGGCGTTTGTGAAACTGACTTTTCTGGCTATCCTGATTGTCGTGATAGTTTTATTAAATCAATGAACGTCACACTTTCGCTCTCTATGGATAAAGATTTTGTCATCCATACACCACTTATGTGGCTTGATAAGAAACAAACATGGGCATTGAGTGATGAGCTGGGTGTACTCGACTATATTAGATATCAAACTTTAACTTGTTATAACGGTATTGTCGGCGAAGGCTGTGGCGAGTGTCCTGCGTGTAAACTACGTGCTCGAGGATTAAACGCTTATTTAGAAGAAAAAGGAGCGAAATAATATGTTCCAACAACATTACCCTAGCATTAACCATAACTACCAGTTTGAACTTAATAAAGATTTTAATTTTTCAGCCGCGCACTATATTCCGAGTGATGACGCTGGAAAATGTATGCGTACTCACGGCCATACTTACTTTGTAAATTTAACTATTGGTGGGGACGTCTTAGATCATAATGGTTTCTTAGTGAATTTTAGTGAATTGAAAAAGTTAGTGCATGATCAATTTGATCACCATTTATTAAATGAATTACCACAATTTAAAGATAAAAGCCCTTCCACAGAAATAGTTGCGCAAACCATTTACGAAATGGTGCAAACCTCTTTAAACGAAAGAGCCAATCAACCACAATGCTTACAAGTTTATGTAAGAGAAACACCAACGAGTTATGTCATATTTAGACCAAAGGAGTTAAATCATGAGTAAAATTCCTGTTCTTGAAATTTTTGGCCCAACCATTCAGGGCGAAGGTCGCGTCATTGGTCGTAAGACGATGTTTGTACGTACAGCTGGATGCGATTACCGATGTAGCTGGTGTGATTCTAGTTTTACATGGGATGGCAGTGCAAAAGAAGATATACGTATGATGAATGCTGAAGAAATTTATGCGGCATTATATGACCTTGCTGGTGAGTCGTTTAATCACGTGACCATTTCTGGTGGCAACCCTGCTTTAATCAGAGGAATTCAGGGCTTAGTGGATTTGTTTGAAGAAAAAGGTATACAAAGCGCCTTAGAAACACAAGGTAGTAAATTCCAACCATGGATGACACAAATTGATGATTTAACGATTAGCCCTAAACCACCTAGTTCAATGATGAAGCCAAACTTACCTATCTTAGATGACGTTATTGCAAAATGTGTCCCAGAAACACTAAACCTAAAAGTTGTTATTTTTGATGATGATGATTATGAGTTTGCTAAAATGATTCATCACCGGTATCCCGATATCCCTTTTTATCTACAAGTTGGTAACCCCTACTTAGATGGCGAGTATGTCGAAGCACATACAGAAAAATTACTATCATTATACGAAACGCTTGTAGATCGAGTAATGGTAAGTAATGATATGAATAATGTATATGTATTGCCTCAATTACACACTTTACTCTGGAGTAACAAAAAAGGTGTTTAAATTGTGTCGAATAACCGGTTCATTGTATAATGCCTTTTGTCTATACAATGAACCGTTTTTTCATTTGAATCAATAGACTTAGGAACAATAGTCACTGTATATGTATAATGATTTAAATTAATAACCTTTTACAGGTTGACTCGTTTTTATTTCATAAATTATAAAATATCAACTGTTATTAAATGATTAAATTAAACTTACTTGATATAATGTTGCAGTGAAGTATCTAGGTTAGGAGAGCAACATGCTAATAAATATAATCATAAATATAGCTACGGTATTAATCATTCTAGGTATTGATTTATATCGTCAGAATTTCAAACAACTTAAGTTCAGCTCTATACTTTTAGCAATAACTATAAATGCTATGATCAATTTAGTTATTGTGGGCAAATATGATTACATAACATTTTATACTTGTGTTCAATTGATTATTTGGACAATGCTACAATTGTATTTAAATAAAAAGATCAAAGTATATGTGATTACTGATCAAAAATTGATTGGTTTCATTTTATCAATTATCATGAGTACATCTTTAATCCTTTCATACGATACAAGTAACGATTCTTACTATATGTCTATTCCATATTTAGCACCGGCCATTTTTATTATAGGCGCAACTTTGTTGTTCTATAGTACTTTCCAAACACATGAAAAAGAACAAATTAAAGTATTAAATCGTATTCGCCGGCCTATCACGATTGGACAAATATGTATTATATTATCTTTTACTATCATGACTTTATTAACACCGTATTGGTATGCCTTTATTATTGTACATTTGTTATTTATACTTTTTTTATTATGGCAGAATATATTTTTTTCACAAAAATGATTAACAAATTATATTTTGTGGTATGTAATAATAGTTAAATAAATTATAGAGGAGGTATATCATGTTTGGATTTATCCTTATGTTAATCGTCGGTGGTTTAATCGGTTGGATTGCTGGTGGCATCTTAGGTAAAGATATCCCCGGTGGCATTATCGGTAATATCATTGCTGGTGTTGTAGGCTCTGCACTGGGTTCTTGGATTTTAGGCGATTGGGGTTGGCACTTAGGTGGCATTGCGATATTCCCTGCGCTTATCGGAACGATTATCCTTGTAGCGCTCTTATCATTTATATTAGGTAAATTGCGCAAAAAATAATATATCATATTTAAATAACCCCAGATTAAGCGAAACCAAGCTTAATCTGAGGTTATTTTTATCTGTGTTTTACAAGTGGTTTATCTTTATCAGAAGTTGCTTTACGCGACGGTGTATATAAAGATGCTGCGCTGTTCACATTATTTTGGTTATCTTTAATTGTATAATCTGACATTTGCAATTTAGATTCAGATTGCTTTGTTTTATTTTTAGGATCCAAATTAGAAACTTGCACAATATATTTTGGACGTTGTTTGACTTCATAATAAATTCTACCAATATACTCTCCAACAATACCTATTGAAATGAGTTGGATACCGCCGAGTAATAAAATCGCTGCAATCGTTGAAAAGTAACCTGGTGTTTTAACACCATTAATCATAATGCTTCCAAAACTAAAGACAATATAGAGTAAGCTCACAAAGAAAACAACAAGCCCTAAATAAATCATGGCACGTAATGGTTTATTGTTAAATGAAATGAGACCATCAATACCATAATTCAATAATTTACCAAATGACCATTTCGATTTTCCGTCTTCTCTTTCAACATTTTCATAAGTGAATACCTTAGTGTTATAACCAATCCATTCGAACAATCCTTTTGAAAAACGATTGTATTCATTTAACTCTGTCAATGAATGAATTGCACGTTGGCTGAGCAACCTAAAATCACCAATGCCGTCTTCTAATTTTATGTCTTCAACAAGATGATTAATCACTTTGTAATACACTTTAGTTAGCCATTTTCTTGAATGTTTTTCACCTGTTCTATCACGTTTAGCCACAACTTGATCGTAACCATCTAAATAACTGTCAACCATTTGGGGGATCAACTCAGGGGGGTGTTGTAAATCAGCGTCAATCATCACTACAGCATCACAATTGACACTGTGTTGAAAACCAGCAATCATTGCGGATTCCTTACCAAAATTTCTACTGAATGAAATATATTTCACATGATTGTCATGTGTCGCCATTTCTTGAATATAATTGATTGTTTTATCGTGGCTACCGTCATCTATAAATAATAATTCGTAGTTATACTGACGGTTGAGACTGTCTTCCGTTAAGATTTCTGTTAATCTGTCATACGTTTTTAATATTACTTCACCTTCATTATAACATGGCACTATTATTCTTATATCCATATTAAACACCTTCATTTCAATGACTTCAATTTCACTTTATCAATATTCACAGTTATTTTGCCATTCTTATTATTTAGATTTACGCAATCTTTATATTACCTTAATATTCATTAATGAAACTTAATTGTTTAACAAATATTGCAAATTGTTGTTAACTAAACTGCTTTTATAATTAGGAATTGTCACTGTTTGAATTACAAATTTTCTTAATACAGTAATAAATCATTAAACTTAAATATTGTTCTATATATTTTTTGTAAAAAGTTGTAACTTTGTCCATTAAGTTTATCAACTATTGCAAACGATTGAAAATAAAACCCTTTATAACTTTAATCTAAAAAACAGGAAAGAAATCAAAAGTTACTAAATTGATTTTCTCCCCTGTCCTTTAACAAGAATATAATAAGTTTTCAACATATTTAATATGAATAGATATAGCTATATTTAATTACTGTAATGAGACGCTTATAACCTGTAATAAGTGGCCTATCCGCCCAAAGTGATACTGCATGAAGGTATTATTTTAAGTCACCAATACGTACCTTATCTGGATCTTTACCTTGACGGTCATTTCGATTTAAATTATCTATCTCAGCAATATCCCTTAATTCTAAAGTGAAATCAAAAATATCATAATTTTCCTTAATACGTTCTGGTGTTTTTGATTTAGGAATTATCAAGCGATTATGTGCTAAATGCCAACGTAAAACAACTTGTGCAGGTGTCTTACCGTATCGATTTGCGATGTCAGTTATCACTCGATGATCCAACAATCCTTGATTTCTCATTAATGGCATCCAAGCTGTTACAGCAATATCGTTATCGTCACAATAAGCTTGCAACTCGTGTTGGCTAAAGTAAGGGTGTACCTCGATTTGGTTTACAGCTGGTGTGATTTCAGTTTCAGCCATTAATGTCTCTAAATGATGTTGTTTAAAATTACAAACACCAATTGCACGAATACGTCCTTCTTTATATAGTTTTTCCATTGCTTTATAGGTTTCTATAAACAAATTATCTGCTTCACATGGCCAATGTATTAAGAATAAATCTAAATAATCCGTGCCTAAATTTTCTATTGATTTAGTGAAAAACTCTATTGTTTTATCATATCCTTGGTAATCATTCCAGATTTTAGATGTAATGAATAAATCAGAACGAGGTATATCTGCTTTTTTTAAAGCATTTCCTAATGCTATTTCATTTTTATAAAAGTAGGCTGTATCAAACGCACGATAACCTGATTCTAATGCAGCATTGACCGCTTTTTCCATTTCTTCTTCAGTGATTTTATAAACACCCAAACCAACTTTCGGCATTGGATAACCATTATTTAAATAATATGTATCGGCTAACAT
Protein sequences of DBSCAN-SWA_9 >CP017459|2349084:2356517|2353099_2353693_+|AWI45269.1|DBSCAN-SWA MLINIIINIATVLIILGIDLYRQNFKQLKFSSILLAITINAMINLVIVGKYDYITFYTCVQLIIWTMLQLYLNKKIKVYVITDQKLIGFILSIIMSTSLILSYDTSNDSYYMSIPYLAPAIFIIGATLLFYSTFQTHEKEQIKVLNRIRRPITIGQICIILSFTIMTLLTPYWYAFIIVHLLFILFLLWQNIFFSQK >CP017459|2349084:2356517|2355677_2356517_-|AWI45272.1|DBSCAN-SWA MLADTYYLNNGYPMPKVGLGVYKITEEEMEKAVNAALESGYRAFDTAYFYKNEIALGNALKKADIPRSDLFITSKIWNDYQGYDKTIEFFTKSIENLGTDYLDLFLIHWPCEADNLFIETYKAMEKLYKEGRIRAIGVCNFKQHHLETLMAETEITPAVNQIEVHPYFSQHELQAYCDDNDIAVTAWMPLMRNQGLLDHRVITDIANRYGKTPAQVVLRWHLAHNRLIIPKSKTPERIKENYDIFDFTLELRDIAEIDNLNRNDRQGKDPDKVRIGDLK >CP017459|2349084:2356517|2354067_2355159_-|AWI45271.1|DBSCAN-SWA MDIRIIVPCYNEGEVILKTYDRLTEILTEDSLNRQYNYELLFIDDGSHDKTINYIQEMATHDNHVKYISFSRNFGKESAMIAGFQHSVNCDAVVMIDADLQHPPELIPQMVDSYLDGYDQVVAKRDRTGEKHSRKWLTKVYYKVINHLVEDIKLEDGIGDFRLLSQRAIHSLTELNEYNRFSKGLFEWIGYNTKVFTYENVEREDGKSKWSFGKLLNYGIDGLISFNNKPLRAMIYLGLVVFFVSLLYIVFSFGSIMINGVKTPGYFSTIAAILLLGGIQLISIGIVGEYIGRIYYEVKQRPKYIVQVSNLDPKNKTKQSESKLQMSDYTIKDNQNNVNSAASLYTPSRKATSDKDKPLVKHR >CP017459|2349084:2356517|2351720_2352146_+|AWI45267.1|DBSCAN-SWA MFQQHYPSINHNYQFELNKDFNFSAAHYIPSDDAGKCMRTHGHTYFVNLTIGGDVLDHNGFLVNFSELKKLVHDQFDHHLLNELPQFKDKSPSTEIVAQTIYEMVQTSLNERANQPQCLQVYVRETPTSYVIFRPKELNHE >CP017459|2349084:2356517|2350207_2350801_-|AWI45265.1|DBSCAN-SWA MLLVIDNKDSFTYNIVDYLKQCYAREVFVIDVDEVVIDEIFGMKPEAIVISPGPGKPIDYPILNKVIDRFAKHVPILGVCLGFQLIVTHFGGDIIKNKKPIHGHTTFITHKGTDIFKDLPTTFSVMRYHSLMANIHTFPSILRATAINDEGVIMACAHQDDAVYGVQYHPESILSEYGIEQIKLFIEIVEAYHANKV >CP017459|2349084:2356517|2351047_2351719_+|AWI45266.1|DBSCAN-SWA MTQRTLNNNKAIVVFSGGQDSTTCLFWAKAHFEEVALVTFEYGQRHDTEIQVAKQIAKEQQVEHHVLDMSLLSQLTPNALTQHDMDIEEGEDGVPNTFVPARNLLFLSFAGALAYQTNAKHIITGVCETDFSGYPDCRDSFIKSMNVTLSLSMDKDFVIHTPLMWLDKKQTWALSDELGVLDYIRYQTLTCYNGIVGEGCGECPACKLRARGLNAYLEEKGAK >CP017459|2349084:2356517|2349084_2350224_-|AWI45264.1|DBSCAN-SWA MQIKFNYRYYIDEEQNETYQLQLTKYLRKKIAYHIEEVGEVVRFAETHQNNGDYVALYLPYEAATYFNSQMATIESESSFIYAAAYVFKQAKNEGKKVCNGYQKKHHFTFQYAHEQMIKHIKWVQHAITEGNTYQVNYTTRLKDDIRGPISELYHVLQRDNHGYYSALIDTDEVQIASLSPELFFQYGPFKKQSNTILSKPMKGTIARGKTELEDRDNLNQLICSTKDRAENVMIVDLLRNDISRIANTGTVKVYKPFHIEKYQTVYQMTSMVTGQLGRHLSLESILKAIFPCGSITGAPKLNTMTYIKQLEQTSRNGYCGTIGLLLPSGKSIFNVPIRTIQYINGEAVYGVGAGITIDSNPEAEVQEFKDKTKILERL >CP017459|2349084:2356517|2352138_2352855_+|AWI45268.1|DBSCAN-SWA MSKIPVLEIFGPTIQGEGRVIGRKTMFVRTAGCDYRCSWCDSSFTWDGSAKEDIRMMNAEEIYAALYDLAGESFNHVTISGGNPALIRGIQGLVDLFEEKGIQSALETQGSKFQPWMTQIDDLTISPKPPSSMMKPNLPILDDVIAKCVPETLNLKVVIFDDDDYEFAKMIHHRYPDIPFYLQVGNPYLDGEYVEAHTEKLLSLYETLVDRVMVSNDMNNVYVLPQLHTLLWSNKKGV >CP017459|2349084:2356517|2353754_2354009_+|AWI45270.1|DBSCAN-SWA MFGFILMLIVGGLIGWIAGGILGKDIPGGIIGNIIAGVVGSALGSWILGDWGWHLGGIAIFPALIGTIILVALLSFILGKLRKK |
9 | Pandoravirus(14.29%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|