Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NC_016894 | Acetobacterium woodii DSM 1030, complete sequence | 3 crisprs | csa3,WYL,RT,DinG,DEDDh,cas3,cas2,cas1,cas4,cas5,cas7,cas8b2,cas6 | 0 | 11 | 6 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_016894_1 | 2375564-2375657 | Orphan |
NA
Consensus repeat of NC_016894_1
|
1 spacers
spacers of NC_016894_1
>1.1|2375589|44|NC_016894|CRISPRCasFinder CCATCCGGACCTCCGTTAGGAACATATTTTTCGCGTCGGAAACT |
CRISPR arrays and Neighbor proteins around NC_016894_1
The CRISPR arrays of NC_016894_1 >merge|NC_016894|1|2375564-2375657|CRISPRCasFinder ATTGCCGCCATGTCCGCCATTACCGCCATCCGGACCTCCGTTAGGAACATATTTTTCGCGTCGGAAACTCATTCCGCCATGTCCGCCATTACCG >NC_016894|1|1|2375564-2375657|CRISPRCasFinder ATTGCCGCCATGTCCGCCATTACCG CCATCCGGACCTCCGTTAGGAACATATTTTTCGCGTCGGAAACT CATTCCGCCATGTCCGCCATTACCG
>NC_016894.1|WP_052307079.1|2373994_2374357_-|YhbY-family-RNA-binding-protein MLTSKQRSYLRKLAMDIPDIIFIGKDGLTPQVIVQTKDAIIARELIKGKVQNNSLEDVKDVAQALAAATKSDIVCTIGNKFVLYKKNLLKTKIEVPTKNQKPIKRVKKKALNPLRKFSNS >NC_016894.1|WP_014356377.1|2373335_2373977_-|nicotinate-nucleotide-adenylyltransferase MKKKIGLLGGTFNPIHTGHLLLAESARDQYELDKVLFIPTGNNPFKLSQDEITRKHRLKMVELAINGNDYFEILTHEIDQNGITYTIDTINIIKEIYPDCDFYFIAGADLMFEITLWKGASELLKSVKFITTFRPGYSHERLDMRIKELQEIYGASIYKLYATEMDIASSDIRARIKNGYSIRYLLPDSVAAYIHTHGLYLSELPFEDENESD >NC_016894.1|WP_041668692.1|2372773_2373349_-|bis(5'-nucleosyl)-tetraphosphatase-(symmetrical)-YqeK MNRTEIEADLKKKLSAKRFRHTQNVVEAASNLAYIYGCNVDQVSLAALLHDCAKYFSDQQLLQYAKKHHLKVDRVSRYNQQLLHGPVGAIVAKQTYGVEDVAILHAICYHTTGCKEMTTLDEIIYLADYIEKDRSFPGIEDIRKMADTNLDLATIMALTNSICYVASVGDLIHKRTIDARNDLIIKNKKRK >NC_016894.1|WP_014356375.1|2372428_2372773_-|ribosome-silencing-factor MIFIIPEEFAQKIKEWIDNKNGFDIEVINVTEMTSIANYFVIASGSSERQVKAIADNIEYEAKELEIFPKGIEGQREGRWILLDYYDVIIHIFHAEERGFYSLEKLWKDSEVSR >NC_016894.1|WP_014356374.1|2371104_2372202_-|redox-regulated-ATPase-YchF MKIGIVGLPNVGKSTIFNALTKAGAESANYPFCTIDPNIGVVAVPDFRLAVLEKMYNSKKVIPTSIEFVDIAGLVRGASKGEGLGNKFLSHIREVDAIVHVVRCFEDDNVVHVEGKIDPIDDLETINMELIFADLEMLDRRIEKNKKLAKTNPQEKANIEVAMRLREILETGKMPNDDEFSADEWEFIQTIQLISIKPVLYIANVSEDDLHEDNEMVTRLKATVLENHSGNHKDIIKISAKIEEEIAQFDDAEKAEFLSDMGLAESGLDQVIRTGYKLLGLITFLTAGPQEIRAWTVTDGTKAPQAAGKIHSDIERGFIRAEITSYDQLIEAGSEVKAKESGVTRVEGKDYVMKDGDVTFFRFNV >NC_016894.1|WP_014356373.1|2369239_2370940_-|B12-binding-domain-containing-radical-SAM-protein MKDLVLVAINAKYIHTNLAVRVLKAQLLEFEIEILEMSINDSMHRIVQQLMDIDTKIIGFSCYIWNIEIIFKLAEIIKKAKPTVQIMLGGPEVSFDGKALLETYSFCDFIIQGEGENKLQQFMNNPQNLAEISGLCFRDENGIVWENTDDKPLALNNLTFAYFQNDLESLKHKIIYYETMRGCPFSCSYCLSSVNNGVNMLPLERVYEELDFFIQAGVKQVKLVDRTFNCNLRRTKDIFRYLIKCGGTTNFHFEMTGDLIDDEMILLLKSAPAGLIQFEIGIQSTDPITLKAIGRKISLTQTEKNVKKLLEPQNIHIHLDLIAGLPYETYLVFKSSFNRVIALFPDMLQLGFLKCLKGTRIRKEADIHDYRYTSFPPYEIISNKYINAKELYQLRQIEMLVDRYFNSGAFKYTMHFIIQTNLFDTPFDFFEQFSFYWAEQGYYDMGKSKEQLYGIIGEFCEKHQKGQLIKEYLKFDFLTNGNLRLPSGMVDNSPNKEWIFEFLKEPRHIETYLSDFINFAPKKIYNQIKFQNFSQLFMEQFFGKTSVNTNKSSLLLFTEKSYQVVN >NC_016894.1|WP_014356372.1|2366882_2368799_-|threonine--tRNA-ligase MITITLKDGSIKNYEPGITVLDVANDISSGLAKNTMAGELNGEVVDIRQPINENSTLNLLKFEDAGGQHAFWHTGSHLLAQAIKRLYPQAKLAIGPAIENGFYYDIDLDVIITPEIMEKIEKEMAKIVKEGLKINRYELSRQEALEKVTKEGEIYKAELIENLPADAIISFYSQGEFSDLCAGPHIQNLSGIKAIKLLSLAGAYWRGDEKNKMLQRIYGITFPKKSQLDEYLTRLEEAKKRDHRKLGKELDLFSLHEEGPGFPFFHPKGMIIRNELENFWREEHQRRGYHEIKTPIILNNDLWKRSGHWDKYKENMYFTEIDESEYAIKPMNCPGGMLVYKTKGHSYRDLPLKMGELGLVHRHELHGALHGLMRVRAFTQDDAHIFMTPEQIQEEVIKVIDLADDVYKIFGFSYKVELSTQPENSIGSDEVWEIATEALRKALEKKEINYRLNPGDGAFYGPKIDFHLEDSLGRTWQCGTIQLDFQMPERFDLNYIGSDGEKHRPVIIHRTILGSIERFFGILIEHFAGKFPVWLAPVQVMIIPVADAHHDFAKGIADQLTALGVRASVDGRDEKLGYRIREAQLQKVPYMLVVGEKEAEGGDLALRIRDTGDAGLISLADLKEKLIEKIKTKSLTLD >NC_016894.1|WP_014356371.1|2365405_2366398_-|ABC-transporter-substrate-binding-protein MKKNGKKLMAILFATTLVVLGAGCTSSATKEESKNVSIGIVQYVDHVALDAAREGFISALADNGYTDGDNITIDVQNAQGDQSNLSTISDRFVSNKVDLVLAIATPAAQAIAGKTTEIPILGTAITDYVAARLVKSNEAPGGNVTGTTDMNPISEQIDLLVKLVPTAKTVGVLYTSSEDNSVIQAKIAKEAIEKLGMKYVEVTVTNSNDVQQATQSIVSQCDAIYIPTDNVFASAMPQVENITTQSKTPVICGESGMVESGGLATLGINYSDLGYQTGLMAVKIIKGEAKPATMPIESATKFDYAINGSVAQEIGLTIPADLQQYIITTK >NC_016894.1|WP_041668690.1|2364419_2365316_-|ABC-transporter-permease MLQIILGAISLGLLWAIMTIGVYITYRILDIADLTVEGSIAMGAAIAAFSIFNGMNPFLATALAFVGGMLAGLVTGILHTKLKIPALLAGILTMIALYSVNLRIMGKANLSLLRIDTVFTSLENLGLDPTNAVMLFGFISVMIIVALLYWFFGTEIGCAIRATGNNPQMARAQGINTNNMIILGLVISNGLVALSGSLIAQSQSFADIQMGIGSIVIGLASVIIGEVIFGTRNFLNCLISLVLGAITYRIIIALVLKLGMPANDLKLFTAITVAIALSLPILKSYLRPFKKSIKGGDL >NC_016894.1|WP_014356369.1|2363625_2364420_-|ATP-binding-cassette-domain-containing-protein MLVIKDVEKKFNPETVNEKIALSNLSLTLEEGDFVTLIGGNGAGKSTLLNCVAGVFGVERGTISINGMDVTKLPEYKRSSFIGRVFQDPMMGTAGNMGIEENLALAYRRGKMRSLSWGISQKEREIYKEYLSHLDLGLENRLNAKVGLLSGGQRQALTLLMATLKKPKLLLLDEHTAALDPKTADKVLKLSDQFVKDGNLTTLMVTHNMRHAIEHGNRLIMMHSGRVILDIKGEEKKKLTVDELLKRFGQVSGEEFANDRALLS >NC_016894.1|WP_014356380.1|2375805_2376093_-|50S-ribosomal-protein-L27 MLKMNLQLFAHKKGVGSSRNGRDSEAKRLGVKRGDGQFVLAGNILVRQRGTKIHPGTNVGKGGDDTLFALEDGIVRFERKGRDKKQVSIYPREAI >NC_016894.1|WP_014356381.1|2376105_2376438_-|ribosomal-processing-cysteine-protease-Prp MISVKIQGKNNIATEIIVSGHAGFADHGEDIVCAAVSVLTISILNGLTEIIGRKDLDEVIEEGYVHFLIPQVDDGPMKIKTDTLISTYLLGIRGIKEAYGDYIQFEEVYK >NC_016894.1|WP_014356382.1|2376444_2376762_-|50S-ribosomal-protein-L21 MYAIIKTGGKQYRVQENDVIQIEKINFSEEDVKEITFTEVLAVNKDGEMVIGTPVVENAVVKAEILEVAKGPKVIIYKYKSKKDYRKKQGHRQPFMKVKITGIQA >NC_016894.1|WP_014356383.1|2377212_2377932_+|class-B-sortase MKLRSNITKTKLIASVILILMALTFGIYNYYPTFSNSIEKDKIIAVAKENKLDTQDRVDFSGLLALNSQTVGWVQIDGTPLEYPVVQTDNNDHYLSFNFLNNESFEGAIFQDYLCDTINTRNHILYGHYMSDESMFGSLWNYQDKSYYEHHPVIQFDQPGNPGDWEIFSVYVTEADYDYRQPKFSSDTDFLNYMSRLKKRSLYDTGVDISPSDEVLTLSTCIYTFDNARLAVHARKIKK >NC_016894.1|WP_193353282.1|2377991_2379428_-|sodium:alanine-symporter-family-protein MNFSEIIAAVNNFVWGPIMLALLMGTGIFLTIRLKFLPWRNLGYALKSVFAKPDPSKKDSSGDISPFQSLMTALAATIGTGNIVGVATAMVLGGPGALVWMWISALFGLSTKYGESVLAVKYRETNVEGEMAGGPMYAMKNGFKNKTIGSILAVLFSGFAVIASFGIGNMTQANSISGAVLGTFGIPTWITGAVITILALVVLLGGIKSIGRVCGVIVPFMAVFYFLGGILVIIINFQNIPAGIAQIFTMAFSPTAIAGGVGGTVIASMLSAMRWGVARGVFSNEAGLGSAPIAAAAAKTDHPSRQGYINMTGTFFDTLVVCTVTGLVIASSGVLGTVTESGKLLSGADLTIASFESVLGPIGGYLVTIGIMLFAFSTILGWEYYGEKSLEYLIKAPIAIKAYRFIFSIVTFIGATTALQIVWDFSDTMNGLMAIPNLISLLVLSNVIAKECFDYEEKIIKPERESRRLEKKAIVENE >NC_016894.1|WP_014356385.1|2380292_2380976_-|DUF2344-domain-containing-protein MVKIQYQFKRTKRLRFLSHLDQQRLFQRAFRRADIPVEYSQGFNPHPKMSFALAMSVGLTSDGEYGEVIVSKDIDVDEFINSMNQVLPKGLEIISAMVCPAEVESLSASLRKSVYRLELNLAPGIEIEKATKTIESFLALPQILIQKRNKKGKFVEKDIRPFIESLLVIEDDEEEKLNLKMTLLYIDQQCVKPEQIIESINNQNGVIFLIDPTTRIHREKLLLNADS >NC_016894.1|WP_014356386.1|2380968_2382816_-|TIGR03960-family-B12-binding-radical-SAM-protein MNNFIEENILPLVTKPITYLGNEVNAVHKTPNEDMVRFAFAFPDTYEVGMSHLGMKILYGLLNEEKDIWCERVFAPWVDMEEQLRLHQLPLYGLESMMPLYQYDFVGFTLQYEMSFSNILNMLELGQIPLRTSQRRETDPFIIAGGPCAYNPEPLSDFIDIFVIGEGELVILEIMENYRQWQKTNGNRQEFLISVAGIEGVYVPSLYEVTYDESSGVISAFKPIVKEASKTIRKRFIEDLDNAYFPDKIVVSYTETVHDRISYEIFRGCGRGCRFCQAGMIYRPTREKAPATIQEKIKALIKVTGYDEVSLSSLSSGDYSEIELLIKNLVNEYEDQKVSISLPSLRIDSLSIDMLEEIQKVRKTGLTLAPEAGTQRMRDVINKGVTEKNLLDTVHLAFEKGWGHVKLYFMIGLPGETMEDIEGIADLGQKVVGEYLKIDRSLRNKSLKVVLSTSSFVPKAFTPFQWMGQNSQELFKDKQRHLKMSIKDRKISYSWHDSGVSFLEAVFARGDRRLCEVLEIAHKKGCRFDGWGEFFDFGKWMEAFSEAGVDPDFYALRKRSYTEILPWDFIDTGVTKKYLIAEALKAESALTTPFCPENCSNCGIMEFKKGWKCNG >NC_016894.1|WP_041668697.1|2382987_2383419_-|EamA-family-transporter MKELSYYLPIILIVIANVFYNICTKSTPESVNPFLSLMVTYLVAALLTFFLMLANGLNEGIVDAFKRLNWTSFALGIAVVALEFGYITAYRLGWNISIGSVVANILLAIILIPIGLLCYKEILTTNQLIGIFLCLAGLVFINR >NC_016894.1|WP_083837880.1|2383461_2384241_-|protein-kinase-family-protein MVRYRKVILMKNPCQLMKSNGKKVISLEGALSYWGFRLKQRIGQGRFGTCYEISGNSGNYVLKLYHANDVKRRKEKLVWEGKWLKMVDHPAIPEVIADFDQDGFYGLILEKMTGNDLEALIDSDHEFKKEEIIAILTQLIEIVDYLYGLKISHRDLKVSNILWTGSKLALIDFGSARFIPQFNKRFNPDFWGIGDVFMRLSAMCHEIMPSSDDFLIDQLRLNDNEKIVLKRMLYIETPYQNINELKHDFNAAFLNNNLI >NC_016894.1|WP_041671287.1|2384176_2384881_-|ABC-transporter-ATP-binding-protein MKHFIEFKDVYKRYHMGEVTINAANGINFFIDEGQFAVVVGPSGAGKTTVLNILGGMDSCDEGEVIVGKKNVAALTRKELAEYRRYDTGFVFQFYNLVQNLTAVENVELATQICRDPKDAEMVLKSVGLEERLANFPSQLSGGEQQRVAIARALAKRPKLLLCDEPTGALDYNTGKNILKLLQETSRKENMTVILITHNQAITPMADKVIIMKNGQVQKSYLNEKPLSVDEIEW |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_016894_2 | 3377721-3380835 | Unclear |
NA
Consensus repeat of NC_016894_2
|
47 spacers
spacers of NC_016894_2
>2.1|3377751|34|NC_016894|CRISPRCasFinder,CRT AATAAATTGAGATGGCAAAATGTTATATTCATTC >2.2|3377815|36|NC_016894|CRISPRCasFinder,CRT TTTGGCGACCGTAGAAATTGTCGTTTGGGTTCTGAT >2.3|3377881|36|NC_016894|CRISPRCasFinder,CRT GATGGCGCTTGCAAGGGTAATCCCGGCGTTGGTGGT >2.4|3377947|36|NC_016894|CRISPRCasFinder,CRT CAAGGTTGAATTCCGAGAATTGGTAGCGGCGGATTA >2.5|3378013|37|NC_016894|CRISPRCasFinder,CRT TGGGTGGCGTAACCCAAAGCTTAACAGACCGGATCAG >2.6|3378080|34|NC_016894|CRISPRCasFinder,CRT GAAAATGAAGTCAATGCCCTAGCCCCGGCATTGC >2.7|3378144|36|NC_016894|CRISPRCasFinder,CRT ATCAGTGTCGGTGCGTCTTCGGACAACGCAACTTTT >2.8|3378210|36|NC_016894|CRISPRCasFinder,CRT TAATCGATTAAGTTCTTCAACAACATCATCCACGAA >2.9|3378276|35|NC_016894|CRISPRCasFinder,CRT CTTCTAATTGCGATACTAGGTCATAGGCCTTTTGC >2.10|3378341|36|NC_016894|CRISPRCasFinder,CRT CGGTATATGTAAAGCCGTTCGGGTGTTGGTAGCACG >2.11|3378407|36|NC_016894|CRISPRCasFinder,CRT TTGCGCTTTTTGTCAACGAGATTGATGGAGAAATGA >2.12|3378473|36|NC_016894|CRISPRCasFinder,CRT TTTATTATAAGAATGAACGGGAAGTTATGGAATCGT >2.13|3378539|35|NC_016894|CRISPRCasFinder,CRT ACGATCAGCCCCAACACTATTAGCCTGTTCAACTG >2.14|3378604|35|NC_016894|CRISPRCasFinder,CRT AAAGTCTCCCCGAAGCTGATAGCCTGATAGTTATT >2.15|3378669|35|NC_016894|CRISPRCasFinder,CRT GACTATAAAAATGTTGTTACTAACGTAAAGCCAAA >2.16|3378734|35|NC_016894|CRISPRCasFinder,CRT GCGCTTAAAAGCCCTCTTCAATTCAAATTTCCAAA >2.17|3378799|36|NC_016894|CRISPRCasFinder,CRT TACGATTGATATACCGTTTATACTCTTTACTTTGAA >2.18|3378865|36|NC_016894|CRISPRCasFinder,CRT TTGTAGTTCGTCCATTGCCATTTTAACCGCATCGGT >2.19|3378931|36|NC_016894|CRISPRCasFinder,CRT TCTTAATAACATTCATCTCATCACCTCATAGAATAA >2.20|3378997|36|NC_016894|CRISPRCasFinder,CRT TTGTTTATTAATGATCAAGTGTTTAGCATTAAGATG >2.21|3379063|34|NC_016894|CRISPRCasFinder,CRT AAAATGGAGAATTAAATACAACTAGTTCACCATC >2.22|3379127|37|NC_016894|CRISPRCasFinder,CRT GATTATAAAGTAATGATAAATCAATCACTAAATTAAC >2.23|3379194|36|NC_016894|CRISPRCasFinder,CRT CCCCCATTGCCTAATTCTCTTGCGCAAATAGCCCAA >2.24|3379260|36|NC_016894|CRISPRCasFinder,CRT AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC >2.25|3379326|35|NC_016894|CRISPRCasFinder,CRT TAAACTAAATACCGGCAGAACAGGACGCTTCCAAA >2.26|3379391|35|NC_016894|CRISPRCasFinder,CRT ATACGTAATCTCTATCAGTAATAGTGCCATACGTT >2.27|3379456|36|NC_016894|CRISPRCasFinder,CRT ACAAAATAACAGATAAGCCGCTGTTCTGCTATTGTA >2.28|3379522|36|NC_016894|CRISPRCasFinder,CRT GCTAGCAGAGATCAAAACCGTCGATGGACCTAGCAG >2.29|3379588|34|NC_016894|CRISPRCasFinder,CRT CGTATTGCCCTGAGCTGTCCAGGTACGTAAACTT >2.30|3379652|35|NC_016894|CRISPRCasFinder,CRT TCTTTTGCAAATCGATTGTCGTAACCGCTTTTAAA >2.31|3379717|34|NC_016894|CRISPRCasFinder,CRT CAACCGGACTGGCCGCGAAATATTATTGTAGTTG >2.32|3379781|35|NC_016894|CRISPRCasFinder,CRT GCATTACCAATTATTTGGAAAGCACCTGTGAAAAG >2.33|3379846|35|NC_016894|CRISPRCasFinder,CRT AAGAATTGTTTCTTTTGCTTTTCTCATGTCTTCAA >2.34|3379911|36|NC_016894|CRISPRCasFinder,CRT AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC >2.35|3379977|35|NC_016894|CRISPRCasFinder,CRT TCGCCATCGTCATTCCCAGTAACGACAATATCCGA >2.36|3380042|35|NC_016894|CRISPRCasFinder,CRT ATTTATCCCGATATTGAAGCGGTTTTCATTGATAC >2.37|3380107|38|NC_016894|CRISPRCasFinder,CRT TAATGCATCGATAATCTCAATGCCGGCATTAATTTTTC >2.38|3380175|35|NC_016894|CRISPRCasFinder,CRT AGAAATAAATTAGTTGATGAACTCAACACGAAATA >2.39|3380240|36|NC_016894|CRISPRCasFinder,CRT AACAATCCGGGTAAACCGATCCGGCGTCATAACAGT >2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT GACGATTTAATTAAAGCTATTAATGATTTTGATTC >2.41|3380371|36|NC_016894|CRISPRCasFinder,CRT TAATACTGTTTATTTTTCTTTTCAGATCATTATAAG >2.42|3380437|37|NC_016894|CRISPRCasFinder,CRT CGCCGGGGCCTCTCCCAAGAGTAGGTCAGCAATCTTA >2.43|3380504|36|NC_016894|CRISPRCasFinder,CRT CTTTTTACATCTTTTAAGTTCATTTTTATTCCTCCC >2.44|3380570|36|NC_016894|CRISPRCasFinder,CRT CCCGCATTGACGCTATTATTTGTTATTTCTCTACTC >2.45|3380636|37|NC_016894|CRISPRCasFinder,CRT GTTGACAAAATACGCATTGCGTACTAGAATAAACGCA >2.46|3380703|37|NC_016894|CRISPRCasFinder,CRT TGATAAGAGTATTAACTTAACGACATCTTTAACAAAA >2.47|3380770|36|NC_016894|CRISPRCasFinder,CRT CTTAACATTTTGATTCTTGATATTGTTCTTGCATTG >2.48|3377823|36|NC_016894|PILER-CR TTTGGCGACCGTAGAAATTGTCGTTTGGGTTCTGAT >2.49|3377889|36|NC_016894|PILER-CR GATGGCGCTTGCAAGGGTAATCCCGGCGTTGGTGGT >2.50|3377955|36|NC_016894|PILER-CR CAAGGTTGAATTCCGAGAATTGGTAGCGGCGGATTA >2.51|3378021|37|NC_016894|PILER-CR TGGGTGGCGTAACCCAAAGCTTAACAGACCGGATCAG >2.52|3378088|34|NC_016894|PILER-CR GAAAATGAAGTCAATGCCCTAGCCCCGGCATTGC >2.53|3378152|36|NC_016894|PILER-CR ATCAGTGTCGGTGCGTCTTCGGACAACGCAACTTTT >2.54|3378218|36|NC_016894|PILER-CR TAATCGATTAAGTTCTTCAACAACATCATCCACGAA >2.55|3378284|35|NC_016894|PILER-CR CTTCTAATTGCGATACTAGGTCATAGGCCTTTTGC >2.56|3378349|36|NC_016894|PILER-CR CGGTATATGTAAAGCCGTTCGGGTGTTGGTAGCACG >2.57|3378415|36|NC_016894|PILER-CR TTGCGCTTTTTGTCAACGAGATTGATGGAGAAATGA >2.58|3378481|36|NC_016894|PILER-CR TTTATTATAAGAATGAACGGGAAGTTATGGAATCGT >2.59|3378547|35|NC_016894|PILER-CR ACGATCAGCCCCAACACTATTAGCCTGTTCAACTG >2.60|3378612|35|NC_016894|PILER-CR AAAGTCTCCCCGAAGCTGATAGCCTGATAGTTATT >2.61|3378677|35|NC_016894|PILER-CR GACTATAAAAATGTTGTTACTAACGTAAAGCCAAA >2.62|3378742|35|NC_016894|PILER-CR GCGCTTAAAAGCCCTCTTCAATTCAAATTTCCAAA >2.63|3378807|36|NC_016894|PILER-CR TACGATTGATATACCGTTTATACTCTTTACTTTGAA >2.64|3378873|36|NC_016894|PILER-CR TTGTAGTTCGTCCATTGCCATTTTAACCGCATCGGT >2.65|3378939|36|NC_016894|PILER-CR TCTTAATAACATTCATCTCATCACCTCATAGAATAA >2.66|3379005|36|NC_016894|PILER-CR TTGTTTATTAATGATCAAGTGTTTAGCATTAAGATG >2.67|3379071|34|NC_016894|PILER-CR AAAATGGAGAATTAAATACAACTAGTTCACCATC >2.68|3379135|37|NC_016894|PILER-CR GATTATAAAGTAATGATAAATCAATCACTAAATTAAC >2.69|3379202|36|NC_016894|PILER-CR CCCCCATTGCCTAATTCTCTTGCGCAAATAGCCCAA >2.70|3379268|36|NC_016894|PILER-CR AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC >2.71|3379334|35|NC_016894|PILER-CR TAAACTAAATACCGGCAGAACAGGACGCTTCCAAA >2.72|3379399|35|NC_016894|PILER-CR ATACGTAATCTCTATCAGTAATAGTGCCATACGTT >2.73|3379464|36|NC_016894|PILER-CR ACAAAATAACAGATAAGCCGCTGTTCTGCTATTGTA >2.74|3379530|36|NC_016894|PILER-CR GCTAGCAGAGATCAAAACCGTCGATGGACCTAGCAG >2.75|3379596|34|NC_016894|PILER-CR CGTATTGCCCTGAGCTGTCCAGGTACGTAAACTT >2.76|3379660|35|NC_016894|PILER-CR TCTTTTGCAAATCGATTGTCGTAACCGCTTTTAAA >2.77|3379725|34|NC_016894|PILER-CR CAACCGGACTGGCCGCGAAATATTATTGTAGTTG >2.78|3379789|35|NC_016894|PILER-CR GCATTACCAATTATTTGGAAAGCACCTGTGAAAAG >2.79|3379854|35|NC_016894|PILER-CR AAGAATTGTTTCTTTTGCTTTTCTCATGTCTTCAA >2.80|3379919|36|NC_016894|PILER-CR AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC >2.81|3379985|35|NC_016894|PILER-CR TCGCCATCGTCATTCCCAGTAACGACAATATCCGA >2.82|3380050|35|NC_016894|PILER-CR ATTTATCCCGATATTGAAGCGGTTTTCATTGATAC >2.83|3380115|38|NC_016894|PILER-CR TAATGCATCGATAATCTCAATGCCGGCATTAATTTTTC >2.84|3380183|35|NC_016894|PILER-CR AGAAATAAATTAGTTGATGAACTCAACACGAAATA >2.85|3380248|36|NC_016894|PILER-CR AACAATCCGGGTAAACCGATCCGGCGTCATAACAGT >2.86|3380314|35|NC_016894|PILER-CR GACGATTTAATTAAAGCTATTAATGATTTTGATTC >2.87|3380379|36|NC_016894|PILER-CR TAATACTGTTTATTTTTCTTTTCAGATCATTATAAG >2.88|3380445|37|NC_016894|PILER-CR CGCCGGGGCCTCTCCCAAGAGTAGGTCAGCAATCTTA >2.89|3380512|36|NC_016894|PILER-CR CTTTTTACATCTTTTAAGTTCATTTTTATTCCTCCC >2.90|3380578|36|NC_016894|PILER-CR CCCGCATTGACGCTATTATTTGTTATTTCTCTACTC >2.91|3380644|37|NC_016894|PILER-CR GTTGACAAAATACGCATTGCGTACTAGAATAAACGCA >2.92|3380711|37|NC_016894|PILER-CR TGATAAGAGTATTAACTTAACGACATCTTTAACAAAA >2.93|3380778|36|NC_016894|PILER-CR CTTAACATTTTGATTCTTGATATTGTTCTTGCATTG |
cas2,cas1,cas4,cas3,cas5,cas7,cas8b2,cas6,WYL |
CRISPR arrays and Neighbor proteins around NC_016894_2
The CRISPR arrays of NC_016894_2 >merge|NC_016894|2|3377721-3380835|CRISPRCasFinder,CRT,PILER-CR AAACCGATTCCAATATGGATCTACTCAAATAATAAATTGAGATGGCAAAATGTTATATTCATTCAATTTACATCCAATATGGATCTACTCAAATTTTGGCGACCGTAGAAATTGTCGTTTGGGTTCTGATATTTACATTCCAATATGGATCTACTCAAATGATGGCGCTTGCAAGGGTAATCCCGGCGTTGGTGGTATTTACATTCCAATATGGATCTACTCAAATCAAGGTTGAATTCCGAGAATTGGTAGCGGCGGATTAATTTACATTCCAATATGGATCTACTCAAATTGGGTGGCGTAACCCAAAGCTTAACAGACCGGATCAGATTTACATTCCAATATGGATCTACTCAAATGAAAATGAAGTCAATGCCCTAGCCCCGGCATTGCATTTACATTCCAATATGGATCTACTCAAATATCAGTGTCGGTGCGTCTTCGGACAACGCAACTTTTATTTACATTCCAATATGGATCTACTCAAATTAATCGATTAAGTTCTTCAACAACATCATCCACGAAATTTACATTCCAATATGGATCTACTCAAATCTTCTAATTGCGATACTAGGTCATAGGCCTTTTGCATTTACATTCCAATATGGATCTACTCAAATCGGTATATGTAAAGCCGTTCGGGTGTTGGTAGCACGATTTACATTCCAATATGGATCTACTCAAATTTGCGCTTTTTGTCAACGAGATTGATGGAGAAATGAATTTACATTCCAATATGGATCTACTCAAATTTTATTATAAGAATGAACGGGAAGTTATGGAATCGTATTTACATTCCAATATGGATCTACTCAAATACGATCAGCCCCAACACTATTAGCCTGTTCAACTGATTTACATTCCAATATGGATCTACTCAAATAAAGTCTCCCCGAAGCTGATAGCCTGATAGTTATTATTTACATTCCAATATGGATCTACTCAAATGACTATAAAAATGTTGTTACTAACGTAAAGCCAAAATTTACATTCCAATATGGATCTACTCAAATGCGCTTAAAAGCCCTCTTCAATTCAAATTTCCAAAATTTACATTCCAATATGGATCTACTCAAATTACGATTGATATACCGTTTATACTCTTTACTTTGAAATTTACATTCCAATATGGATCTACTCAAATTTGTAGTTCGTCCATTGCCATTTTAACCGCATCGGTATTTACATTCCAATATGGATCTACTCAAATTCTTAATAACATTCATCTCATCACCTCATAGAATAAATTTACATTCCAATATGGATCTACTCAAATTTGTTTATTAATGATCAAGTGTTTAGCATTAAGATGATTTACATTCCAATATGGATCTACTCAAATAAAATGGAGAATTAAATACAACTAGTTCACCATCATTTACATTCCAATATGGATCTACTCAAATGATTATAAAGTAATGATAAATCAATCACTAAATTAACATTTACATTCCAATATGGATCTACTCAAATCCCCCATTGCCTAATTCTCTTGCGCAAATAGCCCAAATTTACATTCCAATATGGATCTACTCAAATAAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAACATTTACATTCCAATATGGATCTACTCAAATTAAACTAAATACCGGCAGAACAGGACGCTTCCAAAATTTACATTCCAATATGGATCTACTCAAATATACGTAATCTCTATCAGTAATAGTGCCATACGTTATTTACATTCCAATATGGATCTACTCAAATACAAAATAACAGATAAGCCGCTGTTCTGCTATTGTAATTTACATTCCAATATGGATCTACTCAAATGCTAGCAGAGATCAAAACCGTCGATGGACCTAGCAGATTTACATTCCAATATGGATCTACTCAAATCGTATTGCCCTGAGCTGTCCAGGTACGTAAACTTATTTACATTCCAATATGGATCTACTCAAATTCTTTTGCAAATCGATTGTCGTAACCGCTTTTAAAATTTACATTCCAATATGGATCTACTCAAATCAACCGGACTGGCCGCGAAATATTATTGTAGTTGATTTACATTCCAATATGGATCTACTCAAATGCATTACCAATTATTTGGAAAGCACCTGTGAAAAGATTTACATTCCAATATGGATCTACTCAAATAAGAATTGTTTCTTTTGCTTTTCTCATGTCTTCAAATTTACATTCCAATATGGATCTACTCAAATAAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAACATTTACATTCCAATATGGATCTACTCAAATTCGCCATCGTCATTCCCAGTAACGACAATATCCGAATTTACATTCCAATATGGATCTACTCAAATATTTATCCCGATATTGAAGCGGTTTTCATTGATACATTTACATTCCAATATGGATCTACTCAAATTAATGCATCGATAATCTCAATGCCGGCATTAATTTTTCATTTACATTCCAATATGGATCTACTCAAATAGAAATAAATTAGTTGATGAACTCAACACGAAATAATTTACATTCCAATATGGATCTACTCAAATAACAATCCGGGTAAACCGATCCGGCGTCATAACAGTATTTACATTCCAATATGGATCTACTCAAATGACGATTTAATTAAAGCTATTAATGATTTTGATTCATTTACATTCCAATATGGATCTACTCAAATTAATACTGTTTATTTTTCTTTTCAGATCATTATAAGATTTACATTCCAATATGGATCTACTCAAATCGCCGGGGCCTCTCCCAAGAGTAGGTCAGCAATCTTAATTTACATTCCAATATGGATCTACTCAAATCTTTTTACATCTTTTAAGTTCATTTTTATTCCTCCCATTTACATTCCAATATGGATCTACTCAAATCCCGCATTGACGCTATTATTTGTTATTTCTCTACTCATTTACATTCCAATATGGATCTACTCAAATGTTGACAAAATACGCATTGCGTACTAGAATAAACGCAATTTACATTCCAATATGGATCTACTCAAATTGATAAGAGTATTAACTTAACGACATCTTTAACAAAAATTTACATTCCAATATGGATCTACTCAAATCTTAACATTTTGATTCTTGATATTGTTCTTGCATTGATTTACATTCCAATATGGATCTACTCAAAT >NC_016894|2|2|3377721-3380835|CRISPRCasFinder AAACCGATTCCAATATGGATCTACTCAAAT AATAAATTGAGATGGCAAAATGTTATATTCATTC AATTTACATCCAATATGGATCTACTCAAAT TTTGGCGACCGTAGAAATTGTCGTTTGGGTTCTGAT ATTTACATTCCAATATGGATCTACTCAAAT GATGGCGCTTGCAAGGGTAATCCCGGCGTTGGTGGT ATTTACATTCCAATATGGATCTACTCAAAT CAAGGTTGAATTCCGAGAATTGGTAGCGGCGGATTA ATTTACATTCCAATATGGATCTACTCAAAT TGGGTGGCGTAACCCAAAGCTTAACAGACCGGATCAG ATTTACATTCCAATATGGATCTACTCAAAT GAAAATGAAGTCAATGCCCTAGCCCCGGCATTGC ATTTACATTCCAATATGGATCTACTCAAAT ATCAGTGTCGGTGCGTCTTCGGACAACGCAACTTTT ATTTACATTCCAATATGGATCTACTCAAAT TAATCGATTAAGTTCTTCAACAACATCATCCACGAA ATTTACATTCCAATATGGATCTACTCAAAT CTTCTAATTGCGATACTAGGTCATAGGCCTTTTGC ATTTACATTCCAATATGGATCTACTCAAAT CGGTATATGTAAAGCCGTTCGGGTGTTGGTAGCACG ATTTACATTCCAATATGGATCTACTCAAAT TTGCGCTTTTTGTCAACGAGATTGATGGAGAAATGA ATTTACATTCCAATATGGATCTACTCAAAT TTTATTATAAGAATGAACGGGAAGTTATGGAATCGT ATTTACATTCCAATATGGATCTACTCAAAT ACGATCAGCCCCAACACTATTAGCCTGTTCAACTG ATTTACATTCCAATATGGATCTACTCAAAT AAAGTCTCCCCGAAGCTGATAGCCTGATAGTTATT ATTTACATTCCAATATGGATCTACTCAAAT GACTATAAAAATGTTGTTACTAACGTAAAGCCAAA ATTTACATTCCAATATGGATCTACTCAAAT GCGCTTAAAAGCCCTCTTCAATTCAAATTTCCAAA ATTTACATTCCAATATGGATCTACTCAAAT TACGATTGATATACCGTTTATACTCTTTACTTTGAA ATTTACATTCCAATATGGATCTACTCAAAT TTGTAGTTCGTCCATTGCCATTTTAACCGCATCGGT ATTTACATTCCAATATGGATCTACTCAAAT TCTTAATAACATTCATCTCATCACCTCATAGAATAA ATTTACATTCCAATATGGATCTACTCAAAT TTGTTTATTAATGATCAAGTGTTTAGCATTAAGATG ATTTACATTCCAATATGGATCTACTCAAAT AAAATGGAGAATTAAATACAACTAGTTCACCATC ATTTACATTCCAATATGGATCTACTCAAAT GATTATAAAGTAATGATAAATCAATCACTAAATTAAC ATTTACATTCCAATATGGATCTACTCAAAT CCCCCATTGCCTAATTCTCTTGCGCAAATAGCCCAA ATTTACATTCCAATATGGATCTACTCAAAT AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC ATTTACATTCCAATATGGATCTACTCAAAT TAAACTAAATACCGGCAGAACAGGACGCTTCCAAA ATTTACATTCCAATATGGATCTACTCAAAT ATACGTAATCTCTATCAGTAATAGTGCCATACGTT ATTTACATTCCAATATGGATCTACTCAAAT ACAAAATAACAGATAAGCCGCTGTTCTGCTATTGTA ATTTACATTCCAATATGGATCTACTCAAAT GCTAGCAGAGATCAAAACCGTCGATGGACCTAGCAG ATTTACATTCCAATATGGATCTACTCAAAT CGTATTGCCCTGAGCTGTCCAGGTACGTAAACTT ATTTACATTCCAATATGGATCTACTCAAAT TCTTTTGCAAATCGATTGTCGTAACCGCTTTTAAA ATTTACATTCCAATATGGATCTACTCAAAT CAACCGGACTGGCCGCGAAATATTATTGTAGTTG ATTTACATTCCAATATGGATCTACTCAAAT GCATTACCAATTATTTGGAAAGCACCTGTGAAAAG ATTTACATTCCAATATGGATCTACTCAAAT AAGAATTGTTTCTTTTGCTTTTCTCATGTCTTCAA ATTTACATTCCAATATGGATCTACTCAAAT AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC ATTTACATTCCAATATGGATCTACTCAAAT TCGCCATCGTCATTCCCAGTAACGACAATATCCGA ATTTACATTCCAATATGGATCTACTCAAAT ATTTATCCCGATATTGAAGCGGTTTTCATTGATAC ATTTACATTCCAATATGGATCTACTCAAAT TAATGCATCGATAATCTCAATGCCGGCATTAATTTTTC ATTTACATTCCAATATGGATCTACTCAAAT AGAAATAAATTAGTTGATGAACTCAACACGAAATA ATTTACATTCCAATATGGATCTACTCAAAT AACAATCCGGGTAAACCGATCCGGCGTCATAACAGT ATTTACATTCCAATATGGATCTACTCAAAT GACGATTTAATTAAAGCTATTAATGATTTTGATTC ATTTACATTCCAATATGGATCTACTCAAAT TAATACTGTTTATTTTTCTTTTCAGATCATTATAAG ATTTACATTCCAATATGGATCTACTCAAAT CGCCGGGGCCTCTCCCAAGAGTAGGTCAGCAATCTTA ATTTACATTCCAATATGGATCTACTCAAAT CTTTTTACATCTTTTAAGTTCATTTTTATTCCTCCC ATTTACATTCCAATATGGATCTACTCAAAT CCCGCATTGACGCTATTATTTGTTATTTCTCTACTC ATTTACATTCCAATATGGATCTACTCAAAT GTTGACAAAATACGCATTGCGTACTAGAATAAACGCA ATTTACATTCCAATATGGATCTACTCAAAT TGATAAGAGTATTAACTTAACGACATCTTTAACAAAA ATTTACATTCCAATATGGATCTACTCAAAT CTTAACATTTTGATTCTTGATATTGTTCTTGCATTG ATTTACATTCCAATATGGATCTACTCAAAT >NC_016894|2|1|3377721-3380835|CRT AAACCGATTCCAATATGGATCTACTCAAAT AATAAATTGAGATGGCAAAATGTTATATTCATTC AATTTACATCCAATATGGATCTACTCAAAT TTTGGCGACCGTAGAAATTGTCGTTTGGGTTCTGAT ATTTACATTCCAATATGGATCTACTCAAAT GATGGCGCTTGCAAGGGTAATCCCGGCGTTGGTGGT ATTTACATTCCAATATGGATCTACTCAAAT CAAGGTTGAATTCCGAGAATTGGTAGCGGCGGATTA ATTTACATTCCAATATGGATCTACTCAAAT TGGGTGGCGTAACCCAAAGCTTAACAGACCGGATCAG ATTTACATTCCAATATGGATCTACTCAAAT GAAAATGAAGTCAATGCCCTAGCCCCGGCATTGC ATTTACATTCCAATATGGATCTACTCAAAT ATCAGTGTCGGTGCGTCTTCGGACAACGCAACTTTT ATTTACATTCCAATATGGATCTACTCAAAT TAATCGATTAAGTTCTTCAACAACATCATCCACGAA ATTTACATTCCAATATGGATCTACTCAAAT CTTCTAATTGCGATACTAGGTCATAGGCCTTTTGC ATTTACATTCCAATATGGATCTACTCAAAT CGGTATATGTAAAGCCGTTCGGGTGTTGGTAGCACG ATTTACATTCCAATATGGATCTACTCAAAT TTGCGCTTTTTGTCAACGAGATTGATGGAGAAATGA ATTTACATTCCAATATGGATCTACTCAAAT TTTATTATAAGAATGAACGGGAAGTTATGGAATCGT ATTTACATTCCAATATGGATCTACTCAAAT ACGATCAGCCCCAACACTATTAGCCTGTTCAACTG ATTTACATTCCAATATGGATCTACTCAAAT AAAGTCTCCCCGAAGCTGATAGCCTGATAGTTATT ATTTACATTCCAATATGGATCTACTCAAAT GACTATAAAAATGTTGTTACTAACGTAAAGCCAAA ATTTACATTCCAATATGGATCTACTCAAAT GCGCTTAAAAGCCCTCTTCAATTCAAATTTCCAAA ATTTACATTCCAATATGGATCTACTCAAAT TACGATTGATATACCGTTTATACTCTTTACTTTGAA ATTTACATTCCAATATGGATCTACTCAAAT TTGTAGTTCGTCCATTGCCATTTTAACCGCATCGGT ATTTACATTCCAATATGGATCTACTCAAAT TCTTAATAACATTCATCTCATCACCTCATAGAATAA ATTTACATTCCAATATGGATCTACTCAAAT TTGTTTATTAATGATCAAGTGTTTAGCATTAAGATG ATTTACATTCCAATATGGATCTACTCAAAT AAAATGGAGAATTAAATACAACTAGTTCACCATC ATTTACATTCCAATATGGATCTACTCAAAT GATTATAAAGTAATGATAAATCAATCACTAAATTAAC ATTTACATTCCAATATGGATCTACTCAAAT CCCCCATTGCCTAATTCTCTTGCGCAAATAGCCCAA ATTTACATTCCAATATGGATCTACTCAAAT AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC ATTTACATTCCAATATGGATCTACTCAAAT TAAACTAAATACCGGCAGAACAGGACGCTTCCAAA ATTTACATTCCAATATGGATCTACTCAAAT ATACGTAATCTCTATCAGTAATAGTGCCATACGTT ATTTACATTCCAATATGGATCTACTCAAAT ACAAAATAACAGATAAGCCGCTGTTCTGCTATTGTA ATTTACATTCCAATATGGATCTACTCAAAT GCTAGCAGAGATCAAAACCGTCGATGGACCTAGCAG ATTTACATTCCAATATGGATCTACTCAAAT CGTATTGCCCTGAGCTGTCCAGGTACGTAAACTT ATTTACATTCCAATATGGATCTACTCAAAT TCTTTTGCAAATCGATTGTCGTAACCGCTTTTAAA ATTTACATTCCAATATGGATCTACTCAAAT CAACCGGACTGGCCGCGAAATATTATTGTAGTTG ATTTACATTCCAATATGGATCTACTCAAAT GCATTACCAATTATTTGGAAAGCACCTGTGAAAAG ATTTACATTCCAATATGGATCTACTCAAAT AAGAATTGTTTCTTTTGCTTTTCTCATGTCTTCAA ATTTACATTCCAATATGGATCTACTCAAAT AAAATGGTTGAAGTCGTATTAGAAGACGTTGGCAAC ATTTACATTCCAATATGGATCTACTCAAAT TCGCCATCGTCATTCCCAGTAACGACAATATCCGA ATTTACATTCCAATATGGATCTACTCAAAT ATTTATCCCGATATTGAAGCGGTTTTCATTGATAC ATTTACATTCCAATATGGATCTACTCAAAT TAATGCATCGATAATCTCAATGCCGGCATTAATTTTTC ATTTACATTCCAATATGGATCTACTCAAAT AGAAATAAATTAGTTGATGAACTCAACACGAAATA ATTTACATTCCAATATGGATCTACTCAAAT AACAATCCGGGTAAACCGATCCGGCGTCATAACAGT ATTTACATTCCAATATGGATCTACTCAAAT GACGATTTAATTAAAGCTATTAATGATTTTGATTC ATTTACATTCCAATATGGATCTACTCAAAT TAATACTGTTTATTTTTCTTTTCAGATCATTATAAG ATTTACATTCCAATATGGATCTACTCAAAT CGCCGGGGCCTCTCCCAAGAGTAGGTCAGCAATCTTA ATTTACATTCCAATATGGATCTACTCAAAT CTTTTTACATCTTTTAAGTTCATTTTTATTCCTCCC ATTTACATTCCAATATGGATCTACTCAAAT CCCGCATTGACGCTATTATTTGTTATTTCTCTACTC ATTTACATTCCAATATGGATCTACTCAAAT GTTGACAAAATACGCATTGCGTACTAGAATAAACGCA ATTTACATTCCAATATGGATCTACTCAAAT TGATAAGAGTATTAACTTAACGACATCTTTAACAAAA ATTTACATTCCAATATGGATCTACTCAAAT CTTAACATTTTGATTCTTGATATTGTTCTTGCATTG ATTTACATTCCAATATGGATCTACTCAAAT >NC_016894|2|1|3377793-3380835|PILER-CR TCCAATATGGATCTACTCAAATTTTGGCGA CCGTAGAAATTGTCGTTTGGGTTCTGATATTTACAT TCCAATATGGATCTACTCAAATGATGGCGC TTGCAAGGGTAATCCCGGCGTTGGTGGTATTTACAT TCCAATATGGATCTACTCAAATCAAGGTTG AATTCCGAGAATTGGTAGCGGCGGATTAATTTACAT TCCAATATGGATCTACTCAAATTGGGTGGC GTAACCCAAAGCTTAACAGACCGGATCAGATTTACAT TCCAATATGGATCTACTCAAATGAAAATGA AGTCAATGCCCTAGCCCCGGCATTGCATTTACAT TCCAATATGGATCTACTCAAATATCAGTGT CGGTGCGTCTTCGGACAACGCAACTTTTATTTACAT TCCAATATGGATCTACTCAAATTAATCGAT TAAGTTCTTCAACAACATCATCCACGAAATTTACAT TCCAATATGGATCTACTCAAATCTTCTAAT TGCGATACTAGGTCATAGGCCTTTTGCATTTACAT TCCAATATGGATCTACTCAAATCGGTATAT GTAAAGCCGTTCGGGTGTTGGTAGCACGATTTACAT TCCAATATGGATCTACTCAAATTTGCGCTT TTTGTCAACGAGATTGATGGAGAAATGAATTTACAT TCCAATATGGATCTACTCAAATTTTATTAT AAGAATGAACGGGAAGTTATGGAATCGTATTTACAT TCCAATATGGATCTACTCAAATACGATCAG CCCCAACACTATTAGCCTGTTCAACTGATTTACAT TCCAATATGGATCTACTCAAATAAAGTCTC CCCGAAGCTGATAGCCTGATAGTTATTATTTACAT TCCAATATGGATCTACTCAAATGACTATAA AAATGTTGTTACTAACGTAAAGCCAAAATTTACAT TCCAATATGGATCTACTCAAATGCGCTTAA AAGCCCTCTTCAATTCAAATTTCCAAAATTTACAT TCCAATATGGATCTACTCAAATTACGATTG ATATACCGTTTATACTCTTTACTTTGAAATTTACAT TCCAATATGGATCTACTCAAATTTGTAGTT CGTCCATTGCCATTTTAACCGCATCGGTATTTACAT TCCAATATGGATCTACTCAAATTCTTAATA ACATTCATCTCATCACCTCATAGAATAAATTTACAT TCCAATATGGATCTACTCAAATTTGTTTAT TAATGATCAAGTGTTTAGCATTAAGATGATTTACAT TCCAATATGGATCTACTCAAATAAAATGGA GAATTAAATACAACTAGTTCACCATCATTTACAT TCCAATATGGATCTACTCAAATGATTATAA AGTAATGATAAATCAATCACTAAATTAACATTTACAT TCCAATATGGATCTACTCAAATCCCCCATT GCCTAATTCTCTTGCGCAAATAGCCCAAATTTACAT TCCAATATGGATCTACTCAAATAAAATGGT TGAAGTCGTATTAGAAGACGTTGGCAACATTTACAT TCCAATATGGATCTACTCAAATTAAACTAA ATACCGGCAGAACAGGACGCTTCCAAAATTTACAT TCCAATATGGATCTACTCAAATATACGTAA TCTCTATCAGTAATAGTGCCATACGTTATTTACAT TCCAATATGGATCTACTCAAATACAAAATA ACAGATAAGCCGCTGTTCTGCTATTGTAATTTACAT TCCAATATGGATCTACTCAAATGCTAGCAG AGATCAAAACCGTCGATGGACCTAGCAGATTTACAT TCCAATATGGATCTACTCAAATCGTATTGC CCTGAGCTGTCCAGGTACGTAAACTTATTTACAT TCCAATATGGATCTACTCAAATTCTTTTGC AAATCGATTGTCGTAACCGCTTTTAAAATTTACAT TCCAATATGGATCTACTCAAATCAACCGGA CTGGCCGCGAAATATTATTGTAGTTGATTTACAT TCCAATATGGATCTACTCAAATGCATTACC AATTATTTGGAAAGCACCTGTGAAAAGATTTACAT TCCAATATGGATCTACTCAAATAAGAATTG TTTCTTTTGCTTTTCTCATGTCTTCAAATTTACAT TCCAATATGGATCTACTCAAATAAAATGGT TGAAGTCGTATTAGAAGACGTTGGCAACATTTACAT TCCAATATGGATCTACTCAAATTCGCCATC GTCATTCCCAGTAACGACAATATCCGAATTTACAT TCCAATATGGATCTACTCAAATATTTATCC CGATATTGAAGCGGTTTTCATTGATACATTTACAT TCCAATATGGATCTACTCAAATTAATGCAT CGATAATCTCAATGCCGGCATTAATTTTTCATTTACAT TCCAATATGGATCTACTCAAATAGAAATAA ATTAGTTGATGAACTCAACACGAAATAATTTACAT TCCAATATGGATCTACTCAAATAACAATCC GGGTAAACCGATCCGGCGTCATAACAGTATTTACAT TCCAATATGGATCTACTCAAATGACGATTT AATTAAAGCTATTAATGATTTTGATTCATTTACAT TCCAATATGGATCTACTCAAATTAATACTG TTTATTTTTCTTTTCAGATCATTATAAGATTTACAT TCCAATATGGATCTACTCAAATCGCCGGGG CCTCTCCCAAGAGTAGGTCAGCAATCTTAATTTACAT TCCAATATGGATCTACTCAAATCTTTTTAC ATCTTTTAAGTTCATTTTTATTCCTCCCATTTACAT TCCAATATGGATCTACTCAAATCCCGCATT GACGCTATTATTTGTTATTTCTCTACTCATTTACAT TCCAATATGGATCTACTCAAATGTTGACAA AATACGCATTGCGTACTAGAATAAACGCAATTTACAT TCCAATATGGATCTACTCAAATTGATAAGA GTATTAACTTAACGACATCTTTAACAAAAATTTACAT TCCAATATGGATCTACTCAAATCTTAACAT TTTGATTCTTGATATTGTTCTTGCATTGATTTACAT TCCAATATGGATCTACTCAAAT
>NC_016894.1|WP_014357258.1|3377077_3377641_-|TetR/AcrR-family-transcriptional-regulator MRISKEPEVRKQEMIDTAMKIFAQKGYEATSMTDIAKEMNVVSGLCYRYFKSKNELYETAVKMYAKACSEPMIQILSHEGMTLQEGFERFSRSFIVSDGAEKYHEFFHREGSERFHRHLESEMLKNIMPYMIKYLADLRDRGEIQIDDIENSAKFIMYGQMPIINDEQLSSKEKTDKVIYLIKKVLA >NC_016894.1|WP_014357257.1|3376335_3376959_-|class-I-SAM-dependent-methyltransferase MNNEKVKELTQKHFDETAGDYNTSHDGKFVKCMYDEILERIVAINPETVLDLGCGNGNVLKKIMDISNAKLFGLDLSPKMIESAQKKLGEKVTLEVGDAEKLPYAENQFDIVICNASFHHYPNPDRVLSEIKRVLKNGGILILGDPTAPFEWYLKILNWGLKWSNSGDFRIYGAKEITALLSKNGFQVSGWKKIKNRAFVINAISEI >NC_016894.1|WP_014357256.1|3375389_3376070_-|response-regulator-transcription-factor MKHILIIEDDIALNNGIALALKDADYCFHQATTLACAKELMLNQKMAMVILDINLPDGSGFEFLEVIRKDSDVPVIILTANDMELDEVRGLNLGADDYITKPFSLMVLRSRIESVFRRSVKQNKNIYIIDDLYLDFEQMFFKVGDRELGLSKTEQKLLFLLVENKDRTVTRGVLVDKIWTNAAEYVDENALSVAISRLRNKIEKDPGTPQYIQTVYGLGYTWGKKT >NC_016894.1|WP_014357255.1|3374550_3375393_-|HAMP-domain-containing-histidine-kinase MSIFGTRKTLNRLNEMIDDAIAGNFTESNYDESQLSRLESKWMHYLSASKMSMVQTNQERENIKSMVSDISHQTKTPLANILLYTELLNEQVDNQENLKLVEQISMQTQKLDFLIQSLVKMSRLESNIIELNPQKQPVKPLLEQALSEIMPKARQKQMDITVENAEAIQACYDLKWTSEALYNILDNAVKYSEAQTSITIHVKMYELVTCIAVEDQGSGIAPDEKAQIFQRFYRSSGIQQKEGIGIGLYLAREIMQKQKGYIKVTSTPKKGSIFSLYLPT >NC_016894.1|WP_014357254.1|3373772_3374453_-|ABC-transporter-ATP-binding-protein MTILQTRNLRKEYGNGDNLVKALDDVNLTIKQGEFVSIVGTSGSGKSTLLHMLGGLDRPSSGKVFVEGNDIFSFKEEPLTIFRRRKIGFVFQSYNLVPVLNVYENVVLPIELDGNTVDDEYIHEIIDILGLASKEENLPSQLSGGQQQRVAIARALAAKPAIILADEPTGNLDSRTSQDVLSLLKMTGERFKQTIVMITHNEEIAQMADRIIRIEDGKVRERGEND >NC_016894.1|WP_014357253.1|3371245_3373780_-|FtsX-like-permease-family-protein MIKVTNKKAIRNLAYKSFKNNKIRNYIAMIAIALTTVLFTTLFTLGMGTVESIQQATKRQAGGDGHAVVKYINDDEFNTIKEHPLIKEIAYDRILCDDIENQEFLKRRAEFWYDDDIGLKLGFIELASGHKPVAENEVIADTKTLQLMGVPLEVGAPLTLTLNIRGETVTRDFVLAGWWESDPVFNVGQIFASRAYVDAHLGELQNTYKEDNSMTGAIQAYIMFDNSLDLENKLATVITESGYSFDENAPNYLASNVNWSYLSTNFEMDAQTWIALIAALLLIVLTGYLIIYNIFQISVIRDIRFYGLLKTIGTTKKQIRVMIRNQALLLSVIGIPVGLIGGFVIGVALVPLVMSNTTYAGSAVSVSPNPWIFAGAALFALITVMISTFKPGKIAGSVSPVEAVNYTDSDKKNSATNKKSKDGAKIHRMARANLGRNKKRTLLVVLSLSLSLVLLNTVFTLSTGIDMNKFLSKFNDADFLIAHADYFQYEYFGNENQTTETFIEAVQTQPGFQQGGRLYGGRDELFTCTDNSVDIINTNEYGDHYAAVYGLEDFPLNRLVVLDGELDYDKLASGKYILEGVQLDDNNNPEFESSHYDVGEVVELHNYKGTSESFEEREYTTQQFTVLAHVAIKYYVNSDCTGWAYSFYLPANIYKTLVTKPAVMSYTYNVADADEATMERFVANYTDTVEPLMNYTSKLTSLASLSEMKMTVVMVGGALSLIIGLIGVLNFINAVVTSIITRRKEFAMLQSIGMTQKQLRNMLCYEGLYLTLGTGIVALFFGSLFSLVVVNFFSGLIWFLGYQFILWPLLSVLPFLLVMGIAIPWIADMATNNQSIVERLRDAD >NC_016894.1|WP_145972807.1|3370200_3371103_-|LysR-family-transcriptional-regulator MTIRHLKIFITVYDERSMTKAAKKLFMTQPSISQVIKELENYYNVILFERLSHKLYVTKAGEKLYTVARQIINLLDEAKDTLGIADLQKNLAIGVNYTIGSKLVHRYIQKYERLYPGSEISVNVNKAPKLIEMLRNGELDLALIEERDNEADLIQKFFYHDRVVIIANPKHALCQKKYVNPEDIINEHLLLRDRGAGVRNLFELRMKELGLGIKPYWESTSTTALISAAENNFGIAVLPFQLVQEKIDNGSLKEIKIKGMDLDRKLMIAYHKNKFLTSSMLEFVKICHQTEEIKSLQLAK >NC_016894.1|WP_041669100.1|3369737_3370154_+|TOBE-domain-containing-protein MKLSARNQLSGKVEAVQEGAVNAIVTLKTDDGTTISSTISLAAVKELGLAVGKEATAIFKATEVLIGLGTMKISARNKIIGEVAAVEAGAVNGIVTLKADTGCTISSTISMAAIKELGLEPGVKATAVIKATSVMIAV >NC_016894.1|WP_052307100.1|3368580_3369531_+|GIY-YIG-nuclease-family-protein MNQLKEKLKQLPSLPGVYKMLDSTGQIIYVGKSNCLKKRVSSYFTPSPKPAKIEKMILFINDIDYIVTDTHLEARLLECQLIKTIKPYFNAQMKNDKRYFYVKVGHSRQAHVLSIVPERDADTFGPFRRKQLIQSMIDSFTYLFPIVKKNNHYDFIYQTLPQIMSVEDFMNNKQTLMEIFLEENKMLSLINQLQLAMREEAAHYHYEKAARYRDLVNGLTNINHVLHDYKRLLEKDILLKIPVRDGEKLFYISKGQIILKKYFRALSPIEIDKFLAEANNIKAALIINRNEKAEIDFQNILFSELQALPDDWILLK >NC_016894.1|WP_014357249.1|3367805_3368384_-|TetR/AcrR-family-transcriptional-regulator METKRQLQKAATRKLILDTAYQVYAEQGFTATTNKIAQAANVSHGTIFVHFPTVENLISCLLEEFGIEINEQLHSLSEQDENLETFLDAHITILIRYEKFYQRLISEISLLPEQARFIYINMQSVVSFHLNNVLIRYQTKNLIKDIPMHLIFNTWLGLLHYYLSNSFIFTTGSVLTEFKDELISNYIKLIKK >NC_016894.1|WP_014357259.1|3381012_3381291_-|CRISPR-associated-endonuclease-Cas2 MYVILVYDICGDEGGQRVLNKTFKICKKYLNHIQNSVFEGEISEPQILNLKYELNKYIRKDIDSVILFKSRNERWLKKEFWANVEDKTDNFL >NC_016894.1|WP_014357260.1|3381303_3382296_-|type-I-B-CRISPR-associated-endonuclease-Cas1 MKRDYYFYNDGTIRRKDNTITFINSDEESRNLPIENMGNLYVMSEMSLNTSLINLLSQYGIVVHFFNYYSFYTGSFYPREKLVSGNIIVKQVEHYQDNEKRMGIAQALIDAASYNIYRNLRYYNGRGKDVKMEMADIENLRKNIAGTIGIKELMGYEGNIRKIYYSAWDKIIDQDINFTKRVKNPPDNMINTLISFVNTLVYTKVLGEIYQTQLNPTISYLHEPGTRRFSLSLDIAEIFKPLIADRLIFSLLNRNQITEKSFAKNLNYLHLTKEASKTIVSELDAKLQTTIKHRELDKSVSYQYLIRLECYKMIKHLLGEKEYEAFKIWW >NC_016894.1|WP_014357261.1|3382311_3382806_-|CRISPR-associated-protein-Cas4 MEKEITGVMVYYYQVCWRKLWYFYHEIQMEQNNDNVQIGKLLDENAYGRDDKHINIDNIINIDFIRTKKVLHEVKKSKKIEAASILQVKYYLYFLMKRGATGISAQIDYPLLKQSVEVSLSDQDVAEIEKILADISKIVKEENPPVLKKLRICKSCAYYDLCYI >NC_016894.1|WP_041669104.1|3382827_3385083_-|CRISPR-associated-helicase/endonuclease-Cas3 MKNPEDYQAKPDKTIKEHSLELIDELDRLNNLGYIKNDQIYELTKKACWYHDFGKANKEFQKRVMSEKKIRMSLEREVFHNILSVFLIQPDAFESKDDYYKVTQAILFHHDYAESYEDVYDQLKSRKELCTALLNEFPLVPIKNRLQLELIKRIEDDQVVKIKGLLHKCDYSASGGFVAEYPNDFLESGLENLGYDWNDLQKFCIDHRNENIIAVAQTGMGKTEAGLLWIGNYKGYFVLPLRTAINAIYQRIVGDETKKIVSEKLDERVALLHSSSLSYYLEMAEKNKKELVEMGMDGIDVEEYQKRGHQHSIPLNISTMDQLFDFVFKYQGYELKLATLSYSKIVVDEIQMYDSDLLAYLIMGLKRICELGGQVAILTATLAPFVEDELKMAIPGIIKQGFYDNSLRHNLKVKDEEICIDDILAHYTANKDSGIGNKILVICNTVKKSQEVYEKLRQSGKVENDEVFLLHSKFTRGDRAKKEEAIKNFGKTYVGDSHEIDVRNGIWVSTSLVEASLDIDFDYLFTELQDLNSLLQRLGRCNRKGVKSIDQTNCYVYTVINEKLFIINGHGFIDSDIFNISKAALSQWDGPISEKQKLTLINDNLTTEKLKKSNYYKAYKSKCDWIASIAAYTIKQKEIDLRHIFSEEIIPSPIFERYRDKITKLVEQINQPNMERKEKLRLKELLYQYTLSVEKYHVTNYEKAKFKGEALTFEPLRIGKFETIQVLECSYDESLGFRKLEKSQIRNPEFL >NC_016894.1|WP_014357263.1|3385103_3386189_-|CRISPR-associated-protein-Cas5 MKALRIKLYQSSANYRKEESDTNKMTYPLPPFSTVIGALHEASGYQTYHPMDLSIQGKYESMHREPYTDYCFLNSTMDDRGILVKMRNPELLSSAFDKVAAAQKSQGNSFRKRITIKVFDEILYQEFIALKELNDEIENFKNTRYKRIMDLIKTRKKTIKIKKTEVSKGEIQYEKLCRREKQIKEIEKQIKDEFEKYKEVQYTKPYSKFRSLTTSLKFYEILNNVELVIHVKAEETVLMTILDNIYHLKSIGRSEDFVEVTEAKIVELIQDDNCDVTSSFSAYLDFRDVKNERIFPVAVGGGVNEKGGTRYGLNKTYQIIDDKRIFDKKSVIYLSQYGIDETSETIWLDRDDDQEYIVNFI >NC_016894.1|WP_014357264.1|3386219_3387098_-|type-I-B-CRISPR-associated-protein-Cas7/Cst2/DevR MKKALTLTVVANMTANYSEGLGNISSVQKVFKNKKVYSIRSRESLKNAIMVQSGLYDDLQTEVDGATQKLVTEKLTAANCKALEGGYMSTKGTTYIRKSSFYLTDAISTDNFVNETRFHNNLYLASTEAKQKGINLQEKSKESGLMPYQYEYDKSLKVYSFTMDLEMVGKDENFNAEATSAEKANRVIAIVEAIENLSLVVKGNLDNAEPVFVIGGLSPRKTHFFENVVRVQGEKLIISDDLLGKLEKGFNCGLLRGNEFLNEEEIVEKLKPQNMTAFFNDIKSEINNWYGV >NC_016894.1|WP_014357265.1|3387100_3388552_-|type-I-CRISPR-associated-protein-Cas8a1/Csx8 MVEEFVIDEKSYFKLSATEWRYSAAALGLMRYFDFLEIPWIEKAFDVLSLPEIAKELQKSIVCVYERSTGFEYLCFAKEYLSEEDYLRFVREIYPNDLYPFLIEEQLKKSVFEEAEIKEINTWLTGNTVMKKIFGKTKFTGENKDEILTIIKANKDLSTKESFRYKKNLYANYANTHQLLNEGGDSCRLSGYSIDMGKKGRSTAYNFNVKTSTNMDTILFDWIPFAFIGDREAFFINANYDLKQLKKINTFLRTQVKKDRDDDKNKNQNVRYSLFNSMIFSSQFINFDVEVIYKNRERDFFETLYIRHESMEILKSMDKINYKAFCFSLKINDNYYIDIQEKITNCILNLVLTDELIELFLKQKNSNGYLVSQCIEINWLIRKGGEVMKKKMSGAYACAKEVVKKIPENKIESYRQRLTSAIVFKDYDRVCQILLQLSNYSNVSFNFAYDLFEDFENNKDIAYTFINALRKGNDNTSNNEGGN >NC_016894.1|WP_145972727.1|3388567_3389311_-|CRISPR-associated-endoribonuclease-Cas6 MKLELNFSLKSMIIPLDYRKVFIAFIKKALTEAKGGEYFEKFYRDTLAKSFSFSVVFKQPDFKKDKIILGANQLKVLFTAIDDAQVSLIMYMAFIEQKNKAFPLPFENEMVLRTIYEKKAEKIETNKVIFKTAPGSGLCVREHNRETNGDNYYVFNDEAFTEKLFTVLRSQAERAGFNKQVAEKIRCKPLNCKKVVVKHYGCLLNISIGMLQMEADVKLLQYFYDAGIGSRHSAGFGLVDLVAQDLF >NC_016894.1|WP_193353286.1|3389462_3390521_-|hypothetical-protein MKTAKLVIGIISMVLSFFIMFQSCAAGIVNTVASNGEMSGTAGLMVAVFFIIAGIVGVATRNSLGMAGSLTAGGFYLAAALIGSITAGNYTDLYIWSFLAWSFGVVYLVAAFYDQYDIWGAASWWQKSWFIILITIVFPPAGIALVWISRKFELAPRIIMTVIFSIAFLISMASFMGIANTSANKPINMNNTNNTNNTNNTNTNTTTDSKVTEDTQKNKVYGLGETWTVDGEFSLSFTAVTATDDRNQFSEKTPGQVVILNYDYSNIGVEKSFTELYISSNDFNVIDANGEVASTYPASIAVHPQETPIGAKCVGAQCAYGLNNPSSEITVKVQVNGNNFKSYEAVFKLPVQ >NC_016894.1|WP_014357268.1|3390627_3391653_-|WYL-domain-containing-protein MANTKMKILRVLDILKETDEHHPITANEICHKLETYGIEAERKSVSRDINVLMEYFNNDSDYGYEIVLCEDNRKGYYMCSRLFEDWELKILIDAVWQARFLTAKKSESLANRLGSLASTESRKVLQNVTPVKSYIKTTKPKISEHIDMLLLAIRKGRKVEFQYQYTDTNMEKQLRFEGKVYLFNPYALKWRGDRYYLIGNYDKYDNLSFYRLDRIYNLAITDSRVKPVREIVGDNSANKIEAYVSKCMYNFGGENIHPVLRVKAEMVDEIIDYFGEDIQFKKQEDNYFDVRVSVNDGDGLYFWLLQYAEKVKVISPKSVRNELLKRVHAIIKNYDENESTN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_016894_3 | 3904684-3905123 | Orphan |
NA
Consensus repeat of NC_016894_3
|
6 spacers
spacers of NC_016894_3
>3.1|3904710|43|NC_016894|CRISPRCasFinder ATTGGTTAAGCTAGTACAACTATAGAATGCGTCTTTGTCAATA >3.2|3904779|43|NC_016894|CRISPRCasFinder GCTACTCAAACTAGTGCAATCTGCGAAAGTTGCGTCTGCAATA >3.3|3904848|43|NC_016894|CRISPRCasFinder ATTGGTTAGGCTGCTGCATACACTAAATGCATGCGCTCCAATA >3.4|3904917|43|NC_016894|CRISPRCasFinder ATTGATCAAACTACTGCACCGATTAAATGCGTAGTTTCCAATC >3.5|3904986|43|NC_016894|CRISPRCasFinder ATTGATTAAACTGCTACACCGATCAAATGCGTAGCTTCCAACA >3.6|3905055|43|NC_016894|CRISPRCasFinder GCTGGTCATTTTATTGCAATTAGCGAAAGTCCCTTTTGCAATA |
CRISPR arrays and Neighbor proteins around NC_016894_3
The CRISPR arrays of NC_016894_3 >merge|NC_016894|3|3904684-3905123|CRISPRCasFinder TCCTCGACACTGCTTGGTATTGTTATATTGGTTAAGCTAGTACAACTATAGAATGCGTCTTTGTCAATAAACGTAACACTGCTGGATATCGTTACGCTACTCAAACTAGTGCAATCTGCGAAAGTTGCGTCTGCAATAGATGTAACACTATCTGGTATTTTTATATTGGTTAGGCTGCTGCATACACTAAATGCATGCGCTCCAATAGATGAGACACTGTTTGGCATCGTTATATTGATCAAACTACTGCACCGATTAAATGCGTAGTTTCCAATCGACGTAACACTGCTGGGTATCGTTATATTGATTAAACTGCTACACCGATCAAATGCGTAGCTTCCAACAGACGTAACACTGCTGGGTATCGTTATGCTGGTCATTTTATTGCAATTAGCGAAAGTCCCTTTTGCAATAGATATAACACCGTTAGGTATGGTCAC >NC_016894|3|3|3904684-3905123|CRISPRCasFinder TCCTCGACACTGCTTGGTATTGTTAT ATTGGTTAAGCTAGTACAACTATAGAATGCGTCTTTGTCAATA AACGTAACACTGCTGGATATCGTTAC GCTACTCAAACTAGTGCAATCTGCGAAAGTTGCGTCTGCAATA GATGTAACACTATCTGGTATTTTTAT ATTGGTTAGGCTGCTGCATACACTAAATGCATGCGCTCCAATA GATGAGACACTGTTTGGCATCGTTAT ATTGATCAAACTACTGCACCGATTAAATGCGTAGTTTCCAATC GACGTAACACTGCTGGGTATCGTTAT ATTGATTAAACTGCTACACCGATCAAATGCGTAGCTTCCAACA GACGTAACACTGCTGGGTATCGTTAT GCTGGTCATTTTATTGCAATTAGCGAAAGTCCCTTTTGCAATA GATATAACACCGTTAGGTATGGTCAC
>NC_016894.1|WP_014357731.1|3898129_3898597_-|GNAT-family-N-acetyltransferase MALEIRKLIPDLAEDYVHFFDTTPHDNNVDDHKCYCVCWCNDDYEGKDFSTAEKRRKCAIQYVKGNNIQGYLAYSGDTVVGWCNANTKLDCLKCVSWRKFMNYVPIEKSDSGIKVKSIFCFVITPGMKRKGIATLLLERVCTDAKQDGFGLSTLF >NC_016894.1|WP_145972736.1|3897012_3898133_+|IS3-family-transposase MTKRPRRSFTDEFKNQMVQLYLNGKPRSEIVKEYDLTASSLDKWIKQHQSSGSFKENDNRTDEENELIRLRKENQRLLMENDIFKAGSADHRTKVEVIRANQDRYSVSAMCRVLNIPKSTYYYISKKTNGVDPIIADVIEIFKMSRKNYGTRKIKHQLEVKGIVASRRRIGRIMRENGLVSNYTVAQYKVHKQPVNQDPVPNEVNREFNGRAPLEVAVSDLTYVRVGGKWNYVCLIVDLYNREIIGYSAGPNKTAQLVYEAFARIRYRLDQISIFHTDRGSEFKNNVIDGVIETFNIKRSLSNKGCPYDNAVAESAFKVFKTEFANQYAFDRLDYLKLMLSDYVNWYNNIRIHSSLGYLTPDAYRKLAHKKSV >NC_016894.1|WP_014357730.1|3895379_3896711_+|HAMP-domain-containing-histidine-kinase MAKKQRSISLSLVLLRFAIVMLGSMVFCCLLWYLCFWRLENADVICQSFVAYQQVEQMLAGEPKTFISPGDNFIAEYALFDQNGNVLESNVTAKKLEDLTEFLSVATPNLNVLRYPYADGSTVIFHWYYRAEFVDPLLRGMLPPFEYLWMATLGIVWVFCLLFNTLWLRRFLAAKLKLFGEVSAKIGAQELDFTIPHAGIREYDQALDAMEHMREALYQSLSDQWATQQKREAEIAALAHDLKTPLTLVGGNAELLLDEELPERSRKMVATIVASNDRAKHYLVSLLETSAGADESFKDTSLPTMFNELCQRTMTIAETRRICLHTQNELLGAANIQKDHLLRALANVIQNAIEHTPAGKNVYLEGRMADNGWQITVCDEGPGFSKAALHHATERLWRDDPARGVDGHNGLGLWFAAQVVKTHAGQLELQNCDSGGVVTIKFC >NC_016894.1|WP_014357729.1|3894729_3895404_+|response-regulator-transcription-factor MSKLLVVDDDLEMLSLVRAALEKDGHQIDTEADAAIVQPARCQLYDLLLLDVMMPNEDGFSLCRRIRAEVDCPILFLTAKAEDAALVQGFGLGADDYIKKPFSLAELRARVNAHLRREVRQPTHTLSRGGVRFDMQAKVAIAGEHPLPFTKGEYAICEYLALHAGQVFTKEQLYEAVFGFDAEGDPSAVAEHIKNIRAKLKSDDINPIKTVWGVGYKWQKNNVL >NC_016894.1|WP_014357728.1|3893985_3894714_+|lantibiotic-immunity-ABC-transporter-MutG-family-permease-subunit MTILREFFSNFTKIKRTPVILLHLLPPIVITTLFFVYYASGGYHLISDVRLFFVILQIGYPIFVSIVVPILINLDRHNGIQNALGLVPSRSSVYLGKWLFLMFLSAINMILYEVCFYVGVNFFPGINMPPFGASLVIFGVFLFSNLFLYLLHILIAFRFGSSLSVLTGISGTILAGYFENAIGDKIWPFIPWEWGVRFLENYFNFSNVPVFPGIIALMIMTSFILIVSLLWFSHWEGNVIQE >NC_016894.1|WP_014357727.1|3893227_3893989_+|lantibiotic-immunity-ABC-transporter-MutE/EpiE-family-permease-subunit MLQAYLNAENLKFKHSLFRKLILFIPAALILISLVFIFVGIGLGGFSSAMVCNWCMPIGSLSVMFLCHLVNNKDQKHGYRTLYSLPIDLKQIFIAKTILIALNLLIISLLLSFITVIAESIVSGLFIALSHSDYYLLGYGLLWLSLLWQIPFCLFLDQKVGFVAAVIINLFASAFGGLFFSLTPLFWFFPYSWPARFMVTLFGVLPNGLLVNGGSRLILNPGASALLVLISLLTSLLLTVLFSRWYRKQVYRK >NC_016894.1|WP_041669499.1|3892526_3893228_+|lantibiotic-protection-ABC-transporter-ATP-binding-protein MSEYILKTNHVSKKFKQTDAIKDLSMSVRKNSVYGLLGPNGAGKSTFLKMVTGIIRPTSGEIIFNNHPWTRKDLLNIGSLIESPPLYENLTAFENLKVRALLLGISTDRCHQVLQQMDLMATNNKKVANFSLGMKQRLGIALALLNNPQLLVLDEPTNGLDPFGIEELRVMIKNFAASGIAVIISSHILSEIQQVADDIGIIYNGSLLYQDKIDAHKNLEQLFMDIIRKERAS >NC_016894.1|WP_014357725.1|3890224_3892222_+|FAD-dependent-oxidoreductase MKSKTDALFQPMSIGTMRVKNRIAMAPMGLHSKNPDGSFNQDAVDLYVARAKGGVGLIVTTGIACQNKLDSMRATLATAGDSYVTASKKLTDEVHKYGAKIVLQIANGAGRNRKNGFFLDNDPISSSENPNVWHPEMMHRALTTAEVQFLIQSYANGAYVAKQAGFDGVEVHALHEGYLMDQFSMECTNRRTDQYGGSLENRLRYATETVQAIKEKCGKDFPVLIRYSVKSYMKGFGLDKGALPGEKFEEFGRDLEESAKIAKILQDAGYDALDADNGTYESWYFAHPPVYMPKACNLADAQYIKQFVDIPVICAGKMDDPEIGSEAVASGSIDAISVGRALLADPEWPNKVQTENFDDIRPCIGCHAGCLERFFAGKNTSCAINPQVGMEKKYEIKPADVKKNIMVIGGGISGMEAARISALRGHKVDLYERTNSLGGVFIPASSMSFKEEDKKLIQWYVKQLKDTGVTIHMNTEVNENIIKAAKPNSIFVATGSTARKLNINSASSEKVITAVEALLETKPIGDKVVVIGGGLTGVEIGYSLTKDKGKHVEILEMLPDILQVQDLNAANKTMLQNLVLSHNIGVHTNAKVTAITSKGVQFEENGATVELDADTIITSIGYISDKSLYEAIHDCGAEVYLIGDASKVSNLMGAIWDAYEIAMAI >NC_016894.1|WP_041669496.1|3889472_3890066_-|TetR/AcrR-family-transcriptional-regulator MIENIKHTILVKAIELFKKNGFDNVTINEICESCNITKRTFYYHYDSKKTLLLDYFSLVDEDIETSLKDIDNEITWLDKCWKIKQIHIKGIANLNTDILKNLIKIDMEQQNYMFNFRLNDFDPNLKRLRQMVIEYTYKAQETGELDADTSAEDLSYCFASAFLGLAVNWSSTGGNYDLVEAAKKYFDLIYKKTSRSK >NC_016894.1|WP_014357723.1|3888419_3889388_+|helix-turn-helix-transcriptional-regulator MYEWHQQIQTIVDEIDNCIKNYNGEALTLHFLSHKLGYSEFYTTRKFKEIAGMQFRDYLRHRKLAFALKEVRDRNKSFLDIAFDYGFSSHEAFTRAFKGTYGVTPSEYRKKPTPVILRTKINPFDRYFFGFGEIGMIKSTADVKIYFVTIPAHKFLHIKNYQSNGYWDFWQKQNLIPGQDYETICGLLDSIKGKLDDDGGSESNSGSGQLMAYINDPNGRLCDWGIPRTECYGARLPFDYNGEIPSQMLMLDVPEAEYIVFEHGPFDYEQENRSVEATMEKAMATFDFSGTGYCFDPSPGRIIYLLYNPERFWKYIRPVRSK >NC_016894.1|WP_014357733.1|3905420_3905669_-|DUF2442-domain-containing-protein MKITNVYATDDYKLLIDFEEGNQVRFNMQRMVETIPFLRLRDLEVFKDVKFEDKAVCWDAPDGKPEVMPLRMTVDNILFALR >NC_016894.1|WP_014357734.1|3906051_3908538_+|LuxR-family-transcriptional-regulator MKNKKILNRDRINTMLSAVYDYPLTILEAPMGYGKTTAVKRFIEQKNLHTCWFTFSDFKNSETAFWDSFANAIITIDTQAGTILKSLGLPTDAPQMGKVLQTLDSLDFDGTFLIVLDDYHLAGDMRLNRLFLRLAQEELEGFSILLITRDTTGLDFIELLSKGQCCLLPKQLLQFTQGELQDYCRMMLTDITDTDQQMIWQYTDGWISFAYIILLGLESGIPIGMSTNLENMIERTLFAPYDEKTQGFLLLLSVMEDFTAEQAAFVTQQEDAPQLLKRLDMENAFIYYEEKTGIYKIHAVLQNFLRIKRHLSTDDLQNLYGRLGDWMMSQQNLLAAYSYLNRAGRSEDILAHLNNPKNIRNEWLDFEGADELFNRLPRELLFQYPFAYLLHMFYSILLGKENEILGWNERLDELQQYYKNMAGLEETYRNRILGEILIVRKFTRFNDVAAMCASDAEIIRLLNGQNSYITLPENEFTFASPHYLYLYYRDKGSFCKLANLLSEDVGYAKFSGGCGTGSDALTLAEYALETGDLNNVASHCRKAIAKAEIMSQTGIVICAKFSLIRLRLIEGNVSQALHLLTELERHVEKMNNSVYNTTIDLCKGYVFACLGRPEQIPTWLQIGEIKAADFYDQGIAFNYIVYGKTLLALEKYDELESRIEQFEAYFSVFCNRLGLIHNQIFEAVARCRLYGLEEGASVLLVALDEAQADNLVLPFAENALHIMGMLKIIIQGNPGNTFFNHILMLCCRYESAIMGLPHPVATLSRREINILSLAAEGLSRKEIAARLYIAEGTVKTHFKNIYQKLGVNSKMAAVKIAQNRGYLSMTEW >NC_016894.1|WP_169314717.1|3909259_3909646_-|hypothetical-protein MDRKIWSKFMLNIGVNQVVSVYGQNFGSVKKPGRARDMMIAAMAEVIPVAKQEGVVLDEADIAYWLGVVDALSDAGKPSMRQDVEAKRPSEVALFSGTVVALRQKHRIKTPVNAMLYDNIMAIEKGYV >NC_016894.1|WP_169314718.1|3909680_3909833_-|hypothetical-protein MEIKKQQSLAWMPWLFFSEPRLSNKSGMICFGNRADDQSNEKVMRVKRFF >NC_016894.1|WP_014357737.1|3909921_3911073_-|DUF924-family-protein MYKISELTVADYLVKMSVCDFPGPAAGSAAATAAAMAAALLEMSCDGSLRKSGDNLLLVESIAIGAELRQACLMLADVDMMAYGQVIAAAKNKAGDREAYETAMKGATEPFIQILRHCHRLLDQIEKVIKGSFSRVLGDLVGGAYLAEAAAAASKSGIDVNLRLIHDEAFQNRYQAEANALYRACASLKAEILNQVFSSSRGIHSDAKAVLDFWFEPQNQPFWFQKNQAFDLAIKTNFYDHWVAGCNGLLSDWRDTIEGRLAEIILLDQFSRNLNRDNPKAFAQDGMALVLSQEAIHHPDFNRLPQAWQRFMLMPFMHSEAADIHQVALPLFEALGDPATLEYEIKHQQIIDQFGHFPHRNEILKRESTPAEIEFLKQPGSSF >NC_016894.1|WP_169314719.1|3911635_3911746_-|hypothetical-protein MYATVDIVMVVTYWNIGKQTYETQDEYERVEYGICT >NC_016894.1|WP_014357740.1|3911883_3912087_-|hypothetical-protein MVRQVGSSIGIAILGTIFFGTVGNLSGITGFVMGIRYAILSAVGILILTIPLVFLFPKKAQQHSDTF >NC_016894.1|WP_014357742.1|3912901_3914134_-|NAD(P)/FAD-dependent-oxidoreductase MKRQIIVVGAGPGGSTAAFYFAKKGMDVLLLDRETWPREKPCGGTYLPVCYPMFEEMGVLEEMQSVAEMSATKVRLILHDEANGEFTTKPKLNMPRRYGDDCIRRSALRAGADYMENFDVTELIMRKGVVKGVKGYYHNQEMTIESDLVIVADGAHSVLANQLGAFENDPERVMYTFRSMMTGVEGLEDDIIEQYYLPDTLPNEAHSPICVFWLCPQKSGVTLFGVTITEKALRETKFSIEELVEVWVTTTEFGKKRMQNAKVLDDYGYRGWRLPGCTKLHKSYYPGAIIIGDAISAAECAFEYGIPEAMFGGKIAAEVGAEIFAANGTFDEETLAEYRRRAEAQLNPTLGFNAIFRTELLDHKDRLDAFLKWAKEQPGYPNNDFGVNVAQFITKELGIPLQVGGEASMQ >NC_016894.1|WP_014357743.1|3914135_3915842_-|FAD-dependent-oxidoreductase MSEIRIVPNKNKEFVLKRAAVAHIDPKRCVNCGTCRELCPTDAIQENQRTICRICPGCTDKPGMSLDAMDAFTTKQSCTTACPLGISPQGYVNLVNCGKEKEAYELNWKKNPLPSVCAFICNHPCEEVCKRGVLVDQPIMIRGVKRFLSEHVDYVPEKYPRNYEERIAIIGAGPAGLAAGHFLSREGYNVTIFEGEAEAGGMLIKGIPEFRLDREALKRDISKLEEAGLEIKVNQRIGKFYLNKIRKEYDAVILAAGEPNGKLLKIPGHMNDAILTAMQFMQKANNDQTFVSCPGDFFRIKGGEGIIIGGGSVAMDVARAAVRLGAKNVTVVAVEEYDNLPAHAWEVKEAQEEGVQVLGGYCPTEYVNGGGGTFDHVHFVKVKEMIKDENNKLQFVFNEEEYIDIRGDFAVVATGQEADKSWPESDDKTFFYAGDISGESNCVIDAMASGRKTAYKVDAKLRGRTLRDMDLSHEIYAAPLNEKIYPANRRRVVTFEQPVLKPEDRVNNFEAVDLCYTEKQAKQEVSRCLSCGYEIVDVSKCIGCGICQKECPKGDVITMIAAEVRKEI >NC_016894.1|WP_014357744.1|3916128_3916794_-|TetR/AcrR-family-transcriptional-regulator MSQINDEKRSEILKCSYDLFSHNDYCSVFLKDIAAQVGISKSRLQNFFPKKREIIRNLLEEYIYQLFRYVEERLAVDVTVYYKLALFTAFFWKLIDRNKELHYFMMNVITNNELLDVLTDFVFCWHSEMKYEGVHNFEIANLRQSLIFSISGGSALYIKKDSLNIETLYITQNISDTFMRMMGCSDEQISEVLKNTSEWLPKMDVNSFLEYSRDNIAWMQP |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
NC_016894_2 | 2.1|3377751|34|NC_016894|CRISPRCasFinder,CRT | 3377751-3377784 | 34 | NC_021561 | Vibrio phage pYD38-B genomic sequence | 25675-25708 | 8 | 0.765 |
NC_016894_2 | 2.6|3378080|34|NC_016894|CRISPRCasFinder,CRT | 3378080-3378113 | 34 | NC_011044 | Mycobacterium phage Nigel, complete genome | 65045-65078 | 8 | 0.765 |
NC_016894_2 | 2.52|3378088|34|NC_016894|PILER-CR | 3378088-3378121 | 34 | NC_011044 | Mycobacterium phage Nigel, complete genome | 65045-65078 | 8 | 0.765 |
NC_016894_2 | 2.33|3379846|35|NC_016894|CRISPRCasFinder,CRT | 3379846-3379880 | 35 | NC_013940 | Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence | 152505-152539 | 9 | 0.743 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NC_024989 | Clostridium botulinum plasmid pMI06-01 DNA, complete genome, strain: Miyagi2006-01 | 15242-15276 | 9 | 0.743 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NC_025002 | Clostridium botulinum plasmid pTO08 DNA, complete genome, strain: Tochigi2008 | 15242-15276 | 9 | 0.743 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NZ_LR134422 | Legionella adelaidensis strain NCTC12735 genome assembly, plasmid: 13 | 163764-163798 | 9 | 0.743 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NC_011246 | Borrelia recurrentis A1 plasmid pl124, complete sequence | 19263-19297 | 9 | 0.743 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NC_011247 | Borrelia duttonii Ly plasmid pl165, complete sequence | 59081-59115 | 9 | 0.743 |
NC_016894_2 | 2.43|3380504|36|NC_016894|CRISPRCasFinder,CRT | 3380504-3380539 | 36 | NC_030925 | Bacillus phage Shbh1, complete genome | 24197-24232 | 9 | 0.75 |
NC_016894_2 | 2.79|3379854|35|NC_016894|PILER-CR | 3379854-3379888 | 35 | NC_013940 | Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence | 152505-152539 | 9 | 0.743 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NC_024989 | Clostridium botulinum plasmid pMI06-01 DNA, complete genome, strain: Miyagi2006-01 | 15242-15276 | 9 | 0.743 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NC_025002 | Clostridium botulinum plasmid pTO08 DNA, complete genome, strain: Tochigi2008 | 15242-15276 | 9 | 0.743 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NZ_LR134422 | Legionella adelaidensis strain NCTC12735 genome assembly, plasmid: 13 | 163764-163798 | 9 | 0.743 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NC_011246 | Borrelia recurrentis A1 plasmid pl124, complete sequence | 19263-19297 | 9 | 0.743 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NC_011247 | Borrelia duttonii Ly plasmid pl165, complete sequence | 59081-59115 | 9 | 0.743 |
NC_016894_2 | 2.89|3380512|36|NC_016894|PILER-CR | 3380512-3380547 | 36 | NC_030925 | Bacillus phage Shbh1, complete genome | 24197-24232 | 9 | 0.75 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NZ_CP036355 | Bacillus sp. SYJ plasmid unnamed1, complete sequence | 205677-205711 | 10 | 0.714 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NC_014535 | Gloeothece verrucosa PCC 7822 plasmid Cy782206, complete sequence | 11707-11741 | 10 | 0.714 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NZ_CP036355 | Bacillus sp. SYJ plasmid unnamed1, complete sequence | 205677-205711 | 10 | 0.714 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NC_014535 | Gloeothece verrucosa PCC 7822 plasmid Cy782206, complete sequence | 11707-11741 | 10 | 0.714 |
NC_016894_2 | 2.35|3379977|35|NC_016894|CRISPRCasFinder,CRT | 3379977-3380011 | 35 | MN694725 | Marine virus AFVG_250M823, complete genome | 28083-28117 | 11 | 0.686 |
NC_016894_2 | 2.35|3379977|35|NC_016894|CRISPRCasFinder,CRT | 3379977-3380011 | 35 | MN694730 | Marine virus AFVG_250M981, complete genome | 28702-28736 | 11 | 0.686 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NC_010933 | Bacillus cereus strain G9241 plasmid pBC210, complete sequence | 66839-66873 | 11 | 0.686 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NZ_CP009940 | Bacillus cereus strain 03BB87 plasmid pBCX01, complete sequence | 120737-120771 | 11 | 0.686 |
NC_016894_2 | 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT | 3380306-3380340 | 35 | NZ_CP009591 | Bacillus cereus G9241 plasmid pBC210, complete sequence | 196249-196283 | 11 | 0.686 |
NC_016894_2 | 2.81|3379985|35|NC_016894|PILER-CR | 3379985-3380019 | 35 | MN694725 | Marine virus AFVG_250M823, complete genome | 28083-28117 | 11 | 0.686 |
NC_016894_2 | 2.81|3379985|35|NC_016894|PILER-CR | 3379985-3380019 | 35 | MN694730 | Marine virus AFVG_250M981, complete genome | 28702-28736 | 11 | 0.686 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NC_010933 | Bacillus cereus strain G9241 plasmid pBC210, complete sequence | 66839-66873 | 11 | 0.686 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NZ_CP009940 | Bacillus cereus strain 03BB87 plasmid pBCX01, complete sequence | 120737-120771 | 11 | 0.686 |
NC_016894_2 | 2.86|3380314|35|NC_016894|PILER-CR | 3380314-3380348 | 35 | NZ_CP009591 | Bacillus cereus G9241 plasmid pBC210, complete sequence | 196249-196283 | 11 | 0.686 |
1. spacer 2.1|3377751|34|NC_016894|CRISPRCasFinder,CRT matches to NC_021561 (Vibrio phage pYD38-B genomic sequence) position: , mismatch: 8, identity: 0.765
aataaattgagatggcaaaatgttatattcattc CRISPR spacer agcaactgtagctggcaaaatgttttattcattt Protospacer *..** * ** ************ ********.
2. spacer 2.6|3378080|34|NC_016894|CRISPRCasFinder,CRT matches to NC_011044 (Mycobacterium phage Nigel, complete genome) position: , mismatch: 8, identity: 0.765
gaaaatgaagtcaatgccctagccccgg-cattgc CRISPR spacer gcccatgaaggcaatgccgtagccccggccaccg- Protospacer * ****** ******* ********* **..*
3. spacer 2.52|3378088|34|NC_016894|PILER-CR matches to NC_011044 (Mycobacterium phage Nigel, complete genome) position: , mismatch: 8, identity: 0.765
gaaaatgaagtcaatgccctagccccgg-cattgc CRISPR spacer gcccatgaaggcaatgccgtagccccggccaccg- Protospacer * ****** ******* ********* **..*
4. spacer 2.33|3379846|35|NC_016894|CRISPRCasFinder,CRT matches to NC_013940 (Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence) position: , mismatch: 9, identity: 0.743
aagaattgtttcttttgcttttctcatgtcttcaa CRISPR spacer ttcactggtttcttttgcttttctcatttcatctt Protospacer * * ******************** ** **
5. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NC_024989 (Clostridium botulinum plasmid pMI06-01 DNA, complete genome, strain: Miyagi2006-01) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gatgatttaattaaagcttttaatgactacactaa Protospacer **.*************** *******.* .. *
6. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NC_025002 (Clostridium botulinum plasmid pTO08 DNA, complete genome, strain: Tochigi2008) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gatgatttaattaaagcttttaatgactacactaa Protospacer **.*************** *******.* .. *
7. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NZ_LR134422 (Legionella adelaidensis strain NCTC12735 genome assembly, plasmid: 13) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer tttaatttaattaaagttattattgattttattta Protospacer ..************.***** *******. **
8. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NC_011246 (Borrelia recurrentis A1 plasmid pl124, complete sequence) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gttagattttttaaagatattaattattttgattc Protospacer * ... ** ****** ******* **********
9. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NC_011247 (Borrelia duttonii Ly plasmid pl165, complete sequence) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gttagattttttaaagatattaattattttgattc Protospacer * ... ** ****** ******* **********
10. spacer 2.43|3380504|36|NC_016894|CRISPRCasFinder,CRT matches to NC_030925 (Bacillus phage Shbh1, complete genome) position: , mismatch: 9, identity: 0.75
ctttttacatcttttaagttcatttttattcctccc CRISPR spacer gcaagtaactcttttattttcatttttattcctccc Protospacer . ** ******* ******************
11. spacer 2.79|3379854|35|NC_016894|PILER-CR matches to NC_013940 (Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence) position: , mismatch: 9, identity: 0.743
aagaattgtttcttttgcttttctcatgtcttcaa CRISPR spacer ttcactggtttcttttgcttttctcatttcatctt Protospacer * * ******************** ** **
12. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NC_024989 (Clostridium botulinum plasmid pMI06-01 DNA, complete genome, strain: Miyagi2006-01) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gatgatttaattaaagcttttaatgactacactaa Protospacer **.*************** *******.* .. *
13. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NC_025002 (Clostridium botulinum plasmid pTO08 DNA, complete genome, strain: Tochigi2008) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gatgatttaattaaagcttttaatgactacactaa Protospacer **.*************** *******.* .. *
14. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NZ_LR134422 (Legionella adelaidensis strain NCTC12735 genome assembly, plasmid: 13) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer tttaatttaattaaagttattattgattttattta Protospacer ..************.***** *******. **
15. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NC_011246 (Borrelia recurrentis A1 plasmid pl124, complete sequence) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gttagattttttaaagatattaattattttgattc Protospacer * ... ** ****** ******* **********
16. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NC_011247 (Borrelia duttonii Ly plasmid pl165, complete sequence) position: , mismatch: 9, identity: 0.743
gacgatttaattaaagctattaatgattttgattc CRISPR spacer gttagattttttaaagatattaattattttgattc Protospacer * ... ** ****** ******* **********
17. spacer 2.89|3380512|36|NC_016894|PILER-CR matches to NC_030925 (Bacillus phage Shbh1, complete genome) position: , mismatch: 9, identity: 0.75
ctttttacatcttttaagttcatttttattcctccc CRISPR spacer gcaagtaactcttttattttcatttttattcctccc Protospacer . ** ******* ******************
18. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NZ_CP036355 (Bacillus sp. SYJ plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.714
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaactccaattgaacctattaatgattttgatag Protospacer * . *..****.** *****************
19. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NC_014535 (Gloeothece verrucosa PCC 7822 plasmid Cy782206, complete sequence) position: , mismatch: 10, identity: 0.714
gacgatttaattaaagctattaatgattttgattc CRISPR spacer tgggttttaattaatgctattaatgttttttgata Protospacer . * ********* ********** **** . *
20. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NZ_CP036355 (Bacillus sp. SYJ plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.714
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaactccaattgaacctattaatgattttgatag Protospacer * . *..****.** *****************
21. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NC_014535 (Gloeothece verrucosa PCC 7822 plasmid Cy782206, complete sequence) position: , mismatch: 10, identity: 0.714
gacgatttaattaaagctattaatgattttgattc CRISPR spacer tgggttttaattaatgctattaatgttttttgata Protospacer . * ********* ********** **** . *
22. spacer 2.35|3379977|35|NC_016894|CRISPRCasFinder,CRT matches to MN694725 (Marine virus AFVG_250M823, complete genome) position: , mismatch: 11, identity: 0.686
tcgccatcgtcattcccagtaacgacaatatccga CRISPR spacer ccaaagcatccattcccagtaacgacaaaatcgga Protospacer .*. .. .****************** *** **
23. spacer 2.35|3379977|35|NC_016894|CRISPRCasFinder,CRT matches to MN694730 (Marine virus AFVG_250M981, complete genome) position: , mismatch: 11, identity: 0.686
tcgccatcgtcattcccagtaacgacaatatccga CRISPR spacer ccaaagcatccattcccagtaacgacaaaatcgga Protospacer .*. .. .****************** *** **
24. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NC_010933 (Bacillus cereus strain G9241 plasmid pBC210, complete sequence) position: , mismatch: 11, identity: 0.686
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaacgccaattgaacctattaatgattttgatag Protospacer * . ..****.** *****************
25. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NZ_CP009940 (Bacillus cereus strain 03BB87 plasmid pBCX01, complete sequence) position: , mismatch: 11, identity: 0.686
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaacgccaattgaacctattaatgattttgatag Protospacer * . ..****.** *****************
26. spacer 2.40|3380306|35|NC_016894|CRISPRCasFinder,CRT matches to NZ_CP009591 (Bacillus cereus G9241 plasmid pBC210, complete sequence) position: , mismatch: 11, identity: 0.686
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaacgccaattgaacctattaatgattttgatag Protospacer * . ..****.** *****************
27. spacer 2.81|3379985|35|NC_016894|PILER-CR matches to MN694725 (Marine virus AFVG_250M823, complete genome) position: , mismatch: 11, identity: 0.686
tcgccatcgtcattcccagtaacgacaatatccga CRISPR spacer ccaaagcatccattcccagtaacgacaaaatcgga Protospacer .*. .. .****************** *** **
28. spacer 2.81|3379985|35|NC_016894|PILER-CR matches to MN694730 (Marine virus AFVG_250M981, complete genome) position: , mismatch: 11, identity: 0.686
tcgccatcgtcattcccagtaacgacaatatccga CRISPR spacer ccaaagcatccattcccagtaacgacaaaatcgga Protospacer .*. .. .****************** *** **
29. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NC_010933 (Bacillus cereus strain G9241 plasmid pBC210, complete sequence) position: , mismatch: 11, identity: 0.686
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaacgccaattgaacctattaatgattttgatag Protospacer * . ..****.** *****************
30. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NZ_CP009940 (Bacillus cereus strain 03BB87 plasmid pBCX01, complete sequence) position: , mismatch: 11, identity: 0.686
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaacgccaattgaacctattaatgattttgatag Protospacer * . ..****.** *****************
31. spacer 2.86|3380314|35|NC_016894|PILER-CR matches to NZ_CP009591 (Bacillus cereus G9241 plasmid pBC210, complete sequence) position: , mismatch: 11, identity: 0.686
gacgatttaattaaagctattaatgattttgattc CRISPR spacer taaacgccaattgaacctattaatgattttgatag Protospacer * . ..****.** *****************
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
144479 : 152177
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NC_016894|144479:152177|DBSCAN-SWA TATGGCCGTATACATTAATGAGCCGTCGCATACATTTGGAGAGTATTTACTAATGCCCGGTTATTCATCAACAGACTGCATTCCGGATAACGTTAGTTTAAAAACACCGTTAGTAAAATTCAGAAAAGGTGAACAATCGGCAATATCGTTAAATATTCCAACAGTATCAGCGATTATGCAGTCGGTATCTGATGATACCATGGCGATTGCACTCGCAAAAGAAGGTGGTCTTTCTTTTATTTATGGATCACAGCCGATTGAAAGTCAGGCCAAAATGGTAGCGCGTGTCAAATCATATCGGGCCGGCTTTGTTGTGAGTGATTCCAATATTTCACCCGAAGGCACCCTTGAAGAAATTCTTGTCCTGAAGAAAAAAACCGGCCATTCAACGGTTGCGGTTACCACTGATGGCACGGAAGATGGTAAGCTGGTGGGGATTGTAACCAGCAGGGATTATCGCATCAGCCGAATGGATTTAAAAACAAAAGTTAAGGAATTCATGACGCCCTTTGAAAATCTGGTTTGGGCACCAGATAATACGACCCTTAAAGAAGCTAATGATATCATCTGGGAGCACAAGTTAAACTGTCTGCCTTTGATCGATAGTAAGCAAAAGCTCGTTTTTATGGTGTTTCGAAAAGATTATGATTCGCATAAAGAAAACGAAAATGAGCTGATTGATGATTTCAAACGTTTTGTTGTTGGTGCTGGTGTTAATACACGGGATTATGCCGAACGGATACCCGCGTTGATCGCCGCCGGGGCCGATGTCTTATGTATTGACAGCTCTGAAGGTTTTACCGAATGGCAGAAAATCGTGATTCAATATGTTCGTTCAAATTATGGCGATAAGGTCAAAATCGGAGCCGGAAATATTGTTGATAAAGAGGGCTTTTTATTTCTGGCCGAAGCCGGAGCCGATTTTATCAAGATTGGAATTGGCGGCGGGGCAATTTGCATCACCCGTGAACAGAAGGGGATTGGCAGAGGGCAAGCCACGGCGGTTATTGAAGTTGCAAAAGCCCGAGATGATTATTTTGAAGAAACGGGGATTTATATCCCGCTTTGTTCGGACGGCGGCACCGTACATGATTATCACATGACACTGGCCCTTGCGATGGGGGCGGATTTTATTATGATGGGGCGTTATTTTGCCCGATTTGATGAAAGTCCGACCAATAAAGTAAATATCAAGGGCAATTACATGAAAGAGTATTGGGGCGAAGGCAGCGAACGTGCTAAAAACTGGCAGCGGTACGATTTGGGCGGCAGCAGTAAACTTTCTTTTGAAGAAGGCGTTGATTCCTATGTTCCGTATGCGGGAAGTTTAAAAGATAATCTGAGTTTATCTTTGAGTAAAATTCGATCAACCATGTGTAATTGTGGGGTATTAACGATACCCAAACTCCATAAGCATGCCAAAATCACCTTGATCTCGGAAACCAGTATTATTGAGGGTGGATCACATGATGTTATGTTGAAAGAAAGCAAACAAATTATCGGGAGTTAATTTGAGCGGTTTTATAAGAGCTGAAATTATTGGTTCACCGATTTGTGAGTCGGTTGGAAAATTTTAATTTCTCACAGGCAATAATAAAAGATGAGCCTACGTGCATGAGGCTCATCTCTTTTAATTGATGGGATTATCCATCAATGTGTAATTAAGACAATGTGTCATTTTGAATGTAAGGGTTCGGAGCGTTTTAAGTTTTAGGCAAAAATAATTTATCGTTTGCTTGGAAGTGATCATTATCCGCGGAAAGGATTTGATCGTTTGCTACCCGGATGGCTAAAGCAGTGGACTTTGTTGCGTAACATAGCTTCTTAAATGGTCGGATAGTCGAGTGTATTATTTTTAAGCGGTATTTCCTTTCGCAAAGAAACAATTGACAATTATGGTAGATTACCGTATAATCAACAGGCATGAAAAAATTGAAAAGATTGTTTTGTTTTACCTGAGGAGAGATGTCTGAGTGGTCGAAGGAGCACGCCTGGAAAGCGTGTGTACGTGTAAGCGTACCGAGGGTTCGAATCCCTCTCTCTCCGCCATTGAAAATTGGCTTAATAACGGCGTTTGCGTCGTTTTTTTTATGCAAAATTTTATGTTTACCCTTTAATTTACCCTTTATAGATTTTTTACACCCTTTATAAAACTCTCCATTCGGTTTGCACTTTCTGTTTTCATACGATCTGATACATGACCATAAACATCTAATGTGAATGATGCAGTATGATGACCGAGGTTTTCCTGAACACTTTTGATATCATCTCCAGATTGCAATGCAGCTACCGCATAAGAATGGCGTAAATCATGAAAGCGTGCTTCAGGAAGTCCGATACTTTTAACAATTTTTTTGTAGTTAGTAGATACTGTTACATGTGCAAGATGACCACCTAATTGATTGGAAAAAACGAGGTTACTATCTTCCCAAGCAGATCCAGCAATTAAACGCCATTGGTTTTGAACGGCTTTATGCTCTTGGAGCAATTTGATTATTGATGGGGGTAAAGTGATGTTTCTAGATCGATCATTTTTCAGAGAAACAAACATATATACACCCTCGATTCTTTGGAGTTGTTGATAAATTAAAATTGTACCATTTTGCAGATCCACAGAATCCCATGTAAGCCCAAGGACTTCACCTTGCCTCATGCCTGTAAACAAAGTAAAAAGAAACAGATCCTCAAATTGATGGCCATTAATTGATTTGAGGAAATTTGATATTTCAATTTCGCTTAATGGTTTTATTTTAGTCTTTTCTACTCGTGGTAGTTTACATGCATTTGATGGGTTTGCGGTGATATAATTAATTTCTAGTGCTTGCTGAAGCCCCTTATGTACGACACCATGAATATTTTTAATGGTTTTTGGAGACAATGCAGGTTTTTCTTTAGAACCACTTAGTAACTTGTTATAAAATGATTGAATTGCATGTGTTCCAAGGGTTGCGAGCTTTATTGATCCTAATTGTTAATTAGCAAATTATAAGTGTCAAAACAGTCCTGATTTAGTCAAATTATTCTGGATGAATCGGTCTTATCAACTATGATATAATGATTAAACATTAATCACGATAAGGAAGCAAAAACCATGGTTCATCTGGAACACTTTTCTGGCCATCCGTTAGATTACATCACAGAATTTCACATATCTGAAAAAATCCGCATTGACAGCTGCCCTCATTGTTATTCGCGCCGGCGGCTCCATCTTCATGGTGTCTATCACCGGCACATCATCTGGTATGATGATGTCTTTTCCATTCCGGTACAGCGCCATTACTGCATTCATTGCGGCAAAACGGTCAGTATCCTGCCTTCCTTTTGCCATCCCGGCTTTCAACTGGCCCTTCCTTTTCTATTGGAACTGCTTTGGGCCTTCTTTAACAGAATTCCTTCAGCCAATACTTTAGCGCCTCAGCATCGGCACTTTATCACCCGACGTTTTCTACTTTGTATGAATCGGCTGATTGAGTATTTTCGCATCTGCCATGATCCGTTACTCGTCTTTCCTGATTTTTGGCATAAAAAAGCCATAAAGCTTCTTGAAATGGTCTACTCGGTGGGGAAGCCCCACATCTTCGGCAAAAGATATCACGATCATTTTAAGAAAGGATTTATGGCACATTAATTGTACCATCCTTCCGCATTTTTTTGAAGTCCTGTTTATCCCACACAGCGTTTGCTTTGCCTTTTATCGATTGATCCGTTATGCTCTACTTACCTGGTTTTATGGATCCTTAAAACCTCATATTTTTAAAATCGGAGGTTTTTACAATGACTGAAAAAGACAAAGAACTGATTGCTTTATTTCGCTATGGCCTGATTGCACCGTTACTCACGGATACCGTCTCATCGCACACGGCTTATCTGGATGAGATCAGTGCAAAAACCCATGATGTTCCCCATTATGGCATCCGCACTTACAACCGCAAAACCCTGCTGGAATGGCACCGGCTCTATCGGCGCCATGGTTTTGATGCGCTCAAGCCGAAGGTTCGGACAGACAAAGGGTCGTCCCGGGCTTTACCGGCGGAATCAGTGAAGCTGTTGCTTAAGCTGAGAAATGAGAACATCCATTTATCCGTAAAGTTGTTCCAGGAATGGCTCATTTACGAAGGTCACTTCACCAGCTCCGACTGTTCCTATTCGACGGTGTATCGGCTGCTCAAAAAACATCAGCTGTTAAAGCCATCGGCGATCGATACGTCGGACCGCCGCCGGTTTGCTCATATTGACATCAACACCCTGTGGCAGACCGATGTCTCCCACGGCCCGTATCTGTCCCTTAACGGCAAAAAGCGCAAAACTTATCTGATTGCTTTTATCGATGACGCTTCCCGGCGGATTACCGGGGCTCAGTTCATGCTGGCTGAAAAGAATGAAGATCTCCTTCATGTCCTTAAATCTGCTTTACTTACCTGCGGTAAGCCCACCATGCTTTATGCGGATAATGGCAAGATTTTCCGTTCCCACCAACTCAATACTTCCTGTGCCACCCTGGGGATAGCGCTGGTCAATACCAAGCCTTATGATCCAAAAAGCAAGGGCAAAATTGAGCGCTTTTTCAAAACGGTCCGCAGCCGTTTCTATCCACTTTTGACGGATGCTGACTTAATGGATCTTGATGTCCTTAACCAACGCTTTGAGGCCTGGCTGGCTCGGGACTATCATCACAAGGTTCATTCGTCCATCAATGAAGCACCGATGGTCTTCTATATGCGGGGGAGTGACCGGATTAAGCATTTTTCGGATCCCCGGATCATTGATGAAGCCTTTCTGATCCGGGTGACCCGGAAGGTCAAGTCGGATGCCACCATCTCGCTGCACAACGCCCTTTTCGAAGCGTCGCCGATGTTTATTGGTAAGAGCGTGGATATCCGTTACCCCAATGAATCCCCGGATAAAATCTATATCTATGAAAACAGTGTCCGGATTTATACCTGTAATAAAGTCATTATGAAGGACAATGCGGTTGCCAAACGCAATAACAATCCCATCAGCTACAGTTCCTTAGGCGGTGTGCCGCATGTATAAATCATTTTTCGGATTCCAGCAGGCACCCTTTGACAAGGGGATTGATTCAGCGATGCTCTTTCAGTCGGAAGCTTACAAGGAAGTGCTGGCCCGCCTGGATTATCTCAAAACGACCCGTGGGTTTGGTCTGATTACCGGGGACCCCGGGGTTGGTAAAACATCAACGCTTCGGGTCTTTGCGGACACCCTGAATCCGTCCTTATATAAGGTCATGTATTTCCCGATGTCTTCCGGCACAACCATGGATTTTTACCGGGGGCTGGCGTTTTCGCTGGGGGAACAACCCCGATTCCGCAAAGTGGAGCTGTTCTTTCAGATTCAGAACGCCATTACCGATCTTTATGATAAGCGCCGCATCACCCCGGTCTTTATCCTGGATGAGATGCAGTCGGCTTCCGCTCAGTTTCTTCACGATCTGAGCATCATTTTTAACTTTGATATGGATAAACGCAATCCTTTTATTCTGATTCTTACTGGTTTACCGACTTTGGCCAACCGTCTGGCCTTAAACCAGAACCGGTCGCTTGATCAGCGACTGGTGACCCGCTTTCATTTTTCGCCATTGACCCCGGATGAGGTCAGGGACTACATCAAACACCGGTTTAAGCATGCTGGTGTTTCACGGAATCTGATCAACGAGAACGCTTATGAGGCCATTTCGTCTTCAACGGGTGGTTACCCACGATTAGTTGGTAATCTGGTGACTCAATGTCTGATTCTTGCCTTTCAAAAGCAGCGTGATCTCATCGATGAAGAGATTGTTTTTGCCGCTTCTGCGGAAGCTGGGATTTAGCGCCTGACGGCGTTATTTCCCTTTTTTTCTGGAGAAATAAAGCGTGATTATGTGATTAAAAACTGGAATTATACTTTCAACACGCCATTATTTTCGCATTATTTGGTTCTTTTTCATCCGATTTATTGTGATTAATCCAGTCCGAAATAATGTGAAAATTTACACCTAATGAAGGTTTGATATGGTTGTTGATAGCAACTCGGTATGATTTGAGAGTCAAGGGTTTAATGCTACCAGTATACTCTTTTAACCAAATATCAAACCAATTACCGACAGTTAATTTTGATGGTTCAATATAATTACCATTATCGATAGAAGCACAAGCAATTTGGAGCTTTTTTCTAACTTCAGCCTGGGTTTTGCCGTAAACCGACTTTTGAATCTGTTTTCCAGTCCCAGGATCGTATCCAACAGTAAACCGTGCTTCCCATAATCCATCCTTATTTCTTTTTCGAATTGTTCCACTACCATGTGCATTTCTACCAGTTTTTCTAGCCATTGTAAGACACAACCTTTCAATTAAATTTTACAAGTTTTCTCTTTTGTGAATTTCTAAACGAAAAAATAATACCTTAACATTATACCCTTCAAGATATAGTTTTATATCCGTAAACAATTATTAATTGTTAATGCCACTTGATTTCATTAACCATATGTTAAAGGCTTCGACAGGAATAATAATTCGTCTGCCGATATTTAGACATGGAAATCCATTTTGCCGCACTAATTCATATGCTTTTGGTTTGCTAATTCCCAATTGTTTAGACAATTCAGCTACGTTCATGGTTGCTTTTTCTATATGCCGCTCCTCATGTCCTTTTTTCTGATTTGTTGAGAACCTACTAAATTGATGAACGAGTTCGGGATACTCAGCGTTCTTTTGGGGGCTTGCTGTTACAGTGATGAAGTTTTTTTGATTGCTTTTTATTGTACCTGTAATTTTGGGCATATAAATCTCCTTTTGATTGTCAAAATTTTTATTATAGTGTTTTAGATTTCACTTGAAATGATCCAACATTCATATGAGCGTATCATTCAAGAAGCAGCGACTAGTGAAGAAAAATTAGTATTCTCCAACTAGCCGACATTGAAACTGTTATGAGAAATTAATCTTTAAGCTGCAAATGTACCATTTTCAACAGCTTCCATAATTTTGTCGAAAAAGTATATTTGTCCTTTCGGTGTGAATAGCGGCGTATATGATGTTATTAATTTACCGCCGGATTTACTCTCTTTTGTGTAGATAACCGCTAATAAATAGCCTTTATCAATGTATTTTTGATAGGGTCGATTGTTCGCTTGGAGGTAGTTATTATCCCTCATCCATTTTAAAAGAATATTCCTCCCGATTGTGAATCCATTTGTACATAGTGTTAAAACATAGTCAGTTGCCTTTAGGTCTGTACTATCTTTAACTAGTTGATCAGCATATGCTGCTTTTCTTTTGAGAATATCGGCTTCTTCTTTATTAAAAGTGACAGTTTCCTGGATAATTTGAGATGCTTTGTCAGCAATTGCTTTTTTATCATCATATCCAGAAACGGGAATGTAGCCGCCTGTCATTCGGATTTGTTTTAGGATCGCTTTAACTTCCTTTTTGAATACTTTGGCTTTGGGCTTTTGGCTTTGCATGAGAACTTCGTAAAGCCCATATTCAGTTAAGAACCACATTTCTCTATTTTGACCTGAGTGCGATATTATCGCCTTCAGCTTTTCTTCATCATCAACTTTATTAAGCATCTCGCTTGGTTTATTGTGTTCGATCCATGCTGCAACATCTTTCGCCAAAAACAATGGGCTAATGATATCTCCATATATTTTAAATTCTTTTCCCAATACTTCCTGTTCGTTAATCACTTTAATCTCGCTCAT
Protein sequences of DBSCAN-SWA_1 >NC_016894|144479:152177|149504_150305_+|WP_014354548.1|DBSCAN-SWA MYKSFFGFQQAPFDKGIDSAMLFQSEAYKEVLARLDYLKTTRGFGLITGDPGVGKTSTLRVFADTLNPSLYKVMYFPMSSGTTMDFYRGLAFSLGEQPRFRKVELFFQIQNAITDLYDKRRITPVFILDEMQSASAQFLHDLSIIFNFDMDKRNPFILILTGLPTLANRLALNQNRSLDQRLVTRFHFSPLTPDEVRDYIKHRFKHAGVSRNLINENAYEAISSSTGGYPRLVGNLVTQCLILAFQKQRDLIDEEIVFAASAEAGI >NC_016894|144479:152177|150924_151104_-|WP_041669838.1|DBSCAN-SWA MEKATMNVAELSKQLGISKPKAYELVRQNGFPCLNIGRRIIIPVEAFNIWLMKSSGINN >NC_016894|144479:152177|146603_147203_-|WP_083837915.1|integrase|DBSCAN-SWA MSNFLKSINGHQFEDLFLFTLFTGMRQGEVLGLTWDSVDLQNGTILIYQQLQRIEGVYMFVSLKNDRSRNITLPPSIIKLLQEHKAVQNQWRLIAGSAWEDSNLVFSNQLGGHLAHVTVSTNYKKIVKSIGLPEARFHDLRHSYAVAALQSGDDIKSVQENLGHHTASFTLDVYGHVSDRMKTESANRMESFIKGVKNL >NC_016894|144479:152177|144479_145988_+|WP_014354544.1|DBSCAN-SWA MAVYINEPSHTFGEYLLMPGYSSTDCIPDNVSLKTPLVKFRKGEQSAISLNIPTVSAIMQSVSDDTMAIALAKEGGLSFIYGSQPIESQAKMVARVKSYRAGFVVSDSNISPEGTLEEILVLKKKTGHSTVAVTTDGTEDGKLVGIVTSRDYRISRMDLKTKVKEFMTPFENLVWAPDNTTLKEANDIIWEHKLNCLPLIDSKQKLVFMVFRKDYDSHKENENELIDDFKRFVVGAGVNTRDYAERIPALIAAGADVLCIDSSEGFTEWQKIVIQYVRSNYGDKVKIGAGNIVDKEGFLFLAEAGADFIKIGIGGGAICITREQKGIGRGQATAVIEVAKARDDYFEETGIYIPLCSDGGTVHDYHMTLALAMGADFIMMGRYFARFDESPTNKVNIKGNYMKEYWGEGSERAKNWQRYDLGGSSKLSFEEGVDSYVPYAGSLKDNLSLSLSKIRSTMCNCGVLTIPKLHKHAKITLISETSIIEGGSHDVMLKESKQIIGS >NC_016894|144479:152177|150381_150804_-|WP_014354549.1|integrase|DBSCAN-SWA MARKTGRNAHGSGTIRKRNKDGLWEARFTVGYDPGTGKQIQKSVYGKTQAEVRKKLQIACASIDNGNYIEPSKLTVGNWFDIWLKEYTGSIKPLTLKSYRVAINNHIKPSLGVNFHIISDWINHNKSDEKEPNNAKIMAC >NC_016894|144479:152177|151418_152177_-|WP_014354551.1|DBSCAN-SWA MSEIKVINEQEVLGKEFKIYGDIISPLFLAKDVAAWIEHNKPSEMLNKVDDEEKLKAIISHSGQNREMWFLTEYGLYEVLMQSQKPKAKVFKKEVKAILKQIRMTGGYIPVSGYDDKKAIADKASQIIQETVTFNKEEADILKRKAAYADQLVKDSTDLKATDYVLTLCTNGFTIGRNILLKWMRDNNYLQANNRPYQKYIDKGYLLAVIYTKESKSGGKLITSYTPLFTPKGQIYFFDKIMEAVENGTFAA >NC_016894|144479:152177|147569_148106_+|WP_014354546.1|DBSCAN-SWA MVHLEHFSGHPLDYITEFHISEKIRIDSCPHCYSRRRLHLHGVYHRHIIWYDDVFSIPVQRHYCIHCGKTVSILPSFCHPGFQLALPFLLELLWAFFNRIPSANTLAPQHRHFITRRFLLCMNRLIEYFRICHDPLLVFPDFWHKKAIKLLEMVYSVGKPHIFGKRYHDHFKKGFMAH >NC_016894|144479:152177|148252_149512_+|WP_014354547.1|integrase,transposase|DBSCAN-SWA MTEKDKELIALFRYGLIAPLLTDTVSSHTAYLDEISAKTHDVPHYGIRTYNRKTLLEWHRLYRRHGFDALKPKVRTDKGSSRALPAESVKLLLKLRNENIHLSVKLFQEWLIYEGHFTSSDCSYSTVYRLLKKHQLLKPSAIDTSDRRRFAHIDINTLWQTDVSHGPYLSLNGKKRKTYLIAFIDDASRRITGAQFMLAEKNEDLLHVLKSALLTCGKPTMLYADNGKIFRSHQLNTSCATLGIALVNTKPYDPKSKGKIERFFKTVRSRFYPLLTDADLMDLDVLNQRFEAWLARDYHHKVHSSINEAPMVFYMRGSDRIKHFSDPRIIDEAFLIRVTRKVKSDATISLHNALFEASPMFIGKSVDIRYPNESPDKIYIYENSVRIYTCNKVIMKDNAVAKRNNNPISYSSLGGVPHV |
8 | Bacillus_phage(50.0%) | transposase,integrase | attL 148003:148016|attR 155627:155640 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
1920565 : 1933851
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NC_016894|1920565:1933851|DBSCAN-SWA GTTATTTGTTAGATCGGGTAATCTGATTTCGTCCAGATTGCTTAGCATTGTGTAAAGCAATCTGAGCATCGTCTAATAGGCGATCATAAGAATGGGCGATCGTATCAGTTCCGGTAGCAACACCTAATGAGATGGTAATGATCTTTTCAATAGGGGAAGATTGATGGGGGATTTTGAGATTGCTGATCGTTTGCTTCAAATTTTTGGCGACATGTAAGGCACCTTCGGAATCAGTGTCAGGGAGCAGGCAGACGAATTGTTGACCACTCCATCGGGCGATCAGGTCGCCGGCTCTTCTTAATGGTTTTTTAAGGCTGAACGCAATTTCCTGAAGACAAGCATCACCTTCCCAAAATCCGTAGGTCTCATTATAGGGTCTAAAGTAATCAATATCAATCATGATAATTGAAAGGGCTGACTTCATTCTTTTTGCTTTTCGTGTTTCAATGGCCAGCGTTTCGTCAAAGCGACGTCGGTTTGAAATTTGTGTAAGGGCATCCATATCAGAAGTTTGGTTAAGAATATCCTGAAAGTATTGAAGCGCCAGATGATTTCTAATTTTTTCTTCAACAAGCTTCAAATCAAAAGGTTTACTGATAAAATCAATCGCGCCAGTATTTAATTCGTAAACTTCATTTTCAGCATCGCTTATGGTCGTTAGAAAAATGATCGGAATATCTTTGGTAGCTTCTTCCAGATGAATTTCTTTAGAAACATCATAACCGTTCATTCCCGGCATGCTCAAATCTAAAAGAATCATATCAGGGCGGGGACTGGTTTGCGCTAAGGCCAAGGCATCTTTGCCGTTGTTGGCAATCAAAAGCTCATAGTTTTTGTTTAACGTTTGTGCTAATAATTCCGTATTTTCCGTTGCATCATCTACAATTAGAAGACGTTGTTTAGGTGTTTCCTGAGGAGTGTCCGCCTTTTTATTAGTTTCCAGTCCCTTGCGTATTTGTTCGATGGCTCGCAGTTCTTCTGCTTTGAGGCGAGTATTCTGATTGTAGATGGACAGCGATTGAGACGAAGGACGGGTTTTTTCAGGATTTTTTGCGGTTTGATCAAGCAATAACAAAAGATCAAACGAAACAATAAATTCATCGTCGTTATTTTGGGAAAGTAATAAGTGACCATTCATTTTATTAACTAAAGATTTAACAAGTTCAAGACCAAAAGACAGCGGGTTGTTCATTTGAGAAAATTCATCATGATTAAAATTTGTAATAAAATCCGAATAATCAGTAATTTCATTTTTATTGAGAATGCCGATAGTTCTGATTGAAAAATATACTTTAAAAACTGTTTTTATGGTGTCTTCCGGAGTGATATCTATAAAAACAGTTCCTTGTTCTAAGCGTTCGAGTGAATTGAGAACCAGGTAGGCAACAATCTGCTTGAGACGATTGGGATCACCCATTACTAATTGCGGTGTTTTAGCATGAATAGACAATTTGATGTTAATGTTTCTTCGTCGAGCGCGAACAATCAGTGGAATAATCGCGTTTTCAACAATGGTATAAAAATTGAAAGAGATCACATCATGAGTTATGGGTACTCCCGAATCAGTCCAGATAATAGCATTAATTAAATCCTCCAGAAGTTGAGACGAAAGTTGGATATTTTCCAAGCAGGTAGTTTGATCTGCGATAGTCTGCGTTTTTTTAAGTAATTTTGAAAAAAGGGTCAGACTTTCCAACGGGGCAAGAATTTCATTTGATAAAATTGAAGTAACTCTGTTTTTTTCAAAAAGGTCTAATTCAGCGGTTTTATTGGAGTTATAAAATGCACTCAGTTCTTGTCCCGAAGCGTAAATAAGGGTATCAACAAATCTGAATTGCCATTTTGCATGTCGGTAAGTCTCATCTTTCGAACGTAAACGACTGTTAAAATCTAAAATTTCATTTTGGGTGCCAAGTTGTTCACGGATATGGTTAAAGTTCGCTTTATCTTCAGGATGGAAAAAGTCAGTTAATTTTTTACTCTCAAGGTCACTCGTTGAATAACCAAGATTGTTCTCCCAGACGGGGTTGACCTTTAAAATTATTCCATTTACATCGGTGATGCAAAGATAATCCGAACTTACTAAAAAAATATTATTAAGATGTTCGTCGCTTTTTTCATTGATTGGAGATAACCCTTTCATTGAGATGATCCTTTCTAAAATGGTAGGATAAAATAATGTTATCTTTTGATAATTTGAAATTTATGTTAAGTCGCGGGGGATCTAGGCGTTAAAAGACCACGTATTTTTTATCTTTACATTTCGTTCCTTAAAGACTGGGATAACGGTTTTAGTGTTTCCAATTTTATCCTTAAATTTAGTAATTATTTCAAAGTTATCCCTAAAATGCATGGGAATCAAGACTTTGGGGTGAAACGTTTCAATAAAATATTGGCCGGCTTTATAAAAAGAATCTCCGAGACGCGGATCGACGGGAATAAAAGCATATTCCATAGGTAAATTTTTCATTTTTTCTAATTCGTTTTTATAGTCTTTTTCTTCTTGGGCAATATCCAGATTAGGTTTTTCCACGGGATCCCAATCCCACCAGTTTAAGTCACCGGCGTGAAAAATGCGGTGCGAGTTGGTGGCAATATAAAATGAAACGCCCTGATCCGTTGAACCAAAAGTCTTAATATCCATTCCGCCCAGAGACATGTGCTGATAGGGTCCAATGGCATGGGTTTTATGGGTGGAATCATTAGAAATATCATTGCTTAAGATATAGGAAGGGTGGTAAATTCGGCTGGTTGAAAAAATATCAGTTGAATAATGATCACTATGTCCATGAGACACAAAAAAATAGTGAGGCAAGCCTTTTCGGAGCAGACTGCTAGGGATATGGGTAAAACAATCAAAAATAATCGTTTTGTCTTCAAACTGAATCAGAAAACCGCTATGGTGCAAGTGATAAATTTTCATTTGAAACCTCGCTCATAAATATATTTTAAATTAATGATGCTTAAATATTATCATCATAATACCTGTTATGTATTAATTTATAAAACAAATTATATCACATTAACGCTTACTTAAAAACAGACGATCAAGAAAAAACATAATTGTTATAAGTTGTTTCAGAAAATGAAATGGATAAAGAATAATAAAGGAATTAAAAAAAATAATCCGAACGTTTTAAATTCTATTGAAATTATTGTTCGGAAATAGTAGAATGGTTTTATCATTTAAAAAGGTGGAATAATTGTGATAAAACGAATTTTTGTAGAAAAAAAAGATAAGTATCAAGTAGAAGCTAAATCTCTGAAACAAACTTTTCAACGAATTTTGAAGATTCAGGGGCTTGAATCGATGCGTATTTTATACCGATACGACGTTGAAGGGGTAAAAGAGGACTTATTTAAGCAGATTATTGGTACCATTTTATCCGAACCTAATGTGGACAAGGTATTTGAAGATTCAATTCAAATAGAAGAAGGCGATAAAATTTTTGGCATTTCATATTTGCCTGGTCAATATGATCAACATGGAGACTCTGCGGTGCAATGTATTCAGATCGTGTCCGGTCAACGGGCATTGGTTAAAGTAGCAAAAATTGTTATCCTCACCGGAGCATTGACTCAAACAGAATTTGATAAGATTAAACATTATATGATTAATCCGGTCGATTCTCAGGAAACCAGTCTTGAACCATTTGAAACTCTGACTGACGAAATAAGGGAGCCTCAAAATATTTTGCCTTTAGTGGGTTTTATTACGTTGACTTCCGATCAATTAGAAGCGTTTCGGCAAGATAACGGATTCGCAATGACAACTGAAGATCTTCAGTTCGTCCAAAATTATTTTAATAACGATGAAAAACGAAATCCGACCATAACGGAATTAAAGGTGATTGATACCTATTGGTCGGATCATTGTCGTCATACGACCTTTTTAACACAGATCCAGCAAGTGACTTTCTTGGGAGACGACCCCATTTCGCAAGAAATGAAACAAGCTTATGATGATTATTCCCAGGCACGAACGGAACTTTACGGCAAAAATACCAACCGCCCGATTAGTTTAATGGATTTAGCCGTAATGGGAACCAAGATTTTAAAGAAACAGGAACGAATTCTTGATTTAGATGAATCAGAAGAAATTAACGCCTGCAGTATTAATATCGTTGTTGATCATGATGGTGTTGACGAAAACTGGTTATTGATGTTTAAGAACGAAACACATAATCATCCAACCGAAATTGAACCTTTTGGGGGAGCAGCGACTTGTTTAGGAGGGGCCATACGGGATCCGCTTTCAGGGCGCAGTTATGTTTATCAGGCGATGCGGGTAACCGGTGCTTGGGACCCGCGCAGTGCCATTGAAGACACCTTGCCCGGCAAGTTGCCACAACGAAAAATTTCGACCGAAGCTGCGCATGGTTATAGCTCTTACGGAAACCAAATTGGTTTAGCGACAGGACAAGTGACTGAAATCTATGATCCGGGATTTTTGGCAAAACGAATGGAAGTTGGTGCGGTGATTGCCGCGACACCAAAGGAAAATGTAATCCGAGAACGTCCGGTACCGGGTGATGTTGTGTTGTTGGTTGGCGGACGTACCGGACGTGACGGTTGTGGCGGTGCCACCGGTTCATCTAAGGCCCATACTGAAGAATCAATTTTGGAAAGCGGGGCCGAAGTTCAAAAAGGAAATCCGGTCGAGGAACGAAAAATCCAACGGCTGTTTAGAAATAAAAAACTGGCCAACTTAATCAAACGATGCAACGATTTTGGCGCTGGTGGGGTATCGGTTGCGATTGGGGAATTGGCCGATAGTCTGGAAATTGATCTCGACCAGGTACCCAAAAAATATGAAGGTTTGGATGGCACGGAGTTGGCTATTTCAGAATCCCAAGAGCGGATGGCAGTTGTTGTTGAGGCCCAGGATGTCGAGACCTTTATTGCGATGGGAAACGCCGAAAATCTTGAAGTGACACCGGTTGCAGTTGTTACCGATTCAGGTCGGCTGGTGATGAAATGGCGCGAAGCCGAGATTCTTAATATTTCCCGCGCTTTTTTGGAAACAAATGGAGCACCACAGTTTATTGATGTGGTCGTTGAAGCACCGCATAAAATAACCGAAGCAAAAACAGCAGTATTTATTGATTTTAAAAGTAAAATGCTGGAAACCCTCAAAGATTTAAATGTGGCCAGTCAGCGGGGCATGGTTGAAATGTTTGATTCCACTATTGGGGCCGGGACTGTGGCGATGCCGTATGGCGGAAAAAACGCATTGTCGCCAATGGATGGCATGGTTGCCAAAATTCCGATGTGTGAGGGTGATACGACAACTTGCAGTATGATGACGTTTGGTTATAATCCCGTTATTGCTAAACAAAGCCCCTATTTAGGCGGCATGATGGGCGTATTGGAATCATTATCTAAATTAGCTGCCATGGGTGGGGATTATAAACAAGCCCGCCTTAGCTTCCAGGAATACTTCGAGCGGTTAGGCACAGAGCCGGTTAAATGGGGGCGTCCATTTGCTGCCCTATTAGGGGCCTATCAGGTGCAGACAGCTTTGGGAACACCCGCGATCGGGGGCAAGGATAGTATGTCCGGAACTTTTGGTGAACTTACAGTTCCGCCAACCCTGATTTCATTTGCGGTGGCAACAGCTCATGTGGAAGCTGTAATTACCAGCGAAATCAAATCTACAGAGTCATTGATTCAGTTATTTACGCTTCCTTTGGATGACAATGGCGTTCCCGAATTAACGGTTGTAAAAGCTGTTTACGACATTCTTATTAAAGCCAATCAGGAAGGTAAAATTCTCAGTGCCAAAACCGTTGGTTTAGGCGGCCTGGCCGAAGCAGTGGCTAAAATGTCTTTTGGTAATGGCATTGGTGTCACTCTAAATGATCATATTGAGCTAAGCTTTTTATTTAAACCCTTGTATGGCGGAATTTTGATTGAAAGCTTTGAAATTCTTGAAGGTTCAACTCCAATCGGAAAAACAAACAATAAGGGTGAAATTATTTATGCGCATGAGGCAATTAATATTAATGAGTTAGTGGAAGCATGGGAAACACCACTCAGATCAGTTTATCCTGAAAAAGTTGAATGTCAAGGTGATGTCAAAACGCTGAGTTATGAGCAAACGCCATTTATTTACAGCAAAGCAAAAATATTAAAACCACAAGTTTTTATTCCTGTTTTTCCGGGGACAAATTGCGAATATGATTCGGTTAAAGCATTTGAAAATGCCGGGGCAAAAGCGGTAACGACAATTTTTAGAAATCAGACGGTACAAGATATTTCCCAGTCAATTGATGAAATGGTCGCCACGATCAAAGCGTCGCAGATGATTATGATTCCTGGCGGTTTCAGCGCTGGCGATCAGCCGAACGGTTCGGGGAAATTTATTGCCGCTGTTTTCCGGAATCCTAAAATGATGGATGCGGTGATGGAATTATTAAATAAACGTGATGGTCTGGTATTGGGAATATGCAACGGCTTTCAAGCGCTGATTAAATTGGGATTGGTGCCCAATGGCGAAATCTGTGAGATTACCGATGCGATGCCGACTTTGACCTTTAACACCATCGGCCGCCACGTCTCCACCATTCCAATGACCAGAATCAGTTCGAATTTATCACCATGGCTGGCTAACACCGAGGTTGGTGATGTTTACCGGATGCCAATGTCGCATGGGGAAGGGCGATTTGTGGCGAGTGATGAGGTACTTGAAACATTGATCAAAAATGGCCAAATTGCAACCCAATATGTTGATTTCGAGGGGAATGCCACCCTGGATGGTCGATTTAATCCCAATGGTTCCGTTTATGGCGTTGAAGGGATCACCAGTTTGGACGGCCGAGTGCTGGGAAAAATGGGCCATTCCGAACGAATTGGAAAAAACTTATATAAAAACATTCCGGGCAATATGGATCAGCAGATTTTTAAAGCCGGGGTCAATTATTTTAAATAGATCGTTTTGGTTGAAACAAAATCAACTAACCGCATTTTAATAATTTATTGAGAATTTAGAAGAAGACAAGGAGATTAACATGAACACACCAAAAGTTGCCGTTATTATGGGCAGTGATTCGGATTTTGAAATTGTCAAAAAATGTTTGATTGCTTTAGAAAAATTCGATATTGCCTACGATGTGCAGGTTATTTCGGCCCATCGAAACCCTCAGAAAATTTTTGAATACGCGTCAACAGCAGAAGAACGGGGAATTGAAGTGATCATTGGAGCAGCCGGAAAAGCGGCTCATTTGCCAGGGGTTATTGCCGGAATCACACCACTTCCGGTAATTGGAATTCCGATTCAAACATCTTTTCAGGGCGGATTGGATTCCCTTTTGTCAATTGTCCAAATGCCATCGGGCGTACCGGTTGCAACGGTAGCGGTTAATGGTGCTGAAAACGCCGGTATTCTAGCGGCTCAGATGCTTTCGATCAAATACCCGGAAATTCGGGCGAAAATGAAAGCTTTTAAGATTCAATTAAATGATGAAGTTGTCGCTAAAAATGAAAAAGTTCAGGAAATATTGTAAATTACAACATCAATTAAAAAACAAAGGAGATTAAGATGGAAAAGTTAGAACAATTGTATGAAGGCAAAGCAAAGAAAGTTTTTAAAACGGATCAACCGGATGCGTTTATTATTGAATATAAAGATGATGCGACAGCGTTTAACGGTGAAAAAAAGGGAAGTATCGGGGGCAAAGGCGTTATCAATAATAAAATGACCGGTGTTATTTTTACGATGCTGGAAAAACATGGCATTCCAACCCATTTTGTTAAAATTCTTTCCGAAAACGAACAATTAGTTCAAGCAGTTACTATTTTTCCACTGGAAGTTATTATTCGAAATACCGCTGCCGGATCGATTTGTAAACGCCTGGGACTGGAAGAAGGTTTGAAATTAAAAGCACCAATTTTTGAATTTTGTTATAAAAATGATGATTTCGGTGATCCGATGATTAATGACTATCATGTAATTGCAATGGAATTGGCTACACCAGAAGAAATTGAAATAATCCGTGAAATGACATTTAAAATAAATGATATTTTAAAAGCCTATTTTCTGGAAAAAGGGATTAATCTGATTGATTTTAAAATTGAGTTTGGAAAAAACAATCGGGGTCAAATTGTTTTGGCGGATGAAATTTCACCGGATACTTGTCGTTTTTGGGACGTAAAAACCAACGAAAAACTCGACAAAGATCGCTTTAGACGTAATTTAGGCAACATCGAAGAAGCCTATGAGGAAATGTTAAAACGGGTTCAGGCATAATCCTTATCAGATGAATAAATAAGCAAATAAAGGTAATACGCGGATTAAAATTTAATGTACCTGAAGGGAAATACACACCAATGATGAATGATAAGTTTAAAGATGAATGTGGAATAATGGGAGTTTATCTCAAAAATAAAGAACTTAACAGTTCTTCCTATGTTTATTATGGACTGTATGCACTGCAACATCGCGGACAAGAAAGTGCTGGTATCTCAGTGAATAAGGATGGCAAAATCGTAACCCATAAGGAAACTGGTCTGGTTAGCGATGCTTTTAAAGGAAATGTATTAAAACAACTCAAAGGAAATATTGGTATCGGTCACGTCCGTTATTCTACTTCGGGAGAAGATGGCGTAACCAATGCTCAGCCATTAACGGTTAACCATAGTGTGGGTCAGATTGCATTGGCACATAATGGGAATCTCATTAATGACAGTGCCTTACGAAACATGTTGGAAGATTCCGGGGTTGTTTTTCAAACGACCATCGATACGGAGGTAATGGTCAATATTTTAGCTAGAGGGTTGCGTCATGGGATGATTGAAGCGATTCAACGTATGGTCGAAATTATTAAAGGCGCTTATGCGCTGGTAATTACTGTTGGTGATAAATTAGTGGGCGTTCGTGATCCATATGGGTTACGGCCATTATGTATTGGTAAAAAAGATGAAGATTATTTTCTGGCTTCAGAAAGTTGTGCCCTTGATGCCATTGGAGCTGAGTTGCTTCGGGATGTTGAACCCGGCGAGATTGTTGTCATTGACGAAAATGGCTTAACCAGTTACGGTCAAAACAACTGGGTTAAAAAGAAAGCCTGTATTTTTGAGTTGATCTATTTCGCTCGTCCGGATTCCGTGATGGATGAAACGTCAGTTTATGCAGCCCGCCATGAAGCGGGAAAAATTCTGGCCAAAGAAAGCCCCGTTGAGGCCGATGTTGTTATTGGTGTTCCCGATTCAGGAATTGCCGCTGCCATTGGTTATGCTGAAGCTTCGGGAATCCCCTATGGTGTAGGATTAATAAAAAATAAATATATTGGCCGGACGTTTATTCAACCGAACCAAAAATTGCGGGAAGAAGGCGTTCGGATTAAACTAAATCCTTTAAAAGAAACGATTAAAGATAAACGCGTTATTATCATTGACGATTCCATAGTTCGAGGAACAACATCCAAGCGATTGATTGCTATTTTAAAACAAGCTGGGGCAAAAGAAGTACATTTTCGAGTAACGAGCCCTCCGGTATCGCATACCTGTCATTTTGGGATTGATACGCCACGACGAAAATATCTAATTGGGGCCAAGAAGACGCAAGAAGAAATCCGCGAAATTTTAGGAGCCGATTCGCTGGCTTATATTTCGCTAGAGGGACTTAACCAATCAGTCGGTGGTAAAACAACTTTTTGTCGGGCCTGCTTTGATGGGGAATATCCGATGGAAGTGCCGATTTTAAATGCGAACGACTAAGTTCTCATTTTAAACGAAATCGATCGTAGTGGCGACAATTTTTGGTAATTGATTAAGGATAAAAAAAGAGATGGAGGAAATATGTCAGAAAATCAAATAAAAACAGATGCATATCGAGAGGCCGGAGTGGATGTCGAAGCCGGGTACCAGTCGGTTAAACTTATGAAAGCCGATGTCCAAAGAACCTTTAATGATCGTGTTTTATCGCATTTAGGGGGATTTGGCGGATTGTTTGAACTGCCGGAGGGTTATCGAAAACCAGTGTTAGTTTCCGGGACCGATGGTGTGGGGACTAAGTTGCGGCTGGCATTTATGATGGATCGTCATGATACCATTGGTTTAGATTGTGTGGCAATGTGTGTGAATGATATTTTATGTCAAGGGGCGCAACCGATGTTCTTTTTAGACTATGTTGCTTGTGGTAAAAATTATCCGGAAAAAATTGCGACGATTGTCAAAGGAATTGCGGAAGGTTGTCTGCAGGGCAATATGGCGTTGATTGGAGGAGAAACCGCAGAAATGCCGGATATGTATAGCTTAGACGAATATGACCTGGCTGGTTTTGCGGTCGGAATCGTTGAAAAAGACGAGATTGTCACAGGAGCTACTATTTCCGAAGGTGATGTACTGATCGGGTTGCCTTCTTCGGGGGTTCATAGCAACGGTTTTTCATTGGTACGAAAAGTTTTGTTTAAGGATTTGTCGTTGGATGTCAATACCTATGTGGACGACTTGGGGATGACCCTGGGTGAAGCATTGTTAACGCCGACACGCATTTATGTCAAAGCCTTATCGGATCTCATTAAACCGTGTCAAATTAAAGGAATGAGTCATATCACCGGCGGCGGTTTTTATGAAAACATTCCGCGGATGATTCCCGATGGCTTATGCGCCAAGGTGGATACCAGCGTGATCGAAACATTGCCCATCTTTAATTTCATTCAGAAGGCCGGAAAAATTGCCGCAGAAAGTATGTATGCTACTTTTAATATGGGAATCGGTTTGGTAGTTGCGGTTTCAGCTGAGAAGGCCGATGCGTTACTTGCCGGACTGACCGCAAAGGGTGAAAAACCAGTGGTATTAGGTAACATTGTCAAGGGAGAGGAAAAAATCGATTTATGTTTGTCAAACCGTTAAAAAAAATCGGCGTGTTGATCTCGGGCAGTGGTACCAATTTTCAGTCGCTGATTGATACCGTTCATCAAAAAGATGGCGAGATCGTTGTGGTTATTTCAAATAATTGTGATGCTTACGGGTTGGAACGCGGAAAGTGTGCCCAAATACCAGCAGTTGCAGTAAATCCACAAGAATATCCTTCCAATGAGGCTTTTGATCGTAAAATTATAGGACTGTTAAAAGAATATGGGGTCGAGTTGGTGGTTCTGGCTGGATACATGAAAATTATTACGTCGGACTTTGTTAAGGCTTACCCAAACGCCATTATTAATATTCATCCGGCTTTAATTCCGTCATTTTGCGGAGTCGGTTTTTATGGTATGCGAGTTCATCAGGCGGTGATTAACTACGGCGTGAAAGTTACTGGCGCAACGGTTCATTTTGTCAATGAAGTCGCTGATGGAGGACCTATTATCGCTCAAGAGATTGTTTTGGTTGATGATGAGGACACGCCGGAAACAATTCAGAAAAAAGTTTTGAAAGTAGAACACGAGCTTTTACCAAGGGCGGTGAGGGCTTTTTGTCTTGATCAATTAGATGTTGTTGGCCGAATTGTTAAAAAACGAAAAAATAATGACGAGGGAGTCTTGTTGCAGTAATCAATTGATTATATATATAAGGATGATTGATGTTATTGGTTGGTTGTAAAGACCTAATTCTAATTTATAGGCGTTTGCGAAATTAAAAAACATCAAACAACGGTTGCTTTGGGTGCAGTTTCCACAAACGATTTCGTAACGTGTAGGCGAACAGTTCATCGAACTGTCCGCTGTACAGTGTAGAAATTGTTTCGTGCGAAACTGGGCCCAAAGCCCAGGGCACTTTCGCAATTACCTAATTCTAATTTAAATTTGGAGGAATAAAATGAGAGCATTGATAAGTGTATCGGATAAACGTGGAATTGTTGAATTCGCATCAAAGCTGGCCGCAATGGGATGGGAAATTTTGTCTACTGGTGGAACCGCAAAAGCTTTACGAGAAGCTGGACTTAACATCACGGGAGTTTCCGAAGTAACCGGTTTTCCGGAATGTCTGGATGGTCGGGTGAAAACCCTTCATCCTAAAATCCATGGTGGAATTTTGGGAATCCGTAATAACCCCGATCACCAGAAACAAATGGCAGATTTAGATATCACACCGATTGACTTATTAGTAATTAACCTTTATCCTTTTAAGAATACGATTTTAAAAGAAGGCGTAGCTTTTGAAGACGCGATCGAAAACATTGACATTGGTGGTCCAACGATGTTACGTTCGGCAGCGAAAAACTTTAATGATGTAACCGTAATTGTTGATCCTCAGGACTATGCGGTGGTTTTATCGGAACTTCAAAAAAACGGTAAAACTTCATATGATACGCGCTATAACCTGGCTTTGAAAGTGTTTGAAACAACTTCAAATTATGATACCATGATTGCGGATTACTTAAAAAAACGAGTAGCCGCGGAAGTCTTAGAAGATACTTTTACGATGACGTTTGAAAAGGTTCAAGATCTGCGCTATGGCGAAAATCCCCATCAAAAAGCAGCTTTTTACGGCGAAATAATACCGGTAAAAGGGTCTTTGACGATGGCCAAACAACTACAGGGAAAAGAACTTTCTTATAACAATATCAACGATACGAATGGGGCGTTGGAAATTTTAAAAGAATATGGCGATGAACCGACCGTAGTGGCGGTTAAACATGCCAATCCTTGTGGGATTGCCAGTGATGAAAATATCGCTGCAGCTTATAAAAAAGCCTATGCCAGTGATCCCGTATCTATTTATGGCGGAATTATTGCAACGAATCGCTTGATTGATGAAGCAGCGGCCAACGAGATGGTCAAAACATTTTTGGAAGTAATTGTCGCTCCCGGATTTACGCCAGAAGCATTAAGCGTTTTGGCGGTGAAACCAAACTTACGGTTATTGGATCTGGCCGATATTACAGTGAACGAACCTGGTTATGAAGTTAAAAAAGTAATGGGTGGGTTGCTGGTTCAAGAACGTGATACCAAGTTGTACAATGATTTAAAAGTTGTAACGAAACGAGAACCCAGTGCGGCAGAAATGGAAGAATTGCTTTTTGCCTGGAAAGCGGTTAAAAATACCAAATCAAATGCGATTAGCTTAAGTAAAAATAAATGTTTAATGGCTAATGGCCCCGGACAAGTCAGCCGTATTTGGGCGCTGGAAAACGCCATTCGTCAGGCCGGAGAATCGGTAAAAGGGACAGTGATGGCTTCGGATGCTTTTTTCCCATTTGATGATTGCGTGAGAACGGCAGCCGCAGCGGGGATTACCGCGATTATTCAACCCGGCGGGGCAGGCCGCGATGACGAGTCAATCAAAGCTTGCGACGAGTTGGGTTTAGCGATGGTCTTTACCGGCATGCGTCATTTTAAGCATTAA
Protein sequences of DBSCAN-SWA_2 >NC_016894|1920565:1933851|1922788_1923487_-|WP_014356017.1|DBSCAN-SWA MKIYHLHHSGFLIQFEDKTIIFDCFTHIPSSLLRKGLPHYFFVSHGHSDHYSTDIFSTSRIYHPSYILSNDISNDSTHKTHAIGPYQHMSLGGMDIKTFGSTDQGVSFYIATNSHRIFHAGDLNWWDWDPVEKPNLDIAQEEKDYKNELEKMKNLPMEYAFIPVDPRLGDSFYKAGQYFIETFHPKVLIPMHFRDNFEIITKFKDKIGNTKTVIPVFKERNVKIKNTWSFNA >NC_016894|1920565:1933851|1932321_1933851_+|WP_014356024.1|DBSCAN-SWA MRALISVSDKRGIVEFASKLAAMGWEILSTGGTAKALREAGLNITGVSEVTGFPECLDGRVKTLHPKIHGGILGIRNNPDHQKQMADLDITPIDLLVINLYPFKNTILKEGVAFEDAIENIDIGGPTMLRSAAKNFNDVTVIVDPQDYAVVLSELQKNGKTSYDTRYNLALKVFETTSNYDTMIADYLKKRVAAEVLEDTFTMTFEKVQDLRYGENPHQKAAFYGEIIPVKGSLTMAKQLQGKELSYNNINDTNGALEILKEYGDEPTVVAVKHANPCGIASDENIAAAYKKAYASDPVSIYGGIIATNRLIDEAAANEMVKTFLEVIVAPGFTPEALSVLAVKPNLRLLDLADITVNEPGYEVKKVMGGLLVQERDTKLYNDLKVVTKREPSAAEMEELLFAWKAVKNTKSNAISLSKNKCLMANGPGQVSRIWALENAIRQAGESVKGTVMASDAFFPFDDCVRTAAAAGITAIIQPGGAGRDDESIKACDELGLAMVFTGMRHFKH >NC_016894|1920565:1933851|1928892_1930281_+|WP_014356021.1|DBSCAN-SWA MMNDKFKDECGIMGVYLKNKELNSSSYVYYGLYALQHRGQESAGISVNKDGKIVTHKETGLVSDAFKGNVLKQLKGNIGIGHVRYSTSGEDGVTNAQPLTVNHSVGQIALAHNGNLINDSALRNMLEDSGVVFQTTIDTEVMVNILARGLRHGMIEAIQRMVEIIKGAYALVITVGDKLVGVRDPYGLRPLCIGKKDEDYFLASESCALDAIGAELLRDVEPGEIVVIDENGLTSYGQNNWVKKKACIFELIYFARPDSVMDETSVYAARHEAGKILAKESPVEADVVIGVPDSGIAAAIGYAEASGIPYGVGLIKNKYIGRTFIQPNQKLREEGVRIKLNPLKETIKDKRVIIIDDSIVRGTTSKRLIAILKQAGAKEVHFRVTSPPVSHTCHFGIDTPRRKYLIGAKKTQEEIREILGADSLAYISLEGLNQSVGGKTTFCRACFDGEYPMEVPILNAND >NC_016894|1920565:1933851|1928104_1928812_+|WP_014356020.1|DBSCAN-SWA MEKLEQLYEGKAKKVFKTDQPDAFIIEYKDDATAFNGEKKGSIGGKGVINNKMTGVIFTMLEKHGIPTHFVKILSENEQLVQAVTIFPLEVIIRNTAAGSICKRLGLEEGLKLKAPIFEFCYKNDDFGDPMINDYHVIAMELATPEEIEIIREMTFKINDILKAYFLEKGINLIDFKIEFGKNNRGQIVLADEISPDTCRFWDVKTNEKLDKDRFRRNLGNIEEAYEEMLKRVQA >NC_016894|1920565:1933851|1920565_1922707_-|WP_014356016.1|DBSCAN-SWA MKGLSPINEKSDEHLNNIFLVSSDYLCITDVNGIILKVNPVWENNLGYSTSDLESKKLTDFFHPEDKANFNHIREQLGTQNEILDFNSRLRSKDETYRHAKWQFRFVDTLIYASGQELSAFYNSNKTAELDLFEKNRVTSILSNEILAPLESLTLFSKLLKKTQTIADQTTCLENIQLSSQLLEDLINAIIWTDSGVPITHDVISFNFYTIVENAIIPLIVRARRRNINIKLSIHAKTPQLVMGDPNRLKQIVAYLVLNSLERLEQGTVFIDITPEDTIKTVFKVYFSIRTIGILNKNEITDYSDFITNFNHDEFSQMNNPLSFGLELVKSLVNKMNGHLLLSQNNDDEFIVSFDLLLLLDQTAKNPEKTRPSSQSLSIYNQNTRLKAEELRAIEQIRKGLETNKKADTPQETPKQRLLIVDDATENTELLAQTLNKNYELLIANNGKDALALAQTSPRPDMILLDLSMPGMNGYDVSKEIHLEEATKDIPIIFLTTISDAENEVYELNTGAIDFISKPFDLKLVEEKIRNHLALQYFQDILNQTSDMDALTQISNRRRFDETLAIETRKAKRMKSALSIIMIDIDYFRPYNETYGFWEGDACLQEIAFSLKKPLRRAGDLIARWSGQQFVCLLPDTDSEGALHVAKNLKQTISNLKIPHQSSPIEKIITISLGVATGTDTIAHSYDRLLDDAQIALHNAKQSGRNQITRSNK >NC_016894|1920565:1933851|1930362_1931418_+|WP_014356022.1|DBSCAN-SWA MSENQIKTDAYREAGVDVEAGYQSVKLMKADVQRTFNDRVLSHLGGFGGLFELPEGYRKPVLVSGTDGVGTKLRLAFMMDRHDTIGLDCVAMCVNDILCQGAQPMFFLDYVACGKNYPEKIATIVKGIAEGCLQGNMALIGGETAEMPDMYSLDEYDLAGFAVGIVEKDEIVTGATISEGDVLIGLPSSGVHSNGFSLVRKVLFKDLSLDVNTYVDDLGMTLGEALLTPTRIYVKALSDLIKPCQIKGMSHITGGGFYENIPRMIPDGLCAKVDTSVIETLPIFNFIQKAGKIAAESMYATFNMGIGLVVAVSAEKADALLAGLTAKGEKPVVLGNIVKGEEKIDLCLSNR >NC_016894|1920565:1933851|1923769_1927495_+|WP_014356018.1|DBSCAN-SWA MIKRIFVEKKDKYQVEAKSLKQTFQRILKIQGLESMRILYRYDVEGVKEDLFKQIIGTILSEPNVDKVFEDSIQIEEGDKIFGISYLPGQYDQHGDSAVQCIQIVSGQRALVKVAKIVILTGALTQTEFDKIKHYMINPVDSQETSLEPFETLTDEIREPQNILPLVGFITLTSDQLEAFRQDNGFAMTTEDLQFVQNYFNNDEKRNPTITELKVIDTYWSDHCRHTTFLTQIQQVTFLGDDPISQEMKQAYDDYSQARTELYGKNTNRPISLMDLAVMGTKILKKQERILDLDESEEINACSINIVVDHDGVDENWLLMFKNETHNHPTEIEPFGGAATCLGGAIRDPLSGRSYVYQAMRVTGAWDPRSAIEDTLPGKLPQRKISTEAAHGYSSYGNQIGLATGQVTEIYDPGFLAKRMEVGAVIAATPKENVIRERPVPGDVVLLVGGRTGRDGCGGATGSSKAHTEESILESGAEVQKGNPVEERKIQRLFRNKKLANLIKRCNDFGAGGVSVAIGELADSLEIDLDQVPKKYEGLDGTELAISESQERMAVVVEAQDVETFIAMGNAENLEVTPVAVVTDSGRLVMKWREAEILNISRAFLETNGAPQFIDVVVEAPHKITEAKTAVFIDFKSKMLETLKDLNVASQRGMVEMFDSTIGAGTVAMPYGGKNALSPMDGMVAKIPMCEGDTTTCSMMTFGYNPVIAKQSPYLGGMMGVLESLSKLAAMGGDYKQARLSFQEYFERLGTEPVKWGRPFAALLGAYQVQTALGTPAIGGKDSMSGTFGELTVPPTLISFAVATAHVEAVITSEIKSTESLIQLFTLPLDDNGVPELTVVKAVYDILIKANQEGKILSAKTVGLGGLAEAVAKMSFGNGIGVTLNDHIELSFLFKPLYGGILIESFEILEGSTPIGKTNNKGEIIYAHEAININELVEAWETPLRSVYPEKVECQGDVKTLSYEQTPFIYSKAKILKPQVFIPVFPGTNCEYDSVKAFENAGAKAVTTIFRNQTVQDISQSIDEMVATIKASQMIMIPGGFSAGDQPNGSGKFIAAVFRNPKMMDAVMELLNKRDGLVLGICNGFQALIKLGLVPNGEICEITDAMPTLTFNTIGRHVSTIPMTRISSNLSPWLANTEVGDVYRMPMSHGEGRFVASDEVLETLIKNGQIATQYVDFEGNATLDGRFNPNGSVYGVEGITSLDGRVLGKMGHSERIGKNLYKNIPGNMDQQIFKAGVNYFK >NC_016894|1920565:1933851|1931399_1932056_+|WP_014356023.1|DBSCAN-SWA MFVKPLKKIGVLISGSGTNFQSLIDTVHQKDGEIVVVISNNCDAYGLERGKCAQIPAVAVNPQEYPSNEAFDRKIIGLLKEYGVELVVLAGYMKIITSDFVKAYPNAIINIHPALIPSFCGVGFYGMRVHQAVINYGVKVTGATVHFVNEVADGGPIIAQEIVLVDDEDTPETIQKKVLKVEHELLPRAVRAFCLDQLDVVGRIVKKRKNNDEGVLLQ >NC_016894|1920565:1933851|1927574_1928069_+|WP_014356019.1|DBSCAN-SWA MNTPKVAVIMGSDSDFEIVKKCLIALEKFDIAYDVQVISAHRNPQKIFEYASTAEERGIEVIIGAAGKAAHLPGVIAGITPLPVIGIPIQTSFQGGLDSLLSIVQMPSGVPVATVAVNGAENAGILAAQMLSIKYPEIRAKMKAFKIQLNDEVVAKNEKVQEIL |
9 | Synechococcus_phage(25.0%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
3570878 : 3589662
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NC_016894|3570878:3589662|DBSCAN-SWA GTTACTCATTTTTTCCACCTTCACTTTCTGTTTCTGTCTTATCCCCGATTTGCTTCAATGCTTTTTTCAATATGTCAGGAATAGGAACCCCTAAATTTCCGGCGTTTTCTAATAAACTTAATCCTTCATTTGCAATAAAAAGCAAGCACACAATATTTTTAAAATACGCCCCTCCTTGACCGGTTGCCATATCGATCTGAACCGCTGTCATGACAACGAACAACTCAGCAATCTTCTTAAACAGGCCTTTGAGCCCGATCGCAGATGAAAGTGTTTTTGTTACGTAAGCAACCATCAGACCGGTAATATAATCAATCGCCATTAAAGTCACTAATACGCACATCAAAACGTCCCATCCTCCAAATAACCATGTTAGAAAGCCAACTACTGCCGTGAAAATCCCCGATAAAATCGGGCTGTCAACTAAATATCTCATTACTTCATCCTTTCTTTTTCTCTTGTTCAATTGTCACCAAGACCCCTACCGCCGCCCAATCTATAGTCACAAACCGTCCCTGAGCAATAAAAAAACAGCCTAAGCTGCTGCGTTGAGTAAATCAACCAGTTCCGTGTATTCTTCCTGGGTTATTCGGTTATTCAACAGGAACACGTCAAGTTTTACCATCATCGCTTCTTTTGTTCCGTATCGCCCATTATTAATTACTGTTTTACAGTATGTGCAAGTCATTTCTCTCACCTCCTTTCTATAATCCTAGTTCGATATTGGATAATCTAAAATCTAAATCAACCATATATTCTGCTGTTGAGTCCTCAATGATTTCAATTTTTTTCTCAATCGGAATATATGGCTTATATCCTCCATCTTTTACAAAACCATCTGATGGGGTGTATTTATAATATCCTGGTTTTACATACTCTGGTACAACCCCAACGTCATGCAACAAAAAACTCCCATTATTTGGAATAATGCACTCTGACCCGCCAACTTCTTTTACCAATGTCCCATTTGATACTTCAATTGCTTCTGAGCATATCGATACAATTGCGTTTGTCTCTGAACTTGTTACTATAATCATTATTTATAACCCTCCTGTCAATTTTATTACTTTTATGTTTTGCAATGAAGAACCACCGCTTTTTGCTACCGCATTACATTTTTCAATCATGCTACTTGTTCGTCCATACTCTTCAATTTTAGCAACTTTTGAATATAGGTAATAATAGTTACTATCCATAAGAAACAAATCTGCAATTTTAGTCGTTCTTCTTAGAAGTTTACTCATTCCGACGGTGGCAATATTTAATAAATATGTGCTAAACTCTTGTTGAAAAAAACCATACGCTATGTTAATCAAAGCCATCGATGGATAATTATTGGATTGTTTTGCATAGGTCATTAGTATTTTTGTATCAGACAGCGCTACGCATGAAAGACGACTTGCATAAGCGTCAGTAGCAAATGAATCGGTCGAAATATAAGTAGCAGTCGAAGCGCCATCATTAATCGTTATTTTAAAAACCGACATTTTCCCAGTTTCTACTGTAAAAAAAGCATATACCAAACTGTCTGACATAAACACTGGCGACCATTGTGATGAGGTAGCAGATACTAATAACGTAACGGTTGTGCTGGTTAACGTAGCTCCTATCAATGTTAAAAAACAATATGCCACATAACCTGCTCTATTACCCAATAACAATATTTTACCGGATTGCATTTTTCTTAAACGTATATTTGTCATGGGATAACTTGAGTCAATATTTACCGTACCACCTCGGGCTAAAACGTTATTTCCTGATATAGTCAAAACTACTCCGAAAAATGCTGAACCAGAATAAAAAAATACAATAACGTGGGTTGAATCATAAACAGAAATTCCTTGAATATAGTCTGAAGAACTTGCTGTAAATGAATAATGAGAACCTACTGTTATTGCTGTTCCGTTAAAACTCATTAACACAACATATTTTTGTTGCGAAGTTAACGAGTAACAAAAGACCACCTGTGTATCTGAAACTTTTTCTAAAAAAATTGTTTGATCTGCAACATTTGAACTTGCTTTAATTGGTGTTGGTGTTATATTGGAAAGCGTACCATCGCTATTTATTTGAACTACAATCGCATAATGATAAAAATCAGTGCGATTAGTGTAAACAACAAAAATCTTGTTATCTGTTAATTTAACTGCTTCAATAGCCTGTATTGTTATGCCAGTTCCCAAAGGATTAGAAGACGACGTCGCAACAGCGCTTCTAACAAATTCCACAAAATCACCTTTGGCAATAGTTTGCTCGGACATAATAATGCAATCAGCTTCAACCCCATTTATTTTCAATCCTCCACTCTGCCCGTTTAATCTCGCTCTACCCATACTAACCCCCTATCAATTCTACATTAATTGCCGTTGTCGGTATTTCTTCTAAACAGGTGACTGTCATCGTATCCGTCGTACAATCAATGTAAGATATCGTGTTCCATGCTTCTTTTTCCAGTAAAGCAGTTGCTACTGTTGCTGAATAAATCGGGTTGACGTCGGGTCTCGAATCAGTCAGCCCAGAAACTGTAACGGAGACCGAATAAGGTGCGGTACTACTCCATCCTGTTGTAGGTATGATTGACGTTAATAGCCTTTCCTGAAGATCAAGTCGTGTGTCAAGCGACGCAATATCAGCCGTATGATTGCTGATCGATGTTTCAGCTATTGTCATCCGATCAATCAAATCATTTATTTTATTTAATAAATTCGCGGCTGTGTTCTCATCTAATGTATCCTGTAAATCTGCAAACCAGGTATTGAAACTACTTTGAAATGCTGATAACATTACCGCAATATCTGTTGTTGCATCGTCAACCGTTTCCAAATACCACGCCTGATACTGATTAAATAACGTCGTCGTATCAACCTGATCAAACAAACCATGCACAATCCCACAATATGCCGTATTTAACCTCAAATCTGTTATATTAGCTTGTGAGATACTCACCGCACCATTTACAATGTAAATATCCGCCAACCCTAACTCATAGGCATCCGCATCCCGCTGCAATGCCGGAGCTGCTGGTGAACTGGCAAATGATCCTTTTATTACTTTACTGTAGGTGTCACGCTCTAAAGTTATATCACTTACAACAATGCGGTCAATTCTTTTTAAAACGCCATCTGCTATATCAAGCGTAATGACCTTATCCGCCGTATTTTCATAAAACACGCCATTGACCCACGCTTTTCCGGCCTTAACCGTCACCGTCATGTCGCCATTAGCAATTACCTGCAAATTAGTACTCGGATTCGGATAGACACCATTGCCGATAAAGCTCCCTAAAAATCGTGACCAAAAATCAGCCTTGTATCGCCGGTCCCCATTCGCTGAATTATGAAACCCACTAATTTCTCCCATCAAACCACCCCTTTCATAATAGTTTTATTTTCTGTGCAATTGTCCGGGGCATCTCTTTCCCGAAGACAATATTTACTTCCATACCTTTTTCTTCATACACTTCTTCAATTTCATTGATCCGGCTATCAATAGCAATCCCCCATTTTCTTGACAAACACGTCACAATATCACCAAGATCAAAATCCATTTTGTATCGTAAATTCGAATTCAGGTTTATGCCATTCTCAAAGGTCTGCACCTTTTTGGTATCGGTGAGCGTTTCATTTCCTTTACTGGCTAATAAAGCGTTGTACTCAGCCTCTGTCATAGCCACATTATTAACCATATTCGATAGGCCCTTCTGATCATTGAACACTTCAAAGCGATCCATACCGGTACCACTGCCAACAGTCACAAGACGCCGATCAGCGTCTTCACCGATTCCTCCAACTAATACGACATTCTTGAAATCCATGATGCTGTCGGTATATTCCTGATCCAGAATATTGTCAAATTCTTTGCTGAAAATGCACTGAGGATTAACCGTCTGGCTTGATGTCCGATCCAACCCTTGAAAGATTTCAAACTTTAATTTCTTTAATGACTTGTCAAATCGGACTCTATTTCCAAGTTCTGCTTCCATACATAATGCCTCAATTGTTTTAAGTAAGTTCTGGTAGGAAACCTGAAAATTGACATTACCAGCAAAATTGCCAAGATCACCAAGTATCAGCGTTTCAATAATGCGGTCTGAATCCGTAGGATTGATACAGTTTTTATCAACCAACGCCCGCATCGCCAGCTCATAAGTGGTATTGAGAATTTCAGTTCCCCAAATGATGCGCCGATTCAGATAACCTTCTCCCAATTTCCCTTTGACAATCAGGTTTTCTTTTCCTTCTTCATCCTTTTTGATATTTCGGTATTCGATGTAACCAACTTCATCGCTGTCATTCTTTCTGATGACATTGTCCTGGGCCAACAATAGGATATTTTCGACCGTAAATGGACAATGTAATTCAAATTCGCCACACTCAGAATAACGCCTTACCCAACGAAGGGAACCATAAGTATCCATAACATTCTGCAAAGCCAGCGCTTTATTGTAAATATACAGCTCCATCCTACACCCCCAGATAATTGTTGTAATGGTAGATGGTCACTTCCAGATTATCCAGTCCGGAATCGGCATCATAACGAAACAAGTTATCGCCTTTATCCAGCTGCAGGAAGGTTGAATCCTCATCGATGCTATAAAACGCATTGGTTTCCACGCCATTCAGCTTGCTAATAATCCGCTTATCCCCAAAATAGGTAGATATCGAAATCACTTCCCCGGCTGCCATGGTTTTCTTGATCTTAATAAATTCCCTGGTGTTGACATTAAAAAGCGACGGGTTAGTGAGCGTAGCCAATGCCTTAAATTCAATGCGGATACCCGTTTCGACATCGCCATCATTCAAACAGTTCACAATCAGACTCGGTTCCCGGTGCCCGATCTCAATGCCGGTGTCCTCCGGGATCTCCAAATCAAATTCAAAGTCTCCTACCCACAAGGCAATTTCATCCCGGCTTTCCTGTAGATCCTTCCAGAATGGCTCATAGGCCGTTAGGTTAATCAGACCGGTACCGGACTTAATCGCATCTTTTAAGAATGGTATCTTTTCCGGAATGCATTTTATTTTTCGCTCTTTAAGATAATCGTTATAGACCAGGTAGCCCTGACCAAGCTTCGGGTTAAAAACCCGGTAGAGCTTTTCTTTGTACTGATTATATAAGCCAGATGTACTTGCGATAATCACAACCGTAAGATTTACGTCTTTGGGATCTAGGGTGTTACCAAGATAGGTTTCCCCGTCCTGGCCAACACCTTTGAAATTATAATTATTGACACCCTGACTTTCTTCAAATTTCTGCAAAATAAAAGGGGCTGAATTACCAAAAAGCAACTCTTCCCCTAAGGAATTGATGTATTTTATTTTCCGCATTCCAGCCTCCTAAGTCATTAATAATTCTTGCACTGACCGCTTTAGTAATTTGGCCGTTTTGGCTGGTGATAAAGCCGTTGGGCTGTTAATGGTGACCTCCATGGTCACATTACCTCTGGCAAGTAGCTCGCTTGTTTCAGCATCGTAAACCCTTTCGCCACCTTTAAAATTAACCAACTCTCGACCATTTTCTCCCACCCAGTGAAGGCCAGCCGTTGCATAATTGGTTCCTGAAGCGTAACCAAAAATACTGGCCGGATCTACCTGCTCACCATCTTTAATAACGGAGAAATGCAAATGGGGGCCAGTGCTATTTCCGGTATTTCCGGAAAGACCAATCGTCTGCAGCTGGGCGACTAAGTCACCAACATTTACAAGCACCTCGGAGAGATGCCCATAAAGTGTTTCAAGACCATTACCGTGGTCTATGGTTATTGAATTTCCATAACCTCCATTCCAACCGGCTTGAATTACTGTCCCAGCTCCGGCGGAGCCAACAGGTGTTCCTTCTGGCACGCCGATATCAATCCCTTCATGATATTTTGAACCGACATCTCCAACATCATCACGATTGCCGAACCATGAAGTGATACTTCCGTTCACTGGAGCTACCAAGCTACCAAAATCAGAACCACCAATACCAATGCTCTTGAAGAATTCTGCAGCACCGCTACCAACGAAGTCAATAGCAGCTTTTAAATTGAAATTTCCATTGGCAAATGCTGCTTTAATCTCTTCGACCATGCTGTTGACAAATGCTATAAGGTTATCCCCATTCAAACCATTTATCAATCCCTGAATCATGTATTTACCAATTTCAAACAGTTTTTTCGCTGGGGATGCAATCCCGAATCCTTCTCTGAATTTTGTTAAAACCGTCTGAACTAATCCACCAACGGCATCAGTTAGATTGGTAACGCTCGTATTATCATTGATTCCTTTTACCAATTCAGACAGCATATCTTTCGCAAGACTAAATAATTTGCCAGGTAATGCCCCAACAAGGCTTAATATTTTAGGTACTATGCCATTAGGTTCTTTACCCCAAGCATCACTAGCGGCTTCTTTGATCGAATCCCATTTTTTAGGAAGTTCCGTAACAATTTCATGAATTTTTGTAGTTACGTTTGTGAAAATTTCACCAGCTTTTGTCCCCAAATCATCGCGAATATTCGCCCACTTCGTTTGAGAATCATCTTTGCTGGTTTGCCATTTGGATGCCACATCATCAGCGGTTTCTTTTATTTTACTGGTAACCTTTGAATAAATTTCACCAACCTTACTGGCCAGATCATCCCGGATGTTCGCCCATTTCGTCTGAGTATCACTTTTTGTTTCTTCCCATTTAGCAGCAACACCCTTTGCCATTTCGGTAATCTTCCCAATCGTGTTGTCATAGATCGTTTTCCAAGCATTCTCAAGGAAGGTTACAACCCCATTCCAGGTATCGGTTGTATGCTGTACAATGCCATCCCAAATACCTTTTATAAAATCCAAGATACTTTGAAATATCAGGCTCACCCAATTGTAAAGCCCTTGAAAAACATTAGCTAGAAAATCAACCGCATTCTGTCCCATAGCCTTGGCAAATTCCCAGGCTGCTGCCCAATCTCCATTTAGCAGGGCAAAGACCAAACCAACAAAATTACTGATGAAACTGAGCAGATTACCGATAGCTTCAATAAATGGCGCAATTGCTACAATAATGTTCGCAAAGCCGTCGATAAAACCATTAATAAAATCTTTAACGATTGGTATTATCTGATTCCCTATGAAATCACCGATCTGTCCAAGCACCGGGCCGATCCCATCAATAAAACCCTGGAACGCCTCTTTAGCCGGAGCTAACGCCTCGGCAATGCGACTAAACGCTTCAAATGCATGGACGCTTACGGAGTTAAAGGCCATTTCTGCCGATTTTCTAAACGTCTCTGAATTCTGCCAGGCGCCGACCAGTATCGCAATAAAACCAGCAATAGCCGCTACAACAATAGCCACCGGACCCGTTAACGCCGCCAAAGAAGAACCCATTCCCACAGCACCCTCGGCACCAGTGGCAAGGGATGCTGATGCTGTTCCCAAGGCTCCGTTAAGTATACCCCCGGTGGCAAATAGTCCGGCAACGTTGGACACAGCCCCAGCTAAACCGCCTAAAATTAATAAAACCGGGCCAATAGCTGCTGCTACCATCCCGATTTTTACAATAAACTCCTGTTGTCCCTCATCTAAGCTGTCAAACCAATCCGCCACACCTTGTATTTTTTCCGCTGCTGTCTCCATCATCGGAGCCAGCACATTCATAATGGTTTCGCCAAGCCCAGCCAAGGATTCCTGAATGTTTTGCATCGACATTTCAAATTTTGCGCCACCATCCAGTAATTCATCATAAGTTCCGTCTAAGGTTCCATCAGAATTTTCAACGACTGCTAAAAACTCCTCATAAGAGAACCGACCGCCTTTGATTGCATCGGCTAAATCAGGTCCCGCCTTTTGACCAAATGTCTCAATAGCCATCGTCGTTGCGCTGGCAATATCCGGCGTTTCTTCAATGGCTTTTAGAGTCTTTTTAAATTCTTCCCGGGGATCTTTACCCGCTGCTGCCCAGTTAGAAATGGCTTTTTTCATCCCACTAAATGCAATTTCAGTGTTAACCCCGGCTTTTTCCCATCCGGCAAAGATAGCGATGCTTTCCTGGGTATCAAATCCAAGGGCTCGCATTGGCGCACCATATTTGGTCAGATTCTCAGTCAGTGATTCAACCGAAATTCCAGATGCTTGACTGGCAGCTGATAATTGATCAAGGATTGTTTTATAATCGGCTGTATCAATCCCTGCGTCGCTCATTGCCCGGGAAACAAGCTGGACTCCTTGGGTGGCATCCACTCCGGTAATCTCAGCAAATTTTAGAAAGTCTTTACTCATACTTTCCAGGCCATCGCCAGTGGTTCCAAAGCGGGTATTAACCTCCCCAATCGCTCCACCGACATCGTCAAAACTACCGATGACTGACCCCGAAACATTTTTGAATACTTTTTCTAAATCGCCGGCAGCATCGCCGGTGGCTCCGGTAGCCTTAATCATAACGTCCATGCCATCATCAACCGCATTAAAGGCCACCACACTGGCAGCCCCTAAAGCAACAATCGGAGCGGTCACATATTTTGAAAACCCTTCTCCCGCTGAATTTAATCCATTCCGGATACTGTCAGCCTTATCAGCCACGGCACCGAACTTTTTACCTAAGATCTCGGCATTATTTCCGGCCAGATCCATTTCATTATTGGCTTCGCTCGTATCAACAAAAATCGAACCAAACAGTTTAAAGATCTCAAACGCCATTAGCTACACCCCCTTTCAGGGTAAGGTTGATGATCTTTTCAACTTTTTCATTAATTTCGCTGATCGTCTCTGCTTTCGTTTTTGGTGCCGCTCTCGGCTGGGCGCTTTCGATTTTGGCAAGTTCTTTATAAGCTTCAAAGGTGATAAAGTTCTCTACCCCCATATGCCGGTAATCAACTAAATAACGGTCCCACAATTTCGCATCCTCTTCTTTTTCAAAGGCTTTGCGAATAAATGCGAGACCGCTATCAATATCCATATTTAAAATATAGTCGATGTTGTTATATCGTCTTAGGAGCAACTCCTCGATGTCAGTAACATCTACTGAGTTGCTGACTTGAAAAAAGATGCCCACTTCTGAGCATCGGCCACATCTTTCAGTTTTTCAATAGTATCCATCAAATCATTCTCGGCCACTTCTTCCGGTTTGCATTGGAAAGGCCGGGCAATAAAAGCATAGATTTCATCTTCGGCTTTCTTGTTTGCAAAGATTTCCATCACCGAAAAAGCAAGATCAATTCCCACCTCTGCCTGGGATGGTTTTTCCTGAACGACTTCTGTCTTTTCCCCTTCTTCATTTTCCACCAACGCCAGTTTAGGCTGTTTTTCTTTTTTGGGGATATTCTTAGCAATCTTCTTAAGCTCATCTTTAACCCCGGTTCTTTTGACCATCCGCATAAATTCAAATAAGTCCGCCGTATTTAGTTTTCGTACATTTTCAATCATTTAATTATTCTCCAATTCTGTAAGTTTCGGTCATGGTCGCACTGTCGGCCATTCCGGATTTCATTGCTTTTGCTTTTAAGATCGTATCGGTTGCCACCGTAATTTCAGTGGAGTAAGCCGTATCATCTGCCGTTGGCTCAAAACCGTTGGTTGTGTAATAAATCGTTGCGCCCACTGTTGCACATGTTAAGCTGACAGTTTGGCTGGTTGCATAGGTTCCACCCTTCACGCTGGCAACCGGAGTAGCAACATTAGATCCTTTTGGATAATAGATCCGATAAGGCGGGGCATCCAGAGTGCCTTCACCGGTATCTTCATAATGTCCATAGACGGTAACGGGGATGACCCCTTCTTTTTTATCCTCAACCTTGATATTTAACCCATCGGTTGACAGTGCGTTGAAGACCTGAATAATAATGGGCTCCTCACTGCCGGTAATGGTTCCAATATAGGTGATGTTATCCACATAATCCCCATCCTCAAAGGCATTTCGTCCGGTGATAATGTCATAGGTGCCATTGGTGGTCGTATCAACATCAGCAGCACCAAGAGCCATGGCTAAAATTGCCGGGGTAGTTTCAATAAAGTTCATGGTCATGGATACATCAATATAATCAATGATCTCAGTCCCTTTGCCTTTTCCGGGCAGTCCATCAATCTCAATGTTTCGAATCTCAGCAGCCGCCTTAAACTCACCACCGCCCTGAGTAGCTCCAATGAGTTTTCCACCAAGTCGGGCAGATTCATAGGTGTCCGTACCGACAATAAAATTTTTAAAAAACGCACCGGCACCAGTATGGAGATTCTCCATGGTTTTCGGATTGTAACCTGTTCGTACTTTTCCCATTTTTATTCTTCCTTTCCGTAATAGCGGACCAAGAAAGATTCATTAATCCGCTTAATAATTGTTTCATCCAACCGTTGCCGGTCATCATTTTTATAGATTGTAATGCTGTGATTTTCATTTGTTAAGCGTATATTTATTCAAATAATCGCCCACATTATCCGCTAATGTTTCCAGTTCGATGGAGTCCGGTTTGTCCGCCCAGTAGTCCAGTTCCAGTTTTTTACTGGCCCCGATATCGCTTATCTGAAAGGTGATATAAGGGTAAGGAGTAGTTTTGGTCGCCTTCATATAAAAAACGCCCATATGGACGTTTCGAATGATTTTTTTGATTTCTTCAATTAACAGCACCGTTTTACTCGCCATCTGAGCCACCTTCATATTCCTCTTCATTGATTTTAGCCAATGCAGCCGCTTCGGATTCCAATGAGCTTAAATATTGAGATTCAATCTCAACGATTTTGGCAATATTGTCCTGGGTAACTTTGGTCAGTAAACCAAGCGCCGGAGTCTTTGATGATCCCTTTTCCTGGAAGCCACCATAAAAGGCGTTAGGTTTCAAACCCACCTGCAGATCACAATCTTTTTTTCGCACCCAATACTGGGTAAACTTGCCAACCTTGCCCCGGCGTTTTTTAAAATGTCCATAATAAGCCAGACGAAATTCTTTTGTCAGATACTTACCAACATCCCGGAGGGCTGCCCGGGTTAATTCAGACAGGGTATATTTAACCCGATCCACATTTGATGTATATTGAATCGTGGTTTTCCCCTTCTTAACCAATACTTTCGTCACTGATGGAGGCATCCCCATGTTTAATCCCCCTTTCAAGAACTACTTCGATATCCTCACTGTCAACCGCATAGGTCCGGATCATGGTATAAACCTCATCCTCAAACTTAATATAGCGCTGGCCTGCATAATCAGCCTGTTTTAAAGTCAGGGTGATGGATGGCTTATAATCAGTGGTCGCTGCCTGATAAAACTCCGACATCCGGATTGATTTCTGATCACAGAAAACATAATCTTCAAAGGTAACAGCCTCATACTTTTCACCGATGGCGTTTTCTGCTTCAGCTTCGATCCCCAAATAACAGATACTTATCCACATTTACACACCCTCTTCCGGTAAAACAATCACTTCGATAGGTTCCACATTATAGTCACCACACAAAGCCAGATGCCGTTTAATGGCTTCGTAGCTTTCCATATATTTTTCACCGTCTTTGTTATCAAGGCCGAAATTGGCTTTTACGTAGGTCTTAACCGCCTGCTTAATCAACGGGTCGGTATCGTCGATGATTTTCACCCCGGATATGGAAAGATCCAGCTTACAGGCTTCAATTAGATCGGTTATTTCTTCATCGAAAACAATATTTTTAATCCGTAAGGCATTTCTGATTGATTCAATCATTTAATTCACCCATTAAAAGGGGGCATTGCCCCCTAACCCTTCTATACCTTTTTGATAAGCGCAAATGCCTTATTTGTCACCACATCACCATCAATAATTGAATAGCTCATGTAGGTGGTTGTTCTGGCCTTAATATGATCTTCCTGATATAAGGTAATATCCTGATTAACGTTCATGGCATAACCTCGGCCATAATTACCAATGAGAATATTTCCTTCGGCCGCCGCTTCTTCTTTTACCGGCAAGCCAAACATACGACCAACACCGGCACCAGTAGGATCGGGAACAAAATAAGGATTTCCCATTTCATTTAAAACATTGGCCAGCTCATTCCAGATTGTGGCATTATCGGCGTAAATGGCTGCCCCACTTCCCAGATACCCACTTTTAATTTTTGCCAAAGCCGATGTAATCTTTTTATAGGTCAGGGGATCAGCCGTCGCAAAGGTAATAACCTGTGGCGTTCCTGCTTCTGCATTCAAAGCTGTTACCACACCTTTAGGCTGAGCTTTAAAGGTATCGCTTTCGCCTGGTTTTCCTTTTCCGGTAAAAACAGATTTAGCAATGGCATTCCCCATTTTTTCAGCAATTTTTCTGGCAATATAATTTAAGAAATCACCCATGGCCATTTTCTTAATCTTCCATGATACATCAACGGCTTTCGGAAGTTCGCAACCCGTTAACTCAACCGTTCCAAAACCAACATCATCTCCCTCTGCCGAGGTTGCTTCATCAATCCATTCAGCATCGGTAATGCTATCATCGTCTTTAATCAGCGTAAGATCGCCGGGGACAAAGGTTTTAAAAATATCCTGCAATACAGGGTGAGCATCGGCAATTTCCTGCCAGATTTTAGCGGTTACGGTTTCGGGAATCACCACCTGATGATCGGTGGCAGTTTGAACGGCATTTCGATAATCGGTATTGATCCGGTCGAATACCGCTTTTTCCTCCTGTGTTGAAGGTTTGTTTACCAGAAAATTATAAAAGGCTCGTTCATGCAACTCTGTTTCGGTCGTTGTTTCACCAAAACTTGCAAGTACTTGTCCAAATTCAATCCCTTGATTAACAACTGACTGTGTTTCGATATTTACCACCGGCGCCCCTCGCAAGGCTGCAGCATTCGCCTGGGCCGTTCGCTCGGCTTCAAACTGGTTATCCAGAGCCGTAACCTCGGCCATTTTCGCATTGGCATTTTCCACATCGCCACTATTAATCAATCCATCGACCTCTGCCAACAATTCGTTTCTCATTTTCAAATACTGTTCTTTAGTCATTTTTTACATCACCTTTCAGTTTTAAATAATTTAAATAAGCCTTTGCTGATTCAAGATTCTGATCAACAAGGGCTTTTAGTTTGTTTTCTTGATTTTCATTTTTCTCCGGAGCGTTTCCCCGGGATTCCCGCATTTTGGCAATCACACTAGGGCTTAACCGGGGGATCGCTGCGTACATGGCTTTGGCGTTTTCTTTCAAAACACTATTAAATAATTGATTCTGATAGAATCCCTCTTCATCATCAACATTAAACAGCACCTTATCCACAAGCCCCAGCGCCCGGGCATCATGGGCAGTCATCCATGTGGTCTCATCCATCAGCTTTAACGCTGCCTCCATGCTCATGCCAGATTTAACACAATAGGCATTGGCAATGGAACGATTGGCTTTCTTTAAGCTGTCCGATGCGGAATCCATATCCCGGTAATCCCCACTCTGACGCGTCCACACATTATGGACCATCATCTGGGCGGTCGGACTCATTTCACAATAACCGGCCATCGCAATCACGCTGGCAGCACTGGCCGCCAAACCCGTCACCTTGATTTTCACGTTGTTGTAATCCTTAAGGGCCGTATAAATTTCCGATGCAACAAAAATATCACCACCGGGACTATTCACCGAAACTTCCAGTACATCACCATTAGCCGACCGAATCTTATTACGGATATCTGCTGCCGTAGTGCAGGGCTGTTCAAAGTAATCATAGATCCACTTATCACCATCCGGGACAATCGTCCCTCTTACTTCAATTTCAACAGGCATTCTTATTCACCTCCGTTCTCAACTTTTGTGTATTCTTTCACCGGCTGTGTGTCAAGTCGCCGGATGGCTTCATCCCCACCGGTTAATGGGGTCAAGTTTCCTAAAATTTTACGCCACTCGTTAGGTGTCATTGATCCCCGATCAACCGCTTGGTACAATGCCAGTTTAGTGCTCATGCTGGCATACTGCAGATTGGAGGATTCAAACATAATCGAATTACCAAAACCCCGCTGTTTCCGGCTAAATAATTTTCTGGTGTATTCTCCGGATGCCTGCAAAGCCCATGGCTCAATCTCAGCTTCATAATAAGCATTCCATTCATCCTCGTTATACCGGCTCTGAATGATCTTCTCATTGGTACCAAAAAAAGAAAAATACGCTGCGTGGTTTTATCCATCTGTAGCGCATTGGGAACATAATCATGGGGGGTGACCTGAATAGCATCCATCTTGGCATCGGTTGATGCCGCTCCCCCAGAGTTTTCGATACTTAAAAAGGTATTTGTAAATTGATCAGTCTCTTTCTTGAGATCCTCCGGTCTCAGGGTCGTATTAAATTTAAGCAACCATTTTACGATCGCACTATTTTTAATCGCCTTGATGATCCCCTGATCAGTGGTATTAACAATTTCCATCAATGGAGCCAACGCCTGCTGGGGGCTTTCCCCAAAAATATCATTGGTGTTAAAATCCTGTCTCAGGTGAATCACATCCACATAGGGGAAGGTGACCAGTTTGCCATTAAGCAAAAAGCAGCGCAAAAACAAATCCCCGGCTTTATTATAAACCGCTTCCACGGTTGTTGCCGGAATTGGATAAATCGCCACCGGCATTTCACTGGCATCCCTGACAATATAAGCAAAAGCATTATTATTAAGCTGCAATTGCGTGGCCAGCTTTTCCTGCAGCATCTGCCCGGTCATGTAAGGATTTGGTTCCTCCAGTAAAAAACGCATGTAAACCTCCGGATTCACCTGAAAATCCTTTCCGGTTTGCCGGACATGTTTAGCGGTCAGCTTACCAATGGCTTTTACCTTTGGCCGGATGCACGACCTCACCAGGTCAGAATGATAAAGATTCCCATTCCATGCAAAGAACCCATTCCCCTGTTCGGTAATCATTTCCATTCTGGAAACAGTTGGACTCTTATTAAAAAATTGTTTTACTTTTTCAAACAAGGCACACCTCCTAAATCATATTTAAATATTCGGCCATTTTATCCCGAAGGATGACCTTAACAATAATCATGGCCACAGCCCCATCAATTTTCTGTGTTTGCGACACACCCTTAACTGGTTGAATATTCCCATTGATATCCACCTTCACTTCCAGATTCTTAAGACACCACTTATCAATCGGATGGTCATTATAAACTGACTGCTTGGCGATCAGCTCAGCCTTAAGCTCCTTCATCGGCATGGATAAGGTATAAGACCCCTGCCGAACTGAGATCATTGCATTTTTACCAAAGTGATTTTGAAAAGCCATCAATAAACTGGCATCCACATGCCAGGGATCGTAACCAATCCAGGGAATATAAATGTCATACACATCTTGGACTTCAATAAACCATTCTAAAATCGCATAGGGGTTAATCCGGTTCCCCGGGCAAACTCTCAGCAATCCCTGCTTTTCCCATAACAGGTATGGCACCTGATCCAATAATTCTTTATTATTCAAATTTTCTTCCGGCAGCCAGTACATCGACAGATAATAGTCTTTATCATCATCCCTTCTTTTGCAGACAACTTTTGCTGCTGCAAGGTCTGTTGTTTCAGCTAAATCAAAACTACCAATGCCATACCGAAAGCCCATTTCTTTCGCTTCGAATTTTTCCGGGTTATACAGTTCTTCCCAGCGGAGCCATGCGGTAGCAGCGTTTTCTGTCGCGCAAAAATCTTTAACCATGACTGTGGCTTTAAACGCCGGATCTTCTTTAGCCTTATTCACAAAACCCCGAAGAACTTCGATTTTCTTGATAACACCAAGCCCCGGGTTTGCTTTAATCCAGCATTCTTCTTTATCCCATTCGTCCCGGTCATCCAGCTCATAGATAAATGGCAAAAATGTATCATCAACTACCTTGCCATCCAGCACCTTACAGGCATACTCATACTGACTGTCAAAAATGCACTCACGCACAAAACCATTGGTCGAGATACAGGTTAAAAGCGGCTGATCCCGGGAAGACGTTGATTGGATCATCAGATCATAGAGATCACGGTTCTTAATGGCTGCCAACTCATCGATAATAACGCAGTGCGAATTCAAGCCATCCAATCCATTTACATTACTGGCCAAAGCTTTAATAAAAGAGAAGTTGGCATCAAAGAATAAGTCGGATTTTCGTTTTCTGATATGTCTGGACAATGACTGATCTTGCTTAATCATGTTCCAGGCTTCATTAAACCCCTTCGATGATTGTTCCTGCTTGGTCGCAATGAAATAATTCTCAGCGCCGCTTTCACCATCAGCCACCGTCATTTCGATGCTTGTTGCTGCAAGCTCGGTTGTCTTGCCGTTTTTCCGGCCCCGGATATCCAATACTTCCCGGTATTTTCTAAAGCGGGTATTTTTATCAACAAATCCATAAATTGCCTGGTATTTAGCTTTTTGAAAAAGCATCAACTTTAATGGCTCACCCAATACACCCTGGGACTGCTTACAGAAAGTCTCAATAAATTCAATCGGGCGGTTAGCCAGATCTTCATCAAAAACGAATAGCCCTTGGTGTTTGAGATCATACATCAGCTTTTCATAAACCTGTTTGATCCGATAGCAGGCAACAATATCGCCGGACATGATGGCATCGTAATATTCCTCAATAAATTCTGCTCGGCTCATTTTTTAACCGCTTCCTTTCCGGACTGGAAAAACTGCAGGAGCTGATCCTGCTCTTCTTTCTGCTCCTTCGCAGGCATCAAGTCGATTAACTGCTTCATGATATTATCATACTGCTTTCCATAATCCCGAAATGCTTTTGCTTCGGGTCTCTCTCGATCAAAAACCTGAGAACCATTTTTAAACTTTTCCATCAACCCTTCTTTGATCAGCTTCTGCTTGAGTTCCTCAATTGACACCCTCATAAAAGCAGCATCAGAAATAAGACCTTCCAAAACTTTGATAATGTCTTTATCCATCTGCATATTTTTATAAATCTTCAATATCCGGTTTTTCTCAGCCCTGATCTTCTTTTCTTTTTCTAATTGTTCGGCTATGCCCAAAAATATACCCCCCTCCTTTTTTGAAATTTTCGTGCGGAGGAACAAAGAGGTATCCACTCCGACGGTCTCCTGATGGCCCACCCCATGTTTTTTTAGGGGGGCCTATGCTTTGCGATTTCTAAAATAATTTTTCAGAATTTCTTTTTTTAATTCCTTATCATTGCACTCAGCATCGTTCATTATGTTTGCAATACAAGATTCAATATCAGTATCAATTGAAACGATGACTGCATTCAATCGCCCAGCAATTAAGTCACGCTCTTTATCCTTTGGCAATGAAGCAACGATCCAAATGTTTCTTGCATCGATCTTGCCATCAATGATTAAGCGATACAGATAATCAATCACACCGGCAACAGTCTCAGTAAGATTGTCCGGCACTTCATCCTTACCACGTAGGCTCAAGGCCTGACCAACCTGGTTGAAGTCAATGACCAGATCACCATGATCCATATGATCCAGTACATATGTTGTCTTCCCAGATGCTGGAGCACCACAGACTAACCAACGCTTAACCGGCTGAGGATTCCCCTCATCATCAAAGTACATACCGTTGTTCGTAAGCCTCACCCTTTTCCTAAAGTTATTTGATAATGGATTAGTCTTACGATGTTCATCGAAGTGACAGTCACGGCATAACAGCTCAAGGTTATCCTCACCATAAACTATTCCAGGATCATGGATATTCTCAGGCGTCAGATAAATCTTATGATGCACTTCTTCACCTGGTCTTCCACACCTTTCACAGATACCAAAGTTCTTAGAAAAGATATATTCTCTTTTAGTGATCCAACGTTTAGAGTTATAGATCTGCTTTGCAAATATGCCTGCCATGTTAGTGTTGGTATTTTCTTGGAATCTGTGGAATAACTTTTGTGAATCTAAAAATTGATCCAGACCCATATACTGTTTTTAGGATTCCATTATCGTCGATGTATTCAATTGTTACATCTTTAATTTCGTGGCTTAAAATCTCACCATCTCCTCTAAGCGTTACTACTGTATAGTCAATATCTAAAATATTATCAATAGGTCTGCTTCTTTTTCCACCAACGCACATTTCTACAATAAATTTATTTGGATCAATCTTCACAAATACACCTCAATTCTTCAAATAAAAATCCGAACATTATTTGTTACTTCTTATGTTATCGTTCGGGTTTTTCTGTTTGAATGTTTAATTTCCTTAGAGAATCACACATTCAGTTTTTCATCTCTCTACTTACTAGAGTATAAGAAAATCAGACTTTCAATATTCACCCACTCATTTTTTAAACATTCAAGTACAAAAAAATAAAAAAAGCTCACCGTACAAAGTCAGCTAATGCCTTTGAATACTCGTGATACTTCTCCTGATCCAGTCCTAAATATAATTTTGTCTCTTCAATTGAGGAATGTCCCAGCAGCTCTTTGACTGCCACAACATCCTTTCCGCTGTCCATGTAAATCTTGTAAGCATAGGTTTTACGCATGCTGTGCGCCGTGATCCCTTTGATCCCAAAATAAGCAGCAGCGTCTTTCAAAATATTGCTGATTGCCTGAACGCCAATGGCTCCACCCTTCCTAGATGGAAACAGCCATTCATAATCCCGCTTATCTTTGATGTAACATTTCAACTCCCTGGCTACCTTGGGAATAATCTCCGCCTGTCGGGGTTTCCGGTTTTTCTTCCTGATGTTCCTAGAATTATACTTCTTTCCTTCCTGGATTAAAAAATACCCATGCCGGATTGCTTCCCTAGCGTCCCTGACCTTTAGGCCAACCAGATCCCCAGCCCGGTAACCGGTTGTGATACCAATTAAAAATAAAATGTAATTACGTCTACCCTCAACGGTTCTGTTGGATGCCGCTTTTAAATAATCTTGCAT
Protein sequences of DBSCAN-SWA_3 >NC_016894|3570878:3589662|3579864_3580269_-|WP_014357422.1|DBSCAN-SWA MIENVRKLNTADLFEFMRMVKRTGVKDELKKIAKNIPKKEKQPKLALVENEEGEKTEVVQEKPSQAEVGIDLAFSVMEIFANKKAEDEIYAFIARPFQCKPEEVAENDLMDTIEKLKDVADAQKWASFFKSATQ >NC_016894|3570878:3589662|3574250_3575339_-|WP_014357418.1|DBSCAN-SWA MELYIYNKALALQNVMDTYGSLRWVRRYSECGEFELHCPFTVENILLLAQDNVIRKNDSDEVGYIEYRNIKKDEEGKENLIVKGKLGEGYLNRRIIWGTEILNTTYELAMRALVDKNCINPTDSDRIIETLILGDLGNFAGNVNFQVSYQNLLKTIEALCMEAELGNRVRFDKSLKKLKFEIFQGLDRTSSQTVNPQCIFSKEFDNILDQEYTDSIMDFKNVVLVGGIGEDADRRLVTVGSGTGMDRFEVFNDQKGLSNMVNNVAMTEAEYNALLASKGNETLTDTKKVQTFENGINLNSNLRYKMDFDLGDIVTCLSRKWGIAIDSRINEIEEVYEEKGMEVNIVFGKEMPRTIAQKIKLL >NC_016894|3570878:3589662|3571917_3573210_-|WP_014357416.1|DBSCAN-SWA MGRARLNGQSGGLKINGVEADCIIMSEQTIAKGDFVEFVRSAVATSSSNPLGTGITIQAIEAVKLTDNKIFVVYTNRTDFYHYAIVVQINSDGTLSNITPTPIKASSNVADQTIFLEKVSDTQVVFCYSLTSQQKYVVLMSFNGTAITVGSHYSFTASSSDYIQGISVYDSTHVIVFFYSGSAFFGVVLTISGNNVLARGGTVNIDSSYPMTNIRLRKMQSGKILLLGNRAGYVAYCFLTLIGATLTSTTVTLLVSATSSQWSPVFMSDSLVYAFFTVETGKMSVFKITINDGASTATYISTDSFATDAYASRLSCVALSDTKILMTYAKQSNNYPSMALINIAYGFFQQEFSTYLLNIATVGMSKLLRRTTKIADLFLMDSNYYYLYSKVAKIEEYGRTSSMIEKCNAVAKSGGSSLQNIKVIKLTGGL >NC_016894|3570878:3589662|3579532_3579802_-|WP_014357421.1|DBSCAN-SWA MDIDSGLAFIRKAFEKEEDAKLWDRYLVDYRHMGVENFITFEAYKELAKIESAQPRAAPKTKAETISEINEKVEKIINLTLKGGVANGV >NC_016894|3570878:3589662|3589098_3589662_-|WP_052307152.1|integrase|DBSCAN-SWA MQDYLKAASNRTVEGRRNYILFLIGITTGYRAGDLVGLKVRDAREAIRHGYFLIQEGKKYNSRNIRKKNRKPRQAEIIPKVARELKCYIKDKRDYEWLFPSRKGGAIGVQAISNILKDAAAYFGIKGITAHSMRKTYAYKIYMDSGKDVVAVKELLGHSSIEETKLYLGLDQEKYHEYSKALADFVR >NC_016894|3570878:3589662|3582225_3582528_-|WP_014357427.1|DBSCAN-SWA MIESIRNALRIKNIVFDEEITDLIEACKLDLSISGVKIIDDTDPLIKQAVKTYVKANFGLDNKDGEKYMESYEAIKRHLALCGDYNVEPIEVIVLPEEGV >NC_016894|3570878:3589662|3587410_3587794_-|WP_014357815.1|DBSCAN-SWA MGIAEQLEKEKKIRAEKNRILKIYKNMQMDKDIIKVLEGLISDAAFMRVSIEELKQKLIKEGLMEKFKNGSQVFDRERPEAKAFRDYGKQYDNIMKQLIDLMPAKEQKEEQDQLLQFFQSGKEAVKK >NC_016894|3570878:3589662|3582569_3583805_-|WP_014357428.1|capsid|DBSCAN-SWA MTKEQYLKMRNELLAEVDGLINSGDVENANAKMAEVTALDNQFEAERTAQANAAALRGAPVVNIETQSVVNQGIEFGQVLASFGETTTETELHERAFYNFLVNKPSTQEEKAVFDRINTDYRNAVQTATDHQVVIPETVTAKIWQEIADAHPVLQDIFKTFVPGDLTLIKDDDSITDAEWIDEATSAEGDDVGFGTVELTGCELPKAVDVSWKIKKMAMGDFLNYIARKIAEKMGNAIAKSVFTGKGKPGESDTFKAQPKGVVTALNAEAGTPQVITFATADPLTYKKITSALAKIKSGYLGSGAAIYADNATIWNELANVLNEMGNPYFVPDPTGAGVGRMFGLPVKEEAAAEGNILIGNYGRGYAMNVNQDITLYQEDHIKARTTTYMSYSIIDGDVVTNKAFALIKKV >NC_016894|3570878:3589662|3587896_3588628_-|WP_014357433.1|DBSCAN-SWA MAGIFAKQIYNSKRWITKREYIFSKNFGICERCGRPGEEVHHKIYLTPENIHDPGIVYGEDNLELLCRDCHFDEHRKTNPLSNNFRKRVRLTNNGMYFDDEGNPQPVKRWLVCGAPASGKTTYVLDHMDHGDLVIDFNQVGQALSLRGKDEVPDNLTETVAGVIDYLYRLIIDGKIDARNIWIVASLPKDKERDLIAGRLNAVIVSIDTDIESCIANIMNDAECNDKELKKEILKNYFRNRKA >NC_016894|3570878:3589662|3573211_3574237_-|WP_014357417.1|DBSCAN-SWA MGEISGFHNSANGDRRYKADFWSRFLGSFIGNGVYPNPSTNLQVIANGDMTVTVKAGKAWVNGVFYENTADKVITLDIADGVLKRIDRIVVSDITLERDTYSKVIKGSFASSPAAPALQRDADAYELGLADIYIVNGAVSISQANITDLRLNTAYCGIVHGLFDQVDTTTLFNQYQAWYLETVDDATTDIAVMLSAFQSSFNTWFADLQDTLDENTAANLLNKINDLIDRMTIAETSISNHTADIASLDTRLDLQERLLTSIIPTTGWSSTAPYSVSVTVSGLTDSRPDVNPIYSATVATALLEKEAWNTISYIDCTTDTMTVTCLEEIPTTAINVELIGG >NC_016894|3570878:3589662|3571581_3571914_-|WP_041669151.1|DBSCAN-SWA MIIVTSSETNAIVSICSEAIEVSNGTLVKEVGGSECIIPNNGSFLLHDVGVVPEYVKPGYYKYTPSDGFVKDGGYKPYIPIEKKIEIIEDSTAEYMVDLDFRLSNIELGL >NC_016894|3570878:3589662|3588629_3588887_-|WP_014357817.1|DBSCAN-SWA MKIDPNKFIVEMCVGGKRSRPIDNILDIDYTVVTLRGDGEILSHEIKDVTIEYIDDNGILKTVYGSGSIFRFTKVIPQIPRKYQH >NC_016894|3570878:3589662|3583797_3584571_-|WP_014357429.1|protease|DBSCAN-SWA MPVEIEVRGTIVPDGDKWIYDYFEQPCTTAADIRNKIRSANGDVLEVSVNSPGGDIFVASEIYTALKDYNNVKIKVTGLAASAASVIAMAGYCEMSPTAQMMVHNVWTRQSGDYRDMDSASDSLKKANRSIANAYCVKSGMSMEAALKLMDETTWMTAHDARALGLVDKVLFNVDDEEGFYQNQLFNSVLKENAKAMYAAIPRLSPSVIAKMRESRGNAPEKNENQENKLKALVDQNLESAKAYLNYLKLKGDVKND >NC_016894|3570878:3589662|3575340_3576204_-|WP_014357419.1|tail|DBSCAN-SWA MRKIKYINSLGEELLFGNSAPFILQKFEESQGVNNYNFKGVGQDGETYLGNTLDPKDVNLTVVIIASTSGLYNQYKEKLYRVFNPKLGQGYLVYNDYLKERKIKCIPEKIPFLKDAIKSGTGLINLTAYEPFWKDLQESRDEIALWVGDFEFDLEIPEDTGIEIGHREPSLIVNCLNDGDVETGIRIEFKALATLTNPSLFNVNTREFIKIKKTMAAGEVISISTYFGDKRIISKLNGVETNAFYSIDEDSTFLQLDKGDNLFRYDADSGLDNLEVTIYHYNNYLGV >NC_016894|3570878:3589662|3581230_3581479_-|WP_041669153.1|DBSCAN-SWA MASKTVLLIEEIKKIIRNVHMGVFYMKATKTTPYPYITFQISDIGASKKLELDYWADKPDSIELETLADNVGDYLNKYTLNK >NC_016894|3570878:3589662|3570878_3571313_-|WP_014357413.1|holin|DBSCAN-SWA MRYLVDSPILSGIFTAVVGFLTWLFGGWDVLMCVLVTLMAIDYITGLMVAYVTKTLSSAIGLKGLFKKIAELFVVMTAVQIDMATGQGGAYFKNIVCLLFIANEGLSLLENAGNLGVPIPDILKKALKQIGDKTETESEGGKNE >NC_016894|3570878:3589662|3581468_3581927_-|WP_041669156.1|DBSCAN-SWA MGMPPSVTKVLVKKGKTTIQYTSNVDRVKYTLSELTRAALRDVGKYLTKEFRLAYYGHFKKRRGKVGKFTQYWVRKKDCDLQVGLKPNAFYGGFQEKGSSKTPALGLLTKVTQDNIAKIVEIESQYLSSLESEAAALAKINEEEYEGGSDGE >NC_016894|3570878:3589662|3585758_3587414_-|WP_014357431.1|terminase|DBSCAN-SWA MSRAEFIEEYYDAIMSGDIVACYRIKQVYEKLMYDLKHQGLFVFDEDLANRPIEFIETFCKQSQGVLGEPLKLMLFQKAKYQAIYGFVDKNTRFRKYREVLDIRGRKNGKTTELAATSIEMTVADGESGAENYFIATKQEQSSKGFNEAWNMIKQDQSLSRHIRKRKSDLFFDANFSFIKALASNVNGLDGLNSHCVIIDELAAIKNRDLYDLMIQSTSSRDQPLLTCISTNGFVRECIFDSQYEYACKVLDGKVVDDTFLPFIYELDDRDEWDKEECWIKANPGLGVIKKIEVLRGFVNKAKEDPAFKATVMVKDFCATENAATAWLRWEELYNPEKFEAKEMGFRYGIGSFDLAETTDLAAAKVVCKRRDDDKDYYLSMYWLPEENLNNKELLDQVPYLLWEKQGLLRVCPGNRINPYAILEWFIEVQDVYDIYIPWIGYDPWHVDASLLMAFQNHFGKNAMISVRQGSYTLSMPMKELKAELIAKQSVYNDHPIDKWCLKNLEVKVDINGNIQPVKGVSQTQKIDGAVAMIIVKVILRDKMAEYLNMI >NC_016894|3570878:3589662|3581889_3582225_-|WP_014357813.1|DBSCAN-SWA MWISICYLGIEAEAENAIGEKYEAVTFEDYVFCDQKSIRMSEFYQAATTDYKPSITLTLKQADYAGQRYIKFEDEVYTMIRTYAVDSEDIEVVLERGIKHGDASISDESIG >NC_016894|3570878:3589662|3580273_3581116_-|WP_014357423.1|DBSCAN-SWA MGKVRTGYNPKTMENLHTGAGAFFKNFIVGTDTYESARLGGKLIGATQGGGEFKAAAEIRNIEIDGLPGKGKGTEIIDYIDVSMTMNFIETTPAILAMALGAADVDTTTNGTYDIITGRNAFEDGDYVDNITYIGTITGSEEPIIIQVFNALSTDGLNIKVEDKKEGVIPVTVYGHYEDTGEGTLDAPPYRIYYPKGSNVATPVASVKGGTYATSQTVSLTCATVGATIYYTTNGFEPTADDTAYSTEITVATDTILKAKAMKSGMADSATMTETYRIGE >NC_016894|3570878:3589662|3576213_3579543_-|WP_014357420.1|tail|DBSCAN-SWA MAFEIFKLFGSIFVDTSEANNEMDLAGNNAEILGKKFGAVADKADSIRNGLNSAGEGFSKYVTAPIVALGAASVVAFNAVDDGMDVMIKATGATGDAAGDLEKVFKNVSGSVIGSFDDVGGAIGEVNTRFGTTGDGLESMSKDFLKFAEITGVDATQGVQLVSRAMSDAGIDTADYKTILDQLSAASQASGISVESLTENLTKYGAPMRALGFDTQESIAIFAGWEKAGVNTEIAFSGMKKAISNWAAAGKDPREEFKKTLKAIEETPDIASATTMAIETFGQKAGPDLADAIKGGRFSYEEFLAVVENSDGTLDGTYDELLDGGAKFEMSMQNIQESLAGLGETIMNVLAPMMETAAEKIQGVADWFDSLDEGQQEFIVKIGMVAAAIGPVLLILGGLAGAVSNVAGLFATGGILNGALGTASASLATGAEGAVGMGSSLAALTGPVAIVVAAIAGFIAILVGAWQNSETFRKSAEMAFNSVSVHAFEAFSRIAEALAPAKEAFQGFIDGIGPVLGQIGDFIGNQIIPIVKDFINGFIDGFANIIVAIAPFIEAIGNLLSFISNFVGLVFALLNGDWAAAWEFAKAMGQNAVDFLANVFQGLYNWVSLIFQSILDFIKGIWDGIVQHTTDTWNGVVTFLENAWKTIYDNTIGKITEMAKGVAAKWEETKSDTQTKWANIRDDLASKVGEIYSKVTSKIKETADDVASKWQTSKDDSQTKWANIRDDLGTKAGEIFTNVTTKIHEIVTELPKKWDSIKEAASDAWGKEPNGIVPKILSLVGALPGKLFSLAKDMLSELVKGINDNTSVTNLTDAVGGLVQTVLTKFREGFGIASPAKKLFEIGKYMIQGLINGLNGDNLIAFVNSMVEEIKAAFANGNFNLKAAIDFVGSGAAEFFKSIGIGGSDFGSLVAPVNGSITSWFGNRDDVGDVGSKYHEGIDIGVPEGTPVGSAGAGTVIQAGWNGGYGNSITIDHGNGLETLYGHLSEVLVNVGDLVAQLQTIGLSGNTGNSTGPHLHFSVIKDGEQVDPASIFGYASGTNYATAGLHWVGENGRELVNFKGGERVYDAETSELLARGNVTMEVTINSPTALSPAKTAKLLKRSVQELLMT >NC_016894|3570878:3589662|3571412_3571565_-|WP_014357414.1|DBSCAN-SWA MTCTYCKTVINNGRYGTKEAMMVKLDVFLLNNRITQEEYTELVDLLNAAA |
22 | Clostridium_phage(64.29%) | capsid,integrase,tail,protease,terminase,holin | attL 3584210:3584223|attR 3590252:3590265 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
3880300 : 3943307
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >NC_016894|3880300:3943307|DBSCAN-SWA TTTAGCGTTGTAAGGGAGCTGTAGTCGGGTTTTTATATTGCTGCCCCAAAATGAAAAAGTTGGCGGAATCATCCGGATCATCGGGTCCGTTTTTATCCCTGAGTGGCCTTTTTCCATGTGCTTCCCGATCTCGGGCAATTTCTTCCTGAAGGGCGGCTTCATAATGTCTCACCGTCTTTCTGACTAAAACTTTTTGAGATTTATTTCGATTCGCACGGGCTTTAACATGGGTTCCATCGATAAACAGCGTTTTCTGATCAACGTAACCGGCCTTGGTACACTGATCCAGAATCTTCATGAAAATCTGCTCAAAAAAACCGGTGTCTTTAAAACGCCAGCCGTAGTTTTTTCCAAAAGTTGTAAAAGGGGGAACCGGTTCATTGAAATCCAGACCCAGAAACCAGCGATAAGCGATATTGACTTCCACATCCCGGATCGTCTGTCACATACTTCGAATGCCGCAGAGATAATAGATGACCGGCAGTTTAATCAGTACAACCGGATCCAGGCTCGGTCTTCCATTGTTCGAACAGTACTTATCCTCTACCAGATCGTATATAAAATCAAAATCGATTGCTTCATCAACCAGCCTTAAAATGTGATCTTTCGGCACCAGCGCATCCATTGTGGCGATCTGTATCTGTTCTCTGATATCCTGTTCCCGTTTGGTTAACATAAGGTTTTCCTCTATTTGTTTTCTAATTTTATGATAACCCATGAACCTTGGAATAAGCTTTTTTGAATTCAAAAAACTAAAAATGGCCAGGTTTCCCTGACCTTCGTCTTCAGTCTGAAGCATCTCAATTGAGATGCTTTTTTGTAATTTAATGTAGAACTTAAATAACTCTTATGACGGAAGTTCTAGAATTTGCTGTAGCACTTTTATGTTCAAATTCACTCTGCGTTGGATCGCATCTGTCGATAAAGAATGAATTCCCGACTTAAGCCTTACGGCAATTACGGTAGCGCTTCTGCTTAAGATTTTCACCCACATTCTAAAATTACGACCGTTTATTCAACTATTATCTTTTGATTTCTTTAGAATCAACATAACAATGATAATACTAACTGGAAGTGACACAATTAAACAAGGTAATATTTCGCTACAAAAATATTGGAAAAATATTTCTTTATTTAAAAATATATTGATGTTATAATTTATTTTTTTTACAACCCAAGTCCCAATCAAAGAACCCAATACCTGTGCCGCAACTAAGACACCAATTTGTTTTACTCTGTTAAACGTCCGACTGCTTTCAACTCTCACAATTATTTAAAAAGGTAAATACCATAACCAACACCATTATCATCAACTTGTTTCTCTTCATGCTAATGCTTTTACTCATTTTTAACCTCCATAAATTTTGCTTAAATAGCAATTCAAATCTTTACTTCGCTACCACTAGAGGGTAAATTAAACTGTAATTTCTAAATGCAACTTACGCTATCCACCATCTCGGGAATCTGCCAATTCCTAAGGTTTTTTAACTTTTGACTCTTCCACCTGTTCCTCCTTTCCGCTTCACGACTATTCTCAAGGTATCACCTACCTGAAGAAACAGTGCTCATAAAGTATTCACGGTTTAGATTCTCAATTTAGATTCTTTTATACAAAAAAGAACTCCCATCAAAGCCAAAAAAGGCCTTAGACAGAAGTTCTAATATTGCTGTAGAACTTTTATGATCTGATCTACTCTGCGTTAGATCGTATCTGTCGATAAAGCTTGAGTTCCCGACTGATGCCTTGCGGCAATCACGGTAGCGCATCTGCTTGGGATTTTCACCCAATTCCTCGCGGTAAAAAACATCACTGCTTTTACCTATAGCCGATATGATTCGGCGGCTTTACCATCTCATAATATTTAGTTTTGTCATAACTCATTGATAGCTTGATCTCATTTAAGCTACAAGTAGAGTATAGCACCGCTGTTTTTAGATTACAATCGCTTTTTTTGTGAATTTTTATGACTAGGGGATGTTTCCGATTCTTTCAGATTTTCATTCAGGATATACGCCGTATTTTTACCGGTTCCAATTTTAATGCTATAACCTTCTTTTAATAAGATTGACAACGCTACTTCAACTGTCAATGTGCTTCATGTATAGATTTTCTCAATACGATTTGATGCGCCGGTACTTTGAATTTGTGCAATTTCCAACATGACCTCAAGAATATCTGGTTTTACTTCAACGAATAATTCCTGTTTAGTCTTATACTCGTGAATGGCCAACACTAATTTCATCAACTCATAATTCATCGGGTAATCGATTATAATCATCTTTTCATATTTCTACAATCCTTTCTGCTCAAACATTTCATCTTTCAACATAATTTCAGCAATGATTTGTGCAGAAGTCAATTTTATTCGGCAGAATCATCGTCTGTATCATTAATCCGCTTGTAATTTTCCATCAAACACTTGGGCATTTGCACAACGCTCAATTTCTACATTCAGAGCTTTACTGCTAAAATTCCCATGATCATGATGAGGGGACGTTTCGTTTGTCATATGCCTCTGCTTTAGTCGCCTGACGGTTCAATCTGTCATCCGGGCTAAAATTGCTTCGTTTCTATCGTCCAAGCTTACTCAGTTCATCGACAAAAGCCGACTTTTTTTTAAAAAAATGACGAGTTTCTGAATGATCTTGTCCTGATTTTTCTGACCAGCAATCTTTTTGTACTGCTTGATAATTTTGCAAACGCCCTGATAGTCCAGTCTCTATTCATGCAGCAAGTCTCTAACGTAGGCATAACTTGGAAACATTTTCTGTTGTCATACAAAAACAGAAACCCCTGCGTACCTCACGATAGCAGGGGCTTGATCCGTTATTTTCTTTTTATTGGAATCCATATCTCAGCATAATAATTTTCATCCAGTGTACCCTTGGGATATTTATCAGGTGCATCATACATTTCGACACAATAACCTGCGGCAATTTCATATTCTCTTAATGTGGGGAGCCATTCAGAGAATATTTTTGCATTCACATTTTGAATCGAAATTGGCATCGCTCCTTGACAAGGAAAAACTGCCCAGGTGAACGCCGGAATTGTTTTGGTCATAAAACCTTCCGGAATATCCATAATCGGATTATAAACATCGGCGATCAAATACTCAAATTTTTCACTTCCCATTTGCTCATCGATGTTAATTCCAAACATTCCGCAAACAGTCTGACCTTTCCCCGATGCATAATGCTCCTGCCAAAAAGCGGGAATTTCCTGTTTAGCCTGCTCGTAAGAAAATTCTTTTGATGCACTAAGGACGGTAAAACTATTTTTTTTCGTAATTCTGTAATCCATAAGATAACCACCTTTCAAAGATATTGTTAATTTCAGCGGTGCAAAGGACTTAATCATATTCCTGTCCTTTCGCACCTGCGAAGGTGTACTACCATGAAATCGAGTAAAAGCTTTGGTAAAACTATCCGGTGAATCATATCCATATATCATTGCAAGATCAATGACTTTAGCATCACTATTCGTTAATTCGACTCCGGCCAGAGCCAGCCTGCGATTGCGGATATATTCCATAATCGAGTAACCGCATAACATACTAAATCCTTTTTGGAAATAGAACGTCGATATACAAACATGATTCGCAACATCATCCGCTGTAATATCTTCCGTCATGTGACTTTCTATATAATCAACTGCTTCACCAATGGCTTTCATCCATTCCATACCGCTCACCTCCTGCTGTAATAACAGTATATCCTGGGACTGTTATCGCTTCCCGACAATACCTGCTTTGTTTTGTCTGTTTTTTTATTGATGCGGGAACGTTTATCCTATCGTTTATTTAATCGCGCTTTATTTCAAAATCCCGGCCCAAAAATTCATGGGATAATCGCTTGACTGTTAATAAAAAATTCTTCCTGACTTGGCTGATATTTTTTCTCCCGGCTTTCCAAACCCGCATCAAAGCGTATTGCTGCTTGCTCATCGATCTCAAATACCGGACTTTGATAATAAACCCATTTTCTCCCGTCCAAAACTTCTGGTTTGAGTTCTTTTACCATCATTGCCGCCGGATAGGTTCCGTTTTCAAGCGTAACGTTGTACTTTTTACAACTCTTAAAACCACGACTGACATAATTGTTCGGATTGCCAAAGATTACAATTACCTCATACCCCAGTGCAACTGCCTGTTTAAAGGAATATTCCATTAGTTTTTTTCCATATCCTTTTTTCTGATATTCCGGCAAAATACAAACTGGACCAAACGTCAGGATGTCTTTTTCTGCTCCCGTCTCATCAATTAGTTTTGTTTTTGTATACATAATATTCCCAATGATCTGATGATCTATTTCAATCACCAGATCCAACTCCGGCAGAAAGTCTTTGTGGGATCGCATCACATGAACCAGGTAGTGTTCAATACATCCTGGAACATATAAATTCCAAAAAGATTTCCTGGTGATTGCTTCGACTTGCTGATAATCTGCTACTGCTTCATTCCGAATTTTCATCATTTTATTCATTCCCTGACAGGTCTGCTTTTCGATCCAGTTGCTAAAAAAATCCAATTGTGTTTTAGTATGGAAATAATGTTCACCCTGTTCCATGACCGTGAGATCACAATTAAATTGCCGGGTGAAGTTTAAAACCGTATCAATTTCACATAAATCATCATTTGAGCCATAAAGAATGCTCGTCGGTTTATTCCATAAATCAATGGGATGTTCCTTGACATAACAATAATAATCCCAATATAATCGCTGTCCAATTGGCGTTACCACTTCTTTTTCGCTTTGCAACTGCTCTTTGCTAACCTCGAACCACGTCATCATGTTATTGATAATTCGCTCCATATCAACAACCGGTGACAAAAATAGACATTGTTTCAAATCGGCCTCTTTGTAGGCCAGCAAACTAAAATATGCGCCCATACTACAGGCAAACAAACTGATATGCTCCCATCCTGTTTTGACATATTCGATAATACTGGTAAGATCATTAACACCCTCTTGAACCTTGCATGGCCTGGGATCATTTTTACGTTCGCCATGCTCAGGCAGATCAAAACTCAATACCTGATATCCTAATGGGATCATTTTTTCTGCAAAGATCTCGATGACCTGATCCGATTTGCTCGACATATTTCCATGAACCGCAATAAATATCTTCGCAGCCTGCTCGCCCCAAATAATTGCTGGTATCCCAGCGATTGTTAATTTTTGTGTTATCATTTTACCCTCACTTCGCAACCCGACTTACTATTTTATCCCCGCACTTTTGACCAAAATATTTACCGCCATTCCATCCCGAGGTCAATATGATCGTCACCACTTGTTGTTTACCTCGTCCGTTTATCGCTAATTTACCATCAATCACTGTATTTGTCCATAAAATAGTCCCAAACCCAAACGCCAATTCCTTTACATTTCCCGCGCTACCCTTTATACTCAACATATGTCCATTTCGAAGCATTTAAAAAATGTTATTCGGATGTATCATACATTGATGATTGAGAGGTAAAAATGATGTTTCGACTTTGGGGAAAAATCATGAAAAACAATAAATTTTTGGAAGAAAAAGTTATCGCAATTGATAACCCATCCTTAAATACGAATGATAAAATCCAAGCTGCTTTAGAGATCTTCTGCCATGACTTTGATTTGGAAAAACCGATGTGGTTTGACAAAAACACAAAAGAATTTAACCAGATTTCCAAAACATCTTTTCGTGAAGACCAATTTATCGAATCCATTTGGTTTGATTATTTAGAAATCGAACTTATCGATGATGGTAAAAAGAAACCTTAACTATGACCGCTGATGACAATTAAGTTCCACAATATGTTTTATAGGGACTATTTGATAGTTCCGGTACGCGCATATATTCCTGATTAAGCAAATGATAATCGTATGGTGCTTGAAGAACTTCTAATAACCGCTGCAAAGGCTTAAAATCATCGTGATCGTTAGCTGCTTGCAAAACGCTTTCAACCTGATGATTTCTGGGGATGACCACCGGATTCGTTTGTTTCATTAACTGTTTGCTATCTTGATTTGTTTGCACCTGTCTTTCCAAACGAGCTTTCCACCGATCATGCCAATCTTTGAAGGCCTCACTTTCATATAATGCTGACGACGAAGTTCGGTCCAGCGTCAAATCAACAAAGGTATTGGTATAATCAGCCTGGTATCGCTTCATTAGTCCCAGTAATTCGGCAATCAACAGCTCGTCTTGCGGCTCTTCATTAGCAATCCCCAGCTTTGCTCGCATTCCCTGGAGCCAATCCGCCTGATATAATAAAGCAAAATTTTGCAGTGATGCTTCAACTATTTTAATCGCTTCTTTTTGATTTTCATCGATTAACGGAATCAGGGTCTCAGCCAAACGGGCCAAATTCCATAGGTCAATATTGGGTTGGTTTCGATAAGCATACCGTCCCTGCAGATCAATCGAGCTAAATACCGTTTCCGGATCATAACGATCCATAAAGGCGCAAGGCCCATAATCGATTGTTTCGCCACTGATGGTCACATTATCGGTATTCATGACGCCATGAATAAAACCCACCCGTTGCCATTTGGCAATCAGCGAAGCCTGGGCTTTGATGACTTCATCGAATAAACCAAGATAAACATTTGGCTTCGACTGAATCCACGGAAAATGGCGATTAATCGCATAATCAGCCAGCGCTTTGACATCAGCGGTGGTTCCCCACTGGGCGGCATATTCAAAGGTTCCGACGCGAAGATGACTGGCCGCCACGCGTGTCAAAATCGCCCCTTTGAGAGGTGTTTCGCGATACACCGGATCACCCGTTGTTATAACCGCCAAACTGCGTGTAGTTGGAATTCCCAAATAATGCATTGCTTCGCTGATCAGATATTCTCTAAGCATCGGTCCTAACGCCGCTTTACCATCGCCACTGCGCGAATACGGCGTCCTGCCTGATCCTTTAAGTTGGATATCCAGACGCTCGCCGGTTGGTGTGATCTGTTCGCCAATCAGCATTGCCCGACCATCTCCGAGCATTGTAAAATAGCCAAATTGATGACCCGCATAAGCCTGGGCAATCGGTTTAGCGTTGGTCGGCAAGGCCCGTCCAGCTAAAATATCGATCCCCGCCTGACCGATTAGTGCTTCCGCATCCAACCCCAAATATCTAGCTAAAGGCTGATTCAAAATAACCAGTTTCGGAGCGCTGACCGTCGCTAATTTTAGCGGAGCATAGAATATTTCCGGCAATTGCGCGTAACTATTTTCCAAATTCCAACCGCCATCATTTTTTTCCATCGTTCTAACCCTTCCTTTCGTTTTCCCCAAGGCCCCAAGCGACCCAAACTGTCTAGCCAACTCTGATTTTTACCTTTTTGTTATTGATGATCTGTTTATAACATCTTTATCTTTTATCATTTTAAAATTAGTCAAAGGGACACCGCCTCTGACTACGATTTGTTTAGCCTGGACCGTATATCCGATTTTTTCAAAAAAAAGTTTGGCTGTAATGGAAGCCTCTGTTTTAAAACAAACCACCTCTTCTTTGGCACGTCGTTCCAGTTCGTTGCTTAGTGCCGTTGCGATCCCCTTGCCTTGATAATCTTTGTGCACATATAACCTATCCAGATAACCCTTCCCATCCAGATCAGCAAAACCAACAATCACGCCGTTATCTACCGCCACTAAAGTCGTGTGGTCTAAGAACGTACGATTCCATTCGTTTAAATCAACCGTTCCGGTTGCCCAAACATCAAGCTGTTCTTTTGTATAGTCCTTAGCATTAATGGTATGTACCGTGTCATAAAACAATTGCGCTAAAAAAACACAATCATCTGGTTTGTATTCTCTGATCATCATGCTCCCCCTTATCATTTTCTACTTTAAATTTTTCTGGTAATCACCGTTTCAATATTCCGGCGGCCATTCCTCGCAGTAATGCTCCTCAGTTTTAACTATCGCGGTGGGATAAACGATGTTACGGTCCATTACCACAAGTAAAGCTAATTAATATCAGTTATCACCACGCCCATCACCAGCTATGCTTTTATCCTTATTGGTGTTAGAATAAAAACAAAAAATGAAATAACCGCAAGTAAAATCAAGCTCGAATCGCTACATTTCTTTATAATAAATGTAGGGTGATTGAAACGAGGTGAATCGACGCATGTACGAGTGGCATCAACAAATTCAAACAATCGTTGATGAAATTGACAACTGTATTAAAAATTATAATGGCGAAGCCTTAACACTTCACTTTCTTTCTCACAAGCTGGGTTATTCCGAATTTTATACCACCAGAAAGTTTAAAGAAATAGCCGGTATGCAATTTCGGGATTATCTGCGCCATCGGAAATTAGCCTTTGCGCTCAAAGAGGTCCGTGATCGTAACAAAAGCTTTTTAGATATCGCTTTCGATTATGGTTTTTCATCCCATGAAGCTTTTACCAGAGCTTTTAAGGGAACCTATGGTGTAACTCCCAGTGAGTACCGAAAAAAGCCTACCCCTGTCATTCTTCGTACAAAAATAAACCCTTTTGATCGCTACTTTTTTGGATTTGGAGAAATTGGTATGATTAAATCGACAGCTGATGTTAAAATTTATTTTGTAACTATTCCGGCCCACAAATTTTTGCACATTAAAAACTATCAAAGTAATGGGTATTGGGATTTTTGGCAAAAGCAAAACCTTATTCCGGGACAAGACTACGAAACAATTTGCGGTTTGCTTGATAGTATCAAAGGCAAATTAGATGATGATGGCGGGAGCGAATCGAACAGCGGCAGTGGTCAGTTGATGGCCTACATTAATGACCCCAACGGCCGACTCTGCGATTGGGGCATTCCCCGTACCGAGTGTTATGGTGCCCGTCTTCCTTTTGATTATAACGGCGAGATCCCATCCCAAATGCTGATGCTTGATGTTCCCGAGGCCGAATATATTGTTTTTGAACATGGGCCCTTCGATTATGAACAGGAAAATCGGAGTGTCGAAGCAACAATGGAAAAAGCCATGGCAACTTTTGATTTTTCCGGCACGGGTTACTGCTTTGATCCTTCCCCCGGTAGAATTATTTATTTGTTATATAATCCCGAGCGGTTTTGGAAGTATATCAGACCCGTACGAAGTAAATAAAATCGTTATCTTTAAACACGCACTGCTGACCGCCATGTTAACATTTTTTATTTCCATATTCCCATTTAATTAACCTAACAACCATCATTTAGATCTTGAAGTTTTTTTATATATTAAATCAAAATATTTCTTTGCCGCTTCTACCAGGTCATAGTTTCCTCCTGTTGAACTCCAGTTTACAGCTAATCCTAAAAATGCCGATGCAAAACAATATGATAAATCTTCAGCTGAAGTATCGGCATCAAGTTCCCCTGTTTCTTGAGCTTTATAGGTATATTCAATAACCATTTGTCGTAATCTTTTCAAATTCGGATCAAAATCATTTAACCTAAAGTTGAACATATAATTTTGTTGTTCCATATCAATTTTAATTAAATTTTTTAATATATCCGTATTCAAATTTGCAATGCCTTTTATATGAATTTGTTTAATTTTCCAGCATTTATCAAGCCATGTTATTTCATTATCGATATCCTTTAAACTAGTTTCTATATCTTCATCAACTAAAGAAAAATAATCTAAAAGCAGTGTTTTCTTCGAATCATAATGATAATAAAATGTCCTCTTTGTAATATTGCAGCTCTCACATATTTCGTTAATCGTTACATTATCAAATCCATTTTTCTTAAAAAGCTCAATCGCTTTAACCAAAATTGTATGTTTTATATTTTCTATCATAGTTATTCCTCCGATATATATCTGCAATTTTATCATACTTATTAAAATATATTAAATTTATATTTGCAAAATATTGACATCTCATACACCGCGGTATACAATCAACGTATACCGTGGTAACAAAATTATTTTAAACTTATCAAAGTGAGGTGCTTTTTATGAAAAGTAAAACGGATGCATTATTTCAGCCTATGAGTATAGGTACAATGAGGGTAAAAAACAGAATCGCAATGGCTCCAATGGGTTTACATTCAAAAAATCCTGATGGAAGTTTTAATCAAGATGCTGTTGATTTATACGTTGCTCGCGCTAAGGGGGGCGTCGGATTAATTGTAACAACCGGTATCGCATGCCAGAATAAACTCGACTCAATGCGCGCTACCTTGGCAACTGCAGGTGATTCTTATGTCACCGCTTCCAAAAAGCTTACCGATGAAGTACACAAGTATGGTGCTAAAATTGTGCTCCAAATCGCAAATGGTGCTGGCAGAAATCGAAAAAATGGTTTCTTTTTAGACAATGACCCTATTTCTTCTTCGGAAAATCCAAATGTTTGGCATCCTGAAATGATGCATCGTGCATTAACAACAGCAGAAGTCCAATTTCTTATCCAATCTTATGCTAATGGTGCTTATGTTGCAAAACAGGCCGGCTTTGATGGGGTAGAAGTTCATGCGCTTCATGAAGGATACCTAATGGATCAATTTTCTATGGAATGTACTAATCGTCGTACCGATCAATATGGCGGAAGCTTAGAAAACAGACTTCGTTATGCTACCGAAACAGTACAAGCAATAAAAGAAAAATGCGGAAAAGATTTTCCTGTTTTGATAAGATATAGTGTTAAAAGCTATATGAAAGGATTTGGTCTTGATAAAGGTGCCCTTCCGGGAGAAAAATTTGAAGAATTTGGCCGTGATTTAGAAGAAAGTGCTAAAATAGCCAAAATTCTTCAGGATGCTGGTTATGATGCTTTAGATGCAGACAATGGCACTTATGAATCATGGTATTTTGCACACCCACCAGTATATATGCCAAAAGCATGTAACTTGGCAGATGCTCAATATATAAAGCAATTTGTTGATATTCCTGTTATCTGTGCCGGTAAAATGGATGATCCAGAAATAGGCAGCGAAGCTGTTGCGAGTGGGAGTATTGATGCTATTTCTGTTGGCCGAGCACTCCTTGCTGACCCTGAATGGCCAAACAAAGTACAAACTGAAAACTTTGATGATATCAGACCTTGCATCGGATGTCATGCCGGATGTTTGGAGCGGTTTTTTGCCGGCAAAAATACTTCATGTGCAATTAATCCACAAGTTGGCATGGAAAAAAAATATGAAATTAAACCCGCTGATGTTAAAAAAAATATTATGGTCATCGGTGGCGGTATAAGCGGTATGGAAGCCGCAAGAATTAGCGCCCTTAGAGGGCATAAAGTAGATTTATATGAACGTACAAACAGCCTTGGCGGTGTTTTCATCCCGGCTTCTTCTATGAGTTTTAAAGAAGAAGATAAAAAATTAATTCAATGGTATGTGAAACAACTTAAAGATACTGGCGTAACCATTCATATGAATACCGAAGTAAATGAAAACATTATAAAAGCTGCTAAACCAAATTCTATTTTTGTCGCAACTGGTTCTACGGCAAGAAAGCTAAACATAAATAGCGCAAGTTCAGAAAAAGTTATAACCGCAGTGGAAGCATTATTGGAAACTAAACCAATCGGTGATAAAGTGGTCGTTATCGGCGGAGGGCTTACTGGTGTTGAAATCGGGTATAGCCTAACAAAAGATAAAGGAAAACATGTAGAAATACTTGAAATGCTGCCTGACATTTTACAAGTACAGGATCTAAACGCTGCCAATAAAACGATGCTTCAAAATCTTGTATTATCTCATAACATTGGCGTTCATACTAATGCCAAAGTTACCGCAATCACATCGAAAGGCGTGCAATTTGAAGAAAACGGAGCCACTGTGGAATTAGATGCCGACACAATTATTACAAGTATTGGCTATATCAGCGATAAATCACTCTATGAAGCAATCCATGATTGTGGTGCAGAAGTGTATTTAATTGGAGATGCATCAAAAGTATCTAATCTAATGGGCGCTATTTGGGATGCCTATGAAATTGCTATGGCAATTTAAAAAATAAAAGATCCCGCCCTGCTAACCAGGACAAATTTTTTGAATAATTCCCTTCGACCTTATAAATTCCTTAAAAATGACTGTTATCATAACCATAACAACTTTAGGTAATTGCGAAATGAAAAAACATCAAATAACGGTTGCTTTAGGTGCAGTTTCCACAAACGATTTCGTAACGTGTCGGCGAACAGTTCATCGGACTGTCCGCCGTACCGTGTAGAAATTGTTTCGTGCGAAACTGGGCCCAAAGCTCATGGCACTTTTGCAATTACCTACATAACAACTCACAATGGAGGAATTTATCATGTCGGAGTACATCCTAAAAACAAATCATGTTTCTAAAAAATTTAAACAGACCGATGCCATAAAAGATTTATCGATGTCGGTTAGAAAAAATTCGGTCTACGGTTTATTAGGACCTAACGGTGCTGGTAAATCGACATTTTTGAAGATGGTTACCGGCATTATCCGACCCACTTCAGGCGAAATAATATTCAATAATCATCCTTGGACTCGAAAAGATTTATTAAATATCGGTTCCTTAATCGAATCACCGCCACTGTATGAGAATTTAACGGCATTTGAAAATTTAAAAGTACGTGCGCTGCTGCTGGGGATTTCCACAGATAGATGTCACCAAGTTTTACAACAAATGGACTTAATGGCTACTAACAATAAAAAGGTAGCCAATTTTTCGTTGGGCATGAAACAGCGCTTAGGCATCGCCTTGGCGTTACTGAACAACCCCCAATTATTAGTTTTAGATGAACCAACAAACGGGTTAGACCCTTTTGGAATTGAAGAATTACGGGTCATGATTAAAAACTTTGCCGCATCAGGGATCGCGGTTATTATCTCCAGTCATATTTTAAGCGAAATCCAACAAGTTGCCGACGACATCGGGATTATCTACAATGGCTCACTTCTATATCAAGATAAAATTGACGCCCATAAAAACCTCGAACAATTATTTATGGATATCATCAGAAAGGAGCGTGCTTCCTGATGTTACAAGCCTATTTAAACGCAGAAAACTTAAAATTTAAACACTCCTTATTTAGAAAACTGATACTATTTATTCCCGCTGCTTTAATTTTAATCTCGTTGGTATTTATTTTTGTCGGGATTGGGTTAGGTGGTTTTTCAAGCGCAATGGTTTGCAATTGGTGTATGCCGATTGGATCTTTATCCGTTATGTTTTTATGTCATTTAGTGAATAATAAAGATCAAAAACACGGCTACCGAACGCTTTATAGCTTACCGATCGACTTAAAGCAGATCTTTATTGCAAAAACCATCTTGATCGCACTGAATCTTTTGATCATCTCATTATTACTGTCATTTATCACAGTTATCGCCGAATCCATCGTATCCGGTCTTTTTATTGCGCTAAGCCATAGCGACTATTATCTTTTAGGTTATGGCTTGTTGTGGCTCTCATTATTATGGCAGATCCCCTTCTGTTTGTTTTTGGATCAAAAAGTGGGATTTGTTGCTGCTGTGATCATCAATTTATTCGCCAGCGCATTCGGCGGTTTGTTTTTTTCCTTAACCCCTTTGTTTTGGTTTTTCCCTTATAGCTGGCCGGCTCGGTTTATGGTGACATTATTTGGCGTTTTACCCAACGGATTATTGGTCAATGGCGGTTCTCGATTGATTTTAAATCCCGGCGCAAGTGCATTACTGGTATTAATAAGCTTACTTACCTCATTGCTTCTGACGGTTTTATTTTCCCGCTGGTACCGAAAGCAGGTGTATCGCAAATGACGATTTTAAGGGAGTTTTTTTCCAACTTTACCAAGATCAAACGTACGCCTGTTATTTTACTCCATTTGTTACCGCCGATCGTGATCACAACATTATTTTTCGTTTATTATGCTTCTGGCGGGTACCATCTTATTTCCGATGTGCGCTTGTTTTTCGTAATTCTACAAATTGGTTATCCGATTTTTGTTAGTATTGTTGTCCCTATTTTAATCAATTTAGATCGACATAACGGGATTCAAAATGCACTCGGTTTAGTCCCCTCGCGAAGTAGCGTATATCTGGGAAAATGGTTATTTTTAATGTTTCTTTCGGCGATCAATATGATACTATATGAAGTGTGTTTCTATGTTGGGGTCAATTTTTTTCCAGGCATCAATATGCCCCCCTTCGGTGCGTCGCTGGTCATCTTTGGTGTTTTTTTATTTAGCAACTTATTTTTATATTTATTACACATACTGATTGCTTTTCGATTTGGTTCAAGTCTTTCGGTTTTGACCGGGATATCCGGCACCATTTTAGCCGGTTACTTCGAAAATGCGATTGGTGATAAAATTTGGCCCTTCATTCCCTGGGAGTGGGGTGTTCGGTTTTTGGAGAATTATTTTAACTTTTCAAATGTCCCTGTTTTTCCCGGAATTATTGCCCTGATGATAATGACTTCGTTTATTCTGATTGTATCGCTATTATGGTTTAGTCACTGGGAAGGCAACGTGATCCAAGAATAAAAAAGGAGGCAACCAATGTCGAAATTGTTAGTGGTCGATGATGACCTTGAGATGCTGTCGCTGGTGCGCGCCGCCTTAGAAAAAGACGGCCACCAGATCGACACCGAAGCGGATGCCGCTATCGTACAGCCCGCTCGGTGTCAGTTGTACGATCTTTTGCTACTCGATGTGATGATGCCCAACGAAGATGGCTTTTCCCTTTGTCGCCGAATTCGGGCTGAGGTGGATTGTCCGATTCTCTTTTTAACCGCCAAGGCGGAAGACGCCGCTCTGGTCCAGGGCTTTGGTCTGGGCGCCGATGATTACATTAAAAAACCCTTCAGTCTTGCGGAACTGCGCGCACGGGTAAACGCCCATCTGCGGCGGGAGGTCCGTCAGCCGACCCACACCCTGAGCCGCGGCGGTGTACGCTTTGACATGCAGGCCAAAGTGGCCATCGCCGGCGAACACCCCTTGCCCTTTACCAAGGGCGAATATGCAATCTGTGAGTATCTGGCTCTGCATGCCGGTCAAGTCTTTACCAAAGAACAATTATATGAAGCAGTTTTTGGTTTTGATGCCGAGGGCGACCCGTCGGCTGTTGCGGAGCACATCAAAAATATCCGCGCCAAGCTAAAAAGCGACGACATCAACCCCATCAAAACTGTTTGGGGGGTGGGCTACAAATGGCAAAAAAACAACGTTCTATAAGCCTTTCCTTGGTACTTTTACGCTTTGCCATCGTAATGCTTGGCAGTATGGTTTTTTGTTGTCTGCTCTGGTATCTCTGCTTTTGGCGGCTTGAAAACGCCGATGTTATTTGCCAGAGCTTTGTCGCCTACCAACAGGTCGAGCAAATGCTGGCTGGGGAACCAAAAACCTTTATTTCTCCAGGTGATAATTTCATCGCTGAATACGCTTTGTTTGACCAAAATGGCAACGTGTTAGAAAGCAACGTAACAGCAAAAAAACTGGAAGACCTGACTGAGTTTTTATCGGTCGCTACCCCCAACCTCAATGTTTTACGATACCCCTATGCGGATGGCAGCACCGTCATCTTTCACTGGTATTACCGAGCCGAGTTTGTTGACCCGCTGTTGCGCGGCATGTTGCCCCCCTTTGAATACCTATGGATGGCAACACTTGGGATCGTCTGGGTGTTTTGTCTGTTGTTTAACACCTTGTGGCTGCGTCGGTTCCTCGCCGCCAAACTAAAACTATTTGGCGAAGTGAGCGCAAAAATCGGCGCACAAGAGCTGGATTTCACAATTCCCCACGCCGGCATCCGGGAGTACGACCAGGCGCTCGATGCGATGGAACATATGCGGGAGGCGTTATACCAGTCCCTGTCTGACCAATGGGCGACCCAACAAAAACGCGAGGCGGAAATAGCCGCACTCGCGCATGATTTAAAAACCCCGCTCACCTTGGTGGGCGGTAATGCCGAACTTTTGCTGGATGAAGAACTGCCTGAGCGCAGCCGTAAAATGGTGGCCACGATTGTGGCCAGCAACGACCGGGCCAAACACTATCTCGTCAGCTTGCTGGAAACCTCTGCCGGTGCCGATGAAAGCTTTAAAGACACCAGTCTACCCACCATGTTTAACGAACTTTGTCAACGTACAATGACGATCGCCGAAACCAGGCGGATTTGCCTGCACACCCAAAATGAACTGCTCGGTGCTGCAAACATTCAGAAAGACCATTTACTTCGCGCCCTCGCGAATGTGATACAAAATGCTATCGAGCATACCCCGGCGGGTAAAAACGTCTATTTGGAAGGCCGCATGGCCGATAACGGCTGGCAAATTACGGTGTGCGATGAAGGTCCCGGTTTTAGCAAAGCAGCCTTACACCATGCCACCGAGCGCCTCTGGCGTGATGATCCCGCACGTGGCGTTGATGGACACAATGGCCTGGGTTTGTGGTTTGCCGCCCAAGTCGTTAAAACCCACGCCGGACAACTGGAACTGCAAAACTGCGATTCTGGTGGGGTGGTTACAATCAAATTTTGCTAAACCGCTAGAGATGACAAGGGGATGATGCTTCGTTTGTTATGAAAAAACAGCACAAAAAAGCCATCCCCATTGAATCCTACCTTAACTGCTTTCTCATGACCAGTCCTTGATCCGATTCCAAAAACACATGAAATCCACTTTTTTTGTACATCTCAAAATAGCCGCCAAAATCTGATGATTGATAACTAGATTCTTTATACGGGTATGCCTCAAGAAAGTCAAATTGGATAGGTTACAATAAACTGGACAATAAAATTGTGGGCAGGTAAAATAAAAACAATAAATAAAGGAGACCTGCCAAATGACCAAAAGACCAAGACGAAGTTTTACCGATGAATTCAAAAACCAGATGGTGCAGTTGTACCTTAACGGAAAACCCCGAAGTGAAATTGTTAAAGAATATGATTTGACGGCATCGTCACTTGATAAATGGATCAAACAACATCAGTCTTCAGGCTCGTTCAAAGAAAATGACAACCGCACTGATGAAGAAAATGAACTGATCCGCTTGAGAAAAGAAAACCAACGTTTATTAATGGAAAACGACATTTTAAAGCAGGCAGCGCTGATCATAGGACGAAAGTAGAGGTTATTCGAGCCAATCAAGACCGCTACTCGGTATCAGCAATGTGCAGAGTCCTGAATATCCCCAAAAGTACCTATTACTACATTTCAAAAAAGACGAATGGAGTCGATCCGATTATCGCGGATGTGATTGAAATTTTCAAAATGAGCCGCAAGAATTACGGAACCCGCAAAATCAAACATCAACTTGAAGTCAAAGGGATTGTTGCTTCCCGAAGACGGATTGGTCGCATTATGCGGGAGAATGGCCTCGTTTCGAATTATACCGTCGCCCAATACAAAGTCCATAAACAACCAGTTAATCAGGATCCAGTCCCCAATGAAGTGAACCGGGAATTTAATGGACGGGCACCACTGGAAGTGGCGGTCAGTGATCTGACTTATGTTCGGGTTGGTGGAAAATGGAACTATGTTTGCCTGATCGTTGATCTTTACAATCGGGAAATTATCGGATACAGCGCCGGGCCAAACAAAACCGCACAGCTGGTTTATGAAGCTTTTGCCAGGATCAGATACCGGTTGGATCAGATTTCAATTTTCCATACTGACCGGGGAAGTGAATTTAAAAATAATGTGATTGACGGTGTTATTGAAACCTTTAATATCAAACGTTCCTTGAGCAACAAAGGCTGCCCTTATGACAATGCTGTTGCTGAAAGCGCTTTTAAAGTCTTCAAGACAGAATTCGCTAACCAATACGCATTTGACAGATTGGATTATTTAAAGCTCATGCTTTCTGATTATGTCAACTGGTACAACAACATTCGAATACACTCGTCATTGGGGTATCTCACACCAGATGCCTATCGGAAATTAGCCCACAAAAAATCTGTCTAAAAAAGTGTTGACAATCCAAATCCATCCTGTTTCGCATCCGTACATACCCGCTCCAATAAAAGCGTCGCTATACCTTTTCTTTTCATCCCCGGAGTAATTACAAAACAAAATATGGATTTCACCTTTATGCCCGAGTCAGATTTCTCTATCGGTACATAATTCATAAATTTCCGCCAACTAACACATTTTAAACAATCTAATTTAGTATTCGCATTGCACCATCCAACCACCGTATCACCACTATAAGCAAGATAACCTTGAATATTATTGCCTTTAACATATTGTATGGCACATTTTCTTCTTTTCTCTGCTGTGGAAAAGTCTTTGCCCTCATAATCATCATTACACCAACACACACAGTAACATTTGTGATCATCCACATTATTATCATGTGGTGTAGTGTCAAAAAAATGTACATAATCTTCTGCAAGATCTGGTATCAACTTGCGTATCTCTAAAGCCATACGTTACCTCCATAAATATAAACAATCTAGGTAATTGCAAAAGTGCCATGAGCTTTGGATGCAGTTTCGCACGAAACAATTTCTACACGGTACGGCGGACAGTTCGATGAACTGTTCGCCTACACGTTACGAAATCGTTTGTGGAAACTGCACCCAAAGCAACCGTTGTTTGATGGTTTTTATTTTTGCACCATTTTTAACCAAAAGTCTGTTAAATATGGCCACTGTTAAAATATCATATACATTTCAACAATGCAATCCATATCACTTAATGTTTATTCGCACAATTTTAAAATTTTTAAGTCAGGCATCCTGCACCTCCTTATCCTCCTTTGTCGATATAAGTTAGCTGGAATTGTCAATATTAGTTCAATCAAAACAAACAAGAAAATTACCAAATTTTGATACAAACAACCAGATCAAGTTTTTAACTGTCAACAGATCAAAAACATTAATTTCAACAAAAATATATGTAAATTTCTACAAAGATTATAATAGCGTAAAATAATTTGTTATTATGAACATATTATTCTAGAATCATAATTTATGAGGAGGATTTTTTAGTTTTTAGTTTAGGTCTAAGTTCTGGTGTACTAAAATATTACTTAGTAATAGACGGTCTTATCAATTATTATAACGCCCCTATACAATTAAGTGGTTATGCTAGTATTATACATTAAGAAATGTTTCATGTTTTTGCCTATTGTTTACAACGAAGAATAACTACGTATATAAGCGATCCTAGAAATAATGGTATTATAGAGAGTATAGTTACCATTTTAAAACTAACTATACCCAGTATATAAAGAAAGTAGGTGCATCCATGCAATTTTTCCTATATATACATGTATTTTTGAACATTGCTTTATTAATATTAATAATTTCCTGTTTAGTTATTCTATTTATATATTTGAAAAACAAGATAAAATAAAAATTTTGTCTTACTCGCTATATTTATTTGCATTAATCCTGATTGGTTCTTCTGTAAAAATTGCCAACTCCTTTACTTCAGAGGCCTTGTACCTGTCAATAAACAGATACAGTTAGGGCAGAATCTTTTGATGCATTTGTAAAACTCACAGATAATCGGATATGCCTCCATCAGGCAATCACGTTACCCTGTCACAATGGCATCATTCCTCCAAAGAAACCGGAAGATATTTCTCCGGGTTACATGGTCATCTTTGCATAACTGCTTCTTTCAGCTGATGGGTTTTTTATCTTCTTTGGTTTTTTTATCGACTCAAGGCCCCTAATACGCCGACAGATCGGTCTCATTTTTAACCACCTTAACCAGCAGCGCCTCTAGTCGCAGGGCACTGCCAACCGTCCCCAGCTTCTCGCCATCCGCGTACCAGTCGGTGCTTTCTGTCGGCAGATCGCCGATATTCTGGACATGGCCGCGGTAGTAAACGCTGTAGCCCGGATACGGCTTGCCATCTTTGTCGGTCAGCACCAGTTTGACCGCTTCAATCCGCAGGCTTTCACCGCGGGTACCGGCGTAGGCGCCGTCTTTCGGCCAATCGGCACAATCGTTCTCGTCATAAAGCCAACCTTTGTTCTCGACATGAACGTTATAACGCAGTTCCATCCCTGTCGGAACAGTATCCTCAAGACGGATTTCAAAACCCTCAATCCGCTTGCTCTGGCCGACCGTCCCGATTATCTCGGGGCTGTTAACCCAACTGCCATCAAGCGGGTAGTCGCCAATATTCTGAATATGTCCGCGGTAAGCCACCGTCACTGATTTTTCCGCAACTGGTGCTTCCGCAACTGTAAAGCTTAATGGTATTGAAACAGAAGCTCCATTTGTTCCGACAATGCTAAGGCTTTCGTTATAGCTACCTGCCGCAAGTCCCAGTTTCGGCTGGATCGTAAAGGTAACTGTTTCATCTTTGTTCAAAAGATTATTACTAAGCGGACCAATTGCGTAATGCTCGGAAGTTGGCTGCGTCAGTGTCACGCTTTGATTTCCGGTGTTTTTCACCATCATGGTCTGGATTGCCGGAGGAGTGGTGTAACCTGCCGTCAAGCTCCCAAAAATAATGGAGCTCGATGTGGTGATGAGGTGCGCTTCCGGATCCGGTGTTGGTGAATCTCCACCAGTGTTTCCACCGTTATTCCCGCTTGATGCTGAGCTTATGTAGATACTCAATGCCTTGATATCATCACCTTCATTGTTTATCGCCTTGACGGTAAAGCTGAACGTACCACTCGTTGTCGGCGTTCCGCTGATGTGGCCAGTATTCGCGTTGAGTGTCAAACCGTCCGGCAGATCGCCGCTGTCGATGCTCCAAGTAATCGGCGAATCGGCGGTAGCAGTAAGGGATTTGCCGTAAGCGGTACCGACCACGCCATTATCCAGTGAATTTGTGGTAATTGCCGGAGCCACTTTGACCGTAATGCTCTGGCTCACCGACTGATGATCGGCAGTGTAGGTGATGTTAACCGCGCTATCGCTGTCGGAAAGTCCGGTGCCATTCGTTGGCGTCGTGGTAATGCCTTTGGTAGCAAAATCAGCATAGGCCACGTCCTCCGTTGTACTGTCACTCTTATGCAGAGTGACCACCAGACCGCTTAGGTCAAGAAGATCACCGGCGGTATAAGTAATCTTGGTCGGTGCCGTTTTTACCGTAACCGATGTCACGGTCACAGTTACTGGATTGACCGTAATGCCCTGGCTCACCGACTGGTTATCGGCGGTGTAGGTAATGGTAACCGCGTTATCACTGTCGGAAAGTCCGGTGCCATTCGTTGGCGTCGTGGTAATGCCTTTGGTAGCAAAATCAGCCCAGGGTACATCCTCCGTTGTGCTGTCACTCTTATGCAGGGTGATCACCAGACTAGTCAGGTCAAGAAGATCACCGGCGGTATAAGTAATCTTGGTCGGTGCCGTTTTTACCGTAACCGATGTTACAGTCACGGCTGCCGGATTGACCGTAATGCTCTGACTCACCGACTGATGATCGGCGGTGTAGGTAATGGTAACCGCGTTATCACTGTCGGAAAGTCCGGTGCCATTCGTTGGCGTCGTGGTAATGCCTTTGGTAGCAAAATCAGCCAAGGGTACATCCTCCGTTGTGCTGTTGCTCTTATTCAGGGTTACCACCAGACCGCTTAGGTCAAGAAGATCACCGGCGGTATAAGTAATCTTGGTCGGTGCCGTTTTTACCGTAACCGATGTCACGGTCACAGTTACTGGATTGACCGTAATGCTCTGGCTCACCGACTGGTTATCGGCAGTGTAGGTGATGTTAACCGCGTTATCACTGTCGGAAAGTCCAGTGCCATTCGTTGGCGTCGTGGTAATGCCTTTGGTAGCAAAATCAGCCAAGGGTACATCCTCCGTTGTGCTGTTGCTCTTATTCAGGGTTACCACCAGACCAGTCAGATCAAGAAGCTCACCGGCGGTATAAGTAATCTTGGTCGGTGTCGTTTTTACCGTAACCGATGTCACGGTCACAGTTACTGGATTGACCGTAATGCTCTGGCTCACCGACTGGTTATCGGCGGTGTAAGTGATGTTAACCGCGCTATCACTGTCGGAAAGTCCGGTGCCATTCGTTGGCGTCGTGGTAATGCCTTTCGTTCCAAAATCAGCCCAGGGTACATCCTCCGTTGTGCTGTTGCTCTTATTCAGGGTTACCACCAGACCAGTCAGGTCAAGAAGCTCACCGGCGGTATAAGTAATCTTGGTCGGTGCCGTTTTTACCGTAACCGATGTCACGATGATAGGTTCTGCCTCTGTTTTAAAGCTGCCGATACTACTTGCTGCCGTTTCATTATCTGCACTGTCAATATATGCACCAGCTTCAAGTGTGACGGTATATGTTGTATTGTAACCCAAGGATAGCGGCGCTGTGCCGTTTAAGAATTTCTGGATCGGAATAGTTGCCTTGCAGTCTGAACCGATTCCACTGACATACCCATCACTTACTCCGATGGTATAGATGTAATCATTCGTGCCGTCAGAAATGGTTACACTTTTGTTTTCTACGGCTGTAACAGTTTCACTAAAGCCCAATACCATATCCGCAGCCGATAGCGCCACACTTGTCCCTGACGGAGCAACGAGATTGGCTGTCGGCACTGTATTGTCTATTTCAACAAACACGCCAGAAATGGTAATGGCATTATCCGGCATCGTGAAGCTGGTGCCGCTGATACTGTAGTCGTGACTACCATCATTATATTCCAAAGAACCGGGCTTGAGCCGGTAGCCGGTAACCGGCGTAATTTCAAGGCTGATTGTCTCTCCGGGCATTCCTTCAATCGTACTTGATGAGATCGTGCCATTTTCTGTTGGACTGACTGTGACAGCTTTGGTTTCAAGCGTCGTCAATGGAGACAACGTTATCCCGCCTGGATTTCCGCTTGGAGAATGATATTCCAGTGACCCTGAGCAACTATCAAATACAGACAATCCAGTTGTAGGCATATGACCATCAAAATATGCGTGATTCAGGGCCGCGCAATATTGAAATGCGCTATTTCCTAAAAATGTAATGCTGCTGGGTATCGTAACGCTGGCCAGGTTGATGCATCCAGAAAATGCACTAACTTCAATAGTCGTAACACTAACCGGTATTGTTACGCCGGTCAGCCCACTACAATTAGAGAAAGCATTATTCCCTATCGAAGTAATGCTACTAGGTATGGTAAACGCGCCAGACAGCCCTGTCGGATAGCAAATCAAAGCGGTTTTATCAAAATTATATAACACCCCATTCAGACTGGAATAATACGTATTAGCTTCATCGACGCTGATTTCAGTTAACCCTGTGCAGCCTGTGAGCGCATTATCTCCTATTGATGTAACACCGCCCGCTATCGCCACTTTATTAAGGCCGCTGCAATAAAAGAAGGCATTATTTGCTATGGCTGTAACGCTGCTGGGTATTATAACTTCGGTCAGCTTGCTACAGTAAGAAAATGCGCTATCCCCAATCGATGTGACCCCGTTCAATATATTGATACTGTTTAGGCTGCTGCAATCTTTGAACGCATAGTCTCCAATAGACTTCACGCTGTCTGGTATCGTTATGCCAGTTAAACTGCTGCATTGATCGAATGCATAAGGCCCAATAGATATAACACTGTTTGGTATCGTGACGCTGTTCAAATTACTGCAATTAGCAAACGCACCTTTTGATATCGATGTAACACCGCTGGGTATTGTTACCCCGGTCAATACGCCGCAATCGGCAAATGCATATTCTGCAAAAGACGTAACCGTGTACCCATCAAGTGAAGCAGGAATTGTGATGTTTCCACCGATCCCGCTGTAACTGGTGATAATACATGATGTGCCATCCGGATTGACCGTATATGTATAAGCTTTGATTGTCGAAAAACTGCCGACATTATTGTTTCCTAAAATAAGATTACTCGCATCATCAATATATGCCCCTGCTTCAATCGCAACAATATAGTCAGCATTGTAGTTCAGCGAAAGATGCTCTGTTCCGTTTAAAAACCTTGAAATCGGAATGGTTGCCGTATCGCCTGACGCAGTTCCCCCAAAATAGTTATCACTTTCTCCGATGGTATAAACATATATATTTGAACCATCAGAAACGCTCACTTTTTTATTTGACAAACCGGTAACAGGTTTGCTGAAGACAATTGAGATATTTGAAAGCGAGATGGGTATGCCTGTCCCTGACGGAAATATCTGATCTACTTTAGGTTCTATGGTATCTAGTTCAAACTCTGCAAAAACTGTAATGTCACTACTTGGCATGGTAAAGATGGTTTCATTGATACCGTGGTAGCTATTATCATAATATTTTAATGAACCCGACTTCAGGCAATAACCTTTTTCCGGAATGATATTAAGGTTGATTGTCTCCCCGGGCATTCCTGAAGTTACACTCGGTGTGACAGTGCCCTTTCCTGTTAAATTAATTGTGATGGTTTTAGTTTCAAGTTCTTGCACTGAGACCGTAGTAAAATATCCCGAGTTTCCATTTGGACAATATAAGTTTGCGTTAGTATTTATAAATGCAAATTGATTCACCTGTAGCTCGCCATCAAAAAATACGTTAGCCAAGTTTGAGCATTTATCGAAAGCAAATGGCTTAATTTCCTCGACACTGCTTGGTATTGTTATATTGGTTAAGCTAGTACAACTATAGAATGCGTCTTTGTCAATAAACGTAACACTGCTGGATATCGTTACGCTACTCAAACTAGTGCAATCTGCGAAAGTTGCGTCTGCAATAGATGTAACACTATCTGGTATTTTTATATTGGTTAGGCTGCTGCATACACTAAATGCATGCGCTCCAATAGATGAGACACTGTTTGGCATCGTTATATTGATCAAACTACTGCACCGATTAAATGCGTAGTTTCCAATCGACGTAACACTGCTGGGTATCGTTATATTGATTAAACTGCTACACCGATCAAATGCGTAGCTTCCAACAGACGTAACACTGCTGGGTATCGTTATGCTGGTCATTTTATTGCAATTAGCGAAAGTCCCTTTTGCAATAGATATAACACCGTTAGGTATGGTCACACTAGTCAAGACATCTTTGTCGGCAAATGCATATTCTGCAAAAGACGTAACCGTGTACTCAACAATTGTAGCAGGAATTACAATATTCCCACCAGCACCAGTGTAACCAGTAATTTGACAGGTTATGCCATCAGGATTGACCGAATATTCATAATCGCCGCTGGTTGCTGCATTTACGGATATATTCCCCACTAAAAGAGTTGTAACAAGAACCAGCAGAAACACAAAAATGCGTTCAAATTCCTTTTTTTTCATAATTTCCTTCTTTCTGCGACCTATTTTATCTAAAACCGTCTTCTACCGCAGCGCAAATAAAATGTTATCCACGGTCATCCGCAGCGGCATCACTTCCGGCTTTCCATCCGGCGCATCCCAGCAAACCGCTTTGTCCTCAAATTTGACATCTTTAAATACTTCCAGATCCCTTAGCCGTAAAAAAGGGATGGTTTCGACCATTCGCTGCATATTAAAGCGGACCTGATTGCCTTCTTCAAAGTCGATCAAAAGCTTATAATCATCTGTCGCATAGACGTTCGTTATTTTCATTTTTCATCTGCCTTTCTTTTTATTTGCAGGCTTTAGCTAAACATCATAAAAACGGTGTTATATTATATTTTAAAGTTGATTTCAGAATAAAAACATCTCCCAAAAGGGGTATTTTTTCCAGCAAGGTGTGTGATTTTTTAAAAAGGGGTCTGAACCTCTGTCAGCTCAATCCCTTTGCCAGGACATACCCACAACATAGCTTCCCGGCTAAAAGGATGATTTATAAAACTAATTCTGGCATATTTAATATCACATATTTCTACTCGGAACTGGATTTTTAACACATCGTATGTGTTATAATATGACAATATTTGAAAGAATATAAAAACAGTTGAGGAACTTCAAATCTAAGACAAAATAATTTGGCAATGGAGATAAGCAATTGAAAAATAAGAAGATTTTAAACAGAGATCGGATTAACACGATGCTGTCCGCTGTTTATGACTATCCGCTCACTATTCTGGAAGCTCCCATGGGATACGGAAAGACAACCGCGGTAAAAAGATTTATTGAGCAGAAAAACCTTCACACCTGCTGGTTTACCTTTTCTGATTTTAAGAATTCGGAGACCGCCTTTTGGGATAGCTTTGCCAACGCTATCATAACAATTGACACACAAGCGGGAACCATCCTTAAATCACTGGGGCTCCCCACGGACGCCCCGCAGATGGGTAAGGTCTTGCAGACACTTGATTCATTGGACTTCGATGGAACCTTTTTAATAGTTCTGGATGATTACCATCTGGCCGGAGATATGCGGCTGAACAGACTGTTTTTACGGCTTGCCCAAGAAGAGCTGGAGGGATTTTCGATCTTGTTGATCACCAGAGATACTACCGGTCTCGACTTCATCGAACTTCTTTCAAAGGGGCAGTGCTGCCTGCTACCAAAACAACTGCTGCAATTTACCCAAGGCGAGCTTCAGGACTATTGCCGGATGATGTTAACTGACATCACGGATACGGATCAACAAATGATCTGGCAGTACACTGACGGATGGATTTCCTTTGCCTATATCATCCTTTTAGGGCTTGAAAGCGGTATCCCCATTGGCATGAGCACCAACCTGGAGAACATGATCGAGCGAACGCTGTTTGCCCCCTATGACGAAAAGACCCAAGGTTTTCTGCTGCTACTTTCGGTCATGGAAGACTTCACTGCGGAGCAAGCTGCATTTGTGACGCAACAAGAAGACGCCCCGCAGCTCTTAAAGCGACTGGACATGGAGAACGCCTTTATCTATTATGAAGAAAAGACGGGCATCTATAAAATACATGCAGTGCTGCAAAACTTCTTGCGGATAAAGCGGCATCTCTCTACGGATGATTTACAAAATTTGTATGGGCGACTAGGCGACTGGATGATGAGCCAGCAGAACCTTCTTGCCGCCTACAGTTATCTGAATCGGGCCGGACGATCAGAGGATATCCTTGCCCATTTGAACAATCCTAAAAATATCCGCAACGAATGGCTTGATTTTGAAGGTGCCGATGAACTATTTAACCGTTTGCCACGTGAATTGTTGTTCCAATATCCTTTCGCCTACCTGTTGCATATGTTCTATTCGATCCTGTTGGGAAAGGAAAATGAAATCCTCGGGTGGAACGAAAGACTTGATGAGCTACAGCAATATTACAAAAACATGGCGGGCCTGGAGGAAACCTATCGGAACCGGATTCTTGGCGAAATCTTAATCGTGCGTAAATTTACACGATTTAATGATGTCGCTGCGATGTGCGCTTCCGATGCGGAAATTATCAGGCTGCTAAATGGCCAGAATTCCTACATTACCTTACCAGAAAATGAATTTACTTTTGCCTCTCCCCACTATCTGTATCTTTATTACCGGGACAAGGGCAGCTTTTGTAAATTGGCAAATCTGCTTTCAGAGGATGTGGGCTACGCCAAATTTTCCGGTGGCTGCGGAACGGGAAGCGACGCCCTTACTTTAGCGGAATACGCACTTGAGACCGGGGATTTAAATAATGTTGCCTCACACTGCCGCAAAGCAATTGCCAAAGCCGAAATAATGTCACAAACCGGCATTGTTATTTGTGCTAAATTTTCTTTGATTCGTCTGCGTCTGATAGAAGGTAACGTTTCCCAGGCACTTCATCTCCTGACCGAGTTGGAGCGTCATGTGGAAAAGATGAACAACTCCGTCTACAACACGACCATTGATCTGTGCAAAGGATATGTATTTGCCTGCCTCGGTCGGCCGGAACAGATTCCCACATGGCTGCAGATTGGAGAAATTAAGGCGGCCGACTTCTACGATCAGGGCATCGCTTTTAATTATATCGTGTATGGGAAAACCCTCCTTGCTCTGGAAAAATACGATGAGCTTGAGTCCCGTATCGAACAGTTTGAGGCGTATTTCTCGGTATTTTGCAACCGTTTGGGACTGATCCACAACCAGATCTTTGAAGCGGTGGCTCGCTGCCGCTTGTACGGATTGGAAGAAGGCGCATCCGTTCTTTTGGTTGCGCTCGACGAAGCACAAGCTGACAATCTGGTGCTACCCTTTGCGGAAAACGCACTCCACATTATGGGGATGCTTAAAATAATTATTCAGGGAAATCCCGGCAATACGTTTTTTAATCATATTCTGATGCTTTGCTGCAGATATGAAAGCGCAATAATGGGTCTTCCCCATCCGGTGGCGACGCTCTCCCGACGCGAAATCAATATTCTATCCCTCGCAGCCGAAGGTTTGAGTAGAAAAGAAATAGCCGCTCGCTTGTATATTGCCGAGGGCACGGTAAAAACGCATTTTAAAAATATTTACCAGAAGCTTGGTGTTAACAGCAAGATGGCGGCCGTAAAGATAGCACAAAACCGAGGTTATCTGAGCATGACTGAATGGTAAGCGATTATTCTATGAATTATTTAGGAGAGATAGTAACTGGAGATTTTGAAAATTAATGATAGCGATAGAACTGACTATATGGAACTACTACTAATTGCCGATGAGCAGGTCAGTATGATCGAAACATATTTGTACCGTGACGATATGTTTACCTTACGTGATGATGATATTAGGGCAATTTGCGTTATTACACAAGAGCAACCTGGCCTTTTGAACTTAAGAATATTGTTACGTGCCTAAATATCAACGCAAAGGATATGGACAAAATCTGATTGCATTTATTGTTGATTACTATCAGCAGTTTGGTAGTGAGTTATCGGTTGGAACGGGCGATAGCCCGACGATCCTTCGCTTCTACGAAAAGTGTGGATTTGTAAAATCACACGTTGTTAAAAACTTTTTTATCGATAACAACGACCGTCCTATGTATGAAGATGGTCAACAATTAGTTGCTATGATTTATTTAAAAAGAAACCTATAAAATAAAGGTTGCGTCGCCCGTGTCATGCAAGCCATCAAAAACTCTCTGTTTAGTTTTTGATCCCCTTACCTGCATTTTTAACTAATTGTAACATCTTAAATATGACAGCATAACGTTATATTATAAATAATATTTCTTAAAGAGCTTAAAAGGTTTCTCATTTTCGGCATGCTTAATAATGGTCCGGATTTGAACAGTGATTGGGATGTATTAAGCCGCTGAAAAATACAGCCGCACCATTTACACATAGCCTTTTTCAATAGCCATGATGTTGTCATAGAGCATGGCATTTACCGGGGTTTTAATCCTATGCTTTTGCCTAAGTGCCACCACCGTTCCGGAGAAAAGTGCCACCTCGCTGGGGCGTTTGGCTTCGACATCTTGCCTCATGGAAGGCTTTCCAGCATCACTTAGGGCATCCACCACGCCCAGCCAGTAGGCGATATCCGCCTCATCCAGCACCACCCCTTCCTGCTTCGCCACCGGAATGACCTCGGCCATGGCGGCAATCATCATGTCCCTAGCTCTACCAGGTTTTTTGACACTGCCAAAGTTCTGGCCATAAACTGAAACCACCTGATTAACCCCGATGTTTAGCATAAACTTGGACCAGATTTTGCGGTCCATCCAGTTATCAATCTGATAGGCGATGCCCACCCGATTAAAAAAAACGTTTAACCCGCATTACTTTCTCATTGGACTGATCATCCGCCCGATTGCCAAAACAGATCATCCCCGATTTGTTGGACAATCTGGGCTCCGAAAAGAATAACCAGGGCATCCAAGCCAATGATTGCTGCTTTTTTATTTCCACACTTACCTCATTTTTCAACCGGATCGGCCCATGTCGCTTTAACCTGATCTGTACTTAAATTTCAAGAAATAACTGGTTTACCAACATTTTAAAAGCTGCTGCCCGGTTGTTTCAAAAATTCTATTTCAGCCGGAGTGGATTCTCGCTTCAGTATCTCATTACGATGCGGAAAATGGCCAAACTGATCAATGATCTGCTGGTGCTTTATTTCATATTCCAGGGTTGCCGGATCGCCCAGCGCTTCAAAAAGCGGCAGCGCGACCTGATGGATGTCCGCCGCTTCTGAATGCATAAACGGCATTAACATAAACCGTTGCCAAGCCTGAGGCAATCGGTTAAAATCAGGATGATGAATGGCTTCCTGAGATAGCACCAGGGCCATTCCATCCTGAGCAAAAGCCTTGGGGTTATCGCGGTTTAAATTTCTGGAAAACTGATCCAGCAGAATAATCTCGGCCAGCCGTCCTTCAATGGTATCCCGCCAGTCTGATAAAAGGCCGTTGCAACCCGCAACCCAGTGATCATAAAAATTTGTTTTAATTGCCAAGTCGAAGGCTTGATTCTTCTGAAACCAGAAGGGCTGGTTTTGGGGCTCGAACCAAAAATCCAGCACTGCTTTCGCATCGGAATGGATGCCCCGCGACGATGAAAAGACCTGGTTGAGAATTTCGGCTTTCAGACTGGCACAGGCCCGATAAAGGGCGTTCGCTTCAGCCTGATATCGGTTTTGAAACGCTTCATCATGAATCAGCCTCAGATTGACATCAATGCCCGATTTTGATGCTGCCGCAGCCGCCTCAGCCAGATAGGCCCCACCAACCAGATCCCCCAATACTCTTGAAAAACTGCCTTTGATCACTTTTTCGATCTGATCAAGCAGGCGGTGACAATGCCTGAGAATCTGAATAAACGGTTCAGTGGCTCCTTTCATCGCGGTTTCATAAGCTTCCCGGTCACCCGCCTTATTCTTTGCAGCTGCAATAACTTGTCCATAGGCCATCATGTCCACATCAGCCAGCATCAGACAGGCCTGGCGAAGCTCGGCACCGATCGCAATGGATTCCACCAGTAAGAGGTTATCCCCACTTTTTCTGAGACTGCCATCACAGGACATTTCCAGCAGCGCTGCTGCCATCGCCGCTGCTGTTGCTGCCGCACTGCCCGCTGCCGGTCCCGGAAAATCACAAACTGACATTTTTACTAAATAATCCGCTACCGTTAATTCACTAATTTTATACATTTTAACCTCCAATCGATTATCTTTACATAGTCTTAGTAGATGGACCAGTTTAGTTCATCCTCATGAGCGTAAAAATCCAAAAACTCCTTATGACCACAGTGAATGTGAGTTGCCACAGCGGCAATCGGACTGTTGGTCAACTTTATCACTTCGTCGTAAATATTGCAAATACCGAGGCCGGTATCAATATGTAAATACACAATCGCAATTTTCAAACCTTTATCTTTTAATGACTTCGTACTCAAAGAAAATTAGGACATATCCAAATATCCCTGATAGATGTTGCTGACATCGTAATGGGGGTATTTTTTGATAAAATCTGCTCTTTATTTACCCATAAACTCCAATATCCCTTTGTATGCAATTTGGATTTCATCCCGCCGCAACTGGCGAATATACGCGGCTACTCGTTTATTAATCGTTTTCATAATTTTGCCTTCAACAAATTTGATTTATTTGTTTCGAATGTATAACAAGAGAAGCCCCCTGCAGAAGTGGCGGTTTGTAAAGAATAAGTACACCTTACGCCTTCTCTTGCAGATATTTTTCGATTTCCAAAAATTCAAGTACATATTCCATACTCTACACGTTCATATTCATCTTGTGTTTCATATGTCTGTTTACCAATATTCCAATAAGTTACTACCATTACAATATCAACAGTAGCATACACTTTCTGTTGTTTATTGTAAAATAAAAATGTAGAATTTTCAAATTAATAATATTTTAGCACAAAGTTACATCGTTTTCGAAAGTATTATCCGTCGCATGAAAAAAATATTTTACTGATAATCATCCGTCCCGGCAGGTTTAAAACGTGTCACTATGTTGTTGCGCCTTTTTGGGGAACAAGAAAACAAGTGGTATCGTTAAAATCAAAATACCGACAGCAGACAAAATTGCATATCTAATGCCCATAACAAATCCGGTAATTCCCGATAAATTTCCAACAGTGCCGAAAAAAATTGTACCGAGAATAGCAATACCGATACTGCTGCCAACTTGCCGCACCATGCTCAAAATACCGGAAGCCGACCCTGCATACTACTCAGAAACTTGTGAAAGACTAAAATTAATGATGCTATTTATACTGTTTTGGCAGTTAAAACCGAGAAGCAAATGATATAAAAGGTATTAGTTAAGGATATTATGTCAAGAATGAACCATTGGATTGGCAGTACGACTGCTCATTTTTTATCACAATTCCCGACAAAGGCATAACAGGGGGACGTTTCGGGATCTGTGAAAAACACCTGTTTTTTTGCTAAGTTCGCAAAATTTGAATGAATGATTTTTAAAATGCGAAATTAATTCTGAAACTGACGAATATTTCAAAAAAAAGAAGCTTTAGCGGTCATGATAGCAGCTAACTTTGCCTGTTTGGGCATCGAAACCAGACCGTATCTTTTTGCCCGGCCAAGACCATGGAATCTTTTGAGCTCCGCATTTTTCCCTTCAATGCTGGCTCTTCTTTTGTATGTCTCTTTGAATTCGTCGGTTTTCTGACTAAGGTCTGTCAAGAGTTTTGTATTTTTACCATCCGTGCTGACCAATTAGCGTAAGTGAGATTTGACCTTGTCTGGGGAATAGATCGACAATTATAGCAGACTTTATTTTCACCGAGCGTTGCCGCATAGACCAGATTTTTCCAAAAACAATCACCCTGCATGACCTTCATCATTAGAACGGAATTTTTTAACAATTCCATTTCGTTTTCAACCTTTTATCATGATTTGTTTTCGGAAAAAGAAAAAATGGATGGGAAATTGAAATCCCATCCACAAACTTTGTCTACAGTCTGATGGCGACAAAATTTTCATGAATTTAATTACTGCATAGACGCTTCTCCGCCAACTTGTAGCGGAATTCCAAGTTCTTTTGTAATGAACTGTGCAACATTTACCCCAAAATCATTATTAGGATATCCCGGCTGTTCTTTCGCCCATTTCAGGAATGCATCCAACCGATCCTTATGATCCAGTAGCTCAGTTCTAAAGATTGCATTAAATCCCAGCGTAGGATTGAGCTGAGCCTCGGCACGTCTCCGATATTCTGCCAGTGTTTCCTCATCAAAGGTTCCGTTCGCTGCAAATATTTCTGCACCCACTTCTGCTGCAATTTTACCACCGAACATTGCTTCAGGTATGCCGTATTCAAATGCGCATTCTGCCGCACTGATCGCATCTCCGATGATGATTGCACCCGGATAATAACTCTTATGGAGTTTTGTACATCCTGGCAGACGCCAACCCCGGTAACCGTAATCATCTAACACCTTGGCATTTTGCATTCTCTTTTTACCAAACTCTGTTGTGGTCACCCAAACTTCAACCAATTCTTCAATAGAAAATTTTGTCTCTCTGAGCGCTTTTTCTGTAATAGTCACTCCGAAAAGCGTTACCCCGCTCTTTTGTGGGCACAACCAGAAAACACAAATCGGACTATGTGCTTCATTTGGTAACGTATCAGGAAGGTAATACTGCTCGATTATATCATCTTCCAGACCTTCAACTCCAGTCATCATGGAACGGAAAGTGTACATAACTCTCTCAGGGTCATTCTCAAACGCTCCAAGCTGATTTGCCAGTACGGAATGAGCACCATCCGCAACGATTACCAGATCTGACTCAATTGTCATTTCTTGATTATGATAATATCCTTTAACGCCCTTAACCACACCTTTTCGCATGATCAATTCTGTGACATCAAAATTCTCCATATAGTCTGCGCCGGCACGCAGAGCACTTCTGCGAATACAGTCATCACCATATCGACGAGGCATATTCAGCTTAGGCTTTGTCGTGAATTCACCATTCGCTTCATCATGAAGAATCAGTCTTACTTTCGTAGCAGACATTTCTGCAACAGACTGCATTTCTTCTAACACTCCCATTTCCTCAAACATCGGATAGCATACAGGAAGATATGTTCCACCACAGGGTTTCTCCCTTGGCCAGGTTTCACGATCAAGTAAAAGAACATCCATTCCTTTCTTGGCAAAATAGAATGCCGCTGTACTTCCGCCTGGGCCAGCTCCAACAACGATTATCTGTCGTTTCATATCATATCTCCTTTCTGACCTCAGCAGCAATCATGGTTATGACGTCGCCTTTCGGACATTCTTTCTGACAAATGCCACATCCAATACATTTCGATACATCAACAATCTCATATCCACAACTCAGGCAGCGTGAAACTTCCTGTTTCGCCTGTTTCTCAGTATAACAGAGATCTACCGCTTCAAAATTATTCACTCGATCTTCTGGTTTTAATACCGGCTGCTCGAAAGTAACCACTCTTCTTCGGTTTGCCGGATAGATCTTTTCATTAAGCGGTGCAGCATAAATTTCATGGCTTAGATCCATATCTCTGAGGGTTCTTCCGCGAAGCTTCGCATCCACTTTGTATGCTGTCTTTCTTCCGGATGCCATAGCATCGATTACACAGTTTGATTCTCCGCTGATATCACCTGCATAGAAGAATGTCTTGTCATCAGATTCCGGCCAGGATTTATCCGCTTCCTGCCCTGTCGCAACTACTGCAAAATCACCTCTGATATCAATGTACTCCTCTTCATTAAAAACAAATTGAAGTTTATTATTTTCATCCTTAATCATTTCCTTCACTTTCACAAAGTGAACATGATCAAAGGTTCCACCACCACCATTAACATACTCCGTCGGGCAATATCCACCAAGAACCTGAACGCCCTCTTCTTGAGCTTCTTTTACTTCCCATGCATGTGCAGGCAGATTATCATATTCCTCAACGGCGACGACCGTAACGTTCTTTGCTCCAAGCCTTACAGCGGCGCGCGCAACGTCCATAGCTACACTTCCACCGCCGATAATTATGCCTTCGCCGCCCTTGATGCGGAAGAAGTCTCCCGGGCAACTGACAAATGTCTGATCATTATTGGCTTTCTGCATGAACTGCATTGCAGTCAGAATCGCATCATTCATATGTCCGGGAATCTTCAGCAGCTTTCCATTTGGCTCTCCTGCAGCAAGAATAACTGCATCATATTCCTTTCTGATCTTGTTAAGATAGAACTTGCCTATCCGTTGGTTTACCTTGATTTCAAGACCTGCTTCTTCAAGCTTTGATATATCGCGCTTCAACGCTTCGCGATCCAGTCGAAATTCGGGGATACCCTTTATTAGCATACCGCCGGCTTCGGCTTCGCCTTCAAAAATCGTGACATTATATCCTTCTCGAGAAAGGAAATGTCCCGCTGCTAGGCCGGCAGGGCCCGCTCCGATAATGGCGATACGCTCCTCATAGTTCCTAGGATATTTTTCCGGCACATAATCCACGTGCTCACTCAGGAAGCGCTTTACTCCTCTTATCATAATTGGCTGATCCACCAATACTCCGCGCTTGCAGACTTCCTCACATGGATGATTGCAGATGAACGCGCAAACTGATGGCAAAGGATTCTTCTTCCAATTCAGTTCGTAGGCTTCCTTTTCTTTTCCGCAGTTTACAAGATTGACATAACCCTGCGGGCTGATGCCCAAAGGACATGCCGTTGTACACGACTGCTTAGTCGTAAAAGCGTCCATCGCATCCAGAGACATCCCCGGCTTATCCGTACAGCCAGGACAGATCCTACAGATTGTTCTCTGGTTCTCCTGAATCGCATCTGTTGGGCATAATTCCCGACAGGTTCCGCAGTTTACACACCGTTTGGGATCAATATGGGCAACTGCTGCTCGTTTTAATACGAATTCCTTGTTCTTATTAGGAACAATCCTAATTTCACTCATTGCGTGTATAGCCTCCTATATATTGTGTACCTTCAGAGTGCGCTGCTCTTAAAACTACACCGATCTTCCGTATATATTGATACTAGTATTAATACTAGTATCAATATATATTTTTTATATTTATTTGTCAATATTTTTTGTATTTTTCTTGTCATCGTGACTATGGATATATGTTCTGGAAATATTAGAACTGTCGCAAATAAATAAAAGCTTTGACCTGTTCTTTGCGGTCAAAGCTTTTATCTATATCTCTATATCCGATCATAGTCCAGTGACTTTTTTCATCTTAAGGCTGCATCCACGCAATGTTATCCCTGCTGTATTCGAGAAAGGAATTGACATCCATCTTTGGTAACCACTCACTTGTGTTCTTCAGCACTTCGCTGATCTGTTCGTCGCTGCAGCCCATCATGCGCATGAAAGTATCGGAAATATTCTGCGTAATATACAGCGTTTCAATATTTAGGGAGTCCTTTTTGATGTAGAGCGCACTTCCTCCAGAAATAGAAAATATAAGAGACTGCCTGAGATTAGCAATCTCAAAGTTATGGACTCCTTCATATTTCATCTCAGAGTGCCAGCAGAAAACAAAATCTGTCAAAACATCAAGCAGTTCATTATTAGTAATGACATTCATCATAAAATAGTGCAGTTCTTTATTTCTGTCAATGAGCTTCCAAAAAAAGGCCGTGAACAACGCCAGCTTGTAATACACAGTAACATCCACGGCAAGCCGTTCTTCGACATATCGAAATAATTGATAAATATATTCCTCCAGAAGGTTGCGTATTATTTCTCTTTTCTTGGGAAAAAAGTTTTGAAGCCGTGATTTGCTGATCCCGACCTGCGCCGCAATATCCTTCAAAAAAACGCTGCAATAATCGTTGTGTGAAAAGAGATCGTATGAGCATTTTAGTATTTCGCTGCGCTTCTCATCATTTATTTGTGACATATAATTCTATACCGCCTTTTTTGCTTTAATTTTATTACATTTCCTGTCTGATTGCAAACGAGTCTGATGAGCGGCCTCAATTCGAAACGAGATAGGTTCTTCCACAAAAACCCGTCAATTAAGTGTAAGCATCCAATAAACACATCGATTTAAAGGGTTTTCAAAGTTTCTCGTTATGTCTTGGGGTGGATGCCGTTCCGAGGTGGGTCCAGAATAATCACATCGGCCTGGTCATGGAGATTGGCCACCTCCACCATCACGTCGCCGACGATAAACTGGCAGTTGTCTCTTAAATGCTATTGATTTTTTCAACCGGATCGGCTCATATTGTTTTAACCTGATCCGTACTTAAATCTCAAGAAACAACCGGGCAACAGTTTAAAAACTGCTACCCGGTTGTTTCAAAAACTCTATTTCCACCGGAGTGGATACTCACAACCTCAATTTTTCGCGGTACACCATGCCACCTGATCCCGCGCGTGGCACCGATGTCCACAATGGCCTTGGTTTGTGGTTTGCCGCCCAAGTCGTAAAAGCCCACGCCGGACAACTGGAACTGCAAAACCGCCGCCGTTTCTATCCGCTGTTAACCAATACCGAGCCGTTTTAGTCTGATTCTCAATAACCCGGGAGATGGTCATCCATCGACCCGTTAGACCGCTTGCCAAATAACATTTTTGTTTATTTCTGCTGCACGTTGTTGCGCTTCTTCAATCGTCTCAAAAACACTATCCTGCTCCACTTCCATACGATTATTGCATTTGAATAGATAAATTGTTTTATCTCCTTTATATTTGCCGATTGCCAAATATTCTACTGGGATTGGTTTGAGCGAATTATCGGTATATCGGATGACTCCAAAATGATCTTTTTGGGATAATAAAATAACCTCGGCACCATCTAAAATCATAACGATCTCCTTTGTGTTAAAATAATTTTTTGCACCTCGATCCGTAATCCATTAAATTGCTCAATCAAGCTTTGCTCGTTTTTTAGCGGATTGAAATTGCGGACAAACAATATTCATATTAGCAGCTTAATATTTTCATTTGTTCCGCTTTACGCCGCCGGTTGTCATTATTAATTTTTTAATATCGCATTGGCAATTAGTCGATCAAATTTTCTGACATCGATCCCTTTTCGCAAATTCACTTTAATATGACCAGCACGAGTCCAGAGTTCAACTTCAGCATTTAAATCAAGTAACTTCCCGGCATTTTCGGTTGACCACATATTAATTGATGTGTATGGCAAGGAGTATATTTCTACTTTTTTGCCGCTCAATCCCTGAGCATCTCTTACGATCAAACGTTTATTAGTAAAAACAGCACTATCTCGAATTGTTTTATAAGCGGCTACCGCTTCTTCACCTTTGACTAACAATTCCTGCACATCTTGTGGAATCGGACACTCCGAAATGAAGGTCCATAATAAAATTTGACTTGTTTCTGCCATTTTAATCTCCTTTTAAATTATAATTTTTTGTTTGCTCTGGAGTAATTGATTATACATTGTTTTTTGTCAAACTATTTAATCTTTACAAAGTGAATGTGATCGTATTTCGCTGAACGTACTCAATCAAGTGTGCCCTGCAACGGGGCTGCCAACGACTTAGAGAATCCGTCCGGAAAATGATCATTTAAAAAGCGTCGTTTGACTAAGCTCGGCTTGAATGGATTTATTATATCATTTTATGGCACTGAAGGAAAGTTTTATCTTGCTCACTATCTCTATTTGCCTTAATCCTGATTGGCTCCAAATTTCTTTTGCTTCGATTAATTCCCCCATTACTTTATCTAAAAATGCCTTTGGCATTCCCTTTTTTCGATAAAGCGGGTGTGTTCCCATAAACTCAATTGCTGCCAAAATTTTCACGATCCTCTTGTTTTTCATATTGCCCTCCTTTTCATCCGTCCTATGTTATCAAATTTTGATAATTTTGTTTTGCTCAATCTTGCGGTCTTTTAAATATTGCGTACACCGTCAAAAAGAGTACGACAATTTTATCTTGTCGTACTCTTTTTATTTTAATCGTAGCTGCTTGCTATAATCTTGCAGTTTATCGCAGATAAGTTTATTTTTTGCCTTTTCAATCAAATCAAAGTGCCAGCCTACATTCCAACTATCTGAAATACTCATTAATGTGGTATCCAGATCCGCTACAGATTTATCTTACCAATTGCGACTAAATTGTTAATGCGCTAAATTACTACCGGTATTTATTATTTATCCGCAATCATTTCGATTTCGACTTTTGCACCGAGTGGTAGCTTAGCAACTTCAAACGCCGCTCTAGCAGGAGCGTTATTTTTAAAATATTGTGCATACACTTCGTTCATCTTAGCAAAATCATCAATATCATCAAGTAACACAGTTGTCTTAACAACATCATCAAATGTATATTCTACTGATTCTAATATTGCTTTGGCATTCTCCAGAGATTGCTTAGTTTGTTCTTCTATCGTTTCGCCTGCAAATTTTCCTGTTGTTGGATCAATTGGCAGTTGTCCCGATACATAGATTGTTGTGCCAACTTTATTGGCCTGTGAATAAGGTCCTATCGCTTTTGGTGCATTTTCAGTACTTATTATTTCTTTCATTTTCATCCACCTCTATCAAAATTATTTTTATTTTAAATCTTCAAACACTTTGGCAATTCGTTCCATCGCTTCTTTAATCATCGGTCTTGGTGACGGGACACAAATTCGTTCATAACCGGTTCCTTCTTCACCAAACATTGCGCCACTTTCTAAAATCACGTTGGCATCAACATAAATTCTTTTCTTTACTTCTTCCGGTGTAAGCCCATATCCCCTAAAGTCCATCCACATAATGTACGTTCCTTCTGGTTTAACGACTTTTACTTTCGGCATATTTTCTTTTAAGAAATTCTCGATATAATCAATATTACCATCAATATAATCAATAATTTGATCCAGCCATTCTTCCCCTTCATTATAAGCAGCAATAAGTGCCGCAATTGTAAATGGTGACGGCATTTCATATCCGCATTCTTTTTTAAATTTATTTCTTAAATCCTCGTTGCCAATCACGACATTTGTCGCATGTAAGCCCGCAACATTAAAGGTCTTGTTAATTGCGGTACACGTAACAAGATGATCAACCTTGTCGGCACACTTTACAATGGGATAAAACTTATTATCTTTTCTAATTAAATCGCCATGGATTTCATCAGCAACAATAATGACATCATTGTTATAACATATTTGGGCTAATCGCTTTAACTCTGCTTTCGAAAAAATTCTTCCCGAAGGATTATGGGGATTACAAAGAATAAATAACTTTGTTGATGCCACTTTTGCTTTTGCTTCAAAATCCTCAAAATCTATTGTGTAGTAACCATCATTGTTTATTAATGAATTATTGATAACAACTCTGTTATTATCCTCGATGGCACTTGTAAATGGCGGATAAACCGGTCTTTGGATGATAACTCCATCTCCGACATTCGTATATGCTCTTACTGCTATCCCCAGTGCTTTTACCGTCCCTGGGCAATAAACAATTTCCTCTTTTTTAATATCCCAGTCATTTCTTCTTTTAAACCAATTGATAATTGCCTCATAATAATCGTCATTAGCCATGGTATAACCAAAAATTCTGTTATCCACGATTTTATGTAATGCTTTTATAACCGGATCTGGCACCGGAAGATCCATATCAGCGGTAAAAAGGGGCAATGTTTCTTCATCATACCGCTCCGTGATCCCTACCATTTTTAAAAAATCTCCGGCATCCCACTTCATCGAACCAGTTCCGCGTCTGTTTACTTTTTCATCAAAATTATACTTCATAATCTGCACTATCCTTTTTTTAATTGTTTATCGCGATAATTTACATAAATGACTGTTACGGCAAAGAAAATTATATTTCCGATAATCAAACCTGTTGATAAATCTTTTATTAAGAAATATGCTTGTACGATATATACCAGTGCCGCTAAACCACACAATATATATAACACAAAATTCTTTACATGCAGCTTAGAATTAAGCCATTCTTCTTTGAAAAGTTTAGGAATTCTAGCGGTTGCTAAAGCTATAAATAAGTTAAACAGATAACTTGGTATCATGACTAAACTTACTAATATATTTAAATCAACATTAAAAATGATCGGGGTAATTCCAATTAGCAAGAAAAATCCCATAATAACGTACGGAAAATCATATTTTTTATCCGTTTTTAATAATATTTTTGGTAAAAATCCATCTTCAGCTACTTGCATAACTGGATATCTTAAACTTGCCAATGTCGAGTTTAATGTACTTCCAAGAGCAAAACATGCCCCGCCAATAATAAATACAACAAATAATGGACTTGGTAAGATTTCTTTAGCTACTACTCCCAAGCTTTGAAAAGCAACTTGATCATAAGGAAGAACCCCGGCTGCTGCGGTACCAATCCCAAAATAAATTATTCCAACGACAATAAATGTCATTATCATCGCTCTTGGTAAAAGTTTCTGCGAATCTTCAACTTCTGAACTATAATTAACGATACATGTTGCCCCTTGTGTTGCAAAAGTTAAAAGCGCAACGGCCGTAAAAAATCCAGTAAATCCATTCGTGAATAATCCTGGTTCGGTAAAATAACCTGGTTGCACTTGCGGTACTCCAAATACAACAAACAATCCCAACGCAATCATCATTACAACAACAAAGATATTTTGTGCTCTTGCCATAAATTTCGCGCCTTTAATACTTATTAGGAAAAAGAATAGAATGGTAAGAATTGAAAATAATTGATGATAATCCCCTAATACTGGTATTAATTGTGTTAAATAATCAATGATTGAAATAGCCATGACCGAAATAGTTAAATTAACTATTATATAGATATATCCAACAATTGAAGCCCATTTCTTTCCTAATAATATCTCTGCTTGAGTTACCAGACCACCTTTTAAATCTACAACTCCAGAAAGTAAAATTGTCGGTACGGTCATCAAAAATGATAATATAATTGCCACAATAAGCGCAATATTTACGCTTCTTCCCGTCATTCCAATCCCAATACCCAACATTACAAATATTCCTGACCCAATTGTGGCACCAACGCCCATTGAAACCAGATCAAAAAACGTCATTTTTTTCTTCATCCATTCTCCTTCTAATTATCAGGCACTTTAAGTTAAATTTTATCGTTTAGCACCTGCACCATTTAGTATAGTTGCTAAACGATATCTTGTCAATTAATAATTTACGTTAAAAAAACTTAGGTTTCAAACTGAATCCCTAAGCTTTTGTTATTTTTACTTATTCTGTTCTTTATCTAACTTGAATATTTTTACTAATATATTTTTACTTCTTTCAAAATCTTCACACGTATAGTTCTCTAACCTTTCAAGATATCTATTATAAGCAATTATGTCTTTTTGTTTATGATAGTTATAAACAATCTTGCCTTTTTCAGTTAACATTAAAACTTTTTTTCGAGTGTCCACATCGTGCATATCCTTTTTGATCAATCCTTTTTTCTCTAATTTATCAACAGTTTGACAAACAGCCCCTTTTGTCTTATACATTTTTGCAGCTATTTCCGAAGATGTAATATTATCGTACGTGCCAATAATATCTAACGTATGAACTTCTATTGTATATAACAAATCATCGGTCCCATAACATCGGGCCTCTTTTTCATAGTCTTGCATTTTATCAAAAACGCCATTGATCACTTTCATTAATTCATAAAATTCTTTATTTTTATCCATTAGTTCCCCTTTTACAATAAATTGTTAAAATCAAGCCCAAAAGCTAGTCTCCTTTCCAATCTAGAAAGCGATGGAAAGGAAAATGCCATTAAAAGACGCACGCTTGACGAGCTAATCATCTTTTAATGGCATTCCAAAATCTATATTTATTATATCAGATTTTATGATAATTGAAAATAGCGAAAAAATATTCGTCCCAATAACTATTGTTCTCGATAATCCGATCTACCAAACTTTAAAGAGGTTTCTCCGTTGAGATTCCTCTTTTTTATCAATAACCAGCAGTACAAGCAAGAAAACCGATTGGCGGCCTGCGCTGAACCTATATCCTTACGGCATCGCTTACAATAATAAAGAAAAATTTTTTCAAAAACTGACATTATTTTATATCAAGCCCATGTGCCGCTTTATTCCATCAATTGCTCCTTCTTTCTGTCCCCTTTGCCGAACAAGTTATCCTTCAATTGTCAAAATATCCGCAAACCCGGTGATTTCAAATACCTCCATAATTGTCTCGTTAACACCGGTGATCAGCAACGTACGGGGAGGAGACATTTTTTTCTGAGCGCTCAGGATAACGCGGAGACCGGCAGACGAAATATATTCCAACTCATCAAAATTAAGTTCCAAAAACGATACCGTCTCTCCAACCAGCAAAATTTCATTCTCTAACTGAGCGGCGGTGGTGTTACCCAGCCGCCCTTTTAGCGCAAGGCTAATCTTTTCGGCTGTTTGATTTTTGGTAATAATCATCTTCTTTTCCCTTCTAAAATAAAACTAGTAGGCGTTTGCGAAATTAAAAAACATCGAACAACGGTTGCTTTGGGTGCAGTTTCCATAAACGATTTCGTAACGTGTCGGCAAACAGTTCATCGAACTGTCCGCCGTACAGTGTAGAAATTGTTTCGTGCGAAACTGGGCCCAAAGCTCATGGCAGTTTCGCAATTACCTAATAAAACTAGGCTTTTTGATAAACCGCTTTCCGATATCACGCCCGCACCTCTATTTCTTCGGTAGGCTGCGCTATTCTTCTGACCACGCGTTGGCATCGTTTGGGGTCGATCCGCTGCTCAATTTTTCCCAGTCCAAAAATAAACAACCAAGTTATGACAAAATAAATAATTGTTGACATCAAAATACCAGCGCTCGATGCAATCGGCAGTGCCGTTTAATTTACATACATATATACAAAAGGCGCTTTCGCATAATCAAAGGCTTTTTGACTTAATCCAAAAATACTTGCGCCAGTTGTTCTAACTGTAGCCGATCCTGTTGACCCGGTTCCGGGTGCTTCTGCCCAGGCGAGTTACAATCATATTGGCATTTAGGACAGATTCCTGTAAAACCTGTGTTTATATCCTCGGAAAAATGCCAAAAGCAATTTGGGCAGATATAATCTTTTTTTGTTACTTCGCTGCTGCCAGTGACTCCTCCCGATACGTTTACAAGCTCCACATCGGAAAGCTCAACGACCGTGTTTTCTTTGCTCATTATAATTTCCACCTTTCTATGGATTCGATTTTTGCCAAAGATCCCAACGCAATTATCAAATGTAATGCTTTCGCACTCTTGTAAATTAGATAATTTTAATAGGACGTAATGTGCCCATCCGAACCAGTAGCCGTCTGACAAGCACTACAAAAAATTGTATGCCCATTAGAATAAACATATTCACTTCCGCATTGTGGACAATGATATTTGATCTTTCGATAACTGCCGCAACAAACTCCGCCTGCTGCAGGTCCACTATGATTATACTTGTCTGCTATATAATATGTATTAGCGTCTATATTCTTAATGCTGCCACAGGTTTGGCATTGAAATACGATGTAATTCGGCTTTGGTATCCTCGTTATAGGGGTATTACCGCCACCAGTAACTTCAGCAAGATCATTGTCTTCTAATTCAATTCTCGCATGCTTTGATATACCATCATGGCCTCCGATATTTACTTCTGCAAGGTTGCTTTCTTCTGCTTTCATTTTTTCATGTTCTGACATAATAATATTTCTCCTTTTCTATCTTTTGTTTTTTTGGTAGTTTCAAAACTACTATGAGCTTTGTGCTCAGGTTCGCACGAGACAATTTTAATATGCAGTGGTTGCCTCAATAAATCCAGTCTCGTCAAGCCGCTGGCGAGCTATCAGTTCGGCGAAATAACCGTTTCGTTCAACCAGCGTTTCATAACTGCCATCTTCAATGATTTTACCTTTATCAAGCACAATAATTCGGTCGCATTGTTTGATTGTCGACAAGCGATGGGCGACTACGATGCGGGTACATTTAAGCCTGTCTAGCGATTCGGATACATGCTTTTGGGTGATGTTGTCGAGCGCACTTGTGGCTTCGTCAAACATGATGATCTTTGGTTTCGGTGCGACGGCGCGAGCAATCATCAAGCGCTGTTTCTGTCCGCCGGATATTCCGCCTGAGCCTTCGGAGATAACGGTGTGCATCCCCATGGGCATGGCGCGAATGTCGGCGGCGATACCGGCAAGTTCTGCGGCCTCCCACGCGTCACTGAGCGTCAGCCACGGCGCAGCAACGACGATGTTAGAATAAATATCGCCCTGCATCAGCTTGCCATTTTGCATGACTACGCCGATATTACGCCTTATGGATTTCAGGTCAACAGTGCTTAAATCCTTTCCGTCATAATAAACGGCGCCTTTTGCCGGCGTTTCAAAGCCCAGCAGCAAGCGCATCAGCGTAGATTTGCCGCAGCCCGTCTGCCCCACAATTGCAATATACTGACCCGCTCTGATTTTTATCGAGAGGTTATCAAGTATCAGTGGCATGTTCTCATTGTACCGAAACGACACGTTAGAAAACTCAATGTTGCCCGATACTTTTGTCACAATTTTTTTCCCGGCCGCCGCTTCCGGCACCGATTTAAGAAGCGGTAACGCCATTTCGAGCGTCGGCTTGATCCCCGCGATGGTGTTGACAATTCCAAACAATGAAGCAAACGCACCGCTTACCATGCCATAGGATATGTTAAATGCCATATATCCCGCGACGCCGACATTCGTCTTGACGGCATAATAATAAATTGCCAGCGTTCCAACGGCGCTGATGAGCGTTGACAACACCCCACTGTATTTCAGAAATACCGGCGGATTATAACTCAGCCGAGCAATTTCCGAATATATCTTGGACCATCTGACAAACGCCCGTTTTTCAGCACCAGTCAGCCTGATTTTCTGAATCCCAGTTATCAGCGAATACTGCATCCCATTTTGTTTTGAGGAAAGCGACATTGTCTTTTGTGAGCGTTTCATGCTTAACAAAGCTGTCACCAATGTAACCACACAGGAACACAGCGTTACCAGCAGCGCGGGCATCACAAGCCCGGGCGAGTAAGCAAAAATCTGTGTTATATACACCAGAGAAAACAGTGACGGCAACCCGACCGACAAAATAGTATTCTGAAGCATATTGCAAATACTGTTGACGTAACCAACACGACTTGCCAGCTCACCGGCAGAATAATCCTTAAAAAATGTAACCGGCATCACGAGTACACGCATCATCGCCGCCGACTGCACGGATATATTAATTTTTGTATTAACCCGCGATTGAATCAGCGAGCTGCTAATCCCAAGCAGCATCTGGCTGATGGTCACTCCCGCATAAAACAACGCAATCGGGATAATCAGCTGGGTAATTCCGCTAGGCACGACAACACTAAAAATCAGCTTGTTAATATAAGGTAGCAGCATCCCGATCAGCATAGTCGCTATCATCGCAAGTCCAACCATCACAAAATCGGAAACCGACAACGTCTGCAGTGTATAAATCAGTAAATCGGCAATTTTCAACGCTTTAAGCGGAAACGGCTTGTAAAAGCAAATCGCCTCATCCGAAAGCTCAGCCGCGTTTTTTCGCGTCACCTTGACGCGCTTACCGGTTTCGTGGTTAAAAAATGTATAACCACTTATCTTTCCGGGAATCAGCGCCACGATGTTTCCTTCTTTGGTTTCACCCAAAAGTGCCCCTACGCAATCCTTATACCAACCATCGTCTAGTTTGATGGAACGTCGCATGAGGCCATGCGGCCGCATGTAATATTCAAGCTTTTCGTTAAGATCCGGAAATTTTTCGTTGGTTTCCTCCATTTTGATATAATAAAAAGCAAGTATCTCTGAAATGGCATTGCTCTCCCGTTTGTCTGCAGCAGCAAAGGAATTTAAAATTGACTTTCCCATAATCACGGAGGATATATTAGCAAACGCCTCGGAAAAACTGTCGTTATCGCTTTTTAACCGTTCTTTGATTTGCTCATCAAACCAGCTCATTTATTTCCACCTCCATCTATTCACAGGTGACAAGCTTTGTATAATAGCCGTCTTTTGCGATCAATTCTTGATGTGTCCCGCGTTCAATGACTTTGCCTTCATCCAGTACCACAATCTCGTCGCAGTCGCGGATGGTGGAAAGACGGTGTGCGACAATAATCAGCGTGATGCCCCGATCCTTAACAGCGCGGGTAACATTGAACTCCGTCTTGGCATCAAGGGCGCTGGTCGCCTCATCCATGATAATGATGGTGGGGTCTTGCGCAAGTACACAGGCAATCTCCATGCGCTGCCGCTGGCCGCCCGAAAAATCGCGCCCCCCCTCCATGATCTTATACTGATAACCGCCGTCGCGCTGCATGATGTCCTCATGAAGCTGGGCATCACGTGCGGCCAGAATCATTTCAAAATCCTCAATGGAACTGTCCCACATTTTGATATTGTTGGCGATCGTGTCTTCAAACAGGATAATATCCTGATCAACAACGGCAACCGAGCCTGTGAAAATTTCGTGTCCGATGGCATTCAGCGGTTTGTCATCAAATAAAATTTCGCCGCTCCACGGTTCGTAAAGACCCGAAATCAACTTTGAAAGCGTTGATTTCCCGCAGCCGGACGCCCCAACAAACGCAACGCTTTTACCGGCTTCAAGCTTCAGATTAAAATTTTTGATAATCGGCTCGGAAAGGCGTGAGTACCCAAAGGTCAGGTCTTTAATTTCCAGCTCCCCAGAAAGCTTCGCGTAGGTCTGCCCGATGCTCTCCGGCTCCCGGTTTGTCTCAGCCAACAACCGGTCAACCGGATACTTCATGACGTCCTCAATCCGTTCCATACTGGTGCGCATTTCCTGCATCATTTGGCCAGTCGCAATGAACTTGTCGACCGGCGACATAAAGGAACTCATAAAACCCTGAAAAGCCAGAATCATCCCGACAGTAAAACTGCCTTGCATGGTGAAAAACACACCGAGCATAAGAATCAGAATATCTACCAGTGAGGATACCATTCCCGGCACGGCCCCGAGGTATTGGTTCAAATGCAAGAATTTTACCGATTGGGTATTAACACTCGCGTGATAACCCGCCCATTTCGAAAAATATCCATTTTCCGCACCGCTCGCTTTGATCGTTTCAATCATCTCGATCCCCGAAACCGTAGCCGCCGAAAGTTTGCCGGCATCGCGCATCTGAACACGGGTCACATTGACCCGCTTGTTGGATATAATCCGTGCGACCACCATATTGACAACAATCGACAAAAGCCCGATAATTGTCAGAATCAGACTGTAACGAATCATAACCACCAGATAAAATATCAGCATGATAAAATCAAGCGCGATCGGCGCAAACTGATTGATAATGGCGGAAGCGATCCCCTGATTACTGCTTGCCCGTCCCACAATGTCGCCCGCCATCCGCTGAGAAAAGAATTCCATCGGTAAGCATAACAGATGCCACATGAAAGTCGCATTTGCGACGATCGCCATTTTTCCCTCGATTTTAAAGCGAAACGCCGTGCTGATAACCTTAACAATCAGTGAAATTAACGTCATCCCCGCAAGCGCAGCGATAAACGGATAAAGCCAATCGGGGTTTTGCCCGGTCAGTAACCGGTCCATAAATATCCGCGAAAACGCAGAATTGATAATCCCCAATATGGAATTAATTAATGTTGTCATCACCACAAAAGCGAAAGCAACACCCGTCCCATGCAGCCGCTCTTTGGCAAAGTCCATCACCGAACGGGGTTTTCCGCCCGGTTCAAAACTTTGTGTCGGCTCGAACATCATGCATACCCCGGTGAACGCTTCATCAAATTCCTTCATCGGCACTTTGACATTACCGTGAGCCGGATCGTTTAAATAAGCAAAATTGTGTTTAAAGCCACATAGCACCACAAAATGATTGAAATTCCAATGGATAATGCAGGGAAATTTTCCTTCCTCTTTGAGTAGCTCCGGCTCATAACGGTAGCCTTTCGCCGTCATCCCGTAGCTGCGCGCCGCTTTTAGTATGTTCCGGGCGTTCGAGCCATCACGCGACACGCCGCAATCGGCTCTGACCCGTTCAAGCGGAAGCCATTTGCCAAAATAGGCCAATACCATTGCCAAAGAAGCCGCTCCACATTCGAGCGCTTCCATTTGCATAACGACCGGCACCTTTGCCACACCCTTAGTGACCGGGGCCGTTTCTACCATTCCGGCCACCTCAATTCACAACAAATGAAATCGGCTTTACTTCATCAAGGGTAATCACCATTTCATACAGTCCATCCGCAACCCCGGAAATTGTCGCTCTGACCGGATAGTTCATTGTCCCGGCTGAAAGAGCCTTCACCGCGTCAGTATCACCGTACTCATCAATAAGCACCGTTAATGAAACCGGGATCGTGGAGACCTCAGAAACAGTACCGGTAGCATCACCGATTTTTACCGTCATCCCCGATTTGATTTTCGCTGCCGAGTTACTGTCCACATAACCAACCGAAATACCGTCTTTTACAGATGCCATCACGGTCAGCGTCGTGGGTATCGTACCAAAAACCGACCAAATCAGCACTGAAATCAACAACACAACAACAGCGCCCAAAACAATCCAGGCGCTGGGATTAGACACTTTGATGTAATCAGTCAGTTGTTCAGGCGACGATATTCGTTCAAGATTTTTCTCTCGGAAAACTTTATTATCCATAACATTCACTCCAGCAGTTATTTCTTAAACATATTAGCACAAGTTTTTTGACAGAAAAATCACCTCAGGGTGAGGAATATTGAAATTTATTTTAATATTTACAAATATCTACTTAAACAGATTCATTCAGTAGCGGTAATCCAAAAACCTCCTGTTTGATATACTCTCAACGAGTAAACAAACAGGAGGTTTTTATACTAAAATCAGCACCTCGCTTTATAATTCTATTTCACATAAAGCTGCATCGGGTAAGAAAGGTATTCCAACGCATCTAGTTTCTCAACGGTAACATATCCTGATGGCGCATTCAAAACAGTCGGGATACGATTTACAATCGTTGCACAGGTATGCTCTACCGTGGCCGGTTTTGACACATAAAATGTCGTATCCGGTTCTCCTTTAATCTTCCAATCACACATGTCACCATCCTCTGGTCCATATACTTTACCAATACATTGGGTTTCAATCACCGGACCCTGAAATGTTTCTGTTGTTACTATGGCACTCATCCCAATACAATCGCCCTTAGGAATCGTTTTTCCTAATGTTTCCGAATATAAGTCGGTGTCATAAAAATAAGGTACACATTTCTGAGATTGAGACCGGATGGTCCATCCCATCTTTGCACAGATGGCTTCATTTGAATTCCAGACATAACTTGGTTCCAGGGTTTCTGGATGCGCAATTTGCGCTTCAAATTCTGCCGCTGTAAATCCGGCTCCATGAGCCTTTGCAAGCGCAAGTCCATAATCTTCTACGTTATAGCTCACCGCTCCTTCAATTCTATCGATCCTATGAACGCCGCCAGCTACACAGCCAATCATGTTAACCCAGTAAATATCTTGCATACCAGTACCAACAACGGTACAATTATGTTCTTTGGCCAGCTTATCTAATTTATTGGTAAGGGGTGCAGCCGTGGTCCATGGATAAATAGCTTCTTCACAGGTAGAAATTACATTAATCCCTCGTTTTACACATTTTTCAAAATATGGATATACGTCTTTGACAAAACTAAATAATGTCACTACTGCAATATTAGCATCACATTCATCAAGCACCGCATCAGCATCGCTGCGGATAGTGACCCCAAGCTTTACACCAAGTCCCGCCCAATCACCTACATCCATACCAACAACATCTGGATTTACGTCAATTGCGCCAACGATTTCTGCACCTTTTTCATACAAATAACGAAGGGTGTATTTTGACATTTTTCCACAGCCATACTGAACAACACGAACTTTTTCATGATACATAATGATAACCTCTTTCCTTTGCTTAATTTTTTATCGCAGGATTATTCTTAATCCTTCTAATAAGAAAGTATAAAGGTTATGCTTACTATAATGTCAATAGGAAATTGATAATTGATTAACAAAATTTTATTGGAATTTGCAATCGTAAATACATCCCTCTCTCACTATTATCTATAATGGGAAGTTCAGCAATCGCTTCGCATAAATAATCGCCACTAATTTGGTATCCTTTATTTTCAATCTGCTCTAATAGTCGTTCTGCATATTCTCTTTCTTTTTGAAAGGAGTCACAATAAATACAGAGATAATTATTAGCCGGAATTTTTGTAATCCGTTCTTCTGCCACAAAATCATTATCCACAAAGACAAACACTTCCGTTGAAATAAAACGATGCTGTCTCAGATTCTGCTGCCGCAATATTGTGCCGGCATTACAAAAATAGATTTGAGGTAAACGATCTGAAATAAGACTTTCTTTAAAATCCCGTAATATCTTCTCATATGTCTCAATATCATGATCATAAATGTTTATTTTAGAATCGATATAATACATCATTCTTTTTTCAATATATTCAAGTAGAATTGTTCCATCCTGCGGAGCACTTTCATATCGTTCTAAACTCTCGATGGTACGTTCCACCGCTCTTCTTTGATATTTAAGTTTTTCAATTTCATCATCAATATGATTCTCTTTTTGTCTCAGAATATTCTTAATGTTAGAAATATTCATATTGTCAAACTGTTCCTTAATATCCTTCAGCTTCATCCCTAAGGATTTCATATATTGGATCATATCCAGATGAGCACTTTGCTTAATATCATAAAAACGATAACCGTTTTCATCATCACGACTATCCGGAACTAGAAGACCCATTTTATCATATAGCCGCAGTGTTTGTTCGGTAACATTGTTTAGTTTAGCCATTTGTCCGATCGTAAGTTGCATTATTTCCCTCCTCTCATAGCAAGTCAATTATACGATAAAAACGTTATTGTAACAATAATGTTTTCACGTGCGACGGTGAATGTGAATGAACAAGGCCCCGTTGAGCAATCCGGTTTGCACGCAAAGAGCCTGAATGATGTTTGTAATCCGCCAAGCAGGAAGATTTCCGTTAAATTTCACGTCTAATTATCTTGTTATTGTTGAACAGGAAACTAAATAATGGTATACTATAATTACATATCGCCAAATTGGAGGATTGCAAATGAACAAAGATGAACAAGTCATGATAGGCTTATGGAACATGTTTAAAAAAAGAATGTGGCTTGACAGCATTAAGATGAAAGCCGGTCTTAAGGGCTATAATCCATCTGAAATACATTGTATCGCTTATATCGGAGAAAATGAAGATTCCAACGTGACAAAGCTGGCGGAATCCTTTGATATGACCAGAGGTGCGATAAGCAAACTATCGAAGAAACTCGTAAAAAAGGGGCTTATTGAAAGTTATCAGAAGCCGGAGAACAAAAAAGAAGTCTATTTTGAACTTACTGAGCAAGGAAAAGCAATCTACACGATTCATGAAAAAATGCACCGGGAGTTTAAAAATAGAGATCAACCTTTTTTTGATCAGGTAACCGAGGAACAGCTTGATGTTATCCTTAGTTTCGCAGAAAAGTATAATGCGCATTTAGACGCGGAAATAAAAAAACTGGGTGTCGCTATGAAATCCGATAACCTATAGTTATACCGATTCCTTTTGAAAATAACAAATCATACCAGAATGCAGCCCGCCCTTATTGAGGACGGACTGCATTGTTTTCGGCAATCTTTATTTTTCAATCAATCGTTATCAAACTATAAACTGATGATGCCCATAACGATGCTTATGTTCATTCATTTGGGAGTTCTTCAAACTTTGGCACTTTCTCAAGCTCAGTGTCCCAGTTTGCTTTGCTTGCATAATAGATATGTCCTTGCGGCTTTATGTTTATATCGCTGTCAAGACTCCCTGCCGGTACAACCAATAATTTTCCATCCATTTGAAGATTTGGCAACGCCGATCCACAATTGGTACAAAAACTTTTTATGTGTCCTCCTGAACGAAAATTAAAAGTTTTAGTTTTTTCTTGACCCGACAGCCATCTTAACTTGGCGGTCGAAGAAAACAAATTGGCAGCATGTGCTGAACCGGTATCCTTCCGGCATCGCTTACAATGGCAAAGAAAAAACTTTTCAAAATCGCCTTCTATTTCAAAAGTAACTTCACCACACAGACATGATCCTAAATATTTCATCATCAAGTCTCCCTTCTAACTCATTCATTGCTTTATTAGGCCTTTTTAGGCGCCTTAATCCGCGCTCATTCTTAATCGCTTCATCCGTCAGATTACAGCAATACATGTTAGCCAATTGTAGCATCTTTGCGCTTTTTTTAAAGGTCTATTTTAACACGGATGTCCGTTTACCAGGCTAACAATCGCTTCAACTATGCCTTTCCATGTTCCCACCGGCATATCATGTCCCATACCTTCGATCAAAAGTAATTTAGCTTCAGGTATTGTCTTCGCTGTATCTTTTCCTGCTTCAACCGGAAACAATACATCTGCGGTTCCATGAATTACCAGTGTTGGAATTGTTAATAACGCAAGGAATCGTCTCCGATCCCCATTAGCAACCAACGCTGCATTTTGACGTATCGCTCCCTGTGGATAATAAGAACGGTCATAACTTTCTTCACAATATCGCCTTGCGCGTTTTTCTTCAAAAGGAAATCCCTTACTCCAGATGTTTTTCCACATCCGTAAACTATAATCAATATATGCATCCCGTCCCGATGGTGGTACTGCGGTAACAATCGCCAATGTTTCCGCTGATATTTGCGGATTATTCGGATTACCGGTCGATGACATAATCGAAGTCAAACTGCATAGACGTGAAGGATGCCGATCGGCAAAAACCTGAGCAATCGCACCTCCCATCGAAGCACCACAAATATGCGCCTTCTTTATTTCCAATGCCTCAAGCAAACCAGCCACATCATCCGCCATATCTTCCAATGTATATGCAAGCTTAACTGGTTTTCCCTCTTGTGCCGCCTGATATATTTCTTTCATATCAGGAATGCCAGACGCTTCGAACTTTGTAGACAATCCGGCATCGCGGTTATCAAAGCGGATAACTTGTAAATTCTCGTTTGCAAGCATTTCACAAAAATCCGGTTCCCAAAAATTTAGCTGTGCCCCGTTTCCTGCAATCAGCACTATTGTTGGATTTGTTTTCTTTCCAAATATTTCGTATTCAATTTGAATGCTATTTGCCTCTACGTGTGCCATATACCACATACCTCCGTTATCTTTCTTAATTAGGTAATTGCAAAAGGGCCCTGAGCTTTGGGCCCAGTTTCACAATTGCCTATTTTCTTAATATTTTTATATTGATATCGTCTTAATTTTAAACGTCTCTCTTAAACCTACCTAACTTCCTGTTTATCCATATCTTTTACAAAAGAACTCATTTTCACCATTTGATGTTGTCGTCGCGAATCAAAAACTTTATAAATTATAAAAACCAGCACAATTTGTATCAGATCAATCACCATCGTTTTGATCCCGGGAAAATTAATCAAGGTAGTAATCGTGTACATTCCACCAAGCACCGTATTTCCCCATGCATGTACCAAAACGCTTGCCCAAATGCTTTTTGTCAGCCGATGTATGGCTGCCAGCGTACAACCCAACGTCATACAATATAGTGTAAAAGCTATAAAATTCATGGAACCCTGGGTTGTGTCTGGCACAAGCCAAAGCGGCAAATGCCAGATACTCCATATAATACTTTCAACGATCGCTGCCACGAGAAAAGAGAACCTTTTTTCAAGCAAAGGTTGCAACAAGCCACGCCAGCCGATTTCTTCCAAGCCGCCACCAAGAATCATCATCGGTATAAACAAAATAAAATAGTACCATGGATTTCCTAAATACGTTTCTTGCACGGCACAAGCCATAAATTGGAGCAAGCAAAAAACGATTATAAAAGATACGGTCCTCCGTAAATTTACGTTATAAAAGATTTGTTTGCAAAATCCTCGAAACGTAATCGCATTTTCTTTTTTTAAAACGATCAACGCCGCATAAGCAGGAGCCATTCCGGCTCCTAATCCAATTACTGCATAGTGAAAAAACTGACCGAAAATACCGGACAACAACGCGAAATGATAAGCAGCAATTAAAATAAACTCCGTCCCCCAGGCAATTACAAAAGTATAAAATAAAAACGTCCCCATCTTTTTACGCTCAGCTGCGGTATATCTCGTGGTTTTATTCATTGAACACGCTCCTTTAAACGGATAAAATTTTTCGTTTTACCCTGGTTTTACATTTAGATTTTTACAATTCTAAGTGTAAGCGTGGTGGCCACCCCCAAGTCAAGGAGCAAAATAATTTTATTTTAAAGGCAGCCATACTTCATAAAAGTTCCGTTCTGTTTGTTTAGATAAAGCCATAAAACGAATGAAAATATAAACCACACCTTTAAATTCAACATGATGGTTTTTGGCCCACTCGTGACAGGAAAAAAACATCTCCTCCATAATAGAATCATCACGATTGTCCGCTTCTAATACCGTATGCAGACATTTTCCGCTTTCCAAATACACTTTGCCCGGTGGTTGTTCTCTTTCCGTTGCTGGTTGTTTTACAATACACATGCCACTCCCCTTATAACCGGAAGAGTCAAACGTGACGGCCCGAACTAGATTGGATAAAATATCGTCTTGCTGCAAATTCAGATATTTCAGCACACTGTTCTGATACTCGTTCAAAGAAGATACCGCATCAAATGATTCCAGCACTAAATATAGGGGCATTTCCTTTACCGAAAATTTTCTCTTTGAATTTATGGCATCTTCATAAAACTGCTTTGTATCGTTTAGCTGTTTGATCATCAGCTGTTGTTCCTGAATGGCTTTTTGTAAGTCCACTATTTTTCTATTCAGATAGTGCAAATTATCTGATTGCTTGTCTGACTGTATTAACTCTTTAATTTCAAGCAGTGTAAAACCGCGCTTTTTATAGAAATCAATTGACAAGAGGTGTGAAATATCAGCAAAAGTAAACTCTCGATATTGGTTACTTGAATTCCGCCCCGGAGTAATCAAACCGATTTCTTCATAATAACGTAACGTTTCTCTCGTCAGACCAAGATTTTTATACAAATCGTTGGCGCGATAAACCGTAGCGTAGTTATCGATATCCCGGCGATTGATTTTGGGGAATTCACCTTGCAAATCCTGATTATCTTTGATCACAATTTTATCTTTTGAACATCTTTTATCAGCCGGTTTTTTTGTATTCACAGGAATCAGCCAAGTTTTTCCTTTTTTTATTGCCCCGTTAAGCTTCTTTGTTTTACAATAATAGGCAATCATGCGATTGGAAACGCCCCATTTTTTTGACAATTCTGTAGCCGTTAAGTAGTCCATTTTACGTCCCTCCATCAACATTATATTTCAGATATCGGAAATATTCAATGATACCACCAAACTGTTAACCATTTTCTCCTGTTGACTGAATCAGAAATGGCTGACGCCCTATAGGGACCTGGATCATTTCTTGCTCGTTTTGGCTGAACTTTTATCGGCAATTCCATATTTGAAATTTAGCTGGTGCTCTTTCACCCGTGTATCTCTCTATATATTGTATATTGCTAAAAAGTTCTTCATATTTCATTATGCAAATGCAAAATCGGGCCAACCAAAAACATTTCTTCTAAGGTAATTACGCGTTCTTTTTTTCGATCTAAATTTTTCAGGATAGCTTTTAAAGTATCTGCCGCTAAATGTCCGAATACAATGTGTACTATCAAGTTAACCTCCAAATTTACCATTAACCGATACCACCAGCCAATTTAATTCCACATCGTTTACTGATTATACCATATCGTTGTCTTCAATCAAAAGCTTTGCAAATTACAAAACCAGCGCCTTTGGCCAAATAACTAGCGGCCTTTTTGCCGGGGCCGAAGAAACATCGCGCTATATCCGAATAGAAAGGATACGATAACGCCGCCCATAAAAATTTCCGGTCTTCGGCTTGTAGCCGCAATGATTGGCAAAACCGCAATGTATGTGCAGACAGATATTCCTACCATCTGTAAAAGGCCTGTGAACAAAAAAGCAAGGCTCAGTCCTGAAATACCGGACAGCAATCCGACAGCGAGTATTACTGCATAACTGTATAACCCGAACAACACACTCAAAATTCCCATTGCCAGCAGTTTTCCAAATAACAAACATTGTAAAACGCTATCTTGGGTGTCTCTCATGATGATTTATGGCTTTATTATAAATAATATGCTAAAATTTATAATATATACTCATATTCTATGCGGGGTTTAGCGTTTCGCAAACGCCCATTAACCTTAAAGATAGAAAGGAAACAGTATGATGTCGATCGAAATTTATTACTTCAGCGGAACAGGTAACTCCCTGTTTATTGCAAAAGAACTAAAAAAGCGGCTTCCGGATTGCAGCCTTGTTCCTATCGTGCATGTTCTTAGAAATGGTAACCTCGAAACGACTGCCGATGTGATTGGCATCGTCTTCCCGATTTATGCCACGACCTATCCCGATGAGATTCGACAATTTATTGAATTGCTTAATTGTAATAAGGACACCTATATTTTTGCTGTTTCAAGCCGTAAATGCCGTCCGCGCGTGTTTACGGCGCTTGGAGAAATGCTGGCCCGAAAGGGCGGCACACTTTCCGCAGCGCGCTCTATTTCGATGCCGCAGAATTATATCCCCATTTTTACGGTCGAAACACCGGACGATATTAAAAGACAGGATGAAGCGCTTTTTCAAACATTGGACGTATTTGCGCAAACCATCCTCGAGCGGCGGATTTCCATCGAGCAGGCCCAAAAGCTTCCGCTCCACGTTGCGATATTATATTCGCTCGTTCGGCTTTCCTCTTTTCTGAACAGAAAAACGCGTTACTTTAATTTGGAAAACAGATTTTATGCAGATGACAAATGTATCGGCTGCGGTCTTTGCGAGAAAATATGTTTAGCCGAGCGTATCCGGCTGGACGACGGGCGACCCGGCTGGGATGCCCACATCCCTTGCCGGCTATGCCTGGCCTGCATACACTTTTGTCCGGCCGAAGCGATTCAGATCAAGGGAACGAAGACAGAAAAAAACGGACGGTATCATCATCTGGGAATTACTGCGGAAGATATTTCACATCAGAAATAAGTTCTTTATCCCAAGTGGCTAAGAACACGGCCATCAATAAATGCGTTTAAACCATATATAAAAAAAATGCCGGACGCGAAGGCCACAATTGGCAATCGCGCCCGGTATTTCTATATCTATTGTTATCTTTCTTCGTCCGTAAAATCAAAGCTCTGTACCGATGCTCGATATGTAAATGCAAATAAGGTTTGTTTTCTCAACAGGAAAGCGTTCCATCCTCTTCTAATTTCACTTCCTGTTGTTATTTTGCAATATACCTTACTTTTATTGATATGACAAACAAAACGTTCCCCCCATGCCATCCGTGATGATTGCAATAACCTAGCAGTTTATTGCATGTAAGATTATTTTTTTTGCCTTTTCAACCAAATCAAAGTCGCCATCCTGCATTATCCATTGTAATGTAAGACCATTTGAAATACTCATTAATGTGGTATACAAATCGTCTACAGACTTACATTCAGGAAATTCTTGATTATTAATTCCCTTTCTAATTAAATCAATAATTAAATTTTTAAAATAAACATTATCAGGAATAACAGGAGCATTTTTATCGTAAAGATATTCCCGGTAAATTTCACGCGTTATGGAAACACCGGCATCCATTGCGGCTTGAAAATATAACCGCATAATGATCCATAGTTGTTCTTCGACAGAGTTTTGGGCTATAACCAGCTTAAGGATTTCTTCAGTACCATAATGAACTTTATCAAAGTAGTGGATAATCAAATCGTGTTTAGATTGATAGTGATAGTAAAATGTAGTTTTTGATATATTACATGCTTTACAAATATTCATGATCGAAACATTATTATAACCATATTCTTTGAAAAGTTGGGTGGCTTTTTCCCAAATTTGCAATTTCATGGAATCCGACATAGTAGCCTCCGTATTAGTGATTGTTTAATTATACTGTAATAACGTTTAAATTCAAAGTTTTTATTTGATTGCTAAATACTTGACAAATTATATTACTGTGGTAATATAATTTGTATTAAATATAGTACTGCGGTAATATAAAATTAAAAAGTAAAAGGAGAATTTTTGTGGAAAAATTTAAAAAAGCCTTAAGCCCAATTACAATCAATAAGACAGAATTTAAAAACCGTTTGTGGATTCCCCCTATGGGAACAAGTGCTGTAAAACCTGATGGTACACCAACTGACGAAATGGTGGCATACTTTAATAATATGGCCAAAGGTGGTGCCGGTGCTGTTGTGATTGAAGTTGCCGATGTTGATGAACATCGCCGTTATAATAGCACGGTGATTGGTTTGTTTGATGACAAATTTGTGCCTAAATACAAAGAAATAATTGATGCTATTCATGACGGTGGTTCGAAAGCAATCAGTCAACTACTGCATGCAGGTCCAATTCCACTTATTAAGAATGATCCAACCCAGTATGGCCCGCTTTGCGCATCTTCTGTTCCTCATATCTATAACCTGAATGCCATTCCGCAGGTCATTACAAAAGAACAAATGGCAGAAATCAAACAAATGTACATCGATGCGGCTCTCCGCGTAGTAAAAGCAGGTGCTGATGGTATCGAAATTCATTGTGCACATAACCACGGATTGCTTGGTACCTTTGTTTCTTCAATTCACAACAAGAGAACAGATGAATATGGCGGAAATCTTTCTTGCAGAATGAAATACCCTCTTGAAATCGTTGAAGCGATCAGAACAGCAGTAGGTCCTGATATGGTTCTTGGCGTTCGTATTTCCGATTCTTATGATGAAGTTGATGGACTTACCTTGGAAGATTCCTGCCGAATGTCAAGAATGTTTGAAAAAGCCGGTATTAACTATATTCACGCATCTCATGGTTCATTGATTTCAATTGCAAACATTCAACCACCACACGGCTCCCCACAGGGAATTTTTGCCAATAGAGCGAAAGTAATTAAGGAAGCTGTTAATATTCCTGTTGGTACGATCGGTCGAATTACTGACCCGGAGATTGCTGAAGAATTGCTTGAAACTGATGTAGCCGATATTATTTTTATGGGTCGTGCTCTTATTGCCGACCCAGAACTCCCAAACAAAATTAAAGAAGGCCGCGAAGCCGATATTCGACCATGTATAGGTTGCAATGAATGTGTAACATCAGCAATGTATGGTAATGGCTTCTACTGTGCAATGAACACTTTATCCGGACACGAATTAGAGGGTGGAGTCGTTTATGATGAAAACAATAAAGGTAAAAAAGTTTTAGTGATTGGCGGTGGCCCGGGTGGTTTGGAAGCTGCAGGTCAGGCTGCAATTGCAAGCTACGATGTAACCCTTGTTGAAAAAGCAAATTATTTAGGCGGCCAGTTTGAATTAGCAGCATATCCACCAACAAAGCAGGAATTTGCTTGCGGGGTTAAATATCTTATTAATCAGGTTGAAAAACATGGTGTCGATATCAGACTTAACACCGAAGCAACCAAAGAGTATGTTGTTGATATGAAACCAGATGCTGTTATTGTTGCAACAGGTGGTCAACCTATCGAAGCGAAATGGATAACCGAAAGTGGTCATCCTAATGTTATCGGTGCCTGGGATGCAATCAGAGGCAACGCCAATATTGGCATTAATATCGTCGTTATTGGCGGTGGTCTGGTTGGCTGTGAATGTGCCGATATGATTGCTGCTCCGCGTTATTATAGAAAACAGTATGCAAGAAAAGTTACTGTCATTGAAATGAAAGATTATGTCATGATCGATGATTATACGCCACAACGTGACCAGTTGATGACTAGATTGATGGATAAAAATGTTGATATCCTGGAAGGTGCCGCAGTAAAAGAAATTTCTGCTGATTCTATTACTTATGTTAAGGATGGCGAAACAAAAACAATCAAACATGTTGACACAATTATTTCAGCAGTTGGTACTCAATCTGTAAATGGTCTTACGGAAGAACTTAAAGTTTTGGATATTCCTGTTATTACAATAGGTGATGCCGTAGCACCGAGAAAGATTCATTTAGCAACTCGTGAAGCCGCTGAAGCAATTAAAAAACTTAAAATCTAAATACTTATAAATAACCCGCCCTCCGTTTGTAGTATCTTCTTAGGTAATTGCGAAAATGCCGTGAGCTTTAGGCCCAGTTTCTCACGAAACAATTTCTACACTGTACAGCGGACAGTTCGATGAACTGTTCGCCTACACGTTACAAAATTGTTTGTGGAAACTGCACCCAAAGCAACCGTTGTTCGATGTTTTTTACTTTCGCAATTACCTATAGTATCTTCTTTGATGCTCCCTTTTTCGGCGCATTATCTTGTTAATTAGCAAATTATAAGTGTCAAAACAGTCCTGATTTAGTCAAATTATTCTGGATGAATCGGTCTTATCAACTATGATATAATGATTAAACATTAATCACGATAAGGAAGCAAAAACCATGGTTCATCTGGAACACTTTTCTGGCCATCCGTTAGATTACATCACAGAATTTCACATATCTGAAAAAATCCGCATTGACAGCTGCCCTCATTGTTATTCGCGCCGGCGGCTCCATCTTCATGGTGTCTATCACCGGCACATCATCTGGTATGATGATGTCTTTTCCATTCCGGTACAGCGCCATTACTGCATTCATTGCGGCAAAACGGTCAGTATCCTGCCTTCCTTTTGCCATCCCGGCTTTCAACTGGCCCTTCCTTTTCTATTGGAACTGCTTTGGGCCTTCTTTAACAGAATTCCTTCAGCCAATACTTTAGCGCCTCAGCATCGGCACTTTATCACCCGACGTTTTCTACTTTGTATGAATCGGCTGATTGAGTATTTTCGCATCTGCCATGATCCGTTACTCGTCTTTCCTGATTTTTGGCATAAAAAAGCCATAAAGCTTCTTGAAATGGTCTACTCGGTGGGGAAGCCCCACATCTTCGGCAAAAGATATCACGATCATTTTAAGAAAGGATTTATGGCACATTAATTGTACCATCCTTCCGCATTTTTTTGAAGTCCTGTTTATCCCACACAGCGTTTGCTTTGCCTTTTATCGATTGATCCGTTATGCTCTACTTACCTGGTTTTATGGATCCTTAAAACCTCATATTTTTAAAATCGGAGGTTTTTACAATGACTGAAAAAGACAAAGAACTGATTGCTTTATTTCGCTATGGCCTGATTGCACCGTTACTCACGGATACCGTCTCATCGCACACGGCTTATCTGGATGAGATCAGTGCAAAAACCCATGATGTTCCCCATTATGGCATCCGCACTTACAACCGCAAAACCCTGCTGGAATGGCACCGGCTCTATCGGCGCCATGGTTTTGATGCGCTCAAGCCGAAGGTTCGGACAGACAAAGGGTCGTCCCGGGCTTTACCGGCGGAATCAGTGAAGCTGTTGCTTAAGCTGAGAAATGAGAACATCCATTTATCCGTAAAGTTGTTCCAGGAATGGCTCATTTACGAAGGTCACTTCACCAGCTCCGACTGTTCCTATTCGACGGTGTATCGGCTGCTCAAAAAACATCAGCTGTTAAAGCCATCGGCGATCGATACGTCGGACCGCCGCCGGTTTGCTCATATTGACATCAACACCCTGTGGCAGACCGATGTCTCCCACGGCCCGTATCTGTCCCTTAACGGCAAAAAGCGCAAAACTTATCTGATTGCTTTTATCGATGACGCTTCCCGGCGGATTACCGGGGCTCAGTTCATGCTGGCTGAAAAGAATGAAGATCTCCTTCATGTCCTTAAATCTGCTTTACTTACCTGCGGTAAGCCCACCATGCTTTATGCGGATAATGGCAAGATTTTCCGTTCCCACCAACTCAATACTTCCTGTGCCACCCTGGGGATAGCGCTGGTCAATACCAAGCCTTATGATCCAAAAAGCAAGGGCAAAATTGAGCGCTTTTTCAAAACGGTCCGCAGCCGTTTCTATCCACTTTTGACGGATGCTGACTTAATGGATCTTGATGTCCTTAACCAACGCTTTGAGGCCTGGCTGGCTCGGGACTATCATCACAAGGTTCATTCGTCCATCAATGAAGCACCGATGGTCTTCTATATGCGGGGGAGTGACCGGATTAAGCATTTTTCGGATCCCCGGATCATTGATGAAGCCTTTCTGATCCGGGTGACCCGGAAGGTCAAGTCGGATGCCACCATCTCGCTGCACAACGCCCTTTTCGAAGCGTCGCCGATGTTTATTGGTAAGAGCGTGGATATCCGTTACCCCAATGAATCCCCGGATAAAATCTATATCTATGAAAACAGTGTCCGGATTTATACCTGTAATAAAGTCATTATGAAGGACAATGCGGTTGCCAAACGCAATAACAATCCCATCAGCTACAGTTCCTTAGGCGGTGTGCCGCATGTATAA
Protein sequences of DBSCAN-SWA_4 >NC_016894|3880300:3943307|3888419_3889388_+|WP_014357723.1|DBSCAN-SWA MYEWHQQIQTIVDEIDNCIKNYNGEALTLHFLSHKLGYSEFYTTRKFKEIAGMQFRDYLRHRKLAFALKEVRDRNKSFLDIAFDYGFSSHEAFTRAFKGTYGVTPSEYRKKPTPVILRTKINPFDRYFFGFGEIGMIKSTADVKIYFVTIPAHKFLHIKNYQSNGYWDFWQKQNLIPGQDYETICGLLDSIKGKLDDDGGSESNSGSGQLMAYINDPNGRLCDWGIPRTECYGARLPFDYNGEIPSQMLMLDVPEAEYIVFEHGPFDYEQENRSVEATMEKAMATFDFSGTGYCFDPSPGRIIYLLYNPERFWKYIRPVRSK >NC_016894|3880300:3943307|3942047_3943307_+|WP_014354547.1|integrase,transposase|DBSCAN-SWA MTEKDKELIALFRYGLIAPLLTDTVSSHTAYLDEISAKTHDVPHYGIRTYNRKTLLEWHRLYRRHGFDALKPKVRTDKGSSRALPAESVKLLLKLRNENIHLSVKLFQEWLIYEGHFTSSDCSYSTVYRLLKKHQLLKPSAIDTSDRRRFAHIDINTLWQTDVSHGPYLSLNGKKRKTYLIAFIDDASRRITGAQFMLAEKNEDLLHVLKSALLTCGKPTMLYADNGKIFRSHQLNTSCATLGIALVNTKPYDPKSKGKIERFFKTVRSRFYPLLTDADLMDLDVLNQRFEAWLARDYHHKVHSSINEAPMVFYMRGSDRIKHFSDPRIIDEAFLIRVTRKVKSDATISLHNALFEASPMFIGKSVDIRYPNESPDKIYIYENSVRIYTCNKVIMKDNAVAKRNNNPISYSSLGGVPHV >NC_016894|3880300:3943307|3937161_3937971_+|WP_041669537.1|DBSCAN-SWA MSIEIYYFSGTGNSLFIAKELKKRLPDCSLVPIVHVLRNGNLETTADVIGIVFPIYATTYPDEIRQFIELLNCNKDTYIFAVSSRKCRPRVFTALGEMLARKGGTLSAARSISMPQNYIPIFTVETPDDIKRQDEALFQTLDVFAQTILERRISIEQAQKLPLHVAILYSLVRLSSFLNRKTRYFNLENRFYADDKCIGCGLCEKICLAERIRLDDGRPGWDAHIPCRLCLACIHFCPAEAIQIKGTKTEKNGRYHHLGITAEDISHQK >NC_016894|3880300:3943307|3932608_3933013_-|WP_041669529.1|DBSCAN-SWA MKYLGSCLCGEVTFEIEGDFEKFFLCHCKRCRKDTGSAHAANLFSSTAKLRWLSGQEKTKTFNFRSGGHIKSFCTNCGSALPNLQMDGKLLVVPAGSLDSDINIKPQGHIYYASKANWDTELEKVPKFEELPNE >NC_016894|3880300:3943307|3880300_3880726_-|WP_014357715.1|transposase|DBSCAN-SWA MEVNIAYRWFLGLDFNEPVPPFTTFGKNYGWRFKDTGFFEQIFMKILDQCTKAGYVDQKTLFIDGTHVKARANRNKSQKVLVRKTVRHYEAALQEEIARDREAHGKRPLRDKNGPDDPDDSANFFILGQQYKNPTTAPLQR >NC_016894|3880300:3943307|3895379_3896711_+|WP_014357730.1|DBSCAN-SWA MAKKQRSISLSLVLLRFAIVMLGSMVFCCLLWYLCFWRLENADVICQSFVAYQQVEQMLAGEPKTFISPGDNFIAEYALFDQNGNVLESNVTAKKLEDLTEFLSVATPNLNVLRYPYADGSTVIFHWYYRAEFVDPLLRGMLPPFEYLWMATLGIVWVFCLLFNTLWLRRFLAAKLKLFGEVSAKIGAQELDFTIPHAGIREYDQALDAMEHMREALYQSLSDQWATQQKREAEIAALAHDLKTPLTLVGGNAELLLDEELPERSRKMVATIVASNDRAKHYLVSLLETSAGADESFKDTSLPTMFNELCQRTMTIAETRRICLHTQNELLGAANIQKDHLLRALANVIQNAIEHTPAGKNVYLEGRMADNGWQITVCDEGPGFSKAALHHATERLWRDDPARGVDGHNGLGLWFAAQVVKTHAGQLELQNCDSGGVVTIKFC >NC_016894|3880300:3943307|3923513_3923657_-|WP_014357754.1|DBSCAN-SWA MSTIIYFVITWLFIFGLGKIEQRIDPKRCQRVVRRIAQPTEEIEVRA >NC_016894|3880300:3943307|3931980_3932460_+|WP_014357761.1|DBSCAN-SWA MNKDEQVMIGLWNMFKKRMWLDSIKMKAGLKGYNPSEIHCIAYIGENEDSNVTKLAESFDMTRGAISKLSKKLVKKGLIESYQKPENKKEVYFELTEQGKAIYTIHEKMHREFKNRDQPFFDQVTEEQLDVILSFAEKYNAHLDAEIKKLGVAMKSDNL >NC_016894|3880300:3943307|3894729_3895404_+|WP_014357729.1|DBSCAN-SWA MSKLLVVDDDLEMLSLVRAALEKDGHQIDTEADAAIVQPARCQLYDLLLLDVMMPNEDGFSLCRRIRAEVDCPILFLTAKAEDAALVQGFGLGADDYIKKPFSLAELRARVNAHLRREVRQPTHTLSRGGVRFDMQAKVAIAGEHPLPFTKGEYAICEYLALHAGQVFTKEQLYEAVFGFDAEGDPSAVAEHIKNIRAKLKSDDINPIKTVWGVGYKWQKNNVL >NC_016894|3880300:3943307|3882236_3882389_-|WP_169314715.1|DBSCAN-SWA MTVEVALSILLKEGYSIKIGTGKNTAYILNENLKESETSPSHKNSQKKRL >NC_016894|3880300:3943307|3919016_3919394_-|WP_041669509.1|DBSCAN-SWA MKEIISTENAPKAIGPYSQANKVGTTIYVSGQLPIDPTTGKFAGETIEEQTKQSLENAKAILESVEYTFDDVVKTTVLLDDIDDFAKMNEVYAQYFKNNAPARAAFEVAKLPLGAKVEIEMIADK >NC_016894|3880300:3943307|3926839_3929020_-|WP_052307121.1|bacteriocin|DBSCAN-SWA MVETAPVTKGVAKVPVVMQMEALECGAASLAMVLAYFGKWLPLERVRADCGVSRDGSNARNILKAARSYGMTAKGYRYEPELLKEEGKFPCIIHWNFNHFVVLCGFKHNFAYLNDPAHGNVKVPMKEFDEAFTGVCMMFEPTQSFEPGGKPRSVMDFAKERLHGTGVAFAFVVMTTLINSILGIINSAFSRIFMDRLLTGQNPDWLYPFIAALAGMTLISLIVKVISTAFRFKIEGKMAIVANATFMWHLLCLPMEFFSQRMAGDIVGRASSNQGIASAIINQFAPIALDFIMLIFYLVVMIRYSLILTIIGLLSIVVNMVVARIISNKRVNVTRVQMRDAGKLSAATVSGIEMIETIKASGAENGYFSKWAGYHASVNTQSVKFLHLNQYLGAVPGMVSSLVDILILMLGVFFTMQGSFTVGMILAFQGFMSSFMSPVDKFIATGQMMQEMRTSMERIEDVMKYPVDRLLAETNREPESIGQTYAKLSGELEIKDLTFGYSRLSEPIIKNFNLKLEAGKSVAFVGASGCGKSTLSKLISGLYEPWSGEILFDDKPLNAIGHEIFTGSVAVVDQDIILFEDTIANNIKMWDSSIEDFEMILAARDAQLHEDIMQRDGGYQYKIMEGGRDFSGGQRQRMEIACVLAQDPTIIIMDEATSALDAKTEFNVTRAVKDRGITLIIVAHRLSTIRDCDEIVVLDEGKVIERGTHQELIAKDGYYTKLVTCE >NC_016894|3880300:3943307|3934188_3935043_-|WP_014357764.1|protease|DBSCAN-SWA MNKTTRYTAAERKKMGTFLFYTFVIAWGTEFILIAAYHFALLSGIFGQFFHYAVIGLGAGMAPAYAALIVLKKENAITFRGFCKQIFYNVNLRRTVSFIIVFCLLQFMACAVQETYLGNPWYYFILFIPMMILGGGLEEIGWRGLLQPLLEKRFSFLVAAIVESIIWSIWHLPLWLVPDTTQGSMNFIAFTLYCMTLGCTLAAIHRLTKSIWASVLVHAWGNTVLGGMYTITTLINFPGIKTMVIDLIQIVLVFIIYKVFDSRRQHQMVKMSSFVKDMDKQEVR >NC_016894|3880300:3943307|3936713_3937040_-|WP_145972755.1|DBSCAN-SWA MRDTQDSVLQCLLFGKLLAMGILSVLFGLYSYAVILAVGLLSGISGLSLAFLFTGLLQMVGISVCTYIAVLPIIAATSRRPEIFMGGVIVSFLFGYSAMFLRPRQKGR >NC_016894|3880300:3943307|3930887_3931721_-|WP_041671669.1|DBSCAN-SWA MMQLTIGQMAKLNNVTEQTLRLYDKMGLLVPDSRDDENGYRFYDIKQSAHLDMIQYMKSLGMKLKDIKEQFDNMNISNIKNILRQKENHIDDEIEKLKYQRRAVERTIESLERYESAPQDGTILLEYIEKRMMYYIDSKINIYDHDIETYEKILRDFKESLISDRLPQIYFCNAGTILRQQNLRQHRFISTEVFVFVDNDFVAEERITKIPANNYLCIYCDSFQKEREYAERLLEQIENKGYQISGDYLCEAIAELPIIDNSERGMYLRLQIPIKFC >NC_016894|3880300:3943307|3924612_3926823_-|WP_014357756.1|bacteriocin|DBSCAN-SWA MSWFDEQIKERLKSDNDSFSEAFANISSVIMGKSILNSFAAADKRESNAISEILAFYYIKMEETNEKFPDLNEKLEYYMRPHGLMRRSIKLDDGWYKDCVGALLGETKEGNIVALIPGKISGYTFFNHETGKRVKVTRKNAAELSDEAICFYKPFPLKALKIADLLIYTLQTLSVSDFVMVGLAMIATMLIGMLLPYINKLIFSVVVPSGITQLIIPIALFYAGVTISQMLLGISSSLIQSRVNTKINISVQSAAMMRVLVMPVTFFKDYSAGELASRVGYVNSICNMLQNTILSVGLPSLFSLVYITQIFAYSPGLVMPALLVTLCSCVVTLVTALLSMKRSQKTMSLSSKQNGMQYSLITGIQKIRLTGAEKRAFVRWSKIYSEIARLSYNPPVFLKYSGVLSTLISAVGTLAIYYYAVKTNVGVAGYMAFNISYGMVSGAFASLFGIVNTIAGIKPTLEMALPLLKSVPEAAAGKKIVTKVSGNIEFSNVSFRYNENMPLILDNLSIKIRAGQYIAIVGQTGCGKSTLMRLLLGFETPAKGAVYYDGKDLSTVDLKSIRRNIGVVMQNGKLMQGDIYSNIVVAAPWLTLSDAWEAAELAGIAADIRAMPMGMHTVISEGSGGISGGQKQRLMIARAVAPKPKIIMFDEATSALDNITQKHVSESLDRLKCTRIVVAHRLSTIKQCDRIIVLDKGKIIEDGSYETLVERNGYFAELIARQRLDETGFIEATTAY >NC_016894|3880300:3943307|3889472_3890066_-|WP_041669496.1|DBSCAN-SWA MIENIKHTILVKAIELFKKNGFDNVTINEICESCNITKRTFYYHYDSKKTLLLDYFSLVDEDIETSLKDIDNEITWLDKCWKIKQIHIKGIANLNTDILKNLIKIDMEQQNYMFNFRLNDFDPNLKRLRQMVIEYTYKAQETGELDADTSAEDLSYCFASAFLGLAVNWSSTGGNYDLVEAAKKYFDLIYKKTSRSK >NC_016894|3880300:3943307|3917874_3918249_-|WP_041669503.1|DBSCAN-SWA MAETSQILLWTFISECPIPQDVQELLVKGEEAVAAYKTIRDSAVFTNKRLIVRDAQGLSGKKVEIYSLPYTSINMWSTENAGKLLDLNAEVELWTRAGHIKVNLRKGIDVRKFDRLIANAILKN >NC_016894|3880300:3943307|3899849_3905132_-|WP_169314716.1|DBSCAN-SWA MTSVTIPNGVISIAKGTFANCNKMTSITIPSSVTSVGSYAFDRCSSLINITIPSSVTSIGNYAFNRCSSLINITMPNSVSSIGAHAFSVCSSLTNIKIPDSVTSIADATFADCTSLSSVTISSSVTFIDKDAFYSCTSLTNITIPSSVEEIKPFAFDKCSNLANVFFDGELQVNQFAFINTNANLYCPNGNSGYFTTVSVQELETKTITINLTGKGTVTPSVTSGMPGETINLNIIPEKGYCLKSGSLKYYDNSYHGINETIFTMPSSDITVFAEFELDTIEPKVDQIFPSGTGIPISLSNISIVFSKPVTGLSNKKVSVSDGSNIYVYTIGESDNYFGGTASGDTATIPISRFLNGTEHLSLNYNADYIVAIEAGAYIDDASNLILGNNNVGSFSTIKAYTYTVNPDGTSCIITSYSGIGGNITIPASLDGYTVTSFAEYAFADCGVLTGVTIPSGVTSISKGAFANCSNLNSVTIPNSVISIGPYAFDQCSSLTGITIPDSVKSIGDYAFKDCSSLNSINILNGVTSIGDSAFSYCSKLTEVIIPSSVTAIANNAFFYCSGLNKVAIAGGVTSIGDNALTGCTGLTEISVDEANTYYSSLNGVLYNFDKTALICYPTGLSGAFTIPSSITSIGNNAFSNCSGLTGVTIPVSVTTIEVSAFSGCINLASVTIPSSITFLGNSAFQYCAALNHAYFDGHMPTTGLSVFDSCSGSLEYHSPSGNPGGITLSPLTTLETKAVTVSPTENGTISSSTIEGMPGETISLEITPVTGYRLKPGSLEYNDGSHDYSISGTSFTMPDNAITISGVFVEIDNTVPTANLVAPSGTSVALSAADMVLGFSETVTAVENKSVTISDGTNDYIYTIGVSDGYVSGIGSDCKATIPIQKFLNGTAPLSLGYNTTYTVTLEAGAYIDSADNETAASSIGSFKTEAEPIIVTSVTVKTAPTKITYTAGELLDLTGLVVTLNKSNSTTEDVPWADFGTKGITTTPTNGTGLSDSDSAVNITYTADNQSVSQSITVNPVTVTVTSVTVKTTPTKITYTAGELLDLTGLVVTLNKSNSTTEDVPLADFATKGITTTPTNGTGLSDSDNAVNITYTADNQSVSQSITVNPVTVTVTSVTVKTAPTKITYTAGDLLDLSGLVVTLNKSNSTTEDVPLADFATKGITTTPTNGTGLSDSDNAVTITYTADHQSVSQSITVNPAAVTVTSVTVKTAPTKITYTAGDLLDLTSLVITLHKSDSTTEDVPWADFATKGITTTPTNGTGLSDSDNAVTITYTADNQSVSQGITVNPVTVTVTSVTVKTAPTKITYTAGDLLDLSGLVVTLHKSDSTTEDVAYADFATKGITTTPTNGTGLSDSDSAVNITYTADHQSVSQSITVKVAPAITTNSLDNGVVGTAYGKSLTATADSPITWSIDSGDLPDGLTLNANTGHISGTPTTSGTFSFTVKAINNEGDDIKALSIYISSASSGNNGGNTGGDSPTPDPEAHLITTSSSIIFGSLTAGYTTPPAIQTMMVKNTGNQSVTLTQPTSEHYAIGPLSNNLLNKDETVTFTIQPKLGLAAGSYNESLSIVGTNGASVSIPLSFTVAEAPVAEKSVTVAYRGHIQNIGDYPLDGSWVNSPEIIGTVGQSKRIEGFEIRLEDTVPTGMELRYNVHVENKGWLYDENDCADWPKDGAYAGTRGESLRIEAVKLVLTDKDGKPYPGYSVYYRGHVQNIGDLPTESTDWYADGEKLGTVGSALRLEALLVKVVKNETDLSAY >NC_016894|3880300:3943307|3909921_3911073_-|WP_014357737.1|DBSCAN-SWA MYKISELTVADYLVKMSVCDFPGPAAGSAAATAAAMAAALLEMSCDGSLRKSGDNLLLVESIAIGAELRQACLMLADVDMMAYGQVIAAAKNKAGDREAYETAMKGATEPFIQILRHCHRLLDQIEKVIKGSFSRVLGDLVGGAYLAEAAAAASKSGIDVNLRLIHDEAFQNRYQAEANALYRACASLKAEILNQVFSSSRGIHSDAKAVLDFWFEPQNQPFWFQKNQAFDLAIKTNFYDHWVAGCNGLLSDWRDTIEGRLAEIILLDQFSRNLNRDNPKAFAQDGMALVLSQEAIHHPDFNRLPQAWQRFMLMPFMHSEAADIHQVALPLFEALGDPATLEYEIKHQQIIDQFGHFPHRNEILKRESTPAEIEFLKQPGSSF >NC_016894|3880300:3943307|3917446_3917704_-|WP_014357746.1|DBSCAN-SWA MILDGAEVILLSQKDHFGVIRYTDNSLKPIPVEYLAIGKYKGDKTIYLFKCNNRMEVEQDSVFETIEEAQQRAAEINKNVIWQAV >NC_016894|3880300:3943307|3933163_3934051_-|WP_014357763.1|DBSCAN-SWA MAHVEANSIQIEYEIFGKKTNPTIVLIAGNGAQLNFWEPDFCEMLANENLQVIRFDNRDAGLSTKFEASGIPDMKEIYQAAQEGKPVKLAYTLEDMADDVAGLLEALEIKKAHICGASMGGAIAQVFADRHPSRLCSLTSIMSSTGNPNNPQISAETLAIVTAVPPSGRDAYIDYSLRMWKNIWSKGFPFEEKRARRYCEESYDRSYYPQGAIRQNAALVANGDRRRFLALLTIPTLVIHGTADVLFPVEAGKDTAKTIPEAKLLLIEGMGHDMPVGTWKGIVEAIVSLVNGHPC >NC_016894|3880300:3943307|3911635_3911746_-|WP_169314719.1|DBSCAN-SWA MYATVDIVMVVTYWNIGKQTYETQDEYERVEYGICT >NC_016894|3880300:3943307|3887620_3888112_-|WP_014357722.1|DBSCAN-SWA MMIREYKPDDCVFLAQLFYDTVHTINAKDYTKEQLDVWATGTVDLNEWNRTFLDHTTLVAVDNGVIVGFADLDGKGYLDRLYVHKDYQGKGIATALSNELERRAKEEVVCFKTEASITAKLFFEKIGYTVQAKQIVVRGGVPLTNFKMIKDKDVINRSSITKR >NC_016894|3880300:3943307|3898129_3898597_-|WP_014357731.1|DBSCAN-SWA MALEIRKLIPDLAEDYVHFFDTTPHDNNVDDHKCYCVCWCNDDYEGKDFSTAEKRRKCAIQYVKGNNIQGYLAYSGDTVVGWCNANTKLDCLKCVSWRKFMNYVPIEKSDSGIKVKSIFCFVITPGMKRKGIATLLLERVCTDAKQDGFGLSTLF >NC_016894|3880300:3943307|3917218_3917404_+|WP_145972754.1|DBSCAN-SWA MDTHNLNFSRYTMPPDPARGTDVHNGLGLWFAAQVVKAHAGQLELQNRRRFYPLLTNTEPF >NC_016894|3880300:3943307|3909680_3909833_-|WP_169314718.1|DBSCAN-SWA MEIKKQQSLAWMPWLFFSEPRLSNKSGMICFGNRADDQSNEKVMRVKRFF >NC_016894|3880300:3943307|3880741_3880975_-|WP_145972751.1|DBSCAN-SWA MLTKREQDIREQIQIATMDALVPKDHILRLVDEAIDFDFIYDLVEDKYCSNNGRPSLDPVVLIKLPVIYYLCGIRSM >NC_016894|3880300:3943307|3923749_3924016_-|WP_014357755.1|DBSCAN-SWA MSKENTVVELSDVELVNVSGGVTGSSEVTKKDYICPNCFWHFSEDINTGFTGICPKCQYDCNSPGQKHPEPGQQDRLQLEQLAQVFLD >NC_016894|3880300:3943307|3941364_3941901_+|WP_014354546.1|DBSCAN-SWA MVHLEHFSGHPLDYITEFHISEKIRIDSCPHCYSRRRLHLHGVYHRHIIWYDDVFSIPVQRHYCIHCGKTVSILPSFCHPGFQLALPFLLELLWAFFNRIPSANTLAPQHRHFITRRFLLCMNRLIEYFRICHDPLLVFPDFWHKKAIKLLEMVYSVGKPHIFGKRYHDHFKKGFMAH >NC_016894|3880300:3943307|3938292_3938850_-|WP_014357768.1|DBSCAN-SWA MSDSMKLQIWEKATQLFKEYGYNNVSIMNICKACNISKTTFYYHYQSKHDLIIHYFDKVHYGTEEILKLVIAQNSVEEQLWIIMRLYFQAAMDAGVSITREIYREYLYDKNAPVIPDNVYFKNLIIDLIRKGINNQEFPECKSVDDLYTTLMSISNGLTLQWIMQDGDFDLVEKAKKIILHAINC >NC_016894|3880300:3943307|3897012_3898132_+|WP_145972736.1|transposase|DBSCAN-SWA MTKRPRRSFTDEFKNQMVQLYLNGKPRSEIVKEYDLTASSLDKWIKQHQSSGSFKENDNRTDEENELIRLRKENQRLLMENDIFKAGSADHRTKVEVIRANQDRYSVSAMCRVLNIPKSTYYYISKKTNGVDPIIADVIEIFKMSRKNYGTRKIKHQLEVKGIVASRRRIGRIMRENGLVSNYTVAQYKVHKQPVNQDPVPNEVNREFNGRAPLEVAVSDLTYVRVGGKWNYVCLIVDLYNREIIGYSAGPNKTAQLVYEAFARIRYRLDQISIFHTDRGSEFKNNVIDGVIETFNIKRSLSNKGCPYDNAVAESAFKVFKTEFANQYAFDRLDYLKLMLSDYVNWYNNIRIHSSLGYLTPDAYRKLAHKKSV >NC_016894|3880300:3943307|3924111_3924525_-|WP_041669514.1|DBSCAN-SWA MSEHEKMKAEESNLAEVNIGGHDGISKHARIELEDNDLAEVTGGGNTPITRIPKPNYIVFQCQTCGSIKNIDANTYYIADKYNHSGPAAGGVCCGSYRKIKYHCPQCGSEYVYSNGHTIFCSACQTATGSDGHITSY >NC_016894|3880300:3943307|3892526_3893228_+|WP_041669499.1|DBSCAN-SWA MSEYILKTNHVSKKFKQTDAIKDLSMSVRKNSVYGLLGPNGAGKSTFLKMVTGIIRPTSGEIIFNNHPWTRKDLLNIGSLIESPPLYENLTAFENLKVRALLLGISTDRCHQVLQQMDLMATNNKKVANFSLGMKQRLGIALALLNNPQLLVLDEPTNGLDPFGIEELRVMIKNFAASGIAVIISSHILSEIQQVADDIGIIYNGSLLYQDKIDAHKNLEQLFMDIIRKERAS >NC_016894|3880300:3943307|3906051_3908538_+|WP_014357734.1|DBSCAN-SWA MKNKKILNRDRINTMLSAVYDYPLTILEAPMGYGKTTAVKRFIEQKNLHTCWFTFSDFKNSETAFWDSFANAIITIDTQAGTILKSLGLPTDAPQMGKVLQTLDSLDFDGTFLIVLDDYHLAGDMRLNRLFLRLAQEELEGFSILLITRDTTGLDFIELLSKGQCCLLPKQLLQFTQGELQDYCRMMLTDITDTDQQMIWQYTDGWISFAYIILLGLESGIPIGMSTNLENMIERTLFAPYDEKTQGFLLLLSVMEDFTAEQAAFVTQQEDAPQLLKRLDMENAFIYYEEKTGIYKIHAVLQNFLRIKRHLSTDDLQNLYGRLGDWMMSQQNLLAAYSYLNRAGRSEDILAHLNNPKNIRNEWLDFEGADELFNRLPRELLFQYPFAYLLHMFYSILLGKENEILGWNERLDELQQYYKNMAGLEETYRNRILGEILIVRKFTRFNDVAAMCASDAEIIRLLNGQNSYITLPENEFTFASPHYLYLYYRDKGSFCKLANLLSEDVGYAKFSGGCGTGSDALTLAEYALETGDLNNVASHCRKAIAKAEIMSQTGIVICAKFSLIRLRLIEGNVSQALHLLTELERHVEKMNNSVYNTTIDLCKGYVFACLGRPEQIPTWLQIGEIKAADFYDQGIAFNYIVYGKTLLALEKYDELESRIEQFEAYFSVFCNRLGLIHNQIFEAVARCRLYGLEEGASVLLVALDEAQADNLVLPFAENALHIMGMLKIIIQGNPGNTFFNHILMLCCRYESAIMGLPHPVATLSRREINILSLAAEGLSRKEIAARLYIAEGTVKTHFKNIYQKLGVNSKMAAVKIAQNRGYLSMTEW >NC_016894|3880300:3943307|3885499_3885733_-|WP_145972752.1|DBSCAN-SWA MLRNGHMLSIKGSAGNVKELAFGFGTILWTNTVIDGKLAINGRGKQQVVTIILTSGWNGGKYFGQKCGDKIVSRVAK >NC_016894|3880300:3943307|3929030_3929513_-|WP_041669518.1|DBSCAN-SWA MDNKVFREKNLERISSPEQLTDYIKVSNPSAWIVLGAVVVLLISVLIWSVFGTIPTTLTVMASVKDGISVGYVDSNSAAKIKSGMTVKIGDATGTVSEVSTIPVSLTVLIDEYGDTDAVKALSAGTMNYPVRATISGVADGLYEMVITLDEVKPISFVVN >NC_016894|3880300:3943307|3884139_3884775_-|WP_193353297.1|DBSCAN-SWA MMKIRNEAVADYQQVEAITRKSFWNLYVPGCIEHYLVHVMRSHKDFLPELDLVIEIDHQIIGNIMYTKTKLIDETGAEKDILTFGPVCILPEYQKKGYGKKLMEYSFKQAVALGYEVIVIFGNPNNYVSRGFKSCKKYNVTLENGTYPAAMMVKELKPEVLDGRKWVYYQSPVFEIDEQAAIRFDAGLESREKKYQPSQEEFFINSQAIIP >NC_016894|3880300:3943307|3935160_3936198_-|WP_041669534.1|DBSCAN-SWA MDYLTATELSKKWGVSNRMIAYYCKTKKLNGAIKKGKTWLIPVNTKKPADKRCSKDKIVIKDNQDLQGEFPKINRRDIDNYATVYRANDLYKNLGLTRETLRYYEEIGLITPGRNSSNQYREFTFADISHLLSIDFYKKRGFTLLEIKELIQSDKQSDNLHYLNRKIVDLQKAIQEQQLMIKQLNDTKQFYEDAINSKRKFSVKEMPLYLVLESFDAVSSLNEYQNSVLKYLNLQQDDILSNLVRAVTFDSSGYKGSGMCIVKQPATEREQPPGKVYLESGKCLHTVLEADNRDDSIMEEMFFSCHEWAKNHHVEFKGVVYIFIRFMALSKQTERNFYEVWLPLK >NC_016894|3880300:3943307|3920617_3921913_-|WP_014357751.1|DBSCAN-SWA MKKKMTFFDLVSMGVGATIGSGIFVMLGIGIGMTGRSVNIALIVAIILSFLMTVPTILLSGVVDLKGGLVTQAEILLGKKWASIVGYIYIIVNLTISVMAISIIDYLTQLIPVLGDYHQLFSILTILFFFLISIKGAKFMARAQNIFVVVMMIALGLFVVFGVPQVQPGYFTEPGLFTNGFTGFFTAVALLTFATQGATCIVNYSSEVEDSQKLLPRAMIMTFIVVGIIYFGIGTAAAGVLPYDQVAFQSLGVVAKEILPSPLFVVFIIGGACFALGSTLNSTLASLRYPVMQVAEDGFLPKILLKTDKKYDFPYVIMGFFLLIGITPIIFNVDLNILVSLVMIPSYLFNLFIALATARIPKLFKEEWLNSKLHVKNFVLYILCGLAALVYIVQAYFLIKDLSTGLIIGNIIFFAVTVIYVNYRDKQLKKG >NC_016894|3880300:3943307|3886087_3887551_-|WP_014357721.1|DBSCAN-SWA MEKNDGGWNLENSYAQLPEIFYAPLKLATVSAPKLVILNQPLARYLGLDAEALIGQAGIDILAGRALPTNAKPIAQAYAGHQFGYFTMLGDGRAMLIGEQITPTGERLDIQLKGSGRTPYSRSGDGKAALGPMLREYLISEAMHYLGIPTTRSLAVITTGDPVYRETPLKGAILTRVAASHLRVGTFEYAAQWGTTADVKALADYAINRHFPWIQSKPNVYLGLFDEVIKAQASLIAKWQRVGFIHGVMNTDNVTISGETIDYGPCAFMDRYDPETVFSSIDLQGRYAYRNQPNIDLWNLARLAETLIPLIDENQKEAIKIVEASLQNFALLYQADWLQGMRAKLGIANEEPQDELLIAELLGLMKRYQADYTNTFVDLTLDRTSSSALYESEAFKDWHDRWKARLERQVQTNQDSKQLMKQTNPVVIPRNHQVESVLQAANDHDDFKPLQRLLEVLQAPYDYHLLNQEYMRVPELSNSPYKTYCGT >NC_016894|3880300:3943307|3890224_3892222_+|WP_014357725.1|DBSCAN-SWA MKSKTDALFQPMSIGTMRVKNRIAMAPMGLHSKNPDGSFNQDAVDLYVARAKGGVGLIVTTGIACQNKLDSMRATLATAGDSYVTASKKLTDEVHKYGAKIVLQIANGAGRNRKNGFFLDNDPISSSENPNVWHPEMMHRALTTAEVQFLIQSYANGAYVAKQAGFDGVEVHALHEGYLMDQFSMECTNRRTDQYGGSLENRLRYATETVQAIKEKCGKDFPVLIRYSVKSYMKGFGLDKGALPGEKFEEFGRDLEESAKIAKILQDAGYDALDADNGTYESWYFAHPPVYMPKACNLADAQYIKQFVDIPVICAGKMDDPEIGSEAVASGSIDAISVGRALLADPEWPNKVQTENFDDIRPCIGCHAGCLERFFAGKNTSCAINPQVGMEKKYEIKPADVKKNIMVIGGGISGMEAARISALRGHKVDLYERTNSLGGVFIPASSMSFKEEDKKLIQWYVKQLKDTGVTIHMNTEVNENIIKAAKPNSIFVATGSTARKLNINSASSEKVITAVEALLETKPIGDKVVVIGGGLTGVEIGYSLTKDKGKHVEILEMLPDILQVQDLNAANKTMLQNLVLSHNIGVHTNAKVTAITSKGVQFEENGATVELDADTIITSIGYISDKSLYEAIHDCGAEVYLIGDASKVSNLMGAIWDAYEIAMAI >NC_016894|3880300:3943307|3905420_3905669_-|WP_014357733.1|DBSCAN-SWA MKITNVYATDDYKLLIDFEEGNQVRFNMQRMVETIPFLRLRDLEVFKDVKFEDKAVCWDAPDGKPEVMPLRMTVDNILFALR >NC_016894|3880300:3943307|3911883_3912087_-|WP_014357740.1|DBSCAN-SWA MVRQVGSSIGIAILGTIFFGTVGNLSGITGFVMGIRYAILSAVGILILTIPLVFLFPKKAQQHSDTF >NC_016894|3880300:3943307|3914135_3915842_-|WP_014357743.1|DBSCAN-SWA MSEIRIVPNKNKEFVLKRAAVAHIDPKRCVNCGTCRELCPTDAIQENQRTICRICPGCTDKPGMSLDAMDAFTTKQSCTTACPLGISPQGYVNLVNCGKEKEAYELNWKKNPLPSVCAFICNHPCEEVCKRGVLVDQPIMIRGVKRFLSEHVDYVPEKYPRNYEERIAIIGAGPAGLAAGHFLSREGYNVTIFEGEAEAGGMLIKGIPEFRLDREALKRDISKLEEAGLEIKVNQRIGKFYLNKIRKEYDAVILAAGEPNGKLLKIPGHMNDAILTAMQFMQKANNDQTFVSCPGDFFRIKGGEGIIIGGGSVAMDVARAAVRLGAKNVTVVAVEEYDNLPAHAWEVKEAQEEGVQVLGGYCPTEYVNGGGGTFDHVHFVKVKEMIKDENNKLQFVFNEEEYIDIRGDFAVVATGQEADKSWPESDDKTFFYAGDISGESNCVIDAMASGRKTAYKVDAKLRGRTLRDMDLSHEIYAAPLNEKIYPANRRRVVTFEQPVLKPEDRVNNFEAVDLCYTEKQAKQEVSRCLSCGYEIVDVSKCIGCGICQKECPKGDVITMIAAEVRKEI >NC_016894|3880300:3943307|3893227_3893989_+|WP_014357727.1|DBSCAN-SWA MLQAYLNAENLKFKHSLFRKLILFIPAALILISLVFIFVGIGLGGFSSAMVCNWCMPIGSLSVMFLCHLVNNKDQKHGYRTLYSLPIDLKQIFIAKTILIALNLLIISLLLSFITVIAESIVSGLFIALSHSDYYLLGYGLLWLSLLWQIPFCLFLDQKVGFVAAVIINLFASAFGGLFFSLTPLFWFFPYSWPARFMVTLFGVLPNGLLVNGGSRLILNPGASALLVLISLLTSLLLTVLFSRWYRKQVYRK >NC_016894|3880300:3943307|3916128_3916794_-|WP_014357744.1|DBSCAN-SWA MSQINDEKRSEILKCSYDLFSHNDYCSVFLKDIAAQVGISKSRLQNFFPKKREIIRNLLEEYIYQLFRYVEERLAVDVTVYYKLALFTAFFWKLIDRNKELHYFMMNVITNNELLDVLTDFVFCWHSEMKYEGVHNFEIANLRQSLIFSISGGSALYIKKDSLNIETLYITQNISDTFMRMMGCSDEQISEVLKNTSEWLPKMDVNSFLEYSRDNIAWMQP >NC_016894|3880300:3943307|3936434_3936581_-|WP_014357766.1|DBSCAN-SWA MIVHIVFGHLAADTLKAILKNLDRKKERVITLEEMFLVGPILHLHNEI >NC_016894|3880300:3943307|3919421_3920609_-|WP_041669511.1|DBSCAN-SWA MKYNFDEKVNRRGTGSMKWDAGDFLKMVGITERYDEETLPLFTADMDLPVPDPVIKALHKIVDNRIFGYTMANDDYYEAIINWFKRRNDWDIKKEEIVYCPGTVKALGIAVRAYTNVGDGVIIQRPVYPPFTSAIEDNNRVVINNSLINNDGYYTIDFEDFEAKAKVASTKLFILCNPHNPSGRIFSKAELKRLAQICYNNDVIIVADEIHGDLIRKDNKFYPIVKCADKVDHLVTCTAINKTFNVAGLHATNVVIGNEDLRNKFKKECGYEMPSPFTIAALIAAYNEGEEWLDQIIDYIDGNIDYIENFLKENMPKVKVVKPEGTYIMWMDFRGYGLTPEEVKKRIYVDANVILESGAMFGEEGTGYERICVPSPRPMIKEAMERIAKVFEDLK >NC_016894|3880300:3943307|3893985_3894714_+|WP_014357728.1|DBSCAN-SWA MTILREFFSNFTKIKRTPVILLHLLPPIVITTLFFVYYASGGYHLISDVRLFFVILQIGYPIFVSIVVPILINLDRHNGIQNALGLVPSRSSVYLGKWLFLMFLSAINMILYEVCFYVGVNFFPGINMPPFGASLVIFGVFLFSNLFLYLLHILIAFRFGSSLSVLTGISGTILAGYFENAIGDKIWPFIPWEWGVRFLENYFNFSNVPVFPGIIALMIMTSFILIVSLLWFSHWEGNVIQE >NC_016894|3880300:3943307|3922978_3923278_-|WP_014357753.1|DBSCAN-SWA MIITKNQTAEKISLALKGRLGNTTAAQLENEILLVGETVSFLELNFDELEYISSAGLRVILSAQKKMSPPRTLLITGVNETIMEVFEITGFADILTIEG >NC_016894|3880300:3943307|3883126_3883984_-|WP_014357717.1|DBSCAN-SWA MEWMKAIGEAVDYIESHMTEDITADDVANHVCISTFYFQKGFSMLCGYSIMEYIRNRRLALAGVELTNSDAKVIDLAMIYGYDSPDSFTKAFTRFHGSTPSQVRKDRNMIKSFAPLKLTISLKGGYLMDYRITKKNSFTVLSASKEFSYEQAKQEIPAFWQEHYASGKGQTVCGMFGINIDEQMGSEKFEYLIADVYNPIMDIPEGFMTKTIPAFTWAVFPCQGAMPISIQNVNAKIFSEWLPTLREYEIAAGYCVEMYDAPDKYPKGTLDENYYAEIWIPIKRK >NC_016894|3880300:3943307|3929737_3930775_-|WP_041669524.1|DBSCAN-SWA MMYHEKVRVVQYGCGKMSKYTLRYLYEKGAEIVGAIDVNPDVVGMDVGDWAGLGVKLGVTIRSDADAVLDECDANIAVVTLFSFVKDVYPYFEKCVKRGINVISTCEEAIYPWTTAAPLTNKLDKLAKEHNCTVVGTGMQDIYWVNMIGCVAGGVHRIDRIEGAVSYNVEDYGLALAKAHGAGFTAAEFEAQIAHPETLEPSYVWNSNEAICAKMGWTIRSQSQKCVPYFYDTDLYSETLGKTIPKGDCIGMSAIVTTETFQGPVIETQCIGKVYGPEDGDMCDWKIKGEPDTTFYVSKPATVEHTCATIVNRIPTVLNAPSGYVTVEKLDALEYLSYPMQLYVK >NC_016894|3880300:3943307|3922066_3922525_-|WP_014357752.1|DBSCAN-SWA MDKNKEFYELMKVINGVFDKMQDYEKEARCYGTDDLLYTIEVHTLDIIGTYDNITSSEIAAKMYKTKGAVCQTVDKLEKKGLIKKDMHDVDTRKKVLMLTEKGKIVYNYHKQKDIIAYNRYLERLENYTCEDFERSKNILVKIFKLDKEQNK >NC_016894|3880300:3943307|3885810_3886068_+|WP_145972753.1|DBSCAN-SWA MKNNKFLEEKVIAIDNPSLNTNDKIQAALEIFCHDFDLEKPMWFDKNTKEFNQISKTSFREDQFIESIWFDYLEIELIDDGKKKP >NC_016894|3880300:3943307|3912901_3914134_-|WP_014357742.1|DBSCAN-SWA MKRQIIVVGAGPGGSTAAFYFAKKGMDVLLLDRETWPREKPCGGTYLPVCYPMFEEMGVLEEMQSVAEMSATKVRLILHDEANGEFTTKPKLNMPRRYGDDCIRRSALRAGADYMENFDVTELIMRKGVVKGVKGYYHNQEMTIESDLVIVADGAHSVLANQLGAFENDPERVMYTFRSMMTGVEGLEDDIIEQYYLPDTLPNEAHSPICVFWLCPQKSGVTLFGVTITEKALRETKFSIEELVEVWVTTTEFGKKRMQNAKVLDDYGYRGWRLPGCTKLHKSYYPGAIIIGDAISAAECAFEYGIPEAMFGGKIAAEVGAEIFAANGTFDEETLAEYRRRAEAQLNPTLGFNAIFRTELLDHKDRLDAFLKWAKEQPGYPNNDFGVNVAQFITKELGIPLQVGGEASMQ >NC_016894|3880300:3943307|3939017_3940991_+|WP_014357769.1|DBSCAN-SWA MEKFKKALSPITINKTEFKNRLWIPPMGTSAVKPDGTPTDEMVAYFNNMAKGGAGAVVIEVADVDEHRRYNSTVIGLFDDKFVPKYKEIIDAIHDGGSKAISQLLHAGPIPLIKNDPTQYGPLCASSVPHIYNLNAIPQVITKEQMAEIKQMYIDAALRVVKAGADGIEIHCAHNHGLLGTFVSSIHNKRTDEYGGNLSCRMKYPLEIVEAIRTAVGPDMVLGVRISDSYDEVDGLTLEDSCRMSRMFEKAGINYIHASHGSLISIANIQPPHGSPQGIFANRAKVIKEAVNIPVGTIGRITDPEIAEELLETDVADIIFMGRALIADPELPNKIKEGREADIRPCIGCNECVTSAMYGNGFYCAMNTLSGHELEGGVVYDENNKGKKVLVIGGGPGGLEAAGQAAIASYDVTLVEKANYLGGQFELAAYPPTKQEFACGVKYLINQVEKHGVDIRLNTEATKEYVVDMKPDAVIVATGGQPIEAKWITESGHPNVIGAWDAIRGNANIGINIVVIGGGLVGCECADMIAAPRYYRKQYARKVTVIEMKDYVMIDDYTPQRDQLMTRLMDKNVDILEGAAVKEISADSITYVKDGETKTIKHVDTIISAVGTQSVNGLTEELKVLDIPVITIGDAVAPRKIHLATREAAEAIKKLKI >NC_016894|3880300:3943307|3909259_3909646_-|WP_169314717.1|DBSCAN-SWA MDRKIWSKFMLNIGVNQVVSVYGQNFGSVKKPGRARDMMIAAMAEVIPVAKQEGVVLDEADIAYWLGVVDALSDAGKPSMRQDVEAKRPSEVALFSGTVVALRQKHRIKTPVNAMLYDNIMAIEKGYV |
58 | Bacillus_phage(30.0%) | transposase,integrase,protease,bacteriocin | attL 3941031:3941060|attR 3947082:3947111 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_5 |
3956431 : 4006028
Sequences of DBSCAN-SWA_5
Nucleotide sequences of DBSCAN-SWA_5 >NC_016894|3956431:4006028|DBSCAN-SWA TTTAGACAGATTTTTTGTGGGCTAATTTTCGATAGGCATCTGGTGTGAGATACCCCAATGACGAGTGTATTCGAATGTTGTTGTACCAGTTGACATAATCAGAAAGCATGAGCTTTAAATAATCCAATCTGTCAAATGCGTATTGGTTAGCGAATTCTGTCTTGAAGACTTTAAAAGCGCTTTCAGCAACAGCATTGTCATAAGGGCAGCCTTTGTTGCTCAAGGAACGTTTGATATTAAAGGTTTCAATAACACCGTCAATCACATTATTTTTAAATTCACTTCCCCGGTCAGTATGGAAAATTGAAATCTGATCCAACCCATATCTGATCCTTGCAAAAGCTTCATAAACCAGCTGTGCGGTTTTGTTTGGCCCGGCGCTGTATCCGATAATTTCCCGATTGTAAAGATCGATAATCAGGCAGACATAATGCCATTTTCCGCCCACTCGAACATAAGTCAGATCACTGACAGCCACTTCCAGTGGTGCCCGGCCATTAAATTCCCGGTTCACTTCATTGGGGACTGGTTCTGATTAACCGGTTGTTTATGCACTTTGTATTGGGCGACGATCTAATTCAAACCAGACCATTCTCCCGCATAATGCGACCAATCCGTCTTCGGGAAGCAACAATCCCTTTGGCTTCAAGTTGATGTTTGATTTGACAGGTCTCCTTTATTTATTGTTTTTATTTTACCTGCTCACAATTTTATTGTCCTGTTTATTGTAACCTACCCAAAGCTCCTTTGCCATATGAAAGATGGCATATCCATCTAAATCCACATGGTGCTAGAATAAAAATAGTACAAATCGAAATCAAAAAATCCAAAATTAATAAAAACATGGTACGATAAAATAATCGTACTGCCAAACTAAAATTAGGGCAAAAATCGAGCGGTTTTTAGCCTAATTTTTGCCCGTTTTTTGCTCATAAAACATAACATATCGTTGTCGTAACGCCTTATTTATCACTTTGACCACAACGTGTTATCAAAATCACAGTTTCAACGTGCCCTGCGGCGGTGATAATGATGTCGTATAAAACTAGTAACCCCTTGCAGGAGCTATATTTTCCCATTTTAAGTGATCAAAATCTCTTCTGTTAACTTAATTTGTTTTCTATTTCCAAATTCAGCAATATTACTTTTATTTATAAGCTTAGCTATATCCTTTGTACTCCAACTTCATGATTTACTTAGGCAATAGCTACCAACGCCCGTATAAACGTAAACGTCGCTCTATATCTTCTTCATTCCTCACTTTCATATCATATCCATAACTTAATTAAATCTAATTATTACGCTTTTCACAAAATTCTATTCTAGTCATTGCAAAGAAATAAAAATGGTGCTAAAATATAGTTAACCCACTCATATATTAACCATATCACATAAATGGAAGTGAGGAAAAAGTATGTCTGATAATTATATTCAGGTATCAGGTGCAAGGGAACGAAATCTAAAAAACATAAATGTTCTGATACACAAAAAAGAAATTACGGTTTTTACAGGTGTTTCCGGTTCAGGAAAATCATCTTTGGTATTTGATACAATAGCGGCAGAATCGCAAAGACAATTAAATGAAACCTACACCAGTTTTATCCGCCACCGTATGCCACATTACGGAAAACCCGATGTGGACACCATTGAAAATTTGTCCGTAGCCTTTATTATCAATCAAAAACGATTAGGTGGTAATGCTCGTTCAACAGTTGGAACAATTACAGATATTTATTCTGTATTACGTTTATTGTTTTCCAGAATTGGAGAGCCATTTGTCGGTTATTCAGACGTTTTTTCATTCAACAATCCGGCTGGAATGTGTGAATATTGCGAGGGCTTGGGCAAAATTGAAACCATTGATATTGAAAGGCTGTTAGATAAAAATAAATCCTTAAATGAGGGGGCTATCCGTTTTCCAACTTTTGAACCCAGCGGTTGGCGATTAACCCGCTATATTCATTCAGGCTTTTTTAATAATGACAAAACAATTAAGGACTATTCTACCGAAGAACTGGAGCTGTTACTTTACGCTGATGGAATTAAGGTTAAAAATCCTACCCCCGAATGGCATAAAACCTCATTGTATGAGGGTTTGCTTCCACGCATTGAACGGAGTTTTCTTAAAAAAGAAGATGGAGAAAAGGTTAGATATGGAAAAGAAATTGAGCGGTTTGTTGTAAAGCAGGGTTGTCCCCACTGTCATGGAACACGCTTGAATGATAAGGTACTATCTTGCAAAGTGAACGGAAAAAATATTGCGGAATGCGCAGATATGCAAATAAATGAGCTTTTGGATTTTGTTCAATCTATTCATGCTCCCGTAGCCGCTACAATCGTTTCGGAACTTGTGAATCGGATTCAGCACATGATATCCATTGGGCTAGGCTATTTAAACTTAGGCAGAGAAACCTCTACACTTTCAGGTGGAGAGTCGCAAAGAATTAAAATGGTTAGCCAGCTTGGCAGTAGCTTGACCGACCTTACTTACATTTTTGACGAACCGAGTATAGGGCTTCACCCTCATGACATAAGCAAAATTAATGAGCTTATGAGGTTGTTGCGTGACAAAGGGAACACTGTTCTGATCGTAGAGCATGATCCAGACATGATAAAAATTGCAGACCATATTATTGATATGGGACCAGGTGCAGGAAGCCACGGAGGGGAAGTTGTATATCAAGGAAATTTGGATGGGCTGAAAACAGCGGGTACCCTCACGGGAAAATACTTATCCTACTGCCCCAAACTAAAATCTGATATTCGTGCCCCGAAAACTTGGCTTTCTATTCAAAATGCAACCATGCATAATTTGAAGAACCTTTCGGTTGATATACCAAGAGGAGTAATGACTGTTGTAACCGGAGTTGCCGGTTCAGGAAAAAGTACGCTTATTAATGGGGTATTGCCACGGTTATATCCAGAAACTGTTTTTATTGACCAGAAAGGAATTCAAGCGTCAAAACGTTCCAACATTGCAACCTTTACAGGTATCTTTGATATTATCAGAAAATTATTTACGAAAAGGAACGGTGTAAGCGCCTCCCTATTCAGTTTCAATTCACAAGGTGCTTGTCCTGCCTGCAAAGGTCTAGGAGTTACTTATACAGATTTGGCGTTTATGGATACAATTGTTACGGTATGTGAGGAATGTCACGGAAACCGTTATACGGACGAAGTGCTTGCCTATCAGCTAAGAGGAAAAAGTATTGCCGATGTTCTTAAAATGACGGTCACAGAAGCCTTAGAATATTTTCAGGAAAAAGAAATCATAACGGTACTAAAACGGCTTTCAGACGTTGGTATCACTTATGTTTCTTTAGGACAACCATTAAGCACGCTTTCAGGTGGTGAATTACAGCGAATTAAACTTGCTTCCGAACTCGAAAACGGTGGTCAGATTTATGTTTTGGACGAACCGTCAACAGGTTTGCATATGGCTGATATAAAACAGTTGATTAGTGTAATGAATCGCCTTGTAGAACAAAATTCCACTCTTATTGTTATAGAACACAATTTGGATATTATTTGTCAAGCAGATTGGATTATTGACATAGGCCCCTATGCAGGACAGAATGGTGGTAAGATCATGTTTACAGGATTACCAAAAGATTTAATCAACTGTCCCGATTCTTTAACTGGAAAGCACTTGAAAAAGTATATTAATGAAAAATAGGAGGTTGACTTAATGGCTATAAAAGAATTAGAGGAAAGTTATGTTCCCTTTCAATGCATGATTGTATCAGATTCAAATCGGTTCAATGTTGAGGGTGTTTCAACGGCACAATACTATATCCTCGATACATTGAATAAGCAAGGGGCGAAAACCACGAAAGAACTTGCTGAAATGAGAGGTATCTCACAATCTGGTATTTCAAAATTAACAAAGCGTTTGCTGGAAAAAAAGTATATTATTCAGGAAAGGCAGGCGAATGACCGCCGCTCTTACAATATTGTTCTTACCAAAGATGGAAAAGCTTTTTTAAATCGTGTTGAGGATTTTGGAAATGAAATTATGAACCTAATTGAAGAAGCATTAACAGAGGAAGAAGTACATGCCTTTTCAATGATGTGCAAAAGGGTTACGAGCTTATACGCAAGAAAGCAATAGGCATACTTAGGAGAATACGAGAATTTATCTGCCCTACGGTAAATAAAAAAAACCGTAGTTATGGCATATGTTTCGTTGTGCTGTAATTGCATATGGAGCAGGGCACTTCAGAACAGCGGTAATATTGAAAGTCGTGACTCAGGTAATTATGCATTGGATGAAAGTAAAGAAATCGCACGATTAAAACGGGAGTTGCGGGATACTCAAGATGCATTGGATGTCTTAAAAAAGGCTATCGGCATTCTGGGAAAATAACCGAAGCGATTTATGTTGAGGTTACCAAAAAGGGTTCTTCCGTAAAAAGCCGTTTACTAAACGATTTATTAAACCTGAAGTGATATAATAAAGACATCAAATAGAAAGAAAGGGTGGTAAAAATGGATTCACCAAATACCCTGATTTTGGATCATTACTTCCCATCCGATGTTTTAAAGATCACGGAAGTAATTGAAACTGATAAAATCATTATTCATATGAAATCTCTTTCCAGAACCTGTGTCTGTCCCAGGTGTCACCAGACACTTAAGCATTATCACGGTACCTATACAAGAAAAGTTCAGGATCTTCCCATACTGGGAAAAAATGTTCAGCTCCGGATTAAAGCCCATGAGTACATCTGTGACAATGAAGCGTGCTCGGTTAAAACCGTTGCTGAAACATTTGATGGCTTTCTTAACACAAACCGAAGAATGACTCAGCGATGTGAAGATTTCATCTGTATGCTGGCAATGGAAACCAGTTGTGAGGGGTGCGCACGGATCTGTCAGGCAATGAATCTGAATATCAGCGGCGATAGCGTGATTCGCTTTCTGACAGAACATTATGAGTCTCAGCCGGTTCCAGTTTGTAGTGAAACGATTGGTGTTGATGATTTTGCCTTCAAAAAAAGAAGCCGATACGGAACGGTGATTGTTGACGAAGCCACCCACAAACCGGTTGCAGTTCTGGATGGTCGTGACAGCAATACATTCAAGGCCTGGTTGCGGCAGAACAGACAGGTCAAGCGGATCACTCGAGACCGTGCCGGGGCCTATGCTTCCGCTATTGGGGAAATCCTGCCCGATGCCATGCAGATTGCCGACCGATTTCACCTTCATCAGAATCTATTGGAGGCCGTTCAGAATGCACTCAAATCAGTTATCCCGGCTAATATAAAAATATCAGTTGATCAGGAACAGCCTGCTGGACAGCAACCGACAGAAAGAACTGCAAAAGAAAGGATTAAAAAAAAATGATCCCCCGGCAAGACCGGTCAGTTATGATGAAAACCGGATCCAACGCTACAATGCAGTTAAAGAATACATTGGTGCCGGATTCACGATCATGTAAATTTTCACATTATTTCGGACTGGATTAATCACAATAAATCGGATGAAAAAGAACCAAATAATGCGAAAATAATGGCGTGTTGAAAGTATAATTCCAGTTTTTAATCACATAATCACGCTTTATTTCTCCAGAAAAAAAGGGAAATAACGCCGTCAGGCGCTAAATCCCAGCTTCCGCAGAAGCGGCAAAAACAATCTCTTCATCGATGAGATCACGCTGCTTTTGAAAGGCAAGAATCAGACATTGAGTCACCAGATTACCAACTAATCGTGGGTAACCACCCGTTGAAGACGAAATGGCCTCATAAGCGTTCTCGTTGATCAGATTCCGTGAAACACCAGCATGCTTAAACCGGTGTTTGATGTAGTCCCTGACCTCATCCGGGGTCAATGGCGAAAAATGAAAGCGGGTCACCAGTCGCTGATCAAGCGACCGGTTCTGGTTTAAGGCCAGACGGTTGGCCAAAGTCGGTAAACCAGTAAGAATCAGAATAAAAGGATTGCGTTTATCCATATCAAAGTTAAAAATGATGCTCAGATCGTGAAGAAACTGAGCGGAAGCCGACTGCATCTCATCCAGGATAAAGACCGGGGTGATGCGGCGCTTATCATAAAGATCGGTAATGGCGTTCTGAATCTGAAAGAACAGCTCCACTTTGCGGAATCGGGGTTGTTCCCCCAGCGAAAACGCCAGCCCCCGGTAAAAATCCATGGTTGTGCCGGAAGACATCGGGAAATACATGACCTTATATAAGGACGGATTCAGGGTGTCCGCAAAGACCCGAAGCGTTGATGTTTTACCAACCCCGGGGTCCCCGGTAATCAGACCAAACCCACGGGTCGTTTTGAGATAATCCAGGCGGGCCAGCACTTCCTTGTAAGCTTCCGACTGAAAGAGCATCGCTGAATCAATCCCCTTGTCAAAGGGTGCCTGCTGGAATCCGAAAAATGATTTATACATGCGGCACACCGCCTAAGGAACTGTAGCTGATGGGATTGTTATTGCGTTTGGCAACCGCATTGTCCTTCATAATGACTTTATTACAGGTATAAATCCGGACACTGTTTTCATAGATATAGATTTTATCCGGGGATTCATTGGGGTAACGGATATCCACGCTCTTACCAATAAACATCGGCGACGCTTCGAAAAGGGCGTTGTGCAGCGAGATGGTGGCATCCGACTTGACCTTCCGGGTCACCCGGATCAGAAAGGCTTCATCAATGATCCGGGGATCCGAAAAATGCTTAATCCGGTCACTCCCCCGCATATAGAAGACCATCGGTGCTTCATTGATGGACGAATGAACCTTGTGATGATAGTCCCGAGCCAGCCAGGCCTCAAAGCGTTGGTTAAGGACATCAAGATCCATTAAGTCAGCATCCGTCAAAAGTGGATAGAAACGGCTGCGGACCGTTTTGAAAAAGCGCTCAATTTTGCCCTTGCTTTTTGGATCATAAGGCTTGGTATTGACCAGCGCTATCCCCAGGGTGGCACAGGAAGTATTGAGTTGGTGGGAACGGAAAATCTTGCCATTATCCGCATAAAGCATGGTGGGCTTACCGCAGGTAAGTAAAGCAGATTTAAGGACATGAAGGAGATCTTCATTCTTTTCAGCCAGCATGAACTGAGCCCCGGTAATCCGCCGGGAAGCGTCATCGATAAAAGCAATCAGATAAGTTTTGCGCTTTTTGCCGTTAAGGGACAGATACGGGCCGTGGGAGACATCGGTCTGCCACAGGGTGTTGATGTCAATATGAGCAAACCGGCGGCGGTCCGACGTATCGATCGCCGATGGCTTTAACAGCTGATGTTTTTTGAGCAGCCGATACACCGTCGAATAGGAACAGTCGGAGCTGGTGAAGTGACCTTCGTAAATGAGCCATTCCTGGAACAACTTTACGGATAAATGGATGTTCTCATTTCTCAGCTTAAGCAACAGCTTCACTGATTCCGCCGGTAAAGCCCGGGACGACCCTTTGTCTGTCCGAACCTTCGGCTTGAGCGCATCAAAACCATGGCGCCGATAGAGCCGGTGCCATTCCAGCAGGGTTTTGCGGTTGTAAGTGCGGATGCCATAATGGGGAACATCATGGGTTTTTGCACTGATCTCATCCAGATAAGCCGTGTGCGATGAGACGGTATCCGTGAGTAACGGTGCAATCAGGCCATAGCGAAATAAAGCAATCAGTTCTTTGTCTTTTTCAGTCATTGTAAAAACCTCCGATTTTAAAAATATGAGGTTTTAAGGATCCATAAAACCAGGTAAGTAGAGCATAACGGATCAATCGATAAAAGGCAAAGCAAACGCTGTGTGGGATAAACAGGACTTCAAAAAAATGCGGAAGGATGGTACAATTAATGTGCCATAAATCCTTTCTTAAAATGATCGTGATATCTTTTGCCGAAGATGTGGGGCTTCCCCACCGAGTAGACCATTTCAAGAAGCTTTATGGCTTTTTTATGCCAAAAATCAGGAAAGACGAGTAACGGATCATGGCAGATGCGAAAATACTCAATCAGCCGATTCATACAAAGTAGAAAACGTCGGGTGATAAAGTGCCGATGCTGAGGCGCTAAAGTATTGGCTGAAGGAATTCTGTTAAAGAAGGCCCAAAGCAGTTCCAATAGAAAAGGAAGGGCCAGTTGAAAGCCGGGATGGCAAAAGGAAGGCAGGATACTGACCGTTTTGCCGCAATGAATGCAGTAATGGCGCTGTACCGGAATGGAAAAGACATCATCATACCAGATGATGTGCCGGTGATAGACACCATGAAGATGGAGCCGCCGGCGCGAATAACAATGAGGGCAGCTGTCAATGCGGATTTTTTCAGATATGTGAAATTCTGTGATGTAATCTAACGGATGGCCAGAAAAGTGTTCCAGATGAACCATGGTTTTTGCTTCCTTATCGTGATTAATGTTTAATCATTATATCATAGTTGATAAGACCGATTCATCCAGAATAATTTGACTAAATCAGGACTGTTTTGACACTTATAATTTGCTAATTAACACGATCAGTCAAACGGCAAAAATCCTCCACTGCAGCCGCAAGACTGTACGCAATAATATGAATGGAGATTTTGATGCATTATGTTGTCGGGAACCTCAAAGCTGCGCGGATCGCTATTATGATTACATTGTAAAATCATTGAGTGCCGGGATGATTCGTAAGGACATTTATCGTGAGATCATAAAACAGGGTTATCCGGGAAAAAAGACTGCCGCCTACGATTACATGAATAATGTGATTCAGATCCTGGGTATTGAAATTGCTGTTAACAGAAGCTCATCAATTGAAGCCATCGAACGAAAGAAACAGTTAAATAAATTTGACCATCTATCCCGGAGAGAAATCTTTCGATTTCTCTGGATGAGTGAAGACATTTCACCCAAACACCGTGACTATCTGAAGATGAATTATCCGGTTATTTGCGAGCTCTACAAATGCATCAAGGAATTTCGTCAGATTTTCAAAGAAAAAAGCCTACCTCAACTGTATCTGTTCATTGATCGATATAAAGAATCTGAGATGAAGCCTCTTGCAATTTTTGCGACCGGTCTGGAAAAAGATCTCGAAGCCGTTGAAAATGCTGTTGTCAGTGATTTATCAAATGGTTTTGTAGAAGGGGTCAACAACAAACTTAAAATGATAAAACGAACCATGTATGGCCGGTGCGGTCAAAAATTATTGACAGCCAAATTGATGTATGATCCACATTCGAAACCTGGATAACGGGTTTTTGCGGAAGAACCCCAAAAAGGCGGAAACAGCGCATCACGAGAAGCGCCCGGTTTCCGTCTCCGGAATGTTGCAAAAATTGGGTGTATCACGAACCGGGTATCGTTCGTGGATCAACAGAAAACCGTCGAATACTCAAAAACGACAGGAAGACATCAAAATCTTTTAAATGATCGCACCTCATGATTTGGTATCTCTTTGGCAATCATCCAGCTAAAATCTTTATTCAATCTCTGATGATAACGCTGCTAGAATAGTTTCAACCGCTTTTTCATATTTTTTAATCCGTTCCTGGTCTTTCTCGGTTGGCTTTTCAATACGTGTTAAATCCATATTATCAGCGATATCTGCCAATTTCACCCGACAGGCCGTTTCATTTTCTATTACTCTGCCAATAAATGCATCATAACATTCTCCATCGCGCTTAGTCAGGCAATCCAATACCTCAATGACTTCTTCTGAAAACCCCTGTTTACGTAAATCTTCAAAGGTAAACTCCGAATCCTCTACGACATCATGCAATACTGCACATATTCGTTCAAGATCATTATCTCTTGAAAGCATCACTCGGAGTGGGTGTAATATATAGGGTGCTCCGGCTTTATCAACTTGCCCAGTATGAGCAATTGCAGCAATTTCGATTGCTTTATTTAACATTTTAGACCTCCATTCCGCCGCTATTGCTTACGGCACAACTTGTTATCAAAAAACTTTACGTTATAAATGACGAGGGGACGTTTCGTTTGTCATATTTACCGCTTCAATACCTGTTCACTATCAACCTACCCAGACCCAGCACCCGACTCAATTGACGGATACTGCTGTCCGTTTCCTGCTGAATCTGTCAGATCAACTGGTTTCGCTTTTCAACCGACAATTCGCCCGGATTCTAATATTCGCTGTCCTGACTCAGCATATCTGTAAGCTGTGCATCACTCAATCTAGATTTTTGATTGATTTCGAGACATTCTGATTATCTTTCTTCGAAAAACGAACAAAATCTGCCACCGTTGGGAAATAGTCTTTGATGATCTCAACATCAAGTGCAATCGGATTTCCCTGATAGCCCTGGATAACTTTATCATAACTGCTCCATGTATATTCTTCCAGTCGAGCAATCATTCCGGCTTTTAAGGGATTACGGTGAATGTACCGAATTACCCTCTCCTGATTTTTTCAGGTATATCACAGCTTGATGGGATGACAAGCGAAACGTCCAATGTCACCCCCATGTCATATTCTACCTGCCCACAATTTTCTTGTCTATTTTATTATAGCCTATCCAATTTTATGTTATATGAAGGTCCCATTATTATACTTATTTTTAGCTGAACCATATGATATTTTTGATAAATCTGATACGAAACTCTTCAAATTTATATCCATATCTTCTTTGAGGCCGTACTCAGATAAAATATTCCAAATTACTTTTTCTCTGCTTTTTTCTGGTTTCTTATATATGTTTTGAAGTCTTTTATCAACATTTTCTCTTATATACTTAATAATAATTATGTCACAATAAGCCAATAAATCTATATCCTCAATTAGCTGCTTATCAAGTTGATATACATACTCAATCATAGCTTTGATCATTGATGCGATTTCCTTAAAAGTGGGTGTTTGCTTTTTTTCAAATCGTTCTAGAGTTAATAAGATATCCATTCCATTATGCCTTTCCATAATTTTATCTCTATCACGTTTTAATAAATTTATGACCTCATCTAAAGGTTTATTTTCGGCCTTATAATGAACCAATCTATTTCTCCAGCAAATCATTAAATCAACAATCGAGGAATTAATTTGATCAAATTCATAAGCTTTTCCAAAACTCAAAAATGAGTGATAAACACTTTGATTATTTTTATCTATATCTTTTTGCAATGAATTATTATTTATCAATTTTGGTTCTTCATAACTCATCCTAAAATACATGTCTAAGTTATCTACTGTCCATGACATCGCAGATTTTATTGAAAACTCACGACTTCGATCGGCAGAAGCAACTTTGTCTTTTGGGTTCCAAGAAGTACTAAATTCTTCGTTTTTTTCAATGACTCCAGCTTTAACTCCATCTAATCCAACTAATATCGTTATTAAATAATGGTTCGCTTGACCTATTTCTCTTTTAAATAGTTTTAAATTTTTTGATTTCATACTTACCTTCGTTTTGGTGCCTCATATAAGAATCGAACTTATGTCTACCACTTTAAAGGATAAAATCTATAAAGGTGGTCGGCTTATCCAGTTTGCCCAATGAGACATATTACACTTTCTCCCAACAAATCTGTACACTAAGTTAGGTAACATCATTTATATCATACTGGTATATTAAAATTAACATACTAAAAGTACGGCAGTAGGTGATACAATATCCACGCTTAGCTAATGGTTACGTCATCTTTCCGCACAAAAGTCTATAGTTGTGCACATCCTATATGGGGTAATAATATTTACTCTGCCATGAACTAGTTCAGTTTTACTTGATTTAAAAAACTTAAAAATACTTTGTTCTATACAGACTATTTTTATTTCATTAAGAAATGTGTTACTTTAACAATAGTCAAGCCGTAATCGACCAAGAAATTCTTTTGCTCTTCCGTATAGGTTTTTCTTTCTGCTATTGCTTCGTTCGTCGCATGCCTAAAGCACTGCATTTTCTTTCTATAGCTTGTCACTTTATCGTTAGAAATATAATCAAAACAAACCATAGGATAATCAGGCGTGATAAACTTTCCATTTTTCTTTAATAAATTTTCTATCAAGTTTGCTATCTCCGCAAGTTTTTCATCTGTGCTCATATTATTAAAAGATGCTTGACGATTTGATATCTCAACAAACTTTTGATTTATCAAATGATCTATAACAATATGACTAGAGTTCTGCTCGAAGGTTAAACTTGCAACTAATTTTCTTCTAACTGCATATCTAACGGTTCCATTATCATCTTCTCCCTGAGTAATAATTCTGTTTCTGATTTCTCCATAAGTAAAGTTACTGGGATCTATAGGTGGTCTCGCTAACAATCTTGGGAATTCTTTTATCACATATCCCATTTTATATAAATAATACGTTATAAGATTAAACCAACACTTATTTTCACTACAAGAAATGTGGATTGTCAACACTTTTTTAGACAGATTTTTTGTGGGCTAATTTCCGATAGGCATCTGGTGTGAGATACCCCAATGACGAGTGTATTCGAATGTTGTTGTACCAGTTGACATAATCAGAAAGCATGAGCTTTAAATAATCCAATCTGTCAAATGCGTATTGGTTAGCGAATTCTGTCTTGAAGACTTTAAAAGCGCTTTCAGCAACAGCATTGTCATAAGGGCAGCCTTTGTTGCTCAAGGAACGTTTGATATTAAAGGTTTCAATAACACCGTCAATCACATTATTTTTAAATTCACTTCCCCGGTCAGTATGGAAAATTGAAATCTGATCCAACCGGTATCTGATCCTGGCAAAAGCTTCATAAACCAGCTGTGCGGTTTTGTTTGGCCCGGCGCTGTATCCGATAATTTCCCGATTGTAAAGATCAACGATCAGGCAAACATAGTTCCATTTTCCACCAACCCGAACATAAGTCAGATCACTGACCGCCACTTCCAGTGGTGCCCGTCCATTAAATTCCCGGTTCACTTCATTGGGGACTGGATCCTGATTAACTGGTTGTTTATGGACTTTGTATTGGGCGACGGTATAATTCGAAACGAGGCCATTCTCCCGCATAATGCGACCAATCCGTCTTCGGGAAGCAACAATCCCTTTGACTTCAAGTTGATGTTTGATTTTGCGGGTTCCGTAATTCTTGCGGCTCATTTTGAAAATTTCAATCACATCCGCGATAATCGGATCGACTCCATTCGTCTTTTTTGAAATGTAGTAATAGGTACTTTTGGGGATATTCAGGACTCTGCACATTGCTGATACCGAGTAGCGGTCTTGATTGGCTCGAATAACCTCTACTTTCGTCCTATGATCAGCGCTGCCTGCTTTAAAATGTCGTTTTCCATTAATAAACGTTGGTTTTCTTTTCTCAAGCGGATCAGTTCATTTTCTTCATCAGTGCGGTTGTCATTTTCTTTGAACGAGCCTGAAGACTGATGTTGTTTGATCCATTTATCAAGTGACGATGCCGTCAAATCATATTCTTTAACAATTTCACTTCGGGGTTTTCCGTTAAGGTACAACTGCACCATCTGGTTTTTGAATTCATCGGTAAAACTTCGTCTTGGTCTTTTGGTCATTTGGCAGGTCTCCTTTATTTATTGTTTTTATTTTACCTGCCCACAATTTTATTGTCCAGTTTATTGTAACCTATCCAATGTTTACATCTGGCTGGCATAATTCTCTAAATTTTGTTATCGCTTCCTCTGTATCATACACTTCAAATTTGTAATCATCTACTTCCTCATATCCACTAAAAATATTGTATATCGCATTAACATTCTTAATTGAATCATAAAAACGATAATGATATTCTTCTTCTAGTATATTTTGAAAATAAAATTCTTTTATGTCCATTTATCTAATCACTCCAAATCTTTTATGTGATTCTATAATAATTTTTCAAAAACTCATCACTAAAAGTTATTATTTTATATACTTACCTACTTGCTTTAATTGATACATACTGGTTCTATGCCAAGATTTAGTATAAACTAAAATGAAAATTTTAACACTGTCATTTTAACCTTCTATACGCAAACTTTCGTTTTGCATTTTAGTAAAAATTTTTTCAAAATTATCCGGCGACTTATAATCGCAATGACTGTGAATACGGGTTGTATTGTAAAAGGTTTCCAAATACTCAAAGATCAGTCTATAAGCATGGTTATAATCAAGGATTTTAAAACGATTGAACCATTCGCATTTAATGATGGCAGGAAAGGATTCGATGTAGGCGTTATCCCTGGGAAATACCATTTTAGAATAACTACGCTGCATTTTTGTCGTTGCTTTCTGGTATTCTTTTGAAACGCACTGACTGCCACAATCACTGCAAATGATCAAGGGCACAACAAGTTTTCGGGAGTATAAATCCATGATACTGGTTAAATAAAAAAATCCGTCCATTGTCCAAATATAAGTAATATCACTGCATCACATGACAAAGGGTCGTTTCATTTGTCATGTGATGCAGTGTTTCAAATTTTGTACAAACTCTAAAAAACTGATATAGTGATAATTTTCCCCTTGTTCTTTTAACTCTATTTTACTACAACTTATACGGTATCGTCAAAGCTTCTTCCAAACTCCAGCCCTCTTTTATTCGATCCTTAAAGATATAGCTTTTGATTCCCCAATAAGCCCACATCTCTTTCTCGGTGTCAAACTTCTTACCCAAATGATCAACTACCGTATTCGGATTTTTGCCTTCTAAAGCTTCTTCTAATGACCAGCCATCTTTTATCCGATCATTAAAAACATACTCCTTAACGCCCCAATAGCTACACATTGCAGATTTTGTTTTAAAGCCCCTGCCTTGATGATCCTTAATGCTATCCGGTTGTCTACTTTCTAACGCCTCTTCTAATGTCCAATTTTCAGAAAGTCGATCTTTAAACACATAATACTTAACACCCCAATAGTTACACATCTCTTCTTCAGATTTATAGCCTCTGCCTTTATGGTCTACTACCTTAACTGTCAAACATCAAGTCTTGCTTATAATAAACATAATGTTAACTTTCCATTTATGTACTGATTAGCACCAACTATAATTTAATGCGCAATTTTTGCCAAGTGTCAAGGGAAGTGAGTTTAATGCATCCTACATGGGTAAAGTCCTCGGAAAATAAAACCATCTCATTATTCATCAATAAAGCATAATAAGTTTCATATCCAGGTGAAAGCTTTGTACGCGCTTCTGATACCATTGATAAAGCTTCTTTAGCCCTATTACAAAGAACCTCTATTGGATTGTCATGAGAGTTTTCAATAACTAGTCTACTCGGATTGAAAAAAAGCAAATGCTTTTTAGTACAAATTATTCGATTGAGGCTTTTTATAGTTTCTTTCATATATCTATCTGCTTTATCTTCTAATACAATCTTGTTTTTTTCGTTTAGATGTAAACTACGACTGACAAAAAATCCCCAAATATTTGGAAATAGCAAAGATGGTTCTCCGCGCATGGATACTTTTGAAGGAGTACTCATTGTCACTCCTGTACATAGCGTTACCTCAGTAAGTCTTGTTTCATTCACATTTTGTGCTCCTTCTTGGCTAAGTAAGCGCTTAAAATCTATGCTGTAACAACCATTCTTTCCAATTGCATCGCATTGACCTTTAGACTCAGATTTTGGAGCAGAAAAGCCTCCACCGCTCTTTTCGATGAAAAAGGAAATGCGATTTAGACATTCCAACAATAAAGGCTCATAATTTTTCTTATCGTAAAACTGTTCCTTTGGCATTTCAAATTTAATACTTGATTCCATAAATACGCCTCAAATCATATTCGCAGTATAGCCATAACCAGACCTAATTCTAATTGCCAATTATTGCTATAACGCCCACTATTTTTCTCTTTCACCACTTTATCGCCATATATTCAAATCTTCTAATGCCTTGTTTCAATATAATTGCTATTAATTATACATCTTTTGTCAAAACACATCCACAATTATCCTAAAAGAAAGGACTGAATTTATGGATAACATTTTCCAAAACTTAGTCCCTTATTGCGCTATATTTTCTTAAAATCTACCTGTTGCTAATATCTTCGTGTAATTAAATTATACTAAAATTCTTCAAAGCATCTTTAATTGCTTCTACCTTTTCAGGCGTTGGATGTTTTCTTGAATTTTTAATTCTTCTACTGCATTTGAAGCATCAAACATTGATAATCCCAAATCTCTTTTCACTTCTACAATATAAGCTGTATACACTTTGAATCCGTACTTGCTTTCTACATACTCTTGTATCATTTTATAGGTTACTTTTTCCGCTTGGTCTATAATCCTCAGCTTTTTCAGCAATCTTGCCTATAGGTATTTTCCCGTCACCTTCGCCAAACTCCACATTTACGTTGATATGTGTGTCTGCATTTTTGTGGGAAAGGAGTACTACCGTTTCAACGTGCCCGGTATAGTGAGTGTTCATCTTGTTACGTATTTTACTATGCATTACTATTCTTTGAAAATAGCTTCACAAAAGCATTTTCAATGACTCAGTTTTCATTTTTGTTCAGTTTTATATTTTAATGGATCTTAACATTTTTTATTTTAGGTGGACAAGACGTGGACAAGATAAACTGATGCCGAAGAACAACCTCAAGAATCCCCGACAATTCAGACATGTTAACACAACCGCTTCTATGGCTGTTTCGATTGAGGAAGCAAGTAAGTAGGGTATAGCCCCATTTGTTACGGTATCATGCGATTTCAAGCAGGTTCAATTGAGATAAATTTCAATCGTATGACACAAGTATGACACAGGTATGACACAACGGTATGACACAACGGTATGACACAAATTTTATATATTAAAACCCAGGTTTTTAAGCCTGGGTTTTTTGATTCGTGGTTTTCTTTGGACATCCTGATTAAGCGTCAGATGAGAATATCAGTGTAATTACACCTTGAAGTTATCTCGCCATTTTATCGCCACTTTTCTATAATAAATAAAATACTTTGACTTGATCATACCATACATTTATAAAACTATAAAACGCAAACAACTCATTTTATTTAATGCTAATTAGAAGTTAATCCTCAATAAAAGTATTTTTATATCGATATCAAAATATCGCATATTCAATAATATCTTCTATAATTATTAACAAACTTAAACTTTTTAATATTGAAATAAACCAAACCATTTGCCCTTGCTTCAAGCAGTTTGGTTTTAATTCTTTATGTGATTACTTCTTTCTATTATTTCAAATAGCTAGTTAAATCTAAACGCACTATCAAAATAAAGTTAATATTTTTAAAAAATAATAACTTATTGTCAATAGTAACACAATTGATTTAAGAAAATAAGTTAACTTTTTATAAGATGAATTCACCTTACTGACTACATACTCTTTGTTGTATAAAAGAGTAATCTTTATTTCAATATTTTTTTTACGTACACGCTTCATTCATGCTCCTCCTAAAATATAAATTAAAGGAGATACAAAAATACCAAGCTTTCCCAAATCTCAACTTACTTACTTACATAGTTTGCATTGGCAAGGAGGAAGTAAACATCTCAAAGAAACTAAGGATAAAAGCAGGCTCTCGTTAAAATAACGAATAAACATCACTATGTTTATCGATAAGAACTAGTTTTGACTCAGCCAAAAAGTAAGGAAATCTAAAACTAGAGAACTTAAAGTTTCTTTTTTTAGCATGTACGGCAGAAAAGGGAATGTTTAATAGCTCCATACTATTATACATTTATTTGTTCTATTTATAAAGGTTTCGCTAAAAATTAATGTTTTCAGGGATAAGATCTATTTGTAGATATTGTTCTATATAAGAATGCTATGAAGAAATAAGCTTGTATAACCAATAAATATCTTGGATAGGTTACAATAAACTGGACAATAAAATTGTGGGCAGGTAAAATAAAAACAATAAATAAAGGAGACCTGCCAAATGACCAAAAGACCAAGACGAAGTTTTACCGATGAATTCAAAAACCAGATGGTGCAGTTGTACCTTAACGGAAAACCCCGAAGTGAAATTGTTAAAGAATATGATTTGACGGCATCGTCACTTGATAAATGGATCAAACAACATCAGTCTTCAGGCTCGTTCAAAGAAAATGACAACCGCACTGATGAAGAAAATGAACTGATCCGCTTGAGAAAAGAAAACCAACGTTTATTAATGGAAAACGACATTTTAAAGCAGGCAGCGCTGATCATAGGACGAAAGTAGAGGTTATTCGAGCCAATCAAGACCGCTACTCGGTATCAGCAATGTGCAGAGTCCTGAATATCCCCAAAAGTACCTATTACTACATTTCAAAAAAGACGAATGGAGTCGATCCGATTATCGCGGATGTGATTGAAATTTTCAAAATGAGCCGCAAGAATTACGGAACCCGCAAAATCAAACATCAACTTGAAGTCAAAGGGATTGTTGCTTCCCGAAGACGGATTGGTCGCATTATGCGGGAGAATGGCCTCGTTTCGAATTATACCGTCGCCCAATACAAAGTCCATAAACAACCAGTTAATCAGGATCCAGTCCCCAATGAAGTGAACCGGGAATTTAATGGACGGGCACCACTGGAAGTGGCGGTCAGTGATCTGACTTATGTTCGGGTTGGTGGAAAATGGAACTATGTTTGCCTGATCGTTGATCTTTACAATCGGGAAATTATCGGATACAGCGCCGGGCCAAACAAAACCGCACAGCTGGTTTATGAAGCTTTTGCCAGGATCAGATACCGGTTGGATCAGATTTCAATTTTCCATACTGACCGGGGAAGTGAATTTAAAAATAATGTGATTGACGGTGTTATTGAAACCTTTAATATCAAACGTTCCTTGAGCAACAAAGGCTGCCCTTATGACAATGCTGTTGCTGAAAGCGCTTTTAAAGTCTTCAAGACAGAATTCGCTAACCAATACGCATTTGACAGATTGGATTATTTAAAGCTCATGCTTTCTGATTATGTCAACTGGTACAACAACATTCGAATACACTCGTCATTGGGGTATCTCACACCAGATGCCTATCGGAAATTAGCCCACAAAAAATCTGTCTAAAAAAGTGTTGACAATCCATCTCATCACCCCATATTTAAAAGCCCACACACCGTAAGGCCCTTTAATATAAGGTCAATTTTTAGTAATTCGTGATTATTACTTCTTTGTATTCTTTATCTTTTCCATCATACCGCTCAAGCAGCGAATTTCTCCGGCTGACTTCAATCAGGTTAAAGCCTTGGTACAATTCCCGGACAAAATCATCATTGTTATAACTCAGTATAAACTTTCCTTTGATTTCTTTCAAGCAGTCTCTTAATCTTATATGATCAGCATCACCAAAGCCGGCCTGATAATATTTTTCAGTGCCATGATAAGGTGGATCAAGATAGAAAAGCGCACCGGGCCGATCATGAACTTTGATGATCCGTTCAAAGTCTCTGTTTTCAATCACCACGCCGTTCAGCCGATCACTGATCTCGCTCAGATAGTCGGTACTTTTGATCAGGTTTTTCTTCGTCCCACCATAGGTCTTTCTATCAGCTCCATATGATGTTTTGATGATCATGAAATAACGCCCAGCACGTTGAATATCGGTTAATCCACGCATATCCAATTGAGACTTGAAGTCGTCGAAAAACTCCCGGGAATTGAGAACTCCGGTTATTTCTTTTTTAACCTCATCCGGATGATACTTCACGCACCGGAACAAATTGGTCAGCTGACCGTCATAATCATTATAAATCTCCAGATTGGCATGCTTATCTTTTGCAAAGAGCACCCATCCGGCACCGCCAAAGACTTCAATGTATCGATCAAAGTCCTTTGGAAACATTTCAATTATTGTTTTTCTTAACAGGCGTTTCCCGCCAATCCATTGTATAAAACTATTCATTTTTCCTCCTAAATATTAAATATGGCCACCCGAAGGTGGCCGTGAAACTCACTTGACAAATTTTCGGTCAAGATCATTGTATCTTCAATTTCAAAATGTCAAGATCTCTCTATATCTTAAAACCAATCGTAAATCCCTTGAACAACGACCTCACCAAATGCTGAAGCATTGGTCAATAACCCGATGTCGGGTCGAATACCGCCAGTCTCAAAGATGCAGGCCGTCATTCCCGTGTCGGCAACCTCCCAATCGTCTCGCTGGATCACACCCCGGGTACCGAGTCCCAGACGAACTTGAGCTGAAGCAATCAGGCAGTTTGCAATCCGGATTCCGTCGCCACTCCCTGGGTAGACGATTGGCAGCGTTCCGGACGGGGCTTTATTATAATCGCAGTGCAGCGATACATAAACATCAGCCCCCCATGAATTCGCTTCGTTAACGCAAACGGCAATGTTTTTATCATTGTCTGTGTCAGCATCGGTCAGGACTGTAAAGCCCATATTTCGCAGTTTAGTTGCAGCCACTTTTCCAATGGCCAACATTAAATCCGCTTCAGTATACTGGCCGTCCACGCATCCGCAGTCCCAAGAACCATCTGAGCTGATACCATGACCAACTGCCAGATAAATCTTTCCTGATTTCTGGCCTTGCACAGTTGCTGCAGGGGTTGGAGTCGGCACGAGAATAGGAGCAGGAGCAATTTCGAACGTAGATCTGTGATCGTCAACGCTAATTGGCTCAGCACTTTTTAATAGACGAATTGCTTCGATTCTTAGCCCCCCACCAGTTGTACCGGCCATTTCTCCATTTCTGGCAAAATCTAGCCATCCGACATTTTGGACATGAACCTGATAATTGAGATTTTCGCATTCAATTTCAATTGCCTCGATCCGCAGACCCTGGCCGACTGTACCGGCAATTTCATCTTCTTTAACCCAATCCATCCAGCCAATATTTTCCACATAAACACGGTATCGGTCAACGCCTTGGATTCGGATCGCTTCAATACGCAAACCCTCACCAACTGTTCCAGCCAACCGCCCTTCCTGGACCCAAGCACCCCAGCCTTTATTTTCGACATGAACTTTATATAATAATGTGTCAGCCATTTTATTCACCCTCACTTTCATTTTCTGTTTCTGAATTATCCCCGATTTGCTTCAATGCTTTTTTCAATATGTCAGGAATAGGCACCCCTAAATTTCCGGCGTTTTCTAATAAACTTAATCCTTCATTTGCAATAAAAAGCAGGCACACAATATTTTTAAAATATGCGCCCCCTTGGCCAGTTGCTAGATCGATCTGAACCGCTGTCATGACAACAAACAGTTCCGCTATCTTCTTAAACAGGCTTTTAAGCCCGATGGCTGATGAAAGTGTTTTTGTTACGTAAGCAACCATCAGACCGGTAATATAATCAATCGCCATTAAAGTCACTAATACGCACATCAAAACGTCCCATCCTCCAAATATCCACGTCACAAATCCTACTACTGCTGTAAAAATCCCCGATGCAATCGGGCTGTCTGCAAAATATCTCATTATTTTTTCCTTTCTTTTTGAGCAATAAAAAAACAGCCTAAGCTGCTGCGTTTAGAAGTTCAACAAGTTCTGTGTATTCTTCCTGAGTGATCCGATCGTTAAGTAAGAAAACATCAAGTTTTACCATCATTGCTTCTTTTGTTCCGTATCTACCATTTTTAATAACGGTTTTACAATATGAATATGTCATCTGATTTCGCCTCCTTTCCTATAATCCTAGTTCGATGTTTGATAATCTAAAATCCAGATCAACCATATATTCAGCGGTTGAATCCTCAATAATTTCAATTTTTTTCTCAATCGGAATATATGGTTGATATCCTTCATCTTTTACAAAACCATCTGATGGGGTGTATTTATAAGCTTGTGCCGAAACACTATTCGGAGCATCTACTTCTTTGTAGATATTAAAACATTCTGAATCTGCAAGAATACATTCAAAACCGCTATTATCAAAAACTTTAATTCCATTAGAAACAATATCAGCTTTTACAGCTATATAAACAATTGAATCATTTTTTTTATCTGTAATTATTACCATTTTATAACCCTCCTGTTAATGTGAAAACTTTTACCATCTCACCTGCGCTGCCCTTTGTTTTTGAAACCCCTTGAATACCTTCTGATAAAGTGCTTTGTTTTACACTTTCAATAATATTGATTATTCTACTGACAATGTATTGATTGCCGTCACTGTAAATATTCATCATTTTTTTTGTCCCAATAATTATAGGTGGAGGACTTTCCCGTACGTTTTGACTGTAAGTGATATAACGTGTTTCTGGAATAATATTATCCCCTATGAGGTTCAGAACCATTGCATTGTGATAAAACGGGTTTGTCCCACTTGCGAATGTCATAATTGATTTTGTGCTTGACAAATTTGTAATGCTGACAAAGAAGAAAGCAGAAAAATAACCTAAGAATCTAGATGTTGTATCAATTGTAATTGTATTTCCATTAATACTTACGTTGTAAAACTTGATTGAAGCTGGGCTTGTTCCATCAAGATGCAATACACATGCACGTATATCTGAAACAAACCAAACATAAATATTTGATGTTCCAACATAAGGTGTCAACACTACACTTCCGGCACTTATCGTAGTTCCAGATATTGTAAACACTACACAACCTACATAATTTGAAGCATCGAATCCGACAAGAATGGTTCCATCGGCTCTCTGTCTAAAAAATACTGATGCTGAGTAACCATTAAAAAACATTATGTCTGTTCCTCTTGTTGTTATGCTTGTCCCTGAAAATGTCAATATCGTGGCCAAACACTGTGAACCCCAACAATAAGTAAACAATAATGTTGAGCCACTTAAAACAAGCACATCCAGCGGCGCAACTCCAATATTATAGGCACCACCTAAACTCAATGAGGTTCCGTTAAAACGAACTATTTTTAGTGTTTTTACTGTGTTGCTGCTCACTGTGTAGGCAATAATAGCTGTAGTATCCGTGAGTTTTTTAATTTTTAATTCACTGTCGATTTGAGATCCACTTACATTGATAGGAGTAGTAACTTGAGTTATTGTTGCACTTGTAATATTTAACACCGAAGCGTAACAAACCCCATCGCTTCCTTTTCTGTAGCAAATCATTACTTCCGTATCATTTAATTTTGCTGCCTTAATATAATTGACTGAAAAATTACCAAGGGGATTATTCGCAGTTCCAAGCGATATACATCTAATAAATTCAACAAAATCACCTGCTGAAACTGTATTTCCGGCTTGGATAATATATTCTTTAATAATCCCATTTATTTTCGCCCCACAGCTTTGTCCATTTAATCTCGCTCTACCCATATCAACCACCCACCAATTCCACATTAATTGCCGTTGTCGGTATTTCTTCCAGACAGGTAACCGTCATCGTATCCGTCGTACAATCAATATAGCTGATCGTATTCCATGCTTCTTTTTCTAATAACGCCGTTTCCAAAGTTGCGGAATAAATCGGATTAATGTCGGGTCTTGAATCAGTCAGCCCAGAAACTGTAACGGCAACCGAATAAGGTGCGGTACCACTCCATCCTGTTGTAGGTATGATTGACGTTAATAGCCTTTCCTGAAGATCAAGTCGTGTGTCAAGCGACGCAATATCAGCCGTATGATTGCTGATCGATGTTTCAGCTATTGTCACCCGATCAATTAAATCATTTATTTTATTTAATAAATTCGCGGCTGTGTTCTCATCTAATGTATCCTGTAAATCTGCAAACCAGGTATTGAAACTACTTTGAAATGCTGATAACATTACCGCAATATCTGTTGTTGCATCGTCAACCGTTTCCAAATACCACGCCTGATACTGATTAAATAACGTCGTCGTATCCACCTGATCAAACAAACCATGCACAATCCCACAATATGCCGTATTTAACCTCAAATCGGTTATATTGGACTGCGATATACTCACCGCACCATTTTCAATGTAAATATCCGCCAACCCTAACTCATAGGCATCCGCATCTCGTTGCAATGCCGGAGCTGCTGGTGAACTGGCAAATGATCCTTTTTTTACCTTACTGTAGGTGTCACGCTCTAAAGTTATGTCACTTACAACAATACGGTCAATTCTTTTTAAAACGCCATCTGCTACCTCAAGCGTAATGACCTTATCCGCCGTATTTTCATAAAACACGCCATTGACCCACGCTTTTCCGGCCTTAACCGTCACCGTCATGTCGCCGTTGGCAATTACTTGCAAATTGGTGCTCGGATTCGGATAGACACCATTGCCGATAAAACTTCCTAAAAATCGTGCCCAAAAATCAGCCTTGTATCGCCGGTCCCCATTCGCTGAATTATGAAACCCACTAATTTCTCCCATCAAGCCACCCCTTTCATAATAGTTTTATTTTCTGTGCAATTGTCCGGGGCATCTCTTTCCCGAAGACAATATTTATTTCCATGCCTGATTCCTCATAGACTTCTTCAATCTCATTTATCCGGCTGTCAATGGCAATTCCCCATTTTCTGGACAAACACGTCACAATATCACCAAGATCAAAATCCGTTTTGTATCGTAAATTCGAATTCAGGTTTATGCCATTCTCAAAGGTCTGCACCTTTTTGGTGTCGGTGAGCGTTTCATTTCCTTTACTGGCTAATAAAGCGTTGTACTCAGCCTCTGTCATAGCCACATTATTAACCATATTCGATAGGCCCTTCTGATCATTGAACACTTCAAACCGTTCCAGTCCCGAACCACTTCCCACCGTCACAAGACGCCGATCAGCGTCTTCACCGATTCCTCCAACTAACACGACATTCTTGAAATCCATGATGCTATCGGTATATTCCTGATCCAGAATATTGTCAAATTCTTTGCTGAAAATGCACTGAGGATTAACCGTCTGGCTTGATGTCCGATCCAACCCTTGAAAGATTTCAAACTTTAATTTCTTTAACGACTTGTCAAATCGGACTCTATTTCCAAGTTCTGCTTCCATACATAATGCCTCAATTGTTTTGAGTAAGTTCTGGTAGGAAACCTGAAAATTAACATTACCAGCAAAATTGCCAAGATCACCAAGTATCAGCGTTTCAATAATGCGGTCTGCATCCGTAGGATTGATACAGTTTTTATCAACCAACGCTCGCATCGCCAGCTCATAAGTGGTATTGAGAATTTCGGTTCCCCAAATGATGCGCCGATTCAGATAACCTTCTCCCAATTTTCCTTTGACAATCAGGTTTTCTTTTCCTTCTTCATCCTTTTTAATATTTCGGTATCCAATGTAACCAACCTCATCGCTGTCATTCTTTCTGATGACATTGTCCTGGGCCAACAATAGGATATTTTCGACGGTAAATGGACAATGTAATTCAAATTCGCCACACTCAGAATAACGCCTTACCCAACGAAGGGAACCATAAGTATCCATAACATTCTGCAAAGCCAGCGCTTTATTGTAAATATACAGCTCCATCCTACACCCCCAGATAATTGTTGTAATGGTAGATGGTCACTTCCAGATTATCCAGTCCGGAATCGGCATCATAACGAAACAAGTTATCACCTTTATCAAGCTGCAGGAAGGTTGAATCCTCATCGATGCTATAAAACGCATTTGTTTCCACGCCATTGAGCTTGCTAATAATCCGCTTATCCCCAAAATAGGTGGATATTGAAATCACTTCCCCGGCTGCCATGGCTTTCTTGATCTTAATAAATTCCCTGGTGTTGACATTAAAAAGCGACGGGTTAGTGAGCGTAGCCAATGCCTTAAACTCAATCCGGATACCCGTTTCGACATCGCCATCATTCAAACAGTTCACAATCAGACTCGGTTCCCGGTGACCGATCTCAATGCCGGTGTCCTCCGGGATCTCCAAATCAAATTCAAAGTCTCCTACCCACAAGGCAATTTCATCCCGGCTTTCCTGTAGATCCTTCCAGAATGGCTCATAGGCCGTTAGGTTAATCAGACCGGTACCGGATTTAATCGCATCCTTTAAAAATGGGATCTTTTCCGGGATGCACTTAATTTTACGTTCCTTAAGATAATCGTTATAGACCAGATAGCCCTGGCCAAGCTTCGGGTTAAAAACCCGGTAGAGCTTTTCTTTGTACTGATTATATAAGCCAGATGTACTTGCGATAATCACAACCGTAAGATTTACGTCTTTGGGATCTAGGGTGTTACCAAGATAGGTTTCCCCGTCCTGGCCAACACCTTTGAAATTATAGTTATTAACGCCCTGACTTTCTTCAAATTTCTGCAAAATAAAAGGGGCTGAATTGCCAAAAAGCAACTCTTCCCCTAAGGAATTGATGTATTTTATTTTCCGCATTCCAGCCTCCTAAGTCATTAATAATTCCTGCACTGACCGCTTTAACAGCTTAGCCGTTTTGGCAGGCGATAAAGCCGTTGGGCTGTTAATGGTGACCTTCATGGTCACATTGCCTCTTGCAAGCAGCTCGCTTGTTTCAGCATCGTAAACCCTTTCGCCACCTTTAAAATTAACCAGCTCTGGGCCTTTTTCTCCGACCCAATGTAAACCTGCAGTAGCATAATTGGTTCCAGATGCATATCCGAAGATACTGGCCGGATCTACCTGCTCACCATCTTTAATAACGGAGAAATGCAAATGGGGGCCAGTGCTATTTCCGGTATTTCCGGAAAGACCAATCGTCTGCAGCTGGGCGACTAAGTCACCAACATTTACAAGCACCTCGGAGAGATGCCCATAAAGTGTTTCAAGACCATTACCGTGGTCTATGGTTATTGAATTTCCATAACCTCCATTCCAACCGGCTTGAATTACTGTCCCAGCTCCGGCGGAGCCAACAGGCGTTCCTTCTGGCACGCCGATATCAATCCCTTGATGATATTTTGAACCGACATCTCCAACATCATCACGATTGCCGAACCATGAGGTGATACTTCCGTTTACTGGAGCTACCAAACTACCAAAATCAGAACCGCCAATACCAATGCTCTTGAAGAATTCTGCTGCACCGCTACCAACGAAGTCAATAGCAGCTTTTAAATTGAAATTTCCATTGGCAAATGCTGATTTGATATCTTCAACCATGTTGTTGACAAACGCCATCAAATTATCACCGTTCAGGCCGTTAATAAGACCTTGGACGATATATTTTCCAATTTCAAGCATGACCCTGGCAGGTGAGTGAATTCCGAAGCCTTCTTTAAACTTGGTGATAACATCGTTGACAAGACTGGTTACAGCTCCATAAACATTTCCAGCAGTTTCCTGAATTCCCGCAACCATTTGATTTAACATGTCGCTAGCAATGTTTTTCAGGTCGGTCGGTAAATTTTGAATTTTTGAAATGATGTTGTCTTTGACTTCCTGCCATTTTTTCCCGGCAGTCTCTTTTATTTCTTGCCATTTCTCGGGCAAGTCTTCAACAATTTCCCTTGCTTTATCAGTAACATTCAGGAAAATTTCACCAGCCTTTTGAGCCAGATCATCCCTGATCGCTGCCCACTTCGTTTGAGAATCATCTTTGCTGGTTTGCCATTTGGATGCCACATCATCAGCGGTTTCTTTTATTTTACTGGTAACCTTTGAATAAATTTCACCAACCTTACTGGCCAGATCATCCCGGATGTTCGCCCATTTCGTCTGAGTATCACTTTTTGTTTCTTCCCATTTAGCAGCAACACCCTTTGCCATCTCGGTTATCTTCCCAATCGTGTTGTCATAGATCGTTTTCCAGGCATTCTCAAGGAAGGTTACAACCCCATTCCAGGTATCGGTTGTATGCTGTACAATGCCATCCCAAATACCTTTTATAAAATCCAAGATACTTTGAAATATCAGGCTCACCCAATTGTAAAGCCCTTGAAAAACATTAGCTAGAAAATCAACCGCATTCTGTCCCATAGCCTTGGCAAATTCCCAGGCTGATGCCCAATCTCCATTTAGCAGGGCAAAGACCATGCCGACAAAATTACTGATGAAACTGAGCAGATTACCGATAGCTTCAATAAATGGCGCAATGGCCACAATAATGTTCGCAAAGCCGTCGATAAAACCATTAATAAAATCTTTAACGATTGGTATTATCTGATTCCCTATGAAATCACCGATCTGTCCAAGCACCGGGCCGATCCCATCAATAAAACCCTGGAACGCCTCTTTAGCCGGAGCTAACGCCTCAGAAATGCGACTAAACGCTTCAAATGCATGGACGCTTACGGAGTTAAATGCCATTTCTGCCGATTTTCTAAACGTCTCTGAATTCTGCCATGCGCCGACCAGTATCGCAATAAAACCAGCAATAGCCGCCACAACAATCGCCACCGGACCCGTTAACGCCGCCAAAGAAGAACCCATTCCCACAGCCCCCTCGGCACCAAGGCCAAAGGATGCTGATGCTGTTCCCAAGGCTCCGTTAAGCATACCCCCGGTGGCAAATAGTCCGGCAACGTTGGACACCGCCCCAGCTAAACCGCCTAAAATTAATAAAACCGGGCCAATAGCTGCTGCTACCATCCCGATTTTTACAATAAACTCCTGTTGTCCCTCATCTAAGCTGTCAAACCAATCCGCCACACCTTGTATTTTTTCCGCTGCTGTCTCCATCATCGGAGCCAGCACATTCATAATGGTTTCGCCAAGCCCAGCCAAGGATTCCTGAATGTTTTGCATCGACATTTCAAACTTTGCGCCACCATCCAGCAGCTCATCATAAGTTCCGTCTAAGGTTCCATCAGAATTTTCAACGACTGCTAAAAACTCCTCATAAGAGAACCGACCACCTTTGATGGCATCGGCTAAATCAGGTCCCGCCTTTTGACCAAATGTCTCAATGGCCATCGTCGTTGCGCTGGCAATATCCGGCGTTTCTTCAATGGCTTTTAGCGTCTTTTTAAATTCTTCCCGGGGATCTTTACCCGCTGCAGCCCAATTGGAAATGGCTTTCTTCATTCCGCTAAAAGCGATCTCGGTATTAACCCCAGCCTTTTCCCATCCAGCAAAAATCGCTATAGATTCCTGAGTATCAAAACCCAACGCTCGCATTGGAGCACCATATTTGGTCAGATTCTCAGTCAGTGATTCAACCGAAATTCCAGATGCTTGACTGGCAGCTGATAATTGATCAAGGATTGTTTTATAATCGGCTGTATCAATCCCTGCGTCGCTCATTGCCCGGGAAACAAGCTGGACTCCTTGGGTGGCATCCACTCCGGTAATCTCAGCAAATTTTAGAAAGTCTTTACTCATACTTTCCAGGCCATCGCCAGTGGTTCCAAAGCGGGTATTAACCTCCCCAATCGCTCCACCGACATCGTCAAAACTACCGATGACTGACCCCGAAACATTTTTGAATACTTTTTCTAAATCGCCGGCAGCATCGCCGGTGGCTCCGGTAGCCTTAATCATAACGTCCATGCCATCATCAACCGCATTAAAGGCCACCACACTGGCAGCCCCTAAAGCAACAATCGGAGCGGTCACATATTTTGAAAACCCTTCTCCCGCTGAATTTAATCCATTCCGGATACTGTCAGCCTTATCAGCCACGGCCCCGAACTTTTTACCTAAGATCTCGGCATTATTTCCGGCCAGATCCATTTCATTATTGGCTTCGCTCGTATCAACAAAAATCGAACCAAACAGTTTAAAGATCTCAAACGCCATTAGCTACACCCCCTTTCAGGGTAAGGTTGATGATCTTTTCAACTTTTTCATTAATTTCGCTGATCGTCTCTGCTTTCGTTTTTGGTGCCGCTCTCGGCTGGGCGCTTTCGATTTTGGCAAGTTCTTTATAAGCTTCAAAGGTGATAAAGTTCTCTACCCCCATATGCCGGTAATCAACTAAATAACGGTCCCACAATTTCGCATCCTCTTCTTTTTCAAAGGCTTTGCCAATAAATGCGAGACCGCTATCAATATCCATATTTAAAATATAGTCGATGTTGTTATATCGTCTTAGGAGCAACTCCTCGATGTCAGTAACATCTACTGAGTTGCTGACTTGAAAAAAGATGCCCACTTCTGAGCATCGGCCACATCTTTCAGTTTTTCAATAGTATCCATCAAATCATTCTCGGCCACTTCTTCCGGTTTGCATTGGAAAGGCCGGGCAATAAAAGCATAGATTTCATCTTCGGCTTTCTTGTTTGCAAAGATTTCCATCACCGAAAAAGCAAGATCAATCCCGACCTCTGCCTGGGATGGTTTTTCCTGAACAACTTCTGGTGTTTCGGCTACTTCATCCCCTACCACTGTCAATTTAGGCGGTTTTTCTTTTTTCGGAATATTCTTTGCAACCTTTTTAAGCTCATCCTTCACTCCGGTTCGCTTAACCATCCGCATAAATTCAAACAGATCCGCTGTATTTAGTTTTCGTACATCTTCAATCATTTAATTATTCTCCAATTCTGTAAGTTTCGGTCATGGTCGCACTGTCGGCCATACCGGATTTGATTGCTTTTGCTTTTAAAATCGTGTCAGCTGCCACAGTAATTTCAGTGGAGTAAGCTGTATCATCTGCCGTTGGCTCAAAACCGTTGGTTGTGTAATAAATCGTTGCGCCCACTGTTGCACATGTTAAGCTGACAGTTTGGCTGGTTGCATAGGTTCCACCCTTCACGCTGGCAACCGGAGTAGCAACATTAGATCCTTTTGGATAATAGATCCGATAAGGTGGCGCATCCAGGGTGCCTTCACCAGTGTCCTCGTAATGGCCATAGACGGTAACGGGGATGACCCCTTCTTTTTTATCCTCAACCTTGATATTTAACCCATCGGTTGACAGTGCATTGAAGACCTGAATAATAATGGGCTCCTCACTGCCGGTAATGGTGCCAATATAGGTGATGTTATCCACATAATCCCCATCCTCAAAGGCATTTCGTCCGGTGATAATGTCATAGGTGCCATTGGTGGTCGTATCAACATCAGCAGCACCAAGAGCCATGGCTAAAATTGCCGGGGTGGTTTCAATAAAGTTCATGGTCATGGATACATCAATATAATCAATGATCTCAGTCCCCTTGCCTTTTCCGGGCAGTCCATCAATCTCAATGTTTCGAATCTCAGCAGCCGCCTTAAACTCACCACCGCCCTGAGTAGCTCCAATGAGTTTTCCACCAAGTCGGGCAGATTCATAGGTGTCCGTACCGACAATAAAATTTTTAAAAAACGCACCGGCACCAGTATGGAGATTCTCCATGGTTTTCGGATTGTAACCTGTTCGTACTTTTCCCATTTTTTATTCTTCCTTTCCGTAATAGCGGACCAAGAAAGATTCATTAATCCGCTTAATAATTGTTTCATCCAACCGTTGCCGGTCATCATTTTTATAGATTGTAATGCTGTGATTTTCATTTGTTAACGTATATTTATTCAAATAATCGCCCACATTATCCGCTAATGTTTCCAGTTCGATGGAGTCCGGTTTGTCCGCCCAGTAGTCCAGTTCCAGTTTTTTACTGGCCCCGATATCGCTTATCTGAAAGGTGATATAAGGGTAAGGAGTAGTTTTGGTCGCCTTCATATAAAAAACGCCCATATGGACGTTTCGAATGATTTTTTTGATTTCTTCAATTAGCAGCACCGTCTTACTCGCCATCTGAGCCACCTTGATAGTCCTCTTCATTGATTTTAGCCAATGCAGCCGCTTCGGATTCCAATGAGCTTAAATATTGAGATTCAATCTCAACGATTTTGGCAATATTGTCCTGGGTAACTTTGGTCAGTAAACCAAGCGCCGGAGTCTTTGATGATCCCTTTTCCTGGAAGCCACCATAAAAGGCGTTAGGTTTCAAACCCACCTGCAGATCACAATCTTTTTTTCGCACCCAATACTGGGTAAACTTGCCAACCTTGCCCCGGCGTTTTTTAAAATGTCCATAATAAGCCAGACGAAATTCTTTTGTCAGATACTTACCAACATCCCGGAGGGCTGCCCGGGTTAATTCAGACAGGGTATATTTAACCCGATCCACATTTGATGTATATTGAATCGTGGTTTTCCCCTTCTTAACCAATACTTTCGTCACTGATGGAGGCATCCCCATGTTTAATCCCCCTTTCAAGAACTACTTCGATATCCTCACTGTCAACCGCATAGGTCCGGATCATGGTATAAACCTCATCCTCAAACTTAATATAGCGCTGGCCTGCATAATCAGCCTGTTTTAAAGTCAGGGTGATGGATGGCTTATAATCAGTGGTCGCTGCCTGATAAAACTCCGACATCCGGATTGATTTCTGATCACAGAAAACATAATCTTCAAAGGTAACAGCCTCATACTTTTCACCGATGGCGTTTTCTGCTTCAGCTTCGATCCCCAAATAACAGATACTTATCCACATTTACACACCCTCTTCCGGTAAAACAATCACTTCGATAGGTTCCACATTATAGTCACCACACAAAGCCAGATGCCGTTTAATGGCTTCGTAGCTTTCCATATATTTTTCACCGTCTTTGTTATCAAGGCCGAAATTGGCTTTTACGTAGGTCTTAACCGCCTGCTTAATCAACGGGTCGGTATCGTCGATGATTTTCACCCCGGATATGGAAAGATCCAGCTTACAGGCTTCAATTAGATCGGTTATTTCTTCATCGAAAACAATATTTTTAATCCGTAAGGCATTTCTGATTGATTCAATCATTTAATTCACCCATTAAAAGGGGGCATTGCCCCCTAACCCTTCTATACCTTTTTGATAAGCGCAAATGCCTTATTTGTCACCACATCACCATCAATAATTGAATAGCTCATGTAGGTGGTTGTTCTGGCCTTAATATGATCTTCCTGATATAAGGTAATATCCTGATTAACGTTCATGGCATAACCTCGGCCATAATTACCAATGAGAATATTTCCTTCGGCCGCCGCTTCTTCTTTTACCGGCAAGCCAAACATACGACCAACACCGGCACCAGTAGGATCGGGAACAAAATAAGGATTTCCCATTTCATTTAAAACATTGGCCAGCTCATTCCAGATTGTGGCATTATCGGCGTAAATGGCTGCCCCACTTCCCAGATACCCACTTTTAATTTTTGCCAAAGCCGATGTAATCTTTTTATAGGTCAGGGGATCAGCCGTCGCAAAGGTAATAACCTGTGGCGTTCCTGCTTCTGCATTCAAAGCTGTTACCACACCTTTAGGCTGAGCTTTAAAGGTATCGCTTTCGCCTGGTTTTCCTTTTCCGGTAAAAACAGATTTAGCAATGGCATTCCCCATTTTTTCAGCAATTTTTCTGGCAATATAATTTAAGAAATCACCCATGGCCATTTTCTTAATCTTCCATGATACATCAACGGCTTTCGGAAGTTCGCAACCCGTTAACTCAACCGTTCCAAAACCAACATCATCTCCCTCTGCCGAGGTTGCTTCATCAATCCATTCAGCATCGGTAATGCTATCATCGTCTTTAATCAGCGTAAGATCGCCGGGGACAAAGGTTTTAAAAATATCCTGCAATACAGGGTGAGCATCGGCAATTTCCTGCCAGATTTTAGCGGTTACGGTTTCGGGAATCACCACCTGATGATCGGTGGCAGTTTGAACGGCATTTCGATAATCGGTATTGATCCGGTCGAATACCGCTTTTTCCTCCTGTGTTGAAGGTTTGTTTACCAGAAAATTATAAAAGGCTCGTTCATGCAACTCTGTTTCGGTCGTTGTTTCACCAAAACTTGCAAGTACTTGTCCAAATTCAATCCCTTGATTAACAACTGACTGTGTTTCGATATTTACCACCGGCGCCCCTCGCAAGGCTGCAGCATTCGCCTGGGCCGTTCGCTCGGCTTCAAACTGGTTATCCAGAGCCGTAACCTCGGCCATTTTCGCATTGGCATTTTCCACATCGCCACTATTAATCAATCCATCGACCTCTGCCAACAATTCGTTTCTCATTTTCAAATACTGTTCTTTAGTCATTTTTTACATCACCTTTCAGTTTTAAATAATTTAAATAAGCCTTTGCTGATTCAAGATTCTGATCAACAAGGGCTTTTAGTTTGTTTTCTTGATTTTCATTTTTCTCCGGAGCGTTTCCCCGGGATTCCCGCATTTTGGCAATCACACTAGGGCTTAACCGGGGGATCGCTGCGTACATGGCTTTGGCGTTTTCTTTCAAAACACTATTAAATAATTGATTCTGATAGAATCCCTCTTCATCATCAACATTAAACAGCACCTTATCCACAAGCCCCAGCGCCCGGGCATCATGGGCAGTCATCCATGTGGTCTCATCCATCAGCTTTAACGCTGCCTCCATGCTCATGCCAGATTTAACACAATAGGCATTGGCAATGGAACGATTGGCTTTCTTTAAGCTGTCCGATGCGGAATCCATATCCCGGTAATCCCCACTCTGACGCGTCCACACATTATGGACCATCATCTGGGCGGTCGGACTCATTTCACAATAACCGGCCATCGCAATCACGCTGGCAGCACTGGCCGCCAAACCCGTCACCTTGATTTTCACGTTGTTGTAATCCTTAAGGGCCGTATAAATTTCCGATGCAACAAAAATATCACCACCGGGACTATTCACCGAAACTTCCAGTACATCACCATTAGCCGACCGAATCTTATTACGGATATCTGCTGCCGTAGTGCAGGGCTGTTCAAAGTAATCATAGATCCACTTATCACCATCCGGGACAATCGTCCCTCTTACTTCAATTTCAACAGGCATTCTTATTCACCTCCGTTCTCAACTTTTGTGTATTCTTTCACCGGCTGTGTGTCAAGTCGCCGGATGGCTTCATCCCCACCGGTTAATGGGGTCAAGTTTCCTAAAATTTTACGCCACTCGTTAGGTGTCATTGATCCCCGATCAACCGCTTGGTACAATGCCAGTTTAGTGCTCATGCTGGCATACTGCAGATTGGAGGATTCAAACATAATCGAATTACCAAAACCCCGCTGTTTCCGGCTAAATAATTTTCTGGTGTATTCTCCGGATGCCTGCAAAGCCCATGGCTCAATCTCAGCTTCATAATAAGCATTCCATTCATCCTCGTTATACCGGCTCTGAATGATCTTCTCATTGGTACCAAAAAAAGAAAAAATACGCTGCGTGGTTTTATCCATCTGTAGCGCATTGGGAACATAATCATGGGGGGTGACCTGAATAGCATCCATCTTGGCATCGGTTGATGCCGCTCCCCCAGAGTTTTCGATACTTAAAAAGGTATTTGTAAATTGATCAGTCTCTTTCTTGAGATCCTCCGGTCTCAGGGTCGTATTAAATTTAAGCAACCATTTTACGATCGCACTATTTTTAATCGCCTTGATGATCCCCTGATCAGTGGTATTAACAATTTCCATCAATGGAGCCAACGCCTGCTGGGGGCTTTCCCCAAAAATATCATTGGTGTTAAAATCCTGTCTCAGGTGAATCACATCCACATAGGGGAAGGTGACCAGTTTGCCATTAAGCAAAAAGCAGCGCAAAAACAAATCCCCGGCTTTATTATAAACCGCTTCCACGGTTGTTGCCGGAATTGGATAAATCGCCACCGGCATTTCACTGGCATCCCTGACAATATAAGCAAAAGCATTATTATTAAGCTGCAATTGCGTGGCCAGCTTTTCCTGCAGCATCTGCCCGGTCATGTAAGGATTTGGTTCCTCCAGTAAAAAACGCATGTAAACCTCCGGATTCACCTGAAAATCCTTTCCGGTTTGCCGGACATGTTTAGCGGTCAGCTTACCAATGGCTTTTACCTTTGGCCGGATGCACGACCTCACCAGGTCAGAATGATAAAGATTCCCATTCCATGCAAAGAACCCATTCCCCTGTTCGGTAATCATTTCCATTCTGGAAACAGTTGGACTCTTATTAAAAAATTGTTTTACTTTTTCAAACAAGGCACACCTCCTAAATCATATTTAAATATTCGGCCATTTTATCCCGAAGGATGACCTTAACAATAATCATGGCCACAGCCCCATCAATTTTCTGTGTTTGCGACACACCCTTAACTGGTTGAATATTCCCATTGATATCCACCTTCACTTCCAGATTCTTAAGACACCACTTATCAATCGGATGGTCATTATAAACTGACTGCTTGGCGATCAGCTCAGCCTTAAGCTCCTTCATCGGCATGGATAAGGTATAAGACCCCTGCCGAACTGAGATCATTGCATTTTTACCAAAGTGATTTTGAAAAGCCATCAATAAACTGGCATCCACATGCCAGGGATCGTAACCAATCCAGGGAATATAAATGTCATACACATCTTGGACTTCAATAAACCATTCTAAAATCGCATAGGGGTTAATCCGGTTCCCCGGGCAAACTCTCAGCAATCCCTGCTTTTCCCATAACAGGTATGGCACCTGATCCAATAATTCTTTATTATTCAAATTTTCTTCCGGCAGCCAGTACATCGACAGATAATAGTCTTTATCATCATCCCTTCTTTTGCAGACAACTTTTGCTGCTGCAAGGTCTGTTGTTTCAGCTAAATCAAAACTACCAATGCCATACCGAAAGCCCATTTCTTTCGCTTCGAATTTTTCCGGGTTATACAGTTCTTCCCAGCGGAGCCATGCGGTAGCAGCGTTTTCTGTCGCGCAAAAATCTTTAACCATGACTGTGGCTTTAAACGCCGGATCTTCTTTAGCCTTATTCACAAAACCCCGAAGAACTTCGATTTTCTTGATAACACCAAGCCCCGGGTTTGCTTTAATCCAGCATTCTTCTTTATCCCATTCGTCCCGGTCATCCAGCTCATAGATAAATGGCAAAAATGTATCATCAACTACCTTGCCATCCAGCACCTTACAGGCATACTCATACTGACTGTCAAAAATGCACTCACGCACAAAACCATTGGTCGAGATACAGGTTAAAAGCGGCTGATCCCGGGAAGACGTTGATTGGATCATCAGATCATAGAGATCACGGTTCTTAATGGCTGCCAACTCATCGATAATAACGCAGTGCGAATTCAAGCCATCCAATCCATTTACATTACTGGCCAAAGCTTTAATAAAAGAGAAGTTGGCATCAAAGAATAAGTCGGATTTTCGTTTTCTGATATGTCTGGACAATGACTGATCTTGCTTAATCATGTTCCAGGCTTCATTAAACCCCTTCGATGATTGTTCCTGCTTGGTCGCAATGAAATAATTCTCAGCGCCGCTTTCACCATCAGCCACCGTCATTTCGATGCTTGTTGCTGCAAGCTCGGTTGTCTTGCCGTTTTTCCGGCCCCGGATATCCAATACTTCCCGGTATTTTCTAAAGCGGGTATTTTTATCAACAAATCCATAAATTGCCTGGTATTTAGCTTTTTGAAAAAGCATCAACTTTAATGGCTCACCCAATACACCCTGGGACTGCTTACAGAAAGTCTCAATAAATTCAATCGGGCGGTTAGCCAGATCTTCATCAAAAACGAATAGCCCTTGGTGTTTGAGATCATACATCAGCTTTTCATAAACCTGTTTGATCCGATAGCAGGCAACAATATCGCCGGACATGATGGCATCGTAATATTCCTCAATAAATTCTGCTCGGCTCATTTTTTAACCGCTTCCTTTCCGGACTGGAAAAACTGCAGGAGCTGATCCTGCTCTTCTTTCTGCTCCTTCGCAGGCATCAAGTCGATTAACTGCTTCATGATATTATCATACTGCTTTCCATAATCCCGAAATGCTTTTGCTTCGGGTCTCTCTCGATCAAAAACCTGAGAACCATTTTTAAACTTTTCCATCAACCCTTCTTTGATCAGCTTCTGCTTGAGTTCCTCAATTGACACCCTCATAAAAGCAGCATCAGAAATAAGACCTTCCAAAACTTTGATAATGTCTTTATCCATCTGCATATTTTTATAAATCTTCAATATCCGGTTTTTCTCAGCCCTGATCTTCTTTTCTTTTTCTAATTGTTCGGCTATGCCCAAAAATATACCCCCCTCCTTTTTTGAAATTTTCGTGCGGAGGAACAAAGAGGTATCCACTCCGACGGTCTCCTGATGGCCCACCCCATGTTTTTTTAGGGGGGCCTATGCTTTGCGATTTCTAAAATAATTTTTCAGAATTTCTTTTTTTAATTCCTTATCATTGCACTCAGCATCGTTCATTATGTTTGCAATACAAGATTCAATATCAGTATCAATTGAAACGATGACTGCATTCAATCGCCCAGCAATTAAGTCACGCTCTTTATCCTTTGGCAATGAAGCAACGATCCAAATGTTTCTTGCATCGATCTTGCCATCAATGATTAAGCGATACAGATAATCAATCACACCGGCAACAGTCTCAGTAAGATTGTCCGGCACTTCATCCTTACCACGTAGGCTCAAGGCCTGACCAACCTGGTTGAAGTCAATGACCAGATCACCATGATCCATATGATCCAGTACATATGTTGTCTTCCCAGATGCTGGAGCACCACAGACTAACCAACGCTTAACCGGCTGAGGATTCCCCTCATCATCAAAGTACATACCGTTGTTCGTAAGCCTCACCCTTTTCCTAAAGTTATTTGATAATGGATTAGTCTTACGATGTTCATCGAAGTGACAGTCACGGCATAACAGCTCAAGGTTATCCTCACCATAAACTATTCCAGGATCATGGATATTCTCAGGCGTCAGATAAATCTTATGATGCACTTCTTCACCTGGTCTTCCACACCTTTCACAGATACCAAAGTTCTTAGAAAAGATATATTCTCTTTTAGTGATCCAACGTTTAGAGTTATAGATCTGCTTTGCAAATATGCCTGCCATGTTAGTGTTGGTATTTTCTTGGAATCTGTGGAATAACTTTTGTGAATCTAAAAATTGATCCAGACCCATATACTGTTTTTAGGATTCCATTATCGTCGATGTATTCAATTGTTACATCTTTAATTTCGTGGCTTAAAATCTCACCATCTCCTCTAAGCGTTACTACTGTATAGTCAATATCTAAAATATTATCAATAGGTCTGCTTCTTTTTCCACCAACGCACATTTCTACAATAAATTTATTTGGATCAATCTTCACAAATACACCTCAATTCTTCAAATAAAAATCCGAACATTATTTGTTACTTCTTATGTTATCGTTCGGGTTTTTCTGTTTGAATGTTTAATTTCCTTAGAGAATCACACATTCAGTTTTTCAGTTATCTTCTTACTAGTGTATAAGAAATTCAGACCTTCAATATTCACCCACTCATTTTTTAAACATTCAAGTACAAAAAAATAAAAAAAGCTCACCGTACAAAGTCAGCTAATGCCTTTGTGTACTCGTGATACTTCTCTTGATCCAGTCCTAAATATAGTTTTGTCTCTTCAATGCTCGAATGTCCCAGCAGCTCTTTGACTGCCACAACATCCTTTCCGCTGTCCATGTAAATCTTGTAAGCATAGGTTTTACGCATGCTGTGCGCCGTGATCCCTTTGATCCCAAAATAAGCAGCAGCGTCTTTCAAAATATTGCTGATTGCCTGAACGCCAATGGCTCCACCCTTCCTAGATGGAAACAGCCATTCATAATCCCGCTTATCTTTGATGTAACATTTCAACTCCTTGGCTACCTTGGGAATAATCTCAGCCTGCCGGGGTTTCCGGTTTTTCTTTCGGATGTTCTTAGAATTATATTTCTTCCCTTCCTGAATCAGGAAGTACCCATGCCGGATCGCTTCCCTGGCATCACGAACCTTAAGACCAACTAAATCACCGGCACGATAGCCGGTTGTGATGCCGATTAAAAATAAAATGTAATTACGTCTACCCTCAACCGTTCTGTTAGATGCCGCTTTTAAATAATCTTGCATATCCAGAACGTCCTGGGTTTTCTTGATTGGTTTTGACGGTTGTTTTCTCACTTCATTTCTTAACCTCCCGTTCCAATCTGATCGCTGGCTTCAGGCATCCAGTCTGTTTATATGGATCACTCAACAACCGCTTATCCAGACATTGACCATCCCGATTATGCGTACAACCCTTACAATCACATTGATTATTCATTTAGAAACTCCATTTCTGGCAATAAAAAAAGCAACCAATTTTCGGCTGCTTAATTTTTTACCTTCTTTTCTATTTTAGATAATATCATGGTTTTAAAAAAATTGCTGTCACATGTTTTGTCATATTTCACTGTCATTTCCCAAATTTTTTGATATATTTCTTACATACCCATAGCTATAATCCAATACCAAGGCAATTTCCTGCAAGCTGTATCCCACCTGATCACGAAGGTATTTAACTTTCACATTAACATTATCGATCCCCTCAATATGTTCAATGATTTGCCCTCTGAGATTCTCCAATATTTTTATTTCTTTCTCATGTTCATTAATCTGCTGCTGCAGCTCCATGATCTCCGGAAGAATATCTTCAAACGCCTTTGAAGAATTACCGTGGATGGATTCCGCATCATTAGTTATACAGCTGGTTTTAATAACGTCCGGAGACAATTTAACCATCAGTCTTATTTTCCTTCGGATCAAATTATCCCGGCATTTTGTCTCTATGTTGATCATCTCTGTAATACTCTGAATCTTTGACATTTGCTTCCCCCCATGTTAAAATAAATTTAATGAGCAACTTGGGGCGAAAGCTCCTTTTTTTATGTCCCGAAATATTTTTATATTTTAATTTTTAAACTATCTTCATCTCAACCTGTCGTGTTGGTTGATAATTCATCCAAATTACTTCAACTGCTGATTTTCCACCTTCAGCCAAAACATTCGCATATTGTTTGCTCCATCCACGCAATAAATCATTATACATATCGTTGTCATAGCCAGATATAATAATAAAAGCCTTATGATTTATAAGAACATCAATCAATTTTTCGTGGTCCTGATCTTTCATTTCATGTTTGTAAATTCGTTTACTTCTTGTTGATAGCAAATAAGGTGGATCAATATACATCAAAACATTATCACGGTCATATCTCTCGATTATTCTTATCGCAGGTTGATTTTCTATTTGTACAATACAATTATTACTGCATTGAAGTCTTTCAGTAACCTCCATAATTCTCTGTGGCAACCGATTATGCCAATGTGATAAATTACCATTAAATCCCTTTATATTGTTTCTGAACCCTGTTTTATCTGAAGACTTCGCTCCAATAGCCATCCACATTCTTACCAAAAAACGTCTTGCATTTTCAATCGGATCATCAACACTGATGTAACTTAATTTATATTCATCTCTTGCCCATGGTGTCATCTCTACCAAGGATGCCAGTTTATCTGGGTGTTCTCTAATTACCTTAAATAAATTAACAACATTTGTATCAATATCATTAATTGTCTCAACCTTAGATCTTTTTTTATTGAAAAATACTGCCCCCGATCCGAAGTAAGGTTCTAGATATGTCATATCTTCATAACAAGCTGGAAAATTATTTATAATCCAGCTGGTCATCGACCACTTACTCCCAGGATATTTCAATACTGTTTTCATCTCTTTCTTCATCTGATTAGCTGACAGCCTGAATATTTGGCTCATAATTTCGGCATTTATTTAAAAGATGAGCATTCGCCGAAGCCGAACAATTATTTTTAAAATAATTGTTATAATATTTGCAATCCTTCTTTTTACAGGCGTTTTTCTTTTTCCCTTTCATATGTTCCTCCTAAATATTGAAACTTCTAAAGTCTGTCCCCTTTTTCATATGCATATTTATTGCTGCTGGCCGTTGCCACGATCTGGCGAACTTTTCGACTTCTTTGGAATACTTTGTTTTTTCATTCGTGAAATCTCTGTACAGCTGGGCAAATGGCATGGCCCCAGCCCACCAAATCTTTTGCAGTCGTTCTTCATTTTCGCTAATGTCGCCATCAATCAACGCATAACATTTTATATGCTCTCTTGTAAAACCTGCCTTTACCAACTTTACCGCTGCTTTTTCAAAATTTTTAAACGCCCCATCGGTATCGCATGCTAGCCACAATTCATCTATACTCAAACCTCGCACATTATCAACAAAATGATCATCAATCAAATCGACTTCTAAACCGCCTTTGAACTGAATTCGCTTTTGAGTTTTCAGCATCCTAAACACTTTGTCTTTATGCTGCCGTGACGTTTGGAGAAAATTATTATCCTGAATCACATTTCCCTGACAAATTGGAATCTCTTTTAATTTCCCTTCAATCTTCGGGACAATGCACCATGGGCAATTGTTATTGCATCCACGCGATGTAAAAATTATATTTGGCTTCATATAAAGGCCTTGCGTAAACCCATCTATTTGACTTTTAAATGCCGGTCCGCCTAATTTAACTGGTCTATCTTGCGTGGATCGGAATTGAAACGCCATTTCTTGGCAATATTTTCTGTCCCACGTGAACGAGCATGAAATATGTATTTCGTCAAATTCAGGAAATATTTTCCATGACGGCGACTGTATTATTCCATTGGGATAATAAACAAGCGAATCGATTGGTGTATAACTTGTCTTCTTCGGAAATATTCTTAGTATTTTCATCTTTTTCTCTTACCAAACGCACCGATCACACCTCCACTTTGCATTGGTTTAAAATAATACCCAAAACACTCTCGGATAGACAATTTACTTACGTCTGCTGAGAAAAACTCAATGCCTTTTCGGTTTTGGCAATTAACATGAATCAAGCAGTCTCCTTTTAGTATCTCCTCCCCAATTTTTTCGCACAGCCCCACACTTGCATAAAATGAATCACTGGTGCCATCCCGATATAATATTTCTAGTACCCCAAATTTTTTACTTTTCATAATGCTCCACCATCTCCATTATTTCTTGAGCCAGCAGCTTCCCTTTTTCAATGTCCACTGCAAAGGCCCCATTTTTTGCTGAAGTAATGACTAGGCTATCACCCTTGATAATGTATCTCAGGCCAGTAAACCGGTCGCTTTCTACTTCAAACCCTTCTTCCCGATCCCGACTTTGATTTTTAAAATTATAAATCCTTTTGATAAAATCCATTTCATTCCGTTTTTCTCCTTGAGTTTAATTCAATTTCCGCAATCGATTTTAAAATTGGGTAAACCTGCTGTGGAACAACAGCATTTCCTATGCATTCAAGTCGGTCCATCCCTTCGGAAAGCCCATTATCATTTCGTTTTTTTCCGCTGCTTGGATTGGAGATAGCCCCATAAAAATCCAGAGATAAATGCTCCGCATTGTTCCACGCTTCGAACGCATTCGAAATATCGATGTCTGGACATCGGATGCCATGTTCTTGTTCCAGGCCATCCCATCGCTTGCCAATGGCGTAGGAAACGATAAACACCCGGTCCCGTTTATGCGCTGCGCCGATGCTACAAGCTGGTATTTGAAATACCCCCCCCTGATAACCGATACTTTCCAGCTCAGAAAGTATTTTTTCGATTCCCATTCTGAGGATGCCAACAACATTTTCGCCAAGCACCCAAGTGGGTTTGATCTCTTGGATAACTCTAAACATTTCTGGCCAGAGATAACGGTCATCTTCTTGGCCTTTTCGCTTCCCGGCAATACTATATGGCTGGCAAGGGAATCCCCCGCTAATAATGTCAACTGTTCGCATTCCCGTTCTTTCATAAAAATTTTCTCCAGTTAATGTTCTTATATCTCGCCATCTCGGTACATCTTGCCAATGCTTCTCTAATACTTTAGTTGCATAATCCCCCCGTTCACATTGTCCGATTGTCTCAAATCCAGCCCATTCAGATGCTAAGTCAATGCCACCGATCCCTGTGAATAAGCTTAAATGAGTCAATTTATTCATTGCACTTATCCTTACCTTTTTTTCTGGGACAACCCCATATGCAAATATAAGGCGATGCTGCTATATACTCACATCCTTCACAAATCCAATTCATCCTTTTGCTCCATCCCCATACCACTTAGCTTTAACCGCCCGGATCTCAACCTTAACTTTTTCCAGCAGGGCCTTTTCCTGCTCAATGTCCTTGGGATCGGCATCAGGCCGGGTTATGTAATACTGCAGAGCATGTTTGATTGTCTGTAATCTTCGGTATTTATTCACTTTCTACCCCTTCTTTCACAAACAGCATTTGAAACCCCATGGCTCCCATAATCTTCCCCAGTATCACAGATTGTGGATCTCTTTGACCAAGTTCATAATGCCCAATACTTCTTTGCGAAACACCTGCAGCAAGTGCTAACGCTTCTTGTGACCATCCGCACTGTTCTCGCTCTTTTTTTATTCGTTCACCAATCGTCATTTTCCTGTCCTCGTTCCAAAGCACTTGTTGTTCCAACCTGGTGGATACTGTGGCAAAAGCATTTTTCCACTTTCCTCACAAAACAACGCATTACCTACTTGCGTCAACTTTTCGCATTGCTCACATGGAGACGCTTTTCTTTCCAAAGCTATTTCTAGTGCTGTTTTTTTCATTCACTCCTCCTGAAACTTATAAATCTTTGCCGGCACTCCATGAAATAACTTTGTTGTCCGATTCTTCCTGATAACCCGGCAGATCACCGGGATCTCAGCTTTACAGATCTCAGCCAATTCATTCAGGCTGCCAGCGGTGGCCAAGGGCCATTCATATTTGCTTGTGTCTGCAATCAGGTAAATCATGCAACCTCAATCCTACCCAATTCATTTTTTCTATAAAAATCAGATTTGAATACCGGAAAGTGCGGATAAAGATTACCGTTCGAGCAGCTGCAGCGAGCCACGCACTCGTGGCCATCTTGTTCGAGAATGAACAGCAACCCCCGTCCACCGCAAAGCTCACAGTCTTGTCGTTCAACCGTGATTGGCTTATGCAAGGTTCGGGCAATCGATAAAATATCCCCGGGCTTTGGCTCTCTGGATTCGCCTGATTTCAAATATTTAATATACGCCTTATGGCAAGTATCGTAGGGCACGTTGTCCAGAATCTCTTTCCATGTTTCGATGGTGACATCCCGAACACTAATCCGAGGAAAGCACCCTTGCATTTCCTCCAGAAAGTTGGTTGTTTCCGCATGATTCAATTTTTAGTTCCTCCTGTCTTTCAAATTGTAGCAGCTTTTCAATTTTTGCTGTTTCGATAATCTCAGCTATCGATGGTACATATTTACAAGATTTAATCAATTTTTTTGTAGCTGGTAATGCAAACCGAAAATCTACATCTTCCAGCAGATTTGCCCAGATCTTTTGATTAAAATCACTGACTTGAAAATTTTGATAAACAGCAGCCAATGTCGCTAATATTTTTGCTGTTTCTGCATTAGTCAAAGATTGATCCTCCTTTTTCTAGCTCATATTGATTTTGAAGATTTGACAGCGCCCCCTGCATATTTCTGGGAATCTTGGTTTTGTTGTCATAGTTCCCTTCGAGGATCTTAACAAAGTTCTCTGACTTCATGATCCAATCAAAACTGGCCACCCAGCCACGTTCGTTTATCCCACAGAGAAAATCACTTTTGCCAGCTTTGAAAAAACAAACACTGACTGATTCCCGCCCATGCTCCTTAATACGCTGTTGGATAGTATTTCGACGTTTTGGCGTTAAGGCCGTTACCTTAGGCAGACGAGAAACAACCTGATTAAACTCATCCACCACATTATTCAGTTCCACCTTTCCCGGTTTCCTTGCCAATTCGATTGCAGTCGTTTCGGGAGGACTCTCTCTATCTGTGTTTACATCTGTGTTTATATCTGTGTTTATATCTGGTATAGGTTCGACATTCCTGTCACTTCTATTTGACAAACCTGTCACTTTCATTTGACAATTATGTAAAATGGAAATGCCATAATCAGTAAATGCATACCACAAAGTACGATCATACTTTAATTCATTAAAATTGCCTTTTATGATGATTCCTTTTTCAATCAAATCGTCCAATATTTTCCGGATTTGTCGATCCGACCAGAATGGGAATAATTCTTTCCATGCCTTGATACTGTTAAATGTCCAGTACCGGCCATCATGAAAATGCTTATCGTTGGCTTCGTTCTTCTTAATCCAGAATTGAAGATTTTGAACAACAATGGCCGCATTAACCCCCAGCTTTTCAGCTACATCTATGTCAAAATTATAATTCACGCCACATCCTCCAGATTTTCAACACCTGCCCATTCCAGGGCCTTTTCAAAGTGAGTGGTGTATTTTGTCAGGACTTTAAAATAATGGGTAACACCATCTGTTTTTATTTTAATTTCCTTATAGCTTGGTGCTATGCAATGAAGCACTCCATTATTTTCAGGTTCTTCAATGCTAAAGCCCTTCTTTTCTAAAATTTCAATCACTTTCTGTATTGTGTAAGATCTCATGATATCCCTCCATTTAGTAGAATTCCGGTTGAGCCGAAACCCAACCGGTTAAAATAACTAAGCGATGATCGTATAGCCTTCCCCTAGTTCAAATTCAAGATAATCCTTGATTGACTGCATGGCCTTGTTTTTCCATGCCCCGCCATCAGCTTCAAATAGGCCGACATTGCACTTATCATCAACTCTCAGAATAAAGGGGCTGATTGGCTGTTCGATCTCCGAAAATGTCCGAAATGGGGCAAGCCTAACAGGGTTCGGGATCTGTTCTTCCCGTACAAGAGCAACCCCAGACTTGGAAGCAACTGTTTGAGTGATGCCATCATCTTCCAATTTGACCTCATTTTCGTATCGCATCTTACCGATGCTTCGTAACACTTCAGCCCTGTCCGCAACATCGGCAAAGCGAGATTGCAGCATAATATTAAATGTTTCCCGGTCAATAAAACTGTTTAATCTAGATTCCGGTGGCTCTGCCTGAGCCCGGATATAATACTCACGGTCACGGTAGACAAAATCCAATGCTGACATAATTTGGACTGATTGATGATCTATGACATGAATGATCATCTTATCCGCATCTAATTTGTCAATATTAGCTTTAATAAAATCGACAATTGCTGTTAGACTCTTTGTCTGGATGGACTTAGGTTTAGGCGGTTCAATTTGATATAAATCTTTCGTGGAGTATTGAACCCCTTCAACCTCAATTAACTCTGCTGCTGCCATTTCCTCAATTTTTTCTAAAAAACTTCGATCAATCATTTTCTTGCTCCTTCCATTGCAATAATATTGTCCATATCAATTTGACCAGGCACCTTGTCGGAAATCTCGGACACCGTTACACCAGCACCGGTCTTTTCCATCAAAATATTTGTTGCCAGCCCCTTTAACGGGGCCGAGGTATGGCTCACTTTAATATCCACATTTCCCACCATGCGCTGTTCATCGGGTTTGATAGACAGCTGGATAGAAATTTTTCTTGTCGCTTTAGGATCTGTGTTCAGATCCTTGATGTTTTTTAGCACCTTATCCATTTCATGTGCAAACAACTCCTGTAAACCACCACCGGCAATTTCATTCAAATTCATAATTTTCCTCCATATTATTTTCAGGATACTGAGGCTTAAGCCCGATCCCTTTTCTAAACTTATTAATCATTGTCCGATACTTACTGTCGCCTTTTTGCAGGGTCGACTCCTTTTCCTGTAGCTCCAATATTCTGGAATGTTTGATTCGGTCATCCTGTTTATTATTTTTATTCATCCCGCCCTTTCCCCACTATACAAACGCATATAAATATGCTAAAATTGATAAAAGAATAATTACCTGCCGAGGGTAAAAACTTGAGATCGTTGTTCCAGCAACGGTCTTTTTTCTATTGCGGAGAAAATTAAACTCCATCCGGACATAATGCCTTCCATTACTTCTTTTATAAATGTTTCCGAGGTTTCTATCTCATGTTCATCAATACGGTTATCTAAGATAACCTTTCGCATTTCGCTTTCCAAAGGGTGTATATCGCTTATTTCAGCCTGAAATTTCAAAAATGCTTCCGGCAAATTAGTTACTTCAATATTTGGAAAAATCTCCCGACCGATTAAGGTGTTTTCCTTAAGATGAAGCAATGGTAACCATGGTGTACCGTATATTTTTGCCATTCTCAAGATTACTTCATCCGGGGGAACGTTTTTACCCAATTCATAATTCGACAATGTGTGAGTATGGACATCCAGCTTTTCCGCTGCCTCGTCCTGGTTTAAATTTGCATGATCTCTGCATATCCTGTAGATGCTTTTACATGTTTCTTTCATGTTCTTTTCTGATCCTTTCAAGTAAAATTAAAATGTAATACTCCTTAATCTCTCCCCCTTCAAGCTCCAACAGCCTGATCAAGTTCCACGCATAATTCTTTACCTTCTTCATCCTTCATTATTTGATCAATTAGTAATGCCTCAAGAAAGTTTAAACAATCTTCAAACTCGGACAAAGCCGAATAATTATCTAGGCGAATTGTCATGTCATTTTCACAATTCCGATCCCATCCATTTTCAAACATATAAACTTCAATGGTGCCAATATGTCCGGACAGATGGAAAAATACACAAAGTTTTCCTGCTTCTCTATTTCTCTTGTCACCAATCGAATTGATATCCAGACAACAAAGTGCAATTGCTTTGGTCAGTTCCTTCTTTTTTTCCAGCTCGAAACCATCTTTAATAAATTCGTTCATGTTCATGATTTTCTTCTCCTTTTCTAACTGGCCACCTGATTTTCAGGCAAGTATGGTTTAATATTGTTCATGTCTGTTAAATCCATTCCGTCATAATTGGCCATGAAGCTTTCAAGCGTAATTCTTCGGATCTTTAAGTGTCCCAATTTTAAGGCTCTAAGCAATCCTTTGTTAATCAGTTCATAGACAATAGGTTTGCTGCATCCGAGTATTTTTGCGGCATCCGCAACCGTGTAGAGTTTATCTTCCATACATAACGCCTCCTATTTTTTATTAGGCTATCTCCTCAAAATATATTCTGCCTTCACTGAAATCCTCATCACATTCATTACATAAAAATGTCTCTGTGAAATTATCACCATTTTCTAATGTAGCGGTATAAGCGATATCATCACTCATACACTCAGGGCATATAATTTTTAGCATTTTTCTCACCTATTCCATAATAATTTTTATTTCAAAATCATAATTCTCAAGTTTTTCAATTGTGTTTTTGAGCAGTTGCATTTGAACTATCGCTTGTTCTAATAATTCTTCAAATGCTTTATTGCTTCTTGCTGAAATATGCAACTCATTTTGGTTGGTGTGCATAATCATCTTATCTTTATCCAGCCTTCTCACCTCCTAACTTGGTTTTTTGTTTTCGCTAACATAACGTTGTTTTCTCCAGCAAAAAAAATATCTTCTATAGTTGCGTTAAAGTAGTCAGCAATTTCTTTTGCCATGTCTAAATTAGGTACTCTTTTCCCAGTTTCCCACATTCCCACAGCACCCGACGTTACTTTCAGTTCCTCGGCAAGTTCATTTTGTGTCAAACCATTTTTAGCTCTGTATTTCGCAATATTATTCACTCTCCACCCCCTCCTTTCCCCGCTAACGTTTCGTTGATATTATAATACAACGCTTCGTTAGCATTGTCAATACCTTTATTAACAATATGTTAGTATTTTTACTAACATATTGTTGTTTTTATTGATTCTTGTTATAATAGCCTAAATAAACAGAGTAGGTGCTAATATGTTTTCAGATCGTTTAAAGTATTTACGTTCAACTGAAGATTTAACCCAAAGAGATCTAGCTAGCAAGCTTGGTATTACCAGCGGTGCGATAGGTATGTATGAATCTGGAAAGAGATTTCCTGATAATGCAATCTTAAACAAAATCGCTGATCATTTCCACGTCTCCACCGATTATCTCCTTGGTCGAACAGACGACCCACTACCAGTGCGTGACGTTGACCAGGATCTCTACGATGAGCATGATTATAATAAAGAGCTGGATGCCTTTCTAAATGATGATGAAATGTCATCGATGTTTTATGACTATAAGAACTGGACGGAAGAAGAAAAAAGGAACCTGTTGAATATTTTAAAAGGGCAGGAAGCATTGAGGGAATTGAATAAGAAAAAATAG
Protein sequences of DBSCAN-SWA_5 >NC_016894|3956431:4006028|4002442_4003147_-|WP_014357824.1|DBSCAN-SWA MIDRSFLEKIEEMAAAELIEVEGVQYSTKDLYQIEPPKPKSIQTKSLTAIVDFIKANIDKLDADKMIIHVIDHQSVQIMSALDFVYRDREYYIRAQAEPPESRLNSFIDRETFNIMLQSRFADVADRAEVLRSIGKMRYENEVKLEDDGITQTVASKSGVALVREEQIPNPVRLAPFRTFSEIEQPISPFILRVDDKCNVGLFEADGGAWKNKAMQSIKDYLEFELGEGYTIIA >NC_016894|3956431:4006028|4000136_4000343_-|WP_041669593.1|DBSCAN-SWA MTIGERIKKEREQCGWSQEALALAAGVSQRSIGHYELGQRDPQSVILGKIMGAMGFQMLFVKEGVESE >NC_016894|3956431:4006028|4004255_4004615_-|WP_145972829.1|DBSCAN-SWA MNEFIKDGFELEKKKELTKAIALCCLDINSIGDKRNREAGKLCVFFHLSGHIGTIEVYMFENGWDRNCENDMTIRLDNYSALSEFEDCLNFLEALLIDQIMKDEEGKELCVELDQAVGA >NC_016894|3956431:4006028|3996265_3996688_-|WP_041669168.1|DBSCAN-SWA MSKIQSITEMINIETKCRDNLIRRKIRLMVKLSPDVIKTSCITNDAESIHGNSSKAFEDILPEIMELQQQINEHEKEIKILENLRGQIIEHIEGIDNVNVKVKYLRDQVGYSLQEIALVLDYSYGYVRNISKNLGNDSEI >NC_016894|3956431:4006028|3965837_3966272_-|WP_014357790.1|DBSCAN-SWA MLNKAIEIAAIAHTGQVDKAGAPYILHPLRVMLSRDNDLERICAVLHDVVEDSEFTFEDLRKQGFSEEVIEVLDCLTKRDGECYDAFIGRVIENETACRVKLADIADNMDLTRIEKPTEKDQERIKKYEKAVETILAALSSEIE >NC_016894|3956431:4006028|3977909_3978167_-|WP_145972826.1|DBSCAN-SWA MKVFDNSGFECILADSECFNIYKEVDAPNSVSAQAYKYTPSDGFVKDEGYQPYIPIEKKIEIIEDSTAEYMVDLDFRLSNIELGL >NC_016894|3956431:4006028|4000698_4001103_-|WP_169314726.1|DBSCAN-SWA MNHAETTNFLEEMQGCFPRISVRDVTIETWKEILDNVPYDTCHKAYIKYLKSGESREPKPGDILSIARTLHKPITVERQDCELCGGRGLLFILEQDGHECVARCSCSNGNLYPHFPVFKSDFYRKNELGRIEVA >NC_016894|3956431:4006028|3976275_3977268_-|WP_041669567.1|DBSCAN-SWA MADTLLYKVHVENKGWGAWVQEGRLAGTVGEGLRIEAIRIQGVDRYRVYVENIGWMDWVKEDEIAGTVGQGLRIEAIEIECENLNYQVHVQNVGWLDFARNGEMAGTTGGGLRIEAIRLLKSAEPISVDDHRSTFEIAPAPILVPTPTPAATVQGQKSGKIYLAVGHGISSDGSWDCGCVDGQYTEADLMLAIGKVAATKLRNMGFTVLTDADTDNDKNIAVCVNEANSWGADVYVSLHCDYNKAPSGTLPIVYPGSGDGIRIANCLIASAQVRLGLGTRGVIQRDDWEVADTGMTACIFETGGIRPDIGLLTNASAFGEVVVQGIYDWF >NC_016894|3956431:4006028|3987409_3987769_-|WP_041669587.1|DBSCAN-SWA MASKTVLLIEEIKKIIRNVHMGVFYMKATKTTPYPYITFQISDIGASKKLELDYWADKPDSIELETLADNVGDYLNKYTLTNENHSITIYKNDDRQRLDETIIKRINESFLVRYYGKEE >NC_016894|3956431:4006028|4000339_4000516_-|WP_169314725.1|DBSCAN-SWA MKKTALEIALERKASPCEQCEKLTQVGNALFCEESGKMLLPQYPPGWNNKCFGTRTGK >NC_016894|3956431:4006028|3964228_3964765_-|WP_014354546.1|DBSCAN-SWA MVHLEHFSGHPLDYITEFHISEKIRIDSCPHCYSRRRLHLHGVYHRHIIWYDDVFSIPVQRHYCIHCGKTVSILPSFCHPGFQLALPFLLELLWAFFNRIPSANTLAPQHRHFITRRFLLCMNRLIEYFRICHDPLLVFPDFWHKKAIKLLEMVYSVGKPHIFGKRYHDHFKKGFMAH >NC_016894|3956431:4006028|3999973_4000144_-|WP_169314724.1|DBSCAN-SWA MNKYRRLQTIKHALQYYITRPDADPKDIEQEKALLEKVKVEIRAVKAKWYGDGAKG >NC_016894|3956431:4006028|3977738_3977891_-|WP_014357801.1|DBSCAN-SWA MTYSYCKTVIKNGRYGTKEAMMVKLDVFLLNDRITQEEYTELVELLNAAA >NC_016894|3956431:4006028|4000516_4000702_-|WP_014357441.1|DBSCAN-SWA MIYLIADTSKYEWPLATAGSLNELAEICKAEIPVICRVIRKNRTTKLFHGVPAKIYKFQEE >NC_016894|3956431:4006028|3993701_3994085_-|WP_014357815.1|DBSCAN-SWA MGIAEQLEKEKKIRAEKNRILKIYKNMQMDKDIIKVLEGLISDAAFMRVSIEELKQKLIKEGLMEKFKNGSQVFDRERPEAKAFRDYGKQYDNIMKQLIDLMPAKEQKEEQDQLLQFFQSGKEAVKK >NC_016894|3956431:4006028|3968744_3969865_-|WP_145972736.1|transposase|DBSCAN-SWA MTKRPRRSFTDEFKNQMVQLYLNGKPRSEIVKEYDLTASSLDKWIKQHQSSGSFKENDNRTDEENELIRLRKENQRLLMENDIFKAGSADHRTKVEVIRANQDRYSVSAMCRVLNIPKSTYYYISKKTNGVDPIIADVIEIFKMSRKNYGTRKIKHQLEVKGIVASRRRIGRIMRENGLVSNYTVAQYKVHKQPVNQDPVPNEVNREFNGRAPLEVAVSDLTYVRVGGKWNYVCLIVDLYNREIIGYSAGPNKTAQLVYEAFARIRYRLDQISIFHTDRGSEFKNNVIDGVIETFNIKRSLSNKGCPYDNAVAESAFKVFKTEFANQYAFDRLDYLKLMLSDYVNWYNNIRIHSSLGYLTPDAYRKLAHKKSV >NC_016894|3956431:4006028|3998877_3999099_-|WP_041669591.1|DBSCAN-SWA MDFIKRIYNFKNQSRDREEGFEVESDRFTGLRYIIKGDSLVITSAKNGAFAVDIEKGKLLAQEIMEMVEHYEK >NC_016894|3956431:4006028|3980558_3981647_-|WP_014357805.1|DBSCAN-SWA MELYIYNKALALQNVMDTYGSLRWVRRYSECGEFELHCPFTVENILLLAQDNVIRKNDSDEVGYIGYRNIKKDEEGKENLIVKGKLGEGYLNRRIIWGTEILNTTYELAMRALVDKNCINPTDADRIIETLILGDLGNFAGNVNFQVSYQNLLKTIEALCMEAELGNRVRFDKSLKKLKFEIFQGLDRTSSQTVNPQCIFSKEFDNILDQEYTDSIMDFKNVVLVGGIGEDADRRLVTVGSGSGLERFEVFNDQKGLSNMVNNVAMTEAEYNALLASKGNETLTDTKKVQTFENGINLNSNLRYKTDFDLGDIVTCLSRKWGIAIDSRINEIEEVYEESGMEINIVFGKEMPRTIAQKIKLL >NC_016894|3956431:4006028|3974203_3975323_+|WP_145972736.1|transposase|DBSCAN-SWA MTKRPRRSFTDEFKNQMVQLYLNGKPRSEIVKEYDLTASSLDKWIKQHQSSGSFKENDNRTDEENELIRLRKENQRLLMENDIFKAGSADHRTKVEVIRANQDRYSVSAMCRVLNIPKSTYYYISKKTNGVDPIIADVIEIFKMSRKNYGTRKIKHQLEVKGIVASRRRIGRIMRENGLVSNYTVAQYKVHKQPVNQDPVPNEVNREFNGRAPLEVAVSDLTYVRVGGKWNYVCLIVDLYNREIIGYSAGPNKTAQLVYEAFARIRYRLDQISIFHTDRGSEFKNNVIDGVIETFNIKRSLSNKGCPYDNAVAESAFKVFKTEFANQYAFDRLDYLKLMLSDYVNWYNNIRIHSSLGYLTPDAYRKLAHKKSV >NC_016894|3956431:4006028|3977269_3977701_-|WP_014357800.1|holin|DBSCAN-SWA MRYFADSPIASGIFTAVVGFVTWIFGGWDVLMCVLVTLMAIDYITGLMVAYVTKTLSSAIGLKSLFKKIAELFVVMTAVQIDLATGQGGAYFKNIVCLLFIANEGLSLLENAGNLGVPIPDILKKALKQIGDNSETENESEGE >NC_016894|3956431:4006028|4004888_4005041_-|WP_169314727.1|DBSCAN-SWA MLKIICPECMSDDIAYTATLENGDNFTETFLCNECDEDFSEGRIYFEEIA >NC_016894|3956431:4006028|3994920_3995178_-|WP_014357817.1|DBSCAN-SWA MKIDPNKFIVEMCVGGKRSRPIDNILDIDYTVVTLRGDGEILSHEIKDVTIEYIDDNGILKTVYGSGSIFRFTKVIPQIPRKYQH >NC_016894|3956431:4006028|3970307_3970664_-|WP_169314721.1|transposase|DBSCAN-SWA MDLYSRKLVVPLIICSDCGSQCVSKEYQKATTKMQRSYSKMVFPRDNAYIESFPAIIKCEWFNRFKILDYNHAYRLIFEYLETFYNTTRIHSHCDYKSPDNFEKIFTKMQNESLRIEG >NC_016894|3956431:4006028|3975403_3976159_-|WP_014357798.1|DBSCAN-SWA MNSFIQWIGGKRLLRKTIIEMFPKDFDRYIEVFGGAGWVLFAKDKHANLEIYNDYDGQLTNLFRCVKYHPDEVKKEITGVLNSREFFDDFKSQLDMRGLTDIQRAGRYFMIIKTSYGADRKTYGGTKKNLIKSTDYLSEISDRLNGVVIENRDFERIIKVHDRPGALFYLDPPYHGTEKYYQAGFGDADHIRLRDCLKEIKGKFILSYNNDDFVRELYQGFNLIEVSRRNSLLERYDGKDKEYKEVIITNY >NC_016894|3956431:4006028|3960118_3960541_+|WP_014357785.1|DBSCAN-SWA MAIKELEESYVPFQCMIVSDSNRFNVEGVSTAQYYILDTLNKQGAKTTKELAEMRGISQSGISKLTKRLLEKKYIIQERQANDRRSYNIVLTKDGKAFLNRVEDFGNEIMNLIEEALTEEEVHAFSMMCKRVTSLYARKQ >NC_016894|3956431:4006028|3970836_3971217_-|WP_014357796.1|DBSCAN-SWA MCNYWGVKYYVFKDRLSENWTLEEALESRQPDSIKDHQGRGFKTKSAMCSYWGVKEYVFNDRIKDGWSLEEALEGKNPNTVVDHLGKKFDTEKEMWAYWGIKSYIFKDRIKEGWSLEEALTIPYKL >NC_016894|3956431:4006028|3988859_3990095_-|WP_014357428.1|capsid|DBSCAN-SWA MTKEQYLKMRNELLAEVDGLINSGDVENANAKMAEVTALDNQFEAERTAQANAAALRGAPVVNIETQSVVNQGIEFGQVLASFGETTTETELHERAFYNFLVNKPSTQEEKAVFDRINTDYRNAVQTATDHQVVIPETVTAKIWQEIADAHPVLQDIFKTFVPGDLTLIKDDDSITDAEWIDEATSAEGDDVGFGTVELTGCELPKAVDVSWKIKKMAMGDFLNYIARKIAEKMGNAIAKSVFTGKGKPGESDTFKAQPKGVVTALNAEAGTPQVITFATADPLTYKKITSALAKIKSGYLGSGAAIYADNATIWNELANVLNEMGNPYFVPDPTGAGVGRMFGLPVKEEAAAEGNILIGNYGRGYAMNVNQDITLYQEDHIKARTTTYMSYSIIDGDVVTNKAFALIKKV >NC_016894|3956431:4006028|3995389_3995953_-|WP_052307153.1|integrase|DBSCAN-SWA MQDYLKAASNRTVEGRRNYILFLIGITTGYRAGDLVGLKVRDAREAIRHGYFLIQEGKKYNSKNIRKKNRKPRQAEIIPKVAKELKCYIKDKRDYEWLFPSRKGGAIGVQAISNILKDAAAYFGIKGITAHSMRKTYAYKIYMDSGKDVVAVKELLGHSSIEETKLYLGLDQEKYHEYTKALADFVR >NC_016894|3956431:4006028|4004638_4004866_-|WP_041669611.1|DBSCAN-SWA MEDKLYTVADAAKILGCSKPIVYELINKGLLRALKLGHLKIRRITLESFMANYDGMDLTDMNNIKPYLPENQVAS >NC_016894|3956431:4006028|4005632_4006028_+|WP_014357828.1|DBSCAN-SWA MFSDRLKYLRSTEDLTQRDLASKLGITSGAIGMYESGKRFPDNAILNKIADHFHVSTDYLLGRTDDPLPVRDVDQDLYDEHDYNKELDAFLNDDEMSSMFYDYKNWTEEEKRNLLNILKGQEALRELNKKK >NC_016894|3956431:4006028|4001339_4002158_-|WP_014357822.1|DBSCAN-SWA MNYNFDIDVAEKLGVNAAIVVQNLQFWIKKNEANDKHFHDGRYWTFNSIKAWKELFPFWSDRQIRKILDDLIEKGIIIKGNFNELKYDRTLWYAFTDYGISILHNCQMKVTGLSNRSDRNVEPIPDINTDINTDVNTDRESPPETTAIELARKPGKVELNNVVDEFNQVVSRLPKVTALTPKRRNTIQQRIKEHGRESVSVCFFKAGKSDFLCGINERGWVASFDWIMKSENFVKILEGNYDNKTKIPRNMQGALSNLQNQYELEKGGSIFD >NC_016894|3956431:4006028|4003143_4003473_-|WP_014357825.1|DBSCAN-SWA MNLNEIAGGGLQELFAHEMDKVLKNIKDLNTDPKATRKISIQLSIKPDEQRMVGNVDIKVSHTSAPLKGLATNILMEKTGAGVTVSEISDKVPGQIDMDNIIAMEGARK >NC_016894|3956431:4006028|3964943_3965609_+|WP_014357788.1|transposase|DBSCAN-SWA MNGDFDALCCREPQSCADRYYDYIVKSLSAGMIRKDIYREIIKQGYPGKKTAAYDYMNNVIQILGIEIAVNRSSSIEAIERKKQLNKFDHLSRREIFRFLWMSEDISPKHRDYLKMNYPVICELYKCIKEFRQIFKEKSLPQLYLFIDRYKESEMKPLAIFATGLEKDLEAVENAVVSDLSNGFVEGVNNKLKMIKRTMYGRCGQKLLTAKLMYDPHSKPG >NC_016894|3956431:4006028|3996779_3997595_-|WP_145972828.1|DBSCAN-SWA MKTVLKYPGSKWSMTSWIINNFPACYEDMTYLEPYFGSGAVFFNKKRSKVETINDIDTNVVNLFKVIREHPDKLASLVEMTPWARDEYKLSYISVDDPIENARRFLVRMWMAIGAKSSDKTGFRNNIKGFNGNLSHWHNRLPQRIMEVTERLQCSNNCIVQIENQPAIRIIERYDRDNVLMYIDPPYLLSTRSKRIYKHEMKDQDHEKLIDVLINHKAFIIISGYDNDMYNDLLRGWSKQYANVLAEGGKSAVEVIWMNYQPTRQVEMKIV >NC_016894|3956431:4006028|3996005_3996146_-|WP_169314722.1|DBSCAN-SWA MNNQCDCKGCTHNRDGQCLDKRLLSDPYKQTGCLKPAIRLEREVKK >NC_016894|3956431:4006028|3981648_3982512_-|WP_014357806.1|tail|DBSCAN-SWA MRKIKYINSLGEELLFGNSAPFILQKFEESQGVNNYNFKGVGQDGETYLGNTLDPKDVNLTVVIIASTSGLYNQYKEKLYRVFNPKLGQGYLVYNDYLKERKIKCIPEKIPFLKDAIKSGTGLINLTAYEPFWKDLQESRDEIALWVGDFEFDLEIPEDTGIEIGHREPSLIVNCLNDGDVETGIRIEFKALATLTNPSLFNVNTREFIKIKKAMAAGEVISISTYFGDKRIISKLNGVETNAFYSIDEDSTFLQLDKGDNLFRYDADSGLDNLEVTIYHYNNYLGV >NC_016894|3956431:4006028|4005232_4005466_-|WP_041669615.1|DBSCAN-SWA MNNIAKYRAKNGLTQNELAEELKVTSGAVGMWETGKRVPNLDMAKEIADYFNATIEDIFFAGENNVMLAKTKNQVRR >NC_016894|3956431:4006028|3994187_3994919_-|WP_014357433.1|DBSCAN-SWA MAGIFAKQIYNSKRWITKREYIFSKNFGICERCGRPGEEVHHKIYLTPENIHDPGIVYGEDNLELLCRDCHFDEHRKTNPLSNNFRKRVRLTNNGMYFDDEGNPQPVKRWLVCGAPASGKTTYVLDHMDHGDLVIDFNQVGQALSLRGKDEVPDNLTETVAGVIDYLYRLIIDGKIDARNIWIVASLPKDKERDLIAGRLNAVIVSIDTDIESCIANIMNDAECNDKELKKEILKNYFRNRKA >NC_016894|3956431:4006028|3962822_3964082_-|WP_014354547.1|integrase,transposase|DBSCAN-SWA MTEKDKELIALFRYGLIAPLLTDTVSSHTAYLDEISAKTHDVPHYGIRTYNRKTLLEWHRLYRRHGFDALKPKVRTDKGSSRALPAESVKLLLKLRNENIHLSVKLFQEWLIYEGHFTSSDCSYSTVYRLLKKHQLLKPSAIDTSDRRRFAHIDINTLWQTDVSHGPYLSLNGKKRKTYLIAFIDDASRRITGAQFMLAEKNEDLLHVLKSALLTCGKPTMLYADNGKIFRSHQLNTSCATLGIALVNTKPYDPKSKGKIERFFKTVRSRFYPLLTDADLMDLDVLNQRFEAWLARDYHHKVHSSINEAPMVFYMRGSDRIKHFSDPRIIDEAFLIRVTRKVKSDATISLHNALFEASPMFIGKSVDIRYPNESPDKIYIYENSVRIYTCNKVIMKDNAVAKRNNNPISYSSLGGVPHV >NC_016894|3956431:4006028|3971335_3972058_-|WP_014357797.1|DBSCAN-SWA MESSIKFEMPKEQFYDKKNYEPLLLECLNRISFFIEKSGGGFSAPKSESKGQCDAIGKNGCYSIDFKRLLSQEGAQNVNETRLTEVTLCTGVTMSTPSKVSMRGEPSLLFPNIWGFFVSRSLHLNEKNKIVLEDKADRYMKETIKSLNRIICTKKHLLFFNPSRLVIENSHDNPIEVLCNRAKEALSMVSEARTKLSPGYETYYALLMNNEMVLFSEDFTHVGCIKLTSLDTWQKLRIKL >NC_016894|3956431:4006028|3979519_3980545_-|WP_014357804.1|DBSCAN-SWA MGEISGFHNSANGDRRYKADFWARFLGSFIGNGVYPNPSTNLQVIANGDMTVTVKAGKAWVNGVFYENTADKVITLEVADGVLKRIDRIVVSDITLERDTYSKVKKGSFASSPAAPALQRDADAYELGLADIYIENGAVSISQSNITDLRLNTAYCGIVHGLFDQVDTTTLFNQYQAWYLETVDDATTDIAVMLSAFQSSFNTWFADLQDTLDENTAANLLNKINDLIDRVTIAETSISNHTADIASLDTRLDLQERLLTSIIPTTGWSGTAPYSVAVTVSGLTDSRPDINPIYSATLETALLEKEAWNTISYIDCTTDTMTVTCLEEIPTTAINVELVGG >NC_016894|3956431:4006028|3960918_3961776_+|WP_041669558.1|transposase|DBSCAN-SWA MDSPNTLILDHYFPSDVLKITEVIETDKIIIHMKSLSRTCVCPRCHQTLKHYHGTYTRKVQDLPILGKNVQLRIKAHEYICDNEACSVKTVAETFDGFLNTNRRMTQRCEDFICMLAMETSCEGCARICQAMNLNISGDSVIRFLTEHYESQPVPVCSETIGVDDFAFKKRSRYGTVIVDEATHKPVAVLDGRDSNTFKAWLRQNRQVKRITRDRAGAYASAIGEILPDAMQIADRFHLHQNLLEAVQNALKSVIPANIKISVDQEQPAGQQPTERTAKERIKKK >NC_016894|3956431:4006028|3962029_3962830_-|WP_014354548.1|DBSCAN-SWA MYKSFFGFQQAPFDKGIDSAMLFQSEAYKEVLARLDYLKTTRGFGLITGDPGVGKTSTLRVFADTLNPSLYKVMYFPMSSGTTMDFYRGLAFSLGEQPRFRKVELFFQIQNAITDLYDKRRITPVFILDEMQSASAQFLHDLSIIFNFDMDKRNPFILILTGLPTLANRLALNQNRSLDQRLVTRFHFSPLTPDEVRDYIKHRFKHAGVSRNLINENAYEAISSSTGGYPRLVGNLVTQCLILAFQKQRDLIDEEIVFAASAEAGI >NC_016894|3956431:4006028|3956431_3956944_-|WP_014357783.1|transposase|DBSCAN-SWA MNREFNGRAPLEVAVSDLTYVRVGGKWHYVCLIIDLYNREIIGYSAGPNKTAQLVYEAFARIRYGLDQISIFHTDRGSEFKNNVIDGVIETFNIKRSLSNKGCPYDNAVAESAFKVFKTEFANQYAFDRLDYLKLMLSDYVNWYNNIRIHSSLGYLTPDAYRKLAHKKSV >NC_016894|3956431:4006028|3986154_3986559_-|WP_014357809.1|DBSCAN-SWA MIEDVRKLNTADLFEFMRMVKRTGVKDELKKVAKNIPKKEKPPKLTVVGDEVAETPEVVQEKPSQAEVGIDLAFSVMEIFANKKAEDEIYAFIARPFQCKPEEVAENDLMDTIEKLKDVADAQKWASFFKSATQ >NC_016894|3956431:4006028|3986563_3987406_-|WP_014357810.1|DBSCAN-SWA MGKVRTGYNPKTMENLHTGAGAFFKNFIVGTDTYESARLGGKLIGATQGGGEFKAAAEIRNIEIDGLPGKGKGTEIIDYIDVSMTMNFIETTPAILAMALGAADVDTTTNGTYDIITGRNAFEDGDYVDNITYIGTITGSEEPIIIQVFNALSTDGLNIKVEDKKEGVIPVTVYGHYEDTGEGTLDAPPYRIYYPKGSNVATPVASVKGGTYATSQTVSLTCATVGATIYYTTNGFEPTADDTAYSTEITVAADTILKAKAIKSGMADSATMTETYRIGE >NC_016894|3956431:4006028|3997611_3997758_-|WP_169314723.1|DBSCAN-SWA MKGKKKNACKKKDCKYYNNYFKNNCSASANAHLLNKCRNYEPNIQAVS >NC_016894|3956431:4006028|3982521_3985833_-|WP_014357807.1|tail|DBSCAN-SWA MAFEIFKLFGSIFVDTSEANNEMDLAGNNAEILGKKFGAVADKADSIRNGLNSAGEGFSKYVTAPIVALGAASVVAFNAVDDGMDVMIKATGATGDAAGDLEKVFKNVSGSVIGSFDDVGGAIGEVNTRFGTTGDGLESMSKDFLKFAEITGVDATQGVQLVSRAMSDAGIDTADYKTILDQLSAASQASGISVESLTENLTKYGAPMRALGFDTQESIAIFAGWEKAGVNTEIAFSGMKKAISNWAAAGKDPREEFKKTLKAIEETPDIASATTMAIETFGQKAGPDLADAIKGGRFSYEEFLAVVENSDGTLDGTYDELLDGGAKFEMSMQNIQESLAGLGETIMNVLAPMMETAAEKIQGVADWFDSLDEGQQEFIVKIGMVAAAIGPVLLILGGLAGAVSNVAGLFATGGMLNGALGTASASFGLGAEGAVGMGSSLAALTGPVAIVVAAIAGFIAILVGAWQNSETFRKSAEMAFNSVSVHAFEAFSRISEALAPAKEAFQGFIDGIGPVLGQIGDFIGNQIIPIVKDFINGFIDGFANIIVAIAPFIEAIGNLLSFISNFVGMVFALLNGDWASAWEFAKAMGQNAVDFLANVFQGLYNWVSLIFQSILDFIKGIWDGIVQHTTDTWNGVVTFLENAWKTIYDNTIGKITEMAKGVAAKWEETKSDTQTKWANIRDDLASKVGEIYSKVTSKIKETADDVASKWQTSKDDSQTKWAAIRDDLAQKAGEIFLNVTDKAREIVEDLPEKWQEIKETAGKKWQEVKDNIISKIQNLPTDLKNIASDMLNQMVAGIQETAGNVYGAVTSLVNDVITKFKEGFGIHSPARVMLEIGKYIVQGLINGLNGDNLMAFVNNMVEDIKSAFANGNFNLKAAIDFVGSGAAEFFKSIGIGGSDFGSLVAPVNGSITSWFGNRDDVGDVGSKYHQGIDIGVPEGTPVGSAGAGTVIQAGWNGGYGNSITIDHGNGLETLYGHLSEVLVNVGDLVAQLQTIGLSGNTGNSTGPHLHFSVIKDGEQVDPASIFGYASGTNYATAGLHWVGEKGPELVNFKGGERVYDAETSELLARGNVTMKVTINSPTALSPAKTAKLLKRSVQELLMT >NC_016894|3956431:4006028|4001041_4001347_-|WP_052307123.1|DBSCAN-SWA MTNAETAKILATLAAVYQNFQVSDFNQKIWANLLEDVDFRFALPATKKLIKSCKYVPSIAEIIETAKIEKLLQFERQEELKIESCGNNQLSGGNARVLSSD >NC_016894|3956431:4006028|4005050_4005206_-|WP_169314728.1|DBSCAN-SWA MHTNQNELHISARSNKAFEELLEQAIVQMQLLKNTIEKLENYDFEIKIIME >NC_016894|3956431:4006028|3998618_3998888_-|WP_041669176.1|DBSCAN-SWA MKSKKFGVLEILYRDGTSDSFYASVGLCEKIGEEILKGDCLIHVNCQNRKGIEFFSADVSKLSIRECFGYYFKPMQSGGVIGAFGKRKR >NC_016894|3956431:4006028|3990087_3990861_-|WP_014357429.1|protease|DBSCAN-SWA MPVEIEVRGTIVPDGDKWIYDYFEQPCTTAADIRNKIRSANGDVLEVSVNSPGGDIFVASEIYTALKDYNNVKIKVTGLAASAASVIAMAGYCEMSPTAQMMVHNVWTRQSGDYRDMDSASDSLKKANRSIANAYCVKSGMSMEAALKLMDETTWMTAHDARALGLVDKVLFNVDDEEGFYQNQLFNSVLKENAKAMYAAIPRLSPSVIAKMRESRGNAPEKNENQENKLKALVDQNLESAKAYLNYLKLKGDVKND >NC_016894|3956431:4006028|3987758_3988217_-|WP_041669589.1|DBSCAN-SWA MGMPPSVTKVLVKKGKTTIQYTSNVDRVKYTLSELTRAALRDVGKYLTKEFRLAYYGHFKKRRGKVGKFTQYWVRKKDCDLQVGLKPNAFYGGFQEKGSSKTPALGLLTKVTQDNIAKIVEIESQYLSSLESEAAALAKINEEDYQGGSDGE >NC_016894|3956431:4006028|3966908_3967769_-|WP_014357792.1|DBSCAN-SWA MKSKNLKLFKREIGQANHYLITILVGLDGVKAGVIEKNEEFSTSWNPKDKVASADRSREFSIKSAMSWTVDNLDMYFRMSYEEPKLINNNSLQKDIDKNNQSVYHSFLSFGKAYEFDQINSSIVDLMICWRNRLVHYKAENKPLDEVINLLKRDRDKIMERHNGMDILLTLERFEKKQTPTFKEIASMIKAMIEYVYQLDKQLIEDIDLLAYCDIIIIKYIRENVDKRLQNIYKKPEKSREKVIWNILSEYGLKEDMDINLKSFVSDLSKISYGSAKNKYNNGTFI >NC_016894|3956431:4006028|3988515_3988818_-|WP_014357427.1|DBSCAN-SWA MIESIRNALRIKNIVFDEEITDLIEACKLDLSISGVKIIDDTDPLIKQAVKTYVKANFGLDNKDGEKYMESYEAIKRHLALCGDYNVEPIEVIVLPEEGV >NC_016894|3956431:4006028|4003707_4004196_-|WP_014357826.1|DBSCAN-SWA MKETCKSIYRICRDHANLNQDEAAEKLDVHTHTLSNYELGKNVPPDEVILRMAKIYGTPWLPLLHLKENTLIGREIFPNIEVTNLPEAFLKFQAEISDIHPLESEMRKVILDNRIDEHEIETSETFIKEVMEGIMSGWSLIFSAIEKRPLLEQRSQVFTLGR >NC_016894|3956431:4006028|3985822_3986092_-|WP_014357808.1|DBSCAN-SWA MDIDSGLAFIGKAFEKEEDAKLWDRYLVDYRHMGVENFITFEAYKELAKIESAQPRAAPKTKAETISEINEKVEKIINLTLKGGVANGV >NC_016894|3956431:4006028|3988179_3988515_-|WP_014357813.1|DBSCAN-SWA MWISICYLGIEAEAENAIGEKYEAVTFEDYVFCDQKSIRMSEFYQAATTDYKPSITLTLKQADYAGQRYIKFEDEVYTMIRTYAVDSEDIEVVLERGIKHGDASISDESIG >NC_016894|3956431:4006028|3990863_3991988_-|WP_014357814.1|portal|DBSCAN-SWA MEMITEQGNGFFAWNGNLYHSDLVRSCIRPKVKAIGKLTAKHVRQTGKDFQVNPEVYMRFLLEEPNPYMTGQMLQEKLATQLQLNNNAFAYIVRDASEMPVAIYPIPATTVEAVYNKAGDLFLRCFLLNGKLVTFPYVDVIHLRQDFNTNDIFGESPQQALAPLMEIVNTTDQGIIKAIKNSAIVKWLLKFNTTLRPEDLKKETDQFTNTFLSIENSGGAASTDAKMDAIQVTPHDYVPNALQMDKTTQRIFSFFGTNEKIIQSRYNEDEWNAYYEAEIEPWALQASGEYTRKLFSRKQRGFGNSIMFESSNLQYASMSTKLALYQAVDRGSMTPNEWRKILGNLTPLTGGDEAIRRLDTQPVKEYTKVENGGE >NC_016894|3956431:4006028|3957844_3960106_+|WP_014357784.1|DBSCAN-SWA MSDNYIQVSGARERNLKNINVLIHKKEITVFTGVSGSGKSSLVFDTIAAESQRQLNETYTSFIRHRMPHYGKPDVDTIENLSVAFIINQKRLGGNARSTVGTITDIYSVLRLLFSRIGEPFVGYSDVFSFNNPAGMCEYCEGLGKIETIDIERLLDKNKSLNEGAIRFPTFEPSGWRLTRYIHSGFFNNDKTIKDYSTEELELLLYADGIKVKNPTPEWHKTSLYEGLLPRIERSFLKKEDGEKVRYGKEIERFVVKQGCPHCHGTRLNDKVLSCKVNGKNIAECADMQINELLDFVQSIHAPVAATIVSELVNRIQHMISIGLGYLNLGRETSTLSGGESQRIKMVSQLGSSLTDLTYIFDEPSIGLHPHDISKINELMRLLRDKGNTVLIVEHDPDMIKIADHIIDMGPGAGSHGGEVVYQGNLDGLKTAGTLTGKYLSYCPKLKSDIRAPKTWLSIQNATMHNLKNLSVDIPRGVMTVVTGVAGSGKSTLINGVLPRLYPETVFIDQKGIQASKRSNIATFTGIFDIIRKLFTKRNGVSASLFSFNSQGACPACKGLGVTYTDLAFMDTIVTVCEECHGNRYTDEVLAYQLRGKSIADVLKMTVTEALEYFQEKEIITVLKRLSDVGITYVSLGQPLSTLSGGELQRIKLASELENGGQIYVLDEPSTGLHMADIKQLISVMNRLVEQNSTLIVIEHNLDIICQADWIIDIGPYAGQNGGKIMFTGLPKDLINCPDSLTGKHLKKYINEK >NC_016894|3956431:4006028|3999100_3999892_-|WP_145972756.1|DBSCAN-SWA MSAMNKLTHLSLFTGIGGIDLASEWAGFETIGQCERGDYATKVLEKHWQDVPRWRDIRTLTGENFYERTGMRTVDIISGGFPCQPYSIAGKRKGQEDDRYLWPEMFRVIQEIKPTWVLGENVVGILRMGIEKILSELESIGYQGGVFQIPACSIGAAHKRDRVFIVSYAIGKRWDGLEQEHGIRCPDIDISNAFEAWNNAEHLSLDFYGAISNPSSGKKRNDNGLSEGMDRLECIGNAVVPQQVYPILKSIAEIELNSRRKTE >NC_016894|3956431:4006028|4002154_4002385_-|WP_014357823.1|DBSCAN-SWA MRSYTIQKVIEILEKKGFSIEEPENNGVLHCIAPSYKEIKIKTDGVTHYFKVLTKYTTHFEKALEWAGVENLEDVA >NC_016894|3956431:4006028|4003459_4003648_-|WP_041669602.1|DBSCAN-SWA MNKNNKQDDRIKHSRILELQEKESTLQKGDSKYRTMINKFRKGIGLKPQYPENNMEENYEFE >NC_016894|3956431:4006028|3978243_3979518_-|WP_014357803.1|DBSCAN-SWA MGRARLNGQSCGAKINGIIKEYIIQAGNTVSAGDFVEFIRCISLGTANNPLGNFSVNYIKAAKLNDTEVMICYRKGSDGVCYASVLNITSATITQVTTPINVSGSQIDSELKIKKLTDTTAIIAYTVSSNTVKTLKIVRFNGTSLSLGGAYNIGVAPLDVLVLSGSTLLFTYCWGSQCLATILTFSGTSITTRGTDIMFFNGYSASVFFRQRADGTILVGFDASNYVGCVVFTISGTTISAGSVVLTPYVGTSNIYVWFVSDIRACVLHLDGTSPASIKFYNVSINGNTITIDTTSRFLGYFSAFFFVSITNLSSTKSIMTFASGTNPFYHNAMVLNLIGDNIIPETRYITYSQNVRESPPPIIIGTKKMMNIYSDGNQYIVSRIINIIESVKQSTLSEGIQGVSKTKGSAGEMVKVFTLTGGL >NC_016894|3956431:4006028|3997767_3998622_-|WP_014357820.1|DBSCAN-SWA MKILRIFPKKTSYTPIDSLVYYPNGIIQSPSWKIFPEFDEIHISCSFTWDRKYCQEMAFQFRSTQDRPVKLGGPAFKSQIDGFTQGLYMKPNIIFTSRGCNNNCPWCIVPKIEGKLKEIPICQGNVIQDNNFLQTSRQHKDKVFRMLKTQKRIQFKGGLEVDLIDDHFVDNVRGLSIDELWLACDTDGAFKNFEKAAVKLVKAGFTREHIKCYALIDGDISENEERLQKIWWAGAMPFAQLYRDFTNEKTKYSKEVEKFARSWQRPAAINMHMKKGTDFRSFNI >NC_016894|3956431:4006028|3992049_3993705_-|WP_014357431.1|terminase|DBSCAN-SWA MSRAEFIEEYYDAIMSGDIVACYRIKQVYEKLMYDLKHQGLFVFDEDLANRPIEFIETFCKQSQGVLGEPLKLMLFQKAKYQAIYGFVDKNTRFRKYREVLDIRGRKNGKTTELAATSIEMTVADGESGAENYFIATKQEQSSKGFNEAWNMIKQDQSLSRHIRKRKSDLFFDANFSFIKALASNVNGLDGLNSHCVIIDELAAIKNRDLYDLMIQSTSSRDQPLLTCISTNGFVRECIFDSQYEYACKVLDGKVVDDTFLPFIYELDDRDEWDKEECWIKANPGLGVIKKIEVLRGFVNKAKEDPAFKATVMVKDFCATENAATAWLRWEELYNPEKFEAKEMGFRYGIGSFDLAETTDLAAAKVVCKRRDDDKDYYLSMYWLPEENLNNKELLDQVPYLLWEKQGLLRVCPGNRINPYAILEWFIEVQDVYDIYIPWIGYDPWHVDASLLMAFQNHFGKNAMISVRQGSYTLSMPMKELKAELIAKQSVYNDHPIDKWCLKNLEVKVDINGNIQPVKGVSQTQKIDGAVAMIIVKVILRDKMAEYLNMI >NC_016894|3956431:4006028|3966551_3966737_-|WP_014357791.1|DBSCAN-SWA MIARLEEYTWSSYDKVIQGYQGNPIALDVEIIKDYFPTVADFVRFSKKDNQNVSKSIKNLD |
67 | Clostridium_phage(41.94%) | capsid,integrase,tail,protease,portal,terminase,transposase,holin | attL 3961017:3961032|attR 4005738:4005753 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_6 |
4017850 : 4027704
Sequences of DBSCAN-SWA_6
Nucleotide sequences of DBSCAN-SWA_6 >NC_016894|4017850:4027704|DBSCAN-SWA TTTATCCTTTCTGAATTTTCATTATCTTAATGAAACATTTTTCCCATTGTAATCTTAAATTAACATTATATTGTATTGTCGCCATCAATTCAAACAAAGTTTTGATAATGGCCTGATTTTTTTCATTTTCCAGCAATTGATGGTAGGCCTTATGCGCCTGATTGGGCACTTCCTGATGGGGTAACGGATAACCGGCTAACAGCAGATCGATCTCATAAAACCAATGAATAAAAAATTCCAGAATCTCCTGACTGGTGCCCTTATCGTTCGCTAAGGTTTCGGCCAACGTAAACACTTTAATCTGATCCCCTTTTAACAAACTATAAAGCTCTCTAAGATAGTGGGTTCGTTCTTTTTGGATTTCGCTGTTATTTAAAAAATATAACGCCATTCCCGGCGAACCACCAGCCGCCATTATCGCTTCAGCTTTAGCTTTTTGATCAAATTCTGGGTTGTCGGCTATTACTTTCTCGATATCCTTAAGACTCAGCGGTTGAAAATGGTAACTTTGACAACGCGATTGAATGGTTGGCAAAATCGCCTGCGGATGACTTGTCATCAGAATAAAGATATTATAGTTAAGCGGTTCTTCCAATGACTTAAGCAGGCTGTTTTGAGCTTCGGGGGTCATTTTTTCGGCCCCGTCAATAATATTAATCCGCCAATTGCCGGAGTAAGGTTTGATCGACAGCTCACTGATCATTTCGCGGACCTGACTTATTTTAATACTGGCTTCGCCAGCTTTGGGCCCAATGATTTTTACATCAGGGTAATTATCATGATCAATCTGGGCACAAACTGCGCATTGACCATTGCCATGATGCGCCGATTCCGGACACAAAAGTGCTTTAGCAAATTCCCGGGCCGTTTTCTTTTTTCCAATCCCATCGATTCCAGAAAAGAGGTAAGCATGGCTTACCTCTTTTCTGGCTATTTCTTTTTTTAGATGATTGGTGATACTTTGATGACCGTATATTTTTTCAAACATTTTTTTCCTCTCAAAAAAATCGCTTAATTAGGTTTATTTTTTTCCTCTTCGCTGTCATCGTAATCATCCGCATCCAGGCCTAATTCTTCATCCAATTCAGCACTGAATTCTTCATAATCGAGCAACCGCACCGCCTCGTCAAAATCACTTTCTTTAACAAAAACTTCAATATGTGCCGGAGTAAAGTTCCCCATGAAAATACTTCTGATCGGGCCGCCAAAACCTTTTTCTTTTGTAATAACCGGGATACCGTTGGCACTCAGATAATTTTTAAGCAGAATAAAATCCATATCCGTATCTGCCATGGTCAAATAGATATACTGATCTTCAATCATTTGTTTTACTCTCCTTTATTGATTTCCAAATTTCCTGATGAATACTGTCAACACTTCTTAACACATTTTCTTCTACACAATTTATTTCCGACCATCCATATTCTTCAACTAAAGCTAACGCACTGTTGTAAGCATCCAGCAAATGTTCGGGACTGCTTTCGTGAATATCCTTTTGCTGTTTTCCGGTTATTTTGTTTTTACGGTTTTTTATCAGTTTCTGATTGATTTCCGGCGGAATATTTAAGAAAAATACGCGATCGGGAATTGGCAATTGATAAAGATTAAATTCAAAATCCCACAGCCAGTCCAAAAATCGCTTGCGTTCCGCCTGATCCTTTATTTTTCCCGCCTGATGCACCATATTAGAGGTTGTATAGCGATCGACCAGAACGAGTCCGCCCTGATTAAGAAAATCTTCATAATCCTCTTTATAGGAAGCATAACGGTCAGCCGCATAAAAAGTGGAAGCAATATACGGACTAATCGTACTGGGGTCTTTTCCGAATGCGCCTTCTAGATACAATTTTACCATGGCTGATGATTTTTTGTCATAACGGGGATAAGAAATTTTCATAACTTTTTCACCGGCTTTCAGCAGCCGCTCATATAACAATTTTGTTTGAGTTTGTTTGCCACTGCCGTCGACACCTTCAATCACGATCAACTGGCCCTGATGTTTTTTTTCCATCTTTGCCGGCTCCTTTTTTAACAACCTGAGTTCGTTTTTTTCATCAATTCCCACGACGGCGACATCGTGGCTTAACAAATGATCTAAATAAGCGGCAATTTCGGGGCTAACTCGACTGCCGGGAAAAAGCAGTGGGATGCCCGGCGGATAGGGAATGACAAAATCCCCGGCTATTCGACCAATACTCTGATTCAGGGGCCTGGTCTCTTTGTCACTGGCGTACAACGCTTCCCACAGGGGCCTTTCGGTTTGCAATGCTTTTTCTAAATTAATATTTTCCCAAATAGCTGGATTTACCGGGTCCGGCGTTTTCTTAATTTGACCGGTATTTATCTTTTTATTGATATCATCAATGGCCTGCGTTAACCGTTTAATATCTTCCGGCGTTGTCCCAATGCCGGTCATCGCTAAAAAATGATTCAACCCCGACATTTCGCATTGGATTCCATACGCTTTGGCCAATAAAGTTTCGATCTCAGTTCCTGACACTCCCCGCGTATGAAATAACCACTTGCTGCGATCATATTCCTGATTTGTTTCATTTTCCTGATAAAGGATAATTGGTGCGTTGTTGTCTTGCTTCTGACAATAATCGCAATGCGCGTTGTGAATGGCTTCAAAGATTGCCTCGCCTTTTTCGTAGGCTATATCGACCGCCGCTTCAACCGATATCATCAGGGGATAACTGGGTGATGAACTCTGGAGCAATGCTAAAAAAGACTTAATTTTCGGAATATCGATCAACGTTCCCTGAAAATGAATCAGTGAGCTTTGCGTGAACGACCCCAATATTTTATGGGTGCTCTGGATGACCACATCGGCCCCGGCAGCTACGGCATCAAGCGGTAATTTATCATTAAATCGCAAATGTGCCCCATGAGCTTCATCGACAATTAAAAATTTTCCTTGTTCATGGAGAATGGTCGCGATCGTTTTAACCGCACTGGTCGTTCCATAATAGGTGGGATTAGGCAGGATCATCCCGATAATTTCAGGATGGTCGATTAATGCCTTTTTAACGCGATCAACCCCCACCGATTTGGCAAAACCCATTTCCGTTTCAATTTCCGGGGTTATCAAAACCGCTTCGATCCGACCAAGAGCCATGGCTCCAAAAACCGCCCGATGACAATTCGTCGGGACCAGCAGCTTCCCGCCAGGTGAAAAGGTTCCTAAAATGGCACTATGGATTCCCGTTGTTGTCCCATTAACCAAAATCGCGGCTTCGTCACTTCGATAAATTTGAGCCAGCTTTTGCTGGGCCTGAGCAATAATCCCCTGTGCATCATGAAGGTTATCAGCCCCGGGAATTTCTGTCAGATCATCATCATACCAGTTCATGTTTATGCCTCTGCCCTTGTGTCCGGGCATATGGAAACGACACTTCTTTTCTTTATTTATTTTATCCAATTCGCTTTTTATTATACTTTTTTTCATGCTTCTATTCTAACACAACCAATCATCTTTACTATTATAAATTTAACTTTTATCCTTTTATCCTTTAATCTTAGCTCAAATTATTATATAATGTGTGAGCAAATACATTGATGAGGAGAATTTAAATGTCCAACGAAAAAATTATTAATATCAATATGGAAAATTTCGAAACCGAGATTTTATCTTATAATGGGGCTGTCATGGTCGATTTTTGGGCCGACTGGTGTGGTCCTTGTAAATCACTGGCCCCAACGATCGATCAAATAGCGCTGGAGTTGGGAAATGATATGAAAGTCTGTAAAATTAATGTCGACGAAAACCAATCCTTAGCCCAACAATTCCGGGTGATGAGTATTCCTACTGTTGTTTTCTTTAAAAACGGCGAAGCCGTCAACCGCTTTGTCGGAGTTCGTGAAAAAAGCGAATATCTTGATACCATGAAAAACCTTTAATGACTGACCACCTCTGAAAGTCTAAATGGGACGATTACTCCCATTTAGACTTTTTTTATTTAAGAAACTTTTCCCCCGGAAGGAATTCCCTCGACGGTCACCAGTGATAATTTTTTACCTTTGGTTGCCGCCAGAATCATGCCATTGGATTCCAGACCGCGGAGCATCACCGGTTTCAGGTTGGCCACCAGAATCACCGTTTTGCCGACCAGATCAGCGGGTTGATAATATTTGGCGATCCCCGATACAACCTGACGTTTTTCCTGACCCACCATCAGCTGTAATACCAACAAACGATCAGCGTCCGGGTGCGCTTCACAAGCGACAACCTCGGCGACTCGTAACTGCACCTTGGCAAAATCGTCGATCGTAATCAGACCTTCCGGCAGCGGCTCGTTCAGCTCCGGAGCTTTTTTAACATCCTTTTTTTGTGGCTCGGCTTTCACTTCTTTTTTGACGGCTTCTTTTTTGACCAGCTCAATCCGCGGAAACAGGGCTTCGCCGCGTTTAATCTGCACATCTTCGGGGTAAGCGCCGAATTTCTGAATACTGTCCCAGGTTAAACACGCTTCCGGACAATTTAGCTGAACCGCGATTTTCTGGGCCGTTTCTGGCATCGCCGCCGAAATAAGAACAGTAACAATCCGTAAACATTCAGTCAGATTATACATTACCTGTGCTAATCGGGCCTGTTTTTCGGGGTTTTTTCCCAGCACCCAGGGTTGGGTTTCATCAATATATTTATTGGATCGCGAGATCAGTTTCCATATTTCTTCCAAAGCTCGGCTAAAGTCCAGCTTATCCATGTAATCACTAACAAGTTGCGGCGTTTTTTCAGCCAGCTCAAGGAGTTCGCTATCAATAGTTTCCGTTTCACGCTCTTTGGGAATTACCCCGCCAAAATATTTATCGGTCATCGCCAATGTCCGGCTTAACAGGTTCCCCAAATCATTCGCCAGATCGGAATTAATATGGCTGACCAATAAATCTTCGTTATACACGCCATCAGAACCATAACTCATTTCGCGCAGGACATGATAACGTAAGGCATCAACTCCGTATTTATCAACTAATACCACCGGGTCAACAACATTTCCTACTGATTTTGACATTTTTCCGCCTTTTAAAAGAATCCAGCCGTGGCCGTATACCTGTTTAGGCAGTGGTAATTTCAAGGCCATCAAAATAATTGGCCAATAAATCGTATGAAAACGAATAATGTCTTTGCCAACCAAATGAACATCTGCCGGCCAATATTTATCCATCAGATCCGGTTTGTCATTAAGATAGCCCAATGCGGAAATATAATTAGGCAGCGCATCAATCCACACATAAACGACATGTCCGGGATCAAAATCAACCGGTACGCCCCAGCTAAATGAGGTGCGGGAGACACATAAATCCTGAAGTCCGGGCTTGATAAAATTGTTGATCATTTCATTTTTACGGGATTCCGGCTGAATAAAATGCGGATTCTCTTCAATATATTGTAACAGCTGATCGGCATATTTTGACATCTTAAAAAAATATGCTTCTTCCGAAGCTTTTTCCACCGGTCGTCCGCAATCGGGACAGTTGCCATCAACCAGTTGACTTTCTGTCCAAAAAGATTCACACGGCGTACAATACCAACCCTCGTAATTGGATTTGTAAATGTCTCCCTGATCATAAAGTTTTTTAAAAATACGTTGAATCGTTTTTTCGTGTTGGGGGTCAGTGGTTCTGATAAACTGATCATAATTAATATTCATCGTGTTCCACAGATCTTTAATGCCTGTCACAATGCCATCGACATAAGCCAGCGGTTCAATCCCGGCAGCTTCAGCAACTTTTTGGATCTTTTGACCATGCTCATCGGTCCCGGTCAGGAAATAGGTATCATACCCTTTTAATTTTTTAAACCGGGTAATGGTATCCGCCGCTACTGTCGTATAGGTATGACCGATGTGCAGGTTCCCACTGGGATAATAAATCGGGGTTGTAATATAAAATGTTTTTTCTGACATAATTACTCCTTTGTTTTGTTATTTAAAATTTATTCAAACCGCAAAAAAACCTTCGTCCCGTTAAGGGCGAAGGTTTCGCGTTACCACCTTAGTTCGCATTATTCTCACAAATAATGCCTTGATAAGTTCAATCGACTTTTAGTTTTATCGCGTCAAGCGGTCACGGCTCAATGCTTCACCGCAACTGACTCCGAGGCCATCTTCAATGTTTTTTCTGCCACCGGCTTGCACCTTTCCCGGCTCTCTTTGGACAGATTCCCCATTTACTCTTCTCTTCATTGTCATTCATATTTTTAATATTTTATTAGACTAATCCTTATTATACTGCAATTCGAAATTTTTTCAAGGCTTTTATCGCTTAACCGTGTTATAAACATCCCGGCGGGAAATGTTGCGATCTTTAGCGACGGCTTTCATCGCCTCTTTCTCGGGCAACCCCTGGTTCAGATAATGTTCCAGATGTTCGGCGATACTTAATTTATCCAATTCCAGACTTGCTATCGATTGCCCTTCATCCGCGGTTTTTCCCTCAATACACAAGACATATTCGCCTCTTGGGGGATGTTCCTGATAATATAAATTGTGCTCGGTGATTGTCCCATACCGACTTTCTTCATAGCGCTTGGTTATTTCCCGGGAAATACTCATCTGGCGATGACCTAAACCCTGTTGTTCCAGCAGCTCCAGCGTTTTGGGCAAACGATGGGGCGATTCGTACAAAACAATGGTCACGGTAGCCTCTTCAATTTGTTTTAACGCGGCTTTAATGGCTTTATTTTCTTTTCCTATAAAACCCAGAAATAAAAAGCTGCGGGTATCTAATCCCGACAACACCAGCCCACAAAGGCCGGCATTGGGACCAGGCACCACTTCCAGTTGAATATCATTTTCGACGCAATGTTTAACCAGCACTGATCCCGGGTCCGAAATCAGCGGCATCCCGGCGTCAGATATCAAGGCAATGTTTTGTCCCTGTTTTAATAATTCAATTAATCCCTCACTGGATTGCTGTTCATTATGCTGATGATAAGCAACCATCTTTTTAGAAATTTCAAAATGATTGAGCAGTTTAATTGAATGCCTGGTGTCTTCCGCCGCGATCAAATCAACTGTTTGTAAAACCTTTAAGCCACGGATTGTCATATCATCCAGATTACCGATCGGGGTTCCGACAATATAAAGTTTTCCCGACATTTATTCGTTATACAGGTTTCTGGCGACAAATACGCCATTCGCCGATGCCTGCATCAGACCGCGGGTGACACCTGCGCCATCACCTAAAACATAAAGATTTTTAATGCTCGACTGAAAGCTTTTATCAACCGTTACTTTGTTGGAATAAAATTTGACCTCAACCCCATAAAGCAAGGTTTCGTCACTGGCTAAACCGGGTGAGACATGATCCAGTGCCCGAATCATTTCATCAATATCCTTCATAATCCGATAAGGCAATACCAGACATAAGTCCCCGGGCACGGCATCAATTAGCGTCGGTCGAATGTTATTTCGCATCAACCGTTCGGCCGTGGTGCGGCGGCCTCTTAAAAAATCGCCATACCGTTGCACCATAATCTTGTTACCGGTTAACATATTTGCCAATCCGGCAATATGTTTCCCATAAGCGACCGCTTCTTTAAACGGTTCGGTAAAACTTTTTGAGACTAATAGGGCAAAATTGGTATTATTGGTTTTTAGTGCCTCCGCTTTATAGCTATGACCATTTACCACCGCCAATTGATTATCGTAATATTCGGTCGACACAACGCCGCCCGGATTTGAACAAAAAGTGCGCACGCTATCATCAAAGGTGGGCGTATAATAAACCAGTTTACCTTCATAAAGGGCGTCGTTGATTTCCTGCATGACCTCATTTCGGGTCTCCAGACGAATGCCGATGTCAATTTTTCCAACCTTCGTTTCAACTTTGTATTGGTCACACATAGCGGTAAACCACTCGGATCCATCCCGCCCAACGGCAACCAAGACCTTATCGGCCCGATAGGTCTCGTCTTTGGCAACAACTCCGACAACGGTATTATCTTCCACTACCAGACTTTGAACCGGGGTTCTAAATTTGATCTCGATCCCCAAGTCATTTATTAAATGCTCCTGAATGCGTTGATAAATCGTGTACCCCACTTCGGTTCCCATATGACGCACCGGACACTCAATCAGTTTTAAATTGCTCTGGATCGCTTTGGTCCGGATATCTCTTATCTCCCGGGGATTGTCAAGACCATGGACGCGTTTATCAGCGCCAAATTCAATGTATAAATCATCGACATATTTGATTAAATCAACGGTCTCATTATAACCGATATATTCCGGCAATTCGCCACCAACATCGGGTGAAAGCGACAATTTTCCGTCGGAATAAGCCCCCGCACCGGCAAAACCGGTGGTAATATTACAAGGTTTACAACCGATACAAACGTTTGTTTGTCTTTTGGGACAAATCCGTTTTTCAATGGCATTCCCTTTTTCCAGCATTAATATTTTTAACGCACTATTCTTTTTAGCCAATTCCATCGCGGCAAAAATGCCACTCGGGCCAGCACCAATGATTATCACATCATATTTCATTTTTTCCTCTTTATGCAAACGCATCTGGTCCGTAGTCATCTTCATTGTAACCGACAGCCAAATCGTTAAATTTAGTATACTCGGGAATCCATGCCAGTCGCACCGTTCCGGTTGGGCCGTTTCGTTGCTTGGCAATGATTAATTCCGATAGATTTTTTAATTCGGGATTTTTATCATAATAATATTCACGATATAACAGCATGATTACATCGGCATCCTGCTCGATCGATCCGGATTCTCGCAAATCTGACATGACCGGATGATGATCGGTTCGAGCATCCGGGGCCCGACTAAGTTGCGATAACGCAATCACCGGAGCTTCCATTTCCCTGGCCAGCGCTTTTAAACCACGCGACATCTCCGAAATTTCATTTTGGCGGTTTTCACTTCGACTACCACCGCTCATTAACTGAAGGTAGTCAATTACGATCAGATCCAGTGCTTTTTCGGTTTTTAACCGACGACATTTGGATCGTACCTCTGAAACAGTTATTCCCGGAGTATCATCAATAAAAATACTGGCTCCGTAAAGGGTATTATAACCAACCACCATCCGTTCCCAGTCTTCTTTTGATAAATTTCCGGTTCGCACATTATTGCTGTCAACTAAGGAAGCTGCGCAGAGCATTCTCTGAACCAATTGTTCTTTGGACATTTCAAGACTAAAAATAGCCACCGAACAATTATCTTTGATGGCCGCATTTTGAGCAATGTTTAAGGCAAAGGCGGTTTTTCCCATAGACGGTCTGGCGGCCACAATAATCAGATCGGAAGGCTGCAAACCCGAAGTAATATGATTTAGTTCGGTAAAGCCGGTTTCTATTCCGGTCAGTTTGCCTTTTTTGCTTTCAATCGCTTCAATCTGGGCTAAAGTCGTACTGAGGGTTTCCTGGATACTTTGGAAATCACCGGTTCGGCGACCTTGTGAGACCTTAAAAATCTCCTGTTCGGCGCGGTCAATCACATCACCAATATTATCATATTGACCATAACTATCTTCCAGAATTTGGGTCGCGGTATTAATCAGATTTCGAATTACCGCCTTTTCATGAACAATCTGGCAATATTCCAGATAATTCCGGTTGATCGGCACCATTTCAATCAATTCGCTAAGATAACCGATGCCACCGATTTTCTCCAATACGCCACGATTTCTAAGTGCATTAATCAGCGTTACCGTATCAATTGGTTTTCGTTCATTATGAAGATCCAACATACACTCATAAATTTCTTTATGCGCCCCCCGATAAAAATCATTAGGCGATAACAGTTCTTCCGCCCGGGCGATATTGGATTCGTCCATCAGGATCGCACCTAAAACAGACTGCTCTGCTTCTATATTGTGGGGAGGAACTTTGGGATTCAT
Protein sequences of DBSCAN-SWA_6 >NC_016894|4017850:4027704|4021808_4023755_-|WP_014357843.1|tRNA|DBSCAN-SWA MSEKTFYITTPIYYPSGNLHIGHTYTTVAADTITRFKKLKGYDTYFLTGTDEHGQKIQKVAEAAGIEPLAYVDGIVTGIKDLWNTMNINYDQFIRTTDPQHEKTIQRIFKKLYDQGDIYKSNYEGWYCTPCESFWTESQLVDGNCPDCGRPVEKASEEAYFFKMSKYADQLLQYIEENPHFIQPESRKNEMINNFIKPGLQDLCVSRTSFSWGVPVDFDPGHVVYVWIDALPNYISALGYLNDKPDLMDKYWPADVHLVGKDIIRFHTIYWPIILMALKLPLPKQVYGHGWILLKGGKMSKSVGNVVDPVVLVDKYGVDALRYHVLREMSYGSDGVYNEDLLVSHINSDLANDLGNLLSRTLAMTDKYFGGVIPKERETETIDSELLELAEKTPQLVSDYMDKLDFSRALEEIWKLISRSNKYIDETQPWVLGKNPEKQARLAQVMYNLTECLRIVTVLISAAMPETAQKIAVQLNCPEACLTWDSIQKFGAYPEDVQIKRGEALFPRIELVKKEAVKKEVKAEPQKKDVKKAPELNEPLPEGLITIDDFAKVQLRVAEVVACEAHPDADRLLVLQLMVGQEKRQVVSGIAKYYQPADLVGKTVILVANLKPVMLRGLESNGMILAATKGKKLSLVTVEGIPSGGKVS >NC_016894|4017850:4027704|4024949_4026338_-|WP_014357845.1|DBSCAN-SWA MKYDVIIIGAGPSGIFAAMELAKKNSALKILMLEKGNAIEKRICPKRQTNVCIGCKPCNITTGFAGAGAYSDGKLSLSPDVGGELPEYIGYNETVDLIKYVDDLYIEFGADKRVHGLDNPREIRDIRTKAIQSNLKLIECPVRHMGTEVGYTIYQRIQEHLINDLGIEIKFRTPVQSLVVEDNTVVGVVAKDETYRADKVLVAVGRDGSEWFTAMCDQYKVETKVGKIDIGIRLETRNEVMQEINDALYEGKLVYYTPTFDDSVRTFCSNPGGVVSTEYYDNQLAVVNGHSYKAEALKTNNTNFALLVSKSFTEPFKEAVAYGKHIAGLANMLTGNKIMVQRYGDFLRGRRTTAERLMRNNIRPTLIDAVPGDLCLVLPYRIMKDIDEMIRALDHVSPGLASDETLLYGVEVKFYSNKVTVDKSFQSSIKNLYVLGDGAGVTRGLMQASANGVFVARNLYNE >NC_016894|4017850:4027704|4018860_4019172_-|WP_014357840.1|DBSCAN-SWA MIEDQYIYLTMADTDMDFILLKNYLSANGIPVITKEKGFGGPIRSIFMGNFTPAHIEVFVKESDFDEAVRLLDYEEFSAELDEELGLDADDYDDSEEEKNKPN >NC_016894|4017850:4027704|4017850_4018837_-|WP_014357839.1|DBSCAN-SWA MFEKIYGHQSITNHLKKEIARKEVSHAYLFSGIDGIGKKKTAREFAKALLCPESAHHGNGQCAVCAQIDHDNYPDVKIIGPKAGEASIKISQVREMISELSIKPYSGNWRINIIDGAEKMTPEAQNSLLKSLEEPLNYNIFILMTSHPQAILPTIQSRCQSYHFQPLSLKDIEKVIADNPEFDQKAKAEAIMAAGGSPGMALYFLNNSEIQKERTHYLRELYSLLKGDQIKVFTLAETLANDKGTSQEILEFFIHWFYEIDLLLAGYPLPHQEVPNQAHKAYHQLLENEKNQAIIKTLFELMATIQYNVNLRLQWEKCFIKIMKIQKG >NC_016894|4017850:4027704|4019164_4021297_-|WP_083837914.1|DBSCAN-SWA MKKSIIKSELDKINKEKKCRFHMPGHKGRGINMNWYDDDLTEIPGADNLHDAQGIIAQAQQKLAQIYRSDEAAILVNGTTTGIHSAILGTFSPGGKLLVPTNCHRAVFGAMALGRIEAVLITPEIETEMGFAKSVGVDRVKKALIDHPEIIGMILPNPTYYGTTSAVKTIATILHEQGKFLIVDEAHGAHLRFNDKLPLDAVAAGADVVIQSTHKILGSFTQSSLIHFQGTLIDIPKIKSFLALLQSSSPSYPLMISVEAAVDIAYEKGEAIFEAIHNAHCDYCQKQDNNAPIILYQENETNQEYDRSKWLFHTRGVSGTEIETLLAKAYGIQCEMSGLNHFLAMTGIGTTPEDIKRLTQAIDDINKKINTGQIKKTPDPVNPAIWENINLEKALQTERPLWEALYASDKETRPLNQSIGRIAGDFVIPYPPGIPLLFPGSRVSPEIAAYLDHLLSHDVAVVGIDEKNELRLLKKEPAKMEKKHQGQLIVIEGVDGSGKQTQTKLLYERLLKAGEKVMKISYPRYDKKSSAMVKLYLEGAFGKDPSTISPYIASTFYAADRYASYKEDYEDFLNQGGLVLVDRYTTSNMVHQAGKIKDQAERKRFLDWLWDFEFNLYQLPIPDRVFFLNIPPEINQKLIKNRKNKITGKQQKDIHESSPEHLLDAYNSALALVEEYGWSEINCVEENVLRSVDSIHQEIWKSIKESKTND >NC_016894|4017850:4027704|4024106_4024949_-|WP_014357844.1|DBSCAN-SWA MSGKLYIVGTPIGNLDDMTIRGLKVLQTVDLIAAEDTRHSIKLLNHFEISKKMVAYHQHNEQQSSEGLIELLKQGQNIALISDAGMPLISDPGSVLVKHCVENDIQLEVVPGPNAGLCGLVLSGLDTRSFLFLGFIGKENKAIKAALKQIEEATVTIVLYESPHRLPKTLELLEQQGLGHRQMSISREITKRYEESRYGTITEHNLYYQEHPPRGEYVLCIEGKTADEGQSIASLELDKLSIAEHLEHYLNQGLPEKEAMKAVAKDRNISRRDVYNTVKR >NC_016894|4017850:4027704|4021422_4021749_+|WP_014357842.1|DBSCAN-SWA MSNEKIININMENFETEILSYNGAVMVDFWADWCGPCKSLAPTIDQIALELGNDMKVCKINVDENQSLAQQFRVMSIPTVVFFKNGEAVNRFVGVREKSEYLDTMKNL >NC_016894|4017850:4027704|4026348_4027704_-|WP_014357846.1|DBSCAN-SWA MNPKVPPHNIEAEQSVLGAILMDESNIARAEELLSPNDFYRGAHKEIYECMLDLHNERKPIDTVTLINALRNRGVLEKIGGIGYLSELIEMVPINRNYLEYCQIVHEKAVIRNLINTATQILEDSYGQYDNIGDVIDRAEQEIFKVSQGRRTGDFQSIQETLSTTLAQIEAIESKKGKLTGIETGFTELNHITSGLQPSDLIIVAARPSMGKTAFALNIAQNAAIKDNCSVAIFSLEMSKEQLVQRMLCAASLVDSNNVRTGNLSKEDWERMVVGYNTLYGASIFIDDTPGITVSEVRSKCRRLKTEKALDLIVIDYLQLMSGGSRSENRQNEISEMSRGLKALAREMEAPVIALSQLSRAPDARTDHHPVMSDLRESGSIEQDADVIMLLYREYYYDKNPELKNLSELIIAKQRNGPTGTVRLAWIPEYTKFNDLAVGYNEDDYGPDAFA |
8 | Streptococcus_phage(33.33%) | tRNA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|