Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
LR134327 | Aggregatibacter aphrophilus strain NCTC5906 genome assembly, chromosome: 1 | 2 crisprs | WYL,cas2,cas1,cas4,cas7,cas8c,cas5,cas3,DEDDh,DinG | 0 | 3 | 4 | 2 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
LR134327_1 | 667186-667484 | TypeI |
NA
Consensus repeat of LR134327_1
|
4 spacers
spacers of LR134327_1
>1.1|667219|34|LR134327|CRISPRCasFinder GTTCAATCGGTTTTGCTTGTCCGTGGCCTTTGCC >1.2|667286|35|LR134327|CRISPRCasFinder GGCGACGATGGGGAGAGTTCGGCCGCATAATGGGT >1.3|667354|32|LR134327|CRISPRCasFinder AAAAATGGTGAATCTGAATTTTTGGGTTTTAA >1.4|667419|33|LR134327|CRISPRCasFinder TTATTGTTATGTACAGAAACACAAAAAATATCT >1.5|667209|44|LR134327|CRT GGTGGCTGCCGTTCAATCGGTTTTGCTTGTCCGTGGCCTTTGCC >1.6|667276|45|LR134327|CRT GGCGGCGGCTGGCGACGATGGGGAGAGTTCGGCCGCATAATGGGT >1.7|667344|42|LR134327|CRT AGCGGCTGCAAAAAATGGTGAATCTGAATTTTTGGGTTTTAA >1.8|667409|43|LR134327|CRT AGCGGCTGCATTATTGTTATGTACAGAAACACAAAAAATATCT >1.9|667363|22|LR134327|PILER-CR GAATCTGAATTTTTGGGTTTTA >1.10|667428|31|LR134327|PILER-CR TATTGTTATGTACAGAAACACAAAAAATATC |
cas2,cas1,cas4,cas7,cas8c,cas5 |
CRISPR arrays and Neighbor proteins around LR134327_1
The CRISPR arrays of LR134327_1 >merge|LR134327|1|667186-667484|CRISPRCasFinder,CRT,PILER-CR GTTTCAACACACAGCCGCCCAAAGGTGGCTGCCGTTCAATCGGTTTTGCTTGTCCGTGGCCTTTGCCGTTTCAACACACAGCCACCCGAAGGCGGCGGCTGGCGACGATGGGGAGAGTTCGGCCGCATAATGGGTGTTTCAACACACAGCCGCCCGAAAGCGGCTGCAAAAAATGGTGAATCTGAATTTTTGGGTTTTAAGTTTCAACACACAGCCGCCCGAAAGCGGCTGCATTATTGTTATGTACAGAAACACAAAAAATATCTGTTTCAACACACAGCCGCCCGAAAGCGGCTGCT >LR134327|1|1|667186-667484|CRISPRCasFinder GTTTCAACACACAGCCGCCCAAAGGTGGCTGCC GTTCAATCGGTTTTGCTTGTCCGTGGCCTTTGCC GTTTCAACACACAGCCACCCGAAGGCGGCGGCT GGCGACGATGGGGAGAGTTCGGCCGCATAATGGGT GTTTCAACACACAGCCGCCCGAAAGCGGCTGCA AAAAATGGTGAATCTGAATTTTTGGGTTTTAA GTTTCAACACACAGCCGCCCGAAAGCGGCTGCA TTATTGTTATGTACAGAAACACAAAAAATATCT GTTTCAACACACAGCCGCCCGAAAGCGGCTGCT >LR134327|1|1|667186-667474|CRT GTTTCAACACACAGCCGCCCAAA GGTGGCTGCCGTTCAATCGGTTTTGCTTGTCCGTGGCCTTTGCC GTTTCAACACACAGCCACCCGAA GGCGGCGGCTGGCGACGATGGGGAGAGTTCGGCCGCATAATGGGT GTTTCAACACACAGCCGCCCGAA AGCGGCTGCAAAAAATGGTGAATCTGAATTTTTGGGTTTTAA GTTTCAACACACAGCCGCCCGAA AGCGGCTGCATTATTGTTATGTACAGAAACACAAAAAATATCT GTTTCAACACACAGCCGCCCGAA >LR134327|1|1|667320-667484|PILER-CR TGTTTCAACACACAGCCGCCCGAAAGCGGCTGCAAAAAATGGT GAATCTGAATTTTTGGGTTTTA AGTTTCAACACACAGCCGCCCGAAAGCGGCTGCATTATTGTTA TGTACAGAAACACAAAAAATATCTGTTTCAA CACACAGCCGCCCGAAAGCGGCTGCT
>LR134327.1|VEF41880.1|665278_666943_+|EIICBA-Glc MKKLLSFEFWQKFGKCLMVVIAVMPAAGLMVSIGNSLPLISDAEWLARVGNIIAQIGWGIIGNLHLLFALAIGGSWANERAGGAFAAGLAFILINLITGHFFGVKIEMLTDPNAHVGTILTGDIPVANYFVNILGQPALNMGVFVGIIAGFVGATTFNSYYNFRKLPEVLTFFNGKRFVPFVVIYRSVLVALILAVFWPVVQTGINHFGEWIANSQDSAPILAPFVYGTLERLLLPFGLHHMLTIPMNYTSLGGTYEFLTGMQQGKQVFGQDPLWLAWISDLINLKDAGNMTQYNELLSTVTPARFKVGQMIGSSGILMGITLAMYVNVDPDKKTIYKGIFLSSALAVFLTGVTEPIEYMFMFVALPLYLVYAAIQGCAFAMADIVNLRVHSFGNIEFLTRTPMAIKAGIGMDLINFIWVSGVFAVAAFLIANFMIKKLNLATAGRNGNYDAKGTDEAPAEEKKVANASAQVVQIVNLLGGRNNIAEVDACMTRLRITVHNPELVGDAAAWKQAGAMGFIVKGTGIQAIYGPKADVLKSDIQDLLSSGVEIPKM >LR134327.1|VEF41879.1|664476_665268_+|Uncharacterized-protein-conserved-in-bacteria MKLLTLNVHAWLEDNQAEKIDIIADTIVEKGYDIVALQEVNQLMSAPAISQALKQDNYGVVLLNKINQRATQKYSLFWSNSHIGYDKYDEGIAFLTRLPVYEVDAFYCSQHQRLDSILSRKILGLTVEYQGQLVDCYSCHINLPNCAGENQLDNIRNIVERSQSRNLKILMGDFNTDAISDPNAYQKIKSLGLLDTFEMAEQKDSGITVEKAIDGWKGHSEEKRLDYIFLNQTKRVLSSQVVFNGKNKPVVSDHFGLEVELTL >LR134327.1|VEF41877.1|660693_664467_+|Maltodextrin-phosphorylase MLTRSSGVLMHITSLPNAFGIGSFGQSAYDFVDFLVETKQTYWQILPLTTTSYGDSPYQSFSAIAGNTHLIDFALLTQMGLLQETDYASVNFGDDPTKVDYERIFYTRRPILEIAVKHFLADKKRQADFKNFEKNNRTWLEDYAEFMAIKEHFGNKALQEWEDKLVVARKPKTLAKYRTMLKEQIQYFKVTQYFFFQQWLALKNYANQRGIKIIGDMPIYVAEDSVEVWTMPELFQLDKECKPLFVAGVPADQFSATGQLWGNPLYDWPEHKKQGYAWWIHRIEESFKIYDVLRIDHFKGFSDYWQVDGKADIAKYGTWQPGPGYDLFKAVKAQLGDLPIIAENLGNIDEKAEKLLTDCGYPGMKILQFGFENVSGESLDSPHYCIPHCIAYTGTHDNDVINGWYADLSTKQQQYINAYTHRATDESVCQAMIRQLFATVSNTVIATMQDILDLPASSRMNLPSTIGGNWEWRMQESDLTKAKKDFLTQITMLYGRANKEQVMIKFSEFVQQTTNKKLEKLSDHAIYVQLLNYVKTLAANKEKNTAKRKVYYISAEFLIGKLLSNNLINLGVYQEIKDELAQASKSLSHIEDIEPEPSLGNGGLGRLASCFIDSMSTLGLNAEGVGLNYHCGLFKQVFKNNEQHAEPNNWIEKESWLIPTDIRYEVPFKDFTLTSKLDRIDILGYKKDTKNHLNLFDIESINHKLIKKGITFDKTKIKENLTLFLYPDDSDKNGELLRIYQQYFMVSNAAQLLIDEAIERGSNLHDLADYAYVQINDTHPSMVIPELIRLLTEKHRIKFAEAVEIVRNMVGYTNHTILAEALEKWPLAYLEEVVPHLVKIIKKLNKLVQKEYPNPDVQIIDKQKRVHMAHMDIHFSNSVNGVATLHTEILKNSELKAFYEIYPEKFNNKTNGITFRRWLEFSNQELAAYIKQLIGDGYLHDATQLEKLLAFKDDKKVHQKLAEIKFWNKLALKTYLKENKGIELDENSIIDTQIKRFHEYKRQQMNALYVIHKYLEIKAGKLPKRKITVIFGGKAAPAYVIAQDIIHLILCLSELINNDPDVNHYLNVHLVENYNVSVAEKLIPATDISEQISLASKEASGTGNMKFMLNGALTLGTMDGANVEIAELAGAKNIYTFGKDSESIIKLYETAGYVSKDYYKKDKHIKRAVDFILDSTLVKLGNKNRLKRLHDELLNKDWFMTLIDFDAYVTAKEQILADYEDQDSWNEKVIHNIAKAGFFSSDRTIAQYNTDIWHCED >LR134327.1|VEF41875.1|659780_660494_-|Trehalose-operon-transcriptional-repressor MSKYKAVYNDIKSKITDGILPPKQELPSESELMQEYGFSKDTIRKALSLLEMDGYIKKQQGRTSIVLEHNLSTPQQLSEIKTVGELNRPLTHQVKTTLTSLYIVQGEEELMQIFNVNDQIDFYRIGRVREIDGEAVEYEVSYFDRRIVPFINREIAEQSIYHYLESELGLKISYSQREIVFRYANEEEKSTMDLGEYNMVVNVTSTTYLADGRLFQYGSISYRPDKITFASTAKRHV >LR134327.1|VEF41872.1|657373_659647_+|5-methyltetrahydropteroyltriglutamate---homocysteine-methyltransferase MTIFHLAGFPRVGAKRELKFAQERYWRGEIAEADLLDIAKKLREINWQHQANANADFVAVADFTFYDHILDLQVATGAIPTRFGFDSQNLTLDQYFQLARGNKTQFAIEMTKWFDTNYHYLVPEFHKDTQFKANPAHYVQQIREAKALGHNVKPTIVGPLTFLWLGKEKGAAFNRFDLLNKLVPVYVDILNALSSEGVEYIQIDEPALTLDLPAEWVAAYKEVYATFAAQVNAKLLLATYFGSVSEHADLLKALPIAGLHIDLVRAPEQLSAFADYDKILSVGVIDGRNIWRANLNQVLDVVEPLKAKLGERLWIAPSCSLLHTPYDLAVEIQLQANKPELYQWLAFTLQKIQELRVIKTALEQGREAVQAELDASQAAADARKNSREIHRTCVAERLANLPKNAVQRKSPFAERIKLQNAWLNLPLLPTTNIGSFPQTTEIRHARAAFKKGDLSLADYEAAMKKEIEFVVREQEKLDLDVLVHGEAERNDMVEYFGELLDGFAFTKFGWVQSYGSRCVKPPVIYGDVTRPEPMTVRWSQYAQSLTNKVMKGMLTGPVTILQWSFVRNDIPRSTVCKQIAVALSDEVLDLEKAGIKVIQIDEPAIREGLPLKRADWDAYLQWAGEAFRLSSMGCKDDTQIHTHMCYSEFNDILPAIAALDADVITIETSRSDMELLTAFGDFKYPNDIGPGVYDIHSPRVPTAEEIEHLLRKALQVVPKERLWVNPDCGLKTRGWPETIAALKVMVDITKKLRAELA >LR134327.1|VEF41870.1|656176_657109_-|Cyn-operon-transcriptional-activator MKPIFLELRHLKTLLALKETGSVSLAAKRVYLTQSALSHQIKLLEDQYGLPLFERKTQPLHFTPAGERLIQLANDILPKVIEAERDLARVKQGEAGELRIAVECHTCFDWLMPAMDLFRQHWPLVELDIVSGFHTDAVGLLLSHRADWAVVQEVEETPDIVYKPLFSYEMVGLCAKDHPLAAKDVWQAEDFIDQTLITYPVPDDMLDLLRKVLHPKGVNPTRRTSELTIAIIQLVASKRGVAALPFWAAKPYLDRGYIVARKITEQGLHSNLYAATRELDSQIAFVDDFYETVKAQSFSTLPELSILEEI >LR134327.1|VEF41868.1|655440_656172_-|azaleucine-resistance-protein-AzlC MSDVKTNSHPIWAAAKAALPYSAPMLAGFLFLGVAYGIYMKALGFSFWYPVLMALLIYGGSVEFIIAGALSLAFAPLNALLITLMVSGRQLFYSISMLEKYGKSLGKKRPYLIATLVDESFSLNYMAKVPSHIDRGWYMFFVSFYLHMYWMIGAGLGNLFGNIIPFDLKGIEFAMTALFLVIFAENWAQEKSHESSLLGLAIAAISLIVFGREYFLLPTLIGIWTVLTFRRPKLSSRLERIEE >LR134327.1|VEF41865.1|655111_655444_-|Branched-chain-amino-acid-transport-protein-(AzlD) MTLTEQIITIGIAVLGVQFTRWLPFWVFPANRPIPEYIRYLGKVLPAAMFGMLVVYCYKNVDVFSGFHGVPEFLSGVIVVALHLWKRNMFLSIAAGTMLYMFLVQRVLVA >LR134327.1|VEF41863.1|652252_655045_+|protease3 MSNQKTMKKLTALFVLLCSFRLVIACQAGIDPDALAFDPNIKHGKLTNGLQYYILNNRDPKDRVYIRLVVNAGSMHEDDDQKGIAHLVEHMAFNGSKKYPENTIINALEKLGMKFARDINAFTDFENTVYTLNLDGNSPQKLSLAFDVINEWMNHLTILPKDLDGERGVVQEEWRRRLSPMLRLGDKKSAIEMAGSRYVLRDPIGDMNIIRHISRDRVADFYHKWYRPDNMSLIVVGDIDTHKITQLISQQLDKPSSHTQRPLDKIDFSIPLIHHWRVASIAEQGTNIPALELSFFEEDKQKETITDYKQDLIQQIVTRLVNLRLQKWEENQNNWLDSANFYRSHLGKQTLQSVFSLQLADTNYLKNITALFAFIAEIKQHGFTADELNSEIARLHNLNEKQQNIRPGSLKIANDLIAIAANHQIMLSAKERYNLNRRFLNEIKVTDLNVTFNQMLALNAKLLLITQLLPEKKLPFDATYIEQRWNQAMRSDQNQWENKKHIVKQPHFEFKDGSLVLEKHWDKGNIDEFRLSNGAKLIYHYSNKTPNQVHFRAVTSGGLRSVPNQDYHLLRTAITLVDDTGTGELTQADVSNLFGQSPLVLATVIDDDKQGFTGVAKPQDLSRLLTLFRLKLQSAPVSNNVLQKYHRETQDYFKQIDAETKFMQAISYLRRPNTATVYTQNQNEQLSFTAAQLSQIYQEKILGKTDFTYFIIGDISRSELEKLAKQYLATVEIKTQARAYQPGYIHTPKKAFIMRGLSEPRADVEIYLTAENQWHPEQKYALEILGEIVQEKLRLVLREKVSGIYSVNSWFSQDPHTPQIEGKIAFSCAPNRAEELIKLTHQILDEIIENGIDETLLRKKQAEQQQYIKRQFDSLVSVAGMIEDSYWQQGNPQSVYLYQRLEQLADKPHLEALARKVLVKAARFEAILRQ >LR134327.1|VEF41861.1|649826_652193_+|Outer-membrane-cobalamin-receptor-protein MYKKTKIAFFICTALYAQHVLSEEKSTNKSNMLPEIIVYGDSNKSLSSTQAVTSNEMEKIPTTNNNITDYLRSNPHIRYEDSDQNGFQLGEIKPQNISINGADANQTAYFVDNVNVNNDLTVDNEIFDGAMQVVPGISNTQAYFFDASMLSKVEVHDSNISASLGGFMGGAVVAKTKQYNGKDGVSLKYRTTNSGWAKINADSSAKTLLDKIRPDAGGVAEFQPKYHKQTFSIMAEKGLTENLGMVIGYSKRHARIQQNRLIGYAPDVKLDKQNHKRDSDNLLLNFNLAASEKDRFELGFRYSNYKEQKYYATNIDSNVSDYHQALGSTLAWVHSFNSGILTNTLAYDHFKDKRKSSSANVEIVSVFDENFDPLYDYEKGGYGNSSLTQDNIHFSTEFAVDPFNLGFANHSISIGGIYQATHYKFNRPQDVHSKIIQKYPNLSPIETTNVTHQGNAQTRYQNFVFYTEDLIKWKKLELRPGVRIERDDYLQNNNIAPRFVARYKPWEETGFTLGLNRYYGRSFASLKLTNEILKINRDTSRKYQEFHSLKTPYADELSIGFDQEFNNLAFKLNYIHRKNKNRIVLKRDANKVNFYHNGSDFSVEVYTFQMNNIEPWQLGKSYWTSSLGFDWLKTKRADIGRDLDPNELVYLDGKLLTRREMLNKVNSSTEDWITRFGLDMAIPDYNITWSNKVYIKAPIRSYDVLEGDFNDGISRYRSYHYGRHTQWDSSIRWQPTITGNHSIYLQVDILNVLNKTRKSKTVKPISSNDEYGIYTPGREFWLEVGYKF >LR134327.1|VEF41882.1|667674_667968_-|CRISPR-associated-endoribonuclease-Cas2 MLMLITYDISFDDPNGQARLRRIAKHCLDYGVRAQYSVFECDVTPDQWVMLKNKLLETYDPTCDSLRFYHLGSKWRNKVEHHGAKPAVDVFKDVLVI >LR134327.1|VEF41884.1|667971_668985_-|CRISPR-associated-endonuclease-Cas1,-subtype-I-C/DVULG MRKLQNTLYITTQGSYLHKERETLVVEQERKKVAQLPVHSIGHIFCFGNVLVSPFLLGFCGENNVNLAFFTENGRFLGRLQGRQSGNVLLRRAQYRVSEQNPVSIARNIIAAKIQASKRVLQRQIRNYGENAAIQSAVDSLNISLRQLKGTAELDVVRGIEGDAAARYFGVFGQLLSEKSGFSFDGRNRRPPRDGVNALLSFVYSILGKDISGALQGVGLDPQVGFLHADRPGRDSLAQDILEEFRAWWADRLVLSLINRGQIKPQDFVAEASSAVSLKADARKLLFQALQAKKQEKIVHPFLGEEVEIGLLPYIQAMLLARHLRGDLAEYPPFLMR >LR134327.1|VEF41886.1|669023_670040_-|Uncharacterised-protein MNIRPDFLPLPWQLNSLLECAKVLENNKNDWSHLKNKEDFSQVYYLDLKDRLPLEKIYATGAMVSGMSDDLRQFNYPNYYPTLTSFLQSSVINNIITGKWSDDLTSILKNAEDKVYELKENSVSVPWAIEQMLKLFKKQIELLNIIRQFLIGLKQSNIYQRENEILIGSVSVERILECINRAGKRFEDLPATYNQFGEEDLRDNILLALSGISDISAYGEVFNKVGKTDILAFENGEKKFIAECKFWRGEKVFLGAINQLLSYLTWRDNNVAVIIFVDNVDFVRVIDIARSSIQQHPYYVSLISQRDESWFEYKFNNGNQDINLSLMIYHIPSSIQHS >LR134327.1|VEF41888.1|670074_670545_-|CRISPR-associated-protein-Cas4 MSGWIRASRKRARVCALSGRCKLGISGVLDLVEVDTKTGRLKPVEYKRGKPKPDPMDEIQLCAQGLCLEEMTVQTVSEGALWYMQTRHRVPVVFSDDLRAQTLSTIAAVRELLNSGQTPPPDYGKRCKACSLVEICQPELLGKRDRSLGYVVGLFE >LR134327.1|VEF41889.1|670803_671670_-|Uncharacterized-protein-predicted-to-be-involved-in-DNA-repair MSAIQNRYEFVYFFDVTNGNPNGDPDAGNMPRLDPESSKGLVTDVCLKRKIRNFVEISSENEAGYEIYVKEKSVLNLQNKRAYEALGIESEAKKLPKDEAKARDITAWMCKNFFDIRTFGAVMTTEVNSGQVRGPVQLAFAQSIDPIVPLEVSITRMAVTNEKDLEKERTMGRKYIVPYALYRVHGFISANLAAKTGFSDDDLAKLWQALQLMFEHDRSAARGEMAARKLIVFKHDSALGNQPAHKLFDAVKVERVNGESGTPASGFDDYKISVVSDGLNGVSVEELL >LR134327.1|VEF41892.1|671681_673475_-|CRISPR-associated-protein-Cas8c/Csd1,-subtype-I-C/DVULG MILASLARYYRRLAAENDEMGNPKVPPYGFSEEKIGWILVLDKEGRLKTVVPNLTADKKPQPKLMSVPQSFKRPGTTPKPFFLWDKTSYSLGVETNKNKAEAKEKPFTSSEKTFDAFKQYHLDLLQNSEDEGLQALCRFLQNWQPAYFAAENLPAEMLDANIAFSLEKPTALIHKREAAQTLWAGCLKSDEALEGLCLISGDTAPIARLHPAIKGVFGGQSSGGSIISFNKEAFASFGKEQGANAPVSEQSAFAYTTALNYLLRQRNQEENNHCLTIGDASTVFWAEADDNATAQAAEGFFAHVFTPPDDEQESAKVFNVLEQIGKGRPLQEIAPELSANTRFYILGLAPNAARISVRFWLDTTFGQLAENLAQHWQDLALEPCAWKTPPSIWRLLLQTAVLGKSENISPVLAGEMTRAVICGTPYPMSLLSQLITRIRADGDVNGLRVAMMKAVLERRFRKGFIEEGVPMSLNNESPNRAYLLGRLFAVLERIQYQALGDLNAGIADRYYGSASAVPFSVFPRLLSGAKHHLSRLRKDKAGMAVNLDKDLGEIIAKLPETFPRHLSIDEQGRFAIGYYHQEQSYFAKKETAETIEN >LR134327.1|VEF41894.1|673471_674149_-|CRISPR-associated-protein-Cas5,-subtype-I-C/DVULG MANQIRLHIWGDYACFTRPEMKVERVSYDVITPSAARGILAAVHWKPAIRWVIDRIYVLKPIRFESVRRNELGGKISAGKVSGAMKRKSVADLYTLIEDDRQQRAATVLKDVAYVIEAHAVLTAKAGADETVTKHIEMFKRRAKKGQCFQQPCLGVREFPADFALIDEGEPLPPLALSEREANRDLGWMLHDIDFDHGSTPHFFRAQMKDGVIDVPPFYAEEVKA >LR134327.1|VEF41896.1|674319_674736_-|putative-methyltransferase MLEDTEKSYHAKVWSESAVFDNRLIFGDNLLSLKALEQEFTGKVKCVFIEPPFNTGSAFEHYDDGVEHSIWMGLMRDRLEIIKRLLSDDGSLWITIDDNEAHYLKVLCDEVFGRRNFVVNAIWVKKSAPQNDAKLIMY >LR134327.1|VEF41898.1|674816_675761_-|Uncharacterised-protein MSTNTKKQIKEIQAENFNDWSVSFWLIKRKAPTTIKEASYHAWRVDMDKKLPTRFKGYLKNQLQGKKFHVEKYDYSNADCDDVLLTVDSGITDFEKVEAEINKGFDNPRVDNHKDLLNSWAYVILFEKDDKKLYAWKKINTDTQPKKVASKGILFFINKELVDPDDKEVFVIYPNYDFFVYKRTVFIASKKQFESSMNFREGMKRKSAEVIADFKNLETFKNIELIEQYVGNNLHHLRKMASILKSGYYKQPDYLKKLIAVNKKEKWDLKVENGQIVVEEETIDLLLKLLNNDRLRSPINDEIFDAAAKSKVNK >LR134327.1|VEF41900.1|675757_676339_-|Uncharacterised-protein MADSSLRLRPWVSLILFISAYSPLMVIMAIKQIDLTSPNYFNSPEIGIGLLVAAIISSIIVLQVVKSVRSGLMVVVSKASNKSGDMFGYTIPYMMSFMRIDLTDWQTILAIILFLTVLFTMAYRTKTVFINPILAIFGYMLIDCTFKRGEKEVQAMVITKQPISYGDTVCLDRLSHYLYIRSNSDYKNDKEKS |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
LR134327_2 | 1433507-1433648 | Orphan |
NA
Consensus repeat of LR134327_2
|
1 spacers
spacers of LR134327_2
>2.1|1433555|46|LR134327|CRISPRCasFinder TGTGCTCTACCAACTGAGCTATTCCCGCATGGCTTGATGTTGAGAA |
DEDDh |
CRISPR arrays and Neighbor proteins around LR134327_2
The CRISPR arrays of LR134327_2 >merge|LR134327|2|1433507-1433648|CRISPRCasFinder TGGAGCGGGAAACGAGGCTCGAACTCGCGACCCCAACCTTGGCAAGGTTGTGCTCTACCAACTGAGCTATTCCCGCATGGCTTGATGTTGAGAATGGAGCGGGAAACGAGGCTCGAACTCGCGACCCCGACCTTGGCAAGGT >LR134327|2|2|1433507-1433648|CRISPRCasFinder TGGAGCGGGAAACGAGGCTCGAACTCGCGACCCCAACCTTGGCAAGGT TGTGCTCTACCAACTGAGCTATTCCCGCATGGCTTGATGTTGAGAA TGGAGCGGGAAACGAGGCTCGAACTCGCGACCCCGACCTTGGCAAGGT
>LR134327.1|VEF43346.1|1431668_1433294_-|Putative-phosphoethanolamine-transferase-ybiP MFKKFLSYLNSRIFWIWLLFFSFITLIISPENSAYYGIFVIYIIYYLIFSFNQKIFWLFITFVVITLSLYQPIYSSYGNLNSGVVAAFFETNPAESFEFLGKLKIDQFILPFLFSLSAYILYRLREQATPQGEITEKDIKYKKILNITLIIVTIFSIIWIPTKFHFENSSKEQIDSHWTLANSPVNLISFYANIIDSITDYYNDKKDLEAAKDILPPWHIISTQPKYKNYILIIGESARKDYMSSYGFKLPTTPFLDKTNGYINAGYVSAAPATYHSLLNTLHFKPKDKGKKDYSYNIISLAKAAGIKTFWLSNQGTIGKYDTLASRLGIGADFHYFTKKGGFITNNADDFKLLEELKIKFKEKAYENDTRLFVIHLMGSHRNFCQRITDKEKKLEFINESLSCYVNTILKTDKLIEEIVNVLKEQNEPYSLIYFSDHGLSHVNKENKKEVDLDFGEEHKQNFEVPFVKISSDDTSREVVNVKRSAFNFIYGFSQWLGIETKELDQEYNFFSNKNDENIKVFNFKENIPYNTLKNDDIPNL >LR134327.1|VEF43344.1|1431025_1431643_-|spermidine-synthase MNKYGTKTVKTVFFMSGFAALIYQIAWQRMLFTAFGVDLESITIIIAVFMAGLGIGAYFGGRIADKFPKHIILLFALTEIGIGIFGFASPTLIELTKNLFLHSSIITIAFSNFVLLLFPTFLMGSTLPLLTQYLNQHFDNIGNNIGWLYFTNTLGAAFACITTGFFLFNYLTIIQVIYLAAIINCLVATIIFLKYRKRGMNYDNH >LR134327.1|VEF43342.1|1429527_1431039_-|Spermidine-synthase MTITRKAMLLSFLSGFLSLGLEVIWIRLFSFYGIILPQIFSLTLALFLLGIACGSLIGKNLCQSGKGNISYIGYAFILSAFFDCLAITMIMYFPLEGMLGIFIVSIFFCALVRGIVFPIVHHLGAEQKKTGAAISNVYFANVLGCTISPILIGFYLLDTFTTQQTYLIIILITLITATFCVPTKWLKSAVSIFAVLVMMTTFILPEKVIHALAQKKDENGQDLKLEKLIENKHGFIQVYLNSNNDELVFGSNVYDGMLNTNLNHSHNGIERAYLLPIIAPHAKNILVVGLSTASWTKVLTSMPELESMTVIELNPGYPQLAGMYPEMHKFLQDKRVNLITDDGRRWLNKNPDRKFDFILMNTTFHWRNYATNLLSKEFLELTKSHLNPNGFIYFNTTSSFDAYYTSKDVFPHVYSYVNMSLASLSPIPEITKEQVLQGLEKLKWEDGNRVFDSSEALNKGVNNILNRPFISYKNIDFSKLRRNAEVITDNNMITEYKYGFFNQ >LR134327.1|VEF43340.1|1428881_1429358_-|ADP-binding-protein MTERFTQYIPNENAMCAFGEKLIKAICQMSNNKSVMLYLNGDLGAGKTTLSRGMIQGLGHSGNVKSPTYTLVEEYKIGGKIIYHFDLYRLADPEELEFMGIRDYFAENTICLIEWAEKGAGLLASADLLVNIAYAENARNIELLAESETGRQIIQQLN >LR134327.1|VEF43338.1|1427377_1428835_-|N-acetylmuramoyl-L-alanine-amidase-AmiB-precursor MHGLLFFAVLAFADNTWTIAIDPGHGGKDPGAIGRNLKIYEKNVTLSIAKELKALLDKDPHFRAVLTRNGDYYISVPQRSEIARKYKANYLVSIHADSSETPNLRGASVWVLSNRRANDEMGQWLEDHEKRSELLGGAGSVLASHNEKYLDQTVLDLQFGHSQRVGYELGNIVLRHFSQIASLSRPTPRHASLGVLRSPDIPSILVETGFLSNQEEELKLSTPAYRKRIAKAIYNGLAEYRRKNVKDEPKVAIVDKNEKTSEKSTALEVKDSGIRHTVKSGEGLGKLAEKYHVSTADIIALNKLKRKALWVGETIKIPDNGKNIPTTEDKSVKTKENNIVEVKDSGVRHKVKRGETLGKLAEKYKVSANDILTLNKLKRKELLIGENLKIPAIAKAETSNKTEKGKETETPKPVDKSPKTQGKTKPEVKEAVPKFHTVKKNETLYSIAREYKIAPNKLLKLNPQLKNGKVLSGQKIKLTEDQGKK >LR134327.1|VEF43334.1|1425530_1427378_-|DNA-mismatch-repair-protein-mutL MTIRVLSPQLANQIAAGEVVERPASVVKELVENSLDAGADKIQIDIENGGAGLIRIRDNGIGIAKEELALALARHATSKIADLADLEAILSLGFRGEALASISSVSRLTLTSRTAEQHEAWQVYAQGRDMETTIQPASHPIGTTVEVANLFFNTPARRKFLRSEKTEFSHIDEVIRRIALAKFNISFTLTHNGKVLRQYKSAVTNEQKLKRVAAICGDDFIQNALQIDWKHDDLHLSGWIALPHFNRPQNDLNYCYVNGRMVRDKIITHAIRQAYAEYLSNDQYPAFVLFIDLNPNDVDVNVHPTKHEVRFHQSRLVHDFITQGISHALTSESLDFSATETERKIQEPMGLWEVSSKPNRSAAGPNMFTQPSTYSTGYCVEKQPSEGAYHSSQKHRQNPPHFNSDNITPSVLDAHKYLWMDSTAPSRSKITISEDSKPRSTCLHALALVGNHALLLQQERHFYLLSLSRLQRLKLELNLTLTATSQPLLIPVIFRLSETQWQAWQQQKAWFTQVGFDFLAEDAQRKITLQKVSAHLRRQNLQQLIIALLNEPVENLSEFLTALLAQLDFPPIQVLADAVTMLTEIEQLLNKQSHIQLSDLFLEINWQPYLTQLAD >LR134327.1|VEF43332.1|1424571_1425528_-|tRNA-dimethylallyltransferase MMQHSEHKPPAIFLMGPTASGKTDLAIQLRQQLPVEVISVDSALIYRGMDIGTAKPTAEELALAPHRLIDICDPAESYSAMNFCHDALREMQDITAQGKIPLLVGGTMLYYKALLEGLSPLPSADEKVRSEIETKAMQIGWSGLHQELAKIDPISAQRINPNDSQRINRALEVFYLTGKTLTELTAQKGEALPYDILQFAIAPEQREVLHLRIEQRFHKMIELGFQQEVEKLYQRSDLKENLPSIRSVGYRQMWEYLRGDYDHKEMIFRGICATRQLAKRQITWLRGWKSPIQWLDSLHPTQALEKVLVSVNSLSDKQ >LR134327.1|VEF43330.1|1424142_1424445_-|RNA-binding-protein-Hfq MAKGQSLQDPYLNALRRERIPVSIYLVNGIKLQGQIESFDQFVILLKNTVNQMVYKHAISTVVPARSVAHHNANQQQQHQQGQQQEAPSSVETNTDAQTE >LR134327.1|VEF43328.1|1422745_1424128_-|GTP-binding-protein-HflX MDNLLGNLTQSAVDSGNVSTAFSMPENSTQTSDHTINNAIIVHCFFEQSKNTDDLTEFQLLAKSANVHILNVITATRSTPQAKYFVGSGKAEEIADAVRQYNAALILANHGLPPAQARNLETLCDCRVVDRNGLILDILAQRARSHEGKLQVELAQLKHLSTRLVRRKTGLDQQKGAVGLRGPGETQLETDRRLIKVRINQLQSRLEKVAKQRNQNRQTRQKADIPTISLVGYTNAGKSTLFNLITDANVYAADQLFATLDPTLRRLTLQDVGTTILADTVGFLRDLPHDLISAFKSTLQETTEASLLLHVIDCADNRKLENIEAVNQVLEEIGAQEVPRLLVYNKIDQLENVTPYIEYDEKHLPSAVYISANSGSGLDLLLEAIHLRLTEHILNLQIRLPPSDGKLRHAFYQLNCVEKEEINEQGEFLLSIRLEKTEWLKLVKRFTQLTPFNPIQPDEN >LR134327.1|VEF43326.1|1421789_1422749_+|Transcriptional-regulatory-protein-tyrR MTTLKNTDPFAQIVSKNPRMQDMIEKAKKFALLNVPLLIQGETGTGKDVIAKACHDFSERRDHAFLAVNCAGIPGEDAETEMFGRRNKDGEFIGFFEYADGGTVLLDGVEELPLTLQAKLLRFLSDGTFRRVGEEEERYANVRVICTSQQPLQHYVEQGKMRSDLFHRLNVLSLNLPLLRERKEDLALLSYQLIQEISEKLGVFPPHFDENVLRYLQEYPWPGNIRELYNALYRACSLCQNNQLRIEDLGLAPQIPHSQDIDQFITEGDTLDEMVGRFEAAVLNKFYAKYPSSRKLATRLGVSHTAIANKLRQYGIGKS >LR134327.1|VEF43348.1|1433795_1434341_-|Oligoribonuclease MELDKQNLIWIDLEMTGLDPEKERIIEIATIVTDKNLNILAEGPVLAVHQPDELLNKMSEWCVKTHTANGLVERVKASKLNERAAELQTLDFLKKYVPKGTSPICGNSVAQDKRFLFKYMPELADYFHYRHLDVSTLKELAARWKPEILNGFTKQNTHLALDDIRESIKELAYYREHFLNI >LR134327.1|VEF43349.1|1434412_1435453_+|Putative-ribosome-biogenesis-GTPase-RsgA MSKPKLTQNQKRRIQSNNNKVLHRHQKKEIEWRDDMLGESQEGVVVTRYARHADVENAQGEIFRCNLRRTLSGVVVGDHVIWRQGNEQLQGVSGVIEGIHPRKNEISRPDYYDGIKVIAANIDRIIIISSVLPSLSLNIIDRYLVVCEEANIEPIIVLNKVDMLTEAQWLEADELLAIYRKIGYQTLMLSAQSGKNLEKLTALLSHGVSIFVGQSGVGKSSLINAVLPHVDAQVGEVSATSGLGQHTTTSSCLYHLPQGGSLIDSPGIREFGLWHLEEEQITKGYREFQTVLGTCKFRDCKHLSDPGCALRQAVEEGKISTVRYENYHRLLASRKEMKSQRHFSSE >LR134327.1|VEF43350.1|1435680_1435938_+|Phosphocarrier-protein-HPr MYSKDVEITAPNGLHTRPAAQFVKEAKAFASDITVSSAGKSASAKSLFKLQTLALTQGTVITISAEGEDAEKAVEHLVALIPTLE >LR134327.1|VEF43351.1|1436078_1437806_+|Phosphoenolpyruvate-protein-phosphotransferase MISGIPASPGIVFGKALVLKEEKIVLDTQKIKDSQIENEIARFYAGRDAAVEQLTSIKDRAYQSLGEEKAAIFEGHLMILEDEELEEEIIDYLRSNHVNAAVAANVVIDQQVAMLSEIDDEYLKERAGDIRDIGNRLIKNILGMHIVDLGEINEEAILVAYDLTPSETAQLNLDKVLGFVTDIGGRTSHTSIMARSLELPAIVGTNNVTEKVKTGDFLILDALNNAVYVNPSQQEIQRLKTLQDKLAEEKAELAKLKDLPALTLDGHQVDVVANIGTIRDVEGAERNGAEGVGLYRTEFLFMDRDQLPSEEEQFIAYKEVVEAMNGNLVVLRTMDIGGDKELPYLNLPKEMNPFLGWRAIRIALDRREILNAQLRAVLRASAYGRLAVMFPMIISVEEIRELKSVIEELKVELRNEGKAFDEDIQVGVMVETPSAAVNAKFLAKEVDFFSIGTNDLTQYTLAVDRGNELISHLYNPMSPSVLNLIKQVIDASHAEGKWTSMCGELAGDERATILLLGMGLDEFSMSAISVPRIKKLIRNVNYQDAKLLAEKALQQPTAAEIEQLISDFLAEKALN >LR134327.1|VEF43352.1|1437866_1438367_+|Glucose-specific-phosphotransferase-enzyme-IIA-component MGLFDKLFGSKDKKAVDVEIYAPLSGEIVNIEDVPDVVFSEKIVGDGVAIRPTGNKLVAPVDGVVGKIFETNHAFSMESKEGVELFVHFGIDTVELKGEGFTRIAQEGQSVKRGDTIIELDLPLLEAKAKSVLTPVVISNMDEISNIEKKSGEVVAGDSVVLVLKK >LR134327.1|VEF43353.1|1438502_1440542_-|Oligopeptidase-A MSNPLLTPTDLPAFSKIEPQYIEPAIKQLIEENRATVEHLLKQPHFTWENFILPLAEAGDRLSKVWSPISHLNSVKNSPELREAYQACLPLLAEYGTWVGQHQGLYEAYLQLKNSPEFANYSQAQKKAIENSLRDFKLSGISLPAEKQKRYGEIVARLSELTSQFSNNVLDATMGWEKIIEDESQLKGLPESALQAAKQSAESKGLSYYRFTLEFPSYIPVMTYCENRELREEMYHAFATRASDQGPNAGKWDNSALMQEILSLRVELAKLLDFNTYTELSLATKMAETPQQVLDFLTNLAQRSKAQGKRELQELKDFCKTHYNLTALELWDLTFYSEKQKQHLYAINDEELRPYFPEERVLNGLFELIKRIFHIRAVERHGVETWHKDVRFFDLIDDTNEVRGSFYLDLYAREHKRGGAWMDDCIGRRKTIDGNLQKPVAYLTCNFNRPLGDQPALFTHDEVTTLFHEFGHGLHHMLTKIDVADVAGINGVPWDAVELPSQFMENWCWEEEALQFISGHYQTNEPLPKEKLTQLLKAKNFQAAMFVLRQLEFALFDFRLHHTFDANKSNQVLDTLHQVKAEVAVVPTVDWGRMPHSFSHIFAGGYAAGYYSYLWAEVLSADAYSRFEEEGIFNAQTGQSFLDEILTKGGSEEPMKLFKNFRGREPQLDALLRHKGIAN >LR134327.1|VEF43355.1|1440674_1441040_+|Inner-membrane-protein-ybaN MKYFYIGLGFLFLIIGLIGIVLPILPTTPFLLLTVFFFAKGSERVHNWFVGTKIYQNHLKDFHEQRALTKKTKMAILTFSTTMLLIGFYFTPSIIGKSLIIAVLLIKYWFFFFWIKTLEEE >LR134327.1|VEF43357.1|1441078_1442647_+|Periplasmic-oligopeptide-binding-protein-precursor MPVAHFPLSAFRLFPFKSVVLFCSVFALNACDKKPQEPVTPPPTIETVQLQLISSQGNRQLLVRGVYSDLVLNPSQAVNAEQFAFLRDLFEGLVIYDQRGNVIPAVAESWQTTDNKTWKFSLRQDAKWSNGEPVTAQQFVASWQALVTSNSPLRHYLAYINLANAESVLKGKLPADKLGIFAENDRTLRLTLDKATPYLPQMLVHISLLPQYLAPHEGIVTNGAYQVAGQENHFIHLEKNPHYWAQDKVAFKHVDYQKIASQQDPIALDLVINPSKTEQAQYFPQLCTYFYAFNMKQPKLAQSSVRKALSMMAPSRNMNNEGKNFIYLSDNFLPISMQTVESHWEQTPMEQLLSQSKISEKAPLKLTLSYDQTELQSKIAQSLIRMWSQSDMIRIIGEGMPRQKLLENIAKGDFQIARSGWCADYNDPAAFLSLFYSHSPDNKSGYHNEEVDRLFEQSLQLMPSAERTTLYSRIEQILQQEKVVLPLYQTTVPIYINPTINGYYLSNPTEVIYSKDLFRKIQ >LR134327.1|VEF43359.1|1442685_1443483_-|Uncharacterised-protein MLKTLSKVISSSISMAFLVVLGWSVAYAYGWGQSYFYGFPWWYVDVGSGNVARSLGYVIWATIILLLTYLIGLFGLKKVKPYMSERCVNLLRTYILCTIFFIPIPVACILLVGKLNSIFAIVYIITTFIFTLLFKNYFRNHISTISIHVVIRFFHRNKSYVMLFMYCYFVIFGFIMGYVRPNFKIIFDSMEVEKQSYYVLAKYSYTFILSRSIRATNGDFYIYKMNPNSICHIKVVDIRKLGIDKMAPKEIELKEVKAEEANTEL >LR134327.1|VEF43361.1|1444598_1445252_-|GTP-cyclohydrolase-2 MAKIELVAQANLPTEFGLFKIVGFEFPDSKKEHVALVLGDISNGDEPVLARIHSECLTGDALHSLKCDCGFQLAAALRQINQEGRGVLIYHREEGRGIGLINKIRAYSLQDQGMDTIEANLALGFAADERNFSVCADIFDLLGVKKIRLLTNNPEKIETMKQAGINVVERVPLNVGENRYNTAYLDTKAKKMGHFIVHNGEQHLMECPYCQEEVPKK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
LR134327_1 | 1.3|667354|32|LR134327|CRISPRCasFinder | 667354-667385 | 32 | NC_019300 | Zymomonas mobilis subsp. mobilis NCIMB 11163 plasmid pZMO7, complete sequence | 1209-1240 | 7 | 0.781 |
LR134327_1 | 1.3|667354|32|LR134327|CRISPRCasFinder | 667354-667385 | 32 | NC_013358 | Zymomonas mobilis subsp. mobilis NCIMB 11163 plasmid pZA1003, complete sequence | 3827-3858 | 7 | 0.781 |
LR134327_1 | 1.10|667428|31|LR134327|PILER-CR | 667428-667458 | 31 | MN693376 | Marine virus AFVG_25M306, complete genome | 12088-12118 | 7 | 0.774 |
LR134327_1 | 1.4|667419|33|LR134327|CRISPRCasFinder | 667419-667451 | 33 | AP013541 | Uncultured phage_MedDCM-OCT-S42-C7 DNA, complete genome, group G8, isolate: uvMED-CGR-C97-MedDCM-OCT-S42-C7 | 20528-20560 | 8 | 0.758 |
LR134327_1 | 1.10|667428|31|LR134327|PILER-CR | 667428-667458 | 31 | MH791397 | UNVERIFIED: Enterococcus phage EfsSzw-1, complete genome | 150148-150178 | 10 | 0.677 |
1. spacer 1.3|667354|32|LR134327|CRISPRCasFinder matches to NC_019300 (Zymomonas mobilis subsp. mobilis NCIMB 11163 plasmid pZMO7, complete sequence) position: , mismatch: 7, identity: 0.781
aaaaatggtgaatctgaatttttgggttttaa CRISPR spacer aaagtaaatgtatctgaatttttgtgttttaa Protospacer ***. ..** ************* *******
2. spacer 1.3|667354|32|LR134327|CRISPRCasFinder matches to NC_013358 (Zymomonas mobilis subsp. mobilis NCIMB 11163 plasmid pZA1003, complete sequence) position: , mismatch: 7, identity: 0.781
aaaaatggtgaatctgaatttttgggttttaa CRISPR spacer aaagtaaatgtatctgaatttttgtgttttaa Protospacer ***. ..** ************* *******
3. spacer 1.10|667428|31|LR134327|PILER-CR matches to MN693376 (Marine virus AFVG_25M306, complete genome) position: , mismatch: 7, identity: 0.774
tattgttatgtacagaaacacaaaaaatatc CRISPR spacer atcttttatatacagaagcacaaaaaatacc Protospacer .* ****.*******.***********.*
4. spacer 1.4|667419|33|LR134327|CRISPRCasFinder matches to AP013541 (Uncultured phage_MedDCM-OCT-S42-C7 DNA, complete genome, group G8, isolate: uvMED-CGR-C97-MedDCM-OCT-S42-C7) position: , mismatch: 8, identity: 0.758
ttattgttatgtacagaaacacaaaaaatatct---- CRISPR spacer ttgttgttatggacagaaacac----aatgtcaccag Protospacer **.******** ********** ***.**
5. spacer 1.10|667428|31|LR134327|PILER-CR matches to MH791397 (UNVERIFIED: Enterococcus phage EfsSzw-1, complete genome) position: , mismatch: 10, identity: 0.677
tattgttatgtacagaaacacaaaaaatatc CRISPR spacer attttttaggtacagaaacacaaaaggcgga Protospacer ** *** ****************....
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
473 : 15939
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >LR134327|473:15939|DBSCAN-SWA CTTAACGCACGCACCGGCAACGACAATTCCAGCCATTGGGCGGATACATGACATCCCAAATCGGGTCGTCATAACGATACACCTTCTCGTGCAAGGCTAAATGACTTGCCCGAGTGCGACTATCTTTAATCGCCAAATATTGCCAATAGGGCTGTTCATCGGCGTTGGCCATTTGTTCGGCGTAGCGCGCGGCATGGTAAGCGGTGATTTTATTGGTGCGTAAAATCGTTTGTAAGCGGCGCGGACTGCCGAGCTGTATCGTCTGCTCCGTGCCGTTGGTATTAGACACTTTAACTTTTCCCCACCATCCCAACGCCTCCAGTTTGGGGCGCAAATTGTTGATATATTCGCGCTCCGGGATGCCTTTTTCAATGGCTTCCACGGTGGCCGTGCGGATAGTCTCTAAAATATCCATGCGGGTGACTTTTGCCACGGTAAACGCCCGCGCGTGGGCATCCTCAAGGGCTTCTTGCCAATTCCAGGCGATGGCATACCCCTTGGCCTTGAGATAGTCAACGGCAAGTTTAGGCTCCATGCGCAATAGCTCGCGCATATCTAGATTAGCGGTTGGCATTGAGACGTCCTATCAAGTCGCTAACAAATAATGCACGGGTAAGCATTTGCTCCAACGCGTCATCGTCCAAATCTTGATAGAGTTCGGCCAGGCGGGTTTGTGCGTATTCATAGCCACCTGTGCGGATAGCGTCCACAATCGGTTTTAACATCGGGTCAATCACCGACTCGTATTCTTCTGCCGTAGGCTCCAGCTCGTCGATTAAGTCGTCGGGGTCGCGGTGGATTGTGTTAAATTTAAGCTCCGGTAGGTTAGCGCTTAATATGGCTTTTTTGCGCGGGTCTTCCGGTTCGGCTTTGGGCTGTGTTCGGCTTAATACGTCTTCATTCTCGGCTGCAACAGGGATTTGCATTTTATCTTGCGCCCATTGCAACGGGATTTTAAACCCGATGTCAACTAACTTGCCCAATCCCTCACCAAAGCTATTAATATCCTCACTTTCGGCGGTGTCAAATTCAAATCGTGGTATGCGGCGCGCGTCGTTAAATGACTTACAGTTAAGCGCATAAAGCGGGTACACCAAATCACGGGTTAGCGTTGCGGCTAAGCGTTTTAAATCGGCGTCACGTAATTCTTGGCGCACCTCATTGTGTACATTGCCAAGGGCATTGGTCGAGGTCTTGCCATCAGATTGCGAGGTGAGCGTGCCGCCTAAAATCGCTTTAGACATGGATTTTTCCGCCCAGTCAATCATCGCCATAAATTCTGCCGCATTGCCGTCAGCCGCCTTGGCAAATTCAATCTCCATGGCGCGCGGGATGATGCCGCCTGCGTTATGACCGATACTCATTACCGCCCGTAACAATGTATTTTTCTCGTTGTTGGTAGCCCCTTCCGGATATTTACCAAGGCGCAATGGCAGGCCATAAATCTCCAAAAACTCGGCAAAATCTCGGGCGGAGTAGTTGCGATAAATAAACGCCAAACCAAGGTGCGCACAAGACCAATACGGGACAAATAACCCGTTTTCGCCTTGGCTATATGCGTAATCCATCCAAATTTAGCCAGCTCCACGCCTTTTTCTGTGCCATCGCGCAAGCGTAATGTATTGCGGTCATATTGCGGCGTCATAAACCACGCAGGGTCGCGCCAGTTAACATTACGGATTAATTTCAGGCCGCTGACAAGGCCCGGTTCCCACTCGATTTCTTGGCAACTAAACCCTTTCAAAATGGCGTCAGTCGCATCAAAAATGCAATCATCCAGCCACGTTGCGTCACGCAAGATTTCTTCGAGCATTTGTGCGTCTCGTTGTTCTGCCGCACCGGCATTAGGCGGCGGGGCAATTTGCCAATCCATTGTCAAGATGGCATTACGGCGCTTGCCGAGCTCCGATTGCAAGTGTGAGTCCTTTTCCTCCATATCTTCGGCCAATTCACATTGTCCGATTAAGTCGCCCATTTCAGCGGCACGTAATAATGTTGCCGCTTTGGATGGGGTAAGACCGCTTGCCGGGTGCTCACTATAATGACGTTGCAACCAACCTAAGCGGCTGTCATTTTCGGTTTGTAGCTCGTCATCAAAAGCAAATGGTTTGCCGTGGATGTCTAAAATTTTGCTTTGCATAAGTAATCCTTAAATATTATCCCAATCAGAGCCAAACTCGGCCTTAAGGTCTTCTTTTTCGCTGTTGGAGTATTCAAAATTTCGGCCGCCTGTCGCGCTTTGGTGTTTGGCGGGCAGTGGTGTAAACTCAATTTCTCCGCCCGTCATATAACTTGCTCGCACTGCCATACAATACGACACCGCGCTGTCTCCGTGGCGCTGTCCGCTTTTGCCTTGATTGCGGGCGCGGTCGATTTTCGGTACGCCATTAATCACCACAATGTGCCCTTGGTCTAAGATGATTTCTTCATCTTGCGGGATTTGGATCAGTCCGCTTTCATAGCGCTTTATATTTTGGCATCCACTCGCGGTACCATTTATCATTTAACTGCACCGTCTCGACCATGCTTGCGCCATAACGCAATAGCACGGACTCCGCTAAATACCCCCCGTTTCCGGTGGCATCAAATGCCGCACCGATAAAACGTGGGATGTGTTTTAACACAAAAAATACGATTTGTTTTTGTTGCTCATAAGGGCAATTACGCACCTCAAGGGTGATATCCATGTGGCGTGCCGTAGTCGGTTGCACGGCACAAACGCTAAAAATACTCAAGTCGCCTTTACGCGCAAAGTCACACCCAAACGAGTGACGCATATCTTTATCTAGCGCGTCTAAGTGCGGTAAAACGTCTTTGATTAGCCATTCATTGACTAGCGTAATACGCTCCATCTCACTGTAGTCTATAAACTTGCTGTCGCATTCAAATGCAAGTTTGACCTTATCCGGATTCGCCGCGCGGTCAACTAGCGGACGAGGGATATAACCACCGGAGCTTCGTTTTGGTACGCAGTAGTATTCTTCCAGTGCGTCTTCTTCCGTGGAGGTGTCACGCAATAAACCGCGCTTCCAGGCATCTTCTTTTGCTGGTGACCATTCCTGTTTTGACACCTGGCAAATACGTTGGTAAAGCCCCTCTTTGCACGCGTCATCTAGTGTAATAGTGTGGATGGAGTAGCTTTTGCGACCCGCGCGGCTATCTTGGATTAATTGGTTAAACAGATTGTCCACGCCGTTATGAGTTGAGATTAACCGCACTTTTGCGCCCCACATGGTAAGCGCAAGAGCCGCCTTCAGAACTTCGGCTAGTTTTTCGTGAAATGCCGCTTCGTCAATACACACGACCCCTTGCATACCACGCAAGTTTTTAGGGTTGGATGAGAGTGCTTTAATCTTAAAGCCCGATGCAAAGTAGATGACGTAGGTTAAAATGTCCTTGTCTTCGTCATCAAAAATCTCTTCTTGGATTTGCCCGGCGGCTTGGTTAAAGTTTTCCGCCCACATGGCCGCCGCGTCAATAAACTCGCGTGCCATCTCTTTGTTGGAGCCGATATAAAAAACATCAGACCCGCTGTCTGATTTTGCTCTGCCCGCAATTAATACATCATCTGCCGCTTCCGCCCAGGTTAAACCTGTTCGACGGGACTTTTCGGCAATTTTTAAAGGGCTATCATCAGCAACCCAGCGCTTTTGATAGCCCAATAATAATTCTTTCGGATCAAACGGGATAAAATCCGGTAACTTCATCATGCAATCCCCAAAATTTTTGCTTTCAGGTGGTCAACGGTTTCTTGCGATAGTCCGGCTTGCGAAATCACTTTTTCCGCCGTTTCTGCGGCAAGTTGCGCCACCTCTTTGCGAATTTTGCGCTCCCGCTCCTCGTTGATAGCTTGTGCTTGCTCAATTCGGTTGGCTACTAAAGCAAGCTGATTAATGACTTTAGGGTCGACATCATCATCTTGACCTAACGCCATGGCCTTATCAAAGGCAATGGTCTTGACCGCCTCCATTAAGAGTTTGCCAACATCCGATTGCGGCGCTTCGCCGATTTGCTTCGTCCAGATTTCGGCCATCTCGCGGCTTTCGCGGATTTTTGCCCCCATCTTTTCCATCTTGCTGGCATAGCGGTTAAGCCCTGTTTTGCTCAAAAGTGCGGTTTCCGGCAAGCCACAATCGCGGATGAGATCGTTAATTTCTTCCAAAATTTCAGCCTGTGAAAACATCTTGTCGCGCAACATCATGGCAAGGCGGGTTTTGATGTCCGGTGGTAATAAATCAACTTTTGATGCGCGCCCGCGGGTGGTTTTATCACTCATTTAAAGCCCCTTTAAAGTCGGTTTAAAGGTGAGGTGACGGGGCGTTTAACGCCGTCCACGATAACGCGCCCTTGTGCCACGTCTAACCCTCTTTGAGTGATGACGAGGACAAAAAACTCACCTTTGCCGGTGTCAATGCGCTTGATTTTGACTAACCTTGTTCTTCGAGCCAAATCGCATGATTGCGCACCAAATCGCGGCTGATGTTGTGTCCGTAGGCGGTTAATACATCTTGTAAGATGGACTCGTTAGCGTCGTAGCCGTCTTCCGCAAGCGTGCGGAGCATGACAAGACGTTGGTCTTTAGTAAAAATATCGTGCATGATTTATTCCTTTCGGTTCAAAACTTTATCTTCCAGCAATAAGCCCGTTTGGCGGCTAATTGCGCTTAATGTGGCGTTAGTGGCCTTCGTTTCGCCTTCAATTTTTGTCATCAATTTTTCAAGTGATGCAAAATCTTTTGCAGTGGGTAACGCGTCCACTTTTAATTCCATTTTTTGTCAACCGTTCATCGTTTTTTTCGATGCCATCTTGCAGCATGTAAATATCGCTTTTTTTGGCATATTTACTATCCATTTTGAGCCAAAAAAGGGTTCCTATAACGCCAAAAAGGGTGGCGATAATGCTCCAGTTTTTCTGGATAAAAGAGATAATTTCCATCATTTTTGTGATTCTTCGTGTTCTTGTTGACAACTTACACAACGCACACAGTGCGGCATGGCTTTAATGCGGGCTGGGGGGATAAGCGCACCGCAATCCATACAATACCGCGCCGTGTTCATGGCATTGGCAAATTGTTGCGCCGATGCCTGTTGTTTGCGCCAGTTATCCCACATTATTTCTTCCCTTTCTTGGGTTTTATCAACAATGTCATTCATTGGGTTGTGATTCCTTCTCGCAAATGGTGCGATAGGTTTTGTTATGGGCTAACACTTGGCGCAACGTGCCTAGCGTGTCCTTTTCCGAGGCTTTAATAATGGCAAAGCCTGCGCAACTATTATTCGGCGCGTAAGTCGTTGTTTTTGCGCAACTCGTCAACAACAGAGTCGCGACCAAGACCATGAGTTGTTTCATCATTTTTTTGCTTCACTTTGTAGTTTTTAACTTGTTTCTCAACGACCGCTTTTTCGGTCTTGAGCTGTTCGTTTTTGGTTGTTAATTCCGCGTTTGCACGAGACAGGCTCTCTGCGTGAGATTTAATTCTGCGGATTTTAAAAATACACATAGCCGATGATGGCCAAGATAACGGCGCCAAGCGCGCCAATTAGGCTTAAATTAATCATAATTAGGGTCTCTGTGTCTGTTGCGATTTAATGCGTTAGCAAAGCCCTTGGTTGCTGCACCGCCTGCGCAAAAAATGGCAAAGTACATAAACATTTCCGGCACATAAGGACGGTCAACCCATGCGCAAAAGCAGAGGATAACGGCCATTAAAATCGCGCCGAAAAACTGGATAAATGCGGTTGTGGACAATCGGCCGTCCGCGTTAGTGTAAAGCTGTGAAAACATAATTATTGCCCCTGTATAAGCTCGCAACGGTAAAAATTAACGCCTATTTTGAATTTGCCGTAATCTTGGCAATCGGTAACAACATCAAAACTGACGCTAATCACAGTAAACATAATGCCAATTAGACATACTGCGACAATCAAAAATAAAATCGCTATGTCAGTCTTGTCATGCATAAACGATATAACAGCACCAAAACTGCAAACGGCAAATAAACAGATCGGGAAGCCCCATCATTTACCCCTTATACAAATGGTCAAAGTTAATCATTTGCTCACTATCAAGCCATGCCCATACATCAAAACAAGGGCAATCTTTCAGCCACTCGTTCGGCGTAATCGTGCCGTCGCCGTTTAAATCAGGGCTTAAATCACGATGTCCACAAATGCGAGCACTGGGATGTTGACTTTCGAGTTTGCGTAAGAGTTTGTGCAGTGCAATCCACTGCGCCTCGGTGTATTCACCGTGGTTTTTGCCTCTTTTGGTGACGCCACCGACTAGGCAAATGCCGACGGAATGTTGGTTGTGGCCTTTTACATGCGCCCCGTCTTCACCAACTTGACGGCCTGTTTTCCACGGTGCCGTCAGTATCAATCACAAAGTGGTAGCCGATAGAGGTTAAGTGCGGGTTAAATTGTTTGCATTTTGCGGCGTCACGTTTAAATCCGCGCGGCTTTGTGCCACTCATCAATGCGTTGTGCGGCGGTTTGTGTGGCAGTGCGTAATTGATTGCCGTTTTGTGTGGCCGAGCAATGGATCACTATTTTGTGGATGGGTAAAGACATAAAAAAACTCCCTTTAATGTTTTAAAGGGAGTTTAAACAAAGTAAGGAGCTATTCGGGTTTATTGTCTATCACTAAATTTAGTAGGGTAATTCAGGCTGATAGCGTTTTTTGATGATGTTACGTTGTTTGCGGATAATAGCGTAAATATGCGGCTCAGACAAGCCGTAACGCTCACTTAATGCCCGCACATTACCGCCGTTAAAATCATTATAGATAGCATAGTCGCGGAGTGCTTCTTTTAGTCTGTCTGCGCGCGGCAGGTAGATAGCACGACCGCCGAGATAGTGCGATATGACAAGGATTATTTTTTCGATAGTCTTATCATCAAAGCTCTTTCCTTGTCGGCTAAATTCGGCTTTTAATCAACTGCACTAATTTGACTAACACGCTTTCCCAAGACTTGGATAATTCATCATCCGGAATGTGATCTAACTTATCAAATAACTGCCCGACCATCTCGTGGTCATCTGCAAATAAATCGTGTTGTTCGTCTGTCATACTTGCGCTCTCCGTTGCCATTTTTTCAAAATCTCAAGTAGTTTGTTGCTTCGTCGTCATCTAAACTTTGCACATTGAGCTTGATTAGCTGATTTGGTTGATTGTTTTTTGCTTTAAACAATGTATTGTGCATAAACCGATTTAACGCACGCTCCGAGCCGTCTTTAACAATGCCTGCTTTGTGCATTTGTATCCAAATTGCGCGGATTTTGTGAGTGATTCGGGATTTCACAATCGCATGTTCAGTTACCGGTGTTCTGCCTTTTCTGACTTGTGGTTTAAACCCCTTATCTTTCATGCTTTCGTACACTTTTAAAAGCTCCTCAATCGTCATTTTAGTGGTGCTTGTTTTGCCGGTTAGATTATCCAACAACACACGATAACTTAACTCATCCATATTTAACTTGCTTTTTGCAATATGGATCAGCTGGATAAGTTTAGGTTTAGTTAATTTAACGTCTAGTATCATTTTTCCATTCCAACCAAATTGTATATTCCGGCATATTCTTTACAAATTCCAATTGCCCAATAGCAGCATATTGCTCAATGTACTGTATTGCAGCCGTACGCTTGTCTTCTTCCAATTTTTCCGTATTTTCCACCGTACTTTTACCTTGCTCATTGCGCACCACAGCAAATAACGGTTTCGCCCCCTCATACACCTTTTTGAGATAATTGTGATTTGTTAACGCTACCACATTTCGGGTTTCACGGCGGTTTTTCATCACGCCACTGACAGTTTCGGTGAGCGCATGGGACAACAACGGACTCGGCTGATACATATCCAACACCTCTTGCATTAATTTTAATGCTCTTGAGTTAGATAATGCGCTTTTCCCGGTCTAAATAGGGAAATATAACTCACCAACGCACGGGCATTGTCGCCGCGTAAATTGGTAATAATACCCAACATTTCACGCCCCGCGTCATCTTCTAATAGCACATCCAAGTGGATGTCACTATGGCAAACCGGGCAACGGCATAATTTCACTTTAAAACTCCTTTAAACTAGGTTTAAAACACATTATTCAGCCCACTTCATCTAACTTATTCCCCTCTTTTGTAAAGAGGGTTAGGGAAGATTTAATGGACTGTAAATGGGTTTTAGTCGATTGGTGGTTGTGGCAACGGTTTCCAATGTGTTACACCTTCAAACTCTACACCGTCAAAACTACAAAATCCCATACCATCTTCAAAGTAGCTGCCCGTTCTAATTAGCCACCCGGATTCGGATTCCGGTACCTTCATTGCAAATAAAACTTCACTCCAATCGCCTGGCAACCGTTCCGAACACTTAATCCAGCCATTTTGTGGATACTCAACAAGCACCGGAGGATTTTCAACCATGTGAATGAACTCATCGGCATAGAGTTCTTTTTCCTCTTCGGTGAGCGGTCTGGTCGGTAAATCAAATCCGCCTAACACAACCCCAAAACACCCCTCTTTTATAGCGTCTTCAAGGTCAGTATCAAATCCATCATTTGTGCCAAATTCAAATATCTGGTCGACACAGTCTTGTGCTTGTGATTTAGCTTCGTCTAATGTATCGTGCGTTGTGAACTCACGTTCTAACGCGTCATAAGCAAAATATTTGTTCATTTTTATTTTCCTTGTAACATCAAAAATTCACTTTGTTTGATTTCCGTTAAACACTCAGGGATTGCCGGAAAATCATCACCACCGAAGCCTTCTGATTTCACCCGGTATTTTTGCGATAAAGTGATCGCTTGCCACACCACACACTGCGATATATGCCATGTTACTCGCAAACACCCAACAATTAAGCGCTAACTCGCTTATCATAAAATCATTAAAACTTGGATATTGATTTAATATATTTCTGAGTTCTTGGATTTTAGCGTTAAACGCCTTGCCGGCTTTGGTGCGATTGTTGCCGGTAATATTCACTTTCCCACCTTCAATCATTTCAAATTTATAGGTTTTATCCTCTTTAATTTTTTCAAATTCAGGATTGTTTTCGCTACATACAATGCCATAAATTCGACTTTCACTGCCGCGCCAAAACTCATAAAACGGGATAGTGTCAAAAATTACGTCTAATTCTTTGTTTCGTTGTTCGTGGTCGATATTCCATTGTTGATAAAGTGATTTAACCGGTTCAACATTTAATGCACATTTAAAATATCTAAATTCAGGTTTCATTTTTACCCCTTTCTCCATTCGCCCTTAGGCATTATTTCGGTTATGTCGGCGTCTGCCCATTTTAAAAATTTGGTTACGCTAATTTTCGGATAATGCCGTCCATCTTTTACTGACGGGCTGTCATATTGCAACCCCTGGACGAACCCTTCTTTGTTGTCATAAATCATCCCAACCCAAAGGATTTGTCTATCTCCCAATAAACGGGCGAATCCGTATGTTTGAGGGCGTTTCGCCGAATAAACATGCCCAACTTTTAGGTCTTCTGTTGTTAGCTCTGCCATACTCACTCCAACACCGGCGTAATCTTCCACGCCACACATTTCATTTCTCTGCTTGCTGCCTGTAATAGCTTCAAGCACGCTTTATCATCATCTTCCTGCCACATTTCCTTGGCCATTTCTAACTGCTCAATAATCTGTGCCAATTGGATAGTTACATGCGACTTTTTATCTTTGTCAATCATAGTATTCATCCCCTTTGGATGGCACAGGCTCAACCTCAATCACGTCATACACTTCGGTGATGATGTGCGCCATTTGGGTGAGGTCATTGTTATTCAAATCGCAAGCGTCCATCGCTTGTTGCATGTTTTCGGCTTCAATTGCAAATTCCACCGTGCAATCTAGCCTGACGAGATATTTAGCCATTATTCGCTCCTTAGTTGTTATTCTAAAACTCATTATTCAGCGCACTTAAACCGTGCTTAAATGCGCTGTAAATGGGCTTTATCGGCCTTTGCAAGCAAGCAAGATCACAATCAATGCAAAGCTAGCCCACCCCCATATACTCAGCAGTGTTATTAAGCGTTCATCCATCTTGCTTTACCTCCGTTTGTTTCTTGCGTTTTAATCTTGGGTGCCAGTGTTCGCAAAATTCACCGCGCGTAATTGCCCAATCTTGATTAACCGTTTTTTTGGCGATATCTGCCGCCTTAAACCAAAGCGTCGCGGCATAACTCAAATCCCCCGCACGTTCCACTTCAACGGCCAGCTCGGATAAGTCCTTGTAGGTCATTTCCATGATTAATCCCGTCTAATTGAGTTTAATATTCGGGTGTAATCTGCTGCGGTGACTCTATCCGCCGTCACAGTTGACCCGTTGACAAAGTTAAATGTCAGTTTTACGGTCCCATCTTCGTTTTTATCCGCTTTAATGATGGTTACTTGGTCTAAATTAATTAGGTCCGGATATTCTTTTCTTCCTGTTAATCCTAAGTAGTTCATTTTGCGCTCCTTAAATGCTTGCTAAATCAAGACTAATTGGTTCGTATTTGTCGGTGTCGCCGACGCGTTTATAAACTCGGATATAGCTTTTTGAGCCAACCACCTGCACGCTGTCGGAGATAGCGTCCATCGCGCATTTCCAGCGTGGGTCTTGGATGTCCACGCGGCGTAGGGCTAAAATCTTGTTTGAGTTAAGATTGCCTTCCTTATCCACGTCAAACGCGCGGTCAATAATGGTTTTAAGCTCAGGGCGACTGCCTTCTGTCCAGTCTTGCAAACAGGCGTCAATTAATGCTTTAGCCGCTTGGATGCGTTCATCAAATTGCAATGATTCGGCGATAGCGCGTTGCACTTTGTATTCACCGTCAAAGCTATAAAGTGTGACGTTGCCTTTTTTACCGCCTAAATTTGCGCCATACTGCGCAGCGGAAAGTTCGACAAAGGCGGCGATGTCGCCAAACACTTCACTTTTAAAGTCTTTCATGACTTGGTTAGTCGCTACGGCCTTGCGCACAATTTCAAGCACCAACTCATCTCGCACTTTGTCGATTTCTTTAATTGATGCCTCAGGGATAAGCGCGCCGCGTGCGTCTTTGCGATAGCCTTCGGGGATTGTTACTTTTTGAGTTTCCATTTGTTTTTCCTTTTTTTACGGGTTACTAAAATCAGTGTTTGGGTAGTGTTTGGCGAGCCATGCACGCACTTCTTTTTCGGCTTCGGCCGTCAATGGCGGTGGCATATCGCCAAATTCTTCGCGCCATTCTGCATTTGCCGCTTGTTGCCAACACAACTCATCGCTATCAGCACATTTCAGCGTTTCCGCTTGGGCGACACCGCTCAAAAGTGCGGTCAAAATCAAAGCCGTTTTTAAGGTTTTCATCAGTTGCCCCCGGTCATTTGTTTTTGTGCGATTAAAATCAGGTCTAATGTAATTGCGGTGCCCTGTGCTTTGGCGGTGATAGCGGCAAGTTTTAAATACTGCGTCAACGCGCGTAAACCGCCTGCCTTGGTGCCGATACTATTAAGTACGGTCATCAAATCTTTATCGTCAGTATCCAAACCCCAAGCACCTGCAATCGCTTTAATATCGGCCTTACTGCTCCCCTTGATAGGCGTATGCTTACCAATACGGCTCCAAAGGCGCGCATATTCGTGCGCTTGGTTCACCCCGCCTTGGATGCGGTTGTAAACCTTGTCGTTACCGATTAGGGCAAAGCCGACTTCGACTTCTTCTTGGATAATGCGGATTTCTTCAAGAGCGTCATAAGGCAAGTGGTCGCTTTCATCGATAATCACCAAACCTTTTGATTTTTGTAGCTTTTTAACAATTAAACGGCTTAGGCGGTCTTTACGGCGTGGCGCATCATTAATGCCAAGCTCTAATGCCAATTCATACAAAATACTGCTTAACGTGGCGCGTGCCGGGCTTGCGGTAATCATCCACACGTTGGTGTTGTGTTGTTGATAGGCTTGGCAGGCTTTCGTTTTGCCTACGCCACTGGCGCCGTAAATGGTCACCATCGTTGGCAAAATGCGCGCCATATCAAGCACACCAAACACCGTTTTAGCAGTCGGGATTTCGATAAAACTTGGCGCTTCAACAAACACCTGCACTTTACGTTCGTTTAAGGCCATCCAGTTTTTAATGGGTTCTTCCACTGTTTCTACATTGCCGGTGTATTTTTCGTTTAGCCATGCACTCAATGCCCCGCCGTTTACGCCCGTTTCGCGCGCTAACTTGGCTTGCGTGAGCTTGCCTTGTTTGATTAATAAGCTAATTTGCTCTCTTAATGTCATTTTTTTCGCTCCTTAAAGGTGGTTTAAACTGGCTTTAAAGCCCTTTTTCTTCTTTCAACATGGCGATGCCTTTCATCAGCCATTGTTCGGCTTCGTCTTCTTGTTCATCCTCCGGCACGACTTCCACTTTGCGTAATGCGGTGCCTTCTTTAATGACTTGCCACATTTGGGCTTCCGCCTCTTGGTTTTCTTCAAACTCCACCGGTGGCATATAGGCGGCTGCCTCTTGGATTGCCATATCCTGTGCCGCTTTCGCCGCTTTTTGGGTGTGGCGTACAAATTCGCGCTCTTTGCGAGAGTGGTCTTGTGCCGCACTTGTGTCGCCAAAGGCGGCATCCACCGTACAGTGCGCCTCGGCTAAATAACTTCCATCCAAGCTGTACACCCAAACCGCATCGTGCAAATTGTTCGGGTCGTAACGCACCACCACTTTCTTGTGGCTTGTACCAATCAACTCGTAAGCCTCGTATCGGTTGCGTAATCCTTGCACTTCGCCACCGGCTTTTAACGTAAAGGTGCCGTTGTCTTTTAGCGTGACTTCTTCGTGTAATGTGAGTAAGTAGCGCAGTTGTTCAGGCGTTGCCCAACGTTTCTCGGCAACCGCATAATCCCGTTCAAATGCTTGATTAAAACTCAGTTTGCCTTGGCAAATTTCAGTGGCGCGGTCTTGGCGTTCGTTAAACATCTGTATGCCTTCTTCGAGGGCTAAAATAAAACTCTCATAGTCCACGCCCGCCTTGTTGCCTTGGTAGTTATCAGGCTTGTCTAATGCGTTGTCACCTGCGTGGTAGCCGGCAAGTAAAGGGTGCTTATCCACAAGCTCACCCAAGCCACCGTGCGAAAATGCACGCTCAATCGGCTTGGCTTGCCCCCGTCCTCGGCCGTAGCGCACCGTTGTCCAGTGCAGTTGGATGCCAAGCGCCGGAATAATCCCTTGCACCTCATCTTCCCGCACTTTAAAGCGGTAACGGTTTTTCACCCCGCCTGTCATTTTCTTATTGGCTGCCGCTTTGGTGTTGTCGATGGTTAAGTGTTTCGGGATACCGTACTTATTCACGACATCAAGCAACGCCAAGCGGATCATGTTGGTGTTTTCCGACTCATCGCACCGATACGCCAAGATTTTGCGGGTGCGCACATCCTGCCAAAGCCACGTTTTAGGGCGGATAATGTGGCCGTTATGCCATCTCACCCAAACGTTATGCTTATAACCGTCCCCGTTGACCCATTCCATTGCTTCAATGCCGGCAACGGTACGAATGAGCGATGGATACATGCGGCTCAACGCATAAGTGCCATCTCTTAAATAGGTTTGGTGGGTTTTTGGGATTTCGCGCAAGATTTTGCGCTTAATACTAGAGGGGCTTGGGATAACCCAACCGTTCGCACTTGCCGCACGTTTCAAGCGTTCATAACAAGATCCAAACTGAGGGCGCTCATTACGGAAATAGTCGGCGCGGAAAAATGCCCAGGCTTCAGAGGTAAAAGCGGCCTCGCGGCTTTCGCTGTGCGCACCGTAGCTATCCATTAAAAGCGGTAGCCACAAACTACGATCAGCGTCTTTAACTTGATACCACCAAGACTTAAGTGCACTCACCGTGACCGATTTCTCGCCATCTTGGTTGTGTTTATGGCATACCAATGCCAACGCATCCAAAATCTTCACGCCACCGTTGACCAATTCGGCCACCGCAAACATAATGCCAAGCTTCATTTGCGCTTTTTGTTGTTGCTTTGCCGTGCCTTGTTCATAGGTCGCCCACAACAACTGCGCATCAACAGGCGCACTTTCCTCGGCTAAAACTGGGAGATTTTTCACCGCACTTTTGCCAAGTTTCACCACGATTTCGGCTTGCACGTCTTCCGGCATGGATTTCACGGCATATTCAACACCACCGCCTTTACCAACTCTTTTTTGAGTTGCCCAGCAATTCTTTTTAGCTTGGTAAAGTATTCCTTGCACCGAATTAGGCAAAGTTGCTAAACTTAAACCAACTAATTCTTTTGCTGAGTAGTGTGTTTTTAAGTTGTTTACGCTCATAAATAACCTCAAAACTATCTGTCAGCATATTTTTTAAGGTTGCGTTGCTCATAGCGAGATGCCCAAATCACTTCGGCAGGTACGCCAATCGCTTCAGCAATAATGCGTTCACCTTTCAACCATGGACGGTCTAACGCATTTTTTAACGTGCTTCCGTTGCTGTAACCGTGTTTCAACGATAACTGGCGCAACGACCAACCTTTTTTTGCTAATGCAGCTTTGATGTCTTCTCTATGCCAATCAATAGCTGTTTTTTTAGTTTCCATTTATGTCCTCATTAGATAACTTCACTCGTTAATCTAATGAGGATAATAAACCATAAAAACAACTCAATCAACTTTAAAAAAGTCATTTTAAAGTTAATTGATTAAAAATTAAGCGTTGTTTTAAGGGTTGTTTATTGTATCTCTTTGAAATCAATAACTTTTAATTCAACTTTAAAAACATTAAAGAAAATACAAGGATTTTTTAAAGTTATGCGTGTTAAGTTTAAAAACAACTCATCAATAGGAAGTCGAATTAGAGAGTTAAGAGAGCAGAAAAAAATCTCCAGAAATGCCATGGCAGAGAATTTGGGGCTTTCGTTATCTGCCTTGCAGAATTGGGAAACAAGTCAAACTGAGCCTATAGCTTCAATGATTATTACCCTTGCGGAAGAATTAGGGGTTGAGCCTAGTTATTTACTAACTGGCGAGAAGAACGGGGATGTTGATAGTCCTCCGATTAAACGCGCACAAAAGCACGAAATAAGCGGAGTTTCAATGATTGACTGCTTTTGTTCGGTAAACGTGTCGGCAGGCTTTGGCAGCTTTAACGAGGGCGTAACCGCGCCCGACGGGCAAGTGCCATATTCGGACAGCCTGTTGCAAAAGCTCGGCATTAAACCAACGCACGCCGCCGTATTTTGGGCAGATGGCACATCCATGCGCCCAACCATTGATGACGGCGATCAGATGTTGGTTGACCTCTCTAAAAAAGAGATCAAGGGCGATAAAATCTATTTAGTGCAAAACGGCGAAAGCGTGTGGGTTAAGCGTGTAAAACTCAACTGGAACGGCATAGAGCTCATTTCAGACAACAAAGAAGAGTACGCCCCGATAACGCTAACCAAAGAGGAAGCGGACAATTTAGAGATAATCGGACAAGTTGCCTACATCGGCAAAAGCGTAATTTAA
Protein sequences of DBSCAN-SWA_1 >LR134327|473:15939|11805_12723_-|VEF40596.1|DBSCAN-SWA MTLREQISLLIKQGKLTQAKLARETGVNGGALSAWLNEKYTGNVETVEEPIKNWMALNERKVQVFVEAPSFIEIPTAKTVFGVLDMARILPTMVTIYGASGVGKTKACQAYQQHNTNVWMITASPARATLSSILYELALELGINDAPRRKDRLSRLIVKKLQKSKGLVIIDESDHLPYDALEEIRIIQEEVEVGFALIGNDKVYNRIQGGVNQAHEYARLWSRIGKHTPIKGSSKADIKAIAGAWGLDTDDKDLMTVLNSIGTKAGGLRALTQYLKLAAITAKAQGTAITLDLILIAQKQMTGGN >LR134327|473:15939|4899_5070_-|VEF40553.1|DBSCAN-SWA MHDIFTKDQRLVMLRTLAEDGYDANESILQDVLTAYGHNISRDLVRNHAIWLEEQG >LR134327|473:15939|6022_6256_-|VEF40562.1|DBSCAN-SWA MFSQLYTNADGRLSTTAFIQFFGAILMAVILCFCAWVDRPYVPEMFMYFAIFCAGGAATKGFANALNRNRHRDPNYD >LR134327|473:15939|9705_10023_-|VEF40581.1|DBSCAN-SWA MCGVEDYAGVGVSMAELTTEDLKVGHVYSAKRPQTYGFARLLGDRQILWVGMIYDNKEGFVQGLQYDSPSVKDGRHYPKISVTKFLKWADADITEIMPKGEWRKG >LR134327|473:15939|8345_8531_-|VEF40573.1|DBSCAN-SWA MKLCRCPVCHSDIHLDVLLEDDAGREMLGIITNLRGDNARALVSYISLFRPGKAHYLTQEH >LR134327|473:15939|5744_5972_-|VEF40560.1|DBSCAN-SWA MCIFKIRRIKSHAESLSRANAELTTKNEQLKTEKAVVEKQVKNYKVKQKNDETTHGLGRDSVVDELRKNNDLRAE >LR134327|473:15939|473_1046_-|VEF40541.1|head|DBSCAN-SWA MPTANLDMRELLRMEPKLAVDYLKAKGYAIAWNWQEALEDAHARAFTVAKVTRMDILETIRTATVEAIEKGIPEREYINNLRPKLEALGWWGKVKVSNTNGTEQTIQLGSPRRLQTILRTNKITAYHAARYAEQMANADEQPYWQYLAIKDSRTRASHLALHEKVYRYDDPIWDVMYPPNGWNCRCRCVR >LR134327|473:15939|1032_1836_-|VEF40543.1|DBSCAN-SWA MSIGHNAGGIIPRAMEIEFAKAADGNAAEFMAMIDWAEKSMSKAILGGTLTSQSDGKTSTNALGNVHNEVRQELRDADLKRLAATLTRDLVYPLYALNCKSFNDARRIPRFEFDTAESEDINSFGEGLGKLVDIGFKIPLQWAQDKMQIPVAAENEDVLSRTQPKAEPEDPRKKAILSANLPELKFNTIHRDPDDLIDELEPTAEEYESVIDPMLKPIVDAIRTGGYEYAQTRLAELYQDLDDDALEQMLTRALFVSDLIGRLNANR >LR134327|473:15939|9986_10166_-|VEF40583.1|DBSCAN-SWA MIDKDKKSHVTIQLAQIIEQLEMAKEMWQEDDDKACLKLLQAASREMKCVAWKITPVLE >LR134327|473:15939|7387_7540_-|VEF40566.1|DBSCAN-SWA MTDEQHDLFADDHEMVGQLFDKLDHIPDDELSKSWESVLVKLVQLIKSRI >LR134327|473:15939|5406_5625_-|VEF40557.1|DBSCAN-SWA MNDIVDKTQEREEIMWDNWRKQQASAQQFANAMNTARYCMDCGALIPPARIKAMPHCVRCVSCQQEHEESQK >LR134327|473:15939|10725_10926_-|VEF40589.1|DBSCAN-SWA MNYLGLTGRKEYPDLINLDQVTIIKADKNEDGTVKLTFNFVNGSTVTADRVTAADYTRILNSIRRD >LR134327|473:15939|14778_15030_-|VEF40600.1|DBSCAN-SWA METKKTAIDWHREDIKAALAKKGWSLRQLSLKHGYSNGSTLKNALDRPWLKGERIIAEAIGVPAEVIWASRYEQRNLKKYADR >LR134327|473:15939|2621_2975_-|VEF40547.1|DBSCAN-SWA MINGTASGCQNIKRYESGLIQIPQDEEIILDQGHIVVINGVPKIDRARNQGKSGQRHGDSAVSYCMAVRASYMTGGEIEFTPLPAKHQSATGGRNFEYSNSEKEDLKAEFGSDWDNI >LR134327|473:15939|7992_8322_-|VEF40571.1|DBSCAN-SWA MYQPSPLLSHALTETVSGVMKNRRETRNVVALTNHNYLKKVYEGAKPLFAVVRNEQGKSTVENTEKLEEDKRTAAIQYIEQYAAIGQLEFVKNMPEYTIWLEWKNDTRR >LR134327|473:15939|9214_9703_-|VEF40577.1|DBSCAN-SWA MKPEFRYFKCALNVEPVKSLYQQWNIDHEQRNKELDVIFDTIPFYEFWRGSESRIYGIVCSENNPEFEKIKEDKTYKFEMIEGGKVNITGNNRTKAGKAFNAKIQELRNILNQYPSFNDFMISELALNCWVFASNMAYIAVCGVASDHFIAKIPGEIRRLRW >LR134327|473:15939|6915_7041_-|VEF40564.1|DBSCAN-SWA MSLPIHKIVIHCSATQNGNQLRTATQTAAQRIDEWHKAARI >LR134327|473:15939|1835_2612_-|VEF40545.1|DBSCAN-SWA MQSKILDIHGKPFAFDDELQTENDSRLGWLQRHYSEHPASGLTPSKAATLLRAAEMGDLIGQCELAEDMEEKDSHLQSELGKRRNAILTMDWQIAPPPNAGAAEQRDAQMLEEILRDATWLDDCIFDATDAILKGFSCQEIEWEPGLVSGLKLIRNVNWRDPAWFMTPQYDRNTLRLRDGTEKGVELAKFGWITHIAKAKTGYLSRIGLVRTLVWRLFIATTPPEILPSFWRFMACHCALVNIRKGLPTTRKIHCYGR >LR134327|473:15939|11575_11806_-|VEF40594.1|DBSCAN-SWA MKTLKTALILTALLSGVAQAETLKCADSDELCWQQAANAEWREEFGDMPPPLTAEAEKEVRAWLAKHYPNTDFSNP >LR134327|473:15939|2928_4179_-|VEF40549.1|DBSCAN-SWA MKLPDFIPFDPKELLLGYQKRWVADDSPLKIAEKSRRTGLTWAEAADDVLIAGRAKSDSGSDVFYIGSNKEMAREFIDAAAMWAENFNQAAGQIQEEIFDDEDKDILTYVIYFASGFKIKALSSNPKNLRGMQGVVCIDEAAFHEKLAEVLKAALALTMWGAKVRLISTHNGVDNLFNQLIQDSRAGRKSYSIHTITLDDACKEGLYQRICQVSKQEWSPAKEDAWKRGLLRDTSTEEDALEEYYCVPKRSSGGYIPRPLVDRAANPDKVKLAFECDSKFIDYSEMERITLVNEWLIKDVLPHLDALDKDMRHSFGCDFARKGDLSIFSVCAVQPTTARHMDITLEVRNCPYEQQKQIVFFVLKHIPRFIGAAFDATGNGGYLAESVLLRYGASMVETVQLNDKWYREWMPKYKAL >LR134327|473:15939|8644_9139_-|VEF40576.1|DBSCAN-SWA MNKYFAYDALEREFTTHDTLDEAKSQAQDCVDQIFEFGTNDGFDTDLEDAIKEGCFGVVLGGFDLPTRPLTEEEKELYADEFIHMVENPPVLVEYPQNGWIKCSERLPGDWSEVLFAMKVPESESGWLIRTGSYFEDGMGFCSFDGVEFEGVTHWKPLPQPPID >LR134327|473:15939|4178_4748_-|VEF40551.1|DBSCAN-SWA MSDKTTRGRASKVDLLPPDIKTRLAMMLRDKMFSQAEILEEINDLIRDCGLPETALLSKTGLNRYASKMEKMGAKIRESREMAEIWTKQIGEAPQSDVGKLLMEAVKTIAFDKAMALGQDDDVDPKVINQLALVANRIEQAQAINEERERKIRKEVAQLAAETAEKVISQAGLSQETVDHLKAKILGIA >LR134327|473:15939|15240_15939_+|VEF40602.1|DBSCAN-SWA MRVKFKNNSSIGSRIRELREQKKISRNAMAENLGLSLSALQNWETSQTEPIASMIITLAEELGVEPSYLLTGEKNGDVDSPPIKRAQKHEISGVSMIDCFCSVNVSAGFGSFNEGVTAPDGQVPYSDSLLQKLGIKPTHAAVFWADGTSMRPTIDDGDQMLVDLSKKEIKGDKIYLVQNGESVWVKRVKLNWNGIELISDNKEEYAPITLTKEEADNLEIIGQVAYIGKSVI >LR134327|473:15939|10158_10350_-|VEF40585.1|DBSCAN-SWA MAKYLVRLDCTVEFAIEAENMQQAMDACDLNNNDLTQMAHIITEVYDVIEVEPVPSKGDEYYD >LR134327|473:15939|7565_8009_-|VEF40569.1|DBSCAN-SWA MILDVKLTKPKLIQLIHIAKSKLNMDELSYRVLLDNLTGKTSTTKMTIEELLKVYESMKDKGFKPQVRKGRTPVTEHAIVKSRITHKIRAIWIQMHKAGIVKDGSERALNRFMHNTLFKAKNNQPNQLIKLNVQSLDDDEATNYLRF >LR134327|473:15939|12757_14764_-|VEF40598.1|transposase|DBSCAN-SWA MSVNNLKTHYSAKELVGLSLATLPNSVQGILYQAKKNCWATQKRVGKGGGVEYAVKSMPEDVQAEIVVKLGKSAVKNLPVLAEESAPVDAQLLWATYEQGTAKQQQKAQMKLGIMFAVAELVNGGVKILDALALVCHKHNQDGEKSVTVSALKSWWYQVKDADRSLWLPLLMDSYGAHSESREAAFTSEAWAFFRADYFRNERPQFGSCYERLKRAASANGWVIPSPSSIKRKILREIPKTHQTYLRDGTYALSRMYPSLIRTVAGIEAMEWVNGDGYKHNVWVRWHNGHIIRPKTWLWQDVRTRKILAYRCDESENTNMIRLALLDVVNKYGIPKHLTIDNTKAAANKKMTGGVKNRYRFKVREDEVQGIIPALGIQLHWTTVRYGRGRGQAKPIERAFSHGGLGELVDKHPLLAGYHAGDNALDKPDNYQGNKAGVDYESFILALEEGIQMFNERQDRATEICQGKLSFNQAFERDYAVAEKRWATPEQLRYLLTLHEEVTLKDNGTFTLKAGGEVQGLRNRYEAYELIGTSHKKVVVRYDPNNLHDAVWVYSLDGSYLAEAHCTVDAAFGDTSAAQDHSRKEREFVRHTQKAAKAAQDMAIQEAAAYMPPVEFEENQEAEAQMWQVIKEGTALRKVEVVPEDEQEDEAEQWLMKGIAMLKEEKGL >LR134327|473:15939|5188_5410_-|VEF40555.1|DBSCAN-SWA MMEIISFIQKNWSIIATLFGVIGTLFWLKMDSKYAKKSDIYMLQDGIEKNDERLTKNGIKSGRVTHCKRFCIT >LR134327|473:15939|10936_11560_-|VEF40591.1|DBSCAN-SWA METQKVTIPEGYRKDARGALIPEASIKEIDKVRDELVLEIVRKAVATNQVMKDFKSEVFGDIAAFVELSAAQYGANLGGKKGNVTLYSFDGEYKVQRAIAESLQFDERIQAAKALIDACLQDWTEGSRPELKTIIDRAFDVDKEGNLNSNKILALRRVDIQDPRWKCAMDAISDSVQVVGSKSYIRVYKRVGDTDKYEPISLDLASI >LR134327|473:15939|10510_10723_-|VEF40587.1|DBSCAN-SWA MEMTYKDLSELAVEVERAGDLSYAATLWFKAADIAKKTVNQDWAITRGEFCEHWHPRLKRKKQTEVKQDG |
29 | Vibrio_phage(25.0%) | transposase,head | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
302524 : 335571
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >LR134327|302524:335571|DBSCAN-SWA GCTACTCCTCCCCAACTCTAATTGTGATATCTCTAAATGTCAGTGCGTTATTGCGGATATCCGCCTCCGGCACAATCTTAAACCTAATGATATTTACCCCTGCAGGTAACTTATCTGCAACTTGTTGCGGGTGCCACTCATTAGTTTGCCAGTCGCCCATTAAATCTGAATCGTATGATTGCACCACGTTTTTGCCATTAAGCAGTTGCACAATCACCCGGCATTTGCCGCGGCGTTGGTTATACGTCATAATTTTGTAATCAAGCACAAAACGAGCATATTTACCGGCGGGTATTGCATAGTCTTTATAGATGTTGGATTTTGGCTCCGCGTTACTTGACAACATAAGGTATTTACCGCCTGGGATATCATTGTCATCATACTTATTGATTAAGTCATCGCCCGCAGTCCAAGTCTCACGATAATCATACTTATAGAGTAACACTAACGCGCCGCCGACTTTGAGCACATAACGATGCAAGCTTTGTAAGCCATTTTGGGTGCTATATAACGCTATTTGGCTAAATTGCTCGCCATCTACCTTTTTGGCGTCCGGGTAAACAAACTCGGTTGCGGTGGTATCAATAGACCGCACCACGCTGTCGCCATCCAGTAAATCTACTTTGTAGCTGACACCCTTGCCCAAAACGGTGCTGTCATCCGTATGCGGAATCAACTTATCCGCCTGCACATCACGGTCACGGTGCGCCCAGGTGAGCTTAAACGCGGATTTGTCATTAATGGTGTTACCGTAACCGCCATCGATTTGCACTTTGCCAGGTGGATAAGGGCGGGCTTGACGTTGACGGGTGGTAAGTGTAAGCACCTGAGCCTTGCTCTCATCAAGCGTTTGCTGTGCAGTGCGGGTGAGTAATTTACCCTTAATTTGCTCGCCCACAGTGTATTTTGTCTCATCCGTGCCGGCGGCAAGCAGATAACACCACGCCAAGACGCCCGCTTTATGCGCTTGTGGGATAGTATCCGCACAACCGCGCCCCACAGTCATTGTGCCGGTTTTAAAATCGACGGAATCAATCTTAATAATCTCATCATCCACAATGAGCGCCTCGGCGCCCGCAAGGGCGGAATACTCACCCTCTAACCTAAACTTAATGCTAGTCTGATAAGGGCTCACCTCGCCGACCAGCTCAATACATGGCGTGAATGAGCCTGTCGCAGTCTGCGCATAGCCCGCGCCTACGTTGACTAACATGTCATAGCCAACGGAAAGCGGGGTAGGTTGCGCGCCCATGCCCCACACAAAGCAATCAGTCGGCTTAACATACACCAACTCCGCGTCCGTCAATACAAGCGGGAGGACATGATATGGCACCTCAAACAACTGCGCGTGCTCAATCGGTTTGGCGGTGTAATCGGGCGGCACATAAAGCGACTCGCCCTTTTGGGTGGAGTAGTTAGCTGATGGCAACCCAAACACATCCTGCAAGCAAGTGGCGACAATCTCGCCCTCATTGCCGTTTTTAAGCTCACCGACCCGAAAGACCACGTCCACAATATCACGCTCCGGCAGATTAACCCGGATAACATCACCCGGGCGTAACTCACTACCACGCATATCAAAGGTGATTTTAAGTCGCGTTAAACCACTGGCAATCATCTCTAAATCACGCTGAGCCACACGCGCCGCCAAATCAAACGTTGGAATCCCTTTATACTCAACCGTCTTACTAATTACGCCGTGCATTTGCACTGCCGCGATATTGTTAGCAATAGCCTGGTCGTCGCGGTTTGTCACCGGCTCACGGTATTTAACAATGATTTGATTGGCCTGCTTATCGGTTGCCGCACTATCATCATCGAGCACTGAAAGAATCCCGTTATCGTATGTAAACAGCGGTAAATCCTCGACCTTGTAATCATGGCGAATCAGCTTAATCGCTTGTTTACCGGTCTCAATGTTGTCATATTGCGCCGCGCCGATGTGATCCACAATTTGCTGAATGAACTCTTTAATGGAGGTTTGGCGGTTGTAGCGGATACACAAGCCAAAGCCCTCGGCATAAAGCGTATCGGCGGCTTTTTTGTAGCTATCCAAATCCAAATCGGAAAGGTCTTTTTTACCGCCCCAACTCTTATTCGTAGCGCACTCAACCAAGATATGTGCCGGATTCATGGCGTGAATCTCTCGTACATTTTTTTCTTGCTCCGGTGTCAAGCCGGAGATTTTGAGATTATTGTTGCGTAGCAAGATTTTAGCTTTTTCGGGGTACCACACCACACCGCCGTGCCAGCCTTTATTTGCTCTGCGCACGCGGTAACTGTGCTTTTTGGGATAGGCGTTATAGCAACTAATCAACCCGCTAAACACTGTCGTGGCGACGCCGCGGAAGCCGGGAATTATGTCATCTTGGCTAAGATTACCCGGCTCTACGTTGCCATTTTGAAAAAATTTATTGCGCTCAGGGTTTTTGTTTGCATATTTGCGCAGCCATCTTGAGGCATGGGTGGCAAGCGATGGGTTATAAACTCCTTTGAGTAAATTAATCAGCATTTGTGTCGGCTTTTGGTCGGGCTCGCCCATGAGTATCTCCATCCGGCCTTGAATCCCACCCTCGCCGCCGGTGTTATCACCGCCGAAGAGGTTGGGCTTGTCGATATAAATCGCCTGAGAGTGAGTGAGCTCACCCGGCTTGCCAACATAGGCGGTTTTGTCGTCCACACGTAACTCAACAATCTCGTCCACCGGTCCGCGTCCAAGCCCACTTTGAATATCCCAATAATAGCGATAACCAACCGTTACCGACCCGCCGCCACGTTTACCACCCATTATTTATCTCCTTGACGCGCCGCAATGGCGGCATTAATACATTTGCGGGCAAATACACTGCCCGTGTTTAAAAGCACGTCAGAATCAATCCCGTGTGCTAAAAAATCGGCATAGTCCAAGCCTTCGCGTACAAAAAACGCCTCCACACCGGAGGCGCAGAAATCTACCCGGCGCATGTCTTGCATTGTGATAGTCATCTTGTCCATAACTTAACCTTTTTTGATTTCGGTGGTGCGGTAGTTACCATACGCCAACACTTGCCAGTCCTCAGTCCAACAATCGCCAAAAAACACACACTGCGGCGTGCCCTCGTCAATTTGCGGAAAATTCCAATCTTTTGCGTTCACCGCATCGGGGCTGTTATTATTGCCTCGCTTATTGTTAAGCGCTTGATTGATGTAATAACTGGCAACCGCCCAAGCGACGATTTTGACGATTGCCCATGCAATTGACTCATACATAATTAATACCCCTCAGAATACCCGCGAGCCATCATACGGCGACTTATTTGGCATGTGCGGCGCGCCACCGTAATTGAGCATATTGTTAAACTTTTTAAGACACGTCTCGGCGCGCCCATCACACCCCGGATACACCTTAATGACTGTGCCGACAGACAGTTTTTGGGTGCCGCCCATAAGCGTGAGTTTGTTATTTTGATGAACGGTCACTGCACGCACCTCGCGCACGCCGTCGTCCGTCCACTCGATGAAACCTGCATTAAACCAACCCTGCGGCAAGTTTTGCGGTAAATCAACAGTGATAGATACACCATCCATCGCGCTTATGGTGAGCCCCGCGACGACAAAATTGCCCGGCTTAACTTTGCAATCCACGTCATACAGTGTATAAGGGCAGTTACGCCCCCAAGTCAGGCGCAATCCTGCGCTATCCATGGTGTCGGACAATGCCGCGGAGGTAAGATTGGTAGTATGTATATCCGGGCGACTTGCCTCCGTAATCGTACCAATCCACACAATACGGATCTCGTTGTCGTCCTCATGCAAGCGCATAATAGTGAGCTTAACAGTTTGGCTAGGCGGAAGCCCTCGATACAGGCGCGCCACGGGGTTGTTGCTTGGCATGCGAAGCGTCACATTGCCATCACCTCCGCCGTCGCGGGCATCACTGATAGCGGACGCTAGCCATTTCTCGCTGTTAATCTCTAAATCCTTGTCCGCATTGCAAAAGCGCCAGATTTTCTCGTTTTCGCCGCGCACAAATTGATATAAATCAATCGGGCGCCCCTCAGAGACGGAATGTGTTTTGCTTAAATAACTCATCTTTAAATATCCTTTAAACCGCCTTTAAAGTGCGGTCGTTTTTATGGATGTTTTTACGGCTCAAGCTCATCGCGGAGCCCGCGGAAGCTCACTGTCACTGTTGCCGCGCCGTCTGCGTCAGTGTGATGCACCCAACTGACTGTGTCGCTCTCCAAGCGGGACAGTGTCAAGTACGAAATCTTAAGAATCTCCGCTTGTTTGATATTGAGCGTGTCGCCGTCAAAGGCGAGCCGCTCTGTTGCAGAGTTAATCACTGCGGATGACACAATACGGCGATAAAAAATCCGCCCGCCGGTGCACTCAATGCGCACGTCTTGGCGTCCTGTTTGCTTTTGCAGTGCGCCGGTATAGTTGATGTAGGCAATATCTAAAGTCTTGCCGACAATATCGCCCACCGGCGTCACATCTGTGCTTGAGGTTGCCACCCAAATCGCACGTTGACGCCCGCGCAAGTGGTAAAACAAATTGCGGAGCTTGCGTTGTTCTTCCCGCCCACTTGCCACAAAGCGGTGGGCGGTGATTTGCATGGCTTTGTTTGCGGTATCCAAGTAATACGGCAAGCCCGTCTCATTATCCAGCGTCTTAATCAGCCGTGCATATTGCGCAGTGACGTCTTCTGACCACTCCGATGTCGGCTCCAACACCGGGTGGTTGCGATAAGTCGGCAAATGGCTCACATCATCACTCCACGCATTATGCTCGTGCAGTTGTAGGCGGATTTGCGCGGTTGACACGTTATCGCTTAAACGGCGTACTTGCGGCATATCCGTAAGCACAGCAGAGCGGAGCGGGTAAACGGCGGTAAAAGTGCGGTCATAATTACCAACGATTGGGCGCTTAACTGTGATTTTACTTGGCTCCAGCGCAGTAATCTCAACCATCTCCTTGTTGCTTCCGGTCATCAAAATTGCGCGCCCACCGACGGCAAAATCATAGCCCACGGTGTTAATAGGTAACTCCACCGCGCCCTGTTGCACAGGCTGTAATAATCTTGCACAATCGGTAAAAATCGGTAGCGACCACACGCGCGAGCCGTAGCCGTAAAGGGCGGATTCAAAGAGTTGGCGCTCGGTGTCACTAAAACTCACTTTAAACTCAAACGTGCGGCGCGGGCTTAAACGACGCGCGATACGTTGTTCGGCGGCAGTGACGGATTGATGCACGCGGGTGAACCACTCGAGATTTTCGGTGACGTCCTCACTCCAATCCGGCATAAACGACCAATCAGTGGAGCGCGAGCCGGTAATGCGTAGCGTAACGGGACTTTTGCCCAAAAAGTTAAACGTGACTACGCAATCAATCTCCGGTGTGCCCTGCATGCCGACTTTAACCGTCCATTTTTTAAGGGCGAGCGCGTTAAACGTGCCGGATGTTGGGCCGACAAGCTCTATGCCCTCACCACCGACGACGGAAACAGATAAAAGTTTTACCGCACTTTTGTTGGCATTCCAAACTTGCACATTAAAAGTCTGGTCAGTGGAGATTGAGCCAAGATTGACGGTGTGCGGGATAACAAAAATACGTTTATATAAATCAGCGTAGTAATTGGGCACAACATGAGCGCGCGTGGATTGCGTCAAATCAATCGTCACGCCAGCTGTCAGTGCACCATGAATGAGCTTCCGCGGGCGCGCCAAAATGCGCTGGTTAGCCCCGCGATGGGTTGTGAGACTATCAAGATAGCCGGTGTCTTTAATCGCGCCCGATTTGCCTGTTTTTGCTTTGTATGCCGTGATATTAGCCATAATTGCTACTCAATAATGCGATATGCCACGCCCTGGATGCCGGAGTTGTTTTTACCCTCCTCGATTGAGTTAGCATTGCGCTCGTCGTATTGTGCGCTCGGGATAATCATCCAACGCTCACCGGCAATCTCTAAAATTTGGCGCGGCTGAATGCCAACCATGGTGCACTCGTAACGGTCCGGCAATATGCCCAAACGGCGAAACACACCGTCAATGCCGTGCGCAATCAAACTGTGCGGGCATGGGATTAACGTCTGACCGAATTTTGATTGACTAAAGTCAACCAGTAATTTATCCGGGTGGTATGTCTTATTGTCGGTGTACATTGATGCTCGCCCAAGCGTCAGCAAATATTTACCGTAGTCTTTTTTATTGATGTCGTTAAAATCATTAATACTCACCGGCGCAAAATACCACGGCGATTTTGTTGCACCGCTAATGCCATCAGCTCTAACAACTGCCTGATTACCGTTTTTACCATTAGCAAAACCATAAATGTGATCTATTTCTTGGTAATGCCCATATCGTCCCTGTATTGATGTGCCGTAAGTATATTGTCCGCCGACATACTCACCCTCTTTATCAAGCGTACCAATCCCAAAATGTCTAAATTTATCAGCTTCGACTTGCACAACAATGTGTAAATATTGCTTAGTGCCAAAAAAATCATAAGACACATAATTACCGCTATGCAGTTGAGTGGTTGCGGTCTCAATGGTCGTAAATGAGTTATTTTTTGATGACCCGGGTTGAGCGTCTGCCCCCTTACTTTTGTCAAATCCGGAATTAACATAGCCAAACAGAAAATTACTCTCTGCGGATAACACAAATGACCAATAACCGTCGTCATTATGCAAATAGAGCTCATTGTTTGTTGCTTTATCAATGACCCAATTTTGGGTCTGCGCAAACTCGGTAAGTTTGGTTAATAGCTCGTTTAGTGTTTTTGCGGTGCCTGTTTGATATGCCATGGCTACGCTCCCGTTGTCTCAATCACAAAATAATCCTTGGTTTTAACGCGGAATCCGCCGTTAAACACCACGCCCGAGCGCCCCTCGGCAATTGTTACTTTATCTCCGGCTGCGCGTTGCAACCCTGGAATCCAATAAACGCCATCCAGCGCACCCCAGCGATTATTTTTTTGACTGGAGACCTTGTAACTTAAAAACTCAACCGGCAAAAGCGGAAAACTCCCACCGGGAGAAGCGCCCATCGTACTTAAAATTTGAGGTTGCATATAACTGCCGTATGAATAGTAATTACACATCGGATACATAAATTGATATGCCGAGTCGGTATTGATGTTTTTGTATGTCTCACCGTAAAAATCGCGCCAAGTCTGGTCAGGGGTAATCAACCAGCAATTGCCATAAAGCGGATTAACGATAGACGAATTAAAATTATCAGACTGTGAATAGCGGATAAAAACACCTCTATTACTATCATCAACTAGCGGTGCACTACCGGCGATACAAAGCGGGTATGGGTATTCTGTCGGTGGCACAGTAGGCAAAATAAAGCCTAGATAAGCACTTGAGCACACTTGCGAGATACGGGTCACAATCTTGCAACAGCGACCATCCGCAACAATGTGATACTCAATCGCGCGGTTATCGGCAAACAATGCCACGCCAGGCGACGGGTTAATTAAGCCTTTGTGGATTTGTGTCTCGGTGACAAATTGTGGGTTGTAAAACGTACCACCCCAAAAATTAATATTGTATGTGTCGGCAGAAATCAAATTGGCGGTCGAGGCGCAAATATAAATATCCTGCTCAATCCCTGTACCGGTGGACTTCCAGGCGATTTGACGGATTTCTTTTGTCGTTGTGGTTGCCGGCAAAGTGCGGTCAAACAACACCGTCCACGCCTGCCCATTGGCAACCAACGTCGGGTCGGTGGTTAAAAACTTATTTAGGATGTCAAGCAAATCGCGCTCGTTTTGCGCGGTGCCGGTTTTGTATGCCATGTGATAACCTCTTAATTTAAAATATCTTTTACGGTTTGTTTGTTGGCGCGGAGCATAGTGATGACTGCCTTAACACCCGCGGTGGTCTTGAGCCCCGCAGTAAATAACTCTGCACTGTCAACTGCCAAGGTTTGCTGGATGTTGACCGGTGATGCTACCACCTGCGTGCCCGTGCGGCCGTCACGCAAAGAATCACTTAATCCAGGCTCACTGTAGCTTGGCACAGGAGGGACAGATACCGGGCCGCCTTGCGAAAATGAGCGGAGTTGTCGGCGGTTGATGGCGTGCATAAAGCCTACGCCATAGTGCGCCACAGAATCCGCCTTAACCACGAACTCACCATTGGATAGGCGGGCGGGGATTGAATCCGATGTGCTTGTGCCGGGACCGCGGATATAACCCCCTGTTGCGGCCGCAACGGTACCGCTGGAAAATGCACCTGCAATCGCACCCCACCAACCGCTTGTCGCGCTTGCCGCCTGCATGGCGAGCTGTTGCGCGGCAATATTAATCATTGCATTTATGATGGTATTGGCGAGATTTAACACGGCATCACGCAAGGTCATTGTCCCTTTAGCAAGCCCTACAATAGAGGTTTGCAATCCTTCCGTTAAACCCTCTTTAAAGGTCTTCTCAAGGTCATTTCCCGCATTTTTAAGCTCGGCAATCTTGATTTTCATGCCCTCTAGAGAGCTTTTGGCCGCTTCACCTTGCGCGCCAGGCATTTTGGCCAATTTTTCCAATACCGGGATTTGTTTTTCAAGCTCTGCCACAGTTTCGGTGTATAGGGCCTTCAGTTGTTGTTGCCCCTCAAGGTGGCTAATTAAGCCCACCTGCACCTGCGCTTGGATACGTTGCTCTTGCGTGCTTTGGTTTTGATACAAGCGATTGATTTCAGCTTGCACCCCGTCCACCTGCGCCTTGGCTTGCTCCAGTGGTAAGATTTTTTTAATCAGATTAATCCCATCCACATTGGAGTGCTTAGTAAACTCGGCTAATAGCTTGTTATAACGGCCCTCAATGTCGGTTAAGTTAGCCTTAACCTCTTGCCCTGTTAAGCGCAAATACTGCACGTTAAGCGCAAGGTTTTTGTCTTCTGCATCGTATTTTTTAGTTTTTGTGCGGGCGTTTTTTTTGGCTTTTTCGCCGGCTTCGATTTTTGCGGCGTATTGTGCGGCGAGTTTGCGTTGCTCGTCGTTTAATCCTTCTTTCTCCGCGTCATACATAATCTTTTGCGCGGTGCCCATGCCGGCAGTTGCGGCGCGGTCTTTTAACCGCTCAAGCCAGGATTCATTTGTTTTGTTTTGCTTTGCCTGCTCAATTTGTTTGTTAAGGTCAATCATCATGTTAATGCGGGCGATAAACGGATCCATTTCGCTTGCCGCATTGCCGGCTTGTTTGCTTAACGCGATAAAGGCTTGCTTCATATTTTCAAGTTGCTCGGTCGCCGTCATCGTCGCTTGCGTCAGCTCATTGCGCAGTTTTTTCTCGGTTTGCGTCAATTCGCCGCTCATGGATTGCATTTGTTCTTCCGCGGATTTAATGGCTTTTTTGAGCTCTTCTTGGGTTTCTGCTGCCTCCAAGCCACCAAGATCTTTTAACCGTTCGGCAAATTCGCCGCCTGCTTCCATCGCGGCGTTAAATGCGGCGGTGAGTTGCTCCTGATTGATGTCTGCCAACTCTCCCGTTGTCTCGCTCAAGTCATTAACAGCGGCTTGCAGTGTCTTAATTTGCGCATTAACTTGATTTATCTCGTCTGCATTAATTAATCCGCCCATCACACTAAAGCGGTTTTTACTGAGCAATTCATCGCGACGCTTAATCAGATCATCAAGCTGAGCTTTGGCTTCCTCGATTGCTTTATTGTTGGTTTCAACTTGGCTCACGCGCTCGCTAAATCCGCCAATTTCGCCCAGTTCTTTGCGGGCTTGGATTAATGATTGCGTTTTTTCGATGTTGGATTGGATGCTGTTGGCTGTTTGCTGATATTGCGCATCAAGCTCCGCCTCTTTGCCTTTGATGTATTCATAGGCCGCATAAAGGCCAAAAATAGCGGTAATAGCAAGCCCAATAGGGCCGCCCGCAAGCGCGAGTAAACTTTGCCCCAATCCGCTAAACGTTGCGGCACGCATAGCCACGGCAAGATTGCGGTTAGCTAATGCAAGACGTTCCGTGGCCAGTGTTGCTCTATCGGTTGACGCGGCCATCGCCACTGATGCCTGAGCGGCTTTAACCTCAATGGCGGCGCGGGCAACTAATGCATTGTTAGATGCCGCTGTCACCGCGGCATTGCGCGCCATAGCCACCGCACTTTGCACCATACCGGCGACAAAGCGGGAGGCGGCCACTGCGGCAACCACAAGTGCAACATTGCCAAATAAATCTAGATTATTAGCAAGCCCACTAATTGCGGCCGCTACTGTTGCGGTTAAAGAGATAGCATTGTCGGTTTTGTTAAGGTATTCCGTCCACGCGTTACCAAAATGCGCACCGGCGCGACCGATAGTCAGCGGCATGGATTCGTATTGTTTTTCGATTTCAGCGGCGGCTTCTTTTGTCGCACTCAAGATAATCTGTGGTGTGAGCTCGCCGTCTTCGGCCATTTTGCGTAATTCGGCGCGGGTTTTGCCGAGGGATTTTTGCAGTACCTCTAAAAAGATAGGCATTTGCTCGGCGACGGAGTTAAATTCCTCGCCGCGCAAGGTGCCGGAGGCTAAACCCTGGGATAACTGGATAATGGCGGACTTAGCCTCCTCGGGTAATGCCCCGGAGACGACCACCATTTGTTGCAATGTGCGGGTAAATTGGAGGAGTTCCGCGCTATTGGCTTTATCGCCCAAAGCACGGTAAACACGAGTGTAAAGCTCCGCAGTGGATTTAAACGCATTGCCCGTCTCGTTAGAGATGTCCATCAACTCTCTAAACGTGCCTTTCGCCTCGTTGTTTGTGCGGGAGACAAGTTTAATGCGCGCCTGATAGCTAGTCATGGCATCCGCATCAAGTAAGATACTTTTAGCGCCAAGAGACACGCCGGCAATAGCGGTAAACCCTAACAATTGGGATTTAAACCCGTTTAATTGTTGGCTGACACCGTTTAATTCGGTTTTTGTTTGTTTTAGCTTGTTGTTAAGTTGCCCGGTGACAGTATCTAGCACGCTTAAACCTTGCGCACCCGCTTTACCTTGCGCGCTCAAGCGATCACTTGCCGTGCCAACGCCTGTGATTTCCGCCTTAAACTGTTTAAAATTGCGCACCGCCGCATCCACATCGGCTTTAATGCGCATTGCAAGCGTCAAGGTATCTGCTGCCATAAATTCACCTTAAAAATTGACCGCACTTTATGCGGTCAGGTCGTTAATATAATTGGTTAAGTCTTTGCCGCCGCTAAATCCCACGGCGCAATCTATTGCTCGTGCGGCGCGTTCACGTCGGGCGCGGAGCATGGATTTTTCGTAAAATAGGATGAGTTGCCGGGCAGTGTATTGCCCCAGCTCGTTAAATTGGTGACCGTTAGCCACCAAGTGCTCTATGATTTCGCCCCAATCAGGCGGCGCGCATTGGTCTGTGCTATTTGCTCGACTAGCGGTTGCACCGCTTTGCGGGTAAAAAAATTACTGTTGACCGCCCACCACAACAACATCAAATCTTCGCCTTCTTGGGCATTTAGGTTTGCAACAAACTCCACGGGCTTGTTAATGGATACGGCAACCAGCTCAATAATGGCTTCGTAGTTATCGGCAAGCGCCTGCATGATTTCATCCCAGCGCGCGTTTTCGGGCTTATCGACACTGGCTAATTGGTCACGCAAAGTTGCGATAAACGCTGCCAATTTAGCGTTATGTTGCATTTGCTGGATAAGCGTGTATTCCTTCACAGTGACGGTTTCCCCGCCCACGGTGATGTCGCGATTTGGGTAGAGGATGTCAAGTTCGGAGGTGGCTTGGTTTTGCATTTTTATTATCCTTGCAATTTTAAAAAATCCCGCTCAATCAAAAGTTGCTCCCGCAATGATTGAGCGGGGGAGCTTGCAGAATGGCTACTGCTTAATAGTGGCTACGCGGCCAAAACGCCCAAGGACTGCATCGCCCGGTTTAGAGGTATCGGCCAACACTTTCGCTTTTGCATTCAAGGCGGCCAACGAGTTGTCGTTGTTAATCAACGCAAGTGCATCGGTTGGGTTAAAGTTGATTTTGTACAACTCCAACATCACCCATTCGTTTTGCTCGGCAAGGTTGACGCCCTCGTAACGCAAAAATAAGTCTTTCGGGTTGCTTGTTAGCATTGCCACGTTTTGCGACTCACCGTAGCTGTATTTCACTGTTTCGGTGTTGCCGGATTTGTCTTTCAAAAATTCAATCGCGCCAAATACCTTATGCACTACATAATCGGTGTTTTCGGTCATATTGGCGATTTCTACATTGCTGACATTGACGTGTTTTAATGCAATGCGATCACCGGCCTTAATTTCCGTTGGTAACGCTTCGCCGGTAACTGTACCCGCGGCAATTTTGGTATACTCACCAAGTAACAACAACGCCAAGTTTTCAGGGCTTAACTCGTGGAATTTAAGGCTTACCTCGCCTGATTTGCCGGTATTGATTTTGCGTACTTCTTGGCGCTGACCCGAGTAAGATTCTTTGTGGGTAAATTCTTCCGTGCTTAAGGATAGGTTGGCTTCGGACACATCACCTACCCAACGTAAATTTTTCGGTTCGCCGTTTGGCAAACGTTCGCCAAGGTACACACGGCCTTGACCGTAGCTATAAGTTTCATTGCGCTCCATTGTTTGTCTCCTCGCTTGGTGCTTCTGCTCGACGGGTCGCGGTAGCTTTGCCGGCGCCCATTTTTAAGATAAATTCTGCGGAGGACTCGTCTAACTCCAACGTCTCTCCCGCCTGATATTGTTGCCCTGCATGGGTATGCGGAGCGGTTAAGATAATTTTAGTTTGTGCCATAGTTACCCTTTGTCATAGCTTGGCATTGGTGCTTTAAAGTACATGCCGTAAACTGCCACACCCATGCCGCTTTGCGTGTCAGACCACAGGTTTTGCACGCTTAACAGCTCAAATGTGCCACTTGGTGGTAGTCGATAACGGTGCAAGCCCGCGCTTAACCGCTCAACCAACTGATAGATGCCGACATCATTTTCGCGCTCGCCGTCTAACACGTTTGCGACGACATACACCGCCCAGCGTGCCTGCACAATACCCGGATGTTCGCCCGGCATATGCCCAAGCCATGCGGTATAAGCGGCGGGCGGATTACTTACAATGCGTGTGACCGCCGAGTCATCCCAGTGCCCGGGATGTGAGGTCACCTCTCGCAATACATCACCGCAAAGCTCACGGATTCTCGCTTGTAGCGCGTCACTGGTTTTCGCAATATTGCTCATCAGATAAACCCTTTTGCTTTATCACGCGCCCATACGGAGCCCTGTGATTCAATGATGGCCACATTATCGCCTTCCACTGTTTTGCCGTCCTCACTAATCCCGAGCGAGATAGTGCCGTTGGCCACTTTTTCGAGGTAGCGGATACTGTCGTCGTAATCTCGGCGGGCTTGGTCGGTTGCTCGATTTTTTTCCAAAAAATAGCGGGCGATGTAACAACAGTGGCGCTCTAATACCGCAGGCACGCTTTTTAGCGGCAGGGTATAACGCCCGGCAAGATAGCTATCAATCGTCTGAGAGGCGTCTTCAAGCGCTTCGGCGACTTTGGGGCTGTCCGCGCTTATGGCAAGCGTTTTAATGCTTTGCTCGCCATAGCGTTTAACTAAGCCTTCCGGGGTGGCGTAAAGCATTATTGCCCGTCCTGCACGGTCTTAACGGCGTCAGCCAATAAGGCAACCAAATCCGCTTTCACCGCATTGCCGGCAAACTGCACATTACGCTCGGTTAATGCGGCCTTTAACTGCTCAACGGTCAGGCTGTTTAAATCGGCTGGTAATGCACCGTCATCCACGGTTTTTGTCGGCGTTCCGTTCTCGCCGTTTTGAGGTACTTGTTGCCCGTCACCTTCTTGATTAGGCTCCATGGGTTCAGGCGTTCCAACAACCAACCGGTGGTCACCTTGTAACGCCGCCACTTGTTCAGCCGTAAGCGCTTCAAGGGTGCTTTTGCCGAGAGGTAACACACGCCCAGCGCGGCAATAGCCATCTTTAATACGGTTGTGGACCGCAACTTTAAATAAGTTAAGCATTGCATTTTTATCCTTAAAGAGGTTTTAAAAGGGGTTTAAAGTGCGGTTAAAAATCACCGCACTTTTTGATGAACGGTTACAGGTAGTCTGCAACAATCAACTCAAGTTTTAAGTTGCGTAATTCGTTGTCCACGGTGGCACCGTTTTCAACGCGGAATGCACGATCTAACAACTTGGTGGCTTCCTCTTGCAAATCTACCGGCACCACAATGTGAGTTGGTTTAATGCCCAATTTATGGCCACCGTCACCTTCTACTTTGCGCATTGCTTTAATGGCTTTCCACAGGTTTTCGGCGGTTAGCTTGCCTTTTACGGCGTGTGCCATCTGCCAAAAGCCGTAGCCCACGTTGCAACGGAAGTCCACCCCGTAGCTGTACATGTTTTCTTCATAGACTTTCTGTGCGTTAGCGTCGGTCATTTGAGCCGGCGTGGGCGCTTTGCGATTTTGAAAAATAATCGGTTTTAACGCGCGGGAGCAGTCTAACAGGTACCATGCGCCATCTTCGGTGACATTAGTGCTGTCATCGGTGATATTGCTCACCTGCACCGGGTCCGTGCCATCCGGATTTTTTCCAACCGGGTGGTCGGTGTCAAAAAAGTACTGGCCGTCATAGCACGCTGTTTTAAAGCCTGCTTTTAATGCGCCAAACACTAATTCGTCCGGTTGTTCACCTGCGGAGCGGCCTAACTCCATGACAAGCGGGGCATATACGCTGATATTGTCATCTTCAATGTCGGTACGAAGGATTTCTACCCCTGACGCCCAGTCTTTGTTGACTACCGCATAACCGTGAGACTGGATAGCGGTGACTGCGCGTTTGCCTACCCATTCTTTAAGTTTAGGCATTTGACCTAGCCAGGTGTAGGTGTTGCTTTTGGTGGTAGAGTTAACCACAGTAGCGATTTTGGTGTATTGGCTCGGGGCTTTTTCTAAGCCCTCACGAAAGTTTTTACCAAGACCGGTAAATAACGCTTTTACGATTTCAGGGGTTACATTAGCCATTATTTAGCTTCCTTTTCTTTGGCAAAATCGTCTTCGCTAATGCCTAACAATTTTGCGACGGTTTGTTCTTCTGCGGATAATACTGCTACGCCTTTTTCTTTCGGCTGTTCCAGATTTTCCGTTTGTTGTGCGGATAACACGGCAAGTTTCGGACGTGCATCAAGCATGGCGGATAACGCCGCAACGCCTTGCTGTTTGCCAAAGCCGGTTAAATAGTCCACTTCGGTTTCCATTACGCGGCCTTCGTTTTTGGCTTTTGCGATTACGCCCGCCACGTCGGTTTCATTGGTTTTTGCGGATAACACGGCAAGCTGTTGCACCGTGGCATCATACGTTGCTTTCGGCACATATTTGCTTAAATCCACATCATTGATTTTGGCGCTTAATGCGGCGACTTGCGTTTCGGCTGTCGTTTTGGCGGCGGTAATGCCGTCCAGCGCAGAAAGTGCGGTTTGTGCTTGCTCTTCGGTGAGTTCCGCGTTGTCTTCCACGGTCACACCCAGTTTGCCAAGCAACTGCTTTAACAATGGATTCATTGTTGCTTTCTCCTTGGGGTTGGGTTGATTAAGTTGGGCTGACAGCACCGCCAACCGACGCATGCCGGTGACTCCGGGGTCGTTGGTTAGCGCTGCCATTCTGAGTTCGATGGGTTTGCCTTTGTCGTCGTAACTAAATACGGCGCTTAAAAAAGCAAATTCGCCGTTTTTGATGTGGTCATAGGCTTTTGGCGTCCAGCGCGGCTTAATCCACAAGCCTTGACGCTCGTTATCGTCAAACCACTTGATTTCATCTGCATTAAACCACCCGGCGGCAAGCACTTCTCCCGCGCCTTCGCCTTTTTTGGCTTTGAGGATGGTTTCGTGCTCGTAGTCAACTAAGGCGTCTTGTTTTAGCGCACGTAAGCGGGCAATGAGACGTTTTGCAATCGTCTCATCGATATACCAATGCGGCACGTCGTGCGGGGAGCCGTCACGAGATCTAAATTCACCCTTCGGCAAAAGCTGTTGCCAGCCGTCCGCCGAGGTTTTGTTGATTTGGGCCGTTAAGACGGCAATAGGGTGGTTTGTCGTTTTCATGGCGCAATAATGCGCCAATTTGAGGGGGTGGTGGGTTTATTGTGGCTCGCAATAATTAATGATGTTTTAGTTTGATTTTGTGATTTGTGATTAAGATTGGATTTGCTATCGCGTTTAAGAGGGGTTTAAATGCGTTTAAGTGCGTTTAAAAAATTAAGTTAATACGATTTATCGCCTTAATATATTTTAATCGCTCCACGCGCGTTTTATTGCGTTTTTTAAAATATCCTTGATTTCATCTATTCCCTGCTCGGATATCCCTAAAAACGGACGCGCAGGCATTTTTTTGGTGCCAAGCTGATGATATATGCCGTAAGACTCAGACACACCCACGGCGGCAAAGTCATCACCATAATCAATATTAAGGCTTGCCATCAATAAGCCGGTGCGGTGCAATATCTTACCATCATAACCCTTGGCATAACGACTTTTTTTATAGGCGGGGTCGAGATCTTCCCACTTTTCACCTTTTGGTGACCGCTCATCCTCTAAAGCGTCTTCAGCATCTTCACGCAATACGTTAGCCATTTTGCGTGTAATGCCGTCAGATTTGCCTAATTGCACCAGTTTAGCAAATGCGCCCTGTACAATGCGCATGTCTTTTTCGTCAAATTTTATATCGAGTTCCACTTGACATACTCCTTCAAAAGGGGTTAAATCAATTCAACTAACGCGCTGGGTGGCGAAACGGCAACGCGGCATGATGACAAAATCATGTATACTGTAGGTTCAAATCCTGCCCCAGCGCTTAGTCATTTAAGGCTTTCCTTTCAATACTACATACACACCGCCTTTTATCGCATTTAATACCATATCAAAGTCTTCGACCTTATAAGCATTAATGACAGCATCCACCTGTTCTTTTGGTTTCAGTCTGCGACGATTAAAATCGGCTGTTACAATCACTTTAATACTACGGTCGGCATTAAAATAGATCAGATTGTTATGCCCCTCACTCCTATCAAAGACGACCAAACTTTCATCCGCAATAATACGTGATAATGAGCTGTATTCTTTTTCATTTAAGCCTATGCCGCCTTTGTGATGTTTATGACTATTGGCATGTAATAAGTTTCTTTCGGTCATAACAAGCAGGCGTTGGCTTGTTTGTCCGGTAATTTGCTTAACATCGTCAGCAATATCCTCAGACACAATACCTGCGCTAATATATCGGTCACTTGCCCCACGATTATTCAGGTTGGCTTTAACCCAATTCTCAAATGCCTTATGCCGCGCTTCACTTTTGTTGATTGCTTGGATAGTCTGACTACGTAAATCACGGTTTTTTGCATCTAAGATTTTACGGATTAAAACGATGTCATTTCCTACCGCACTTTTGCCAACATTATTGCTCCATCCTGCGTCCGTGGTAATGGTGCCTTTATCGGTCGTTAGGCTATACACTTTGGCATGGGTTTCTTCGCCGGTGGCCTTATCCACGCCCGCAAGCGCCCAATCCTGTTTAATTCTGCCGCCCGATTGACTTACCTCAAGCCCCATTTTGTCTAACCGTCTTTGGCTTAACGCACGCACCCGGCAACGACAATTCCAGCCATTGGGCGGATACATGACATCCCAAATCGGGTCGTCATAACGATACACCTTCTCGTGCAAGGCTAAATGACTTGCCCGAGTGCGACTATCTTTAATCGCCAAATATTGCCAATAGGGCTGTTCATCGGCGTTGGCCATTTGTTCGGCGTAGCGCGCGGCATGGTAAGCGGTGATTTTATTGGTGCGTAAAATCGTTTGTAAGCGGCGCGGACTGCCGAGCTGTATCGTCTGCTCCGTGCCGTTGGTATTAGACACTTTAACTTTTCCCCACCATCCCAACGCCTCCAGTTTGGGGCGCAAATTGTTGATATATTCGCGCTCCGGGATGCCTTTTTCAATGGCTTCCACGGTGGCCGTGCGGATAGTCTCTAAAATATCCATGCGGGTGACTTTTGCCACGGTAAACGCCCGCGCGTGGGCATCCTCAAGGGCTTCTTGCCAATTCCAGGCGATGGCATACCCCTTGGCCTTGAGATAGTCAACGGCAAGTTTAGGCTCCATGCGCAATAGCTCGCGCATATCTAGATTAGCGGTTGGCATTGAGACGTCCTATCAAGTCGCTAACAAATAATGCACGGGTAAGCATTTGCTCCAACGCGTCATCGTCCAAATCTTGATAGAGTTCGGCCAGGCGGGTTTGTGCGTATTCATAGCCACCTGTGCGGATAGCGTCCACAATCGGTTTTAACATCGGGTCAATCACCGACTCGTATTCTTCTGCCGTAGGCTCCAGCTCGTCGATTAAGTCGTCGGGGTCGCGGTGGATTGTGTTAAATTTAAGCTCCGGTAGGTTAGCGCTTAATATGGCTTTTTTGCGCGGGTCTTCCGGTTCGGCTTTGGGCTGTGTTCGGCTTAATACGTCTTCATTCTCGGCTGCAACAGGGATTTGCATTTTATCTTGCGCCCATTGCAACGGGATTTTAAACCCGATGTCAACTAACTTGCCCAATCCCTCACCAAAGCTATTAATATCCTCACTTTCGGCGGTGTCAAATTCAAATCGTGGTATGCGGCGCGCGTCGTTAAATGACTTACAGTTAAGCGCATAAAGCGGGTACACCAAATCACGGGTTAGCGTTGCGGCTAAGCGTTTTAAATCGGCGTCACGTAATTCTTGGCGCACCTCATTGTGTACATTGCCAAGGGCATTGGTCGAGGTCTTGCCATCAGATTGCGAGGTGAGCGTGCCGCCTAAAATCGCTTTAGACATGGATTTTTCCGCCCAGTCAATCATCGCCATAAATTCTGCCGCATTGCCGTCAGCCGCCTTGGCAAATTCAATCTCCATGCCGCGCGGGATGATGCCGCCTGCGTTATGACCGATACTCATTACCGCCCGTAACAATGTATTTTTCTCGTTGTTGGTAGCCCCTTCCGGATATTTACCAAGGCGCAATGGCAGGCCATAAATCTCCAAAAACTCGGCAAAATCTCGGGCGGAGTAGTTGCGATAAATAAACGGCCAAACCAAGGTGCGCACAAGACCAATACGGGACAAATAACCCGTTTTCGCCTTGGCTATATGCGTAATCCATCCAAATTTAGCCAGCTCCACGCCTTTTTCTGTGCCATCGCGCAAGCGTAATGTATTGCGGTCATATTGCGGCGTCATAAACCACGCAGGGTCGCGCCAGTTAACATTACGGATTAATTTCAGGCCGCTGACAAGGCCCGGTTCCCACTCGATTTCTTGGCAACTAAACCCTTTCAAAATGGCGTCAGTCGCATCAAAAATGCAATCATCCAGCCACGTTGCGTCACGCAAGATTTCTTCGAGCATTTGTGCGTCTCGTTGTTCTGCCGCACCGGCATTAGGCGGCGGGGCAATTTGCCAATCCATTGTCAAGATGGCATTACGGCGCTTGCCGAGCTCCGATTGCAAGTGTGAGTCCTTTTCCTCCATATCTTCGGCCAATTCACATTGTCCGATTAAGTCGCCCATTTCAGCGGCACGTAATAATGTTGCCGCTTTGGATGGGGTAAGACCGCTTGCCGGGTGCTCACTATAATGACGTTGCAACCAACCTAAGCGGCTGTCATTTTCGGTTTGTAGCTCGTCATCAAAAGCAAATGGTTTGCCGTGGATGTCTAAAATTTTGCTTTGCATAAGTAATCCTTAAATATTATCCCAATCAGAGCCAAACTCGGCCTTAAGGTCTTCTTTTTCGCTGTTGGAGTATTCAAAATTTCGGCCGCCTGTCGCGCTTTGGTGTTTGGCGGGCAGTGGTGTAAACTCAATTTCTCCGCCCGTCATATAACTTGCTCGCACTGCCATACAATACGACACCGCGCTGTCTCCGTGGCGCTGTCCGCTTTTGCCTTGATTGCGGGCGCGGTCGATTTTCGGTACGCCATTAATCACCACAATGTGCCCTTGGTCTAAGATGATTTCTTCATCTTGCGGGATTTGGATCAGTCCGCTTTCATATAGCGCTTTATATTTTGGCATCCACTCGCGGTACCATTTATCATTTAACTGCACCGTCTCGACCATGCTTGCGCCATAACGCAATAGCACGGACTCCGCTAAATACCCCCCGTTTCCGGTGGCATCAAATGCCGCACCGATAAAACGTGGGATGTGTTTTAACACAAAAAATACGATTTGTTTTTGTTGCTCATAAGGGCAATTACGCACCTCAAGGGTGATATCCATGTGGCGTGCCGTAGTCGGTTGCACGGCACAAACGCTAAAAATACTCAAGTCGCCTTTACGCGCAAAGTCACACCCAAACGAGTGACGCATATCTTTATCTAGCGCGTCTAAGTGCGGTAAAACGTCTTTGATTAGCCATTCATTGACTAGCGTAATACGCTCCATCTCACTGTAGTCTATAAACTTGCTGTCGCATTCAAATGCAAGTTTGACCTTATCCGGATTCGCCGCGCGGTCAACTAGCGGACGAGGGATATAACCACCGGAGCTTCGTTTTGGTACGCAGTAGTATTCTTCCAGTGCGTCTTCTTCCGTGGAGGTGTCACGCAATAAACCGCGCTTCCAGGCATCTTCTTTTGCTGGTGACCATTCCTGTTTTGACACCTGGCAAATACGTTGGTAAAGCCCCTCTTTGCACGCGTCATCTAGTGTAATAGTGTGGATGGAGTAGCTTTTGCGACCCGCGCGGCTATCTTGGATTAATTGGTTAAACAGATTGTCCACGCCGTTATGAGTTGAGATTAACCGCACTTTTGCGCCCCACATGGTAAGCGCAAGAGCCGCCTTCAGAACTTCGGCTAGTTTTTCGTGAAATGCCGCTTCGTCAATACACACGACCCCTTGCATACCACGCAAGTTTTTAGGGTTGGATGAGAGTGCTTTAATCTTAAAGCCCGATGCAAAGTAGATGACGTAGGTTAAAATGTCCTTGTCTTCGTCATCAAAAATCTCTTCTTGGATTTGCCCGGCGGCTTGGTTAAAGTTTTCCGCCCACATGGCCGCCGCGTCAATAAACTCGCGTGCCATCTCTTTGTTGGAGCCGATATAAAAAACATCAGACCCGCTGTCTGATTTTGCTCTGCCCGCAATTAATACATCATCTGCCGCTTCCGCCCAGGTTAAACCTGTTCGACGGGACTTTTCGGCAATTTTTAAAGGGCTATCATCAGCAACCCAGCGCTTTTGATAGCCCAATAATAATTCTTTCGGATCAAACGGGATAAAATCCGGTAACTTCATCATGCAATCCCCAAAATTTTTGCTTTCAGGTGGTCAACGGTTTCTTGCGATAGTCCGGCTTGCGAAATCACTTTTTCCGCCGTTTCTGCGGCAAGTTGCGCCACCTCTTTGCGAATTTTGCGCTCCCGCTCCTCGTTGATAGCTTGTGCTTGCTCAATTCGGTTGGCTACTAAAGCAAGCTGATTAATGACTTTAGGGTCGACATCATCATCTTGACCTAACGCCATGGCCTTATCAAAGGCAATGGTCTTGACCGCCTCCATTAAGAGTTTGCCAACATCCGATTGCGGCGCTTCGCCGATTTGCTTCGTCCAGATTTCGGCCATCTCGCGGCTTTCGCGGATTTTTGCCCCCATCTTTTCCATCTTGCTGGCATAGCGGTTAAGCCCTGTTTTGCTCAAAAGTGCGGTTTCCGGCAAGCCACAATCGCGGATGAGATCGTTAATTTCTTCCAAAATTTCAGCCTGTGAAAACATCTTGTCGCGCAACATCATGGCAAGGCGGGTTTTGATGTCCGGTGGTAATAAATCAACTTTTGATGCGCGCCCGCGGGTGGTTTTATCACTCATTTAAAGCCCCTTTAAAGTCGGTTTAAAGGTGAGGTGACGGGCGTTTAACGCCGTCCACGATAACGCGCCCTTGTGCCACGTCTAACCCTCTTTGAGTGATGACGAGGACAAAAAACTCACCTTTGCCGGTGTCAATGCGCTTGATTTTGACTAAACCTTGTTCTTCGAGCCAAATCGCATGATTGCGCACCAAATCGCGGCTGATGTTGTGTCCGTAGGCGGTTAATACATCTTGTAAGATGGACTCGTTAGCGTCGTAGCCGTCTTCCGCAAGCGTGCGGAGCATGACAAGACGTTGGTCTTTAGTAAAAATATCGTGCATGATTTATTCCTTTCGGTTCAAAACTTTATCTTCCAGCAATAAGCCCGTTTGGCGGCTAATTGCGCTTAATGTGGCGTTAGTGGCCTTCGTTTCGCCTTCAATTTTTGTCATCAATTTTTCAAGTGATGCAAAATCTTTTGCAGTGGGTAACGCGTCCACTTTTAATTCCATTTTTGTCAACCGTTCATCGTTTTTTTCGATGCCATCTTGCAGCATGTAAATATCGCTTTTTTTGGCATATTTACTATCCATTTTGAGCCAAAAAAGGGTTCCTATAACGCCAAAAAGGGTGGCGATAATGCTCCAGTTTTTCTGGATAAAAGAGATAATTTCCATCATTTTTGTGATTCTTCGTGTTCTTGTTGACAACTTACACAACGCACACAGTGCGGCATGGCTTTAATGCGGGCTGGGGGGATAAGCGCACCGCAATCCATACAATACCGCGCCGTGTTCATGGCATTGGCAAATTGTTGCGCCGATGCCTGTTGTTTGCGCCAGTTATCCCACATTATTTCTTCCCTTTCTTGGGTTTTATCAACAATGTCATTCATTGGGTTGTGATTCCTTCTCGCAAATGGTGCGATAGGTTTTGTTATGGGCTAACACTTGGCGCAACGTGCCTAGCGTGTCCTTTTCCGAGGCTTTAATAATGGCAAAGCCTGCGCAACTATTATTCGGCGCGTAAGTCGTTGTTTTTGCGCAACTCGTCAACAACAGAGTCGCGACCAAGACCATGAGTTGTTTCATCATTTTTTTGCTTCACTTTGTAGTTTTTAACTTGTTTCTCAACGACCGCTTTTTCGGTCTTGAGCTGTTCGTTTTTGGTTGTTAATTCCGCGTTTGCACGAGACAGGCTCTCTGCGTGAGATTTAATTCTGCGGATTTTAAAATACACATAGCCGATGATGGCCAAGATAACGGCGCCAAGCGCGCCAATTAGGCTTAAATTAATCATAATTAGGGTCTCTGTGTCTGTTGCGATTTAATGCGTTAGCAAAGCCCTTGGTTGCTGCACCGCCTGCGCAAAAAATGGCAAAGTACATAAACATTTCCGGCACATAAGGACGGTCAACCCATGCGCAAAAGCAGAGGATAACGGCCATTAAAATCGCGCCGAAAAACTGGATAAATGCGGTTGTGGACAATCGGCCGTCCGCGTTAGTGTAAAGCTGTGAAAACATAATTATTGCCCCTGTATAAGCTCGCAACGGTAAAAATTAACGCCTATTTTGAATTTGCCGTAATCTTGGCAATCGGTAACAACATCAAAACTGACGCTAATCACAGTAAACATAATGCCAATTAGACATACTGCGACAATCAAAAATAAAATCGCTATGTCAGTCTTGTCATGCATAAACGATATAACAGCACCAAAACTGCAAACGGCAAATAAACAGATCGGAAGCCCCATCATTTACCCCTTATACAAATGGTCAAAGTTAATCATTTGCTCACTATCAAGCCATGCCCATACATCAAAACAAGGGCAATCTTTCAGCCACTCGTTCGGCGTAATCGTGCCGTCGCCGTTTAAATCAGGGCTTAAATCACGATGTCCACAAATGCGAGCACTGGGATGTTGACTTTCGAGTTTGCGTAAGAGTTTGTGCAGTGCAATCCACTGCGCCTCGGTGTATTCACCGTGGTTTTTGCCTCTTTTGGTGACGCCACCGACTAGGCAAATGCCGACGGAATGTTGGTTGTGGCCTTTTACATGCGCCCCGTCTTCACCAACTTGACGGCCTGTTTCCACGGTGCCGTCAGTATCAATCACAAAGTGGTAGCCGATAGAGGTTAAGTGCGGGTTAAATTGTTTGCATTTTGCGGCGTCACGTTTAAATCCGCGCGCTTTGTGCCACTCATCAATGCGTTGTGCGGCGGTTTGTGTGGCAGTGCGTAATTGATTGCCGTTTTGTGTGGCCGAGCAATGGATCACTATTTTGTGGATGGGTAAAGACATAAAAAAACTCCCTTTAATGTTTTAAAGGGAGTTTAAACAAAGTAAGGAGCTATTCGGGTTTATTGTCTATCACTAAATTTAGTAGGGTAATTCAGGCTGATAGCGTTTTTTGATGATGTTACGTTGTTTGCGGATAATAGCGTAAATATGCGGCTCAGACAAGCCGTAACGCTCACTTAATGCCCGCACATTACCGCCGTTAAAATCATTATAGATAGCATAGTCGCGGAGTGCTTCTTTTAGTCTGTCTGCGCGCGGCAGGTAGATAGCACGACCGCCGAGATAGTGCGATATGACAAGGATTATTTTTTCGATAGTCTTATCATCAAAGCTCTTTCCTTGTCGGCTAAATTCGGCTTTAATCAACTGCACTAATTTGACTAACACGCTTTCCCAAGACTTGGATAATTCATCATCCGGAATGTGATCTAACTTATCAAATAACTGCCCGACCATCTCGTGGTCATCTGCAAATAAATCGTGTTGTTCGTCTGTCATACTTGCGCTCTCCGTTGCCATTTTTTCAAAATCTCAAGTAGTTTTGTTGCTTCGTCGTCATCTAAACTTTGCACATTGAGCTTGATTAGCTGATTTGGTTGATTGTTTTTTGCTTTAAACAATGTATTGTGCATAAACCGATTTAACGCACGCTCCGAGCCGTCTTTAACAATGCCTGCTTTGTGCATTTGTATCCAAATTGCGCGGATTTTGTGAGTGATTCGGGATTTCACAATCGCATGTTCAGTTACCGGTGTTCTGCCTTTTCTGACTTGTGGTTTAAACCCCTTATCTTTCATGCTTTCGTACACTTTTAAAAGCTCCTCAATCGTCATTTTAGTGGTGCTTGTTTTGCCGGTTAGATTATCCAACAACACACGATAACTTAACTCATCCATATTTAACTTGCTTTTTGCAATATGGATCAGCTGGATAAGTTTAGGTTTAGTTAATTTAACGTCTAGTATCATTTTTCCATTCCAACCAAATTGTATATTCCGGCATATTCTTTACAAATTCCAATTGCCCAATAGCAGCATATTGCTCAATGTACTGTATTGCAGCCGTACGCTTGTCTTCTTCCAATTTTTCCGTATTTTCCACCGTACTTTTACCTTGCTCATTGCGCACCACAGCAAATAACGGTTTCGCCCCCTCATACACCTTTTTGAGATAATTGTGATTTGTTAACGCTACCACATTTCGGGTTTCACGGCGGTTTTTCATCACGCCACTGACAGTTTCGGTGAGCGCATGGGACAACAACGGACTCGGCTGATACATATCCAACACCTCTTGCATTAATTTTAATGCTCTTGAGTTAGATAATGCCGCTTTTCCCGGTCTAAATAGGGAAATATAACTCACCAACGCACGGGCATTGTCGCCGCGTAAATTGGTAATAATACCCAACATTTCACGCCCCGCGTCATCTTCTAATAGCACATCCAAGTGGATGTCACTATGGCAAACCGGGCAACGGCATAATTTCACTTTTAAAACTCCTTTAAACTAGGTTTAAAACACATTATTCAGCCCACTTCATCTAACTTATTCCCCTCTTTTGTAAAGAGGGGTTAGGGAAGATTTAATGGACTGTAAATGGGTTTTAGTCGATTGGTGGTTGTGGCAACGGTTTCCAATGTGTTACACCTTCAAACTCTACACCGTCAAAACTACAAAATCCCATACCATCTTCAAAGTAGCTGCCCGTTCTAATTAGCCACCCGGATTCGGATTCCGGTACCTTCATTGCAAATAAAACTTCACTCCAATCGCCTGGCAACCGTTCCGAACACTTAATCCAGCCATTTTGTGGATACTCAACAAGCACCGGAGGATTTTCAACCATGTGAATGAACTCATCGGCATAGAGTTCTTTTTCCTCTTCGGTGAGCGGTCTGGTCGGTAAATCAAATCCGCCTAACACAACCCCAAAACACCCCTCTTTTATAGCGTCTTCAAGGTCAGTATCAAATCCATCATTTGTGCCAAATTCAAATATCTGGTCGACACAGTCTTGTGCTTGTGATTTAGCTTCGTCTAATGTATCGTGCGTTGTGAACTCACGTTCTAACGCGTCATAAGCAAAATATTTGTTCATTTTTATTTTCCTTGTAACATCAAAAATTCACTTTGTTTGATTTCCGTTAAACACTCAGGGATTGCCGGAAAATCATCACCACCGAAGCCTTCTGATTTCACCGGTATTTTTGCGATAAAGTGATCGCTTGCCACACCACACACTGCGATATATGCCATGTTACTCGCAAACACCCAACAATTAAGCGCTAACTCGCTTATCATAAAATCATTAAAACTTGGATATTGATTTAATATATTTCTGAGTTCTTGGATTTTAGCGTTAAACGCCTTGCCGGCTTTGGTGCGATTGTTGCCGGTAATATTCACTTTCCCACCTTCAATCATTTCAAATTTATAGGTTTTATCCTCTTTAATTTTTTCAAATTCAGGATTGTTTTCGCTACATACAATGCCATAAATTCGACTTTCACTGCCGCGCCAAAACTCATAAAACGGGATAGTGTCAAAAATTACGTCTAATTCTTTGTTTCGTTGTTCGTGGTCGATATTCCATTGTTGATAAAGTGATTTAACCGGTTCAACATTTAATGCACATTTAAAATATCTAAATTCAGGTTTCATTTTTACCCCTTTCTCCATTCGCCCTTAGGCATTATTTCGGTTATGTCGGCGTCTGCCCATTTTAAAAATTTGGTTACGCTAATTTTCGGATAATGCCGTCCATCTTTTACTGACGGGCTGTCATATTGCAACCCCTGGACGAACCCTTCTTTGTTGTCATAAATCATCCCAACCCAAAGGATTTGTCTATCTCCCAATAAACGGGCGAATCCGTATGTTTGAGGGCGTTTCGCCGAATAAACATGCCCAACTTTTAGGTCTTCTGTTGTTAGCTCTGCCATACTCACTCCAACACCGGCGTAATCTTCCACGCCACACATTTCATTTCTCTGCTTGCTGCCTGTAATAGCTTCAAGCACGCTTTATCATCATCTTCCTGCCACATTTCCTTGGCCATTTCTAACTGCTCAATAATCTGTGCCAATTGGATAGTTACATGCGACTTTTTATCTTTGTCAATCATAGTATTCATCCCCTTTGGATGGCACAGGCTCAACCTCAATCACGTCATACACTTCGGTGATGATGTGCGCCATTTGGGTGAGGTCATTGTTATTCAAATCGCAAGCGTCCATCGCTTGTTGCATGTTTTCGGCTTCAATTGCAAATTCCACCGTGCAATCTAGCCTGACGAGATATTTAGCCATTATTCGCTCCTTAGTTGTTATTCTAAAACTCATTATTCAGCGCACTTAAACCGTGCTTAAATGCGCTGTAAATGGGCTTTATCGGCCTTTGCAAGCAAGCAAGATCACAATCAATGCAAAGCTAGCCCACCCCCATATACTCAGCAGTGTTATTAAGCGTTCATCCATCTTGCTTTACCTCCGTTTGTTTCTTGCGTTTTAATCTTGGGTGCCAGTGTTCGCAAAATTCACCGCGCGTAATTGCCCAATCTTGATTAACCGTTTTTTTGGCGATATCTGCCGCCTTAAACCAAAGCGTCGCGGCATAACTCAAATCCCCCGCACGTTCCACTTCAACGGCCAGCTCGGATAAGTCCTTGTAGGTCATTTCCATGATTAATCCCGTCTAATTGAGTTTAATATTCGGGTGTAATCTGCTGCGGTGACTCTATCCGCCGTCACAGTTGACCCGTTGACAAAGTTAAATGTCAGTTTTACGGTCCCATCTTCGTTTTTATCCGCTTTAATGATGGTTACTTGGTCTAAATTAATTAGGTCCGGATATTCTTTTCTTCCTGTTAATCCTAAGTAGTTCATTTTGCGCTCCTTAAATGCTTGCTAAATCAAGACTAATTGGTTCGTATTTGTCGGTGTCGCCGACGCGTTTATAAACTCGGATATAGCTTTTTGAGCCAACCACCTGCACGCTGTCGGAGATAGCGTCCATCGCGCATTTCCAGCGTGGGTCTTGGATGTCCACGCGGCGTAGGGCTAAAATCTTGTTTGAGTTAAGATTGCCTTCCTTATCCACGTCAAACGCGCGGTCAATAATGGTTTTAAGCTCAGGGCGACTGCCTTCTGTCCAGTCTTGCAAACAGGCGTCAATTAATGCTTTAGCCGCTTGGATGCGTTCATCAAATTGCAATGATTCGGCGATAGCGCGTTGCACTTTGTATTCACCGTCAAAGCTATAAAGTGTGACGTTGCCTTTTTTACCGCCTAAATTTGCGCCATACTGCGCAGCGGAAAGTTCGACAAAGGCGGCGATGTCGCCAAACACTTCACTTTTAAAGTCTTTCATGACTTGGTTAGTCGCTACGGCCTTGCGCACAATTTCAAGCACCAACTCATCTCGCACTTTGTCGATTTCTTTAATTGATGCCTCAGGGATAAGCGCGCCGCGTGCGTCTTTGCGATAGCCTTCGGGGATTGTTACTTTTTGAGTTTCCATTTGTTTTTCCTTTTTTTACGGGTTACTAAAATCAGTGTTTGGGTAGTGTTTGGCGAGCCATGCACGCACTTCTTTTTCGGCTTCGGCCGTCAATGGCGGTGGCATATCGCCAAATTCTTCGCGCCATTCTGCATTTGCCGCTTGTTGCCAACACAACTCATCGCTATCAGCACATTTCAGCGTTTCCGCTTGGGCGACACCGCTCAAAAGTGCGGTCAAAATCAAAGCCGTTTTTAAGGTTTTCATCAGTTGCCCCCGGTCATTTGTTTTTGTGCGATTAAAATCAGGTCTAATGTAATTGCGGTGCCCTGTGCTTTGGCGGTGATAGCGGCAAGTTTTAAATACTGCGTCAACGCGCGTAAACCGCCTGCCTTGGTGCCGATACTATTAAGTACGGTCATCAAATCTTTATCGTCAGTATCCAAACCCCAAGCACCTGCAATCGCTTTAATATCGGCCTTACTGCTCCCCTTGATAGGCGTATGCTTACCAATACGGCTCCAAAGGCGCGCATATTCGTGCGCTTGGTTCACCCCGCCTTGGATGCGGTTGTAAACCTTGTCGTTACCGATTAGGGCAAAGCCGACTTCGACTTCTTCTTGGATAATGCGGATTTCTTCAAGAGCGTCATAAGGCAAGTGGTCGCTTTCATCGATAATCACCAAACCTTTTGATTTTTGTAGCTTTTTAACAATTAAACGGCTTAGGCGGTCTTTACGGCGTGGCGCATCATTAATGCCAAGCTCTAATGCCAATTCATACAAAATACTGCTTAACGTGGCGCGTGCCGGGCTTGCGGTAATCATCCACACGTTGGTGTTGTGTTGTTGATAGGCTTGGCAGGCTTTCGTTTTGCCTACGCCACTGGCGCCGTAAATGGTCACCATCGTTGGCAAAATGCGCGCCATATCAAGCACACCAAACACCGTTTTAGCAGTCGGGATTTCGATAAAACTTGGCGCTTCAACAAACACCTGCACTTTACGTTCGTTTAAGGCCATCCAGTTTTTAATGGGTTCTTCCACTGTTTCTACATTGCCGGTGTATTTTTCGTTTAGCCATGCACTCAATGCCCCGCCGTTTACGCCCGTTTCGCGCGCTAACTTGGCTTGCGTGAGCTTGCCTTGTTTGATTAATAAGCTAATTTGCTCTCTTAATGTCATTTTTTTCGCTCCTTAAAGGTGGTTTAAACTGGCTTTAAAGCCCTTTTTCTTCTTTCAACATGGCGATGCCTTTCATCAGCCATTGTTCGGCTTCGTCTTCTTGTTCATCCTCCGGCACGACTTCCACTTTGCGTAATGCGGTGCCTTCTTTAATGACTTGCCACATTTGGGCTTCCGCCTCTTGGTTTTCTTCAAACTCCACCGGTGGCATATAGGCGGCTGCCTCTTGGATTGCCATATCCTGTGCCGCTTTCGCCGCTTTTTGGGTGTGGCGTACAAATTCGCGCTCTTTGCGAGAGTGGTCTTGTGCCGCACTTGTGTCGCCAAAGGCGGCATCCACCGTACAGTGCGCCTCGGCTAAATAACTTCCATCCAAGCTGTACACCCAAACCGCATCGTGCAAATTGTTCGGGTCGTAACGCACCACCACTTTCTTGTGGCTTGTACCAATCAACTCGTAAGCCTCGTATCGGTTGCGTAATCCTTGCACTTCGCCACCGGCTTTTAACGTAAAGGTGCCGTTGTCTTTTAGCGTGACTTCTTCGTGTAATGTGAGTAAGTAGCGCAGTTGTTCAGGCGTTGCCCAACGTTTCTCGGCAACCGCATAATCCCGTTCAAATGCTTGATTAAAACTCAGTTTGCCTTGGCAAATTTCAGTGGCGCGGTCTTGGCGTTCGTTAAACATCTGTATGCCTTCTTCGAGGGCTAAAATAAAACTCTCATAGTCCACGCCCGCCTTGTTGCCTTGGTAGTTATCAGGCTTGTCTAATGCGTTGTCACCTGCGTGGTAGCCGGCAAGTAAAGGGTGCTTATCCACAAGCTCACCCAAGCCACCGTGCGAAAATGCACGCTCAATCGGCTTGGCTTGCCCCCGTCCTCGGCCGTAGCGCACCGTTGTCCAGTGCAGTTGGATGCCAAGCGCCGGAATAATCCCTTGCACCTCATCTTCCCGCACTTTAAAGCGGTAACGGTTTTTCACCCCGCCTGTCATTTTCTTATTGGCTGCCGCTTTGGTGTTGTCGATGGTTAAGTGTTTCGGGATACCGTACTTATTCACGACATCAAGCAACGCCAAGCGGATCATGTTGGTGTTTTCCGACTCATCGCACCGATACGCCAAGATTTTGCGGGTGCGCACATCCTGCCAAAGCCACGTTTTAGGGCGGATAATGTGGCCGTTATGCCATCTCACCCAAACGTTATGCTTATAACCGTCCCCGTTGACCCATTCCATTGCTTCAATGCCGGCAACGGTACGAATGAGCGATGGATACATGCGGCTCAACGCATAAGTGCCATCTCTTAAATAGGTTTGGTGGGTTTTTGGGATTTCGCGCAAGATTTTGCGCTTAATACTAGAGGGGCTTGGGATAACCCAACCGTTCGCACTTGCCGCACGTTTCAAGCGTTCATAACAAGATCCAAACTGAGGGCGCTCATTACGGAAATAGTCGGCGCGGAAAAATGCCCAGGCTTCAGAGGTAAAAGCGGCCTCGCGGCTTTCGCTGTGCGCACCGTAGCTATCCATTAAAAGCGGTAGCCACAAACTACGATCAGCGTCTTTAACTTGATACCACCAAGACTTAAGTGCACTCACCGTGACCGATTTCTCGCCATCTTGGTTGTGTTTATGGCATACCAATGCCAACGCATCCAAAATCTTCACGCCACCGTTGACCAATTCGGCCACCGCAAACATAATGCCAAGCTTCATTTGCGCTTTTTGTTGTTGCTTTGCCGTGCCTTGTTCATAGGTCGCCCACAACAACTGCGCATCAACAGGCGCACTTTCCTCGGCTAAAACTGGGAGATTTTTCACCGCACTTTTGCCAAGTTTCACCACGATTTCGGCTTGCACGTCTTCCGGCATGGATTTCACGGCATATTCAACACCACCGCCTTTACCAACTCTTTTTTGAGTTGCCCAGCAATTCTTTTTAGCTTGGTAAAGTATTCCTTGCACCGAATTAGGCAAAGTTGCTAAACTTAAACCAACTAATTCTTTTGCTGAGTAGTGTGTTTTTAAGTTGTTTACGCTCATAAATAACCTCAAAACTATCTGTCAGCATATTTTTTAAGGTTGCGTTGCTCATAGCGAGATGCCCAAATCACTTCGGCAGGTACGCCAATCGCTTCAGCAATAATGCGTTCACCTTTCAACCATGGACGGTCTAACGCATTTTTTAACGTGCTTCCGTTGCTGTAACCGTGTTTCAACGATAACTGGCGCAACGACCAACCTTTTTTTGCTAATGCAGCTTTGATGTCTTCTCTATGCCAATCAATAGCTGTTTTTTTAGTTTCCATTTATGTCCTCATTAGATAACTTCACTCGTTAATCTAATGAGGATAATAAACCATAAAAACAACTCAATCAACTTTAAAAAAGTCATTTTAAAGTTAATTGATTAAAAATTAAGCGTTGTTTTAAGGGTTGTTTATTGTATCTCTTTGAAATCAATAACTTTTAATTCAACTTTAAAAACATTAAAGAAAATACAAGGATTTTTTAAAGTTATGCGTGTTAAGTTTAAAAACAACTCATCAATAGGAAGTCGAATTAGAGAGTTAAGAGAGCAGAAAAAAATCTCCAGAAATGCCATGGCAGAGAATTTGGGGCTTTCGTTATCTGCCTTGCAGAATTGGGAAACAAGTCAAACTGAGCCTATAGCTTCAATGATTATTACCCTTGCGGAAGAATTAGGGGTTGAGCCTAGTTATTTACTAACTGGCGAGAAGAACGGGGATGTTGATAGTCCTCCGATTAAACGCGCACAAAAGCACGAAATAAGCGGAGTTTCAATGATTGACTGCTTTTGTTCGGTAAACGTGTCGGCAGGCTTTGGCAGCTTTAACGAGGGCGTAACCGCGCCCGACGGGCAAGTGCCATATTCGGACAGCCTGTTGCAAAAGCTCGGCATTAAACCAACGCACGCCGCCGTATTTTGGGCAGATGGCACATCCATGCGCCCAACCATTGATGACGGCGATCAGATGTTGGTTGACCTCTCTAAAAAAGAGATCAAGGGCGATAAAATCTATTTAGTGCAAAACGGCGAAAGCGTGTGGGTTAAGCGTGTAAAACTCAACTGGAACGGCATAGAGCTCATTTCAGACAACAAAGAAGAGTACGCCCCGATAACGCTAACCAAAGAGGAAGCGGACAATTTAGAGATAATCGGACAAGTTGCCTACATCGGCAAAAGCGTAATTTAA
Protein sequences of DBSCAN-SWA_2 >LR134327|302524:335571|326125_326671_-|VEF41238.1|DBSCAN-SWA MSLPIHKIVIHCSATQNGNQLRTATQTAAQRIDEWHKARGFKRDAAKCKQFNPHLTSIGYHFVIDTDGTVETGRQVGEDGAHVKGHNQHSVGICLVGGVTKRGKNHGEYTEAQWIALHKLLRKLESQHPSARICGHRDLSPDLNGDGTITPNEWLKDCPCFDVWAWLDSEQMINFDHLYKG >LR134327|302524:335571|328277_328772_-|VEF41246.1|DBSCAN-SWA MNKYFAYDALEREFTTHDTLDEAKSQAQDCVDQIFEFGTNDGFDTDLEDAIKEGCFGVVLGGFDLPTRPLTEEEKELYADEFIHMVENPPVLVEYPQNGWIKCSERLPGDWSEVLFAMKVPESESGWLIRTGSYFEDGMGFCSFDGVEFEGVTHWKPLPQPPID >LR134327|302524:335571|317507_318584_-|VEF41215.1|DBSCAN-SWA MKTTNHPIAVLTAQINKTSADGWQQLLPKGEFRSRDGSPHDVPHWYIDETIAKRLIARLRALKQDALVDYEHETILKAKKGEGAGEVLAAGWFNADEIKWFDDNERQGLWIKPRWTPKAYDHIKNGEFAFLSAVFSYDDKGKPIELRMAALTNDPGVTGMRRLAVLSAQLNQPNPKEKATMNPLLKQLLGKLGVTVEDNAELTEEQAQTALSALDGITAAKTTAETQVAALSAKINDVDLSKYVPKATYDATVQQLAVLSAKTNETDVAGVIAKAKNEGRVMETEVDYLTGFGKQQGVAALSAMLDARPKLAVLSAQQTENLEQPKEKGVAVLSAEEQTVAKLLGISEDDFAKEKEAK >LR134327|302524:335571|318770_319214_-|VEF41217.1|DBSCAN-SWA MELDIKFDEKDMRIVQGAFAKLVQLGKSDGITRKMANVLREDAEDALEDERSPKGEKWEDLDPAYKKSRYAKGYDGKILHRTGLLMASLNIDYGDDFAAVGVSESYGIYHQLGTKKMPARPFLGISEQGIDEIKDILKNAIKRAWSD >LR134327|302524:335571|325040_325259_-|VEF41231.1|DBSCAN-SWA MNDIVDKTQEREEIMWDNWRKQQASAQQFANAMNTARYCMDCGALIPPARIKAMPHCVRCVSCQQEHEESQK >LR134327|302524:335571|308344_309310_-|VEF41193.1|DBSCAN-SWA MAYQTGTAKTLNELLTKLTEFAQTQNWVIDKATNNELYLHNDDGYWSFVLSAESNFLFGYVNSGFDKSKGADAQPGSSKNNSFTTIETATTQLHSGNYVSYDFFGTKQYLHIVVQVEADKFRHFGIGTLDKEGEYVGGQYTYGTSIQGRYGHYQEIDHIYGFANGKNGNQAVVRADGISGATKSPWYFAPVSINDFNDINKKDYGKYLLTLGRASMYTDNKTYHPDKLLVDFSQSKFGQTLIPCPHSLIAHGIDGVFRRLGILPDRYECTMVGIQPRQILEIAGERWMIIPSAQYDERNANSIEEGKNNSGIQGVAYRIIE >LR134327|302524:335571|329618_329798_-|VEF41252.1|DBSCAN-SWA MIDKDKKSHVTIQLAQIIEQLEMAKEMWQEDDDKACLKLLQAASREMKCVAWKITPVLE >LR134327|302524:335571|325655_325889_-|VEF41234.1|DBSCAN-SWA MFSQLYTNADGRLSTTAFIQFFGAILMAVILCFCAWVDRPYVPEMFMYFAIFCAGGAATKGFANALNRNRHRDPNYD >LR134327|302524:335571|305520_305772_-|VEF41187.1|DBSCAN-SWA MYESIAWAIVKIVAWAVASYYINQALNNKRGNNNSPDAVNAKDWNFPQIDEGTPQCVFFGDCWTEDWQVLAYGNYRTTEIKKG >LR134327|302524:335571|331207_331438_-|VEF41263.1|DBSCAN-SWA MKTLKTALILTALLSGVAQAETLKCADSDELCWQQAANAEWREEFGDMPPPLTAEAEKEVRAWLAKHYPNTDFSNP >LR134327|302524:335571|316581_317508_-|VEF41213.1|head|DBSCAN-SWA MANVTPEIVKALFTGLGKNFREGLEKAPSQYTKIATVVNSTTKSNTYTWLGQMPKLKEWVGKRAVTAIQSHGYAVVNKDWASGVEILRTDIEDDNISVYAPLVMELGRSAGEQPDELVFGALKAGFKTACYDGQYFFDTDHPVGKNPDGTDPVQVSNITDDSTNVTEDGAWYLLDCSRALKPIIFQNRKAPTPAQMTDANAQKVYEENMYSYGVDFRCNVGYGFWQMAHAVKGKLTAENLWKAIKAMRKVEGDGGHKLGIKPTHIVVPVDLQEEATKLLDRAFRVENGATVDNELRNLKLELIVADYL >LR134327|302524:335571|313834_314260_-|VEF41200.1|DBSCAN-SWA MQNQATSELDILYPNRDITVGGETVTVKEYTLIQQMQHNAKLAAFIATLRDQLASVDKPENARWDEIMQALADNYEAIIELVAVSINKPVEFVANLNAQEGEDLMLLWWAVNSNFFTRKAVQPLVEQIAQTNARRLIGAKS >LR134327|302524:335571|326749_327169_-|VEF41240.1|DBSCAN-SWA MTDEQHDLFADDHEMVGQLFDKLDHIPDDELSKSWESVLVKLVQLIKAEFSRQGKSFDDKTIEKIILVISHYLGGRAIYLPRADRLKEALRDYAIYNDFNGGNVRALSERYGLSEPHIYAIIRKQRNIIKKRYQPELPY >LR134327|302524:335571|323813_324383_-|VEF41225.1|DBSCAN-SWA MSDKTTRGRASKVDLLPPDIKTRLAMMLRDKMFSQAEILEEINDLIRDCGLPETALLSKTGLNRYASKMEKMGAKIRESREMAEIWTKQIGEAPQSDVGKLLMEAVKTIAFDKAMALGQDDDVDPKVINQLALVANRIEQAQAINEERERKIRKEVAQLAAETAEKVISQAGLSQETVDHLKAKILGIA >LR134327|302524:335571|327165_327639_-|VEF41242.1|DBSCAN-SWA MILDVKLTKPKLIQLIHIAKSKLNMDELSYRVLLDNLTGKTSTTKMTIEELLKVYESMKDKGFKPQVRKGRTPVTEHAIVKSRITHKIRAIWIQMHKAGIVKDGSERALNRFMHNTLFKAKNNQPNQLIKLNVQSLDDDEATKLLEILKKWQRRAQV >LR134327|302524:335571|331437_332355_-|VEF41265.1|DBSCAN-SWA MTLREQISLLIKQGKLTQAKLARETGVNGGALSAWLNEKYTGNVETVEEPIKNWMALNERKVQVFVEAPSFIEIPTAKTVFGVLDMARILPTMVTIYGASGVGKTKACQAYQQHNTNVWMITASPARATLSSILYELALELGINDAPRRKDRLSRLIVKKLQKSKGLVIIDESDHLPYDALEEIRIIQEEVEVGFALIGNDKVYNRIQGGVNQAHEYARLWSRIGKHTPIKGSSKADIKAIAGAWGLDTDDKDLMTVLNSIGTKAGGLRALTQYLKLAAITAKAQGTAITLDLILIAQKQMTGGN >LR134327|302524:335571|327622_328162_-|VEF41244.1|DBSCAN-SWA MKLCRCPVCHSDIHLDVLLEDDAGREMLGIITNLRGDNARALVSYISLFRPGKAALSNSRALKLMQEVLDMYQPSPLLSHALTETVSGVMKNRRETRNVVALTNHNYLKKVYEGAKPLFAVVRNEQGKSTVENTEKLEEDKRTAAIQYIEQYAAIGQLEFVKNMPEYTIWLEWKNDTRR >LR134327|302524:335571|328774_329335_-|VEF41248.1|DBSCAN-SWA MKPEFRYFKCALNVEPVKSLYQQWNIDHEQRNKELDVIFDTIPFYEFWRGSESRIYGIVCSENNPEFEKIKEDKTYKFEMIEGGKVNITGNNRTKAGKAFNAKIQELRNILNQYPSFNDFMISELALNCWVFASNMAYIAVCGVASDHFIAKIPVKSEGFGGDDFPAIPECLTEIKQSEFLMLQGK >LR134327|302524:335571|325891_326125_-|VEF41236.1|DBSCAN-SWA MMGLPICLFAVCSFGAVISFMHDKTDIAILFLIVAVCLIGIMFTVISVSFDVVTDCQDYGKFKIGVNFYRCELIQGQ >LR134327|302524:335571|315699_316107_-|VEF41209.1|DBSCAN-SWA MLYATPEGLVKRYGEQSIKTLAISADSPKVAEALEDASQTIDSYLAGRYTLPLKSVPAVLERHCCYIARYFLEKNRATDQARRDYDDSIRYLEKVANGTISLGISEDGKTVEGDNVAIIESQGSVWARDKAKGFI >LR134327|302524:335571|330142_330355_-|VEF41256.1|DBSCAN-SWA MEMTYKDLSELAVEVERAGDLSYAATLWFKAADIAKKTVNQDWAITRGEFCEHWHPRLKRKKQTEVKQDG >LR134327|302524:335571|302524_305311_-|VEF41183.1|DBSCAN-SWA MGGKRGGGSVTVGYRYYWDIQSGLGRGPVDEIVELRVDDKTAYVGKPGELTHSQAIYIDKPNLFGGDNTGGEGGIQGRMEILMGEPDQKPTQMLINLLKGVYNPSLATHASRWLRKYANKNPERNKFFQNGNVEPGNLSQDDIIPGFRGVATTVFSGLISCYNAYPKKHSYRVRRANKGWHGGVVWYPEKAKILLRNNNLKISGLTPEQEKNVREIHAMNPAHILVECATNKSWGGKKDLSDLDLDSYKKAADTLYAEGFGLCIRYNRQTSIKEFIQQIVDHIGAAQYDNIETGKQAIKLIRHDYKVEDLPLFTYDNGILSVLDDDSAATDKQANQIIVKYREPVTNRDDQAIANNIAAVQMHGVISKTVEYKGIPTFDLAARVAQRDLEMIASGLTRLKITFDMRGSELRPGDVIRVNLPERDIVDVVFRVGELKNGNEGEIVATCLQDVFGLPSANYSTQKGESLYVPPDYTAKPIEHAQLFEVPYHVLPLVLTDAELVYVKPTDCFVWGMGAQPTPLSVGYDMLVNVGAGYAQTATGSFTPCIELVGEVSPYQTSIKFRLEGEYSALAGAEALIVDDEIIKIDSVDFKTGTMTVGRGCADTIPQAHKAGVLAWCYLLAAGTDETKYTVGEQIKGKLLTRTAQQTLDESKAQVLTLTTRQRQARPYPPGKVQIDGGYGNTINDKSAFKLTWAHRDRDVQADKLIPHTDDSTVLGKGVSYKVDLLDGDSVVRSIDTTATEFVYPDAKKVDGEQFSQIALYSTQNGLQSLHRYVLKVGGALVLLYKYDYRETWTAGDDLINKYDDNDIPGGKYLMLSSNAEPKSNIYKDYAIPAGKYARFVLDYKIMTYNQRRGKCRVIVQLLNGKNVVQSYDSDLMGDWQTNEWHPQQVADKLPAGVNIIRFKIVPEADIRNNALTFRDITIRVGEE >LR134327|302524:335571|305310_305517_-|VEF41185.1|DBSCAN-SWA MDKMTITMQDMRRVDFCASGVEAFFVREGLDYADFLAHGIDSDVLLNTGSVFARKCINAAIAARQGDK >LR134327|302524:335571|315265_315700_-|VEF41207.1|DBSCAN-SWA MSNIAKTSDALQARIRELCGDVLREVTSHPGHWDDSAVTRIVSNPPAAYTAWLGHMPGEHPGIVQARWAVYVVANVLDGERENDVGIYQLVERLSAGLHRYRLPPSGTFELLSVQNLWSDTQSGMGVAVYGMYFKAPMPSYDKG >LR134327|302524:335571|310319_313619_-|VEF41198.1|tail|DBSCAN-SWA MAADTLTLAMRIKADVDAAVRNFKQFKAEITGVGTASDRLSAQGKAGAQGLSVLDTVTGQLNNKLKQTKTELNGVSQQLNGFKSQLLGFTAIAGVSLGAKSILLDADAMTSYQARIKLVSRTNNEAKGTFRELMDISNETGNAFKSTAELYTRVYRALGDKANSAELLQFTRTLQQMVVVSGALPEEAKSAIIQLSQGLASGTLRGEEFNSVAEQMPIFLEVLQKSLGKTRAELRKMAEDGELTPQIILSATKEAAAEIEKQYESMPLTIGRAGAHFGNAWTEYLNKTDNAISLTATVAAAISGLANNLDLFGNVALVVAAVAASRFVAGMVQSAVAMARNAAVTAASNNALVARAAIEVKAAQASVAMAASTDRATLATERLALANRNLAVAMRAATFSGLGQSLLALAGGPIGLAITAIFGLYAAYEYIKGKEAELDAQYQQTANSIQSNIEKTQSLIQARKELGEIGGFSERVSQVETNNKAIEEAKAQLDDLIKRRDELLSKNRFSVMGGLINADEINQVNAQIKTLQAAVNDLSETTGELADINQEQLTAAFNAAMEAGGEFAERLKDLGGLEAAETQEELKKAIKSAEEQMQSMSGELTQTEKKLRNELTQATMTATEQLENMKQAFIALSKQAGNAASEMDPFIARINMMIDLNKQIEQAKQNKTNESWLERLKDRAATAGMGTAQKIMYDAEKEGLNDEQRKLAAQYAAKIEAGEKAKKNARTKTKKYDAEDKNLALNVQYLRLTGQEVKANLTDIEGRYNKLLAEFTKHSNVDGINLIKKILPLEQAKAQVDGVQAEINRLYQNQSTQEQRIQAQVQVGLISHLEGQQQLKALYTETVAELEKQIPVLEKLAKMPGAQGEAAKSSLEGMKIKIAELKNAGNDLEKTFKEGLTEGLQTSIVGLAKGTMTLRDAVLNLANTIINAMINIAAQQLAMQAASATSGWWGAIAGAFSSGTVAAATGGYIRGPGTSTSDSIPARLSNGEFVVKADSVAHYGVGFMHAINRRQLRSFSQGGPVSVPPVPSYSEPGLSDSLRDGRTGTQVVASPVNIQQTLAVDSAELFTAGLKTTAGVKAVITMLRANKQTVKDILN >LR134327|302524:335571|324405_324705_-|VEF41227.1|DBSCAN-SWA MHDIFTKDQRLVMLRTLAEDGYDANESILQDVLTAYGHNISRDLVRNHAIWLEEQGLVKIKRIDTGKGEFFVLVITQRGLDVAQGRVIVDGVKRPSPHL >LR134327|302524:335571|309312_310308_-|VEF41196.1|DBSCAN-SWA MAYKTGTAQNERDLLDILNKFLTTDPTLVANGQAWTVLFDRTLPATTTTKEIRQIAWKSTGTGIEQDIYICASTANLISADTYNINFWGGTFYNPQFVTETQIHKGLINPSPGVALFADNRAIEYHIVADGRCCKIVTRISQVCSSAYLGFILPTVPPTEYPYPLCIAGSAPLVDDSNRGVFIRYSQSDNFNSSIVNPLYGNCWLITPDQTWRDFYGETYKNINTDSAYQFMYPMCNYYSYGSYMQPQILSTMGASPGGSFPLLPVEFLSYKVSSQKNNRWGALDGVYWIPGLQRAAGDKVTIAEGRSGVVFNGGFRVKTKDYFVIETTGA >LR134327|302524:335571|332389_334396_-|VEF41266.1|transposase|DBSCAN-SWA MSVNNLKTHYSAKELVGLSLATLPNSVQGILYQAKKNCWATQKRVGKGGGVEYAVKSMPEDVQAEIVVKLGKSAVKNLPVLAEESAPVDAQLLWATYEQGTAKQQQKAQMKLGIMFAVAELVNGGVKILDALALVCHKHNQDGEKSVTVSALKSWWYQVKDADRSLWLPLLMDSYGAHSESREAAFTSEAWAFFRADYFRNERPQFGSCYERLKRAASANGWVIPSPSSIKRKILREIPKTHQTYLRDGTYALSRMYPSLIRTVAGIEAMEWVNGDGYKHNVWVRWHNGHIIRPKTWLWQDVRTRKILAYRCDESENTNMIRLALLDVVNKYGIPKHLTIDNTKAAANKKMTGGVKNRYRFKVREDEVQGIIPALGIQLHWTTVRYGRGRGQAKPIERAFSHGGLGELVDKHPLLAGYHAGDNALDKPDNYQGNKAGVDYESFILALEEGIQMFNERQDRATEICQGKLSFNQAFERDYAVAEKRWATPEQLRYLLTLHEEVTLKDNGTFTLKAGGEVQGLRNRYEAYELIGTSHKKVVVRYDPNNLHDAVWVYSLDGSYLAEAHCTVDAAFGDTSAAQDHSRKEREFVRHTQKAAKAAQDMAIQEAAAYMPPVEFEENQEAEAQMWQVIKEGTALRKVEVVPEDEQEDEAEQWLMKGIAMLKEEKGL >LR134327|302524:335571|314344_315091_-|VEF41202.1|DBSCAN-SWA MERNETYSYGQGRVYLGERLPNGEPKNLRWVGDVSEANLSLSTEEFTHKESYSGQRQEVRKINTGKSGEVSLKFHELSPENLALLLLGEYTKIAAGTVTGEALPTEIKAGDRIALKHVNVSNVEIANMTENTDYVVHKVFGAIEFLKDKSGNTETVKYSYGESQNVAMLTSNPKDLFLRYEGVNLAEQNEWVMLELYKINFNPTDALALINNDNSLAALNAKAKVLADTSKPGDAVLGRFGRVATIKQ >LR134327|302524:335571|305784_306594_-|VEF41189.1|DBSCAN-SWA MSYLSKTHSVSEGRPIDLYQFVRGENEKIWRFCNADKDLEINSEKWLASAISDARDGGGDGNVTLRMPSNNPVARLYRGLPPSQTVKLTIMRLHEDDNEIRIVWIGTITEASRPDIHTTNLTSAALSDTMDSAGLRLTWGRNCPYTLYDVDCKVKPGNFVVAGLTISAMDGVSITVDLPQNLPQGWFNAGFIEWTDDGVREVRAVTVHQNNKLTLMGGTQKLSVGTVIKVYPGCDGRAETCLKKFNNMLNYGGAPHMPNKSPYDGSRVF >LR134327|302524:335571|324708_325044_-|VEF41229.1|DBSCAN-SWA MMEIISFIQKNWSIIATLFGVIGTLFWLKMDSKYAKKSDIYMLQDGIEKNDERLTKMELKVDALPTAKDFASLEKLMTKIEGETKATNATLSAISRQTGLLLEDKVLNRKE >LR134327|302524:335571|334410_334662_-|VEF41268.1|DBSCAN-SWA METKKTAIDWHREDIKAALAKKGWSLRQLSLKHGYSNGSTLKNALDRPWLKGERIIAEAIGVPAEVIWASRYEQRNLKKYADR >LR134327|302524:335571|316106_316505_-|VEF41211.1|DBSCAN-SWA MLNLFKVAVHNRIKDGYCRAGRVLPLGKSTLEALTAEQVAALQGDHRLVVGTPEPMEPNQEGDGQQVPQNGENGTPTKTVDDGALPADLNSLTVEQLKAALTERNVQFAGNAVKADLVALLADAVKTVQDGQ >LR134327|302524:335571|320664_322245_-|VEF41221.1|DBSCAN-SWA MQSKILDIHGKPFAFDDELQTENDSRLGWLQRHYSEHPASGLTPSKAATLLRAAEMGDLIGQCELAEDMEEKDSHLQSELGKRRNAILTMDWQIAPPPNAGAAEQRDAQMLEEILRDATWLDDCIFDATDAILKGFSCQEIEWEPGLVSGLKLIRNVNWRDPAWFMTPQYDRNTLRLRDGTEKGVELAKFGWITHIAKAKTGYLSRIGLVRTLVWPFIYRNYSARDFAEFLEIYGLPLRLGKYPEGATNNEKNTLLRAVMSIGHNAGGIIPRGMEIEFAKAADGNAAEFMAMIDWAEKSMSKAILGGTLTSQSDGKTSTNALGNVHNEVRQELRDADLKRLAATLTRDLVYPLYALNCKSFNDARRIPRFEFDTAESEDINSFGEGLGKLVDIGFKIPLQWAQDKMQIPVAAENEDVLSRTQPKAEPEDPRKKAILSANLPELKFNTIHRDPDDLIDELEPTAEEYESVIDPMLKPIVDAIRTGGYEYAQTRLAELYQDLDDDALEQMLTRALFVSDLIGRLNANR >LR134327|302524:335571|329337_329655_-|VEF41250.1|DBSCAN-SWA MCGVEDYAGVGVSMAELTTEDLKVGHVYSAKRPQTYGFARLLGDRQILWVGMIYDNKEGFVQGLQYDSPSVKDGRHYPKISVTKFLKWADADITEIMPKGEWRKG >LR134327|302524:335571|330357_330558_-|VEF41258.1|DBSCAN-SWA MNYLGLTGRKEYPDLINLDQVTIIKADKNEDGTVKLTFNFVNGSTVTADRVTAADYTRILNSIRRD >LR134327|302524:335571|306647_308339_-|VEF41191.1|DBSCAN-SWA MANITAYKAKTGKSGAIKDTGYLDSLTTHRGANQRILARPRKLIHGALTAGVTIDLTQSTRAHVVPNYYADLYKRIFVIPHTVNLGSISTDQTFNVQVWNANKSAVKLLSVSVVGGEGIELVGPTSGTFNALALKKWTVKVGMQGTPEIDCVVTFNFLGKSPVTLRITGSRSTDWSFMPDWSEDVTENLEWFTRVHQSVTAAEQRIARRLSPRRTFEFKVSFSDTERQLFESALYGYGSRVWSLPIFTDCARLLQPVQQGAVELPINTVGYDFAVGGRAILMTGSNKEMVEITALEPSKITVKRPIVGNYDRTFTAVYPLRSAVLTDMPQVRRLSDNVSTAQIRLQLHEHNAWSDDVSHLPTYRNHPVLEPTSEWSEDVTAQYARLIKTLDNETGLPYYLDTANKAMQITAHRFVASGREEQRKLRNLFYHLRGRQRAIWVATSSTDVTPVGDIVGKTLDIAYINYTGALQKQTGRQDVRIECTGGRIFYRRIVSSAVINSATERLAFDGDTLNIKQAEILKISYLTLSRLESDTVSWVHHTDADGAATVTVSFRGLRDELEP >LR134327|302524:335571|315077_315263_-|VEF41204.1|DBSCAN-SWA MAQTKIILTAPHTHAGQQYQAGETLELDESSAEFILKMGAGKATATRRAEAPSEETNNGAQ >LR134327|302524:335571|334872_335571_+|VEF41270.1|DBSCAN-SWA MRVKFKNNSSIGSRIRELREQKKISRNAMAENLGLSLSALQNWETSQTEPIASMIITLAEELGVEPSYLLTGEKNGDVDSPPIKRAQKHEISGVSMIDCFCSVNVSAGFGSFNEGVTAPDGQVPYSDSLLQKLGIKPTHAAVFWADGTSMRPTIDDGDQMLVDLSKKEIKGDKIYLVQNGESVWVKRVKLNWNGIELISDNKEEYAPITLTKEEADNLEIIGQVAYIGKSVI >LR134327|302524:335571|319340_320678_-|VEF41219.1|head|DBSCAN-SWA MPTANLDMRELLRMEPKLAVDYLKAKGYAIAWNWQEALEDAHARAFTVAKVTRMDILETIRTATVEAIEKGIPEREYINNLRPKLEALGWWGKVKVSNTNGTEQTIQLGSPRRLQTILRTNKITAYHAARYAEQMANADEQPYWQYLAIKDSRTRASHLALHEKVYRYDDPIWDVMYPPNGWNCRCRVRALSQRRLDKMGLEVSQSGGRIKQDWALAGVDKATGEETHAKVYSLTTDKGTITTDAGWSNNVGKSAVGNDIVLIRKILDAKNRDLRSQTIQAINKSEARHKAFENWVKANLNNRGASDRYISAGIVSEDIADDVKQITGQTSQRLLVMTERNLLHANSHKHHKGGIGLNEKEYSSLSRIIADESLVVFDRSEGHNNLIYFNADRSIKVIVTADFNRRRLKPKEQVDAVINAYKVEDFDMVLNAIKGGVYVVLKGKP >LR134327|302524:335571|330568_331192_-|VEF41261.1|DBSCAN-SWA METQKVTIPEGYRKDARGALIPEASIKEIDKVRDELVLEIVRKAVATNQVMKDFKSEVFGDIAAFVELSAAQYGANLGGKKGNVTLYSFDGEYKVQRAIAESLQFDERIQAAKALIDACLQDWTEGSRPELKTIIDRAFDVDKEGNLNSNKILALRRVDIQDPRWKCAMDAISDSVQVVGSKSYIRVYKRVGDTDKYEPISLDLASI >LR134327|302524:335571|322254_323814_-|VEF41223.1|DBSCAN-SWA MKLPDFIPFDPKELLLGYQKRWVADDSPLKIAEKSRRTGLTWAEAADDVLIAGRAKSDSGSDVFYIGSNKEMAREFIDAAAMWAENFNQAAGQIQEEIFDDEDKDILTYVIYFASGFKIKALSSNPKNLRGMQGVVCIDEAAFHEKLAEVLKAALALTMWGAKVRLISTHNGVDNLFNQLIQDSRAGRKSYSIHTITLDDACKEGLYQRICQVSKQEWSPAKEDAWKRGLLRDTSTEEDALEEYYCVPKRSSGGYIPRPLVDRAANPDKVKLAFECDSKFIDYSEMERITLVNEWLIKDVLPHLDALDKDMRHSFGCDFARKGDLSIFSVCAVQPTTARHMDITLEVRNCPYEQQKQIVFFVLKHIPRFIGAAFDATGNGGYLAESVLLRYGASMVETVQLNDKWYREWMPKYKALYESGLIQIPQDEEIILDQGHIVVINGVPKIDRARNQGKSGQRHGDSAVSYCMAVRASYMTGGEIEFTPLPAKHQSATGGRNFEYSNSEKEDLKAEFGSDWDNI >LR134327|302524:335571|329790_329982_-|VEF41254.1|DBSCAN-SWA MAKYLVRLDCTVEFAIEAENMQQAMDACDLNNNDLTQMAHIITEVYDVIEVEPVPSKGDEYYD >LR134327|302524:335571|325378_325663_-|VEF41232.1|DBSCAN-SWA MINLSLIGALGAVILAIIGYVYFKIRRIKSHAESLSRANAELTTKNEQLKTEKAVVEKQVKNYKVKQKNDETTHGLGRDSVVDELRKNNDLRAE |
44 | Pseudomonas_phage(29.63%) | transposase,head,tail | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1060795 : 1070845
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >LR134327|1060795:1070845|DBSCAN-SWA AATGACAACTTCAATTCAACAACAAATTGACGACCTCAGAAAAACCCTGCGTTATCACGAATATCAATATCATGTGTTAGACGAGCCACAGATTCCCGACAGTGAATACGATCGCTTGTTTCATCAGCTCAAAGCCTTAGAACAACAACATCCCGCGCTGATCACCACCGATTCGCCGACCCAACGCGTGGGTGCGCGGCCATTATCGGAGTTTGCGCAAATTAAACATGAACTTCCGATGCTCTCGTTAGATAACGCCTTTTCTGATGAGGAGTTTCTGGCCTTCGTGAAACGTATTCAAGATCGTTTAGGACTTGTGCCAGAACCATTGACATTTTGTTGCGAACCTAAATTGGACGGATTGGCAGTCAGTATTTTGTATGTGAATGGTGTGCTGACCCAAGCGGCAACGCGCGGCGATGGCACAACGGGCGAAGACATTACGCAAAACATTCGTACCATTCGCAACATTCCCTTGCAACTACTAACAGATAATCCGCCGGCACGCTTGGAAGTGCGTGGTGAAGTGTTTATGCCGCACGACGGTTTCGAGCGCTTAAACGAACGAGCCTTGGAACAGGGCGAAAAAACCTTTGCTAATCCGCGTAATGCGGCGGCAGGTTCCTTACGCCAATTGGATCCGAAAATCACCAGTCAGCGCCCGCTCGTGTTCAATGCTTACAGCATCGGCGTCGCCCAAAGGATAGACTTACCGCCTACTCATTTTGAACGCCTACAATGGTTGAAATCCATCGGCGTGCCGGTAAATAGCGAGATCCGTTTATGCGATGGCATTGAAAACGTGCTGAATTTCTACCGCACTATGATGGAAAAACGCAGTTCCTTGGGTTATGACATTGACGGTACCGTGTTAAAAGTCAATGACATTGAATTGCAACAAAGACTGGGCTTTATTTCCAAAGCACCGCGTTGGGCAATCGCTTACAAATTCCCAGCACAAGAAGAACTGACGGTATTAAATGACGTGGAATTCCAAGTCGGTCGAACCGGTGCCATCACGCCTGTAGCCAAGTTACAACCGGTGTTCGTTGCCGGCGTAACGGTAAGTAACGCAACCTTACATAATGGCGACGAGATCGAGCGTCTCAACATTGCTATCGGCGACACGGTGATTATTCGTCGTGCCGGCGATGTGATTCCACAAATTATTGGTGTCGTACATGATCGCCGCCCGGCCAACGCGCGCCAAATTGTCTTTCCAACGCACTGTCCGGTATGCGATTCCTTAATCGTACGCATTGAAGGCGAAGCGGTGGCACGTTGCACCGGCGGGTTATTCTGTGCGGCACAACGCAAAGAAGCGCTAAAACATTTCGTCTCACGCAAAGCCATGGACATTGACGGTGTAGGTGCCAAACTGATTGAGCAACTGGTGGATCGCGAATTGGTTCATACCCCGGCAGATTTGTTCAAGTTGGATTTAGCCACACTCACCCGCTTGGAACGCATGGGGTCGAAATCGGCTGAAAATGCGTTAGTCAGCTTAGAAAAAGCAAAACACACGACCCTCGCCCGTTTTATCTTTGCGTTGGGTATTCGTGATGTGGGTGAAGCCACGGCATTAAATCTGGCAAACCATTTCAAAACCTTAGAAGCGTTACAAAATGCCGATTTAGAACAGCTACAACAAGTGTCTGATGTGGGCGAAGTGGTTGCGAATCGCATTTTTGTGTTCTGGCGCGAAGAGCATAATGTTGCGGTGGTGAATGATCTCATCGCCCAAGGCGTGCATTGGGAAACCGTCGAAGTACAGGACGTGAAAGAAAATCCATTCAAAGACAAAACTGTGTTGCTCACCGGTACACTTTCCCAAATGGGACGCAACGATGCCAAAGCGCTGTTACAACAACTCGGTGCCAAAGTCAGCGGCAGTGTTTCGGCAAAAACCGATTATGTTATCGCCGGTGAAGCAGCAGGTTCCAAACTCAGTAAAGCGGCAGAATTAGGCGTGCAGGTGTTGAGTGAAGAGGAGTTTTTAGCGTGGGTTAATGGATAAAGTGTAAAGACAGAAATCCATTTATCCCAAAGCAAAAAATAAGGACAGGCATAAAGCCTGTCCCTACAAAAACACTTGAAAAATTACTCCCAATCGAATCAAGTTCGGTTGTTCGCCCCGAAGGGGCCGTTGGCAAAGCTAACGTTCAAAACCCGTTGGATTTTGTGACCGCACTTTCAGTGACCCTATTCGGCAATCCGTTCTTTATAATGCAATCGGCAGACCGATAAATAACTGTCGTTGCCACCAATTTGAATTTGATTCCCTTGTTTGACGACCTCGCCTTGTTCATTTAAACGCAATACGAAATTGGCTTTACGTCCGCAATAGCAAATGGTTTTAAGTTCTTCCAACTGATCCGCCCATGCCAACAAATAGCGACTCCCTTCAAAAAGTTCTGCTTGGAAGTCAGTGCGTAAGCCATAACATAAAACAGGAATTTTCAGTTTATCCACCACATCGCTCAGTTGATACACTTGTGCTTTGGTTAAAAATTGTGCTTCATCCACCAAAATACAATGCAACGGCTCTTTCGTTAAGTGTTGTTGAATTTCTGCAAATAAATCCGTGTCACGTGCGAAGGTGTTCGCCTGTTCACTGATACCAATACGGGAAGTAACGCGTCCGGCGCCAAAACGATCATCAATGGCAGCCGTATAAACGAGTGTGTTCATATTGCGTTCACGGTAGTTATAGGAAGATTGCAGCAAAGTTGTCGATTTTCCCGCATTCATGGTGGAATAATAAAAATACAGCTTGGCCATAATTATTTAAGCGCCCATTTCCAAAAGTAATAGCAGATAAAACCGGTTAACGGCGGTAACGAGGCGAGAATAAAAACACCTATAGTGGTGCGTGCACCAACCATCTTCCCTACCTCCGTTAAGAAATCGATGAGGACGTCTGTCGGCGTGGTAAACACAAAAAAGCCGATAATTGCCAACATAACGAAGCAGCCAATTCCGGCGGCACGCATTGCTCTGAATTTAATGTTGTCCATAATGTTTCCTTGAATGAAGTGCGGTCAAAAAAACGTTTAAATTTTTGACCGCACTTTGATTTAGCATCGGGTTAAATGGCGGTTAATTCGGTCATTGCCCAACGCGGACGCACTTCGATGGCAAGATCTTGCTGCTGTCCTTGTTTTAAACGTAGAAAACCGGCATAGGCAATCATGGCGCCGTTATCGGTACAAAATTGCGGTTGCGGGTAAAACACTTCACCACCTAATTGTTGCATCAGTTCCGCCAAGGTTTGGCGCAACTGTTTATTGGCACTTACACCGCCGGCAATCACTAAACGCTTCAAGCCCGTTTGTTTTAACGCACGCTTGCATTTGATTGCTAGCGTATCCACCACAGCCTCTTGGAACGCATAAGCAATATCCGACTTGCTTTGCTCGGTTAATTTCCCTTCTTCTTGCATGACTTGATGAAGCGTATTGGCGGCAAAGGTTTTTAAGCCGGAAAAGCTGAAATCCAAACCTGGACGATCAGTCATCGGACGTGGAAAAGCAAAACGATTCGGCGTGCCATTTGAAGCTAAACGGGCTAGTGCCGCCCCGCCGGGATAATCCAATCCGAGTAATTTTGCCGTTTTGTCAAACGCTTCCCCTGCGGCATCATCAATGGATTCGCCTAATAATTCGTAGCGTCCGACGCCGTCCACACGCACCAATTGAGTATGCCCGCCGGACACCAACAACGCCACAAAAGGAAAGTGCGGTGGATTTTCTTCCAGCATGGGGGCCAGTAAATGCCCTTCCATGTGATGTATGCCGATTGCCGGTACATTCCACGCATAAGCCAAGGATCGCGCCACCGTAGAGCCAACTAACAACGCGCCGACTAAACCCGGACCGCAGGTATAAGCTACGCCGTCAATGTCTTTGGCGGTAAGATTGGCTTCTTGTAAGGCGGCTTGTAATAATGGCGCTAATTTCCGGATATGATCACGTGATGCTAGCTCCGGCACAACACCGCCATAATCGGCATGCAACGCAATTTGAGTGTGTAACTGATTGGCAATCAAGCCTTTTTCTTCATCATAAATGGCAACACCCGTTTCATCACAGGACGTTTCAATGCCTAAAATTCGCATTTTGAATCTCTTTTTATTCTGTTCAATGAGGCTGAATTTTACCTTTTTTACAAGGATTTAACCAGTTTTCAAACGGGGATTTGCGGAAAAGGCGAATCTTTCCTTTACTTTCGTACTGAATTTGGATTAAAATTGCGACCTTTATTGAATCTGCCGCAGGCGCGGCAACAAATAAAAATTTAAATTGCAATTAAATTAATTAAACTCATTGAGGTGATTGGCTTATGCCTGTAATTAAAGTTCGTGAAAATGAATCCTTTGACGTAGCATTACGTCGTTTCAAACGCTCTTGCGAAAAAGCTGGTATCTTAGCAGAAGTTCGTGCTCGTGAATTCTACGAAAAACCAACAACGATTCGTAAACGTGAAAATGCAACCCGCGCAAAACGTCACGCTAAACGCGTAGCTCGTGAAAACGCACGCAACACACGTTTATACTAATTAACAGTATTTTTTAACTCGAGTTATAAAAACCGTGAATCTTCCAAGGCTCACGGTTTTATTTTCTCTCAATCTCATCAGTTAGGCTCATATTTCGTTCACAATAAGAGGCAGAATACTCGATGAAAGGCACCATTCCACGTACATTTATAGACGATATATTAACTAAAGTTAATATCGTTGATCTGATCAATTCCAGAGTAAAACTGAAAAAAGCCGGCCGAGATTATCAGGCGTGCTGTCCGTTTCATCATGAAAAAACCCCCTCTTTTACCGTCAGTGACAAAAAACAGTTTTATCATTGCTTCGGTTGTGGCGCGCACGGCAATGCCATTTCCTTTTTGATGGAGTATGACAAACTGGAATTTGTGGAAGCGGTGGAAGAACTGGCCGGTTTTCTTGGGTTGGAAATTCTCTACGAAAAACGACCGCACTTTAACGAGAGTGGCAAGCAAGTCGGCTATCAAACCAAGCGTAATCTGTATGAATTAATGCAGGAAATCGCCACATTTTATCAGCAACAATTGCCGTTAAATATTCCTGCGCAAAGTTATCTGCAACAACGTGGTTTATCAGCGGAAATTATCGAACGTTTTCAAATCGGTTATGTGCCGAATGCCATGGATACCGTTTATCGCCAATTCGGTAAAACCCGAGAAGAGCAACAAAAACTGTTCGATTTAGGCATGCTATCACGCAATGATCGTGGCAATATTTATGACAAATTTCGCAATCGGATTATGTTTCCGATTCGCGATCGTCGAGGCCGCACCGTGGCTTTCGGCGGACGCGTGTTAACCGATGAGAAACCGAAATATTTGAACTCTCCGGAAACCGTGACCTATCACAAAGGCAGTGAATTGTACGGTTTATTTGAAGCCCTACAAGCTGACGATTCACCACAAAAATTACTGGTTGTTGAAGGTTATATGGATGTGGTGGCGTTGGCCCAATTCGGTGTAGATTATGCCGTGGCCTCTCTTGGCACATCAACAACCTCGGAGCAAATTCAATTACTCTTTCGCTCAACAGAACAAGTGATTTGCTGTTATGACGGCGATCACGCGGGGCGTGATGCGGCATGGCGAGCCTTAGAAAATGCACTGCCTTATTTGGAAGACGGCCATCAACTCAAATTTATCTTTTTACCTGACGGCGAGGATCCCGATACCTTTATTCGCCAATTTGGCAAAGAGGGATTCGAGGAATATCTCAATAACGCACAATCTTTAAGTGAATTTTTATTTGCTCATTTGACGCCACAAGTGGATTTCTCCAGCAAAGAAGGGAAAAACAAACTGGCGGCATTAGCAATACCGTTAATTAAACAAATTCCGGGCGATGTACTACGTTTGAATTTGCGTAACACGTTAGCCAAAAAACTAGGGATTCTCGATCCGACGCAGCTGGAAAGCCTTATTCCAAATCAACAGAAAACAGAAAACACACCGACAGCCCAACCGATACAATTTAAGCGAACCCCAATGCGTGTGCTGATCGCATTGTTGTTACAAAATCCGGAATTGGTGAAATTTGTACCCGATTTGGAATCTTTTCGTTCGTTAAATGAGCCGGGCTACGATTTGTTTGCAGAAATGACCGCACTTTGCCGTGAAAAAGTGGGTATTAGTTCCGGGCAACTGTTGGAACACTGGCGCGATACACCTCAACAAAATACGCTTGAAAAACTGGCCACATGGAACCATTTGGTTGAAGAAGACAAGATTGAAGATACCTTCCGCGAAACATTACGTTATCTTTATCTACAGATCATTGATAAACGAATAAATTGGCTAATCGCTAAGGATCGTAGCGAAGGATTAAATCTTGATGAGAAAAAAGAACTTTCAACGTTGTTGTTGGTAAAAAAACGCGAAAAAGAACACGAAAGAAATAGTTAAACCGAAGGAAGAATGCTAAAATCTTGGCGTTTTATCTTCACTAAATTAAGTAAGCAAGGCGGATATCAAATATGGATCACAATCCACAATCTCAATTGAAACTACTCATCGCCCAAGGGAAAGAGCAAGGCTATTTAACGTATGCCGAAGTCAATGACAGCCTGCCCGAAGAACTCGTCGATGCCGATCAAATTGAAGATATCATTCAAATGATCAACGACATGGGGATTCAGGTGTTGGAGACTGCACCGGATGCCGATGATCTGATGCTCAATGAAACGATTACTGATGAAGATGTCGTTGAAGAAGCCACACAGGTGTTATCCAGCGTTGAGGCCGAGTTAGGCCGTACAACCGACCCTGTGCGCATGTATATGCGTGAGATGGGCAGTGTGGAATTGCTTACCCGCGAGGGCGAAATTGATATTGCCAAACGTATTGAAGAAGGTATCAATGAAGTACAAAGTGCTGTTGCCGCTTATCCTGAAGCGATCACTTATTTAATTGAACAATACGAATCAGTAGAAAATGGCGGTGTTCGCTTGGCTGATTTAATTACCGGTTTTGTCGATCCAAACGTATTGAGCGAATCTGATAACACCCACTTAGATGAAAATTTTGATTCCGATGAAGAAAATGAAGAAGATGTCGGCGATAATAGGTTAGATGATGAAAGCGAAGATGAAGAAGATAGAGAGGAAAACAGTAGCGACGATGGTGATAGCGATAACAGCATCGATCCCGAAGTTGCACGCGAAAAATTCACCGCACTTAAAGAACAACATCAAAAAACCTTGGCAAGCATTGAAAAACATGGTCGCACATCGAAAAAAACCAAAGATGAAATTCAAGCCTTGTCAGATATTTTCACTCAATTCCGTTTAGTGCCAAAACAGTTCGATATTCTTGTGCTATCCATGCGTGACATAATGAAACGCATGCGTGCGCAAGAACGCTTTATTCAGCGAATCGTGGTCGATAATGCCAAAATGCCTAAATCCAGTTTCCAAAAGAGTTTCATCGGACATGAAACTACCGATACTTGGTTGATTAAAGCCTTGGGCGCTGGCAAAGCATGGTCTGAAAAACTAGTACAATATGAAAATGATTTGCGTCAAGCCATCGCAAATTTAGTACAAATTGAGCAAGACACTCATCTCACTATTCAGCAAATTAGAGAAATCTGCGAACGCATTGCACAAGGTGAGTTAAAAGCACGTCGTGCAAAGAAAGAAATGGTGGAAGCCAACTTGCGTTTGGTGATTTCCATTGCAAAAAAATATACCAATCGTGGATTGCAATTCCTTGATTTAATTCAAGAAGGTAATATCGGCTTAATGAAAGCAGTAGATAAATTTGAATACCGTCGTGGTTACAAATTCTCCACTTATGCCACTTGGTGGATTCGTCAGGCGATTACCCGTTCTATTGCGGATCAAGCACGGACAATCCGTATCCCGGTACACATGATTGAAACGATTAACAAGCTAAATCGTATTTCCCGCCAAATGTTACAAGAAATGGGACGTGAAGCCTCACCAGAAGAATTGGCGGAGCGTATGGGTATGCCTGAAGATAAAATCCGTAAAGTACTGAAAATTGCGAAAGAACCAATCTCTATGGAAACCCCTATCGGAGATGACGATGATTCCCATTTAGGTGATTTCATTGAAGACTCCACCTTAGAGCTTCCGTTAGATTCCGCCACCGCACAAAGCTTAAAAGCGGCCACACATGAAGTGCTGGAAGGTTTAACGTCACGTGAAGCGAAAGTTCTTCGTATGCGTTTCGGTATCGACATGAACACCGACCACACGTTAGAAGAGGTTGGCAAACAATTTGACGTTACCCGTGAACGTATTCGTCAGATTGAAGCCAAAGCATTACGCAAATTGCGTCATCCAAGTCGCTCAGAAACGTTGCGTAGCTTCTTAGATGAGTAGTGAAACAAACCCTAATAGTACAAAAAGGATAAGTCATAATGACTTATCCTTTTTGTTTACACATAATTATCATAATAGCTAGACTTTAGCGTAATATTTCCCTATAATCTGCACCTCAAATCAATGCTCACCGCCCCCATACGCCCCCATAGCTCAGTCGGTCAGAGCAGTCGACTCATAATCGATTGGTCACAGGTTCAAGTCCTGTTGGGGGCACCAACTTAATAATTCATACTGCTCCATTCTGATTCATTTCAATTCAAAAACACTTAAAAATCAACAATTTTAATTGATTCAATAGCGCATTATGCTCCATTCTGATTCATTTTGATTTTGCTTTTTCGTACCCGATATAGTACCCTGGCACAAATTTACTAGTTTTTTGGGTACTAAAAACAAGGCAAAATCATGGCAAGAATAGTGAAGGGTTTAACCAATACACAGGTTGAACGAGCAAAATACACACCTAATGGAACAAATGAATTAAACGATGGCAAAGGGCTATTTCTTCAAATGTATCCAACTGGGGCGAAGAAATGGCGCTTCCGCTATGAAAGACCAATCACCAAAGCGCGCACCAAATTTAATATAGGCGATCACCCCTCTATAACACTAGCCCAAGCACGCGCCAAAAGGGACGAATACAATGCTTTATTAGCGCAAGGGATAGACCCGCAAGAACACGCCAAACAGAAACACCAAGCCTTACAGTTTCAGTTAGAAAATACCTTTCTCAAATGGGCGGAACGTTGGAAAGAAAATAAAGAAAAGAAAGTCAAAGCGGATACCTTAAGGAAAGATTGGCGACGGATTGAAATGTACCTGTTAGAATCACTGGGGCAAATCCCTATTGATAAAGTGCTTCCTCCCCTACTGATTCAGGCCCTTCCCCCCTTGGAAGCCATGAAAGACCGCAGAACAGGCACGGCAGATAGCGACACCTTGAAGCGAGTTATCCGCTTAGCCAATGAAATTCTAACCTATGCAATGAACGCCGGGGCAATTCCTTTTAATCCGTGCTTAAGCGCAAAAGATATTTACAGTTTCGCCCCGGCGGAAAGTCATCCGCACATTGAGCCGGCAGAATTGCCCCTATTGCTAACGGATATAAGCGAATCAAAGGCACAACCAAGAACAAAGGATTTAATCTTGTTTCAACTTTTAACCATGGTGCGCCCATCAGAAGCGAGTAACGCAGAATGGGCCGAGTTTGATTTAGAAAACAAGGTTTGGACGATACCCGCCGAAAAAATGAAAATGAAGCACCCGCACAAAGTCCCGCTTTCTAGTCAAACAATTAGACTGCTTCAACACTTACAATCGCAAACAGGGCACAAGCGTTTTGTATTTGCCAGTAGAAATAAAATAAATGAGCCGATGAATTCCCAAAGCGTCAATAAAGCCCTTGTTGATATGAGCTATAAGGGCAAACAAGACGCGCACGGATTGCGCTCCATAGGAAGAACCTACATTGGCGAGAAACAAATGGACGGTTACGAAGTGCTAGAAATGTGTATTGCCCATAAAGTCGGCACAAGCACCGGCAAAATCTACGATAAAGCAGACTTCTTTGAACAACGAATCCCAATTATGCAAGCATGGGGGGATTTTGTAGAACAGTGTGCGGAACGCACTTCTAGTAAAAGCTAG
Protein sequences of DBSCAN-SWA_3 >LR134327|1060795:1070845|1065135_1065351_+|VEF42593.1|DBSCAN-SWA MPVIKVRENESFDVALRRFKRSCEKAGILAEVRAREFYEKPTTIRKRENATRAKRHAKRVARENARNTRLY >LR134327|1060795:1070845|1065473_1067252_+|VEF42595.1|DBSCAN-SWA MKGTIPRTFIDDILTKVNIVDLINSRVKLKKAGRDYQACCPFHHEKTPSFTVSDKKQFYHCFGCGAHGNAISFLMEYDKLEFVEAVEELAGFLGLEILYEKRPHFNESGKQVGYQTKRNLYELMQEIATFYQQQLPLNIPAQSYLQQRGLSAEIIERFQIGYVPNAMDTVYRQFGKTREEQQKLFDLGMLSRNDRGNIYDKFRNRIMFPIRDRRGRTVAFGGRVLTDEKPKYLNSPETVTYHKGSELYGLFEALQADDSPQKLLVVEGYMDVVALAQFGVDYAVASLGTSTTSEQIQLLFRSTEQVICCYDGDHAGRDAAWRALENALPYLEDGHQLKFIFLPDGEDPDTFIRQFGKEGFEEYLNNAQSLSEFLFAHLTPQVDFSSKEGKNKLAALAIPLIKQIPGDVLRLNLRNTLAKKLGILDPTQLESLIPNQQKTENTPTAQPIQFKRTPMRVLIALLLQNPELVKFVPDLESFRSLNEPGYDLFAEMTALCREKVGISSGQLLEHWRDTPQQNTLEKLATWNHLVEEDKIEDTFRETLRYLYLQIIDKRINWLIAKDRSEGLNLDEKKELSTLLLVKKREKEHERNS >LR134327|1060795:1070845|1063577_1063811_-|VEF42589.1|DBSCAN-SWA MDNIKFRAMRAAGIGCFVMLAIIGFFVFTTPTDVLIDFLTEVGKMVGARTTIGVFILASLPPLTGFICYYFWKWALK >LR134327|1060795:1070845|1069603_1070845_+|VEF42601.1|integrase|DBSCAN-SWA MARIVKGLTNTQVERAKYTPNGTNELNDGKGLFLQMYPTGAKKWRFRYERPITKARTKFNIGDHPSITLAQARAKRDEYNALLAQGIDPQEHAKQKHQALQFQLENTFLKWAERWKENKEKKVKADTLRKDWRRIEMYLLESLGQIPIDKVLPPLLIQALPPLEAMKDRRTGTADSDTLKRVIRLANEILTYAMNAGAIPFNPCLSAKDIYSFAPAESHPHIEPAELPLLLTDISESKAQPRTKDLILFQLLTMVRPSEASNAEWAEFDLENKVWTIPAEKMKMKHPHKVPLSSQTIRLLQHLQSQTGHKRFVFASRNKINEPMNSQSVNKALVDMSYKGKQDAHGLRSIGRTYIGEKQMDGYEVLEMCIAHKVGTSTGKIYDKADFFEQRIPIMQAWGDFVEQCAERTSSKS >LR134327|1060795:1070845|1062996_1063575_-|VEF42586.1|DBSCAN-SWA MAKLYFYYSTMNAGKSTTLLQSSYNYRERNMNTLVYTAAIDDRFGAGRVTSRIGISEQANTFARDTDLFAEIQQHLTKEPLHCILVDEAQFLTKAQVYQLSDVVDKLKIPVLCYGLRTDFQAELFEGSRYLLAWADQLEELKTICYCGRKANFVLRLNEQGEVVKQGNQIQIGGNDSYLSVCRLHYKERIAE >LR134327|1060795:1070845|1067323_1069195_+|VEF42598.1|DBSCAN-SWA MDHNPQSQLKLLIAQGKEQGYLTYAEVNDSLPEELVDADQIEDIIQMINDMGIQVLETAPDADDLMLNETITDEDVVEEATQVLSSVEAELGRTTDPVRMYMREMGSVELLTREGEIDIAKRIEEGINEVQSAVAAYPEAITYLIEQYESVENGGVRLADLITGFVDPNVLSESDNTHLDENFDSDEENEEDVGDNRLDDESEDEEDREENSSDDGDSDNSIDPEVAREKFTALKEQHQKTLASIEKHGRTSKKTKDEIQALSDIFTQFRLVPKQFDILVLSMRDIMKRMRAQERFIQRIVVDNAKMPKSSFQKSFIGHETTDTWLIKALGAGKAWSEKLVQYENDLRQAIANLVQIEQDTHLTIQQIREICERIAQGELKARRAKKEMVEANLRLVISIAKKYTNRGLQFLDLIQEGNIGLMKAVDKFEYRRGYKFSTYATWWIRQAITRSIADQARTIRIPVHMIETINKLNRISRQMLQEMGREASPEELAERMGMPEDKIRKVLKIAKEPISMETPIGDDDDSHLGDFIEDSTLELPLDSATAQSLKAATHEVLEGLTSREAKVLRMRFGIDMNTDHTLEEVGKQFDVTRERIRQIEAKALRKLRHPSRSETLRSFLDE >LR134327|1060795:1070845|1060795_1062811_+|VEF42584.1|DBSCAN-SWA MTTSIQQQIDDLRKTLRYHEYQYHVLDEPQIPDSEYDRLFHQLKALEQQHPALITTDSPTQRVGARPLSEFAQIKHELPMLSLDNAFSDEEFLAFVKRIQDRLGLVPEPLTFCCEPKLDGLAVSILYVNGVLTQAATRGDGTTGEDITQNIRTIRNIPLQLLTDNPPARLEVRGEVFMPHDGFERLNERALEQGEKTFANPRNAAAGSLRQLDPKITSQRPLVFNAYSIGVAQRIDLPPTHFERLQWLKSIGVPVNSEIRLCDGIENVLNFYRTMMEKRSSLGYDIDGTVLKVNDIELQQRLGFISKAPRWAIAYKFPAQEELTVLNDVEFQVGRTGAITPVAKLQPVFVAGVTVSNATLHNGDEIERLNIAIGDTVIIRRAGDVIPQIIGVVHDRRPANARQIVFPTHCPVCDSLIVRIEGEAVARCTGGLFCAAQRKEALKHFVSRKAMDIDGVGAKLIEQLVDRELVHTPADLFKLDLATLTRLERMGSKSAENALVSLEKAKHTTLARFIFALGIRDVGEATALNLANHFKTLEALQNADLEQLQQVSDVGEVVANRIFVFWREEHNVAVVNDLIAQGVHWETVEVQDVKENPFKDKTVLLTGTLSQMGRNDAKALLQQLGAKVSGSVSAKTDYVIAGEAAGSKLSKAAELGVQVLSEEEFLAWVNG >LR134327|1060795:1070845|1063882_1064911_-|VEF42591.1|DBSCAN-SWA MRILGIETSCDETGVAIYDEEKGLIANQLHTQIALHADYGGVVPELASRDHIRKLAPLLQAALQEANLTAKDIDGVAYTCGPGLVGALLVGSTVARSLAYAWNVPAIGIHHMEGHLLAPMLEENPPHFPFVALLVSGGHTQLVRVDGVGRYELLGESIDDAAGEAFDKTAKLLGLDYPGGAALARLASNGTPNRFAFPRPMTDRPGLDFSFSGLKTFAANTLHQVMQEEGKLTEQSKSDIAYAFQEAVVDTLAIKCKRALKQTGLKRLVIAGGVSANKQLRQTLAELMQQLGGEVFYPQPQFCTDNGAMIAYAGFLRLKQGQQQDLAIEVRPRWAMTELTAI |
8 | Serratia_phage(16.67%) | integrase | attL 1060721:1060737|attR 1073433:1073449 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
2328349 : 2337105
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >LR134327|2328349:2337105|DBSCAN-SWA GCTACTCCTCCCCAACTCTAATTGTGATATCTCTAAATGTCAGTGCGTTATTGCGGATATCCGCCTCCGGCACAATCTTAAACCTAATGATATTTACCCCTGCAGGTAACTTATCTGCAACTTGTTGCGGGTGCCACTCATTAGTTTGCCAGTCGCCCATTAAATCTGAATCGTATGATTGCACCACGTTTTTGCCATTAAGCAGTTGCACAATCACCCGGCATTTGCCGCGGCGTTGGTTATACGTCATAATTTTGTAATCAAGCACAAAACGAGCATATTTACCGGCGGGTATTGCATAGTCTTTATAGATGTTGGATTTTGGCTCCGCGTTACTTGACAACATAAGGTATTTACCGCCTGGGATATCATTGTCATCATACTTATTGATTAAGTCATCGCCCGCAGTCCAAGTCTCACGATAATCATACTTATAGAGTAACACTAACGCGCCGCCGACTTTGAGCACATAACGATGCAAGCTTTGTAAGCCATTTTGGGTGCTATATAACGCTATTTGGCTAAATTGCTCGCCATCTACCTTTTTGGCGTCCGGGTAAACAAACTCGGTTGCGGTGGTATCAATAGACCGCACCACGCTGTCGCCATCCAGTAAATCTACTTTGTAGCTGACACCCTTGCCCAAAACGGTGCTGTCATCCGTATGCGGAATCAACTTATCCGCCTGCACATCACGGTCACGGTGCGCCCAGGTGAGCTTAAACGCGGATTTGTCATTAATGGTGTTACCGTAACCGCCATCGATTTGCACTTTGCCAGGTGGATAAGGGCGGGCTTGACGTTGACGGGTGGTAAGTGTAAGCACCTGAGCCTTGCTCTCATCAAGCGTTTGCTGTGCAGTGCGGGTGAGTAATTTACCCTTAATTTGCTCGCCCACAGTGTATTTTGTCTCATCCGTGCCGGCGGCAAGCAGATAACACCACGCCAAGACGCCCGCTTTATGCGCTTGTGGGATAGTATCCGCACAACCGCGCCCCACAGTCATTGTGCCGGTTTTAAAATCGACGGAATCAATCTTAATAATCTCATCATCCACAATGAGCGCCTCGGCGCCCGCAAGGGCGGAATACTCACCCTCTAACCTAAACTTAATGCTAGTCTGATAAGGGCTCACCTCGCCGACCAGCTCAATACATGGCGTGAATGAGCCTGTCGCAGTCTGCGCATAGCCCGCGCCTACGTTGACTAACATGTCATAGCCAACGGAAAGCGGGGTAGGTTGCGCGCCCATGCCCCACACAAAGCAATCAGTCGGCTTAACATACACCAACTCCGCGTCCGTCAATACAAGCGGGAGGACATGATATGGCACCTCAAACAACTGCGCGTGCTCAATCGGTTTGGCGGTGTAATCGGGCGGCACATAAAGCGACTCGCCCTTTTGGGTGGAGTAGTTAGCTGATGGCAACCCAAACACATCCTGCAAGCAAGTGGCGACAATCTCGCCCTCATTGCCGTTTTTAAGCTCACCGACCCGAAAGACCACGTCCACAATATCACGCTCCGGCAGATTAACCCGGATAACATCACCCGGGCGTAACTCACTACCACGCATATCAAAGGTGATTTTAAGTCGCGTTAAACCACTGGCAATCATCTCTAAATCACGCTGAGCCACACGCGCCGCCAAATCAAACGTTGGAATCCCTTTATACTCAACCGTCTTACTAATTACGCCGTGCATTTGCACTGCCGCGATATTGTTAGCAATAGCCTGGTCGTCGCGGTTTGTCACCGGCTCACGGTATTTAACAATGATTTGATTGGCCTGCTTATCGGTTGCCGCACTATCATCATCGAGCACTGAAAGAATCCCGTTATCGTATGTAAACAGCGGTAAATCCTCGACCTTGTAATCATGGCGAATCAGCTTAATCGCTTGTTTACCGGTCTCAATGTTGTCATATTGCGCCGCGCCGATGTGATCCACAATTTGCTGAATGAACTCTTTAATGGAGGTTTGGCGGTTGTAGCGGATACACAAGCCAAAGCCCTCGGCATAAAGCGTATCGGCGGCTTTTTTGTAGCTATCCAAATCCAAATCGGAAAGGTCTTTTTTACCGCCCCAACTCTTATTCGTAGCGCACTCAACCAAGATATGTGCCGGATTCATGGCGTGAATCTCTCGTACATTTTTTTCTTGCTCCGGTGTCAAGCCGGAGATTTTGAGATTATTGTTGCGTAGCAAGATTTTAGCTTTTTCGGGGTACCACACCACACCGCCGTGCCAGCCTTTATTTGCTCTGCGCACGCGGTAACTGTGCTTTTTGGGATAGGCGTTATAGCAACTAATCAACCCGCTAAACACTGTCGTGGCGACGCCGCGGAAGCCGGGAATTATGTCATCTTGGCTAAGATTACCCGGCTCTACGTTGCCATTTTGAAAAAATTTATTGCGCTCAGGGTTTTTGTTTGCATATTTGCGCAGCCATCTTGAGGCATGGGTGGCAAGCGATGGGTTATAAACTCCTTTGAGTAAATTAATCAGCATTTGTGTCGGCTTTTGGTCGGGCTCGCCCATGAGTATCTCCATCCGGCCTTGAATCCCACCCTCGCCGCCGGTGTTATCACCGCCGAAGAGGTTGGGCTTGTCGATATAAATCGCCTGAGAGTGAGTGAGCTCACCCGGCTTGCCAACATAGGCGGTTTTGTCGTCCACACGTAACTCAACAATCTCGTCCACCGGTCCGCGTCCAAGCCCACTTTGAATATCCCAATAATAGCGATAACCAACCGTTACCGACCCGCCGCCACGTTTACCACCCATTATTTATCTCCTTGACGCGCCGCAATGGCGGCATTAATACATTTGCGGGCAAATACACTGCCCGTGTTTAAAAGCACGTCAGAATCAATCCCGTGTGCTAAAAAATCGGCATAGTCCAAGCCTTCGCGTACAAAAAACGCCTCCACACCGGAGGCGCAGAAATCTACCCGGCGCATGTCTTGCATTGTGATAGTCATCTTGTCCATAACTTAACCTTTTTTGATTTCGGTGGTGCGGTAGTTACCATACGCCAACACTTGCCAGTCCTCAGTCCAACAATCGCCAAAAAACACACACTGCGGCGTGCCCTCGTCAATTTGCGGAAAATTCCAATCTTTTGCGTTCACCGCATCGGGGCTGTTATTATTGCCTCGCTTATTGTTAAGCGCTTGATTGATGTAATAACTGGCAACCGCCCAAGCGACGATTTTGACGATTGCCCATGCAATTGACTCATACATAATTAATACCCCTCAGAATACCCGCGAGCCATCATACGGCGACTTATTTGGCATGTGCGGCGCGCCACCGTAATTGAGCATATTGTTAAACTTTTTAAGACACGTCTCGGCGCGCCCATCACACCCCGGATACACCTTAATGACTGTGCCGACAGACAGTTTTTGGGTGCCGCCCATAAGCGTGAGTTTGTTATTTTGATGAACGGTCACTGCACGCACCTCGCGCACGCCGTCGTCCGTCCACTCGATGAAACCTGCATTAAACCAACCCTGCGGCAAGTTTTGCGGTAAATCAACAGTGATAGATACACCATCCATCGCGCTTATGGTGAGCCCCGCGACGACAAAATTGCCCGGCTTAACTTTGCAATCCACGTCATACAGTGTATAAGGGCAGTTACGCCCCCAAGTCAGGCGCAATCCTGCGCTATCCATGGTGTCGGACAATGCCGCGGAGGTAAGATTGGTAGTATGTATATCCGGGCGACTTGCCTCCGTAATCGTACCAATCCACACAATACGGATCTCGTTGTCGTCCTCATGCAAGCGCATAATAGTGAGCTTAACAGTTTGGCTAGGCGGAAGCCCTCGATACAGGCGCGCCACGGGGTTGTTGCTTGGCATGCGAAGCGTCACATTGCCATCACCTCCGCCGTCGCGGGCATCACTGATAGCGGACGCTAGCCATTTCTCGCTGTTAATCTCTAAATCCTTGTCCGCATTGCAAAAGCGCCAGATTTTCTCGTTTTCGCCGCGCACAAATTGATATAAATCAATCGGGCGCCCCTCAGAGACGGAATGTGTTTTGCTTAAATAACTCATCTTTAAATATCCTTTAAACCGCCTTTAAAGTGCGGTCGTTTTTATGGATGTTTTTACGGCTCAAGCTCATCGCGGAGCCCGCGGAAGCTCACTGTCACTGTTGCCGCGCCGTCTGCGTCAGTGTGATGCACCCAACTGACTGTGTCGCTCTCCAAGCGGGACAGTGTCAAGTACGAAATCTTAAGAATCTCCGCTTGTTTGATATTGAGCGTGTCGCCGTCAAAGGCGAGCCGCTCTGTTGCAGAGTTAATCACTGCGGATGACACAATACGGCGATAAAAAATCCGCCCGCCGGTGCACTCAATGCGCACGTCTTGGCGTCCTGTTTGCTTTTGCAGTGCGCCGGTATAGTTGATGTAGGCAATATCTAAAGTCTTGCCGACAATATCGCCCACCGGCGTCACATCTGTGCTTGAGGTTGCCACCCAAATCGCACGTTGACGCCCGCGCAAGTGGTAAAACAAATTGCGGAGCTTGCGTTGTTCTTCCCGCCCACTTGCCACAAAGCGGTGGGCGGTGATTTGCATGGCTTTGTTTGCGGTATCCAAGTAATACGGCAAGCCCGTCTCATTATCCAGCGTCTTAATCAGCCGTGCATATTGCGCAGTGACGTCTTCTGACCACTCCGATGTCGGCTCCAACACCGGGTGGTTGCGATAAGTCGGCAAATGGCTCACATCATCACTCCACGCATTATGCTCGTGCAGTTGTAGGCGGATTTGCGCGGTTGACACGTTATCGCTTAAACGGCGTACTTGCGGCATATCCGTAAGCACAGCAGAGCGGAGCGGGTAAACGGCGGTAAAAGTGCGGTCATAATTACCAACGATTGGGCGCTTAACTGTGATTTTACTTGGCTCCAGCGCAGTAATCTCAACCATCTCCTTGTTGCTTCCGGTCATCAAAATTGCGCGCCCACCGACGGCAAAATCATAGCCCACGGTGTTAATAGGTAACTCCACCGCGCCCTGTTGCACAGGCTGTAATAATCTTGCACAATCGGTAAAAATCGGTAGCGACCACACGCGCGAGCCGTAGCCGTAAAGGGCGGATTCAAAGAGTTGGCGCTCGGTGTCACTAAAACTCACTTTAAACTCAAACGTGCGGCGCGGGCTTAAACGACGCGCGATACGTTGTTCGGCGGCAGTGACGGATTGATGCACGCGGGTGAACCACTCGAGATTTTCGGTGACGTCCTCACTCCAATCCGGCATAAACGACCAATCAGTGGAGCGCGAGCCGGTAATGCGTAGCGTAACGGGACTTTTGCCCAAAAAGTTAAACGTGACTACGCAATCAATCTCCGGTGTGCCCTGCATGCCGACTTTAACCGTCCATTTTTTAAGGGCGAGCGCGTTAAACGTGCCGGATGTTGGGCCGACAAGCTCTATGCCCTCACCACCGACGACGGAAACAGATAAAAGTTTTACCGCACTTTTGTTGGCATTCCAAACTTGCACATTAAAAGTCTGGTCAGTGGAGATTGAGCCAAGATTGACGGTGTGCGGGATAACAAAAATACGTTTATATAAATCAGCGTAGTAATTGGGCACAACATGAGCGCGCGTGGATTGCGTCAAATCAATCGTCACGCCAGCTGTCAGTGCACCATGAATGAGCTTCCGCGGGCGCGCCAAAATGCGCTGGTTAGCCCCGCGATGGGTTGTGAGACTATCAAGATAGCCGGTGTCTTTAATCGCGCCCGATTTGCCTGTTTTTGCTTTGTATGCCGTGATATTAGCCATAATTGCTACTCAATAATGCGATATGCCACGCCCTGGATGCCGGAGTTGTTTTTACCCTCCTCGATTGAGTTAGCATTGCGCTCGTCGTATTGTGCGCTCGGGATAATCATCCAACGCTCACCGGCAATCTCTAAAATTTGGCGCGGCTGAATGCCAACCATGGTGCACTCGTAACGGTCCGGCAATATGCCCAAACGGCGAAACACACCGTCAATGCCGTGCGCAATCAAACTGTGCGGGCATGGGATTAACGTCTGACCGAATTTTGATTGACTAAAGTCAACCAGTAATTTATCCGGGTGGTATGTCTTATTGTCGGTGTACATTGATGCTCGCCCAAGCGTCAGCAAATATTTACCGTAGTCTTTTTTATTGATGTCGTTAAAATCATTAATACTCACCGGCGCAAAATACCACGGCGATTTTGTTGCACCGCTAATGCCATCAGCTCTAACAACTGCCTGATTACCGTTTTTACCATTAGCAAAACCATAAATGTGATCTATTTCTTGGTAATGCCCATATCGTCCCTGTATTGATGTGCCGTAAGTATATTGTCCGCCGACATACTCACCCTCTTTATCAGCGTACCAATCCCAAAATGTCTAAATTTATCAGCTTCGACTTGCACAACAATGTGTAAATATTGCTTAGTGCCAAAAAAATCATAAGACACATAATTACCGCTATGCAGTTGAGTGGTTGCGGTCTCAATGGTCGTAAATGAGTTATTTTTTGATGACCCGGGTTGAGCGTCTGCCCCCTTACTTTTGTCAAATCCGGAATTAACATAGCCAAACAGAAAATTACTCTCTGCGGATAACACAAATGACCAATAACCGTCGTCATTATGCAAATAGAGCTCATTGTTTGTTGCTTTATCAATGACCCAATTTTGGGTCTGCGCAAACTCGGTAAGTTTGGTTAATAGCTCGTTTAGTGTTTTTGCGGTGCCTGTTTGATATGCCATGGCTACGCTCCCGTTGTCTCAATCACAAAATAATCCTTGGTTTTAACGCGGAATCCGCCGTTAAACACCACGCCCGAGCGCCCCTCGGCAATTGTTACTTTATCTCCGGCTGCGCGTTGCAACCCTGGAATCCAATAAACGCCATCCAGCGCACCCCCAGCGATTATTTTTTTGACTGGAGACCTTGTAACTTAAAAACTCAACCGGCAAAAGCGGAAAACTCCCACCGGGAGAAGCGCCCATCGTACTTAAAATTTGAGGTTGCATATAACTGCCGTATGAATAGTAATTACACATCGGATACATAAATTGATATGCCGAGTCGGTATTGATGTTTTTGTATGTCTCACCGTAAAAATCGCGCCAAGTCTGGTCAGGGGTAATCAACCAGCAATTGCCATAAAGCGGATTAACGATAGACGAATTAAAATTATCAGACTGTGAATAGCGGATAAAAACACCTCTATTACTATCATCAACTAGCGGTGCACTACCGCGATACAAAGCGGGTATGGGTATTCTGTCGGTGGCACAGTAGGCAAAATAAAGCCTAGATAAGCACTTGAGCACACTTGCGAGATACGGGTCACAATCTTGCAACAGCGACCATCCGCAACAATGTGATACTCAATCGCGCGGTTATCGGCAAACAATGCCACGCCAGGCGACGGGTTAATTAAGCCTTTGTGGATTTGTGTCTCGGTGACAAATTGTGGGTTGTAAAACGTACCACCCCAAAAATTAATATTGTATGTGTCGGCAGAAATCAAATTGGCGGTCGAGGCGCAAATATAAATATCCTGCTCAATCCCTGTACCGGTGGACTTCCAGGCGATTTGACCGGATTTCTTTTGTCGTTGTGGTTGCCGGCAAAGTGCGGTCAAACAACACCGTCCACGCCTGCCCATTGGCAACCAACGTCGGGTCGGTGGTTAAAAACTTATTTAGGATGTCAAGCAAATCGCGCTCGTTTTGCGCGGTGCCGGTTTTGTATGCCATGTGATAACCTCTTAATTTAAAATATCTTTTACGGTTTGTTTGTTGGCGCGGAGCATAGTGATGACTGCCTTAACACCCGCGGTGGTCTTGAGCCCCGCAGTAAATAACTCTGCACTGTCAACTGCCAAGGTTTGCTGGATGTTGACCGGTGATGCTACCACCTGCGTGCCCGTGCGGCCGTCACGCAAAGAATCACTTAATCCAGGCTCACTGTAGCTTGGCACAGGAGGGACAGATACCGGGCCGCCTTGCGAAAATGAGCGGAGTTGTCGGCGGTTGATGGCGTGCATAAAGCCTACGCCATAGTGCGCCACAGAAATCCGCCTTAACCACGAACTCACCATTGGATAGGCGGGCGGGGATTGAATCCGATGTGCTTGTGCCGGGACCGCGGATATAACCCCCTGTTGCGGCCGCAACGGTACCGCTGGAAAATGCACCTGCAATCGCACCCCACCAACCGCTTGTCGCGCTTGCCGCCTGCATGGCGAGCTGTTGCGCGGCAATATTAATCATTGCATTTATGATGGTATTGGCGAGATTTAACACGGCATCACGCAAGGTCATTGTCCCTTTAGCAAGCCCTACAATAGAGGTTTGCAATCCTTCCGTTAAACCCTCTTTAAAGGTCTTCTCAAGGTCATTTCCCGCATTTTTAAGCTCGGCAATCTTGATTTTCATGCCCTCTAGAGAGCTTTTGGCCGCTTCACCTTGCGCGCCAGGCATTTTGGCCAATTTTTCCAATACCGGGATTTGTTTTTCAAGCTCTGCCACAGTTTCGGTGTATAGGGCCTTCAGTTGTTGTTGCCCCTCAAGGTGGCTAATTAAGCCCACCTGCACCTGCGCTTGGATACGTTGCTCTTGCGTGCTTTGGTTTTGATACAAGCGATTGATTTCAGCTTGCACCCCGTCCACCTGCGCCTTGGCTTGCTCCAGTGGTAAGATTTTTTTAATCAGATTAATCCCATCCAC
Protein sequences of DBSCAN-SWA_4 >LR134327|2328349:2337105|2328349_2331136_-|VEF44963.1|DBSCAN-SWA MGGKRGGGSVTVGYRYYWDIQSGLGRGPVDEIVELRVDDKTAYVGKPGELTHSQAIYIDKPNLFGGDNTGGEGGIQGRMEILMGEPDQKPTQMLINLLKGVYNPSLATHASRWLRKYANKNPERNKFFQNGNVEPGNLSQDDIIPGFRGVATTVFSGLISCYNAYPKKHSYRVRRANKGWHGGVVWYPEKAKILLRNNNLKISGLTPEQEKNVREIHAMNPAHILVECATNKSWGGKKDLSDLDLDSYKKAADTLYAEGFGLCIRYNRQTSIKEFIQQIVDHIGAAQYDNIETGKQAIKLIRHDYKVEDLPLFTYDNGILSVLDDDSAATDKQANQIIVKYREPVTNRDDQAIANNIAAVQMHGVISKTVEYKGIPTFDLAARVAQRDLEMIASGLTRLKITFDMRGSELRPGDVIRVNLPERDIVDVVFRVGELKNGNEGEIVATCLQDVFGLPSANYSTQKGESLYVPPDYTAKPIEHAQLFEVPYHVLPLVLTDAELVYVKPTDCFVWGMGAQPTPLSVGYDMLVNVGAGYAQTATGSFTPCIELVGEVSPYQTSIKFRLEGEYSALAGAEALIVDDEIIKIDSVDFKTGTMTVGRGCADTIPQAHKAGVLAWCYLLAAGTDETKYTVGEQIKGKLLTRTAQQTLDESKAQVLTLTTRQRQARPYPPGKVQIDGGYGNTINDKSAFKLTWAHRDRDVQADKLIPHTDDSTVLGKGVSYKVDLLDGDSVVRSIDTTATEFVYPDAKKVDGEQFSQIALYSTQNGLQSLHRYVLKVGGALVLLYKYDYRETWTAGDDLINKYDDNDIPGGKYLMLSSNAEPKSNIYKDYAIPAGKYARFVLDYKIMTYNQRRGKCRVIVQLLNGKNVVQSYDSDLMGDWQTNEWHPQQVADKLPAGVNIIRFKIVPEADIRNNALTFRDITIRVGEE >LR134327|2328349:2337105|2331609_2332419_-|VEF44969.1|DBSCAN-SWA MSYLSKTHSVSEGRPIDLYQFVRGENEKIWRFCNADKDLEINSEKWLASAISDARDGGGDGNVTLRMPSNNPVARLYRGLPPSQTVKLTIMRLHEDDNEIRIVWIGTITEASRPDIHTTNLTSAALSDTMDSAGLRLTWGRNCPYTLYDVDCKVKPGNFVVAGLTISAMDGVSITVDLPQNLPQGWFNAGFIEWTDDGVREVRAVTVHQNNKLTLMGGTQKLSVGTVIKVYPGCDGRAETCLKKFNNMLNYGGAPHMPNKSPYDGSRVF >LR134327|2328349:2337105|2332472_2334164_-|VEF44972.1|DBSCAN-SWA MANITAYKAKTGKSGAIKDTGYLDSLTTHRGANQRILARPRKLIHGALTAGVTIDLTQSTRAHVVPNYYADLYKRIFVIPHTVNLGSISTDQTFNVQVWNANKSAVKLLSVSVVGGEGIELVGPTSGTFNALALKKWTVKVGMQGTPEIDCVVTFNFLGKSPVTLRITGSRSTDWSFMPDWSEDVTENLEWFTRVHQSVTAAEQRIARRLSPRRTFEFKVSFSDTERQLFESALYGYGSRVWSLPIFTDCARLLQPVQQGAVELPINTVGYDFAVGGRAILMTGSNKEMVEITALEPSKITVKRPIVGNYDRTFTAVYPLRSAVLTDMPQVRRLSDNVSTAQIRLQLHEHNAWSDDVSHLPTYRNHPVLEPTSEWSEDVTAQYARLIKTLDNETGLPYYLDTANKAMQITAHRFVASGREEQRKLRNLFYHLRGRQRAIWVATSSTDVTPVGDIVGKTLDIAYINYTGALQKQTGRQDVRIECTGGRIFYRRIVSSAVINSATERLAFDGDTLNIKQAEILKISYLTLSRLESDTVSWVHHTDADGAATVTVSFRGLRDELEP >LR134327|2328349:2337105|2331135_2331342_-|VEF44965.1|DBSCAN-SWA MDKMTITMQDMRRVDFCASGVEAFFVREGLDYADFLAHGIDSDVLLNTGSVFARKCINAAIAARQGDK >LR134327|2328349:2337105|2335938_2336133_-|VEF44978.1|DBSCAN-SWA MAYKTGTAQNERDLLDILNKFLTTDPTLVANGQAWTVLFDRTLPATTTTKEIRSNRLEVHRYRD >LR134327|2328349:2337105|2334169_2334490_-|VEF44974.1|DBSCAN-SWA MYTDNKTYHPDKLLVDFSQSKFGQTLIPCPHSLIAHGIDGVFRRLGILPDRYECTMVGIQPRQILEIAGERWMIIPSAQYDERNANSIEEGKNNSGIQGVAYRIIE >LR134327|2328349:2337105|2336340_2337105_-|VEF44980.1|tail|DBSCAN-SWA MDGINLIKKILPLEQAKAQVDGVQAEINRLYQNQSTQEQRIQAQVQVGLISHLEGQQQLKALYTETVAELEKQIPVLEKLAKMPGAQGEAAKSSLEGMKIKIAELKNAGNDLEKTFKEGLTEGLQTSIVGLAKGTMTLRDAVLNLANTIINAMINIAAQQLAMQAASATSGWWGAIAGAFSSGTVAAATGGYIRGPGTSTSDSIPARLSNGEFVVKADFCGALWRRLYARHQPPTTPLIFARRPGICPSCAKLQ >LR134327|2328349:2337105|2334666_2335134_-|VEF44976.1|DBSCAN-SWA MAYQTGTAKTLNELLTKLTEFAQTQNWVIDKATNNELYLHNDDGYWSFVLSAESNFLFGYVNSGFDKSKGADAQPGSSKNNSFTTIETATTQLHSGNYVSYDFFGTKQYLHIVVQVEADKFRHFGIGTLIKRVSMSADNILTAHQYRDDMGITKK >LR134327|2328349:2337105|2331345_2331597_-|VEF44967.1|DBSCAN-SWA MYESIAWAIVKIVAWAVASYYINQALNNKRGNNNSPDAVNAKDWNFPQIDEGTPQCVFFGDCWTEDWQVLAYGNYRTTEIKKG |
9 | Pseudomonas_phage(100.0%) | tail | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
LR134327.1|VEF41171.1|300085_300319_-|Uncharacterised-protein |
300085_300319_-
Protein sequences of LR134327.1|VEF41171.1|300085_300319_-|Uncharacterised-protein>LR134327.1|VEF41171.1|300085_300319_-|Uncharacterised-protein MTTTTYYFSESSSVNAIAQAEMLKATNLSDAKREASRRQCFQGTALKIGTIYSLNANGLLVDEIASKEDGKKWVDRY |
77 aa aa |
9
gnl|BL_ORD_ID|9 information
|
NA | NA | No | NA | ||||||||
LR134327.1|VEF44951.1|2325910_2326144_-|Uncharacterised-protein |
2325910_2326144_-
Protein sequences of LR134327.1|VEF44951.1|2325910_2326144_-|Uncharacterised-protein>LR134327.1|VEF44951.1|2325910_2326144_-|Uncharacterised-protein MTTTTYYFSESSSVNAIAQAEMLKATNLSDAKREASRRQCFQGTALKIGTIYSLNANGLLVDEIASKEDGKKWVDRY |
77 aa aa |
9
gnl|BL_ORD_ID|9 information
|
NA | NA | No | NA |