Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
CP028842 | Clostridium botulinum strain DFPST0029 chromosome, complete genome | 8 crisprs | DEDDh,csa3,DinG,WYL,cas3,cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7,cas6,casR | 0 | 11 | 6 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_2 | 2305986-2306345 | TypeIII |
III-B
Consensus repeat of CP028842_2
|
5 spacers
spacers of CP028842_2
>2.1|2306016|36|CP028842|CRISPRCasFinder,CRT TTATATGGTATTTAAGGTTATAGATAAATTAACTGG >2.2|2306082|35|CP028842|CRISPRCasFinder,CRT CTTAAATATATAGGTATAGATCAAGACGCTAAAGA >2.3|2306147|36|CP028842|CRISPRCasFinder,CRT TCTTAACCTTTAATTACATTATATATTATAAGTTCA >2.4|2306213|36|CP028842|CRISPRCasFinder,CRT ATTTCATCAAATCCGCATCAATAAATGAGATAAACT >2.5|2306279|37|CP028842|CRISPRCasFinder,CRT TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA |
CRISPR arrays and Neighbor proteins around CP028842_2
The CRISPR arrays of CP028842_2 >merge|CP028842|2|2305986-2306345|CRISPRCasFinder,CRT GTTTAAATACATCCTATGTTAATGTTCAACTTATATGGTATTTAAGGTTATAGATAAATTAACTGGATTTAAATACACCTCATGTTAATGTTCAACCTTAAATATATAGGTATAGATCAAGACGCTAAAGAATTTAAATACATCTCATGTTAATGTTCAACTCTTAACCTTTAATTACATTATATATTATAAGTTCAATTTAAATACATCTTATGTTACTGTTCAACATTTCATCAAATCCGCATCAATAAATGAGATAAACTATTTAAATACATCTCATGTTAATGTTCAACTAAATTATACCTTAATGCTTATCAATATAGTCTTGTAATTTAAATACATCTCATGTTAATGTTCAAC >CP028842|2|2|2305986-2306345|CRISPRCasFinder GTTTAAATACATCCTATGTTAATGTTCAAC TTATATGGTATTTAAGGTTATAGATAAATTAACTGG ATTTAAATACACCTCATGTTAATGTTCAAC CTTAAATATATAGGTATAGATCAAGACGCTAAAGA ATTTAAATACATCTCATGTTAATGTTCAAC TCTTAACCTTTAATTACATTATATATTATAAGTTCA ATTTAAATACATCTTATGTTACTGTTCAAC ATTTCATCAAATCCGCATCAATAAATGAGATAAACT ATTTAAATACATCTCATGTTAATGTTCAAC TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA ATTTAAATACATCTCATGTTAATGTTCAAC >CP028842|2|1|2305986-2306345|CRT GTTTAAATACATCCTATGTTAATGTTCAAC TTATATGGTATTTAAGGTTATAGATAAATTAACTGG ATTTAAATACACCTCATGTTAATGTTCAAC CTTAAATATATAGGTATAGATCAAGACGCTAAAGA ATTTAAATACATCTCATGTTAATGTTCAAC TCTTAACCTTTAATTACATTATATATTATAAGTTCA ATTTAAATACATCTTATGTTACTGTTCAAC ATTTCATCAAATCCGCATCAATAAATGAGATAAACT ATTTAAATACATCTCATGTTAATGTTCAAC TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA ATTTAAATACATCTCATGTTAATGTTCAAC
>CP028842.1|AWB18020.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >CP028842.1|AWB18019.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >CP028842.1|AWB18018.1|2302869_2303604_-|transpeptidase-transglycosylase MDKFRNMKKSHIALLVIMYMVLMGSFPRFTGWATIFSAIAVGGYFLKNKKDLKGLTRKNKNFIFAGIIILAIIGSLNVAVGNNIQNEKLMADKAKQEQEIKQEEQKKVEEKKLAEEQKRVQEEEAKKKAAEEKRKQEEEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKGDSNSQSNESQNADDNQNYTVYKTRTGSKYHSSGCRYLKKSCYETTVSQARNEGLTPCSVCNP >CP028842.1|AWB18017.1|2302127_2302532_-|hypothetical-protein MNILMLTCSIAIPVLMILIGILFKCNSYKKIDRTLDLIIPIATFFTGFSERDREHLYKNTNNLASVNRKCSLIWSISGVCTLLLTIISLILNKSDIYNTSVILLEPELLILVIVFISVEYILKRNFNKKISEQY >CP028842.1|AWB18016.1|2301176_2301893_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTAPLIKKLSEKGYHLNVTAIFTIDQVKEVVGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDVLKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >CP028842.1|AWB18015.1|2300715_2301153_-|PTS-maltose-transporter-subunit-IIBC MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDMVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >CP028842.1|AWB18014.1|2300402_2300687_-|PTS-maltose-transporter-subunit-IIBC MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >CP028842.1|AWB18013.1|2299025_2300390_-|PTS-ascorbate-transporter-subunit-IIC MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE >CP028842.1|AWB18012.1|2296720_2298814_-|sugar-transporter MLNKRCSNILQMIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFVTINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKILKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNGSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTLTEDHKPSLKELLKPDFIKLNEEAENWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISKVKNIKASSEIDSILYS >CP028842.1|AWB18011.1|2296041_2296395_-|zinc-ribbon-domain-containing-protein MIIWGWGKVTKKIIGAVFQRTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK >CP028842.1|AWB18021.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >CP028842.1|AWB18022.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >CP028842.1|AWB18023.1|2308101_2308464_+|peptidase-M24 MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >CP028842.1|AWB18024.1|2308547_2308721_+|metallopeptidase,-family-M24 MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >CP028842.1|AWB18025.1|2308794_2310201_+|MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >CP028842.1|AWB18026.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >CP028842.1|AWB18027.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >CP028842.1|AWB18028.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >CP028842.1|AWB18029.1|2314726_2316724_-|2-enoate-reductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >CP028842.1|AWB18030.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_3 | 2312982-2313277 | TypeIII |
III-B
Consensus repeat of CP028842_3
|
4 spacers
spacers of CP028842_3
>3.1|2313012|36|CP028842|CRISPRCasFinder,CRT TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT >3.2|2313078|36|CP028842|CRISPRCasFinder,CRT ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT >3.3|2313144|38|CP028842|CRISPRCasFinder,CRT TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA >3.4|2313212|35|CP028842|CRISPRCasFinder,CRT GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA >3.5|2313014|36|CP028842|PILER-CR TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT >3.6|2313080|36|CP028842|PILER-CR ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT >3.7|2313146|38|CP028842|PILER-CR TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around CP028842_3
The CRISPR arrays of CP028842_3 >merge|CP028842|3|2312982-2313277|CRISPRCasFinder,CRT,PILER-CR GCTTAAGTACATCTCATGTTAATGTTCAACTGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTTATTTAAATACATCTCATGTTAATGTTCAACATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGTATTTAAATACATCTCATGTTAATGTTCAACTTAAGTATGATAATATAAAACCTTGGTAAATATATTAAATTTAAATACATTTCATGTTAATGTTCAACGAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGAATTTAAATACATCTCATGTTAATGTTCAACC >CP028842|3|3|2312982-2313277|CRISPRCasFinder GCTTAAGTACATCTCATGTTAATGTTCAAC TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT ATTTAAATACATCTCATGTTAATGTTCAAC ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT ATTTAAATACATCTCATGTTAATGTTCAAC TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA ATTTAAATACATTTCATGTTAATGTTCAAC GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA ATTTAAATACATCTCATGTTAATGTTCAACC >CP028842|3|2|2312982-2313276|CRT GCTTAAGTACATCTCATGTTAATGTTCAAC TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT ATTTAAATACATCTCATGTTAATGTTCAAC ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT ATTTAAATACATCTCATGTTAATGTTCAAC TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA ATTTAAATACATTTCATGTTAATGTTCAAC GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA ATTTAAATACATCTCATGTTAATGTTCAAC >CP028842|3|1|2312984-2313211|PILER-CR TTAAGTACATCTCATGTTAATGTTCAACTG AACTTATGAAAGAACTAGAGTGTGGAGAACCCTTAT TTAAATACATCTCATGTTAATGTTCAACAT TAGGTTTGCCACCACATTCCGTTACTGCAGTAGTAT TTAAATACATCTCATGTTAATGTTCAACTT AAGTATGATAATATAAAACCTTGGTAAATATATTAAAT TTAAATACATTTCATGTTAATGTTCAAC
>CP028842.1|AWB18028.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >CP028842.1|AWB18027.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >CP028842.1|AWB18026.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >CP028842.1|AWB18025.1|2308794_2310201_+|MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >CP028842.1|AWB18024.1|2308547_2308721_+|metallopeptidase,-family-M24 MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >CP028842.1|AWB18023.1|2308101_2308464_+|peptidase-M24 MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >CP028842.1|AWB18022.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >CP028842.1|AWB18021.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >CP028842.1|AWB18020.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >CP028842.1|AWB18019.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >CP028842.1|AWB18029.1|2314726_2316724_-|2-enoate-reductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >CP028842.1|AWB18030.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >CP028842.1|AWB18031.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >CP028842.1|AWB18032.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >CP028842.1|AWB18033.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >CP028842.1|AWB18034.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >CP028842.1|AWB18035.1|2319405_2319840_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >CP028842.1|AWB18036.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >CP028842.1|AWB18037.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >CP028842.1|AWB18038.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_4 | 2313557-2313653 | TypeIII |
III-B
Consensus repeat of CP028842_4
|
1 spacers
spacers of CP028842_4
>4.1|2313587|36|CP028842|CRISPRCasFinder ATGTTGTAAATGTTGTGGTATAACAGAATGTAAATA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around CP028842_4
The CRISPR arrays of CP028842_4 >merge|CP028842|4|2313557-2313653|CRISPRCasFinder GCTTAAATACATCTTATGTTATTGTTCAACATGTTGTAAATGTTGTGGTATAACAGAATGTAAATAATTTAAATACATCTCATGTTAATGTTCAACC >CP028842|4|4|2313557-2313653|CRISPRCasFinder GCTTAAATACATCTTATGTTATTGTTCAAC ATGTTGTAAATGTTGTGGTATAACAGAATGTAAATA ATTTAAATACATCTCATGTTAATGTTCAACC
>CP028842.1|AWB18028.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >CP028842.1|AWB18027.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >CP028842.1|AWB18026.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >CP028842.1|AWB18025.1|2308794_2310201_+|MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >CP028842.1|AWB18024.1|2308547_2308721_+|metallopeptidase,-family-M24 MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >CP028842.1|AWB18023.1|2308101_2308464_+|peptidase-M24 MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >CP028842.1|AWB18022.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >CP028842.1|AWB18021.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >CP028842.1|AWB18020.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >CP028842.1|AWB18019.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >CP028842.1|AWB18029.1|2314726_2316724_-|2-enoate-reductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >CP028842.1|AWB18030.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >CP028842.1|AWB18031.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >CP028842.1|AWB18032.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >CP028842.1|AWB18033.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >CP028842.1|AWB18034.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >CP028842.1|AWB18035.1|2319405_2319840_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >CP028842.1|AWB18036.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >CP028842.1|AWB18037.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >CP028842.1|AWB18038.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_5 | 2313770-2314067 | TypeIII |
III-B
Consensus repeat of CP028842_5
|
4 spacers
spacers of CP028842_5
>5.1|2313801|36|CP028842|CRT TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTA >5.2|2313868|35|CP028842|CRT AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAA >5.3|2313934|37|CP028842|CRT ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAA >5.4|2314002|34|CP028842|CRT GATAAAACCAATCTATTAACCTGTATAACTGCCT >5.5|2313801|37|CP028842|CRISPRCasFinder TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTAT >5.6|2313868|36|CP028842|CRISPRCasFinder AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAA >5.7|2313934|38|CP028842|CRISPRCasFinder ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAAT >5.8|2314002|35|CP028842|CRISPRCasFinder GATAAAACCAATCTATTAACCTGTATAACTGCCTT |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around CP028842_5
The CRISPR arrays of CP028842_5 >merge|CP028842|5|2313770-2314067|CRT,CRISPRCasFinder TGCTTAAATACATATCATGTTAAGGTTCAACTGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTATATTTAAATACATTCTATATTACTGTTCAACAAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAAATTTAAATACATCTTATGTTACTGTTCAACACGAATAGGGGGTGATAAATATTGTTATTTGGACAAATATTTAAATACATCCTATGTTACTGTTCAACGATAAAACCAATCTATTAACCTGTATAACTGCCTTATTTAAATACATCCTATGTTACTGTTCAACC >CP028842|5|3|2313770-2314066|CRT TGCTTAAATACATATCATGTTAAGGTTCAAC TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTA TATTTAAATACATTCTATATTACTGTTCAAC AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAA AATTTAAATACATCTTATGTTACTGTTCAAC ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAA TATTTAAATACATCCTATGTTACTGTTCAAC GATAAAACCAATCTATTAACCTGTATAACTGCCT TATTTAAATACATCCTATGTTACTGTTCAAC >CP028842|5|5|2313771-2314067|CRISPRCasFinder GCTTAAATACATATCATGTTAAGGTTCAAC TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTAT ATTTAAATACATTCTATATTACTGTTCAAC AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAA ATTTAAATACATCTTATGTTACTGTTCAAC ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAAT ATTTAAATACATCCTATGTTACTGTTCAAC GATAAAACCAATCTATTAACCTGTATAACTGCCTT ATTTAAATACATCCTATGTTACTGTTCAACC
>CP028842.1|AWB18028.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >CP028842.1|AWB18027.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >CP028842.1|AWB18026.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >CP028842.1|AWB18025.1|2308794_2310201_+|MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >CP028842.1|AWB18024.1|2308547_2308721_+|metallopeptidase,-family-M24 MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >CP028842.1|AWB18023.1|2308101_2308464_+|peptidase-M24 MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >CP028842.1|AWB18022.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >CP028842.1|AWB18021.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >CP028842.1|AWB18020.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >CP028842.1|AWB18019.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >CP028842.1|AWB18029.1|2314726_2316724_-|2-enoate-reductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >CP028842.1|AWB18030.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >CP028842.1|AWB18031.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >CP028842.1|AWB18032.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >CP028842.1|AWB18033.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >CP028842.1|AWB18034.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >CP028842.1|AWB18035.1|2319405_2319840_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >CP028842.1|AWB18036.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >CP028842.1|AWB18037.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >CP028842.1|AWB18038.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_6 | 2314341-2314436 | TypeIII |
III-B
Consensus repeat of CP028842_6
|
1 spacers
spacers of CP028842_6
>6.1|2314371|36|CP028842|CRISPRCasFinder AGGTGGAGTATTAGAAGATATGCATCTATATAAAGA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around CP028842_6
The CRISPR arrays of CP028842_6 >merge|CP028842|6|2314341-2314436|CRISPRCasFinder GCTTAAATACATCTCATGTTAATGTTCAACAGGTGGAGTATTAGAAGATATGCATCTATATAAAGAATTTAAATACATCCTATGTTATTGTTCAAT >CP028842|6|6|2314341-2314436|CRISPRCasFinder GCTTAAATACATCTCATGTTAATGTTCAAC AGGTGGAGTATTAGAAGATATGCATCTATATAAAGA ATTTAAATACATCCTATGTTATTGTTCAAT
>CP028842.1|AWB18028.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >CP028842.1|AWB18027.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >CP028842.1|AWB18026.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >CP028842.1|AWB18025.1|2308794_2310201_+|MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >CP028842.1|AWB18024.1|2308547_2308721_+|metallopeptidase,-family-M24 MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >CP028842.1|AWB18023.1|2308101_2308464_+|peptidase-M24 MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >CP028842.1|AWB18022.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >CP028842.1|AWB18021.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >CP028842.1|AWB18020.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >CP028842.1|AWB18019.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >CP028842.1|AWB18029.1|2314726_2316724_-|2-enoate-reductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >CP028842.1|AWB18030.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >CP028842.1|AWB18031.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >CP028842.1|AWB18032.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >CP028842.1|AWB18033.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >CP028842.1|AWB18034.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >CP028842.1|AWB18035.1|2319405_2319840_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >CP028842.1|AWB18036.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >CP028842.1|AWB18037.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >CP028842.1|AWB18038.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_7 | 2327923-2328081 | TypeIII |
III-B
Consensus repeat of CP028842_7
|
2 spacers
spacers of CP028842_7
>7.1|2327953|35|CP028842|CRISPRCasFinder GGTTACTGGCTTTCTAATACATATAATTAAATTAG >7.2|2328018|33|CP028842|CRISPRCasFinder CTATATAAAAGCCATTGGGAATTTTGTTTATAC |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around CP028842_7
The CRISPR arrays of CP028842_7 >merge|CP028842|7|2327923-2328081|CRISPRCasFinder ATTTAAATACATCTCATGTTAATGTTCAACGGTTACTGGCTTTCTAATACATATAATTAAATTAGATTTAAATACATCTCATGTTAATGTTCAACCTATATAAAAGCCATTGGGAATTTTGTTTATACATTTAAATACATCTCATGTTAATGTTCAACC >CP028842|7|7|2327923-2328081|CRISPRCasFinder ATTTAAATACATCTCATGTTAATGTTCAAC GGTTACTGGCTTTCTAATACATATAATTAAATTAG ATTTAAATACATCTCATGTTAATGTTCAAC CTATATAAAAGCCATTGGGAATTTTGTTTATAC ATTTAAATACATCTCATGTTAATGTTCAACC
>CP028842.1|AWB18042.1|2326996_2327686_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >CP028842.1|AWB18041.1|2326602_2326977_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >CP028842.1|AWB18040.1|2324847_2326551_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >CP028842.1|AWB18039.1|2323647_2324835_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >CP028842.1|AWB18038.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >CP028842.1|AWB18037.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >CP028842.1|AWB18036.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >CP028842.1|AWB18035.1|2319405_2319840_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >CP028842.1|AWB18034.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >CP028842.1|AWB18033.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >CP028842.1|AWB18043.1|2328478_2328652_+|hypothetical-protein MVLDMLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >CP028842.1|AWB18044.1|2329424_2331080_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >CP028842.1|AWB18045.1|2331856_2332705_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >CP028842.1|AWB18046.1|2332995_2333916_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >CP028842.1|AWB18047.1|2334239_2335733_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >CP028842.1|AWB18048.1|2336657_2337113_+|hypothetical-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >CP028842.1|AWB18049.1|2337192_2337660_-|XRE-family-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >CP028842.1|AWB18050.1|2337827_2338874_-|alpha/beta-hydrolase MEVNGVKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >CP028842.1|AWB18051.1|2339124_2340477_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >CP028842.1|AWB18052.1|2340685_2342029_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_8 | 2328985-2329214 | TypeIII |
III-B
Consensus repeat of CP028842_8
|
3 spacers
spacers of CP028842_8
>8.1|2329015|36|CP028842|CRISPRCasFinder AATAGAGTATTCAGATGAATATAAATTCTTGGAAGA >8.2|2329081|37|CP028842|CRISPRCasFinder TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAA >8.3|2329148|36|CP028842|CRISPRCasFinder CGACCCTATAACAGTTTCAGAAGTAGAACAAAATAT >8.4|2329015|37|CP028842|CRT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGAA >8.5|2329081|38|CP028842|CRT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAG >8.6|2329148|37|CP028842|CRT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATATG >8.7|2329083|36|CP028842|PILER-CR AGAGGTGATTTTATATGAAAAAGGAAAACATAACAA >8.8|2329150|35|CP028842|PILER-CR GACCCTATAACAGTTTCAGAAGTAGAACAAAATAT |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around CP028842_8
The CRISPR arrays of CP028842_8 >merge|CP028842|8|2328985-2329214|CRISPRCasFinder,CRT,PILER-CR TTTTCAATACATTTAATGTTAATGTTCAATAATAGAGTATTCAGATGAATATAAATTCTTGGAAGAATTTAAATACATCTCATGTTAATGTTCAATTAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAGTTTAAATACATCTCATGTTAATGTTCAATCGACCCTATAACAGTTTCAGAAGTAGAACAAAATATGTTTAAATACATCTCATGTTAATGTTCAATC >CP028842|8|8|2328985-2329213|CRISPRCasFinder TTTTCAATACATTTAATGTTAATGTTCAAT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGA ATTTAAATACATCTCATGTTAATGTTCAAT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAA GTTTAAATACATCTCATGTTAATGTTCAAT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATAT GTTTAAATACATCTCATGTTAATGTTCAAT >CP028842|8|4|2328986-2329213|CRT TTTCAATACATTTAATGTTAATGTTCAAT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGAA TTTAAATACATCTCATGTTAATGTTCAAT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAG TTTAAATACATCTCATGTTAATGTTCAAT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATATG TTTAAATACATCTCATGTTAATGTTCAAT >CP028842|8|2|2329052-2329214|PILER-CR TTTAAATACATCTCATGTTAATGTTCAATTA GAGGTGATTTTATATGAAAAAGGAAAACATAACAAG TTTAAATACATCTCATGTTAATGTTCAATCG ACCCTATAACAGTTTCAGAAGTAGAACAAAATATG TTTAAATACATCTCATGTTAATGTTCAATC
>CP028842.1|AWB18043.1|2328478_2328652_+|hypothetical-protein MVLDMLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >CP028842.1|AWB18042.1|2326996_2327686_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >CP028842.1|AWB18041.1|2326602_2326977_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >CP028842.1|AWB18040.1|2324847_2326551_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >CP028842.1|AWB18039.1|2323647_2324835_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >CP028842.1|AWB18038.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >CP028842.1|AWB18037.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >CP028842.1|AWB18036.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >CP028842.1|AWB18035.1|2319405_2319840_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >CP028842.1|AWB18034.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >CP028842.1|AWB18044.1|2329424_2331080_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >CP028842.1|AWB18045.1|2331856_2332705_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >CP028842.1|AWB18046.1|2332995_2333916_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >CP028842.1|AWB18047.1|2334239_2335733_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >CP028842.1|AWB18048.1|2336657_2337113_+|hypothetical-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >CP028842.1|AWB18049.1|2337192_2337660_-|XRE-family-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >CP028842.1|AWB18050.1|2337827_2338874_-|alpha/beta-hydrolase MEVNGVKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >CP028842.1|AWB18051.1|2339124_2340477_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >CP028842.1|AWB18052.1|2340685_2342029_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV >CP028842.1|AWB18053.1|2342464_2343364_+|hypothetical-protein MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CP028842_9 | 2331432-2331592 | TypeIII |
III-B
Consensus repeat of CP028842_9
|
2 spacers
spacers of CP028842_9
>9.1|2331462|36|CP028842|CRISPRCasFinder ACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATA >9.2|2331528|35|CP028842|CRISPRCasFinder TTTAATATTTTTTCTATATCCATAGGCTTAAAATC |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11 |
CRISPR arrays and Neighbor proteins around CP028842_9
The CRISPR arrays of CP028842_9 >merge|CP028842|9|2331432-2331592|CRISPRCasFinder GCTTAAATACATCTTATGTTACTGTTCAACACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATAATTTAAATACATCCTATGTTAATGTTCAACTTTAATATTTTTTCTATATCCATAGGCTTAAAATCATTTAAATACATCCTATGTTAATGTTCAAC >CP028842|9|9|2331432-2331592|CRISPRCasFinder GCTTAAATACATCTTATGTTACTGTTCAAC ACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATA ATTTAAATACATCCTATGTTAATGTTCAAC TTTAATATTTTTTCTATATCCATAGGCTTAAAATC ATTTAAATACATCCTATGTTAATGTTCAAC
>CP028842.1|AWB18044.1|2329424_2331080_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >CP028842.1|AWB18043.1|2328478_2328652_+|hypothetical-protein MVLDMLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >CP028842.1|AWB18042.1|2326996_2327686_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >CP028842.1|AWB18041.1|2326602_2326977_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >CP028842.1|AWB18040.1|2324847_2326551_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >CP028842.1|AWB18039.1|2323647_2324835_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >CP028842.1|AWB18038.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >CP028842.1|AWB18037.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >CP028842.1|AWB18036.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >CP028842.1|AWB18035.1|2319405_2319840_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >CP028842.1|AWB18045.1|2331856_2332705_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >CP028842.1|AWB18046.1|2332995_2333916_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >CP028842.1|AWB18047.1|2334239_2335733_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >CP028842.1|AWB18048.1|2336657_2337113_+|hypothetical-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >CP028842.1|AWB18049.1|2337192_2337660_-|XRE-family-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >CP028842.1|AWB18050.1|2337827_2338874_-|alpha/beta-hydrolase MEVNGVKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >CP028842.1|AWB18051.1|2339124_2340477_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >CP028842.1|AWB18052.1|2340685_2342029_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV >CP028842.1|AWB18053.1|2342464_2343364_+|hypothetical-protein MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR >CP028842.1|AWB18054.1|2343704_2345024_+|APC-family-permease MLEKKYGLWTTVSMVIGIVIGSGVFFKADNILMASGGNVKTALLAWLVGAISMIFGALVFAECANRFERSNGIVDYAEGMLSEKFAYLIGWFNGIIYYPAIAAVLAWAAGNYTAILFNKDGNFVWIMAAIYMIGIYILNYISPILSGKFQIASTAIKLVPLMLIAILGTFQGLNNGILIENFSKVSTIGDSGSGFAAAVLGAAFAYEGWIIATTINGEIKDAKNTLPKALVFGSLVIVIIYILYFLGIVGMIPTETILKQGDNTVNVAARTVFGNFGASILTTFIIVSCLGTLNGLILGGSRSFYSLAIRGQGIKPEAFSKLDSKTNIPTNSTIANFILICIYLVVWYMNFKGLFPNKMFVDISELPIALIYGIYIIIYIAYMMKMKDLSFIKRFVIPSLALMGALIVVYGGLSKPSVIIDLGISVFVFLSGLLFYNKK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
CP028842_2 | 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NC_012654 | Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence | 174503-174538 | 0 | 1.0 |
CP028842_2 | 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NZ_CP006909 | Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence | 62802-62837 | 0 | 1.0 |
CP028842_2 | 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NZ_CP031095 | Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence | 207645-207680 | 0 | 1.0 |
CP028842_4 | 4.1|2313587|36|CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP014152 | Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence | 149447-149482 | 0 | 1.0 |
CP028842_4 | 4.1|2313587|36|CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP013684 | Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence | 128281-128316 | 0 | 1.0 |
CP028842_4 | 4.1|2313587|36|CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP013710 | Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence | 129903-129938 | 0 | 1.0 |
CP028842_4 | 4.1|2313587|36|CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 80344-80379 | 0 | 1.0 |
CP028842_4 | 4.1|2313587|36|CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 37712-37747 | 0 | 1.0 |
CP028842_2 | 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 219276-219311 | 1 | 0.972 |
CP028842_4 | 4.1|2313587|36|CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP013700 | Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence | 47769-47804 | 2 | 0.944 |
CP028842_8 | 8.1|2329015|36|CP028842|CRISPRCasFinder | 2329015-2329050 | 36 | GU949551 | Clostridium phage phiCD6356, complete genome | 4906-4941 | 2 | 0.944 |
CP028842_2 | 2.2|2306082|35|CP028842|CRISPRCasFinder,CRT | 2306082-2306116 | 35 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 30926-30960 | 3 | 0.914 |
CP028842_2 | 2.2|2306082|35|CP028842|CRISPRCasFinder,CRT | 2306082-2306116 | 35 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 163878-163912 | 3 | 0.914 |
CP028842_8 | 8.4|2329015|37|CP028842|CRT | 2329015-2329051 | 37 | GU949551 | Clostridium phage phiCD6356, complete genome | 4906-4942 | 3 | 0.919 |
CP028842_8 | 8.8|2329150|35|CP028842|PILER-CR | 2329150-2329184 | 35 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17536-17570 | 4 | 0.886 |
CP028842_8 | 8.3|2329148|36|CP028842|CRISPRCasFinder | 2329148-2329183 | 36 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17535-17570 | 5 | 0.861 |
CP028842_8 | 8.6|2329148|37|CP028842|CRT | 2329148-2329184 | 37 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17535-17571 | 6 | 0.838 |
CP028842_8 | 8.8|2329150|35|CP028842|PILER-CR | 2329150-2329184 | 35 | MN693403 | Marine virus AFVG_25M412, complete genome | 14464-14498 | 6 | 0.829 |
CP028842_9 | 9.2|2331528|35|CP028842|CRISPRCasFinder | 2331528-2331562 | 35 | MN694042 | Marine virus AFVG_250M538, complete genome | 50649-50683 | 7 | 0.8 |
CP028842_2 | 2.3|2306147|36|CP028842|CRISPRCasFinder,CRT | 2306147-2306182 | 36 | MT795651 | Vibrio phage vB_VnaS-AQKL99, complete genome | 5039-5074 | 8 | 0.778 |
CP028842_9 | 9.2|2331528|35|CP028842|CRISPRCasFinder | 2331528-2331562 | 35 | NZ_CP054613 | Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence | 1277029-1277063 | 8 | 0.771 |
CP028842_8 | 8.3|2329148|36|CP028842|CRISPRCasFinder | 2329148-2329183 | 36 | MN693403 | Marine virus AFVG_25M412, complete genome | 14464-14499 | 10 | 0.722 |
CP028842_1 | 1.2|1901636|40|CP028842|CRISPRCasFinder | 1901636-1901675 | 40 | NC_018689 | Bacillus thuringiensis MC28 plasmid pMC429, complete sequence | 417214-417253 | 11 | 0.725 |
CP028842_8 | 8.6|2329148|37|CP028842|CRT | 2329148-2329184 | 37 | MN693403 | Marine virus AFVG_25M412, complete genome | 14463-14499 | 11 | 0.703 |
1. spacer 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
2. spacer 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
3. spacer 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
4. spacer 4.1|2313587|36|CP028842|CRISPRCasFinder matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
5. spacer 4.1|2313587|36|CP028842|CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
6. spacer 4.1|2313587|36|CP028842|CRISPRCasFinder matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
7. spacer 4.1|2313587|36|CP028842|CRISPRCasFinder matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
8. spacer 4.1|2313587|36|CP028842|CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
9. spacer 2.4|2306213|36|CP028842|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 1, identity: 0.972
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagattaact Protospacer ******************************* ****
10. spacer 4.1|2313587|36|CP028842|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 2, identity: 0.944
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaagtgttgtagtataacagaatgtaaata Protospacer *********.******.*******************
11. spacer 8.1|2329015|36|CP028842|CRISPRCasFinder matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 2, identity: 0.944
aatagagtattcagatgaatataaattcttggaaga CRISPR spacer aatagagtattcagatgaatataagttcttagaaga Protospacer ************************.*****.*****
12. spacer 2.2|2306082|35|CP028842|CRISPRCasFinder,CRT matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.914
cttaaatatataggtatagatcaagacgctaaaga CRISPR spacer ttgaaatatataggcatagatcaagacgctaaaga Protospacer .* ***********.********************
13. spacer 2.2|2306082|35|CP028842|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 3, identity: 0.914
cttaaatatataggtatagatcaagacgctaaaga CRISPR spacer ttgaaatatataggcatagatcaagacgctaaaga Protospacer .* ***********.********************
14. spacer 8.4|2329015|37|CP028842|CRT matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 3, identity: 0.919
aatagagtattcagatgaatataaattcttggaagaa CRISPR spacer aatagagtattcagatgaatataagttcttagaagat Protospacer ************************.*****.*****
15. spacer 8.8|2329150|35|CP028842|PILER-CR matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 4, identity: 0.886
gaccctataacagtttcagaagtagaacaaaatat CRISPR spacer aaatctataacagtttcagaagtagaaaaaaatat Protospacer .* .*********************** *******
16. spacer 8.3|2329148|36|CP028842|CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 5, identity: 0.861
cgaccctataacagtttcagaagtagaacaaaatat CRISPR spacer taaatctataacagtttcagaagtagaaaaaaatat Protospacer ..* .*********************** *******
17. spacer 8.6|2329148|37|CP028842|CRT matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 6, identity: 0.838
cgaccctataacagtttcagaagtagaacaaaatatg CRISPR spacer taaatctataacagtttcagaagtagaaaaaaatata Protospacer ..* .*********************** *******.
18. spacer 8.8|2329150|35|CP028842|PILER-CR matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 6, identity: 0.829
gacccta-taacagtttcagaagtagaacaaaatat CRISPR spacer -acagtactaacagcttcagaagtagcacaaaattt Protospacer ** ** ******.*********** ******* *
19. spacer 9.2|2331528|35|CP028842|CRISPRCasFinder matches to MN694042 (Marine virus AFVG_250M538, complete genome) position: , mismatch: 7, identity: 0.8
tttaatattttttctatatccataggcttaaaatc CRISPR spacer tttaatatttcttctttatccatagtgtttataac Protospacer **********.**** ********* ** * * *
20. spacer 2.3|2306147|36|CP028842|CRISPRCasFinder,CRT matches to MT795651 (Vibrio phage vB_VnaS-AQKL99, complete genome) position: , mismatch: 8, identity: 0.778
tcttaacctttaattacattatatattataagttca CRISPR spacer gcttaacctttaaatacattatacattaccaaccca Protospacer ************ *********.****. *...**
21. spacer 9.2|2331528|35|CP028842|CRISPRCasFinder matches to NZ_CP054613 (Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence) position: , mismatch: 8, identity: 0.771
tttaatattttttctatatccataggcttaaaatc-- CRISPR spacer agtaatattttttctatattcataggc--agcttccg Protospacer *****************.******* *. **
22. spacer 8.3|2329148|36|CP028842|CRISPRCasFinder matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 10, identity: 0.722
cgaccctataacagtttcagaagtagaacaaaatat CRISPR spacer cacagtactaacagcttcagaagtagcacaaaattt Protospacer *. . ******.*********** ******* *
23. spacer 1.2|1901636|40|CP028842|CRISPRCasFinder matches to NC_018689 (Bacillus thuringiensis MC28 plasmid pMC429, complete sequence) position: , mismatch: 11, identity: 0.725
tatttaaaggatttaaactta---catcatttagatctaagag CRISPR spacer tatttaaaggatttaaacttagttcattacataggttatc--- Protospacer ********************* ***.*. ***.*.
24. spacer 8.6|2329148|37|CP028842|CRT matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 11, identity: 0.703
cgaccctataacagtttcagaagtagaacaaaatatg CRISPR spacer cacagtactaacagcttcagaagtagcacaaaatttt Protospacer *. . ******.*********** ******* *
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
575757 : 585171
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >CP028842|575757:585171|DBSCAN-SWA CATGATTATAAAAAAGAAATTGCTTTTAAAAGGCTTACATTGTGCCAATTGTGCAACAAAAATAGAACGAGCCGTGCAAAAGCTAAATATAATAGAGGAAGCTAACTATAATTTTAATAATTCAACTTTAATTATTAACTTAGAAGAAACTCATAAAGATAGCATTATAAAAACAATACAAGAAATAGTAGATAGAATAGAACCCGGGGTAAAGGTAGTAGATAAAGAAAATTTAAAAAGAACGGTAGTGCATGCCCCTGTTAAAAATAGTAGTAATTTAAAGATGCAGAATAATAAAGAGGAAAATTTAAAATTAGATAAAAAAGAAAATAGTTATGAGCATAATCATGATCATAGTCATGGACACAGTCATGATGGAGAAGATAGTGACGAGTTAGAAAAGAAGACTCTTATAAGAATTATTTCAGGAGTGGTTTTATTAATTTTAGCTACCGTATTGAAATCTAAAGAAACTTTGTCTATAGGTCTATATTTAACTTCATATGTATTAATTGGAGGTAAGGTAATATTAAGTTCTATAAGAAATATATCTAAAGGACAAGTATTTGATGAAAACTTTTTAATGGCTGTTGCAACTGTAGCGGCTATAGGAGTAAAACAGTATCCAGAAGCAGTAGCGGTTATGCTATTTTATGAAGTAGGGGAGTTCTTACAAGATAAAGCTGTTAATAAATCTAGAAAATCTATAACAGCACTTATGAATATAAGACCTGACTATGCCAATTTAGTTAGAGGTGAAGATATAGAAGTAGTTTCTCCAGAAGATATTAATATAGATGATATTATAATGGTAAAACCAGGAGAAAAAATTCCTCTAGATGGTATAGTTGTAGAAGGACAATCTTTTGTAGATACATCAGCTATAACAGGTGAATCTTTAATAAGTGAAGTTTCAAAAGATAGTAATGTATTAAGTGGATATATAAACAAAAATGGTGTTATAAAAATAAAAGTTACAAAAACCTTTGGAGAATCTACAGTGTCCAAAATATTGGAATTAACAGAAAACGCATCAGCTACTAAGGCAAATACAGAAAAATTTATAACAAAGTTCGCCAGATATTATACTCCTGTAGTTGTTTTTGCTGCTTTAGCTTTAGCAGTAATTCCTACACTAATACTAAAAGATCCAGATATATCTAAATGGATTTATAGAGCAGCTGTATTTTTAGTAGTATCTTGTCCATGTGCTTTAGTAATATCAATACCTTTAAGCTTCTTTGCTGGTATTGGAGGGGCATCTAAAAAAGGTGTTTTAATAAAAGCAGGAACAGCATTAGAAGCTCTAAATGATGCAGATACAATAGTATTTGATAAAACAGGAACTTTAACTAAAGGTGTGTTTAAAGTATCAAAAATTGATTCAGAAGAAGGAGTAAATACAGAAGAATTAATAGAATATGCTGCTTATGTAGAAAGTTATTCTAATCACCCTATCGCAAAATCTATACTAAAGTATTATGAAAAAACCATAGATAATAAAAGAATAGAAGGTTATGAAGAAATAGTTGCAAGAGGTGTAACTGCTTATATTGATGGCAAAAAAGTTTATGCTGGTAACAATAAATTAATGGAAGAATTAAATATTAACTATAAAAAAGCTCAAGAGGATGGAGTAATCCTTTATATAGCATTAGAAGATAAGTATATAGGTTATATAGTTATAAACGACGAAATAAAGAAAGATTCAAAAGAAACAATAAAATCATTAAAAGATATAGGTATAAAAAAAGCAGCTATGCTTACAGGAGATAGAAAATCTACAGCTAATAATATAGGGACTTTTCTAGGAATGGATGAAATATACTCAGAACTTTTACCACAGGAAAAGGTAGAAAAGATGCAATCCTTAAAGTCCAAAACATCTAAAGATGGGAAAATTGTTTTTGTAGGGGATGGAGTAAATGATGCTCCAGTATTAGCTATGTCAGATATAGGGGTATCCATGGGAGGCTTAGGATCTGATGCAGCCATAGAAGCATCTGATTTAGTTTTAATGTCTGATGAACCATCAAAATTAGTAGATGCCATAAAAATAGCTAGAAAAACTCATAAAATAGTATGGCAAAATATAATTATAGTTTTAATAATCAAGTTTGCAGTATTAGCTCTAGCTGTAATGGGAAAAAGTACTATGTGGATGGCTGTTTTTGCCGATGTAGGTGTGGCTTTAATAGCAGTAATAAATGCATTAAGAATACTAAAATAAGAATTTACTAAAATAATAACTTTCTAAAGAAGGATAGGAACGAATAATTTTAAAGAAAAATATTTAATTATATTTATATAGTTTTAGTTAAGTAGTTTTAGGTTCAGATGGAGTTTGCTTAGAATAATTATTTTTCTCCATCTGAACATTATTATTTATCAGAGAGTAATAAATATAGAAGATTAATTTTTATGAAAGTATAAAAAATTATCAAATTGTATAAACAAAGTATACTTATGAGAAATTATAAGATGAGTATTAGGTACTTCTATATATTCTTCAATAAATGTTATGTAAAAATAAAAGATTTAATAATTTAATAAAAAAATTAAAAACAAAAGAAAATATTTCTAAAAAATATTGACTTAAAATTTAGGCTGTAATATAATTATATATGTTCAAAGAAAATAAATAATTGAGGCTTCTTGGTCAAGCGGTTAAGACGCCACCCTCTCACGGTGGAATCAGGGGTTCGACTCCCCTAGGAGCTACCAGATTTGAAGAAATGCTGTAAACAGTGATGTTTACAGCATTTCTTATTTAGAAGTGAAAATGGAAAATTAATATTTTCCCACACTAGAAAAATACAAATATAAACTTCCTTTCTAATCAAATTTCCATTGGCATCCCCCAATAATTTAAATAGTTTGTTAAAGGCTAAAGAAAAAGCTTTACCAAAAGGATTTAATGAAGCTAGATTTTTACAAAATTGCATGACAGTATTAAAAGATATTAAAAATATAGAAAAATGTAATGAAGTGAGTGTAGTAAGAACAATGCTTAAAGGAGTATTTCTAGGTTTAGACTTCTTTAATAAGGAATGTTATGCAATACCAGTTTATTTAAATCTTTTTTAGAAGAATATAATGGATGTGAAGCTAGGATGATGGCAGTATTAAATGTATCCATGAAAATATAAAGAGTTAAAAAAGTATGAAAGGTGAATTAGAGTTTATTAGATGTGGTAAATATGATTATTGCAAGATTACTAAAGAATTAAAAGAAATTATACACTATAAAAAATTATAAGAGGGGTAATAAAGTGGCAGGTACAACCTCATATATAGATAAAGAAACAAAAGTAAATATTTAAGAGGATGATGATTTTTTTGTTAAAATTCACAAGTTATTTGATGAATATGCTTTAAGTATTATTGGAAGAAGAGAAGTTCCTCAAAAAGTATATGATGTTCTACCAAGTAATTTATCTGATTGTCCAATCTATAGTGAACTAGAAGAACAGTTAATAAATAAAGAGTTGCTTTTATAAGAAGCATAAAGTCAAATTGAATGTTTAAAAGATATAATAGATTTTTTAAAAAGATAACACTACCGTAGTAGAAATTAATATGGCAAGATAAGTGAAAGCCTGGATAAGTTTATATAGAAGTATACAAGAGCATTGGTTATAGCAAGAGAAGCTTTTTTCAAAAAGACAGGCATGACTGAACATTATTTTCTTAGAGAATGAATTGATAATTGGTGCAAGAGGTAGCTTCATAACATCACCAAAAAAGTTGATCCAAAAATGGGGATGGGGTTATAAAAAGACCAGAAGATTTTTAAAAAGAAGCGTTATGTAATACTATATTTGGATTAAAAGATTTAAAATAGGTAATACTACATTTACATTAAAAGACTTAAAACAAGTGGTATAGGAACTAGTACAAGCGGAAGAAGTTATAGAGAAATTAAAATAAATTACAGGATTTATATCCCTGATGATAAGGAGGAAATATGACACCGATAGAAATAATGGAAAAGATAGGGGCATGTCAACGGGGGCTGACGAAAGGGAATATAGAATTAAAAGCTTTAGGAGTGAAGAAGGCTAGAGCAGAACATGACTATAGGATAGCTCTAAGAAAAGAGATTTTAAGATTAAGACAGTTAGAGAATCAGCCAGCAACAATAATAAATGACTTAGCTAAAGGAAAAGAAGATATTGCAAAATTAAGACTTGAAAGGGATATAGCAGAAACTAATTACAGTGTATATATAGAAAGTATGAGGAATTTAAGATTAGAGATTGAGGCGTATAGAAGTTTTCTCACATGGGAACGTGTAGAACTTAAAAATACGTAATGTTAAAATTATGATGAACTAAAGAGAGGTAAAGAAGACCTCTTCTTTTCTGATGTAAATTATTATTGATTGCTTAACTCTGATTTTATTTAATTTATCTGCTATTGTTTCATGTGCACCAATAAGATGAGGAAGATTTTGTAATTCTAGTGAGTTTAAATTTGACATAAAATCACCTCTTTAATAATTAGTTCAATAATATTATTGGAAAGAGAATTAAAAATTATACAGTGATGTTTAATACTTAAATATAAAGTTGAGTGAGCTCATGGCAAAATTCAAATATTGAACTAAGATAAAAGATAAGCTTGTATTAGCTGAAGAAAGGGCAAGAAATGAAGTAAGTAATGGACAAATAACAAAGAATCTAGGGATAGATAAGGGTATATTTTATAAATATAAAAAGCAAGTATATAGGATTTTTTATATCTTAGAAAGGGGGAAGGAGATAATGATGATAGATTTTGGAATTAAAGATTCATTTTTAAAAAGAACATTAGAATATAAGTATAAGGAAGTAACCAAGGAATTAGTATAAGATCATAGGACTAAATTGTATACATATATAATAACTTTGATCATTATTAAATATGTATAATAAATAATAAATATATCAGTAACATAATGTTGTTTGTGAACATATTATATTAAGTAATATAGATTAGAAATATTTTGGAGGGTAACTTTGAAGATTAGTAATATTAAAGAAATAACATTATTTGAGCATCATTTTTGGTTACAGATTTTAGGAGATCATTCTAGATTTATTTTAAACTCACTCTCACCAAAAGAAAAATCTTTTATTGAAGAAGCAAACAGATTTAAAAATTTATTTGATAATTTATTAAAGAAATCAAAACAATCACTTTCAGAAGAAGAGCTTTTCGCTTTAAATAATCATGCCTATAATGCAGCTATGAAAATTAGAGAGTTTAAGCTAGATATAATTGATAGGCAGATTACAGATAAAATTGTCATTTCATTGCCACCTACATTTATTAATCATATGGTTAACGAAGTTGATGAATATATATTTATATTAACTAAATTAATGAAAGGAAATGTATCTAATATAGGACCTATTCATCTCCATCTTTTATGGCTTCCAGATGGAGCAGGTCATGCATCCAATATAGCTAGTAGTCTTGATATAACGGAGAAAGAATTGATTAAAAAGAGTAATCAATATTCTAAAAAATTTAATAATTTATACTTAAGGACTATAGAGTACAATGGTTATACAAGAACTGGTATTTGTGATTTCCCAGCACTTGATAGTCTAAATAATAATGCTGACGAAACAATGAGTTGTTTTAAAGAATTTTTAAATGAATTAAAGAAAGGTGTCATAGAAAAGAAAATACTTGGAACTATTGTACCACTAGTACCCGATCATATGTTTAGAGAAGAATGTTACTATTTAACTAAGCTTTCAATGGTTTCAAACATAAAAAAACCCGAATGTGATCCTACAAAATCAAGAGTAGAGAGCTAAATTTAACAAAGCAAAAGAGTCATATTTTATTATCTAAGGTTCTTTTGGTATGATTTTATTATATAGATTGATGTAGTATATTAGTTTATTTTTATTATACCAAGGTATAATAATCCTAATCATAAAGTTATCAACAATATGCATAATAAAAGGGTGACAATTACAATATTGTCACCTGAATTTTTCCTACACCAGTTTGAAATTATCATGATTTGATGAAAAATCCTATAAATTTCAAACTTAGTAATATCAATGAATAGAAGTATTTATAAATTTTATAAAGACAAATTAAAAGGGAGCTATTCAAAAAGCTACAATTTAGTAATATAAATGACTGTAGCTTTTTATTATGTTTTTTATATAGAATTTTTAATATAAATTATTAATAAGGCTTGCTTAGTTGAAAATTAGAAATTGAGTTTTAAATATTTATAATCCTATTACATTCATTTGCAATATTTTTATCATAGGTTACTATTACAATTGTTTTTCCTTTTTTATTTAAAAGTTTTAATAGACCTATTATTTTATAGGAATTTTCTTCGTCCAGTGAGCCAGTAGGTTCATCTGCTAATATTGTTATTAGGAAGGATTAGAAAAAATATTGACAGGTCTTAAGAGGTGATGTATAGTTTTATTAAGCGGTATAATTTACTACTTAATAAAACTATTTTTACTATTTATTATTATATTATATAGGGGACATTCTTATTTACGCCTCTTTATTTTATTTTTATTTAAAAGGATTTCTATTGATATATAGAGGTCCTTTTTTATTTAAAAGATTTTTGTTAATATAAAAATTTTTTTATTTCAAATCATATATATAACAAATTAAATAATTTAGAAAATATAATATTAAAAGTCTATAAATATTTTTAATTTAATAAAATAGAGAATTTAATAAAGTTATAACTTTATCTGAATATAATAATATAAAGAGAGGAGGAGTAGACTTGAAACTAACTTATGTATTAGATACTAATGTTATTTTGTATTCACCAGGAGCTATATTTTCTTTTGCAGATAATGATGTAGTTATACCTGAAGTAGTTTTAGAAGAATTAGATAGCTTTAAAAAGAATAATTATGATTTAGGGGCTAATGCTAGGCATGCAGCAAGAATAATAGATAAATTAAGAAAAGATGGAAGTTTAATAGATGGTATAGTATTACCTGGTGGAGGAACTTTAAGAGTAGAAATGAATCATTATGATGTAAAATTGCCTCCGTCTTGGGATAAGAATAAGCCGGATAACAGAATAATACAGGTTTGTAAGGGATTAAAAGAAAAAGGGGAAGAAGTAGTATTAATTACAAAGGATACCTTTGAGAGGATAAAGGCGGATACTATTAATATAGATGTAGAGGATTTTTATGAAAAGGTAGTACCAGAATATGAAAGTCAATATAAAGGAAGATGTGATGCTTTTGCATCTCACAGTACTTTAGAAAGTTTTTATAAAAATAAATATATGGATGTAGAGAGCTTATTTTTTTATTCAGAAGAGAAAAATGATTACTATAAAGCAGATATCAATATAAATGAATTTATATTAATTAAATCTATGGAAAATCCAAAACAAACAGCTCTGGGAAGATATAATGGAGAAAAAGTTGTTCCTCTTTTTTATAAAGACGTCAAGCCTCTAGGAATAAGTCCTAGAAACATAGGACAAAAGTTTATGTTAGAAGCTTTTTTAACAGATTCTAAAAATGCACCTTTAGTTATAGTAAAGGGACCTGCAGGTACAGCCAAGACTTTATTCTCTTTAGCTACAGGACTTCATAAAGTTATGGAAGAGGGAGAAGATGGATATAGAAAAATTTTAATCTGTAGACCTAATGTAACTATGGATGAAGATATAGGGTTTTTACCTGGAACAGAGGAAGAAAAAATAATGCCTTTTATGAGACCCATTTTTGATAATTTAGAGATTTTAGTGGATTCTGATGAAAAGGAAAGATATAAAAATGAAAAAGAATTATATGATAAGATAAAAGAGCTATTTGATAGGAGAATTATAACTACAGAAGCAGTAGCTTATTTGAGAGGTAGATCTATAGTGAAAAATTGGGTTATAATAGATGAAGCTCAAAATTTAACACCAAAGCAGGTGAAGGCGGTTATAACTAGAGTAGGACAAGGAACGAAACTTATATTAGTAGGTGATCCAGATCAAATAGATCAACCGTTTTTAGACTCTAGATCAAATGGTTTATGTTATGCATCAGAAAAAATGAAAGGAAGCAAACTTTGTTATCAGGTAACATTAAAGGATCATGAATGTGAAAGATCACCATTAGCCTATGAGGGAGCAAAGCGATTATAATTTTATACTATATGTAAGTAGAGGGCGCCTCAAAATCAAATATATTTTGTGGTGTCCTCTATATTTTATATGATATAATTTATTACAATTGCACTTATGTAAGTTAATGTATAAATAGTTTTAATTTGGAAAATATATTGCAGTTTAAAGGGAAATAAAATGAATTTTAGGAAGTTTTACAATATTTCATAAAGCTTACTATTTAAAAAAATTTATATTTAGTGTACAATAATGAAAGATGTAAAATAAAGAGAAAGGAATTTTTAGATGGAAAATAAAGAGAAAAAGTCGAAAAATAAGAAATTTTCTTTTAAAATATTTTTATATTTTATAATTTTTGAATTGTTTTTTACAGCAGCCACAGCGCCTTTTATAATATTCCATGGTCCTTTTAAAAATGTTAAAAAGACTATGGTAGGAGCAGCTATGACTACTTTAAAACATCAATATATAGCTAAAACATTTTTATCAGATGCTAAAATAAAAGAGATATTAGGTGAAGATTCTATACAAACTATAAAACAAGATAAGAACTCTGTGTTAAAATTTGAAAACAAACATGATAGTACAATAGAAAGATATGATATAAGTTATGGTAAAAAGTTCAAAGGATATATGTTAGTAGTTCATGATCCATCTAGGGTAAAGGTTGGATATAGTTCTAAGTTACCAGTACAAGGAGAACTTACAAGTCAGATAGCAAGAAATAAAAGAGCTGTTGCAGCTATTAATGCAGGTGGCTTTACAGATAAATCAGCTAATAGCAAGTGGACAGGTACCGGTGGAAATGTTGAAGGGGTAATAATTAGTAAAGGTGAAGTTAAATATAATAGTAATAAGCAAGGAGAATTTACAGGAGATGTAGCAGCTATAACTAAAAAGGGGGCTTTAGTTGTAGGTAAACATAGTATACAAGAATTAAAAGATTTAAATGTACAAGAAGCTATAACTTTTGGACCAGCCTTAGTAGTAAAGGGGCAAGGCACCATAACTTCTGGAGATGGCGGATGGGGAATGGCGCCTAGAACTGCTATTGGACAAAGAGAAGACGGAGCTATACTTATGCTGGTTATAGATGGTAGACAAGCATCTAGTTTAGGAGCTACATTAAAAGATGTACAAGATATCATGTTACAATATGATGCATATACTGCTACAAATTTAGACGGTGGATCTTCAACTACAATGTATCATGAAGGAGAAGTTATAAATAATCCTGCTAATTCTTTAGGAGAAAGATCAGTACCATCTATTTTGTATGTTGAACCTTAG
Protein sequences of DBSCAN-SWA_1 >CP028842|575757:585171|578633_578843_+|AWB16403.1|DBSCAN-SWA MLKAKEKALPKGFNEARFLQNCMTVLKDIKNIEKCNEVSVVRTMLKGVFLGLDFFNKECYAIPVYLNLF >CP028842|575757:585171|580756_581566_+|AWB16406.1|DBSCAN-SWA MKISNIKEITLFEHHFWLQILGDHSRFILNSLSPKEKSFIEEANRFKNLFDNLLKKSKQSLSEEELFALNNHAYNAAMKIREFKLDIIDRQITDKIVISLPPTFINHMVNEVDEYIFILTKLMKGNVSNIGPIHLHLLWLPDGAGHASNIASSLDITEKELIKKSNQYSKKFNNLYLRTIEYNGYTRTGICDFPALDSLNNNADETMSCFKEFLNELKKGVIEKKILGTIVPLVPDHMFREECYYLTKLSMVSNIKKPECDPTKSRVES >CP028842|575757:585171|584166_585171_+|AWB16408.1|DBSCAN-SWA MENKEKKSKNKKFSFKIFLYFIIFELFFTAATAPFIIFHGPFKNVKKTMVGAAMTTLKHQYIAKTFLSDAKIKEILGEDSIQTIKQDKNSVLKFENKHDSTIERYDISYGKKFKGYMLVVHDPSRVKVGYSSKLPVQGELTSQIARNKRAVAAINAGGFTDKSANSKWTGTGGNVEGVIISKGEVKYNSNKQGEFTGDVAAITKKGALVVGKHSIQELKDLNVQEAITFGPALVVKGQGTITSGDGGWGMAPRTAIGQREDGAILMLVIDGRQASSLGATLKDVQDIMLQYDAYTATNLDGGSSTTMYHEGEVINNPANSLGERSVPSILYVEP >CP028842|575757:585171|582522_583899_+|AWB16407.1|DBSCAN-SWA MKLTYVLDTNVILYSPGAIFSFADNDVVIPEVVLEELDSFKKNNYDLGANARHAARIIDKLRKDGSLIDGIVLPGGGTLRVEMNHYDVKLPPSWDKNKPDNRIIQVCKGLKEKGEEVVLITKDTFERIKADTINIDVEDFYEKVVPEYESQYKGRCDAFASHSTLESFYKNKYMDVESLFFYSEEKNDYYKADININEFILIKSMENPKQTALGRYNGEKVVPLFYKDVKPLGISPRNIGQKFMLEAFLTDSKNAPLVIVKGPAGTAKTLFSLATGLHKVMEEGEDGYRKILICRPNVTMDEDIGFLPGTEEEKIMPFMRPIFDNLEILVDSDEKERYKNEKELYDKIKELFDRRIITTEAVAYLRGRSIVKNWVIIDEAQNLTPKQVKAVITRVGQGTKLILVGDPDQIDQPFLDSRSNGLCYASEKMKGSKLCYQVTLKDHECERSPLAYEGAKRL >CP028842|575757:585171|580089_580239_-|AWB16405.1|DBSCAN-SWA MSNLNSLELQNLPHLIGAHETIADKLNKIRVKQSIIIYIRKEEVFFTSL >CP028842|575757:585171|581987_582143_-|AWB19463.1|DBSCAN-SWA MLADEPTGSLDEENSYKIIGLLKLLNKKGKTIVIVTYDKNIANECNRIINI >CP028842|575757:585171|575757_577986_+|AWB16402.1|DBSCAN-SWA MIIKKKLLLKGLHCANCATKIERAVQKLNIIEEANYNFNNSTLIINLEETHKDSIIKTIQEIVDRIEPGVKVVDKENLKRTVVHAPVKNSSNLKMQNNKEENLKLDKKENSYEHNHDHSHGHSHDGEDSDELEKKTLIRIISGVVLLILATVLKSKETLSIGLYLTSYVLIGGKVILSSIRNISKGQVFDENFLMAVATVAAIGVKQYPEAVAVMLFYEVGEFLQDKAVNKSRKSITALMNIRPDYANLVRGEDIEVVSPEDINIDDIIMVKPGEKIPLDGIVVEGQSFVDTSAITGESLISEVSKDSNVLSGYINKNGVIKIKVTKTFGESTVSKILELTENASATKANTEKFITKFARYYTPVVVFAALALAVIPTLILKDPDISKWIYRAAVFLVVSCPCALVISIPLSFFAGIGGASKKGVLIKAGTALEALNDADTIVFDKTGTLTKGVFKVSKIDSEEGVNTEELIEYAAYVESYSNHPIAKSILKYYEKTIDNKRIEGYEEIVARGVTAYIDGKKVYAGNNKLMEELNINYKKAQEDGVILYIALEDKYIGYIVINDEIKKDSKETIKSLKDIGIKKAAMLTGDRKSTANNIGTFLGMDEIYSELLPQEKVEKMQSLKSKTSKDGKIVFVGDGVNDAPVLAMSDIGVSMGGLGSDAAIEASDLVLMSDEPSKLVDAIKIARKTHKIVWQNIIIVLIIKFAVLALAVMGKSTMWMAVFADVGVALIAVINALRILK >CP028842|575757:585171|579723_580071_+|AWB16404.1|DBSCAN-SWA MTPIEIMEKIGACQRGLTKGNIELKALGVKKARAEHDYRIALRKEILRLRQLENQPATIINDLAKGKEDIAKLRLERDIAETNYSVYIESMRNLRLEIEAYRSFLTWERVELKNT |
8 | Bacillus_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
910782 : 922501
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >CP028842|910782:922501|DBSCAN-SWA ATTAATTAGTAATATCTATATGCAATCTTATATTATAGTTATTTAATTCTGTAACTTCTACTTTTAATATATAAATTGCACCATTTAATAAACGTATTGAATTGGTATTATTTAAGAGGTGTAAATTTTGTTGTATATTAATTAAATTATAGCCGTCAATAGTTTCAGTGACTCTAAATAAAGTACCTATTCCTTGGTTATAACTAGTATAAAGCCTAATGTTAGATGTATCTTTATTATTAAAGTTACCAGGTATTGTAAATTCATATGAAATATAGTCATGGACATCAGGGCTTTGTCTTGTATAGTAATGTGCACCTGTTGAATTAAGATTATCTATTATATTAACTGAAGAATTCATTAAATTTCGGAGATCCCCTTCTTCTCTCTTGAATTGTATTTGATTTTCTATATTAGAAGAAGTTTGTGGTACTCTAATGTAGTAATTTTTATCCTTATTAAGCAAAACAACTAAATAACTTTTAGCATTAGGACTGTCAAACCCAGTAATATAATTTATTGCTTTAATATCATCATCACATAAATTCCCAGATTGGAAATTTCTATTACCAGAACCTATCGCTTCATATATTTTTAATGATGGTAGATTATTTTGAGCATTAATTTTATAAATTCCTGTAGTATTTACTGTAAATAATATATAAAATGGATTATTATTTACAATACCTGGAATGTTATATGTGTAATTATCTGAAATAGCAGTATTTATTTCTTGTATATTTTCAGATGGGTCTATGACACCTACTACAATTTCTTCCTCGGGACCATTTTGTATAAATCCATCTTCAGCCACTTGCATTTTAACTACTTCAGATTCAGGTGAAGGAGCATTAGTTACTTCACAATATCCTAAGGAAGGAAGATAATACTCAGCTTTATTAACAATACTTCCATTTTGATAGTCTATTAATTCATATTTTTCATAGGTATTATAAGCCTTTATGCATATATTTTTATCTGAAGGAGCTTCTTCTACAAATTTAAATAACGATGTTGATGTATTAAATAATTGTACATTGAAAGCGTCTTTAAGTCTTTCTTCAGTATATTGTTGTGAGAATTTTGTATCATTACTTGTGGTGAATAATGGTCTAGTTGTATTTCTTAATCGAGGTTGTATAATACTTCCTGATGAACCTGCTTCGATTAATAATGTACCTATCAAATCTTTATCATTTGTTCTTATATATCCATCACCCTTATTAATAACATATAGCCCATTACTATAAGGCAATACTCGTTGTGTGCTACTAACTTTAGAATTAAAAATATTGTTAGTTGGTATATTTTTAGTAGTTTCTAAAATTTTTTTATATAGGAATTGTTCATTTAAAATGCACTTATCATTAGTTAGAAAGTAAAAATCTTTATTTATTTTTTCCCCTGGATTAAATTCTATAGACTTAACATATCCAAGAGATGGAACATATAAAACTGCTCTTTCTATAATTTCATGTTGTAAGACTTTTATTATTTCATATCTAATGTAGGTATATTGTAAATACATATATAAGTTTTTATTTGAGGGAGCGGTTTTACTAAATTCAAATCCTATTGGAATTTGATTAGCTTCAGTAAAGTTAGTAAATACAGTTTGTATATTATTTTTTATATATTCTTCATTGAAAGATGGTGTTGGATAATAATATGGTATCGCATTATCATTTACACGTAGGTCCCCAACTATTCCTGTTGATCCATTACTAATTACACTTCCACCTAATATTTGATTTTGTCTAGATAATATCCATCCATCCCCTCTTCTAACTACATAATTACCATCAGCTAAATCAATAGTATCACTATAGTTTATAACTTTTTCTTGTATATCATTATAAATTTTTTTTATAGATGAATTCATACACTTTTCTCCTTTATATTTTTTCAAGTTTGAACATTTGATTTGAATTGTATATATCAAAATTCGGTAATAGGAGTAGTGGTTGGCTTAAAATATTTTCATTAGTATCATAAATGTCCCAGGCATAATCTAATTCATTCACTTTATTTAAACTTAACATAATATAAGTATTTACAGCAATTTTAATAGGAAACCAGTAGCATCTATTGGATAATGAATCTAAAGAAATAAATCCAAAGTTATCGTAACTTAAATACTTATTTGGTTCTGCTACATTAGAGATTTTAAAGCATCTATTTTCAGCCATATATTCTACATTCCATTTTTGATTATTTGCAGAAGATTCATTTGAAAATGTTAATGATTTCGATACAGGATTTAAATATAAAGAACCAGAAAAGATAGATTTTATATTGTAATTACCATTAGGTAGAAAAGTTCTTTCAACTGACATATAATTCACCTCTTTATAAATTAGATGATAGTACTCATATTAAATCTTTGTTAATATTAATTTTATGGGTTACGAATATTCCATTTCTGATTATCATCTCCATGATAATTAAATACTTGAATAGCAGTTCCGTTTGCTGTTTGGCCGCCATATAAATCTAGAGCTTTAGTTGTATCGCGTAGATTAGTAATTGTATATGTTTCATCAGTATCTGAAACAGGATTTATAAGCCAATATTGGGCGTCATTATTTTGATCATTAGAAGAAGAAACCCTTACAGTATTACCATTTGAAAAAATCCATGTTAGAACTCCGTTTGAAAGTATTGTATTAAAAAACTGGTATGCTGCTTTTTCTTCATTATATCTAATTGTCCATTTTTGATTGCGACCATAGTCCCAAGTATATAAATTAACATTTAGATTTGTCACATCCACTTGTTGTACAACTTTATTAAGATCTAATATTGGACTTATTTTACATGTGAAATTGTTAAGATCTGATATTATATAATCTTCTATGATAAATTTTATATAATTTGAATTATTAAGTGTGCTAAGCTTCAAATTACGAGCTACGGTATCAGCATATAATACTAAGTTAGGGTTTTTATAACTTGCAATAATAAATGAATTGTTACCAATGTCTTTTAATAATAACCAATATTGATTATCTGCATTTGAATCTTGTTGCGTTGATATATTATGTGTTGGTGCATTCCATGTTAAAACTAAATTAGTATTATGGATATCCATACTTTTTATTTTATAAGCAGCTTTATTAGAATCATATATAAGTCTCCATCTTTCAAGGTAATTTCTAGTTTGTTGAAATAAGCTAACGTTACCGGCAACTTGATAAAAAAATAAATTAGTATCGGCCTTACAGGAGATGGTAACAATTTTGTCATTTAATGAATTTTGGATTACTGAATAGTGTTCCATTATGATTCCTCCTTTATTTAAGAATTAATCTTACATATAACATATAACATAATCAAATTATTTTTTGTAAACCTAAAATTTAAATATATCAAATTTTTATTAGTATGTTTACATAATTGATTATGGATATTTCGTAAAAATGGCTTATTAAAAATTTAAAGGCAATTAGTTTATTTATAGTATAATAAAAAAATAATATGTATATTATGGAAGGGTAGTGGTAAATATGAATAAATTGTTTTTACAAATTAAAATGTTAAAAAATGACAATAGGGAGTTTCAAGAAATTTTTAAGCATTTTGAAAAAACTATAAATATATTTACTAGAAAATATAATATATATGATAATTACAATGATATTTTGTACCATTTATGGTATACACTTAAAAAAGTTGATTTGAGCAATTTCAATACACAAAATGATTTAGAGAGATATATTAGTAGGACTTTAAAAAGATATTGCTTAGATATTTGCAATAAAAGAAAGATTGATAAGAAAATAATATATAATTCAGAAATTGTAGATAAGAAATTAAGCTTAATAGCAAATAGTTATTCAAGTTATTTAGAATTTGAATTTAATGATTTAATATCCATATTACCTGATGATCAAAAGAAAATTATATATATGAAATTTGTTGAAGATATTAAGGAGATAGATATAGCTAAAAAACTTAATATAAGTCGTCAATCTGTATATAAAAATAAAATAATGGCTTTAGAGAGATTAGAACCCATATTGAAAAAATTAATTAATATGTAGTTTATATTTTTAAAAAATTTTAGGTTTACAAAAAATAGTGTGGCTATGTTATATATAAATGATAAGAATATACTGAAAAATGTATCCAAAATTTAAGGGGGCGTGTATAGTAAATAATTAAAAGTATGTGCGTTGAAATAAATTTAGGAGGGTGGTTAGATATGAATATAAATGACAACTTAAGTATAAATTCCCCGGTAGATAATAAAAATGTTGTAGTAGTTAGAGCTAGAAAAACTGATACGGTTTTTAAGGCTTTTAAGGTTGCTCCCAATATTTGGGTGGCGCCAGAGAGATATTATGGCGAATCTTTGAGTATAGATGAAGAATATAAAGTTGATGGGGGAATATATGATTCTAATTTTCTTTCACAAGATAGTGAAAAAGATAAGTTCTTACAAGCCATTATTACTTTGTTAAAAAGAATTAATAGTACTAACGCTGGGGAAAAGTTATTATCTTTGATTTCTACAGCTATTCCATTTCCTTATGGATATATAGGTGGAGGGTATTATGCACCTAATATGATTACTTTTGGATCAGCACCAAAATCTAATAAAAAATTGAATTCTTTAATTTCAAGTACTATTCCATTTCCTTATGCAGGATATAGAGAAACAAATTATCTTTCATCTGAAGATAATAAAAGTTTCTATGCATCTAATATAGTTATTTTTGGTCCAGGAGCAAACATAGTAGAAAACAATACTGTTTTTTATAAAAAGGAAGATGCAGAAAATGGAATGGGAACAATGACTGAAATATGGTTCCAACCATTTCTAACCTATAAATATGACGAATTTTATATTGATCCTGCAATAGAATTAATAAAATGTTTAATAAAATCTCTTTATTTCTTATATGGTATAAAACCTAGTGATGATTTAGTTATTCCATATAGATTAAGAAGTGAATTAGAGAATATAGAATACTCACAATTGAATATAGTTGATTTACTAGTATCTGGAGGCATTGATCCTAAATTTATAAATACAGATCCATATTGGTTTACAGATAATTATTTCTCAAATGCAAAAAAAGTGTTTGAAGATCATAGGAATATTTATGAAACAGAAATTGAAGGAAATAATGCCATTGGTAATGATATAAAATTGAGATTAAAACAAAAGTTTCGAATCAATATCAATGATATATGGGAATTAAATTTAAATTATTTCTCTAAAGAGTTTAGCATTATGATGCCAGATAGATTTAATAATGCACTTAAACATTTTTATAGAAAACAATACTACAAAATAGATTATCCAGAAAATTATAGTATAAATGGTTTTGTTAATGGTCAAATTAATGCTCAATTATCTTTATCAGATAGAAATCAAGATATTATAAATAAACCTGAAGAAATAATTAATTTATTAAATGGAAATAATGTTTCATTAATGAGAAGTAATATTTATGGTGATGGATTAAAAAGCACTGTAGATGATTTTTACAGTAATTATAAAATCCCATATAATAGAGCCTATGAATATCATTTTAATAATTCAAATGATTCTTCTTTAGATAATGTTAACATTGGAGTAATAGACAATATTCCAGAGATTATAGATGTAAATCCTTATAAGGAAAATTGTGATAAGTTTTCACCGGTACAGAAAATTACAAGTACTAGAGAAATTAATACAAATATACCATGGCCTATAAATTATTTACAAGCTCAAAATACTAACAATGAAAAATTTAGTTTATCCTCAGATTTTGTAGAAGTAGTTTCTTCTAAAGATAAATCTTTAGTGTATTCTTTCTTATCTAATGTAATGTTTTATTTAGATTCCATAAAGGATAATAGTCCTATTGATACAGATAAAAAATATTATTTATGGTTAAGAGAGATTTTTAGAAATTATTCTTTTGATATTACTGCAACTCAAGAAATTAATACTAATTGTGGTATTAATAAAGTAGTAACTTGGTTTGGGAAAGCATTAAATATTTTAAATACATCTGATTCTTTTGTAGAAGAATTTCAAAATTTAGGGGCAATTTCACTTATTAATAAAAAAGAAAATTTAAGTATGCCAATAATTGAGAGTTATGAAATCCCTAACGATATGTTAGGATTACCACTAAATGATTTAAATGAAAAATTATTTAACATATATTCTAAAAACACAGCTTATTTTAAAAAAATCTACTATAATTTCCTAGATCAGTGGTGGACACAATATTATAGTCAATATTTTGATTTAATTTGTATGGCTAAAAGATCAGTGTTAGCTCAAGAAACTTTAATAAAAAGAATAATACAAAAAAAATTGAGTTATTTAATAGGAAATTCTAATATATCATCTGATAACTTAGCATTGATGAATCTTACAACAACAAATACATTAAGAGATATTTCAAACGAATCACAAATAGCAATGAATAATGTAGATAGTTTTTTAAATAATGCCGCTATATGTGTTTTTGAAAGTAATATATATCCTAAATTTATTTCTTTTATGGAACAATGTATTAATAATATAAATATTAAGACAAAAGAATTTATACAAAAATGTACTAATATTAATGAAGATGAAAAATTACAATTAATTAACCAGAATGTTTTTAATAGCTTAGATTTTGAATTCTTAAATATTCAAAATATGAAAAGTTTATTTAGTTCAGAGACAGCATTACTTATAAAGGAAGAAACTTGGCCTTATGAACTAGTGTTATATGCTTTTAAGGAACCAGGTAATAATGTTATCGGAGATGCATCTGGTAAAAATACATCAATAGAATATTCTAAGGACATAGGTTTAGTTTATGGAATAAATAGTGATGCATTATATTTAAATGGATCTAATCAAAGTATAAGTTTTTCTAATGATTTCTTTGAGAATGGATTAACTAACAGTTTTTCAATTTATTTTTGGTTGAGAAATTTGGGCAAAGATACTATTAAATCTAAGTTAATAGGTAGTAAGGAAGATAATTGTGGTTGGGAAATTTATTTTCAAGATACTGGGTTGGTTTTCAATATGATAGATTCTAATGGAAATGAGAAGAATATATATCTATCTGATGTTTCTAATAATAGTTGGCACTATATAACTATATCTGTAGATCGTTTAAAAGAACAATTATTAATATTTATTGATGATAATTTAGTGGCTAATGAAAGTATTAAGGAAATTTTAAATATCTATTCAAGTAATATAATTTCTTTATTAAGCGAGAATAATCCAAGTTATATTGAGGGATTAACTATTTTAAATAAACCCACTACAAGTCAGGAAGTTTTGAGTAATTATTTTGAAGTTCTAAATAATTCATATATAAGAGACAGTAATGAAGAACGATTAGAATACAATAAGACATATCAATTATATAATTATGTATTTTCAGATAAGCCTATATGTGAAGTTAAACAAAATAATAATATATATTTAACAATTAATAATACAAACAATTTAAATCTACAAGCTTCTAAATTTAAATTATTAAGTATAAATCCAAATAAACAATATGTTCAAAAACTTGATGAGGTAATAATTTCTGTATTAGATAATATGGAAAAATATATAGATATATCTGAAGATAATAGATTGCAACTAATAGATAACAAAAATAACGCAAAGAAGATGATAATTAGTAATGATATATTTATTTCCAATTGTTTAACCCTATCTTATAACGGTAAATATATATGTTTATCTATGAAAGATGAAAACCATAATTGGATGATATGTAATAATGATATGTCAAAGTATTTGTATTTATGGTCATTTAAATAATTAATAATTTAATTAATTTTAAATATTATAAGAGGTGTTAAATATGCCATTTGTTAATAAACAATTTAATTATAAAGATCCTGTAAATGGTGTTGATATTGCTTATATAAAAATTCCAAATGCAGGACAAATGCAACCAGTAAAAGCTTTTAAAATTCATAATAAAATATGGGTTATTCCAGAAAGAGATACATTTACAAATCCTGAAGAAGGAGATTTAAATCCACCACCAGAAGCAAAACAAGTTCCAGTTTCATATTATGATTCAACATATTTAAGTACAGATAATGAAAAAGATAATTATTTAAAGGGAGTTACAAAATTATTTGAGAGAATTTATTCAACTGATCTTGGAAGAATGTTGTTAACATCAATAGTAAGGGGAATACCATTTTGGGGTGGAAGTACAATAGATACAGAATTAAAAGTTATTGATACTAATTGTATTAATGTGATACAACCAGATGGTAGTTATAGATCAGAAGAACTTAATCTAGTAATAATAGGACCCTCAGCTGATATTATACAGTTTGAATGTAAAAGCTTTGGACATGAAGTTTTGAATCTTACGCGAAATGGTTATGGCTCTACTCAATACATTAGATTTAGCCCAGATTTTACATTTGGTTTTGAGGAGTCACTTGAAGTTGATACAAATCCTCTTTTAGGTGCAGGCAAATTTGCTACAGATCCAGCAGTAACATTAGCACATGAACTTATACATGCTGGACATAGATTATATGGAATAGCAATTAATCCAAATAGGGTTTTTAAAGTAAATACTAATGCCTATTATGAAATGAGTGGGTTAGAAGTAAGCTTTGAGGAACTTAGAACATTTGGGGGACATGATGCAAAGTTTATAGATAGTTTACAGGAAAACGAATTTCGTCTATATTATTATAATAAGTTTAAAGATATAGCAAGTACACTTAATAAAGCTAAATCAATAGTAGGTACTACTGCTTCATTACAGTATATGAAAAATGTTTTTAAAGAGAAATATCTCCTATCTGAAGATACATCTGGAAAATTTTCGGTAGATAAATTAAAATTTGATAAGTTATACAAAATGTTAACAGAGATTTACACAGAGGATAATTTTGTTAAGTTTTTTAAAGTACTTAACAGAAAAACATATTTGAATTTTGATAAAGCCGTATTTAAGATAAATATAGTACCTAAGGTAAATTACACAATATATGATGGATTTAATTTAAGAAATACAAATTTAGCAGCAAACTTTAATGGTCAAAATACAGAAATTAATAATATGAATTTTACTAAACTAAAAAATTTTACTGGATTGTTTGAATTTTATAAGTTGCTATGTGTAAGAGGGATAATAACTTCTAAAACTAAATCATTAGATAAAGGATACAATAAGGCATTAAATGATTTATGTATCAAAGTTAATAATTGGGACTTGTTTTTTAGTCCTTCAGAAGATAATTTTACTAATGATCTAAATAAAGGAGAAGAAATTACATCTGATACTAATATAGAAGCAGCAGAAGAAAATATTAGTTTAGATTTAATACAACAATATTATTTAACCTTTAATTTTGATAATGAACCTGAAAATATTTCAATAGAAAATCTTTCAAGTGACATTATAGGCCAATTAGAACTTATGCCTAATATAGAAAGATTTCCTAATGGAAAAAAGTATGAGTTAGATAAATATACTATGTTCCATTATCTTCGTGCTCAAGAATTTGAACATGGTAAATCTAGGATTGCTTTAACAAATTCTGTTAACGAAGCATTATTAAATCCTAGTCGTGTTTATACATTTTTTTCTTCAGACTATGTAAAGAAAGTTAATAAAGCTACGGAGGCAGCTATGTTTTTAGGCTGGGTAGAACAATTAGTATATGATTTTACCGATGAAACTAGCGAAGTAAGTACTACGGATAAAATTGCGGATATAACTATAATTATTCCATATATAGGACCTGCTTTAAATATAGGTAATATGTTATATAAAGATGATTTTGTAGGTGCTTTAATATTTTCAGGAGCTGTTATTCTGTTAGAATTTATACCAGAGATTGCAATACCTGTATTAGGTACTTTTGCACTTGTATCATATATTGCGAATAAGGTTCTAACCGTTCAAACAATAGATAATGCTTTAAGTAAAAGAAATGAAAAATGGGATGAGGTCTATAAATATATAGTAACAAATTGGTTAGCAAAGGTTAATACACAGATTGATCTAATAAGAAAAAAAATGAAAGAAGCTTTAGAAAATCAAGCAGAAGCAACAAAGGCTATAATAAACTATCAGTATAATCAATATACTGAGGAAGAGAAAAATAATATTAATTTTAATATTGATGATTTAAGTTCGAAACTTAATGAGTCTATAAATAAAGCTATGATTAATATAAATAAATTTTTGAATCAATGCTCTGTTTCATATTTAATGAATTCTATGATCCCTTATGGTGTTAAACGGTTAGAAGATTTTGATGCTAGTCTTAAAGATGCATTATTAAAGTATATATATGATAATAGAGGAACTTTAATTGGTCAAGTAGATAGATTAAAAGATAAAGTTAATAATACACTTAGTACAGATATACCTTTTCAGCTTTCCAAATACGTAGATAATCAAAGATTATTATCTACATTTACTGAATATATTAAGAATATTATTAATACTTCTATATTGAATTTAAGATATGAAAGTAATCATTTAATAGACTTATCTAGGTATGCATCAAAAATAAATATTGGTAGTAAAGTAAATTTTGATCCAATAGATAAAAATCAAATTCAATTATTTAATTTAGAAAGTAGTAAAATTGAGGTAATTTTAAAAAATGCTATTGTATATAATAGTATGTATGAAAATTTTAGTACTAGCTTTTGGATAAGAATTCCTAAGTATTTTAACAGTATAAGTCTAAATAATGAATATACAATAATAAATTGTATGGAAAATAATTCAGGATGGAAAGTATCACTTAATTATGGTGAAATAATCTGGACTTTACAGGATACTCAGGAAATAAAACAAAGAGTAGTTTTTAAATACAGTCAAATGATTAATATATCAGATTATATAAACAGATGGATTTTTGTAACTATCACTAATAATAGATTAAATAACTCTAAAATTTATATAAATGGAAGATTAATAGATCAAAAACCAATTTCAAATTTAGGTAATATTCATGCTAGTAATAATATAATGTTTAAATTAGATGGTTGTAGAGATACACATAGATATATTTGGATAAAATATTTTAATCTTTTTGATAAGGAATTAAATGAAAAAGAAATCAAAGATTTATATGATAATCAATCAAATTCAGGTATTTTAAAAGACTTTTGGGGTGATTATTTACAATATGATAAACCATACTATATGTTAAATTTATATGATCCAAATAAATATGTCGATGTAAATAATGTAGGTATTAGAGGTTATATGTATCTTAAAGGGCCTAGAGGTAGCGTAATGACTACAAACATTTATTTAAATTCAAGTTTGTATAGGGGGACAAAATTTATTATAAAAAAATATGCTTCTGGAAATAAAGATAATATTGTTAGAAATAATGATCGTGTATATATTAATGTAGTAGTTAAAAATAAAGAATATAGGTTAGCTACTAATGCATCACAGGCAGGCGTAGAAAAAATACTAAGTGCATTAGAAATACCTGATGTAGGAAATCTAAGTCAAGTAGTAGTAATGAAGTCAAAAAATGATCAAGGAATAACAAATAAATGCAAAATGAATTTACAAGATAATAATGGGAATGATATAGGCTTTATAGGATTTCATCAGTTTAATAATATAGCTAAACTAGTAGCAAGTAATTGGTATAATAGACAAATAGAAAGATCTAGTAGGACTTTGGGTTGCTCATGGGAATTTATTCCTGTAGATGATGGATGGGGAGAAAGGCCACTGTAA
Protein sequences of DBSCAN-SWA_2 >CP028842|910782:922501|914287_914824_+|AWB16726.1|DBSCAN-SWA MNKLFLQIKMLKNDNREFQEIFKHFEKTINIFTRKYNIYDNYNDILYHLWYTLKKVDLSNFNTQNDLERYISRTLKRYCLDICNKRKIDKKIIYNSEIVDKKLSLIANSYSSYLEFEFNDLISILPDDQKKIIYMKFVEDIKEIDIAKKLNISRQSVYKNKIMALERLEPILKKLINM >CP028842|910782:922501|912676_913117_-|AWB16724.1|DBSCAN-SWA MSVERTFLPNGNYNIKSIFSGSLYLNPVSKSLTFSNESSANNQKWNVEYMAENRCFKISNVAEPNKYLSYDNFGFISLDSLSNRCYWFPIKIAVNTYIMLSLNKVNELDYAWDIYDTNENILSQPLLLLPNFDIYNSNQMFKLEKI >CP028842|910782:922501|914985_918567_+|AWB19471.1|DBSCAN-SWA MNINDNLSINSPVDNKNVVVVRARKTDTVFKAFKVAPNIWVAPERYYGESLSIDEEYKVDGGIYDSNFLSQDSEKDKFLQAIITLLKRINSTNAGEKLLSLISTAIPFPYGYIGGGYYAPNMITFGSAPKSNKKLNSLISSTIPFPYAGYRETNYLSSEDNKSFYASNIVIFGPGANIVENNTVFYKKEDAENGMGTMTEIWFQPFLTYKYDEFYIDPAIELIKCLIKSLYFLYGIKPSDDLVIPYRLRSELENIEYSQLNIVDLLVSGGIDPKFINTDPYWFTDNYFSNAKKVFEDHRNIYETEIEGNNAIGNDIKLRLKQKFRININDIWELNLNYFSKEFSIMMPDRFNNALKHFYRKQYYKIDYPENYSINGFVNGQINAQLSLSDRNQDIINKPEEIINLLNGNNVSLMRSNIYGDGLKSTVDDFYSNYKIPYNRAYEYHFNNSNDSSLDNVNIGVIDNIPEIIDVNPYKENCDKFSPVQKITSTREINTNIPWPINYLQAQNTNNEKFSLSSDFVEVVSSKDKSLVYSFLSNVMFYLDSIKDNSPIDTDKKYYLWLREIFRNYSFDITATQEINTNCGINKVVTWFGKALNILNTSDSFVEEFQNLGAISLINKKENLSMPIIESYEIPNDMLGLPLNDLNEKLFNIYSKNTAYFKKIYYNFLDQWWTQYYSQYFDLICMAKRSVLAQETLIKRIIQKKLSYLIGNSNISSDNLALMNLTTTNTLRDISNESQIAMNNVDSFLNNAAICVFESNIYPKFISFMEQCINNINIKTKEFIQKCTNINEDEKLQLINQNVFNSLDFEFLNIQNMKSLFSSETALLIKEETWPYELVLYAFKEPGNNVIGDASGKNTSIEYSKDIGLVYGINSDALYLNGSNQSISFSNDFFENGLTNSFSIYFWLRNLGKDTIKSKLIGSKEDNCGWEIYFQDTGLVFNMIDSNGNEKNIYLSDVSNNSWHYITISVDRLKEQLLIFIDDNLVANESIKEILNIYSSNIISLLSENNPSYIEGLTILNKPTTSQEVLSNYFEVLNNSYIRDSNEERLEYNKTYQLYNYVFSDKPICEVKQNNNIYLTINNTNNLNLQASKFKLLSINPNKQYVQKLDEVIISVLDNMEKYIDISEDNRLQLIDNKNNAKKMIISNDIFISNCLTLSYNGKYICLSMKDENHNWMICNNDMSKYLYLWSFK >CP028842|910782:922501|913179_914061_-|AWB16725.1|DBSCAN-SWA MEHYSVIQNSLNDKIVTISCKADTNLFFYQVAGNVSLFQQTRNYLERWRLIYDSNKAAYKIKSMDIHNTNLVLTWNAPTHNISTQQDSNADNQYWLLLKDIGNNSFIIASYKNPNLVLYADTVARNLKLSTLNNSNYIKFIIEDYIISDLNNFTCKISPILDLNKVVQQVDVTNLNVNLYTWDYGRNQKWTIRYNEEKAAYQFFNTILSNGVLTWIFSNGNTVRVSSSNDQNNDAQYWLINPVSDTDETYTITNLRDTTKALDLYGGQTANGTAIQVFNYHGDDNQKWNIRNP >CP028842|910782:922501|910782_912663_-|AWB16723.1|DBSCAN-SWA MNSSIKKIYNDIQEKVINYSDTIDLADGNYVVRRGDGWILSRQNQILGGSVISNGSTGIVGDLRVNDNAIPYYYPTPSFNEEYIKNNIQTVFTNFTEANQIPIGFEFSKTAPSNKNLYMYLQYTYIRYEIIKVLQHEIIERAVLYVPSLGYVKSIEFNPGEKINKDFYFLTNDKCILNEQFLYKKILETTKNIPTNNIFNSKVSSTQRVLPYSNGLYVINKGDGYIRTNDKDLIGTLLIEAGSSGSIIQPRLRNTTRPLFTTSNDTKFSQQYTEERLKDAFNVQLFNTSTSLFKFVEEAPSDKNICIKAYNTYEKYELIDYQNGSIVNKAEYYLPSLGYCEVTNAPSPESEVVKMQVAEDGFIQNGPEEEIVVGVIDPSENIQEINTAISDNYTYNIPGIVNNNPFYILFTVNTTGIYKINAQNNLPSLKIYEAIGSGNRNFQSGNLCDDDIKAINYITGFDSPNAKSYLVVLLNKDKNYYIRVPQTSSNIENQIQFKREEGDLRNLMNSSVNIIDNLNSTGAHYYTRQSPDVHDYISYEFTIPGNFNNKDTSNIRLYTSYNQGIGTLFRVTETIDGYNLINIQQNLHLLNNTNSIRLLNGAIYILKVEVTELNNYNIRLHIDITN >CP028842|910782:922501|918610_922501_+|AWB16727.1|DBSCAN-SWA MPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPL |
6 | Clostridium_botulinum_D_phage(50.0%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1430643 : 1476071
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >CP028842|1430643:1476071|DBSCAN-SWA TATGCTTAAAGAATTTATATCTTATTATAAACCGCATAAAGAGTTATTCGTTTTAGATATGATAGCAGCTTTTATTGTGGCTTTATGTGATTTGTTTTATCCCATGATAACAAGACAAATCATAAATGATATTATTCCAAATGGAAAGATTAGATTACTTTTCTTTTGGGCGATATCTTTATTAATTATATATATAATGAAATATTTTTTAAATCATTTTATTCAGTATTGGGGACATATGGTAGGGGTTAGAATACAAGCAGATATGAGAAAAAGAGTTTTTAACCATCTTCAAACATTACCCTTTACATATTTTGATGAAAATAAAACAGGGGTTATAATGTCTAGAATCATAAATGATCTTATGGAAATATCAGAACTTGCACATCATGGCCCAGAGGATCTTTTTATTTCCATTATTATGTTAATAGGATCTTTTATAATATTGTGTACTATAAACATACCATTGACAATAATAAGTTTTATATTTATACCAATTCTAGTATGGTTTTCCATGAAAAATAGACTTAAAATGGAAAAAGCTTTTATGGATAGTAGAGTGAAAATTGGGGATCTTAATGCGGAATTAGAAAATAGTATTGCAGGTATAAGAGTTGCAAAGGCCTTTACTAATAGAGATTATGAAAATGAAAAATTTGAAATGGGAAATAAAAGATTTGTAGGAGCTAGACAAATGGCTTATAAATCTATGGCAGATTATTTTTCAGGAATGTACTTTTTCATAGATATACTGGATCTAATAGTACTTATAGCTGGTGGATATTTTGTATATAAAAATTTAATTAACTTTGGTGATTTGGTTGCTTATCTTCTATTTATAAAAATGTTTATGACACCTATTAGAAAGCTTATTTCTTTTGTTGAGCAATATCAATCAGGAGTAACAGGTTTTGAAAGATATAGACAACTCTTAAGAGTAAAACCTGAAGAAGATAAAGAAGAAGCAGAAGTTTTAGAAAATATTAAGGGTGCAATAGAATTTAAAAATGTAAGTTTTAAATATGATGAAGATACACATATATTAAATGACCTAAGCTTTAAAGTTGAGGAAGGAAAGACATTAGCACTAGTCGGTCCATCTGGGGGAGGTAAGACAACACTCTGTAATTTAATACCTAGATTCTATAATATAGACAATGGAGATATATTAATTGATAATAATAGTATATATGATGTAAAAATAGGATCTCTAAGAAAAAATATAGGTATTGTTCAACAAGATGTATTTTTATTTACAGGAACTATAAAGGAAAATATATTATATGGTAATCCGGAGGCTAGTTATGAAGAGGTAGTAAAAGCAGCGAAGCTTGCTAATATACATGAATTTATAGAAAGTTTACCAGAAGGATACAATACTTATATAGGAGAAAGAGGAATAAAGTTATCTGGAGGACAAAAACAAAGATTATCCATTGCAAGAGTGTTTTTAAAAAATCCACCTATACTTATACTAGACGAAGCTACTTCTGCCCTAGATAATGCTACAGAATATTTAATACAAAAGTCTTTAGAAAAGTTATCTAATGGAAGGACAACTATAGTAGTAGCTCACAGATTATCTACCATAAAAAATGCAGATGAAATAATGGTTTTAACAGATAAAGGAATTGAAGAAAGAGGAACCCATGAAGAACTATTAGCATTAGATGGAATTTACAGTGAACTTAATAGAAATATTGAAAAAACAAAAGGTTAATTATAAGTTTTTTTATTATAAAAAATATTAAAAAATTTCTAGGTGGCCATAAGAATGAGTTAATGATATAAACGTATAAAAGTAACAATAAAACTTTAATTTTGTTGTTTGTAATTTATCTTGAACAATAAAATTGGAGTTTTATTGTTATTTTTATTTTTTGAAATAAATTACTAAAACAATATACAAATATGTTATATATATAACATAATTTGTATACAATTAACAACTAAAATGGTAAAATATATATAAATAAAGATATATATACATAAATGAAAAATGTATATTTAAAATACTAATAATGTAATATAATGTAGTTAATAAATAGGGGGGTAAAATGGCATACGACATAAAATTAAAAAATAAGAATGAAGAAGAATTAGAAAGAATTGCAAATATTATTATGAATTTATTTTTGTATCAAGTAGTATTTTTTATAATATTTATTATGTTAGCAAATATTTTAGGATATGTGGGATTAAATAAAAATATTATACAACCTTATAGTAAATTAGCAGGGGAAATTTTAGCATATATATTTTTTATTAAGAATTATATTAAAGACAATAGATATAAATTAAAATTTAAAAATACATTACATTTTAAAGGATATGTTTTTATAGCAATGCTAATTATAGGGTATATTTTGGTCTATGATAATACAATTGATATAGTTTTATCAAAGGTTGTAAAAAATAGTTGGTTCTATGATGTTATGACTAAAGAAATGAAAAATCCAATAGTAGGATTTATAGGAACAGTGATTATGGCACCTATTTTTGAGGAGATAGTTTATAGAGGAATAATGTTAGATGAGCTATTGGTTAAATACAATTATAAAAAAGCTATAATTATTTCTGCATTAATATTTGCAGCAATTCATCTTAATTTTGTTCAACTAACAGATGCTTTTATTGCAGGTATCATCCTTGGGACTGTTTATTGTAAAACTAAATGTTTAATTCCATGTATTATAATTCATTTTTTAAATAACTTATTTTGCAATATAGCTAAATTTTATCCCAGTATATATAAAACTAAATTTAATATTATAAGATTAGGTATTGGAATAGCTATTTTAGCAACATTAGCATATATTTTTTTAAAAGATAGAAAAAAAGTTATTTTATAGCAAAATCATATCTAATGTTTTAAAGAGGATAATCATAATTTCAAGGTTAATTAATTTGTTTCTCCAAAATTAAAACATATATTGCTAATTACAAATTAGAAGTATATAGAAATATGTGTTACTATAGCAATATAGGAAAATATATAATTGGAGTGTGATATAAATGAAAATAGCAATGCCTAAGAATGAAAAAATAATTAACCAACATTTTGGAAAAAGTAAAAGCTTTGCCATAGTAACAGTAGATGATAATAAAATTATAGATATTAAAGATATATCAACAGAAAGTTTACAACATAATCATGGTGGTCTATCCAGTTTGTTAGTAGAAGAAAAAGTTGAACTAGTTATAACAGGAGGCATTGGTCAAGGCGCCTATGATGCTTTAATTAAGGAAGGACTAAAAGTTATAAGAGGGGCAAAGGGAACAATTGAAGATGTATTACAACAATATTTAAGAGGAGAACTTCAAGATAGAAAAGTAATGTGTAATCATCACGGTGAACATCATCATCATTAAAAATAAAAGGAAAGTACCTAGTACTTCCCTTTTATTTTTTAGTGTATATTCTATACTTTAAATTATTTTTTATTTAGGTGTTAGGTTTCAATTTATTAGGAATAAAATTATGTGATATAAAAAGTATTTTTGAAGAATATGAATAATATTTCTTCTAAAAATACTTTTTATTTTTTTTATTAATTTTAAAAATAAAATAAATTTTTGTAAAAATATATTATAATTTTCAATAATATCTGATATATTAATTATAACAAGAAGAATTTCATGATTTTATTTAATATAATTATATATTAATAAATGGATTTACTTTATATGGTTTATTTAATGCTTAATAAAATTATAATAAGAATTTATTTCAAATAAATATGTTTTTTATTTTAAGTTATAAAAATTGATTTAAAAGAGGAGATTGTAAATGAAAGAGTATATTATAATGACGGATTCTTGTTGTGACTTGCCTAGTGAGTATATAGAAAATAATCATATCCCTTATATTCCATTAACCTGTAATGTTGAAGGGAAAGAATATATAGACAATTTTGGACAAAGTCTTCCTTATAAACAGTTTTATGAAGCTATGATAAAGGGAGAGATACCAAAAACGTCACAGCCAAGTCCAGAAGCTTATTACAAAGTATTTAAAGAGTTAATAGATAAAGATAAAGATATATTATATGTATGTGTTTCTTCAGGATTGAGTGGAACATACAATAGTGCCAATATAGCTAAAAATATGATTTTAGATGAATTTCGTAATGCTAGAATAGAAATAGTAGATGTATTAACTGCATCATTAGGACAAGGAATTATGGTAATGAAAGCTATGGATATGAAAAAAAATGGATTAACTATTGATGAAGTTACTAGTTATTTAGAAGAAAATAAATTAAATTTAAATAGTTATATGGTTGTAAACGATCTTATTCATCTGAAAAGAGGAGGAAGAATTTCAACAGCTGCAGCTCTTATAGGGACGGTTCTTAATATAAAACCTATACTAACTTTAAATGATGAGGGCAGAGTTATAACTGTGCGCAAAGCTAAAGGTAGAAAGGTCGCTATAAGGAAATTAGCAGAAATAGTTATAGAAAGAATAAAAAATCCAGAAGAAGAAATAGTAGCTATTTCTCATGGAGATTCAGATCTGGATGCAGAGAAGTTGAGAGAACGCATATTAAAAGAGATAAAAGTTAAAGATATAATAATAAACTATGTAGGTCCAGTAGTAGGAACTTATGGAGGGCCAGGATCTCTTAATGTATTTTTTATGAGTGATCATAGACAAAATCATATTATAGATATAAATTAATAAAATAAGGAAAGTGCGACGCACTTTCCTCATTTTTTATCTTTGGCCTTTACCTGTAATATGTTCTATTTCAATCTTTATAATTTTAATTTTATCTTGAGCTCTTTCTATATAAGCTGTCCCTTCTTTTAAATAATCCTTTGAATATTTATTTATAAGAGCTAATAACGCTTGTTTCTTTTCATCTTCAAATACTTCATAAGCTTTACCGAAGGTTATTACACTTTCATAATTTGTATCAAATTTTGAAGGAAGTAATTCTACATTATTTACAATAGAAAATGAAACTTTATCGTTTCCATTTATTGCTTCAAGTTTTTGTCCTTCTTTTGCGCAATGAAAGTAAATAGCCCCATTACTGTAAACAAAATTTAATGGTACACCGTAAGCATACCCATTATTAAGACATACTGAAAGGATTCCATAATTAGATTCTTTTAATAAAGAAATACTTTCCTCATTATTTAACTTTTTTTCTTTTCTTCTTATTTCTTTAAACATATAAAGCCCCCTTTAAATAATAGTATATTATCTAATATTTTAACATTTAATTTTTATATAGTTAAAATAGCTTACAATCCTTTAAAAGTCAACACTATTTCAAAATCCGTCAAAAATTTCGTCAAAAAATCATTTAAAAAATATTTTCAATTATTTTAGTTGCTTTTTTCATCATATCATCGTTAACATGACTATAAGTTTTCATCGTTTGTTCTACTGTATGTCCAAGCAATTGAGCTACAGTCTTAAAATCTACTCCATTGCTTATAAGTTTAGTTGCGTATGTATGTCTTAACTCATGCACAGTAATATCATATCCTTTTAATTTTAGTAATCTATTTAAGCATATACATGATGAATTAGTATTTTTGAATTTAAAAATTCTATTATTTATATTAACAATTTTTTTATGTTTTTTCAATTCATCTAATGTATTTTTGGAAATTGGAATTATTCTATTAGAATTTTTGCTCTTCAATTCACCAAAATTGTACTTGGTAGGGTTAACTTGCTTCCATTGTTTATTTATTATTATAGTTTTATTTACTTCATCTATATCACTCCACGTAAGGCCTAATATTTCTCCAAGTCTTAACCCACATTTTAAACCTAATAGTATAACTAAATAATATTTGTTACTTTTAAAATCTTCTAATAATTTATTTTCTTCATTTTCATTTAATGCCCGCTTATTTACTTGCTGCTTACTTTTATTAAATTTTAAATTTTTAGTTGGTAATTTATCTATTATATTATAATCATCCATGGCAGATTTAAAAATAGTATTAAGCTTTCTAATATATTCTTGTATAGTACTAGGATTCAATCCAGTAAGTGTGAGACTATCCACAATGTGTTGTATATCAATATTAGATATCTTAGCTAATTCTTTATTAGAAAGCGTTACAAAGTGATTTAAAACTGTTTTAAATGCTAATATAGTGTTTGTTGTTCTATATATTTTCAAATGTTCTAAGTACATATCAGTAAACTGCTTGAAAGTTATTTCAGACATTGAAGGATCCATATTATTTTTAACGGATTTTTCTAATTCAACTAAGGACTTATCCATAGCAGTTTGCGCATCTTGCCTTTTCTTAAAACCTTGTTTGCTCTTAGTTTTCCACTTATTGCCTACCTTATAAGTTATTATGTATTGATAGCCCTTATCTTTTTTTCTTATAAGTGTAGAATATTGCAAGGTAACACCTCCTTAAAATTTTTTCATTACTCCAAAATTAGGTTCAAAGAACACTATATAATTATCTATTTCAAATAGAACTCCATATTTCTCTTTATAATGCTGTATAGATGATTCTAAAAAATCCTCCGTAACCTCTAAATGCTCAGCCATTTCATAACGATTTTTAGTACCGGCATTGAAAGCATTAATAATGTCAATAATACCAACTAATTTTTCATATCCCCAATTTCTTGCTCTTTTTTCTTGTTTTAAATTAGATATATTAGAATTGTCTAGTATATTACCACTTGAGGTATAATGATGACCTAGTTCTTCTGCAAGAATGCATCGTTTTTCTTTTAATGTCTCTATGTTTTTATCCAATGCTATTACATTATCTCCATACAACCCTTTGCATTTACCTTTAAATTTCATTTCAACAACTTCTACCCCCTGGCTTTCAGCTTCATATAAAAGTTTATTATACGTCATATGAATCCCCCATTTTGTCTATTTTTTCTTTTTGGATATTATAAATTTTATGAAATTCTCTATATCTTCTACATCCTCATCTGTAAATTCTTCCCCTTCAAAATGTGCAGCCAAAGTTTTAATTTTATTTTCTTGTTTTTCAGGTTGATTAACTTCTTCAATCCCATATTCCTCAGTAGCTTCTTTTACCATGTTGTATACCTTTTTTACAGAATCAAGTGTCATATCCAATTTTTCTTCTGTGTTAAGCAAAAAGTCGGTTGAAACACTAAAAAATTCTGCTATTTTAATTAATACTTCATAACTGGGCTTTCGGGCATTAGTTTCATACATTCCTACCATAGAAGTAGTAACTCCTATGTTTTTCCCTAATTCTTCTTGTGTTATATTTTTACTCTTTCTTAATTTTTTTATTTTATCTCCTAACAAAGTAATCACCTCAAATATATTATTAACACTATTAGTATTATAACCTGTAGTTGTAATAATATCAATACAACTAATAGTGATAATTGAAGCTATAAGAAGCAATAGAAAGGAAATAGCACTTAATTTCTCACTAATGGTTATAATTGCATTTGATTCCTATAACTGTTAGTTGTAATATATACATAAAGCAAATTGAAACGAGGTGATAGATTTGGCAAACCACATTACAACTTTGCGAAAGAAAGCAGGATTTGATACAGCTAAAGAAGCTGCAAAGGCTTTAAATATAAGTAATGGTATGATGTATCAGATGGAAGGTGGATATAAGACCCCAGGTTCACAGTTAGCAATTAAAATGTCCAAGCAGTTTAATTGTACATTAGAAGATATTTTTTTACCTTTTAATACAACTAAGAGTTGTATTAGATCATAAAAAGATGAAAGGTTGAGATTAAAATGGACAAACTTTTAACTAAAAAGGAGCTAGCTGAAAGATGGCAGGTTGCAGAAAAAACGATTGACAACTGGAGGGAAAATGGCGTTTTAACGCCGTGCAGTGGTATACCAGCTATAAGATTTAGCTTACAACATATAGCAGAACTAGAAGGAACTAAAGTGGAAAAATTTTCTCCAATAGAGAGAAGAAGGCTTGAAATAGAAAATGAAAAGTTAAAGCAAGAAAATGAAAAGTTAAAAGGAATATTAGCAAATGTTTTATCTGAAGTATCTAAGATTATTAATTCATAGGGGGTAACAAGATGAAAAAGATAAATTTAACTATAGAAAATGGACAACCTGTAATAACAGAAATAAAACCAGTAGTAGTTAATAACAAAAGGATTTTAACTACAAAACAGTTAGCAGAGGTTTATCAATGTAACGAAACTCAAATACAACAAAATTTTAATAATCATTCAGATAAATTTATTTTAAATAAACATTATTTTTTACTTAAAGGTAATGATTTAAGAGATTTTAAGCACAACATAGATAATATCGAAGTTGCCCCAAATGTAAATAAGCTTTACCTATGGACAGAAAGAGGAGCAAACCGACATTGCAAAATCCTTGATACTGACAAGGCGTGGGAGCAGTTCGACAACTTAGAGGAAACTTACTTTAGAGTTAAAGAAAAGAATTTGCCACCTATGAGTATAGAGGATATTTTAATAGAAAATTTACAACAAATGAAAGATGTAAAGCAACAACTTAATCAAGTAAATTACACTGCTTTAGAAGCTAAGCATGCATCAGAAGAAAATAAAGAAAAACTTGAGGAATTCCCTTTATTTACTATAGATAGTAAGGAATTAAGTAAAGTAGTTAGCAAAATTGCAATTAAATGTTTAGGTGGTAAGGGTACTCCAGCATATAAGGAATTAAATAGAAAAGTATTCTCAGACATATACAAACAAGTTTGGAGAGAATTTGATGTAACAAGTTGTGCAGCAATAAAAAGAAAATATTTAGAAGATGCCAAGAAATTTATAAGTGAATATAAATTACCAAGAGCATTAGCAAATGAAATTGAAACATTAAATAACCAAGTAAGTTTTTAGGAGGGTGGTAACCATGAAATGCCCAAAGTGTAATAAGGAAACCAATGGTATTAATTTTTGTATGCAGTGTGGAGCTAAATTAAATAAAACATGTAAAGAGTGTTGGATGAAGAATAGGCAGCCATATAACTGTGGTTTTGAAAAATGTCCAGGCTATAAGCTACCTATTATTGAAAAATTAAAGCCCTAAAGATTTTTTTATAGTTTCAGAAGCTACATCTACAAATATATCTCTTATGCCTTCAGCAGTATATGTAGCAGCTTTACCTAATAATTTCTTAAATCTAACTACAGCAACTTTAGTTTTAGGGGTAGGAGATTCAACTAGTAAATCTGGAATAGATTCAGAAAATTGCTGTTTTTCAATTTGACTTAAATTTTCGTCCTCATTTATTAATAATCTTGCTGATTCTAGTGCAGATTTAGTCCAAGGATATGGTTGACCACAATTATAACAATAAGCTGGCGTAGTATGCATTGTTGACCCAAGATAACATACAGTATCAGATTCATAATCACCACGAATATTAGCACTACAATTTGGACAAGATATTATAGTTTTAGAACCACATTTAGTGCAAAATTTTTCACCAAACTGAGGAGTTGTATCATAGCTATCAGTTACAATATGACCGTTTAAACATATTTGAGCAATGCGATAAGAACCCATAAAAACACCCCCTTCCAACAAAATTCTACCACAAAGGGGACAAACAGTAAAAGGAGGATTAAAAATGAGTAAAAAAATAAAAACAACAGATTTAAATTTAAATGTTTCTACAGGAACAATGCTTTATGTGGATATAGATATTTTTAGATTCTCATACGATCAAGAAATATTTAACTTAACTATTAAAATACTTGATGGAGAGAATTATGAATTTTTCGAAGAAGTTGATTTGCCAGAAGATGAGGCCATTGTAGATCATAATGATCTGAAAATATTTGCCCTAAATTGGATATTTAAAAATGTTGAGGTAGTAAAGGAGATTTAAAATGCTAAGAAAGTTATTAAAAGAAAGGGGAATTAATTTAACAAAAGAAGAATTTGCAATAGTTGCTGAAATTACAACAGATGATATTAAGTTTAATAGAGTTAGCTTTAGAAAGTGTACAAGCTTAAATTATGTACTATATATTGCAATAAGAAGTGCAAGTATTTTTAAAAGATGTGCATAGAAAGAAGGTGTAAAAGATGAATGAAAATTGGTGCATATTAGCGATAGCTGCTCTTTATGAAAGACCTTGCACAATAGAACAAGCATTTGAAGTGTTTGATAAAGGTAAACTTACTAAAAATAAGAAAAAATCCCAAGAGGATATAGAAGATATGGTTAAGTTTAGAAATATGGGAATGACCTTTGAAGAAATAGCAGATATATATTGTGCAGACAAAAGAACTGTATGTAGATTAATAAACTCTTTTAAAAAGAAAAAAATAGCTCCCTGCCAGGAGCACAATAATTAAATAAAAATTCGTTAAGTACAGTTTATAAGAAAATTTAATGTTTGTAAAGATAGGTGTGATTATTATAGCTAAGAAGTATTATTGGTTAAAGCTTAAAGAAGATTTCTTTAGGCAAAAAGAAATTAAAAAATTAAGGAAAATAGCAGGTGGTGATACATATACAATAATTTATTTAAAAATGATGCTTTTAAGTTTAAAAGATGAAGGGAAATTATTCTTTGAAGGGTTGGAAGATTCTTTTATAGATGAAATAGCTTTAGAAATAGATGAGGATTTAGAAAATGTAAAAGTTACAATAATGTTTTTAATTAAATGCAGATTAATAGAAGAACTTACAGAGAATGAGTTTTTAATGACGAAGGCATATGAAAGTATAGGTAGTGAAACACAGTCGGCTGAAAGGGTTAGAAGGTTTAGACAAAGAAAAAAAGCGTTACTTAGTAACGGTGAGGTAACAAAGAGTAACACAGAGATAGATATAGAGAAAGAAAGAGAGATAGATATAGAGAAAGATAAGATAAAGATAGACTGGAATAAAATATTAGAAGCATGGAATGCATTACCAGAACCAATAAAATCAGTACGTTCCATTACAGATAAAAGAAAAAAGAAAATAAAAATTAGAATGAAAAATTTGAAGTTGACACAAGAAGATATATTAAAAGCAATAGACAAAATAAGTAAAAGCAACTTCTGTAAGGGAATTAATAAGAAAGGCTGGACAATAGAATTTGATTGGTTATTCAAAGATGATAATAATATTACAAAGGTTTTAGAAGATAAATATATAAACAAGGATGGTAAATATGGAGATAGAGAAAATAATTCAAAGGATAAAAGCCAATATGACTTCAATAGACCATATACAGGACCAAGTTACAGCGACCAAGAAATTGACTTCTAATATATGCCACATATGTAATGGTACAGGATGGGAATTTGATAATGAAACAGAAACATATAGAAGGTGTGAATGTTATGAAAAAGAGAAGTTGCAAAGACTTTGGAATAAGTATGGAATAGATCCAAAGGACATAAAAAAACTAAATGAGTACAAGCCTATTGATGATATACAGATATCTGCAAGAGATAAAGCAGTAAAATATATAAAAAACTTTGAAAATATAAAAGATACTAAAGAAAATGGATTCGGATTATTTGGACAACCAGGGGCAGGCAAAACACATATCTTATTATCCATAGGTGCTGCACTGATAACAAAAGGTATAGAAGTTATATATATGCCTTACGTTGAAGTAATGAGGGAGTTAAAAGCTACAGCAATGGATAATGAATACTATATAAAGTTATCATCTAGTTATATGAAAGCAAAAGTTTTAATTATTGATGATTTATTTAAAGATAAGTTAAAAAATGGTGAATTAGTTGGAGAGTTAAGGGAAGCTGATATTAAACATCTTTACCCTATATTAAATTATAGGTATTTAAATAACTTACCAACTTTAGTGAGTACAGAATGTATTCCAGATATTCTACAAAAATTAGATAATGCCCAATGCGGAAGAATGATAGAAAGATGCGGAGATAACATAACAATATTCAAAGGACCCAAGTATAACTATAGAATGAGGAAATTTGTTAAATAAGAGGGGTGATAGTATGCAATTAATGATTTTAAAGAATAGTTCTAAATTAGGAATAAACAATGAACTATTAACATTGGAAAACCTTATAGATAAGTTACAGGAAGAAGTAAAAGAACTAAAAGATGCCGTAGAAGATAAAAACAATATAGATCATGTAGCTGAAGAAGCTTGGGATAGTTTGCAGATGTGTATAGAAGTTCTGGACAAGCTAGAAAGTAAACATAATGTAAATTTAAAAGCAACGTTAAATAAACATCATAAAAAAATTAAAGATAGAGAATGGAAGGCTAAAAAGATGATAGTTTTCCAAATATTCAATGACTATCATTAGGTCGGAATATGAAATTTATGCGACATAAGGGGGTGAAGATTTGAAGGTTTTGAAATGGCCGGGAACTAAATGGAGTATAGCAAATAAAATAGTGGATTTAATGCCTGAACATAAAATTTATTTAGAACCATTCTTTGGTTCGGGAGCAGTATTTTTTAGTAAGCAACCTTGCAATACAGAAATACTAAATGATTTAGATAGCGAAGTAGTTAATCTTTTTAGATGTATCAGAAATACGCCAGAAGAATTGGCCAAACTTATTTATTTTACTCCATACAGTAAAGAAGAATACAAAGAATCTTATAATCGTTCCGGAAGTGACATAGAAAGGGCAAGACAATTTTTAATAAGATCTAATATGGCCAGAGCAGGTATGCAATATTATTCTTCCAGTTGGAGACATGCAGGGCCAGTACTAGGAGGACAATGTAAACAAAGAGTAAGTGGAGATTGGAACAAAGTTCCGGAAAGAATACTTCAAGCTGCAGATAGGTTAAAAGATGCGGAAATAGAAAATACAAATGCTTTGGAATTAATAAAAAAGTACAATAAGAAAAATTGTTTAATATATGTTGATCCACCATATTTACTAAGCACCAGGAGACAAAGGTATTACAATGTGGAAATGACAGAGGACCAGGAGCATGAGGAACTAATCAATTTATTAAAAAAGCATTCAGGACCTGTAATGCTTAGTGGATATAATTCAGATTTGTATAATGATCTACTAAACGATTGGAGTAAAGTTGAGATAAAAACCAATGCAGAGCAAGGAAAAGAAAGAATAGAAGTTATATGGACCAATTATGAAATACCAAAACAAATTTCATTATTTGGTTAGTTAATATGATATAAGAATTAAAATAATTGTTCTTTGAAAATTGAATAATACGGTGGTTTAAAACTATTATTTTTTTCTATCTATCGCTTATAATATATGGGATATATGGTATAATTTTTTATAATGATTAAATTACACTTATGAAACAATATTAAAAGCCGAATTTATAAAAATATAAGTTTAATAATTAACTTATTAGTGTCAGAAGTGCCATAGTTAAGCGAAAGATTTTAAGGGGGATGAAAATGGACGAACAACAATTTTTGAAAACAATGATTGAGACAGTAAAGTATGATGATGAGTATAGCAATAAAGATGAACTACTTGGAATTTTAAGAAATTCTAAAATTACATATGATAAAACTAGTGATTTTTCACGTAAATATTATCACTGTTGGGAGTATATTGACTTAAGAGCACCTGTGCCTATGTTAACAGTAGCTAGAAAGTTTAAAAGCGTTTTAGGAAAATTAGCAGCAGACGTGTATATTGAACCAAGTGACTATGAGTTTGGTGGCTTATGTATAAAGCCAAAACCTGTAGAGCTTGATAGTGAAGAATATACTGAACACAATGTTTTCTTTGATGAAATAAAAGATACAATAGTTCAAGGTATTCGAAATGCGAAATATACAATATGGGCTGCTGTAGCTTGGTTTACTGATACAGAGATATTTGAGGAATTACTGTTAAGAAAAAAAGATGGTGTAAATGTACGAATTATAACATCAGATGAAAAATCGAATCAATATTTAATAGAAAAGCTTGAAAGTAATTTTGAAGTTGTGAAAGTGCCGCTAAAAGGTACTTATTTATCAAACAGACTTCACGATAAATTCTGTATCATTGATTTTGAATTTGTAATGCACGGTTCATATAATTGGAGTAAGAACGCTAGGGGAAATGATGAAACTTTAGTTACTGCACTTGACAGAGACTTTGTAAGAAAATTTGCAGATGAGTTTATGAAATTATATAATGAAAACTAAAACTCAACATTCTTATTTAATTTTACAACTAAAAAGCGAATCAGCTATTAAAACACCGTATTATTCAATGAATTTTATGGTGTTTTTACGTCGTAATCCAAATAAATTACCAAGGGGAAGGAGAGACAGTGGAATGAGTAAAAAATGTTTGCTTTTATGCAATAGGCACAACAGCATTTATGGAGATAATTGGTGCTTATGGTGGGGTGAAAGAGAAAGTAAAAGTGGTTATACAAGTGATATAAGATTAGCACATAGATTTAATGAAGAAGAGATTAAGGGGTATGCAGAAAAAGGATATGACATACCAGTACCAATAGATGTAATAGGAGTATTGGAAGAGTATGAACCAAAAGAAACTTATAATAAAAATTTAAGAGTAATGATAGAAAAAGGCACTCTAAATGAATTGATGGAATTAGAATTAAAACCTTTGTTTCCAGATGATGAAATTATATGTCCTAATTGTGGGAGTTGTCATTATAAAGAAGATTTTGATTATATGGGAAATGAAATATTAATATGTAAAGAATGTGAATATGAGTTTAGCGAAGATGATTTATAGTTCATAATTCAAAAATTTAATGAAGTAAAAGGAGAGATAAATTATGAGTTATGAAAAAGACATAGAACATGAATATACAAATGAAATTGTGTGCCCATTTTGTGGTTATGAATTTATTGATAGTTGGGAATATGGTGAAGAAGATTTAGGATTAATAGAGTGTAATGAATGTGGGAAAGAGTTTTATGCAAATAGGGATATTTCAGTAACTTATCTTACATGTAAAGCTAATTATGGAACTTGTAAACACTGTAGAGACGATAATGTAGTGATTGAAGATTATAATTCAACAGTAGGTAAATATAGTGGTTTATGTGTTAAGTGTGGCGAGCTAGAAAAGCAAAGATTACTGAAAGAATATTTTGATAGTATTCATAACAAGAAAGATTGTTAGAATGCAATTCAAAAAATTTTGGAGGGATAATATGAGGTTAGAAAAAGTTGAAAATAGAAATAGAGGATATGACATTTATTTAATTATTGCTAATAGAGATTATAAAAGTTGGTGGACCTCTCCACCTAAATCAGTAGATCATGCTGGACTTGAATACTTAAAAGATAGATATCCTAAGATAAACACCAAAGCAAGAATGGAAACTTTTAAGGAATTATATAAAAATTTATGGATTGATATTACAAAAACACAAAGACAAAATATGAAACATTGTATAGGATTGGACTATAAAAAGAAACCCTATAGGAATTATTATTGTACAAGCCATAAAGATGAAAACTGGAATAACCTTGTAGAAAAAGGTTTAGCTGTTAAAAGTTCTAAAGAACCAAATAGTTATGGTTGCACATGCTTTTGGTTAAGTAAACAAGGTGTTGAATTTATACTTGATAAGTCTATAAGTGATAAAGTTTATGAAGAATTATAGTTTGTAATTAAAAGAAATGAAATTATTATGTATCAAAGGAGGATTATATGGAGATTTATATTGCAGGTAAGATAACAGGTTTAAAGGACTATAAAGAAAAATTTAATAAAGCACAAGAAAAGCTAATTTCAAAAGGTTATAAGTGTATGAATCCTAGTGTTTTACCAGAAGGATTTCCATGGGAAGTTTACATGCCAATTTGCTATGCAATGATTGATGCTTGTAATTCAGTATATATGTTAAAAAATTGGACTGATAGTAAAGGTGCTAAGTTAGAGCTAGAATATGCTAAAAGCAAAAATAAAAAAATAATTTTTGAGTAGTCTTAAATATTATATGGAGGGAGCTTAAACATGCAATATGTAAAAGAGATTAATATTAATGAGGCAGTAGTTCATATATTGGACAACAATAGTGAGGAGCCAGTATTAAATGAATATAAATTAAGATTGGATGATGAGTGTTATAAATATATATTAAAACATGTAGATAAATGCCTAAAAGATGAATGTCTAAGGTATGCAAAATTCAATGAAGAGAAAAATGTAGTAAAAGAAGTTTCACAAGAATATTTAAATGGCCATAACGATTTATTAGATGTTTCTAAGGAACTGGCTAAACAACTTTTTATATTGATGAAAGGCAATGATAATATATCTTCTTGCGATTTAATGATAGTTTCTATATCAACAGAATATGGCCCAATGTTAGCCATATTAAAAATGGATTATGTTAAAAATTATATTCATGTAGTGGATATGGTAGAGGATAAAGTAGGTATAGATATAGTGCCAGAGTTTACAGGATTACCTGCCAGTGCTCAAAAGATAGAAAAGTGTGCATTTATAAAGCCTATAAGAGAAGATCAAGAATTTAATTTGATGGTTATAGATAAGCAGAAAAAAAATAAAACTAGCGAGGAATATGGATCAAATTATTTTATAAATAAATATCTAGGGTGCAGCATAATAGAAAATGAAAGGGATTCTACAAAAGCATTTGTACAAGCTACGGAAAAGTGGTCTAAAATCAATTTGAATGAAGATGCAGCAACATCAGAAAAAATAATAAGAACAGTAGGAAAACTATTAAAAGAAAAAGATACTATAGACATAGAAGAAGTTTCTAATGATATATTTGGCGAAAATTCAGATGCTAAATTAAATTACGAAGGATTTATAGCAGAACAGGGTATAAAAGAAAAAATAGATGTAGACAAAGAATGGGTAGATAAAAAATTTAAAAGAATAAGATTAAAGATAGATAGAGACATAGATTTGTATATAGATAAAGAATCCTATCATGATGATTCAAGGTTTGAGGTAAAAAGAGTAGGGGATGGATCAGTAAATATAGTAATTAAAAATGTTTATAATTATATGCAAAAGATAAGTGGAAAATAATAATATAAATTAAAACTAAATAGGTGTAAGGATTGAAATGTATATTCTTGCACCTTAACTGTACTAGTGTATTAGAACTATATAACATTAAGAAAGGGTGTTATAAGTGGCTAAAAAACAGATAGAAAATGTCTTGATTGATGGTCAGGTAAGTATTTGGGATATAGATAAAAATATTAAGAAAAGTAATGGTAAGCCAGTTATAAAGTTAGAAAATAAAGAAATAAAAATAAATAATATTGAGCAAGGCAAAATCATAGCAAAGTATAAAACATATGAGAATTTAAATAGAATAATAGGATATGCTGGTGGAGCTTTAGGGATTGAAATTAAATATAAAGATAGATTTGAAACAATTTATGTAAATAAAAAAGGTGAAGAAGAATTTGTAATTAAGAAAAAATCAAGTGTTCTGCCTTGGGATAAGATTATTTATTTCAGAGAAGATTTAAAAATAAATAACATACAGAAAGAAAAAATAAAGAAAATAAAAGGACAGGCTCTAAAAAGACCAGGAGACGAAAATATAATTTTTAATCAAGGCAATAAAGTAATAAGTGTCATAGAAAATGGATGGGTATTAGAGTATGACAACATAAAGATAGCAGAGCTAGAAAAGTATAAAAAAATAAATGCAGATAGTATGGATCAAGATTTTAAAAAAACTTTAAAGCTAGGTAATATAGTTGAAACAGAATATAAAGATGAAATTATACAGGGAAAAGTAGTTCACATTTATAATAATGGATACACTTGCAACATAATTGAGGGAAATAGATATATACCTATTCCTATATGTGGAATTAGGCAGGTGATAGCTTGAGCTGGATAGATGAAATATTAGATAGAGCATTAGAGAATGTTAAAAAGTATTTAAAAGAAAAAGACAAGCCTTTGAAAAGATATAAAAAAAGAGTTAAGAATAGAAACATCTTGTATAAGAAAAGGATGAAACTAGGTAGAGTAAAAAGAAAAGTAAGAAGTGGTAATCATGGAGGAAAATAAAAAAAGATTCATGGATTATGTAAATTTAAGATTAAAGCAAAAAGAATATAAGAAAAGATTATTATATTCAGATATTGCAGATTTAAGGATTAAGAGTATTGAGAAATCAAGAAATAGAAAAAATGGTCAGTTCTAGGAGGGAGCATTGTGTTAAATAAAATATTAGGAGCTGTTGCAATATTAACTTTTATATGGTTAGTGGCATTTAAAAAGATAGATAAAGAAGAAAATTCAATGTGCAAATTTAATTGTGAATATTGTGGTGAGAATGATGTTTGTGGCATAAAGAAAGGAGCAACAAAGAGCTATGATGAATAAAAAAATTTATGAGAAATATAAAAAGAATGCAGAGAATGATTTAAGAAATTATCCATATTGGTTGTTGGCCATAGAGACCCCAGGGTTAGGAGCACCTAATAGATGGGGACAACAAGTAAATCAAAGTGGATATTTTAAAACAAGTACTGTTGAAGAAGATATGATAAAAGATATGGAAAGAAGATGGAAAGTTGATATTATAACTAAAGTATTAAAACATTTAGATCCTACGAGTAAAACAATAATTGAAGAATGGTATTTTAGAGATAATAATTCCAGAGAAGAATTGTTAAAAGAATTAAACATAGATAAAAATAAATTTTATTATTATAGGAACAGAGCATTAAAAAAATTTATGGTAGCAATAGGATATTTAAAATAATAAAAAAGTTAGACAAATTACAGACAAATTACAGACAATTTTAATGCAATAGTAAGAAACATAATATATTATATGATATAAGGGTTAAAAGCCCACGCAGGGGTTTTATCGTACAATAAGGCAACTGCGGAAATAAAAAATAAATATATTGTGTATATGTACTAAAAGCACTTAGCCAGTATTTATTGTATGTAACTACTGGCTAAGCGTTTTTGCATATAGCTCTTTAATAAGGAGGGCAATAACTATGGAAGTGTATTGTAATAAGTGTAATAAAGACTTTGAAATAAAAGCTAAAGAGAAAAAATATGCAGATGGGATAGTAGAACTTTATTTTAAATGTCCATATTGTAAAGAAAGATACACATCGTTTTTTACTGATAAAAACATAAGGCATAAACAAAAGAAAGTCAGAAAATTATATGAACAATATGGTAAAGAAACAGACGAACATAAAATAATAGAGTTACTTAAACAAATAGATGATCTTAAGGCTGAGATAGGTAACGATATGAATAAGTTAAAGAATAAAATGTTAGGCACTCAATAGAGTGCTTTTTTTATAAAGATGTGAATATGAAAGGATGTGCTAAGTATGTATACAAGTTACAAATGCATCTGTTGCAATAAAGAATTTGTTTTATTAACAGAAGAATTAGAATATATAAAAGGATACTTAGTATGTCCCTATTGCAGCAGTAGGAAAGTTAAGAAAGAGAAAGTAAGTGATATTCTTAAAGAGTGCATGAGTGAACGAAGTTATAAAAGAATTAAAGGTGTATTAAGGCAGGTGAGATAGTTGGGGATAAAAAGGCCTGCTAAAGCAATTACTAGTACAACTAAAGTATTAGATATACAAGACTATCTCAGATACAAAAATGAAAGAGATTATGTATTATTTATACTAGGAATTACAACAGGGTATAGAGCAGGTGACTTAGTTAAATTAAAGGTTAGAGATATTAAAGAAGCCTTAAAGAGAAATGAATTTACAATTTATGAAGGAAAGAAAATGAATTGTAAAAACATAAAAGAGAGAAATAAAAAACCGAGATCGGTTGAGGTACTTCCTAAGCTAGCTAAAATATTAAAAGGCTGGATTAAAAATAAAAAAGATTATGAATATGTATTTCAATCTAGAAAAGGTATTAATCAACATATAGGAGTACAGGCAGTAAGTAACATATTAAAAGATGCAGGAGAATATTTTGGTTTACATGATATAACTGCACATAGTATGAGGAAGACGTATGCATATAAAATATACATGGAAAGTGATAAGAATATAGTTGCAGTTAAAGAGTTATTAGGTCATAGAAGTATAGAAGAAACTAAAAAGTATATAGGATTAGATAAAGAAAAATATCATCAGTATTCAAAATCATTAGAGGAATATATTAGATGATATTTTATTTTTTTTATTAGTCAATGTTTAAAAAATTATATAGTAAGTATTGAAGGTATAAAATTAAGTGCATATATTAAGAAGTTAATTTTTAAAATGAATGTGTTATTCACATATATAATTAAACATTCGGACAGATTTTAGTCATATGTACAAAAGCTATATATATCAATGCTTTCAAAGGGTTTTGTTAATAAATGTTATTTTATATTTCTATACTAAATTTAAAAAGTTAGGAAATATAAAAAAATAGCGTAGCACTTTACAAAGCAAGTGCTACGATAATGAGGTGAAAAAATTGGCAAGAAGTGATAGCTTTGAAGACATAATTGAAAAGCGTCTAGATGAGATAGAGCAATGGGTTGAAAGTAATAACACGGATAAGGAAATAGCTGAAAAGCTAGGGATTGCATATTCCACATATAGGAAATATAAGAGTACTAACGTAGCACTTAAGAGCCGAATTGCTACGGCAAAAGATAAGAAGAACCAGGAAGTAGAAAAGGCATTGTATAAATGCTGTATTGGATATCATTACTACGAAGAAGTAATAACAAAAGTTAAAACAGAAGATGTAGTTAATGGACAAATAATAACAAATGAAGATGTTAAGATAAGCAAAGTTAAAAAGTATAGAGGGCCTGAGTTAAATGCACAGAAGTATTGGTTAAATAATAAAGAGAAAGCTAAATGGAAAGAAGACCCACACAAGGTTTCTAATGATAAGAAGCTTACTAAGCTTAAAGAAAAAGAAGTTAACTCAAAGGTTATAGAGATATAATATAGTGCCTATATATAGAAAGTGTACCGAATGTGGCAAGAAAGTAATGCAAGGTAAGTTATGTAAGTGTGAGTATAAGAAGAGAAAGGAAAGATATAAACAATATAAATATAAAAGGTTACAAGATTTAGAAGAGAAAGAAAGACAAAGGTTTTATAGCAATAGTTTCTGGTTAAAGTTATCTGAGAATATAAAGAGGCATTACGTTGGTTTATGTGTAGTGTGTTGGTCTAAAGACTTAACACAAGAGAGTGAGTATACACACCATATAGAAACTATAAAGGATAGATTTGATTTAAGATTGAATGAAGATAACTTAATACCACTATGAGATTGTTGCCATAAGAAAGTCCATAGATTAATGGATAAAAGTTATAAGGATAAAATTATGATACAAAAATATTTAAAAGATTTAATAGAAAAGTTTAATAAAGAATTTTATTAGTACCGGGGGGAGGGTTGAAAATTTTTATACAAACTTAGAAAGTCCCTGGTGCCCTCTCAGTCGCATAAAATTCCCAAAATGAAAGTTTTAAACTTTAAAGTAAAGAAGGTGAAAAAAATATGGCTAGACCATGCAAAGTAATAGACAGTCAAAGTAGACATAATACAAAAGCTGAAATTGAAGCTAGAAAAGAAAAAGAAGAAAGAATAAAAAGTCTAGCTGATAAAATTGAAAAGCCACCAGAATATCTTTCAGAAAAACAAAAAAATATATATAAATTTATTGTAGAAGAATTAAAAATGACTGGAATATTAACTAATCTAGATGTCTATATTTTATCTACATGTGCAATAGCAGTAGATAGATTAAGAACTATAGAAACAATAATAAATAAAAATGTAGGTAGTTTATGCAATAAGGATTTAATGTCAGCTAAAGATAAATATACTAAGGATTTATATAGATGTTGTAATGAATTAAGTTTATCTCCACAGAGTAGAGCAAAACTTGGAAACTTAGCATTGAACAATAAGGAAGAACAAGAGGATCCATTATTAAAAGCCTTAAGAGAAGATGATGAAGATTGATACTTTTAGATAAAGCTTTAAAATATTGTAATGATGTTATTGAAGAAAAAGAGATTACGACTGATGAAGTGAAGCAACAATGTGAAATGTTTTTATGTGATTATAATATAAATCAATATAAAGAAGAGTTTGAATTTTGCTTTAGTGAAAAAAAACTTAAAAAAATAAATAATCTTTTGAAATTGTTTAATTATGCTACTGGATTTGTGGCTGGTAAACAAGTATTAGAAAATTTAGAAGGGTTTCAAGCTTTATTTATTGCTGCCATTTTTGGATGGAGATATAAGAAAAATAAAAAGAAGTTTAGATATAGAGATATAGTTTTATTTATACCTCGTAAAAATGCAAAGAGTTTTATAGCAGCCTTAGTAATCCTCCTTTTAATGCTTACAGAACAAAATTTTAGCGAATTCTATAGTATATGTATAGATAGAGATTTGGCAAAAGAAACAAGAAAAGCTATGGCACAATTAATTGCATCAAGTCCAGATATTAAAAAACATTTTTTTGTATCAGATAGTGAAATAGGTATAATTAAATGTTTAATAACTAATAGTTATTATGTCCCGAGGACTGCAAAAGCAAATAAAAACAACTCTATAAGACCTGCATGTTTTGTTGCTGATGAGGTAGGAGCTTTTACAACAAATGATAATATTCAGGCAATGAGAAAAGGTCAGTTAAGTGTATTAAATCCAATTCAAATGCAAACAACTACTGCTTATGCTGAAAGTGATTCAATTATGTTGGAAGAATTAGAATATGATAGAGCTGTATTAAATGGAGTTGTTGCTGATCCAAAGTTATTTTGTCTGTTATATTATTGCACAAAAGAAGAAGCTTGGACAGATAGAGGATTATATAAAGCCAATCCTCTAAGAGTTGAAGAAAACTATGAAGAGATTAGAGCAGACAGGGAAAAAGCTAAAATAAAGACAAGTGAACAGGAAGAATTATTGACCAAAAACTTTAATATATTTCTTGAAACTAATGAGAAAAATAAATATCTTGATATAAAGCACTGGAAAAAGTGGGTTATTACTGAGGAAGAATTTAAGCAAAGAATTAAAGGAAAAAAGGTTAAAGTTGGGGTTGATTTATCAGTAACTACAGACTTGACAGCAGTAGGGATAGAGTTTGAAGATGAAGGCATAATTTATTGCAATTCACATGGATTTTTGCCAGAAGATAGTTTACCTAATAGAAGAGAAAAGCATATAGATTATAGAAAATATGAAAAAGCAGGTTATTGTGATATTCATTCAGGAATGACAGTAAGTTATACGAAGGTTGAAGAATATATACGAAATATAGAAACTGAATATGAATGTGAAATTGAGGTAATAGTAACAGATCCAATGAATGCAAAAGAAATGATGGAAAGGCTTGCAGAGGATTATGATGTTGTACTATTAAAGCAAACTTTTACTAATTTAAGCCCTGCCACAAAGGAATATAGAAAAGCTGTATATGATAAAAAGATAAGATATGTTAAAAATGAACTTCTTGACTGGAATATGAATAAAGCAAGTACTACTAAGGGCAAAGCTGATGATGAAATGCTTATTAAGGAAAATAAAAATAAGCAAAGAATTGATATGGTTGTAGTTTTAATATTTGCTTTTACAGAATTATTAGGAGGAGATACAAATTATAATCCAGTGGACGAATTAGAAAAAACAGATTGGTAGAAAGAAGGTGATAAAAATGAAGAAAAAACTTAATAAATTACTTAATAAGACTATTTTAAATGATATTTTTATCATGGAAATGGTCTTTTTTATTGGACTTCTTATCATTATTTACACCAATTTTAAGGTGAACTTGTACTTTGGACTGTATTTCTTAGGTATCATTCTAATAGCTTTTAGTATATTTTTATATAAATTTAGAGGAAATCGAGGTGAAAAGAGGTGAACGTAAGTGATTTTTGATAAATTAGTTGAAAGAAGAGAAGCAGTTGACGTAAATGATTGGAAGTCAGTATATTCTTTTGAAAATGGATATGATATTACACCTTTTGAACTTGAAATGAGGGAAAGCACATATTTTAGTTGTATAAATAATATATCTCAAGACATTGCAAAGTGTACATTACAAATAAAAAAAGAAATAGAAAAAGGAGAAGTATTAGCAAAGGAACATTATTTATATGATTTATTAAGATTAAGACCTAATCCTTATATGAGTGCTATAGATTGTTATAAAACTTTTGTAGCGCTAGCTAAACATTGGGGATATGCAGGACTTTTTATTGATAGGCAAAGAGGAAAGGTAAAAGGTTTATATCCTGTTAAAATAACTAATTGTACAATTGATAATACAGGATTAATTAATAGCACTAAGAATAATAAAATTTTATGGGATTTTGAAGGGGTAGATGGTGAAACAGGTTGTTGCTTTGATAAAGATATAATTATTCTAAGAGATTTTACACTTGATGGAATAAAGGGCAAAGCAAATAGAAGTATTTTATCAGAAAGCTTAGATAGTAGCTTAAAAAGCCAAAATTATTTAAACAAGCTGTTTACTAATGGATTAACTAATAAAATTGTTGTGCAAATGACCTCAGATATTAAAGAGGAAAAAGAGTTAAAAAAGGTACAAGCTAAATTTGATAGAGTTTATTCAAATAATGGTAAGATATTTACTATTCCAGCAGGTTATAATATACAGCCATTAAATTTAAGTTTATCAGATGCACAATATACAGAGTTAAGAAAGTTGTCTAAAGAAGAAATAGCAATGTCTTTTAGAGTACCATTAACAAAATTAGGATTCGTAAAAGAAAATGCTAGTTCTGAAGAACAAGACAACATAAAATATCTAACTGAATGTTTGCTTGTTATATTTGAACAGATAGAGCAGGAAATGGATTGGAAATTATTAACGCCACGAGAAAGAGAATTAGGATACAAGGTAAGGTTTAATATTAATGTGCTACTCAGAACAGATAGTAAGACCCAATCAGAAGTGATAAGCACATATGTTAAAAATGGAGTTTATGACTTGGACTATGCTAAGGATATTGTAGGAGTAGAAAAAATAGGTGGAGAGCTTATTATAACCTTACCTTCTGGACAAGTATTATTGAGGGATTTATTAGCTGGAAATGTGAGCTATTTAAATAAGAAAGGAAGTGATACAAGTGAGGGTGGAGATAAGAAGTGACCATGTAATTATAGAAGGTTATATTAATGCAGTAGAAAGAGATTCAAGACCAATGCCAAGTCCTAAAGGAAAATTTGTAGAACAGGTAAGATCAGGTGTATGGAAAAATGCTATAAGCAAAAATGATAATATAATATTTTTGCTTAATCACAATAATAATAAAAAATTAGGTACAAGCAAAGAGAATTTGAAACTTAGGGAGGACAACATAGGATTATATGCTGAAACTAGAGTTTATGATCCCGAGGTCATTAAAAAGGCAAAGGAAAATAAATTAATAGGATGGAGCTTTGGATTTAAAAAAATTAAAGACAGTTGGGGAAAAACGGATGATGGAATTGATAGAAGATATTTAGATGAAATTGAGCTTAGAGAAGTTTCTATATTAGATGATAGCAGAATACCAGCGTATTATGGTACAAGCGTAGAAACTAGAGAAAATGAGGAAATAACAACCGAATTAAGGTCATTTGAAGATATAGTTATTGAAAAAATAGAAGAAGATACTTCTAAAAATGAAGATGAGAAAAGAGAATTAAAACTTAAATTATTAAATTTAGAACTGGAATTATAACAGTTCTTTTTTTATACAAAAAATTAGTAAAGGAAAGGTGAATAAATAATGGGATTGGAAGAATTAAGAGCACAATTAGAAGCTAAGAAGGTAGAAATTAGAGAATTTATAAAGGATAAAAAAGTAGCTGAAGCTGAAAAGGCAATGGAAGAAAAGAGAGGTCTAGAAAAGTTAATTAAGGCAGCAGAGGAACTAGAGGAAGAGGAAAAAAGAGATCTAGAAAATCAAAGAAAAAAGAAAACTCAACCAGAAGAGAACAATGAGTTTAGGGCTATAGTTAAAACAGTAATGGGAGAGGAAACAACGACAGAAGAGAGAGCAAATATAAAATCTGTAGATAATGCTGCAGTTATTCCAAAGCAATTCGTAAATAAATTAATTGAAATACAAAAAGGTTTTGGCTCACTGAAAGGGTTATGTGATGTTATACCAGTTACAAAAAATGAAGGTACTATACCAGTTATTGACCTAGATCAGAACGAAATGGCAGATGTTGCAGAGGGCGAAGATATAGTAGATGGAACACTTGTAACTACTGATGTACCTTTTAAGTGTGCTAAAGTAGGTTTAATTCAATCTTTAGCGTCTGAAACTGTAGATGATGCAGAAGTTGAAATGGAAGGTTTAGTTAAAAAGAACTTTGCCAATATAGCAACAGTTAAAGAAAATGCTAAAATATTGAAAGTAATAAAGGACAATGCTACTGAGGTTGTTGGGGTGACTTCTTATGAAGATGTAGAGAAAGCTATTGATGGGTCTTTACCTTCTATAAAAGCTGGATTAGTTACCTTAACTAATGTGGCAGGATATGTAGAATTAAAGAACAAAAAAGATAAACAAGGTAGATCATTAAACCTTATAACAAATATAAACGGAGTTGAGTATTTCCACGAGAAACCAATTATTACTGTAGATGATATCTTATTACCAGTATCAGAGGGTAAAACACAAGTATTTTATGTAGCTAATATGAATGAAGCAGTTAAATATTGCGATAGAAAAGCTGTAACTATCGCAAGAAGTACAGAAGCAGGGTTTAAAGATGATACGGTAAAATTAAGAATCCTTGAAAGGTTTGTACCAGTTCTAGGAGCTAAGAGATCTATAAAGAAAATAGAATTTTAATGATTGGGTGGCTTAATGCTACCCTTTTAATAAGCAGGTGATAATATGACGGTTGAGGAAATAAAAGATTATATAATAGTTGATGATGAATCTGATAGTTTCCCAGAGGAATTAATGGAAATAAGTCAAATTTATATAGATTCTATGGTAGGAGAAGGGTATAAACAAGATGAAAAAATGATTAAATTAGCTAGTTTGCTACAAAGGAAACTTTGTGCTGATATGTACGAAAACAGAAGTACAGAAGTACCACAAAATGTCAAACAGGATAGAATTACAGCTAGCATACTTGACAAATTAAGTAACTATGATGGTGATATAAATGTTTAAGGTTAATATAGGAGATTTAAATAAAAGGATAGTTATACAAAAGTATATTATAAACCAGAATGAAAATGGATTTGATATAGAAGAATGGATAGATTATAAAGCTGTTCGGGCATCTATGAATAATCTTTGGGGAAAAGAATTTTATGCAGCAAAAGCGACAAATAGTGAAAATACAGTAGAATTTATAGTTAGATATTCTAAAGATTTAAAAAATATAAATACTAAAGAATATAGAATTAAAACTATAAAAGATAAAAATGCTACAAAAGAAAAAGATAAATATAGATATTTTGATATAACCTTTATAGACAATATACAATATAAAAATAAATGGCTTAAAATAAAGGCTATTGAGGTTATTTAATGGCTGATGGTATTGAAATTGAAGGTATGGAAGAATTTACTGAAATGCTAGAGGATATGACTATTGATGAAGCCGATGAAAAGAAAGCAGTGAGAAAAGGAATTGAAGTTGTAGCAAAACGGGTTGAAAGCAATACCCCAGTTTTAACGGGAAAGCTTAAAAAAATAAAGAAAAGTGTTAAAAAGGAAGGTTTTGCAACTGTTGGTACTGTAAAATTAGGAGCTTGGTGGGATTTATTTCAAGAGTTCGGTACTTCACAGCAAAAGCATCATGTCGGTTTTTTTGACAGAGCTGTTAAAGATAGTGAAAATGAAGCTGTTGAGATAGTTGTTGAAGAATTATTAGACAAAGTGAGGTAGATTATATATGACCATAAAGCAATATCTTTTAAAAATATTAAATAATAAAGAGATATTAGATTTATTACCAGATAAAAAAGTGTTTTTCCTTCATGCGAATAATCCTAATAAAAGCATGTATTTAGAGTATGAGATTATAGATGAATATGGTGCAGATTATTCCGAAGGGAAAGAAGATTATACTACTTATGTAGTCCAGATAGATATATTTTCTACTGGAGATTATACAGAATGTGAAGAGGTAGTAAAAAGAATAATGATACAAAATGGATTTAACAGGGACATGGCAGCGGATCTGTACGAAAAAAAGACAGGTCTAAATCATAAACCTATGAGGTTCTCGATAGATTTACCGACTAGCAAAGGCTAGTCTTTTTTAATGCAAAAAATAAATTAAAAAGGATGGGATAATACATGTCAGAAGAAAAAGTAGTTCCGATAGTAGACTTGAAAAAGTTATATGTGGCTAAAGTTTTAACAGATAGGTTAACCACAACTTTTGATGCGCCAAGATATTTTGAAGGGGTAAAAGAGTTAGGGTTAAAACCCAAAGTTAATAGTGATGACTTTTATGCAGAAGGTATTTTGTGGATTAGCGAAACTACACTAGCTAATATAGATGTAGAAATAGATATTACAGATTTAAAAAAAGAAGAGGAAGCATTTCTATTAGGTCATAAATTGGCAGCTGAGGGTGGGATTATAAGAAGTTCCAATGATGAAGCGCCAGAAGTTGCATTATTATATAAGGCAATGAAAGGTAATAATAAAGCCAGATATGGAATAATGTACAAAGGAACATTTTCTATAAGTGATGAAAGTTATAAAGGTAAAGAAGGAAAGGCTAATTTTCAAACAAAAAAATTAAAGGGCACATTTGCACCTCTAAGAAGTAATGAGATGTGGAACTGGAAAGTAGACGAAGAAGATGGAATGACAGATGAAAAATTCTTTAAAGAAGTAATAATACCAACCCCAAAAGTGGATGAGGAAGTAGAAAATAAAAAAAGTGAGGAAGCTTAATTTATAGGGTAGTCAAATACTACCCTTATTATTTTGTTGATGAAAGGACTGGATAATATGTTAAATAAAATAAGAAAACAAAAAATAGGTGATAAAGAATACTCTTTTAAGATGACAAATAAAACAATTCGTAAAATAGATGAAAAGTATGGTAACTATGGTTCTGTTATTTATAGCCTAATGGAAGGACAACAATTCTACACAAATGCTTTAAAATTAGTATCTATGTGTTGTGTAGATAAAGAAAAAGTACTTGTAAATAAAGAAGAAAATAAATATGAAGAAAAAATAAAAGAATGGGATATAGAAGAATTAGAAGATATTATAACAGGACAACAATATCAAGAAATTACAAACTTATCCGTAGATTTATACTTAGATTACATGGGAATGAATCAAACAGAAGATAAAGAAGATAAAAAAGAAAAAAACTAAAAGACCAGTTAAGGACTATTGATGATTATTTAATAGACTTTGACTGGCTTTTTTATATAGCAAAAGTACATTTAAATTACACAAAAGAAGAATTTTGGGATAGTACACATGCGGAAATATATAAGATGTGGCAAAGGCATATTAAATTTAATAAATGGGAAATAAGAAGTGATAATGAAGAAAATAACTCTACAAGTGATGTAAATCACAAAAGAGTAAATATAGAGGATATACCATTTCTATAAGATAGGCACTCTGATGAGTGTCTTTTTTTATATAAAAATTTAGAAAGGAGGTAGAGAATGGCTAGTAATACAGAGAAACGTATAACCGCAAAAATGGTATTAGATAGTAGCGGATTTAATTCTAGCTTAAAAGGTGTAAATGCAGAATTAAAAAATGCACAATCACAAATGAAATTGGCATCTAGCGGTATACAAGCATTTGGGAAAGACAGCGAAAAATTAAAATCTGTACAGGAGGCATTAAGTAGGCAAGTAGAATTGCATTCTAAGAAAGTAGATGTATATAAACAAAGCATAGAGAAGACTACTTCTAAAATGCAGGATAACATAAAAGAAAGAGATAAATTAAAAGAAAGCTTATCTAAAACTGAAAGTGAATTAAAAAAAGTAATAAATACTGGAAGTAAAGAACTACAAAGTTATATCAAAAATAGAGAAGAACTAACTAAATTAAATAAGCAGTATGATGAAGCAAAAAAAAGATATGGAGAAAATTCTAAAGAGGCTGAAAAGTTAAAAGAACAAATTACTAAATTAGAAAATGAGCAAAAAAAACTTACAGCTGGGAAAGAAAAAGAAATAAAAGCATATGAAAAAGCTAAGACAGAAGTTGATAAAACAACAAAAGAGTATGAAAAAAATGAAAAAGCAATAGATAGTAATGCAAAAAAAATACAACAGTATGATACTAATCTAAATAAAGCACAATCCCAGATGAATAAAGCACAGGGAGAACTAAAAAAGATAAATGAAGAATTAGATAAGCAAAACAATAAGTGGGTTCAAGCAAGTGAAAAACTAGGAGAACATTCTAAAAAGTTAAAGGATACAGGACAAAAGATAACTGATGTAGGAAAAAGTATAACTACAAAAGTATCAGCACCTTTAGCTGGACTAGGAATAATAGCAGCAAAGACGACAGCGGACTATGATGACAGTATGAGCCAATTAAAGGCCATAACCAATTCTAGTACGGAAGATATGAAAAAGATGAGTGACCAAGCTAAGGATTTGGGTGTAAAAACCAGGTATAGTGCTAAAGAGGCAGCAGATAGTATGGTCATGTTAGGGCAAGCCGGTTATCGAACAACAGAAATTATGAACACTATGCCAGCAGTGTTAAATTTGGCGCAGGCGGGAGCTATTGATTTAACACAAAGTACGGATGTGTTAGTATCCTCTATGAGCCAATTTGGAATTAAAACAGAAAACGCAGCGCATGTAGCTGATGTATTAAGTCTTGGAGCTAATAAGGCCAATTTGGGAGTAAATGATATGGCCGAAGCATTAAAGTATGCTGGTAGTATGGCTAATACCGCAGGTTGGAGCATTGAAGAAACTGCAAGTGCTATAGGGCTAATGAGTAATTATGGAATTAAGGGTAGCCAGGCAGGAACTGCATTAAGAGGCGCTATTTCTAGATTAGTTAAACCTTCAGAGGCTTCAGCAGAGAAAATGGAAGCACTAGGAATTAAGGTATTTGATAATAACGGTAAAATGAAAGCTTTAGGCGAGGTTATAGATGAGGTTAAAAAGGGAACTTCTAAATTAACAGAAGAACAAAAAATGAATGCACTTGTAACTATATTTGGTCAGGAGGCTATAGCAGGCATTAACGCTCTTATGACCGAGGGTGGAGATAGTGTAAGAAAGTATGCAGATGAATTGAAAAAGGCTGACGGTAGTGCAGAAAAGGCAGCTCAAACAATGGAAGATAATATGGGTGGTGCTTTTAGAAGTTTAAAATCTGCAATGGAAGGTGCAGCAATAAGTATTGGTAGTGCAGCAGCCCCAGCAATAAGAGAAATTACAGATAAAATAACAGAATTAACACGAAAATTCTCAGCATTAAGTCCAGAAACACAAAGAAATATTGTTAAATTTGGAGCATTTGCAATTGCTACTGGCCCTGTTATAGTAGGAATAGGAAAAATAGCAACTGGATTTGGAAGTATTTTAAGTGTTGGAAGTAAAGTGGCTGGAATAATGGGTAAAGTAACACTTGCTACAAAAGGAGTAGAAGTAGCAACTACTACAGCTGGTGTAGCGGCAACAAGTGCAACTGGAGCAGCTAGTGCTGGATTGGCAGGATTAGGTTCAATAGCATTGCCAGTTATTGGTGTTATAGCCGCAGTTGGAGGAGCTGTTTATTTAGCACATAAAAACACACAATATCTAAATGATAGCTGTGTAAAGAGTGCAGAAGATATGGGAACTATGGAAACTGCAATGGCAGGATTAAATGGACATGTTATTCACACTAATAAACAATTAGAAGAAATGAATGTTAAACATAAGGAATGGAGTAATAAAGTTTCTAAAGATACCCAAAAGTCCCTAGATCAATGTGCAAATAAAATAGCAGATTATAGTATGGAGCTAAAGAATGCTGAAAAAATTGATAATTTGGTAGACAGTGAGGCTGGAATAAGATTAAAAACAAAACTAGATGATATTTGCAATAGTGCCATAAAAAAAATTAAGGAGAAACAACCAGAGCTACAAAAAACTTTAGCTGATGGATTTGCTGCAGATGGTAAAATTGACGAAAATGAAAAAAAGATTTTGGCCTCAATAAATAAAAATGGGCAAGAGCAAATAAAAAAGGTTAATGATATTAAATCTAAAATTTTAGAACTAGAGAAAAAAGCAAGTAAACAAACTGGTGAAGCTAAAAAAGCAACTTTAGCTGAGGTTGATAAATTAACTAAAGAAATTGGAAATATAGAATTAAAAAATACTGTTAAATCAAAAGAAGAATTAATGGCAGCACAAGCTGATTTTAATGTCCGCATGAAAAATTTGGACATGAACGGTCTTTCAAAATTAATGGAATCAAAGGCAAAAGCTAGGGATACAGAAGTAAAGAAAATAAAAGAAAACTATGATAAACAAATTGAGCTATTAAAACTAAATTCGATTAATGTAGATAGTGAAACTAAAAAGGCAATTGACATAAAAATAGAACAGTTAGAGACAGCAAAGAATAAAGAAATAGGTGTGGAAAATGAAAAATATAAAGGCTATTTAGATGCCGCAATAGAAAAATATCCGCAACTAATAAACTATATAGATATGCAACACGGAACAATGCTAACCAAAGAACAGCAACAAAAACAGGCGGAATTATTAGAGTATGGTTCTAAAATGGAGGGATTTTTAGGTATTACTGAAACTGGATATTATAAAATTAAAGATAGTGTTACAGGGCAAATGCATAACTGTTACGTAGAAGTGGATAAAAGCACTGGTCAAATTGTTGGGGCTTGGGATAAAAGTAATAATAAAATTTATGGTAACCCCATCAAGGCCCAAGAGAAAATAGACCAAGAGTTGAAAAATGGACAAAAATTTAAGCCAATTGGTGATAGTTACGATCGTGTAAAAGAAGGAATATGGAAGCGTGCGATAGAAGCACAGGCTAAGACAAATTATAATTTATTTAATTGGATACATGACGCACATTCTAACGCACAAAGTTGGTTAAGTAACCATCCTTTTATTGCTAGTGTAGTTCAACAAGTATTACACCCTAACACACCTACATATATACCGCGTAGATGGACAGGGGATAAATATTTCACAGGTGGATTAACATATCTACATGATGCACCAGGGAAAAATAATAATTATGAACTTTATGATCTACCAAGGGGAAGTCGAATCTATAATCATGATGCTAGCGAAGATTTAGTTATTAAGACAGCTGAAAATGTAGCATCTAAAGTAGCTAATAGTGTATTAAAAAATTTTAAAGGGTTAACAGCGGGTGGACAAGATCAAACCATTATAGTTCCAGTTAATTTAGATAGTAGAGAAATTGCAAGAGTAACAGCGAAACCAATGTCAGAGGAATTGGGAAAGTTAAATAGGAGAGGGGGATTAGGCTATGTTTAGTATACAGTTTAATAATTATAATTCTTATAGGGATCTAGGATTAGTTGTAGAACATAGACCCAATATTCCTGCACCTGAAAGAAATGTTAACAATATTTATATACCAGGTAAAAACGGAACATTAACAGAGGACTTGGAAACTTATGAGGATATAGGTATCTCTATTACATTTGGTTTTCAAGATAAAGTTAATATAAATAATAAATGTAGACAAATAAAAATGTGGCTATTGGATAAGATAAAAGATTGCAAATTATATTTTTCTGATGATATTGAAACATATTACAAAGTTAAAAATGTAAAGATAGATAATATTGAAAGAAGTATAAAGAGCTTAGGAAAGTTTACAGTACTTTTTACATGTGATCCATTTGGATATATAGATGAAGAGTTTTTAATTATAGATAAACCAATTTCCATATATAATGAAGGAACTTATGAAAGTCAACCTTATATAAAAATACATGGTTCTGGGGATATTAGTTTAAATATAAACAATGAAGTTATTAAATTAAAAAATATTAATAATTATATAGAGTTAGATTCTGAAATTATGGAATGTTATAAGAATAATGAAGCATTAAATAATCATATGTATGGAGAATTCCCAATTTTTAAAGTGGGAGAAAATAAAATAAGTTGGACAGGTAACATTAATAAAATAGAAATTATACCTCATTGGAGGTGCTTATAAAAATGATTACTTTATATAAAGAAGTAGAAACTAACTTTACTCATAATGGAATAGGAATATTAAAAGACTGTTTACAGTGTGAATTACACAGAGAAATAAACGGTCTTTTTTCTTTAGAATTGGAATATCCTATATTTTCTAAAATGGGTGATAAGATAGAAAAACATATGATAATTAAAGCGCCTACACCTCAAGGGGAACAACTTTTCAGAATACAAGAAAGAGAGAGAGATTTAAGTGTAATTAGAGTGTATGCTACACATATTTTCTTTGATTTAACTAAAAATTTTATAGCTGATACTAATATAGTTGGAAAAACAAGAATACAAGCAGTGCAACAGGTATTAGACAAAACTTTAAATTCACACAATTTTACTCTAGAAGGTGAAGAAGGTGGAAAACAAAATAACTGTAGATTAGTAAGAGAAAATCCTGTAGAAGCTCTTATTGGAGATAATGATAATACTGTAAAGAATAGATGGGGTTTAGAACTTGATTTTGATAACTATAAAATAATAGCTAAAGAAAAAATAGGAAAGGATACAGGAGTATTAATTGCATATAGAAAAAACTTATTAGGCATACATGAAACTTTAGATATGAGTGAGGTTGCAACTAGAATAATACCACAAGGGTATAATGGATTACTATTACCGGAATTTTACATCGATAGTCTTAATATTGGAGCCTATTTTCAACCACTTGTTGCCCATATAAAGTTTGAAGATATAAAGGTAAAAGAAAAAAATTTAGAAGGTGAGGAAACTTTAGAAGATGAAGATAGTGAGGGCTTTGAAACTAAAGAAGAAGCTTATGTAGAAATGAGAAAGCAAACACAAAGACTATTTTCTGAGACTAAAGTTGACATACCTTTTTTTAATTATGAAGTGGAGTTTGAAGAGTTAGGAAAAACGGAAGAATATAAACAATATAAGAACTTAGAAAAGATTAATCTTGGTGATACTGTAACAATAAGACATGAAGAACTAGGATTGGATCTAAAGGGAAGAATGATAGCCTATGATTATGACTGTTTATTAAAAAAATATATAAAAATAGAAATGGGTATGAGAAAAAAAGATTTAACTTTACAGATAAAGCAGACTATTGCTGATATAGAATTTACTAAAGAAAAAATAGAAATGGAAGTTTCCAATTTAGATAAAAGTTTAAGTAGTAAGTTGGAGATAACCGAAAAGCATATAATGACAGAAGTTAATGATGTTAATAGAAGTTTAAATAGTAAGATCGAGCAAACAGCAGATAAAATAACATTTACAGTCAATAACCAAATATCTAAGGTGAATAGTAAAATTGAACAACAGGCAGATAGTATATCTTTGGTTGTAGATGGTGGGGGAAGTATAAAGGCTGCACAAATTGCTTTAGCCATAGCTAATGATAGCAGTTCTATTAATATGTTAGCTGACACTATAAATATAATCCCTCATGATGGTGTTATTAATTTTTCTAATGGTACAAGTATAGATACTAGAGATAGCTCAGGGCAAAACAGGGATAACTTTATAAGATTACGTGCAGATAAATATCATTATGTTTGCGTGGATGCTAACGACGGAGCTATAAGTTTATTTTTCCCAGGCGGTGGCGGTTCACATGCTTACTGGACTTTTAAAAAAGATGGGCTGTATAAAGATGGGGTAAAAGTATTATAAGAAAGGAGTGATTATATGGATAAACCGTTTAATTTACTTATAGATACAAAACGAACAGGTTTCAATGCTGTAAGAGGATTGAAGCAAGGGGACAATAATTCTATATTAAATGTTACTTTAGTGCAGAATAGTGTCCCTTTTAATTTAACTGGATTAACAGTAAGAATAAATTATAAAAGGCCAGATAATAAGTTATTTCTTCAGATGGTGAATATAGAAAATGCTACTGAAGGTAAGATTAAAATAAATATATTAACTAAGGTTTTAGAAAATGCAGGAGAAGTTAAAGCTGACTTATCCTTATTTGATAAAGATAATAGAAAAATAACAAGTGCAACATTTTCTATGTTTGTAGATTCTAGTGTTTATCGAAATGATTATATAGATAAAGAAGATTTAGATCTTATTCAATCTATTTGGGTTGAAGAAGATAAAAGAATTAAACAGGAAAACATTAGAGAAAAGAATGAAGAAAGTAGAGTATCTAATGAAAGCATTAGAGAAAAAAATGAAAAAGATAGAACTGATAAAGAACAGCTAAGGGAATTAATAGAAGATCAAAGGCAAGACAATGAAATAGAAAGAGAAAAAAGTGAAGCTACTAGAATTGAGAATGAAAAAACTAGGCTGGAAAATGAAAATAAAAGAATAGAGAGTGAAGAAAATAGAGTTACAGGGGAATCTAAAAGAGTAGAAGCAGAAGAAGAAAGAAAGGTAAATGAATCAGCTAGGCAACAAGGATATACAGAAATAAAAAATACTATTGATGATTTTTCTTTATGTGAGGAATACAACCCTGACAAAGAATATAAAAAATTTAATCGAGTTGTTTATAATGGTAGCTGCTGTGAATGTTTAAAAGATTGTACTAACATATATCCAGTTAATAAAGAATACTGGATTCTTATAGCCACAAAAGGTAAAGATGGGTTAGGCAGCGGAAATATGCATACAGATGATTATGATAAAAATCAGAATGGCATAGTAGATAAAGCTGAATCTATAACAGATGGATTTATAACATATAACGTAACAGATATTAATAATATAGTAAAAAATTTAAGTATAAATGACCAAAACGCTCGAGAAGAGATAATGGATATTAAACTTAAACTAAAAGAGAAACTAGCAGTAGACTTTATAAATAAATCTGGAATCGGATTCTTTGACACATTTGAAACAGATGATTATATAGAATCTACCACGGCGACATGGAATAAATCAGAGACAACAATAGAATTCGGAAGTCCAGAATCAGAGCAATTAGTTTATCAAGCAGTAGAAAACTCAGATACAATCGAACTAGTAGGCGACCAACTCAGGGTGGGGGATATAATAAAAATAGGAGATAAATTAATAACAGTAGAGGAGGTAATATAGTGGAGTATTTAGGAATTGAAAAGTTCGGGTCATTTCTAGATAATGGAGCAGCGTATACTATTCCAGATAGACCGTGGTTTACAGATAACTACCCAGGTAGCTTATCTGAGCGTGGAAAGGGTAATATAAGAGCTATTGCAGATAGACACGAAATATCATTAGGGAACACTCTATCGAATGAAAACTCACAGATACCGTGGATTCATTTAAAGGATGGTTTAAAACATATTTATGTTTGCAAACAAGTTCTAGCAACAAACATATCATGGGACTATTTAAATGAGCGTAATATGATATATGGAACACCAGTTACAATAGATGGAAAACAATATAAGTTGAGGGTGTTAACTGGTGGAGTTGAAAGAAATCCAGATAAACCGGGTATGGTACCTACAGACAATGAGTGGGATACAATAATACAGAATACAGCAAACATCACAGGATTACCAAAACCAACTACAGAAGATTTAACAGAAGCCAATACTTATGGGCAACTAGACGGAAAACATAACCAACACTGGAACTGGTGGGGAATAAATACAATATGTCAAGAAACTAGGACATTAACCTCTAGTAAAATTACACGAGGATATTCTAGCGCTGCAAGTTTTACCAGTTATGATGCGATAGCCTTGAACAGTGCATGCGGGTGGCGACCAGTTTTAGAGTATATCGAAATAGACCCACCCAGCAAACCAATACCAGTATACCCAACATCAGAAGATAAGACATACCCAGAACCAATAAAAGGTAAGATTACTTTACAAACCAAGTATAACGGTGACGGTTATTTAGAGCAAATGGAGGTGTTAGTATATAATTACACTCAACAAAAGTTTGAATATCAAACTGAATGGATAGACAATACAACAGGAGTAATGCAACTTCCAGTAACATTCAAGGCGGGTAACAATTATAAGATAACAGTAAGACATAAAGGAACAGGTGGAATTGCTAAGGGATGGCTTGAACTTTATGTAATCGGGGGGAAATTAGGAAAATACAAGCTATCAGAACCAGTAACCCAAAAACAATATGACAAGTTAACAGCATATACAAGCGGGGATGACCTAATAATGAAACCACAACAATTCCCAGAAACAGAGAACTCAGTTATAAGACTAGTACCTCAAACAATGAACACACTAACAGTAAAAGAAGATACTACAACAGAAGATCTTAAATATTCAAGCACAACGAAAACTCCAACAATAGGGGATAAGCTAATAAAGGACTCACAAATATATACAATATCAAATATAGTAGAAGAACAATCAGAAATAAATGTATCTACTGAAATAGAAAAGGTAACAGATGCAAATAATTCATCATTAGGCTGGTCTGGAAATGTAGGTAAAAATTCTTATCTATATAACGGAAACATATATTTTGCATGTAGAACACCTAGTCAAGTTACAATATACAAAGTTTCACAAGCAGGAGGAACACCTCACCAAATCTGGGGTACAGGAATCACAAATTCGAGAGGTATCGCAGTAGTAGGTGATGGGAATACACTTTACACCGTAGTCGGTCAACCAAAAGCGTTAGCTATATTCAAAACAAACTTAGGTACAAATGAAACATCAAAAACTATACTAGATATTGATACTGACCCAATCGACATTAGTGCTACAATGGACAGGAAATTTCGTAACCTTATAGTAGTCATGAAAGGGTTTGTAACTGTAACTACACTATATGGTATTGTAGGATATAGAATTAAGGTAGATAACGTCAACTCACCAGAATTGTATAAAAAGACAGAATTAGACGTGGGATATCCACATAAAAACATAGGTAGCCCCTTTATATTAGACACTGGAGATTATCGTTCAGAAAATCTATCAGTATCATATTTGAGAAATTACTCAGATGGTAAAGGACAGGTAATTGAATGCTTATGGTATGGTGATGAAATATCAAGGAAGGCCCGTGCCGAAATAAATACCACAGAGACAGGTAGTAGTCGTATATCTAGTGCATTGTATACTAATAAATTAGGAGAGCGCACATTCATGATTACTTATAGTTATGTAGGTACAACTGAAGCCGTAGGAGTATTTAAGCAAAAGAAAAACGAGGATGGAACGTTTAGCTCATCTTCTAATGATATAATATATCCGAACGATTTAATAACGACACTTAAAATTAACTATGATAAAGAGCATGGATTTATAGTAGTATTTTCGACTAGTAGGGGATATATACAAACACTTCACTCTTTAGGTTACGACCATGCATGGAGTAGTTCGTCAATTGTTACTAACGTAGCACAACGAGGAACAGCTCCAATATATGAAGTAGTGGAATACAACCCATATTCATATGGTCAGCATCCGGGACTACTTATATTAGAATATGATGAAACAAATAAGGTGGATAAATTAATACTACGATCAGATTACACAATGGAAGAACCAAAAGCTAATAAACTAACACTAGATAAACCAATAACAGCACAGGCGGGGGAAACAATAAAATTCTTAGACTATGACTTAGAAGTAAAAGCAAGAGAAGAAACAGCAACAATAACACCTACAGAAATAACAGACACTTACTATGAGTATGACGCAAGTTTTAGTAAGAAGGAATCTAATAGAGACATAACAATAAAAGGAAGAAATACAAAACTCACAACATTATATTACTATAATTATTAGGAGGTACAAATATGGGAATTTATATTAATAACACAATAATACAAGAAAAACAGAAAAAAGAAAAAAATAATATTACATTGCAAAGCTTAGGACAACAACTAACACAAGAAAAAATTAAGAATATGCAAAAAGATGCTATAATAAATAATTTAGGTAAAGAATTAACCCAAATAAAATTAGAAATGTTACAAAATAAGGGAGGTAATTTATAATGTATTTTTGGAAATTAGCATTTGAACAAAAATGGATAGATGCAGAAGAATTAAAAGGGGCAGTTAAGACAGAACAGTTTCCGTTTGGAGAAATAACACCAGATGAGTATTATAAAATAACAAAAATATATTTTGAAGTAGAATAAATTATAAAGGCAAAGTAGACACCGAATAGGTGTTTTTATTTTGCCTATTTTTAGTTAAGAGAGGTGACATATGAATATTGAAATATCAATATTATACACTATTTTAGGTGCTGCATTAAGCTATTTGGGATATAAAAGACTTAAAGAAAAGGATAATAAAGAAGAAGGGAAAAATGAAGGGATAACTTCTTTAAAGTTAGATTATATTTCAAAAGGGGTAGATGATATAAGATTAGATTTAAAAGCAGCAGATAGAAAAATAGAAGATGTAAATACTAGATTGATTAAAGTAGAAGAAAGCACTAAGAGTGCTCATCATAGAATAGATGGGTTAGAAAAGGAGGATTAAATTATGGAATTTCTAAAACAATTTCTACAGATTAAAAAGATAATAGCAGTATTAACTACTATAGTATTTTGCATTTTAGCACTAAAAACTAATATATCAAGTACAGAATTTTTGAGTGTATTTACATTAATAATAGGGTTTTACTTTGGACAAAGTTCAGCTAGACAGGCAGTAAAAGAAAGTAAAGAGCAGGAATAAACCTATTCTTTTTTACATTAAATTTTAGGAGGAATGTTAAATGGCTACATACGGAATAGATTGTGGGCATACATTAAGTGGTGCAGATTATGGAGCAGTAGGAATAAAAGCAGAATCTAATTTAACTAGAGAAGTAGGAACAAAAGTAATAAGTAAATTACAAGCTTTAGGGCATACAGCTATTAAATGTTATAAGGATAGCTGTTCCAGTTTAAATGATAGTTTAAGTTATAGAACTAATACATCCAATAATAACAATGTAGATTTATATGTATCTATTCATTTTAATTGCTATAATGGTAGTGCTTATGGTACAGAAGTGTTTACATATGGAGGTAAGGAACTACCACAAGCTAGAGCAGTATTAAATAATATTTGTGCTTTAGGCTATACAAATAGAGGGTTAAAAGATGGTTCTGGTCTTTATGTATTAAAGCATACAAAAGCTAAATCAATGCTTATAGAATGTTGTTTTTATGATAATAGAAACGATATGAATAGATATAATGCCGAAAATATGGCTAATGCTATAGTTAAAGGATTAGTAGGAAAAACTACAAGCAATAGTACACCAAGCAAACCAACAGATAACAACAATAATGGATGGATTAATTTAGATGGCAAAACAGGAATTATAAACACACCAAGTGGTGTAAATGTTAGAGAAAAGAAATCAACTTCTAGTAGAATATTAGGTACTTTACCTAATGGATCAAAGGTTAATTTATATCGTAAAGAAGGAGATTGGATACATATTTATTATCCACCACATGGGGGTTATGTCTATGGAAAATATATAAGATATTAATTTTAAAGGTACTCCTGTAATGGGAATACCTTTTTGTATTATTTTATTGAAAAACAATGTAAAATGTCTGAATTTTTGGAAAAAATTATAAAGGGGAAATTGTATAAAAGTAGAATTTATATAATAAGAATCTGTTAAGTTAAAATGATTTAACAGATAAAATAATATAGAGGGGGATGACTAAATGAAAAAAATTGCAATTGGTCTTTTAACAGCATTGATAATTGGGGTAAATGTGTCTACTGCCCATGCAGCATTTATTTGTAATGTATGTGATGCCAGGGTGATGCCAGGACAAAGCCATTCATGTTGTGATTATTTAGGACATGTGGAGGCTGTACATTCACGTAGCGATGGAACAGGTTGGGTCGACTGTTCCCGTTGTCGTAAGATACTAAGAGCCTAGATAAAAGAAAAAAGATTATTTAAATAAAAGAACCCTAATAAACAGGGTTCTTTTTTATGGATTTTTCTATATTGGTGCTTTATTTCAGCTTATTTTTATTATATCCAGGGAAATAAATTAAATCATATGTGAAGGAATTTTTTTACATATGTAGAATTATAAATATAATAGTTTTCTATAAGTTACTCATAGACCTCTGTATTTAAAAAAAAAGAACCCCTTTTATTGGGGTTCTTTTTTTATGGATTTATATATTGGTGCTATGTTTTGGTCTATTTTTATTATATCCAGATGTAGAAAAATTAATCAATTAGAAATATATAAACTTTCAATTTTAAAGGTACTTCTATAATAGAAGTACCTTCTTTTTTTATTGGAAAAATTATTATAATTTATATAAATAATTCTTAAAAAGGTATTGATTTATTATACTATGCATAGTATAATATAAGTATAGTAATTGATAAGGAGGTGAGTAAGTGATAGAAAGTATAGGAAAGCTAATAGCCCTAGTAATTTCACTCCTAACAATCCGTCAACTGAGTTTGCAGAACAACAAGACGGAGTTAGAAATAAAAAAACTAAGGCTAGAAATCAAAAGGTTAAAAGAGGGGGATTAAACCCCTCAACCTTTCCTATATTATATCACAAGTATATGAATAAAATACTAAATTATTTATTAATAATATCAATTATAATAATATTATTACTGCTAATCAAATTGACTTATAATAAAAGGAAGAAAACTAAATTAGAATTAGAAAAACATGAAATTAAAAGTAAAAAGGATGATTATAATGGCAAAGAGTAACCAAACGGAAGCCAATAAAAAATGGTATGACAAAAATAAAGAACACGCCAAATACTTAAATAAGAGATCACACACACGAAGTTTTATAAAAAATTTTGCAACTTTAGAAGACTTGGAAGAATTAAAGGATTTAATAGAACAAAGAGAAAGGAAATTGAAATGCGAAAGGGAATAAGATATTTAATAGTAGGCTTGTTAATTGGAGCTTCCACAAGATTCATCGGCATTGCAAAAGCCATTGAACCTTCAGAGGATAATTGCCCAGAGAATGGAGAGTATATGTATTGTTTAGATAAGACTACACCGCTATGGATATCTATATATGATGTACACGAAGAAGAAAAATTTATTTATTTCCGACAACCAAATACAAATAAAATTATTAAGCTAGCAGAATTAAAATAAAAACAAAGAGGTAGTTTCCCAAGTGGAACTGCCTCTTTTCATATACACAAGATTTGTTGATTTATTTACAAATATAACATTTTTGGTATAATTAAGCTATATTACCAAGAGGGGGATTAGTACATGAAAAAACTAATATCTATATTAATAGCAGGAATTTTAGCCTTAGGATTAGTTGCTTGTGGATCTAAACAAACAACTAAGGAATATAATAAAGAAAATATTAACCAAGATTTAAAACAGGAAGATAAAAAAGATGAAAAAAAAGAATCAATAGATTTAAAAAATACAGAATTAAATAAAGGACTTTCAACCGTAATTCCTTTAGAGATTACTCAATTAAGGGAAGATGGAGAAGGTGATGATAAAGGATTATTTGTAGAATTGAATACTAAGGATGGAAGTGTGGAACAAAAAGTGAAAGATTTTTACACATATTCTAATGTTATATCAGGAATTGTTAGCAGTGATAAAAAATATAATTGTTATAAAAGAATAGCATTTACAACTAAGCAATTAGGAGGCATTTTAATGTACACTTCTAAAGAAAGTGTAGATAATTTTTTGACATTTGATAGTGGTACTTTTGGTAAAGAAGAATACCAAAAAATATTTGATAAATTGATCAAAGAGGGAAAATAAATATATAAACAAAAACTCTAAAGGTTAATCCCCTAGAGTTTTTTATTTGACGTCAAAAATACGTCAAAAATGTTTTTCTAATTATTTTAATTTGTTTAAGTGAAAAAAATTTTTGTTAGATTAAAAACATTGAATTTACTAGGTTTTTCAAAAGTATTCTAAATTGCTGGTAGCATTTACAATATAATTTTTATATATTAAAGTGTATTTAATGATTATAACATAGCTTAAAAAAATCGTTTTAATGATATATTTGTAGAGACATATAAAAATATATTAATATTTTATTTAGTTATAATAAATAATCTATAATTATAAAAAACTAAAATAAAAGTATGTTTCTAGTAATATTATTATAAAATTATTTTGTTTTTATTTTGGACATCAGTTAATTTATGGTTTATTATAAATATATATATTTATATTTGTTAATGATTGGGGGAATATAATTGAATATAAGCAAAAGTGGGCTTACTTTTTTACAATTTGCACTTTCTTTTATAATATATAAGTTATTAATGAATTCTTTTAACTTTAATTATAATTTATTTAGTGATAAGTTTAATATATTAAAGTTTTTTATGGATTTTGGATGCTGGGTTATAGTATATTTAATAGTATGTTTTATTTTTTCAAAGTTAGTTACAATAAAAAAGGTAAGTAGAATTTTATTTTAAATTTTTATAAAAAAGGAGATAAGTATGAAAAACACTATGGAAAACTGTAATTTTTGCAAGATAATAAACAAGGAAAAAAAGGCTAATATTGTATACCAAAATGATTTGGTTTGCTGTTTTTTAGCAGAAGAGCCTATTAATGAAGGACATATGCTAATAGCACCTAAAAAACACTATTTAGATTTAGACCAAATGGATGATGAAACGGCTATAGAAATAATGAAAGTATCTAAAATTATGGTAAAGGTACTGAAAGATACATATAAATCAGATGGATATAGTATAATGCAAAATGGTGGAAGCTTTAATAATGTTGGTCATTATCATATGCATTTATTTCCAAGATATAAAGGAGATAGTTTCAGTTGGAGTTATGGAGAAGAGGATAGTAGCACCCTTGAAGTTGTAAGTAAAAAAATACAACAACAATTAAAAGATTATGTAATAAAATAATTTATATTTAAAGTAAAGTTATTTTAATATGTTTTCTAATTAGATTACTAAAAAATTAATTATAAGAAAATTTTATTTAATTGTAATAGTATATTTTAAATTTTAAAAAGACCTATTTAGTTATTTAACTAAATAGGTCTTTAAATTTTATATTTTTACATAACTCTTCCTGGCAGTATAGCATCTATAACACCAATGACTAAAGCTGCAATTATAGCACCTACTATAGAAACTCTCATGGTTGGTACTAAAAATTGAGTTAAATATATTATTATGGCTGATATAACAAATCCTTTTAGTCCTCTACCAAAAGGAGAGGCATCTACTCCCATAAGTTTTTCTACTAAATAATCTATAGCGCTTATGATTACAGCAGCCAATAGAACTGCCCAAAATCCATGTATAGTAAACCCAGGAGTAAAAAACGCAGTTACACTTAAAACAACCATAGATACTATTAATCTTATAATGTATCCCATTATTCCACTTGACATATTATTTGAATCATTTTCTCTTTTTCTTTCATCCAT
Protein sequences of DBSCAN-SWA_3 >CP028842|1430643:1476071|1454205_1454415_+|AWB17253.1|DBSCAN-SWA MKKKLNKLLNKTILNDIFIMEMVFFIGLLIIIYTNFKVNLYFGLYFLGIILIAFSIFLYKFRGNRGEKR >CP028842|1430643:1476071|1452494_1454189_+|AWB17252.1|terminase|DBSCAN-SWA MILLDKALKYCNDVIEEKEITTDEVKQQCEMFLCDYNINQYKEEFEFCFSEKKLKKINNLLKLFNYATGFVAGKQVLENLEGFQALFIAAIFGWRYKKNKKKFRYRDIVLFIPRKNAKSFIAALVILLLMLTEQNFSEFYSICIDRDLAKETRKAMAQLIASSPDIKKHFFVSDSEIGIIKCLITNSYYVPRTAKANKNNSIRPACFVADEVGAFTTNDNIQAMRKGQLSVLNPIQMQTTTAYAESDSIMLEELEYDRAVLNGVVADPKLFCLLYYCTKEEAWTDRGLYKANPLRVEENYEEIRADREKAKIKTSEQEELLTKNFNIFLETNEKNKYLDIKHWKKWVITEEEFKQRIKGKKVKVGVDLSVTTDLTAVGIEFEDEGIIYCNSHGFLPEDSLPNRREKHIDYRKYEKAGYCDIHSGMTVSYTKVEEYIRNIETEYECEIEVIVTDPMNAKEMMERLAEDYDVVLLKQTFTNLSPATKEYRKAVYDKKIRYVKNELLDWNMNKASTTKGKADDEMLIKENKNKQRIDMVVVLIFAFTELLGGDTNYNPVDELEKTDW >CP028842|1430643:1476071|1474860_1475088_+|AWB17278.1|DBSCAN-SWA MNISKSGLTFLQFALSFIIYKLLMNSFNFNYNLFSDKFNILKFFMDFGCWVIVYLIVCFIFSKLVTIKKVSRILF >CP028842|1430643:1476071|1472331_1472553_+|AWB17272.1|DBSCAN-SWA MKKIAIGLLTALIIGVNVSTAHAAFICNVCDARVMPGQSHSCCDYLGHVEAVHSRSDGTGWVDCSRCRKILRA >CP028842|1430643:1476071|1443982_1444726_+|AWB17238.1|DBSCAN-SWA MDEQQFLKTMIETVKYDDEYSNKDELLGILRNSKITYDKTSDFSRKYYHCWEYIDLRAPVPMLTVARKFKSVLGKLAADVYIEPSDYEFGGLCIKPKPVELDSEEYTEHNVFFDEIKDTIVQGIRNAKYTIWAAVAWFTDTEIFEELLLRKKDGVNVRIITSDEKSNQYLIEKLESNFEVVKVPLKGTYLSNRLHDKFCIIDFEFVMHGSYNWSKNARGNDETLVTALDRDFVRKFADEFMKLYNEN >CP028842|1430643:1476071|1432699_1433494_+|AWB17221.1|protease|DBSCAN-SWA MAYDIKLKNKNEEELERIANIIMNLFLYQVVFFIIFIMLANILGYVGLNKNIIQPYSKLAGEILAYIFFIKNYIKDNRYKLKFKNTLHFKGYVFIAMLIIGYILVYDNTIDIVLSKVVKNSWFYDVMTKEMKNPIVGFIGTVIMAPIFEEIVYRGIMLDELLVKYNYKKAIIISALIFAAIHLNFVQLTDAFIAGIILGTVYCKTKCLIPCIIIHFLNNLFCNIAKFYPSIYKTKFNIIRLGIGIAILATLAYIFLKDRKKVIL >CP028842|1430643:1476071|1449527_1449830_+|AWB17247.1|DBSCAN-SWA MEVYCNKCNKDFEIKAKEKKYADGIVELYFKCPYCKERYTSFFTDKNIRHKQKKVRKLYEQYGKETDEHKIIELLKQIDDLKAEIGNDMNKLKNKMLGTQ >CP028842|1430643:1476071|1437520_1437931_-|AWB17227.1|DBSCAN-SWA MLGDKIKKLRKSKNITQEELGKNIGVTTSMVGMYETNARKPSYEVLIKIAEFFSVSTDFLLNTEEKLDMTLDSVKKVYNMVKEATEEYGIEEVNQPEKQENKIKTLAAHFEGEEFTDEDVEDIENFIKFIISKKKK >CP028842|1430643:1476071|1445716_1446172_+|AWB17241.1|DBSCAN-SWA MRLEKVENRNRGYDIYLIIANRDYKSWWTSPPKSVDHAGLEYLKDRYPKINTKARMETFKELYKNLWIDITKTQRQNMKHCIGLDYKKKPYRNYYCTSHKDENWNNLVEKGLAVKSSKEPNSYGCTCFWLSKQGVEFILDKSISDKVYEEL >CP028842|1430643:1476071|1473350_1473539_+|AWB17275.1|DBSCAN-SWA MAKSNQTEANKKWYDKNKEHAKYLNKRSHTRSFIKNFATLEDLEELKDLIEQRERKLKCERE >CP028842|1430643:1476071|1473208_1473364_+|AWB17274.1|DBSCAN-SWA MNKILNYLLIISIIIILLLLIKLTYNKRKKTKLELEKHEIKSKKDDYNGKE >CP028842|1430643:1476071|1438142_1438364_+|AWB17228.1|DBSCAN-SWA MANHITTLRKKAGFDTAKEAAKALNISNGMMYQMEGGYKTPGSQLAIKMSKQFNCTLEDIFLPFNTTKSCIRS >CP028842|1430643:1476071|1471379_1472147_+|AWB17271.1|DBSCAN-SWA MATYGIDCGHTLSGADYGAVGIKAESNLTREVGTKVISKLQALGHTAIKCYKDSCSSLNDSLSYRTNTSNNNNVDLYVSIHFNCYNGSAYGTEVFTYGGKELPQARAVLNNICALGYTNRGLKDGSGLYVLKHTKAKSMLIECCFYDNRNDMNRYNAENMANAIVKGLVGKTTSNSTPSKPTDNNNNGWINLDGKTGIINTPSGVNVREKKSTSSRILGTLPNGSKVNLYRKEGDWIHIYYPPHGGYVYGKYIRY >CP028842|1430643:1476071|1456291_1457368_+|AWB17256.1|capsid|DBSCAN-SWA MGLEELRAQLEAKKVEIREFIKDKKVAEAEKAMEEKRGLEKLIKAAEELEEEEKRDLENQRKKKTQPEENNEFRAIVKTVMGEETTTEERANIKSVDNAAVIPKQFVNKLIEIQKGFGSLKGLCDVIPVTKNEGTIPVIDLDQNEMADVAEGEDIVDGTLVTTDVPFKCAKVGLIQSLASETVDDAEVEMEGLVKKNFANIATVKENAKILKVIKDNATEVVGVTSYEDVEKAIDGSLPSIKAGLVTLTNVAGYVELKNKKDKQGRSLNLITNINGVEYFHEKPIITVDDILLPVSEGKTQVFYVANMNEAVKYCDRKAVTIARSTEAGFKDDTVKLRILERFVPVLGAKRSIKKIEF >CP028842|1430643:1476071|1464717_1466391_+|AWB17264.1|DBSCAN-SWA MITLYKEVETNFTHNGIGILKDCLQCELHREINGLFSLELEYPIFSKMGDKIEKHMIIKAPTPQGEQLFRIQERERDLSVIRVYATHIFFDLTKNFIADTNIVGKTRIQAVQQVLDKTLNSHNFTLEGEEGGKQNNCRLVRENPVEALIGDNDNTVKNRWGLELDFDNYKIIAKEKIGKDTGVLIAYRKNLLGIHETLDMSEVATRIIPQGYNGLLLPEFYIDSLNIGAYFQPLVAHIKFEDIKVKEKNLEGEETLEDEDSEGFETKEEAYVEMRKQTQRLFSETKVDIPFFNYEVEFEELGKTEEYKQYKNLEKINLGDTVTIRHEELGLDLKGRMIAYDYDCLLKKYIKIEMGMRKKDLTLQIKQTIADIEFTKEKIEMEVSNLDKSLSSKLEITEKHIMTEVNDVNRSLNSKIEQTADKITFTVNNQISKVNSKIEQQADSISLVVDGGGSIKAAQIALAIANDSSSINMLADTINIIPHDGVINFSNGTSIDTRDSSGQNRDNFIRLRADKYHYVCVDANDGAISLFFPGGGGSHAYWTFKKDGLYKDGVKVL >CP028842|1430643:1476071|1435960_1437028_-|AWB17225.1|integrase|DBSCAN-SWA MQYSTLIRKKDKGYQYIITYKVGNKWKTKSKQGFKKRQDAQTAMDKSLVELEKSVKNNMDPSMSEITFKQFTDMYLEHLKIYRTTNTILAFKTVLNHFVTLSNKELAKISNIDIQHIVDSLTLTGLNPSTIQEYIRKLNTIFKSAMDDYNIIDKLPTKNLKFNKSKQQVNKRALNENEENKLLEDFKSNKYYLVILLGLKCGLRLGEILGLTWSDIDEVNKTIIINKQWKQVNPTKYNFGELKSKNSNRIIPISKNTLDELKKHKKIVNINNRIFKFKNTNSSCICLNRLLKLKGYDITVHELRHTYATKLISNGVDFKTVAQLLGHTVEQTMKTYSHVNDDMMKKATKIIENIF >CP028842|1430643:1476071|1440486_1440669_+|AWB17233.1|DBSCAN-SWA MLRKLLKERGINLTKEEFAIVAEITTDDIKFNRVSFRKCTSLNYVLYIAIRSASIFKRCA >CP028842|1430643:1476071|1473523_1473769_+|AWB17276.1|DBSCAN-SWA MRKGIRYLIVGLLIGASTRFIGIAKAIEPSEDNCPENGEYMYCLDKTTPLWISIYDVHEEEKFIYFRQPNTNKIIKLAELK >CP028842|1430643:1476071|1440995_1441862_+|AWB17235.1|DBSCAN-SWA MFVKIGVIIIAKKYYWLKLKEDFFRQKEIKKLRKIAGGDTYTIIYLKMMLLSLKDEGKLFFEGLEDSFIDEIALEIDEDLENVKVTIMFLIKCRLIEELTENEFLMTKAYESIGSETQSAERVRRFRQRKKALLSNGEVTKSNTEIDIEKEREIDIEKDKIKIDWNKILEAWNALPEPIKSVRSITDKRKKKIKIRMKNLKLTQEDILKAIDKISKSNFCKGINKKGWTIEFDWLFKDDNNITKVLEDKYINKDGKYGDRENNSKDKSQYDFNRPYTGPSYSDQEIDF >CP028842|1430643:1476071|1449866_1450079_+|AWB17248.1|DBSCAN-SWA MLSMYTSYKCICCNKEFVLLTEELEYIKGYLVCPYCSSRKVKKEKVSDILKECMSERSYKRIKGVLRQVR >CP028842|1430643:1476071|1448394_1448580_+|AWB17245.1|DBSCAN-SWA MSWIDEILDRALENVKKYLKEKDKPLKRYKKRVKNRNILYKKRMKLGRVKRKVRSGNHGGK >CP028842|1430643:1476071|1455637_1456243_+|AWB17255.1|head,protease|DBSCAN-SWA MIQVRVEIRSDHVIIEGYINAVERDSRPMPSPKGKFVEQVRSGVWKNAISKNDNIIFLLNHNNNKKLGTSKENLKLREDNIGLYAETRVYDPEVIKKAKENKLIGWSFGFKKIKDSWGKTDDGIDRRYLDEIELREVSILDDSRIPAYYGTSVETRENEEITTELRSFEDIVIEKIEEDTSKNEDEKRELKLKLLNLELEL >CP028842|1430643:1476071|1430643_1432362_+|AWB17220.1|DBSCAN-SWA MLKEFISYYKPHKELFVLDMIAAFIVALCDLFYPMITRQIINDIIPNGKIRLLFFWAISLLIIYIMKYFLNHFIQYWGHMVGVRIQADMRKRVFNHLQTLPFTYFDENKTGVIMSRIINDLMEISELAHHGPEDLFISIIMLIGSFIILCTINIPLTIISFIFIPILVWFSMKNRLKMEKAFMDSRVKIGDLNAELENSIAGIRVAKAFTNRDYENEKFEMGNKRFVGARQMAYKSMADYFSGMYFFIDILDLIVLIAGGYFVYKNLINFGDLVAYLLFIKMFMTPIRKLISFVEQYQSGVTGFERYRQLLRVKPEEDKEEAEVLENIKGAIEFKNVSFKYDEDTHILNDLSFKVEEGKTLALVGPSGGGKTTLCNLIPRFYNIDNGDILIDNNSIYDVKIGSLRKNIGIVQQDVFLFTGTIKENILYGNPEASYEEVVKAAKLANIHEFIESLPEGYNTYIGERGIKLSGGQKQRLSIARVFLKNPPILILDEATSALDNATEYLIQKSLEKLSNGRTTIVVAHRLSTIKNADEIMVLTDKGIEERGTHEELLALDGIYSELNRNIEKTKG >CP028842|1430643:1476071|1473032_1473173_+|AWB17273.1|DBSCAN-SWA MIESIGKLIALVISLLTIRQLSLQNNKTELEIKKLRLEIKRLKEGD >CP028842|1430643:1476071|1438689_1439490_+|AWB17230.1|DBSCAN-SWA MKKINLTIENGQPVITEIKPVVVNNKRILTTKQLAEVYQCNETQIQQNFNNHSDKFILNKHYFLLKGNDLRDFKHNIDNIEVAPNVNKLYLWTERGANRHCKILDTDKAWEQFDNLEETYFRVKEKNLPPMSIEDILIENLQQMKDVKQQLNQVNYTALEAKHASEENKEKLEEFPLFTIDSKELSKVVSKIAIKCLGGKGTPAYKELNRKVFSDIYKQVWREFDVTSCAAIKRKYLEDAKKFISEYKLPRALANEIETLNNQVSF >CP028842|1430643:1476071|1450983_1451466_+|AWB17250.1|DBSCAN-SWA MARSDSFEDIIEKRLDEIEQWVESNNTDKEIAEKLGIAYSTYRKYKSTNVALKSRIATAKDKKNQEVEKALYKCCIGYHYYEEVITKVKTEDVVNGQIITNEDVKISKVKKYRGPELNAQKYWLNNKEKAKWKEDPHKVSNDKKLTKLKEKEVNSKVIEI >CP028842|1430643:1476071|1470645_1470792_+|AWB17268.1|DBSCAN-SWA MYFWKLAFEQKWIDAEELKGAVKTEQFPFGEITPDEYYKITKIYFEVE >CP028842|1430643:1476071|1446525_1447575_+|AWB17243.1|DBSCAN-SWA MQYVKEININEAVVHILDNNSEEPVLNEYKLRLDDECYKYILKHVDKCLKDECLRYAKFNEEKNVVKEVSQEYLNGHNDLLDVSKELAKQLFILMKGNDNISSCDLMIVSISTEYGPMLAILKMDYVKNYIHVVDMVEDKVGIDIVPEFTGLPASAQKIEKCAFIKPIREDQEFNLMVIDKQKKNKTSEEYGSNYFINKYLGCSIIENERDSTKAFVQATEKWSKINLNEDAATSEKIIRTVGKLLKEKDTIDIEEVSNDIFGENSDAKLNYEGFIAEQGIKEKIDVDKEWVDKKFKRIRLKIDRDIDLYIDKESYHDDSRFEVKRVGDGSVNIVIKNVYNYMQKISGK >CP028842|1430643:1476071|1446219_1446495_+|AWB17242.1|DBSCAN-SWA MEIYIAGKITGLKDYKEKFNKAQEKLISKGYKCMNPSVLPEGFPWEVYMPICYAMIDACNSVYMLKNWTDSKGAKLELEYAKSKNKKIIFE >CP028842|1430643:1476071|1441851_1442565_+|AWB17236.1|DBSCAN-SWA MTSNICHICNGTGWEFDNETETYRRCECYEKEKLQRLWNKYGIDPKDIKKLNEYKPIDDIQISARDKAVKYIKNFENIKDTKENGFGLFGQPGAGKTHILLSIGAALITKGIEVIYMPYVEVMRELKATAMDNEYYIKLSSSYMKAKVLIIDDLFKDKLKNGELVGELREADIKHLYPILNYRYLNNLPTLVSTECIPDILQKLDNAQCGRMIERCGDNITIFKGPKYNYRMRKFVK >CP028842|1430643:1476071|1457690_1458062_+|AWB17258.1|head,tail|DBSCAN-SWA MFKVNIGDLNKRIVIQKYIINQNENGFDIEEWIDYKAVRASMNNLWGKEFYAAKATNSENTVEFIVRYSKDLKNINTKEYRIKTIKDKNATKEKDKYRYFDITFIDNIQYKNKWLKIKAIEVI >CP028842|1430643:1476071|1459501_1459879_+|AWB19478.1|DBSCAN-SWA MLNKIRKQKIGDKEYSFKMTNKTIRKIDEKYGNYGSVIYSLMEGQQFYTNALKLVSMCCVDKEKVLVNKEENKYEEKIKEWDIEELEDIITGQQYQEITNLSVDLYLDYMGMNQTEDKEDKKEKN >CP028842|1430643:1476071|1452030_1452498_+|AWB17251.1|terminase|DBSCAN-SWA MARPCKVIDSQSRHNTKAEIEARKEKEERIKSLADKIEKPPEYLSEKQKNIYKFIVEELKMTGILTNLDVYILSTCAIAVDRLRTIETIINKNVGSLCNKDLMSAKDKYTKDLYRCCNELSLSPQSRAKLGNLALNNKEEQEDPLLKALREDDED >CP028842|1430643:1476071|1447681_1448398_+|AWB17244.1|DBSCAN-SWA MAKKQIENVLIDGQVSIWDIDKNIKKSNGKPVIKLENKEIKINNIEQGKIIAKYKTYENLNRIIGYAGGALGIEIKYKDRFETIYVNKKGEEEFVIKKKSSVLPWDKIIYFREDLKINNIQKEKIKKIKGQALKRPGDENIIFNQGNKVISVIENGWVLEYDNIKIAELEKYKKINADSMDQDFKKTLKLGNIVETEYKDEIIQGKVVHIYNNGYTCNIIEGNRYIPIPICGIRQVIA >CP028842|1430643:1476071|1438387_1438678_+|AWB17229.1|DBSCAN-SWA MDKLLTKKELAERWQVAEKTIDNWRENGVLTPCSGIPAIRFSLQHIAELEGTKVEKFSPIERRRLEIENEKLKQENEKLKGILANVLSEVSKIINS >CP028842|1430643:1476071|1445334_1445685_+|AWB17240.1|DBSCAN-SWA MSYEKDIEHEYTNEIVCPFCGYEFIDSWEYGEEDLGLIECNECGKEFYANRDISVTYLTCKANYGTCKHCRDDNVVIEDYNSTVGKYSGLCVKCGELEKQRLLKEYFDSIHNKKDC >CP028842|1430643:1476071|1440224_1440485_+|AWB17232.1|DBSCAN-SWA MSKKIKTTDLNLNVSTGTMLYVDIDIFRFSYDQEIFNLTIKILDGENYEFFEEVDLPEDEAIVDHNDLKIFALNWIFKNVEVVKEI >CP028842|1430643:1476071|1435362_1435827_-|AWB17224.1|DBSCAN-SWA MFKEIRRKEKKLNNEESISLLKESNYGILSVCLNNGYAYGVPLNFVYSNGAIYFHCAKEGQKLEAINGNDKVSFSIVNNVELLPSKFDTNYESVITFGKAYEVFEDEKKQALLALINKYSKDYLKEGTAYIERAQDKIKIIKIEIEHITGKGQR >CP028842|1430643:1476071|1442578_1442896_+|AWB19477.1|DBSCAN-SWA MQLMILKNSSKLGINNELLTLENLIDKLQEEVKELKDAVEDKNNIDHVAEEAWDSLQMCIEVLDKLESKHNVNLKATLNKHHKKIKDREWKAKKMIVFQIFNDYH >CP028842|1430643:1476071|1460217_1464021_+|AWB19479.1|tail|DBSCAN-SWA MVLDSSGFNSSLKGVNAELKNAQSQMKLASSGIQAFGKDSEKLKSVQEALSRQVELHSKKVDVYKQSIEKTTSKMQDNIKERDKLKESLSKTESELKKVINTGSKELQSYIKNREELTKLNKQYDEAKKRYGENSKEAEKLKEQITKLENEQKKLTAGKEKEIKAYEKAKTEVDKTTKEYEKNEKAIDSNAKKIQQYDTNLNKAQSQMNKAQGELKKINEELDKQNNKWVQASEKLGEHSKKLKDTGQKITDVGKSITTKVSAPLAGLGIIAAKTTADYDDSMSQLKAITNSSTEDMKKMSDQAKDLGVKTRYSAKEAADSMVMLGQAGYRTTEIMNTMPAVLNLAQAGAIDLTQSTDVLVSSMSQFGIKTENAAHVADVLSLGANKANLGVNDMAEALKYAGSMANTAGWSIEETASAIGLMSNYGIKGSQAGTALRGAISRLVKPSEASAEKMEALGIKVFDNNGKMKALGEVIDEVKKGTSKLTEEQKMNALVTIFGQEAIAGINALMTEGGDSVRKYADELKKADGSAEKAAQTMEDNMGGAFRSLKSAMEGAAISIGSAAAPAIREITDKITELTRKFSALSPETQRNIVKFGAFAIATGPVIVGIGKIATGFGSILSVGSKVAGIMGKVTLATKGVEVATTTAGVAATSATGAASAGLAGLGSIALPVIGVIAAVGGAVYLAHKNTQYLNDSCVKSAEDMGTMETAMAGLNGHVIHTNKQLEEMNVKHKEWSNKVSKDTQKSLDQCANKIADYSMELKNAEKIDNLVDSEAGIRLKTKLDDICNSAIKKIKEKQPELQKTLADGFAADGKIDENEKKILASINKNGQEQIKKVNDIKSKILELEKKASKQTGEAKKATLAEVDKLTKEIGNIELKNTVKSKEELMAAQADFNVRMKNLDMNGLSKLMESKAKARDTEVKKIKENYDKQIELLKLNSINVDSETKKAIDIKIEQLETAKNKEIGVENEKYKGYLDAAIEKYPQLINYIDMQHGTMLTKEQQQKQAELLEYGSKMEGFLGITETGYYKIKDSVTGQMHNCYVEVDKSTGQIVGAWDKSNNKIYGNPIKAQEKIDQELKNGQKFKPIGDSYDRVKEGIWKRAIEAQAKTNYNLFNWIHDAHSNAQSWLSNHPFIASVVQQVLHPNTPTYIPRRWTGDKYFTGGLTYLHDAPGKNNNYELYDLPRGSRIYNHDASEDLVIKTAENVASKVANSVLKNFKGLTAGGQDQTIIVPVNLDSREIARVTAKPMSEELGKLNRRGGLGYV >CP028842|1430643:1476071|1475696_1476071_-|AWB17280.1|holin|DBSCAN-SWA MDERKRENDSNNMSSGIMGYIIRLIVSMVVLSVTAFFTPGFTIHGFWAVLLAAVIISAIDYLVEKLMGVDASPFGRGLKGFVISAIIIYLTQFLVPTMRVSIVGAIIAALVIGVIDAILPGRVM >CP028842|1430643:1476071|1466406_1467771_+|AWB17265.1|DBSCAN-SWA MDKPFNLLIDTKRTGFNAVRGLKQGDNNSILNVTLVQNSVPFNLTGLTVRINYKRPDNKLFLQMVNIENATEGKIKINILTKVLENAGEVKADLSLFDKDNRKITSATFSMFVDSSVYRNDYIDKEDLDLIQSIWVEEDKRIKQENIREKNEESRVSNESIREKNEKDRTDKEQLRELIEDQRQDNEIEREKSEATRIENEKTRLENENKRIESEENRVTGESKRVEAEEERKVNESARQQGYTEIKNTIDDFSLCEEYNPDKEYKKFNRVVYNGSCCECLKDCTNIYPVNKEYWILIATKGKDGLGSGNMHTDDYDKNQNGIVDKAESITDGFITYNVTDINNIVKNLSINDQNAREEIMDIKLKLKEKLAVDFINKSGIGFFDTFETDDYIESTTATWNKSETTIEFGSPESEQLVYQAVENSDTIELVGDQLRVGDIIKIGDKLITVEEVI >CP028842|1430643:1476071|1471144_1471339_+|AWB17270.1|DBSCAN-SWA MEFLKQFLQIKKIIAVLTTIVFCILALKTNISSTEFLSVFTLIIGFYFGQSSARQAVKESKEQE >CP028842|1430643:1476071|1467770_1470434_+|AWB17266.1|DBSCAN-SWA MEYLGIEKFGSFLDNGAAYTIPDRPWFTDNYPGSLSERGKGNIRAIADRHEISLGNTLSNENSQIPWIHLKDGLKHIYVCKQVLATNISWDYLNERNMIYGTPVTIDGKQYKLRVLTGGVERNPDKPGMVPTDNEWDTIIQNTANITGLPKPTTEDLTEANTYGQLDGKHNQHWNWWGINTICQETRTLTSSKITRGYSSAASFTSYDAIALNSACGWRPVLEYIEIDPPSKPIPVYPTSEDKTYPEPIKGKITLQTKYNGDGYLEQMEVLVYNYTQQKFEYQTEWIDNTTGVMQLPVTFKAGNNYKITVRHKGTGGIAKGWLELYVIGGKLGKYKLSEPVTQKQYDKLTAYTSGDDLIMKPQQFPETENSVIRLVPQTMNTLTVKEDTTTEDLKYSSTTKTPTIGDKLIKDSQIYTISNIVEEQSEINVSTEIEKVTDANNSSLGWSGNVGKNSYLYNGNIYFACRTPSQVTIYKVSQAGGTPHQIWGTGITNSRGIAVVGDGNTLYTVVGQPKALAIFKTNLGTNETSKTILDIDTDPIDISATMDRKFRNLIVVMKGFVTVTTLYGIVGYRIKVDNVNSPELYKKTELDVGYPHKNIGSPFILDTGDYRSENLSVSYLRNYSDGKGQVIECLWYGDEISRKARAEINTTETGSSRISSALYTNKLGERTFMITYSYVGTTEAVGVFKQKKNEDGTFSSSSNDIIYPNDLITTLKINYDKEHGFIVVFSTSRGYIQTLHSLGYDHAWSSSSIVTNVAQRGTAPIYEVVEYNPYSYGQHPGLLILEYDETNKVDKLILRSDYTMEEPKANKLTLDKPITAQAGETIKFLDYDLEVKAREETATITPTEITDTYYEYDASFSKKESNRDITIKGRNTKLTTLYYYNY >CP028842|1430643:1476071|1433657_1434014_+|AWB17222.1|DBSCAN-SWA MKIAMPKNEKIINQHFGKSKSFAIVTVDDNKIIDIKDISTESLQHNHGGLSSLLVEEKVELVITGGIGQGAYDALIKEGLKVIRGAKGTIEDVLQQYLRGELQDRKVMCNHHGEHHHH >CP028842|1430643:1476071|1454421_1455669_+|AWB17254.1|portal|DBSCAN-SWA MIFDKLVERREAVDVNDWKSVYSFENGYDITPFELEMRESTYFSCINNISQDIAKCTLQIKKEIEKGEVLAKEHYLYDLLRLRPNPYMSAIDCYKTFVALAKHWGYAGLFIDRQRGKVKGLYPVKITNCTIDNTGLINSTKNNKILWDFEGVDGETGCCFDKDIIILRDFTLDGIKGKANRSILSESLDSSLKSQNYLNKLFTNGLTNKIVVQMTSDIKEEKELKKVQAKFDRVYSNNGKIFTIPAGYNIQPLNLSLSDAQYTELRKLSKEEIAMSFRVPLTKLGFVKENASSEEQDNIKYLTECLLVIFEQIEQEMDWKLLTPRERELGYKVRFNINVLLRTDSKTQSEVISTYVKNGVYDLDYAKDIVGVEKIGGELIITLPSGQVLLRDLLAGNVSYLNKKGSDTSEGGDKK >CP028842|1430643:1476071|1458835_1459444_+|AWB17261.1|tail|DBSCAN-SWA MSEEKVVPIVDLKKLYVAKVLTDRLTTTFDAPRYFEGVKELGLKPKVNSDDFYAEGILWISETTLANIDVEIDITDLKKEEEAFLLGHKLAAEGGIIRSSNDEAPEVALLYKAMKGNNKARYGIMYKGTFSISDESYKGKEGKANFQTKKLKGTFAPLRSNEMWNWKVDEEDGMTDEKFFKEVIIPTPKVDEEVENKKSEEA >CP028842|1430643:1476071|1473892_1474411_+|AWB17277.1|DBSCAN-SWA MKKLISILIAGILALGLVACGSKQTTKEYNKENINQDLKQEDKKDEKKESIDLKNTELNKGLSTVIPLEITQLREDGEGDDKGLFVELNTKDGSVEQKVKDFYTYSNVISGIVSSDKKYNCYKRIAFTTKQLGGILMYTSKESVDNFLTFDSGTFGKEEYQKIFDKLIKEGK >CP028842|1430643:1476071|1459935_1460124_+|AWB17262.1|DBSCAN-SWA MAKVHLNYTKEEFWDSTHAEIYKMWQRHIKFNKWEIRSDNEENNSTSDVNHKRVNIEDIPFL >CP028842|1430643:1476071|1458428_1458791_+|AWB17260.1|head,protease|DBSCAN-SWA MTIKQYLLKILNNKEILDLLPDKKVFFLHANNPNKSMYLEYEIIDEYGADYSEGKEDYTTYVVQIDIFSTGDYTECEEVVKRIMIQNGFNRDMAADLYEKKTGLNHKPMRFSIDLPTSKG >CP028842|1430643:1476071|1464013_1464715_+|AWB17263.1|tail|DBSCAN-SWA MFSIQFNNYNSYRDLGLVVEHRPNIPAPERNVNNIYIPGKNGTLTEDLETYEDIGISITFGFQDKVNINNKCRQIKMWLLDKIKDCKLYFSDDIETYYKVKNVKIDNIERSIKSLGKFTVLFTCDPFGYIDEEFLIIDKPISIYNEGTYESQPYIKIHGSGDISLNINNEVIKLKNINNYIELDSEIMECYKNNEALNNHMYGEFPIFKVGENKISWTGNINKIEIIPHWRCL >CP028842|1430643:1476071|1458061_1458421_+|AWB17259.1|DBSCAN-SWA MADGIEIEGMEEFTEMLEDMTIDEADEKKAVRKGIEVVAKRVESNTPVLTGKLKKIKKSVKKEGFATVGTVKLGAWWDLFQEFGTSQQKHHVGFFDRAVKDSENEAVEIVVEELLDKVR >CP028842|1430643:1476071|1444859_1445291_+|AWB17239.1|DBSCAN-SWA MSKKCLLLCNRHNSIYGDNWCLWWGERESKSGYTSDIRLAHRFNEEEIKGYAEKGYDIPVPIDVIGVLEEYEPKETYNKNLRVMIEKGTLNELMELELKPLFPDDEIICPNCGSCHYKEDFDYMGNEILICKECEYEFSEDDL >CP028842|1430643:1476071|1448887_1449280_+|AWB17246.1|DBSCAN-SWA MMNKKIYEKYKKNAENDLRNYPYWLLAIETPGLGAPNRWGQQVNQSGYFKTSTVEEDMIKDMERRWKVDIITKVLKHLDPTSKTIIEEWYFRDNNSREELLKELNIDKNKFYYYRNRALKKFMVAIGYLK >CP028842|1430643:1476071|1437040_1437502_-|AWB17226.1|DBSCAN-SWA MTYNKLLYEAESQGVEVVEMKFKGKCKGLYGDNVIALDKNIETLKEKRCILAEELGHHYTSSGNILDNSNISNLKQEKRARNWGYEKLVGIIDIINAFNAGTKNRYEMAEHLEVTEDFLESSIQHYKEKYGVLFEIDNYIVFFEPNFGVMKKF >CP028842|1430643:1476071|1434432_1435326_+|AWB17223.1|DBSCAN-SWA MKEYIIMTDSCCDLPSEYIENNHIPYIPLTCNVEGKEYIDNFGQSLPYKQFYEAMIKGEIPKTSQPSPEAYYKVFKELIDKDKDILYVCVSSGLSGTYNSANIAKNMILDEFRNARIEIVDVLTASLGQGIMVMKAMDMKKNGLTIDEVTSYLEENKLNLNSYMVVNDLIHLKRGGRISTAAALIGTVLNIKPILTLNDEGRVITVRKAKGRKVAIRKLAEIVIERIKNPEEEIVAISHGDSDLDAEKLRERILKEIKVKDIIINYVGPVVGTYGGPGSLNVFFMSDHRQNHIIDIN >CP028842|1430643:1476071|1450079_1450685_+|AWB17249.1|integrase|DBSCAN-SWA MGIKRPAKAITSTTKVLDIQDYLRYKNERDYVLFILGITTGYRAGDLVKLKVRDIKEALKRNEFTIYEGKKMNCKNIKERNKKPRSVEVLPKLAKILKGWIKNKKDYEYVFQSRKGINQHIGVQAVSNILKDAGEYFGLHDITAHSMRKTYAYKIYMESDKNIVAVKELLGHRSIEETKKYIGLDKEKYHQYSKSLEEYIR >CP028842|1430643:1476071|1457413_1457698_+|AWB17257.1|DBSCAN-SWA MTVEEIKDYIIVDDESDSFPEELMEISQIYIDSMVGEGYKQDEKMIKLASLLQRKLCADMYENRSTEVPQNVKQDRITASILDKLSNYDGDINV >CP028842|1430643:1476071|1470862_1471141_+|AWB17269.1|DBSCAN-SWA MNIEISILYTILGAALSYLGYKRLKEKDNKEEGKNEGITSLKLDYISKGVDDIRLDLKAADRKIEDVNTRLIKVEESTKSAHHRIDGLEKED >CP028842|1430643:1476071|1439668_1440160_-|AWB17231.1|DBSCAN-SWA MGSYRIAQICLNGHIVTDSYDTTPQFGEKFCTKCGSKTIISCPNCSANIRGDYESDTVCYLGSTMHTTPAYCYNCGQPYPWTKSALESARLLINEDENLSQIEKQQFSESIPDLLVESPTPKTKVAVVRFKKLLGKAATYTAEGIRDIFVDVASETIKKSLGL >CP028842|1430643:1476071|1440685_1440958_+|AWB17234.1|DBSCAN-SWA MNENWCILAIAALYERPCTIEQAFEVFDKGKLTKNKKKSQEDIEDMVKFRNMGMTFEEIADIYCADKRTVCRLINSFKKKKIAPCQEHNN >CP028842|1430643:1476071|1475112_1475541_+|AWB17279.1|DBSCAN-SWA MKNTMENCNFCKIINKEKKANIVYQNDLVCCFLAEEPINEGHMLIAPKKHYLDLDQMDDETAIEIMKVSKIMVKVLKDTYKSDGYSIMQNGGSFNNVGHYHMHLFPRYKGDSFSWSYGEEDSSTLEVVSKKIQQQLKDYVIK >CP028842|1430643:1476071|1470445_1470646_+|AWB17267.1|DBSCAN-SWA MGIYINNTIIQEKQKKEKNNITLQSLGQQLTQEKIKNMQKDAIINNLGKELTQIKLEMLQNKGGNL >CP028842|1430643:1476071|1442936_1443737_+|AWB17237.1|DBSCAN-SWA MKVLKWPGTKWSIANKIVDLMPEHKIYLEPFFGSGAVFFSKQPCNTEILNDLDSEVVNLFRCIRNTPEELAKLIYFTPYSKEEYKESYNRSGSDIERARQFLIRSNMARAGMQYYSSSWRHAGPVLGGQCKQRVSGDWNKVPERILQAADRLKDAEIENTNALELIKKYNKKNCLIYVDPPYLLSTRRQRYYNVEMTEDQEHEELINLLKKHSGPVMLSGYNSDLYNDLLNDWSKVEIKTNAEQGKERIEVIWTNYEIPKQISLFG |
64 | Clostridium_phage(75.0%) | terminase,integrase,protease,capsid,head,tail,portal,holin | attL 1436255:1436273|attR 1470644:1470662 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
1730069 : 1737135
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >CP028842|1730069:1737135|DBSCAN-SWA ACTATGTCATATTTGAATATATATCATTAATTTTTTTACATTTATCCTTTATAATTTCTCTAATATGATTGGGTTCAAGTACTTCCACACATTCTCCGTAACTTAATATCATGGAATATATCCAGTCATCTTCTAATAAATATGTATCTACAATTACACTACCATCTTCTTGAAACTTTATTTCATCTTTATCAAAACAATCGTCTATTCTATATCTAACTCTTTCAGAAAACTTTAATACAACTCTTGTAGGTACTTGTTCACTCTCACTAATATTTATATATTCTTTATAGGAAATTCTATTTTCATTAATTTTTTCATGTGGAACAGTTAAATTTTCCATTCTTGATAATTTGAAAAGTCGGTAATCATTTTTTAATTTGCAAAAGGAAAATAAATACCATGAGAAACCTTTAAAAACAAGAGTTAATGGCTCTATCTCCCTCCAATTATATTCACCTTTTGAGTTTCTATAATCAAAGGCTATACAGTTTTTGTTATCTACAGCATCATATATAATTTTGTATTTTAAGTTTTCTTCTTCACATTTTTTAAAGCCCCAAGGTAATGTATCTATACACATTTGCTCAAAATGCAAATCAAATACTTCTTTTTTTTCTTTAGGAACAATATTTTTTACCTTTTCAATGGCCATTTCAACATTTTTATTATCTAAAAATTTATTCATATTTTTTAGAGCTTCTATAATTGAAATCATATCTTCTAATGTTAAAAGTTGATGATTGATTTTATAGTTATCTATAATATAAAATCCTCCATTATTTCCAATTTGAGAAACTATAGGAATTCCAGCAAGATTAATTGCTTCAATATCTCTATAAATTGTTCTTACAGAAACCTCAAATTTTTCAGCTAATTCTGATGCAGATATTTTTTCTCTATTTAAAAGCATTACAACAATTGCCAATAATCTATTAATTTTCATGAATCTATAAACCCCCCATAATTTGAAATGACTATTTTATTATATCAAATTAATAACTTGTAAGATTGGTTAGAGAGAAATTGTTGAGGGAATTGCATAAGAAAGTTTTAAAAGAATAAATTCTAATATGGTAATTTTTGGGTTATCCATGGGTATGAACTTGACTTAACAAATGTACTATAGTAAACTTATATCGTAAAAAAGAATAAAGACAGTTCGTAACCATCCTGTCTATAAATAAAACTAGGACGTAGCTACCGCCTTAGGTAGTTTTTTTGTTGATGGGCATTTAATGCCCTTTTTTATTTGCAAAAAATTTACAAATAGGATTTTTGTTTTAGGTGAAATTTTTAATTTATATAAAGTTTAGAAATTGTTATTTAAGGACGCAGAGGTCTTATCCAATGAATTTTTTAACTTAAATATAACAGTAACAGTATAAGGCTGTTTTTTATAAAGATTGTCCAAATATAACTTAAAAACCTTACAAGGTAGGAAACTTTAAATAGTTGTAAAATATCCTAATAAATAATAATTTATCATAACCATTATAACTGTTTAATGTTTTCAAGTCTAAGTGAGTGTAATAGATTGAAAAATCTATAGCACAAGGAGGAATGAAAATGAAAAAAATAGGACTAACAACTACAGTGCCAGTGGAAGTTATTGTTGCAGCAGGATATACACCAGTAGATTTAAATAATATGTTTATAACTTCAGAGAATTATTTAAAATATATAGACATAGCTGAAAGAGACGGTTTCCCTAAAAGCTTATGTGCTTGGATAAAGGGAATTTATGGAGCATGTCTAGAAAATAATATTAAAGAAATAGTTGGAGTTATGGAGGGGGATTGTTCTAACACTAAAGCCCTCATCGAGGTTTTTAAACTAAGAGGAATAAAAATTTATCCATTTTCATTTCCACATAGCCATAGTTTAAAGGATGTAGAAATTGAAATAAGAAAGTTCATGGATATCTTCAATGTTAACGAGGATAAGGTAGAACAGGTTAGAAAAAGATTAAATAGAGTTAGGAAGCTAGCAAAAAAAATAGATGAAATGACTTATATAGATAATAAGGTTAATGGTTTTGAAAACCACCTATATCAGGTGAGCTTAAGTGACTTTAATGGAAACATAGATGAATTTGAAGAACACCTTAAAAAAGTCATTGAGGGTATGGAGAAAAGAGAGCCAATAAATAAAAAATTAAGATTAGGCTATATAGGAGTTCCTCCAATGACTGGAGATATATATGAGTTTAGTGAAAAATTAAATGCTCATTTTGTATATAACGAAGTTCAAAGAGAATTTGCTTTTCCTAGGGGGATAGAAGCTGCAAATATATTTGAACAGTATTATAATTACACCTATCCTTATGATAATGAGTTTAGAATTAAGGAATTGAAAAAGCAAATAGAAAAGAGAAAAATAGATGCTATAATTCACTACACTCAGGCTTTTTGCCATAGAGCTGTTGAAGATATAGTATTAAAAGAAGAATTAAATATTCCTATGTTAAATATTGAAGGTGATAAGTTAAATACATTAGATGCAAGAACTAAACTAAGATTAGAAGCCTTTCTGGATATGTTGCTGGACTTAAAGCAGAAGTAATAGGTGATCTAGTAAGAATTTTTATCTTAATATATTGTTGGATTTAAAGCAAAAGTAATAGACGGTATATAAAAGAAGTTCATGTTTTCTTTATATTTAGCGAAGGAGGGGAATTAATGAGATTGTTAGGAATAGACCTTGGAAGTAGAGAAGTTAAGATTGTTTTAATGGAAAACAATATTATAGTTCAAAAGAAAAAAGTAAGTACCATGAAATTTTATAGAGATTACTGTAGCTTTCATGGCAAGATTGTAGTAGATTTAGAAAAACTTAATATAGAAGGAATAGATAAAGCGATATCAACGGGTTATGGAAAAAATAATACGGATTTAGAATTTTTTACACCTATAAATGAGATAAAAGCCCATGTTTATGGTGGGATCTATCAAAGTAATTTAAAGGATTTTATACTTTTAGATGTAGGTGGTCAGGACGTTAAGGTGGTAAAGGTAGAAAAGGGTGTTGCAACAGATTTGGAGCTTAATGAAAAATGTGCTGCTTCCTGTGGAAGATACTTGGAGAATATGGCAAATGTACTTGAAATATCCCTAGATGAAATGAGCCAGTACTCGGAAAATCCCGTGGATTTAAATTCCACCTGTGCAGTATTTTCTGAATCAGAATTAATTGGAAAAATAGCCGAAGGGGTACACATAGAAAGGTTATGTGCTGGGGTTAATTACTCTTTGTATAAAAGGCTACAACCTCTTTTAAGTAAGTTTAGGGGGAAGAAATTAGTTATAACCGGTGGTGTTGCAAATAACCATTCAATAAAAAAATATTTAAATAATGATTATGAAGAAATAGTATCCGTAAAAGATCCTCAGTTTAATGGGGCTATTGGATGTTGTTATTACGGAAGCAAATTTTTAAAATAAACTTAGGAGGAAAAAACATGTATACTTTAAAAGTAGAACATAATTTTGATAGTGCTCATTTTCTTGCAGGTTATGAAGGTAAATGTGGAAATATTCATGGACACAGATGGAAGGTTGAAATTCAGGTTCAGGCAGAATCATTAGTACAAGGTGGTCAACTTGACGGGATGATAATAGACTTTGGAGACTTAAAAAAAGATGTTAAATCTATGGTAGATTATTATGATCATGCACTTATAATAGAGAAGGGAACTATGAGGGGGCAATCATTAAGCTCATTAAAGGAGGATGGATTTCGTATAATAGAAGTTAATTTTAGACCAACAGCGGAAAATTTTGCAGCTTTTTTCTATAAAATTATGAAGGATAGAGGATATAATGTAAAAAGTACTACAGTTTATGAAACACCTAATAATAGTGCTACCTATGAAGAAAGTGGGGTAATTTAAAATGGATTTTAAGGTGGTTGAAAGGTTTGTAAGCATAAATGGAGAAGGAAGGCGTTGTGGACAACTGGCTATATTCATAAGATTCGCGGGTTGTAATTTAAACTGTAGCTATTGTGATACACTTTGGGCAAATGAAAAGGATGTACCCTATGAAGTATTAAGTTCCAAAGATATATATGAATATATTAAGTCCAAAGAGGTTAAAAATGTAACTTTAACAGGAGGAGAACCTCTTCTACAAAAGGGAATAATGGAGTTATTAAAACTTTTGTCTAAGGATAAAGAGCTTTATGTGGAAATTGAGACAAATGGCAGCATATTATTAGATGAATTTTTGAATATAGAAAATTCACCAAGTTTTACTATGGATTATAAACTTCCTTTAAGTAATATGGAAAATAAAATGGCATTAGATAACTTTAAATATTTAACTAAGAAGGATACAGTAAAATTTGTATCAGGTAGTATAGAGGATTTAGAAAAAGCTAGAGAAATAATAAATAAGTATAACTTAGTAGATAAAACTAATGTATATATAAGTCCTGTTTTTGGAAAAATTAATTTAGATACTATTGTAGAATTTATGAAAAATAATAGAATGAATGGAGTTAATTTACAACTGCAGCTTCACAAGATTATATGGGAGCCTAGTAAGAGAGGAGTATAGCATATGGCAATTGATGTTAAAGCAATTGAAGAACACATAAGGGGAATTTTGATAGCTTTAGGAGACAACCCAGAAAGAGAAGGTCTAAAGAACACACCAAAACGTGTAGCTAAAATGTATGAAGAAGTATTCAAAGGTATGTGTTATAGCAATGATGAAATTGCAGAAATGTTTAATGTAACCTTTGAAGATGATTTATGTATAAATGATAATGAAAATGACATGGTTTTTATGAAGGAAATAGAAATATTTAGTCATTGTGAACATCATTTAGCACTTATGTACAATATGAAAGTAGCCATAGCATATATACCTAAGAAAAAAATTATTGGTTTAAGCAAAATAGCACGAATAGCAGATATGGTAGGACGTAGACTACAGCTTCAAGAGAGGATTGGAAGTGATATAGCAGAAATACTTCAGAAGATAACTGACTCAGAAGATGTAGCTGTTATTATAGAAGGAGAACATGGCTGTATGACTACTAGAGGAATAAAGAAGCCAGGTACTAAAACTATAACAACTACATTAAGGGGAAAGTTTAACACAGATCCTATTGTAAGCAATAAATTAATGATGCTTTATACGAAATAAAGAAATTTTTAGTTCTAGTTAGAGTTTTATTAAAATAAATATATTAAATTCGTACAAGATTAAAAAATCTTACACATGAGTAGAACAGTTTATATAAAGAGAGTGTATTAAAGAAGCATAACTATAACAAAGATTTTTGTAGATTGTAGGATGATAATAAAATAATAAAGGGATGTGTAGTAGATGAATAAGGAAAAAGCAATAGTAGTATTTAGTGGTGGACAAGATAGTACAACCTGTTTGTTTTGGGCAAAGAAAAAATATAAAGAAGTTATAGCAGTATCCTTTGATTATAATCAAAAACATAAATTAGAGTTAGACTGTGCAAAGGATATATGTAAAAAATATAATATTGAACATCATATTTTAGATTTAAATTTGTTAAATCAATTAGCACCAAATTCACTAACTAGGCAGGATATAACTGTTGATAAAAGCGCACCTAAAGAAGGGGTGCCTAATTCCTTTGTAGATGGAAGAAATTTATTGTTTTTAAGCTTTGTCGCAGTATTTGCAAAACAAAAAGGAATAAACACTATTATAACTGGTGTGTCACAGAGTGATTTTAGTGGATATCCAGATTGTAGAGATGTATTTATAAAATCTTTAAATGTTACATTAAATTTAGCTATGGATTATGAATTTGAAATAATTACACCACTAATGTGGATCAATAAAGCAGAAACGTGGAAAATGGCTTATGATTTAGGGGTTCTTGATATCGTTAAAGAAGAAACCTTAACATGCTACAATGGAATAAAAGCAGATGGATGTGGGGAATGTCCAGCTTGTAAATTAAGAAAAAAGGGATATTGGGAGTTTGAAAAAGAGTATTTAAAATAGTAATTTTATATGTGTTGCTTGAGCAATACCTCCTTTTTATATTTCGTATTTAGTTTTTGTAAATTTTGTCGATAATTTAATATTAGAAGTATGAAATATTAGGAGGATTATACTATGATAAATATTTTTAGTAAAAAAGATAGTGAAAAGGATAATAAAAATGATACTATTGAGCAGGAAGTTATTGTTGAAGAAAAACATGAAGTTGAAACTATAGATACTATGAAATTTCTAAAAGAAATGACTATACAGATAGAGGGTATAATACAGCAGCATAATAAAGTTAATGGTGAACATGAAGTGCTTGAAAAATTAGCAAAACAGATTGAAAATCATATGGTAACAGTATCAAATTTAACTGAAAGGACTAATGAATCAACAGATAAGCTTTTTAGTCAAGGAGAAAGTCTGTTAGAGATTACAAAAGATACTGTAAATAAATCCTTAGAAGGTAAAAAGTCAATTGAGGGTATGGTTAAAGTAATTGAAAATCTTGACATAGAAACAAAGGATACATACGAGAATATTAATGCTTTGGGCGAAAAACTAAAGGAGATTGGAGAAATTGCTCAATTAATAAGTGGAATAGCCTCAAAAACAAATCTTCTTGCTCTTAATGCTGCCATAGAAGCAGCCCGTGCAGGAGAACAAGGCAAAGGCTTTGCAGTAGTTGCTGATGAAGTTAGAAAATTGGCAGAAATGACCGGTGAAAGCAGTAGTAATATAACTAATTTAATTAGTGGCATAGACTCACAAACTGAAAATGTTTTAAATAGTGTTGAAAAGAGTACATTAGTAGTTACAGAAGGAGTAAAATCCTCTAAAGGAGCACTTGAAAAAATAGAAGAAGTTCTAGATTCATTTAACAGAGTTGAAGATGACACTGATAGCCTAATAAAAACAATTAATACTCAAAAAGAAGATATAAGTAAAATTTTTAACGGAATAAATGGAGTAGATAAAATTCTTACTGAAACCAATGAGCAAATTATAAAGCATATAGATGAGGCACACAAAGTAGATGAGAAATTAGAAAAAAGTGTATATCATATAGCTCAATATGTAAAATAA
Protein sequences of DBSCAN-SWA_4 >CP028842|1730069:1737135|1736178_1737135_+|AWB17515.1|DBSCAN-SWA MINIFSKKDSEKDNKNDTIEQEVIVEEKHEVETIDTMKFLKEMTIQIEGIIQQHNKVNGEHEVLEKLAKQIENHMVTVSNLTERTNESTDKLFSQGESLLEITKDTVNKSLEGKKSIEGMVKVIENLDIETKDTYENINALGEKLKEIGEIAQLISGIASKTNLLALNAAIEAARAGEQGKGFAVVADEVRKLAEMTGESSSNITNLISGIDSQTENVLNSVEKSTLVVTEGVKSSKGALEKIEEVLDSFNRVEDDTDSLIKTINTQKEDISKIFNGINGVDKILTETNEQIIKHIDEAHKVDEKLEKSVYHIAQYVK >CP028842|1730069:1737135|1734630_1735221_+|AWB17513.1|DBSCAN-SWA MAIDVKAIEEHIRGILIALGDNPEREGLKNTPKRVAKMYEEVFKGMCYSNDEIAEMFNVTFEDDLCINDNENDMVFMKEIEIFSHCEHHLALMYNMKVAIAYIPKKKIIGLSKIARIADMVGRRLQLQERIGSDIAEILQKITDSEDVAVIIEGEHGCMTTRGIKKPGTKTITTTLRGKFNTDPIVSNKLMMLYTK >CP028842|1730069:1737135|1730069_1731014_-|AWB17508.1|DBSCAN-SWA MKINRLLAIVVMLLNREKISASELAEKFEVSVRTIYRDIEAINLAGIPIVSQIGNNGGFYIIDNYKINHQLLTLEDMISIIEALKNMNKFLDNKNVEMAIEKVKNIVPKEKKEVFDLHFEQMCIDTLPWGFKKCEEENLKYKIIYDAVDNKNCIAFDYRNSKGEYNWREIEPLTLVFKGFSWYLFSFCKLKNDYRLFKLSRMENLTVPHEKINENRISYKEYINISESEQVPTRVVLKFSERVRYRIDDCFDKDEIKFQEDGSVIVDTYLLEDDWIYSMILSYGECVEVLEPNHIREIIKDKCKKINDIYSNMT >CP028842|1730069:1737135|1733961_1734627_+|AWB17512.1|DBSCAN-SWA MDFKVVERFVSINGEGRRCGQLAIFIRFAGCNLNCSYCDTLWANEKDVPYEVLSSKDIYEYIKSKEVKNVTLTGGEPLLQKGIMELLKLLSKDKELYVEIETNGSILLDEFLNIENSPSFTMDYKLPLSNMENKMALDNFKYLTKKDTVKFVSGSIEDLEKAREIINKYNLVDKTNVYISPVFGKINLDTIVEFMKNNRMNGVNLQLQLHKIIWEPSKRGV >CP028842|1730069:1737135|1735404_1736064_+|AWB17514.1|DBSCAN-SWA MNKEKAIVVFSGGQDSTTCLFWAKKKYKEVIAVSFDYNQKHKLELDCAKDICKKYNIEHHILDLNLLNQLAPNSLTRQDITVDKSAPKEGVPNSFVDGRNLLFLSFVAVFAKQKGINTIITGVSQSDFSGYPDCRDVFIKSLNVTLNLAMDYEFEIITPLMWINKAETWKMAYDLGVLDIVKEETLTCYNGIKADGCGECPACKLRKKGYWEFEKEYLK >CP028842|1730069:1737135|1732749_1733511_+|AWB17510.1|DBSCAN-SWA MRLLGIDLGSREVKIVLMENNIIVQKKKVSTMKFYRDYCSFHGKIVVDLEKLNIEGIDKAISTGYGKNNTDLEFFTPINEIKAHVYGGIYQSNLKDFILLDVGGQDVKVVKVEKGVATDLELNEKCAASCGRYLENMANVLEISLDEMSQYSENPVDLNSTCAVFSESELIGKIAEGVHIERLCAGVNYSLYKRLQPLLSKFRGKKLVITGGVANNHSIKKYLNNDYEEIVSVKDPQFNGAIGCCYYGSKFLK >CP028842|1730069:1737135|1731637_1732633_+|AWB17509.1|DBSCAN-SWA MKKIGLTTTVPVEVIVAAGYTPVDLNNMFITSENYLKYIDIAERDGFPKSLCAWIKGIYGACLENNIKEIVGVMEGDCSNTKALIEVFKLRGIKIYPFSFPHSHSLKDVEIEIRKFMDIFNVNEDKVEQVRKRLNRVRKLAKKIDEMTYIDNKVNGFENHLYQVSLSDFNGNIDEFEEHLKKVIEGMEKREPINKKLRLGYIGVPPMTGDIYEFSEKLNAHFVYNEVQREFAFPRGIEAANIFEQYYNYTYPYDNEFRIKELKKQIEKRKIDAIIHYTQAFCHRAVEDIVLKEELNIPMLNIEGDKLNTLDARTKLRLEAFLDMLLDLKQK >CP028842|1730069:1737135|1733528_1733960_+|AWB17511.1|DBSCAN-SWA MYTLKVEHNFDSAHFLAGYEGKCGNIHGHRWKVEIQVQAESLVQGGQLDGMIIDFGDLKKDVKSMVDYYDHALIIEKGTMRGQSLSSLKEDGFRIIEVNFRPTAENFAAFFYKIMKDRGYNVKSTTVYETPNNSATYEESGVI |
8 | uncultured_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_5 |
3024872 : 3034356
Sequences of DBSCAN-SWA_5
Nucleotide sequences of DBSCAN-SWA_5 >CP028842|3024872:3034356|DBSCAN-SWA TCTAGTGTTTAAAATGTCTTATTCCTGTAAATACCATAGAAATCCCTTTTTCATTACATACCTTTATAGATTCTTCATCTCTTATAGAACCGCCTGGTTGAATTATAGCTTTTATTCCCCATTTTGCAGCTTCTTCTGCTACATCTCCAAATGGGAAAAAAGCATCTGAAGCTAAAACTACGCCATCTCCAGCTCTATCTAACGCTTCCTTTGCTGCCCATATTCTATTTACTTGGCCTCCCCCAATACCTTTTGCCATACCATCTTTAACTACTACAATAGCGTTGGATTTCACATATTTAACTACTTTCATACCAAATATAAGATCTTTCATTTCTTGCTCTGTTGGAGATTTTTCTGTAACTACTTTTGTATCTTCTAATAATTTATTATCACTCTTTTGTACTAATATTCCTCCATCTACCTTTGCCATATCTTTTCCTTCTGTAGATTTTTCTTCACATTTTATAACCCTTAAATTTTTCTTGTTTTTTAAGACTTCTAAAGCATCTTCATCAAAATCTGGTGCTACAACTATTTCTAAAAATATTTTTGCAAGATTTTCTGCTGTTTCCTTATCTACTTTTCTATTAAAAGCAACTATGCCACCAAATATAGATATAGGATCACATTCATAGGCCTTAGTATAAGCTTCCTGTACAGTATCCCCTATAGCCACACCACAAGGTGTATTATGTTTTAATGCACAACAAGCCACCTCTTCAAATTCACAAACGGTTTTCCACGCTATATCCATATCCTTTATATTATTGTAGGATAATTCTTTTCCATTTAACTTTTCAAAATTTTTCATAGGATATTTTCCAACAGTAGATGTGTAATAAGCTGCTGTTTGATGAGGATTTTCTCCATATCTTAAATCCATGTTCTTTTTATAGGATAGAGTTAAATATTCTGGATATTCCTCTTCTAATAAGAAATTACTTATAGCTGCATCATAGGCTGACATTAGATTGAAAACTTTTCCTGCTAATTTTTTTCTAGTTTGTATATTAACCTGATTATTTTCTTTTATCTCATTTATGACATTTTCATAATCCTTAGTATCTGTTAGTACTACTACATCTTTAAAATTTTTAGCTGCTGCTCTTATCATAGTAGGTCCACCAATGTCTATAAACTCTACTTTTTCATCAAAACTTAAATTTTCTTCTACTTTATTAAAGAAAGGATATAAATTCACTACTACCATATCTATAGGGTTTATGCCCTTTTCTTCTATTACCTTCATATGCTCTTCATTATCTCTTATAGCTAATATGCCTCCATGAATTAAAGGATTTAATGTTTTTACTCTTCCATCTAACATTTCTGGGAAACCTGTTACCTCTTCTATATCTATTACTTTTACTCCATTTTCTTTTAAATGTTTATAAGTTCCACCTGTAGATATTATTTCTACATCTCTACTTTCTAAAAACTTTGCCAAATCTAAAATTCCTGTTTTATCAAATACACTTATTAATGCTCTTTTTATCACTTAAACTCCCCCAGTTTCAATATTTTTTATTATCTTATTTATCTGTCATAAGTAACTGCCACCAATATACCTTCTTTCAAAGAAAACATATAAGTGGCACTATTTCAATTTACAAACTACAATTTTTTATATTTCAATAAATTTAATCTACTCTAAACACATTTTTCTATTAGTTTCATTTATATTAATAGTAATTTTTTCATTATTATAAATTTAGTATGTTTTAATAAAAACTTTTCTTCCTTGTAATTTTACTTTTTCTTCACTTATAAGTTTTATAGCTTCTGGTAATGCCTCATGTTCTTTTTCTAGAACTCTTTTTTGCAATATTTCTGCTGTATCTTCTGCAAAAACTGGTACAGATTTTTGTATTATTATAGGTCCACTGTCCGTACTCTCATCTACAAAATGAACAGTGCACCCAGATACTTTTACTCCGTATTCTAATGCTTTTTGGTGCACTTTTATACCATACATTCCATCTCCGCAAAAGCTTGGTATTAATGAAGGATGTATGTTTATTATCTTATTTTCAAATTTATTTACCAAATCCCCATTTAATATAGAAAGCCATCCTGCTAAAACTATTAAATCTACGTTTCCATATAAACACTCACATATTTTATTAGACAGATTGCTTTTATATATTTTTCTATCTAGAGTTAAAGTTTTAATTCCCTTTTTTTCTGCTCTTTCTATACCATAAATATTAGATCTATCCCCTATAACCATTTCTATCTTGCAATTTTTTATATATCCCTCTTCTATTTTATCTATTATAGATTGAAGATTGCTTCCTCCCCCTGAAACAAGTACTGCAATTTTAAACATCTTATTCTCCTTTAATTTAAAGAAAATTTTTCATATATACTCTATAAATAATTAATTCCCCAATCAATTATTTTAAAGATCTAACCTATGAACTAATTTTTATTATAAATTTATTTAATGCCTTTTTTTAAATTAGTTCAACAGACTTATCTCCTTTTTTAACATATCCTATTTTATAACCCTTTTCTCCCATTTCTATCAGGTCTTTTATTATATTTTCCCCATCTTTTTCATTTACACATAATACAAAACCAATCCCCATATTAAAAGTATTGTACATATGATCTTCTTCTATCCCTAAACTTATTAGATGGCTAAATATATTTGGTAATGGATAAGATTTTTTATTTATAACTGCTGTAAAATCCTCTTTAAACATTCTAGGAATATTTTCATAAAAACCTCCTCCAGTTACATGAGCCATACCTTTTATATTATATTTTTCTAAAAGTTTCATTACAGGTTTTACATATATTTTTGTAGGAGTTAAAAGAGTATTTCCTATTTTATTTCCTTCAAAATCTTTATGCAAATCTTCTACTAATTTTCTAATAAGAGAATATCCGTTGCTATGAGGTCCTGAAGATGCTATACCTATTAATATATCCCCATCTTCTATTTTACTTCCATCTATTATTTCATCTTTTTCTGCTATACCTACAGCAAAACCAGCTATATCATATTCCCCATCTCTATAAAAGCCTGGCATTTCTGCTGTTTCTCCACCTATTAGAGCACATTCACTTTGGATACAACCATTGCTAACCCCTTCTACAAGCTGAGCTGCAACTTCTGCTTCCAATTTCCCACAAGCTATATAATCTAAGAAAAATAACGGCTTAGCACCATGACATAATATATCATTTATGCACATAGCTACGCAGTCTATTCCCACTGTATTATATTTTTTCATTCTAAAGGCTATATCTAATTTAGTTCCAACTCCGTCAGTTCCTGATACTAATACGGGATTTTTATATTTAGGAAGTTCAAACATTCCTGCAAAACTTCCTAAATTATTTAATACTCCCTTTGTAAATGTCTTTGAAGCATGTTTTTTTATAAGATCTACTGATTTATAACCTTCCTCTATATTAACCCCAGCTTCTTTATAAGATACCATGAATAACATTCCCTTCTTTACATTATTAGTTATTCTCAAAATTTAAAAAACTTAAATTCCCTATTCCAAACTATCTTTAGGCATTTCTATAGGTGCAGATATAGGATATACGCCATTAAAACATCCCAAGCAAAAACCTTTATCTTTATTAAGTGTTTCTACTAAGCCTTCCATACTTATATAAGCTAGACTATCTGCTCCTATTTTTTCTCTTATTTCTTCTACTTCTGAGTGAGCACCTATTAAATCTTTTCTATAAGGAGTATCTATTCCAAAATAGCAAGGATATTTAACCACTGGAGATGATACTCTAAAATGAACTTCCTTAGCTCCAGCTTTTCTTAATATTTGTACTAATCTTTTACTAGTAGTTCCTCTTACTATGGAATCATCTATTATTACTACTCTTTTTCCTTCTACATTTATTTTAAGTGGATTTAGTTTTACAGATACAGCTTTTTCTCTTAATTCTTGAGAAGGTGCTATAAAAGTTCTTCCCACATATTTATTTTTTATAAATCCTATACCATAAGGTATTCCTGAAGCTTCAGCATATCCTACCGCAGCTGGTATACCTGAGTCTGGGACTCCTATAACTATATCTGCCTCTACTGGGTATTCTTCATAAAGTTTTCTTCCCGCTCTAATCCTTGATTCATAAACATTTATACCATCCATAGTACTATCTGGTCTTGCAAAATATATATATTCAAAAGCACAGGTATGACATCTTGTTTTTTCTGTAAACTTAATTGAATTTATTCCACTTTCGTCTATAATAACTATTTCTCCAGGCTCTATATCCCTTATAAACTCTCCACCTACGCAATCAAAAGCACAACTTTCCGAGCTTAATAAATAATCATCCCCAATTTTTCCTAGGCACATAGGCCTTATACCATGAGGATCACGTGCTCCTATTAACTTATCTTCTGTAAGTATAACGATAGCATAGGAACCTTTAATTGCTTGTATTGCATCTACTACTGCTTTATCTATACCTTTTTTAGCGCTTCTTGCTATTAAGTTTAATAATACCTCTGTGTCTATAGAAGTTTGAAAAATACATCCGCCATCTTCTAAAAGTTCTCTTATAACTGCTGCATTAACTAAATTACCATTATGAGCTATAGCAATAGAACCTAACTTATAAGTACCTACTATAGGTTGTGCATTATCTGATTTACTCGCTCCTGTAGTTGAATATCTAACATGTCCTATAGCAGAATTTCCTATTAATCCTTCTATAGTTTCTTTGCTAAAAACATCCGATACAAGACCCATACCCTTATGATATTTAAATTTTTCTCCATCAGATACTACTATTCCTGCACTTTCTTGTCCCCTATGTTGAAGAGCATATAATCCGTAATAAGTTATTTCTGCTGACTTTGATTCATTATCTTTAGAAAATACTCCAAATACCCCACATTCTTCTTTAAACTTATCTCCTTCTAAATCAAAGGGCATATTTTCATTTAAATCATCTAACATATAGCACATACTCATTTTTACTCCCCACTTATTTTCTATTTTAAAAATTTAATCTTCTCTTAGATTATTTCCAGCTGCTGTAAAAATAATTTTAAACTATAACAATCTATTTATTGACTCTTTTTAATATTTCCATATAAGCTTCTTTTACATTTCCCATGTCTCTTCTAAATCTATCTTTATCTAACTTTTCTCCTGTGCTTTTATCCCATAATCTACAAGTATCTGGGGATATTTCATCTGCTAAAAGGAGCTCACCATTAAATCTTCCTATTTCTATTTTAAAATCAACTAGATTTATTCCTTGCTCATCAAAGAATTCTTTTAATGTATTATTTACTTTTTCTGCTATAGAATACATTTCTTTTAGTTCTTCAAAGGTTGTAAGTCCTATAGCCACTGCATGATAGTCATTTATAAGAGGGTCATTTAAATCATCATTTTTATAACTTATTTCAAATACAGTAGTATCTAATTTTCTTCCTTCTGAAAGACCTAATCTTTTTGCCATACTTCCTGCTGCTATATTTCTAACTATAACTTCTAGTGGAACTATTTCTACTTTTTTGCAAAGCTGTTCTCTTTCATTTATCTTTTCTATAAAATGTGTTTTTACGCCCTTTTTTTCTAAAAGTTCAAATAACATTGCCGTTATAGAGTTATTCATAACTCCCTTATCTTCAATAGTTCCTTTCTTTTCCCCATTAAAAGCTGTGGCATCATCCTTATAATACACAACAACTGTATCCTTATCATCCGTTCTGAATATTTTTTTAGCCTTTCCTTCATATAACATATCCTTCTTTTCCATTATAACTCCACTCCCTCTTTGTTATCATTTATAAATTTTTCTTTCATATCTTTTCTATATTCTATAAGTTTTTCTTTTAACTTTTCATACTTTAAAGATAATATTTGTACCGCAAGCATTCCTGCGTTATAACTATTATTTATACCCACTGTAGCTACAGGTATAGATTTAGGCATTTGAACTATAGATAAAAGTGAATCCATTCCTCCAACTGCGGCTTCTATAGGCACTCCTATAACCGGAAGAACCGTATGAGAAGCTATAACCCCAGGTAAATGTGCTGCAAGACCTGCCCCAGCAATTATACATTCATAACCTTCCTTTTCTAAATCTTCAATTGTTTCCATCAACTTTTCTGGTACTCTGTGCGCTGAAAGTATGTAAGCTTTATATTCTATACTAAACTCTTTTAAAGCTTTAGCCGCTCCCTTCATTTTATCAGTATCAGATTTACTTCCAAAAATAATAGCTACTTTCATGTACTAGACCTCCTTATATTTAAATATATAAAAAATTCCGCTAAGATTTCTATGGAGAATCCTAAAGCGGAACTTAAGCGCACTGCAAAAGCATAGCTAAGATTCATCCATAGACAGGGAATTTATGGTTCCCTCGTAGAGACTCTCAAACCTTATTATTGAGATTATATGGATGATATATTCATTTGTTTTATGTACTCATGGTAACATATAATTCTTAATAAATCAACATACTTTTATAAAAACATTCGTATTTTATTGGTATTTTATTTATTTTTTTATAATATTATTCGTAATGTAACGAACAATTAGTTAGGTGAAAAATTCACTGAAATATATATTATATTGTAATAGAAATAATTTATAATAGAAATTTATTTCTGAAAATAAAATAGATTTAATTTTCAGATATCAAGCAAAATAATATATGGTAATAAACATATGAATAAGCTTTAACATTTTCTAATCTTTTTAAATCGAGAGCTTTTGTTATTAATCAAAGAATGAAGGTAAAAAACCGATGGCCAAGCCACACATAGCTTTTCCACCGGGTAAAAAATTTTTAATGAAAAAATTTGAGATTCCTAGTCAAGTAAGTTATCTATCTATACATGTATTTTTTATATTTGCATGGTTAAAATTAAATCTATTTTAAAATATTACTATCTAAGATAATTATTTTTTTCTTCTATAAGCAGTATCCTCAAGTGGAAGCTTTTTTCTAAAGTTTCCATCAAATTTATAGTAAGCACCTTGAGCTGCTGGGGCTGTTGGTATGGTTGTAATTTCTCCTATTCCTTTTGCACCATAAGCTAAATCATTAGTATTCTTTTCAATTATTGTTGTTTCAATTTCTGGTATATCAGTAGCTCTAAACAAACCTAATGTGCCAAACTTAGCAGTTGGGATAGATTTATTTAATGGATAATCTTCTGTAAATGCATACCCAAGTCCCATAACTATTCCACCTTCAATTTGTCCTTCTACATTAGTTAAATTTATAGCTTTTCCCACATCATGTGCTGCAACTACTCTTTCTACTTTTCCATCATCATCAAGAATAACAACTTGTGTTGCATAGCCATAAGCCACGTGACTTACTGGATTCTTTTTATCAGAATTAATAGGATCTGTAATACTTTGATATTCCCCATAAAATTCTTCACCTTCACACTCTTCTAATGATGTAGTTAATAATTTTTCCTTAAGCTTTAATGATGCCATTCTTGTGGCTTCTCCAGTAAATACTGTTTGTCTTGATGCTGTAGTTGTCCCTGAATCTGGTGCAAATTTTGTATCTGGTAAATCTAAAATTATCTGTTCTGGTAATAAACCTATTGTTTCACATATTATTTGTGTAAGAATTGTTCCAAGACCTTGACCTATGCAAGCTGCACTAGTTCTTATATGAACCTTTCCATCTATTACTATTAAGTTACATCTTCCAATATCCGGTATTCCAACACCAACTCCTGAATTTTTCATACAACAGGCTATTCCTGCACATTTACTCTTTTTATATACATCTTTCACAGCTAATATAGTTTCTTTAATTGCAGTTCCTTTATCAGCAATTTGTCCATTAGGTAGTGCATCTCCAGGTTCTACTGCGTTTTTAAATCTTATTTCCCAAGGAGATATACCAACTTTTTCAGCTAAAAGATTTAAGTTGCACTCTGATCCAAAAACTGATTGTGTTACTCCAAATCCCCTAAAAGCTCCTCCTGGGGGATTGTTAGTATATACAGCGGTACCTTTTATTTTCACATTAGGACATTTATATGGGCCAGCTGCATGAGTACAAGCTCTTTGGAGTACAGGTCCTCCTAATGATGCATAGGCACCAGTATCTGATATAATATCTGCTTTAAAAGCAGTTAAATTTCCTTTTTCATCACATGCAGTAGTAATTGTCATTTCCATAGCATGTCTTTTAGGATGAATCTTTATACTTTCCTTACGACTTAAAGTTATTTTAACGGGCTTTTTAATAGTCCATGCAAGAAGAGCGGCATGATGTTGTACACTCATATCTTCTTTTCCACCAAAGCCTCCACCCACATATTTGCTAATAGTCCTTACTTTTTCTTTAGGAAGCCCTAAAAGCTCAGAAATCTCTCTCTGCTCATCATATATACCTTGGCTTCCTGTATAAATAATAACTCCATCCCCATCTGGCATAGCTAAAGCACTTTCAGGCTCTAAAAAAGCATGTTCAGTAAAGGGAGTAGAATAATGATTAGTAACCACATACTTAGAATTGGCTATTGCCTCATCTACATCTCCTCTATTAACTTTTTCCACTGTTAAAATATTTCCCTTAGGATGAATTTTAGGAGCATCTTCAGCTATTGCAATATTAGGATTAGAAATAGGTTCTAATTCTTCATATTCTACCTTTATTAAATTAAGTATTTCTTTTAAAGCCTTCTTGCTTTTTGCTGCCACTAAAGCCACTGCATCACCAACATACCTTGTTCCTTCTCCTACGGCTATCATTGCTGGCCAATCCTTTACAATATGTCCTATAAGCCTATTTCCTGGGACATCTTCTGCTGTAAGAATAGCTTCAACTTCTGGATGTTTTAAAGCTACACTTATATCAATGCTTTTTACTAAAGCTCTAGGATATTTTGATCTTAAAGCAGAACCATAAACCATTCCTTCTATCTTCATGTCATCTACATATTTTCCTATACCTAAAATTTTATCTTTTGCATCTATTCTTGGAATATTTTCACCTATTTTCCCTTTATATTCTTTCGCAAATGGAAGTTTACCATTTCTAAATGCCCCTGCTGCCATTTCAATGGCTTTTATTATTTTCACATATCCAGTACATCTACATACATTTCCTCTAATAGCAGTTTTAATTTCTTTCTTATTTGGATTTAGATTTTTATCTAAAAGTGCCTTTGCACTTATTATCATCCCTGGAATACAATATCCACACTGTACTGCTCCAGCTTTAGAAAAAGCCCAAGTAAAAACATCCTTTTCAAATTCTGTTAACCCCTCTACAGTCTTAACATCTTTTCCATTCACCTTTGCAGTTGTACATATACAGGCTCTAAGCGCCTTACCATTAACAAGTATCATACAGGCTCCACAGGCTCCTTCTGCACACCCATTTTTTACTGAAGTTAAATCCTCATTATCCCTCAAATATTCAAGTAAATTAATATCCTCTGAAACAGATACATTTCTTTCATTTAATATAAATTCATACACATTTATTACCCCCAT
Protein sequences of DBSCAN-SWA_5 >CP028842|3024872:3034356|3031785_3034356_-|AWB18695.1|DBSCAN-SWA MGVINVYEFILNERNVSVSEDINLLEYLRDNEDLTSVKNGCAEGACGACMILVNGKALRACICTTAKVNGKDVKTVEGLTEFEKDVFTWAFSKAGAVQCGYCIPGMIISAKALLDKNLNPNKKEIKTAIRGNVCRCTGYVKIIKAIEMAAGAFRNGKLPFAKEYKGKIGENIPRIDAKDKILGIGKYVDDMKIEGMVYGSALRSKYPRALVKSIDISVALKHPEVEAILTAEDVPGNRLIGHIVKDWPAMIAVGEGTRYVGDAVALVAAKSKKALKEILNLIKVEYEELEPISNPNIAIAEDAPKIHPKGNILTVEKVNRGDVDEAIANSKYVVTNHYSTPFTEHAFLEPESALAMPDGDGVIIYTGSQGIYDEQREISELLGLPKEKVRTISKYVGGGFGGKEDMSVQHHAALLAWTIKKPVKITLSRKESIKIHPKRHAMEMTITTACDEKGNLTAFKADIISDTGAYASLGGPVLQRACTHAAGPYKCPNVKIKGTAVYTNNPPGGAFRGFGVTQSVFGSECNLNLLAEKVGISPWEIRFKNAVEPGDALPNGQIADKGTAIKETILAVKDVYKKSKCAGIACCMKNSGVGVGIPDIGRCNLIVIDGKVHIRTSAACIGQGLGTILTQIICETIGLLPEQIILDLPDTKFAPDSGTTTASRQTVFTGEATRMASLKLKEKLLTTSLEECEGEEFYGEYQSITDPINSDKKNPVSHVAYGYATQVVILDDDGKVERVVAAHDVGKAINLTNVEGQIEGGIVMGLGYAFTEDYPLNKSIPTAKFGTLGLFRATDIPEIETTIIEKNTNDLAYGAKGIGEITTIPTAPAAQGAYYKFDGNFRKKLPLEDTAYRRKK >CP028842|3024872:3034356|3031630_3031765_+|AWB18694.1|DBSCAN-SWA MAKPHIAFPPGKKFLMKKFEIPSQVSYLSIHVFFIFAWLKLNLF >CP028842|3024872:3034356|3028386_3029835_-|AWB18691.1|DBSCAN-SWA MSMCYMLDDLNENMPFDLEGDKFKEECGVFGVFSKDNESKSAEITYYGLYALQHRGQESAGIVVSDGEKFKYHKGMGLVSDVFSKETIEGLIGNSAIGHVRYSTTGASKSDNAQPIVGTYKLGSIAIAHNGNLVNAAVIRELLEDGGCIFQTSIDTEVLLNLIARSAKKGIDKAVVDAIQAIKGSYAIVILTEDKLIGARDPHGIRPMCLGKIGDDYLLSSESCAFDCVGGEFIRDIEPGEIVIIDESGINSIKFTEKTRCHTCAFEYIYFARPDSTMDGINVYESRIRAGRKLYEEYPVEADIVIGVPDSGIPAAVGYAEASGIPYGIGFIKNKYVGRTFIAPSQELREKAVSVKLNPLKINVEGKRVVIIDDSIVRGTTSKRLVQILRKAGAKEVHFRVSSPVVKYPCYFGIDTPYRKDLIGAHSEVEEIREKIGADSLAYISMEGLVETLNKDKGFCLGCFNGVYPISAPIEMPKDSLE >CP028842|3024872:3034356|3027330_3028326_-|AWB18690.1|DBSCAN-SWA MVSYKEAGVNIEEGYKSVDLIKKHASKTFTKGVLNNLGSFAGMFELPKYKNPVLVSGTDGVGTKLDIAFRMKKYNTVGIDCVAMCINDILCHGAKPLFFLDYIACGKLEAEVAAQLVEGVSNGCIQSECALIGGETAEMPGFYRDGEYDIAGFAVGIAEKDEIIDGSKIEDGDILIGIASSGPHSNGYSLIRKLVEDLHKDFEGNKIGNTLLTPTKIYVKPVMKLLEKYNIKGMAHVTGGGFYENIPRMFKEDFTAVINKKSYPLPNIFSHLISLGIEEDHMYNTFNMGIGFVLCVNEKDGENIIKDLIEMGEKGYKIGYVKKGDKSVELI >CP028842|3024872:3034356|3030630_3031110_-|AWB18693.1|DBSCAN-SWA MKVAIIFGSKSDTDKMKGAAKALKEFSIEYKAYILSAHRVPEKLMETIEDLEKEGYECIIAGAGLAAHLPGVIASHTVLPVIGVPIEAAVGGMDSLLSIVQMPKSIPVATVGINNSYNAGMLAVQILSLKYEKLKEKLIEYRKDMKEKFINDNKEGVEL >CP028842|3024872:3034356|3026585_3027203_-|AWB18689.1|DBSCAN-SWA MFKIAVLVSGGGSNLQSIIDKIEEGYIKNCKIEMVIGDRSNIYGIERAEKKGIKTLTLDRKIYKSNLSNKICECLYGNVDLIVLAGWLSILNGDLVNKFENKIINIHPSLIPSFCGDGMYGIKVHQKALEYGVKVSGCTVHFVDESTDSGPIIIQKSVPVFAEDTAEILQKRVLEKEHEALPEAIKLISEEKVKLQGRKVFIKTY >CP028842|3024872:3034356|3029926_3030631_-|AWB18692.1|DBSCAN-SWA MEKKDMLYEGKAKKIFRTDDKDTVVVYYKDDATAFNGEKKGTIEDKGVMNNSITAMLFELLEKKGVKTHFIEKINEREQLCKKVEIVPLEVIVRNIAAGSMAKRLGLSEGRKLDTTVFEISYKNDDLNDPLINDYHAVAIGLTTFEELKEMYSIAEKVNNTLKEFFDEQGINLVDFKIEIGRFNGELLLADEISPDTCRLWDKSTGEKLDKDRFRRDMGNVKEAYMEILKRVNK >CP028842|3024872:3034356|3024872_3026372_-|AWB18688.1|DBSCAN-SWA MIKRALISVFDKTGILDLAKFLESRDVEIISTGGTYKHLKENGVKVIDIEEVTGFPEMLDGRVKTLNPLIHGGILAIRDNEEHMKVIEEKGINPIDMVVVNLYPFFNKVEENLSFDEKVEFIDIGGPTMIRAAAKNFKDVVVLTDTKDYENVINEIKENNQVNIQTRKKLAGKVFNLMSAYDAAISNFLLEEEYPEYLTLSYKKNMDLRYGENPHQTAAYYTSTVGKYPMKNFEKLNGKELSYNNIKDMDIAWKTVCEFEEVACCALKHNTPCGVAIGDTVQEAYTKAYECDPISIFGGIVAFNRKVDKETAENLAKIFLEIVVAPDFDEDALEVLKNKKNLRVIKCEEKSTEGKDMAKVDGGILVQKSDNKLLEDTKVVTEKSPTEQEMKDLIFGMKVVKYVKSNAIVVVKDGMAKGIGGGQVNRIWAAKEALDRAGDGVVLASDAFFPFGDVAEEAAKWGIKAIIQPGGSIRDEESIKVCNEKGISMVFTGIRHFKH |
8 | Synechococcus_phage(42.86%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_6 |
3182792 : 3204692
Sequences of DBSCAN-SWA_6
Nucleotide sequences of DBSCAN-SWA_6 >CP028842|3182792:3204692|DBSCAN-SWA GCTAATAATTAATTTTAATATTTCCACTAAATTTACATTCTACTTGCAATAATGTGTTACTAGCATAAATTACTTCATATAAGTCTTCTTTAACCTGTTTCCATCTTCCAACACCATCATATTGCAAATCTAGTTTATCTATCTCTTCAATATCTGTTATGCTGTCCATGCTAAACAAATAAGCAAATCTTATCTTTTTAGTAGTAATTAATTCATTCCAGAATACATCATTAATAGCATTAAAAGTAGCAATATTCATCCCACTTTTCCTTACGTCATCTACAGTTAAATTAACATTTACCCATTTTTCTCCACTAAATGTTTTCCATGTGTTACCGCTATCCACACTACAAACTATTCTTATATTGTTACCATTAGCAGTTAATCTAAAATAATCTATATGATCTACATTACTTAAATTCATATCACCTTTTGGAATAAGTAAACGATCAAATGGGATAGCCTTTGTCTTTAATTTTTGAATAACTCCATCTTCAAATGTTTCAAAACCTTCTATTTTTTTAAATAGCGTTTTATCCACATTAACACTATATTCTGTAAAGCTTTCTGTATCTTGAACAACTTCAAAATCACTTATATGATTTGTTTCTAAATGTGCTTTACCATCAAAGGTCATCATTCTATCGTCAATAAAATCATTACTCTCATCATTAGTAAATTCGTTTTTAACTGATATTAAATCCTGTGTATTTTCTGTATCATACCTCAAAACATTCACACGAGGCACTTTAAAATCTACTGTGTTAACAGGGATGTTAACGATTCTAGGCGTTTCAGCACTTCCCACTATACCCATTTTGGATATTTGTTTCATCCCTGCGCCAACTATTTCTCCTGCATCTATACCATCAATAGTTGTAAACTTTCCTGTTTCCTCTGAATAAGCTACTAATTGTTTATTTTTCTTATTAGTAACATCTACATCCTCAAGCTCCTCAAATTTTGTAATTCTTTTATCTATTATTTCCTTTTGTATTTTCTCACTTGACCATCCAGTTTTATTAGAAATTACACTATCATCTAAAATTATATCCTTGTCCAAAGTTACATTAAAAAATTCACTCATTAAGCCACCTCCTATTCACTAATAACTAAGTGAAAGTCTCTAACTGCAAAATTATGATTTTCTGCATTTTTAGTTATTTTTACATATATACCTTTACTTTCACGCTGTTTTATACTATCTATAGTTAAAGAGTCTGCATAATTTATACCATCGAAGGATAATTGTATTAAATCATTACTAGGTGTTTCAGTTCCTATTTTAATATTGTTATAATCCTTATCTCCTATATTTTTAATTGTTATTAGCTCTTCTAAATCTTGGAGCATAGCAGGACTAACATTAGTTACTACATTTCCATGATATATAATTTCAAAATTATATGGACTAAATACCCACATATCACCATATTGTAACTGAAGAGCATCACTAGTATATATCACTTTTCCATCCCTATCTTTAAATGTAAAATATCCACTTATTTTGCTATCTATAAATACTTTACATTCCATATCTGAATTAAATAATCTAGTTTTAATTAAATTATTATCTAAATCATATAATTCACATAAAGTATTTTCTGGGAAATTCTGAATAGTTACATAGGGATTAGCGTAAACCTTGTAATTATTTAATATAAAATCTTCATCACTATACTTCATAAAACCTTGCTTTGTAAGTGGCTCTGCAAATTCCATTCCGCCCATGTTTGTATAATTTTTGCCATCATTACTTGAATAAGCTTGTATATAATTATCTTTCTTAAGTATTTTCCAATATCTATTTTGTTCATTTGATTTTAAATCCTTAATACCAAAAATATGATCGCTATTCCCTAAATAAAGCATGGAATAATCCATATCTTTTATATCATTGAAATTTTCTTTTTCAACCTCAATAACAAATTCTTTATAATTAAATTTTCTTTCTATTTTATTATTACTTATTAGTTTTAATTTACCTGTTTTAATATCTCTAGTTATATTGCTTTCTCCCGCAAAATCAGCAAAAGAAGAAGCCAAGAAAAAATTCTCAGCTTCTAATAATCCATTTTTAACTTGTATAAGTTTCATTGAGATCACCTCTAAACTCTAGGCTGCATTATATAATCATATGGTACAAACTCAACTATTTGTATATCTTTAGTTCCTATACCATTTGCTAATAATGTATGTGCTTCCTCTAGTGCATCTTCATAACAATTAGTAGCGTAAGATGTTATTTCACTTCCATTTTTATCTGTTTCATGGCCGTATGGTAATTGGGCTAAGGTTTTATTTTTTAATATTCCCCACATCTTTTGTCTAGTTTTTTTAAAATCTATTGTACTTGTTAACATACTATCTACCTCCCAAATATATTTTTCTTTTCAAAGTTCTGTGTTTCTATCATGTAATTTCTCTTACCTTTTAGTTTATCTAAATCTTTCATAATATCACCATTAGTTGCTACTTTATTAAATTTCCTTTCAATATCCATAGCTTTCGGATTATGCCAAATTGGTACTAAATTAAAATGATGTTGTTTTAGATAATCTATTAAATTAGCTATAAGTAATCCTATAGCTTGTAATCCATTTTCAGTATTAAGGAAGTATACCTTTTCAGCCTCCCACCTGATCCATCTATATGCTCTAATATAATCTGCATTTGGACTTGATGTATCTAACGTATACCAATCATAAATTAATTCCATTATAAATTGGATAGATTCTTTACCTGTGCAATTTAACCAAGCTTGCGTATTTTTATGCCATATCATTATTAAGATATTTATTAAATCTAACATTATTTCAATACTAATTGTCATAGGTGGAATGTTATAATCCACTCCCCAATCTTTCCCCCATTCAATAGGATGATTATTAAATCTTAGATATTCATAATCTAAATTATTTAATAGATCATTATTATATATATAATCTTTATTAGGAACAATTAGCCTATCCGTTGGATTTGTAGGTTTTAACCACCACCATCTTTTGGTCATTTCAATAAACTTATTTTTATTAGGTGTATATATTTGTCTTATAGCTCCATTATTTAAATATTTATTACTTTGTCTATAAATTTGCCATATACTTAAATTTAATAAATCTCTTTCTATCTGCTTATAGATATTAATTATAGGGCTATTATCTAAATATTTTTCGTTATGTTTAAATATATTAGTTGTATATTCCCTATCTAAATATCTATTATTATATTTAAATATAGATCTTATAGCTTGCCTATATAAATACCCATTGATACTTTTATCTATAAATTTAAATACATCTTTATAAAAATATTTTTTATTATGGTCTTTGCATATTTCTTTATGTGCTATTTTATTTAATGCATTTTTAATTCTATATTTTTCTATATCCTTTAGAGCTATATTATACATTAACATAGTTTTATAATTTCTATCTATATCTTTTAAATCTAATATTTTTAAATTATTTATACTTGTATCTATATCTATTCCAATTATAATATCTTTGTTTAACATTGTTTTATTACTTATTTTAGCCACTTCTTTTAAATTGGATCTATCTATAAATCTATATTTATTTTTATTTATATTTTTAAATCCATGTTTCTCAGCAAACTTCAATTTATCTATATCTATTTCCTTGCAATAGATTCTATAAAGATAATATCCAATATTCTTTTCTATATTTATATACTTCTCTAGTTTTAAATTTTGTAAAGATTCACCTTTAAATATTTCTTTTTCTACTATTAGATCTGTATATATACTTTTGAATTTATTCAGTTGTAGATTTTCTCTATCTATAGATAAATTTATTAAATTATTAGCTTTATTTAGTTGTAGAATTTCTCTTACCAATAACTTATTGTTATAACATATAGATATATCTGTATTTTTTCTTACATCAAGTTCCTTACTTGTTATTCTATTTATACTTATATATTTTATTTTATCTAAAGATATAGTATTGTTTTTATTTACTTCTTTATTTCTTAATTCTAACTCTTTTTCAAATTCTTTTTTTATATCAGTAATTTTCTTGGATATATATTTATTCTTTTCTTTCTCTATATTATCTTTAGGTTCTTTATAAAATAATTTATCTCCTTTAATTTTATCTATTTCACCCATTGTTTCTTTGTAAAATAATTTTTCTGTAGTCTTTACTACTTTTTCTGTAGTATCGTATATAAAAGTTCCACTAGAAAAAGCATTGTCCCCTACATATTCAAAACTACATAGGGGTATTTTATGTAGGGGCATTTATACCACCTCTCTTATTTAGTTGTTTTATAACATCTAATAGCAACACAATAATTTATATTAGCACTATTGTTTAAGAAACAATATGGCGCAGTAATTTTAAATTTCTTATAATATTCTTCCTCTTCTGTATCTTTCTTATATGCTAATCTATCTGTATCGTTTATTGCACTGGCATCACCTACAAGTACATTAATCATTTTACCTCTTTCCATATCAACTGGATGTACAAGTGTTATATCTGAGAATTGATGTTTTTTATGATTATATCTACTACCTTCTACATTACATTTATCCATAAAAGGATTAGTAGCATAAAAAGCTGGATAATGTGGTTGATATGGCATACCTATTTTATTAGCTATCATACAAACATCTGTTACTCCTGTTGCAGTTCTTTCTCCATAAACCTTTGAATAATTTGGTTCTATATCAGAAGATACAGTTATACCAAAATTATATTTATCATCTGTATAAGCTGAATCCTCTACTGGTTTTAAAGCTCCAATATAAGCATAAGATGTAAGATAGTTTTCATAAGGATGAACATCCGCAGATGGATCTCCACATAATACTAAGTTTATACTATCTTTAGTTACATTTATCCAATATTGAACGGGTAAAAAGTCTTTTATTTCTGGTTGTAATTTTCTATACCATGCTAATCTATAATTATATTCAGCTTGTATATTTTTAGATATACCTAGATCTGTTTTATCTGCGTTTAATTTATCTGATATTTGCAATTTTATATTGTTTATAGAATTGCTTTTAGTCATAGCACTGACATAAACATCATAATCACCACTTTTACTCCATCTATCAGAAACTCCAGCCATCATTTCTAATACTTGTGCATCTGTTCTACTAAAACTATCCCCATTGCCGTTATAATAAGTATGCAACTTATTAAAGTCAATTAATGCCTTTTTTTCTTCTTTTGTTAAGTCCGCTTCTTCTCTATCTATTTTTACATAAAACTCTTTTCCATAGGTTGTTGTTGCTTTTATAATACACTTATCATTTTGAGAACCTACTGTAAATACAGTATCTACTTTATCTGTCTTAGAGTTATCTTTTATAAGATTTATTGTACTTCCTTCTCCTGCTGACCCTATTTTATTTATGCTATCTGGATAAACTAAATCCCATTTATATATACCTGAATTTTGTGTTATTTCAGCTGCTAATGTTTTTACTAAGTTTTTTACACTTGTATTTCCTTCAACAAAATAAAAATTATCTGTAGCCATTTTATCTACCTCCTGTTATCAATTATTTATTTAAATTTGTTATTTTTAAAGTATTTAAGTCCATTATAAATATATCTTTTAAATCTCTATTTGTATCTAAATTCACATTAAATTTTTTAAGTAGTTTATTACCATAAGGTCTATATTGATATATTTCCAAAGTTACAGGTTCTTTTAGTTCTACTCCATTAAAATTCTTTATACTTATAAGAAGCTTTTTATTTTTGTACCCTTTAACACTTATTATTTCAGGATTTTTGTTTGTTTTATGACTTGTATAATCAAAATTAAGATAAAATCCATCATAGGATTTATTCCCATACCAAACTTTTTTATCATCTATCTTGCCATGTAAATCTATATCTGCATCTGTATTTTCTTCCCAATTCATTACTACTGCTATATCCCATTCATTATCTATATCCTCTATGCCTGGTGGTGGCTCTACTGTAATACTAGAATCTTCTCCATCTATATACTCTAAATCCACAATTATCTGTCTACTATTGCCGCTTAAATTATGAAAAACAAAAGAAATAGGCGTATTAGCATTTACTTTATAGAATGTATTAAAGTATTTATGCTCTCCTATTTCCTTAGTTGTTACATTATCTATTATTTTAATTTTATTAATTTCTAAGCTATATTTATCTTCCTTTTTCCAGCCTGTTTGATTAAAATGCAATCCTGTAATATATACATCTTTATCAAATTTAAATTGTTCTTTGTAATCATTTTGTATTGCTGGGATATCTAATAATATACCTTTCACCTTTTGAATGCCTTCAATTTTTCTGTATATAAAGGCATCAATTTTTTTCTTTAATCCTTCATATTGTACACTTGGCAATAAATTCTTTAATTGTTGTAGTAAATCTTGTATATTGTTGGTATTTATCTCTGGATAATTAGTTCTTATATTATCATCTATCAGACTTAATAAATGATTTTTTAAATCCTCTGTAAGCTCTTCAAAATTAATTATATACTTAGGTAGGCTCAAATTAAGCACCTTCTTTATATTCAAAGATTGAACTTGTATCATTTCTTGGATAAACTTGAGCTGTTTGTGTTATCTTTAAATAAGGATTTTTAATATTAAATTCATCATAAAAATGTAATACACTTTGATATAATTCTTCCAAAGTTACAATTCTATTTTTATCTTTATCAGATTTTTTAGTTTTAATGCTTTGTGTTAATGCCCATGTAAAAGCTCCTGAAGGATTAGGATTTCCATTATATCCAGCGCTCAAGTCACCGGATGTTTCTGACCCTGCACTAGCTGTTAAAACCTTATATCCTTGTTTATTTAATGTTTTGTCTATACTTCTAAGTTTCTCCTCCACTACAGCTAATGTATATGCAAAATTTTTATCTATAGCAAGTCCACTGTGGCAAGTATCAATAAATATTACCTTAGTGCCTTTTATATCATCCAGTATTGTTTGTAATTCATATACTGTTATTATGTTATCTTTTGCTACTAAAGCAAACTTATCTTCATATACAGTACCATGTCCAGACCAAAACAAATAACTAATATCATTATCTTGTGCATCTTGAAAAGTGTTTTTTATTAAATTTAATGCTTCTGATTTAGTTTTATTTTTTGCAACTATATTTTTTGTAAATTTAGCACTTTCTTTATGCTCTTTAAATAAATTAGATATATTGTCAGCATCATATGTGCAACCCATAAGGTTATTAGCGCCTTGTAAAGTATATTCACTTTCTCCTATAGCTAAAAATCTATAGTTTTTTTCACTAGTGGTAGGTATAGTAGGTGTAGGTAAATTACTATTTTCTAATATATTAAAATCTACCCATAAAACTTTACTAGTTCCACTAATATTATTGTAAATAAATTTGACTGTACCATTTATAGGATAAAATACATTTAAAAATTTATGTTCACCATATTCTTTAGTGCGTACACTTTCAAATAATTTATCATTACCTACTTGTAAATCCCAGCTATCTTCAAATCTCCAACTAGATTGAGAATATGTTATACCTGTTATTTGTCCATTTCCCTTAAATTCTATTATATGCTGTCCTTTTACTGCAGGAATCTCTAGCATTTTCCCATAAATTTTCTGTGTGCCTGATATACCTAAATTTCCACTTAAATTATCTAACTTTACACCTAAAGCATTTAACGCATTTATTAAATCATTATAATCTACACCTTGTATTTTATCTTTAATTTCTGATAATAAATTTTCCATATCTTTGGTAGAAAAATTTATATTGCCTATGTCAACTTTCACACCATTTTGTAAATAATCTTTAATAAGATCTGATAGTTCATCAAAGTTGACTACATAGGAAGGTAATCCCATATTATTGCCACCTCCTATACATAATCTATTGTTTCTAATTTACCATGATTATCTTTAATTAATTGTATTGTTTTATTTGTATTATTAGGGTACGTTGTTTTAATTCTATATACCTTACCTTCTGCATTTCTAATTAGTTCTTCTTGCCATTGCATATCTGTTCCACTAGCATATATAAATTTATATGCCTTATTATTACTATCTCTAATTATTCTACATGGATATTCGGGTAATTCCCCAGCATATTTTGAATCTTCATTTGTATTTATTTGATTTTTGAAATTTCTTTTTCTTAATTCTTGATTTAAAATATATACTACTGGCTCCCTAAAATTTTTATATCCCATATGTGCCATTTTAATCACCTACTATTGTTTCAATCTTCCACTGCCTATTTGGATACATTGGTCATACACTTTTGTTTTATCTCGCATACCTTGTAATTGCAATGTATCTACATATGTGTCAGCATTTATTTCTGTACTTATTCCTACAATTAAATACCAGCCATTACCTCTTTGATTATTTACTAATTTAACTACTTGTCCTAAATCAATATTAGGTATTCCAGTTACTGGTACTACATTTAAAGCAGTACTCTCCCTCCACATATCTAAAAATTTATATCCTGCTACCTTTTGTTTTAATAATGGAGTACTAGCTAATGGATTATCAATTATATCTACCCATCTTTCACCATTTAAATAACTAGTCATAGCTTTGGATTCAAAAATAGAATATTTATCATTACAACAAATCTTTAATATATTTCTCATTAAACTAGAATCTCTACTGGCAGTTTCACTAGATAAATTAGTATCAACAGATAAAACATAATCATGGTGATTTGCTTCATGATTTGATTCATTATAAGCAGGATATTGCTCTTCTAATATTATTGTACCGTTTTTGTTTGCCCTTATTCTGGCATACATAGTTTCTACCAAATTACTAATTATATCATTATACATAGTACCTATTTCACATTCTAATTTAGGCACAGTATAATTATTTCCTCCACCTCTTTGAAAACTACATTTTGCATCGGATACAACAGTAGAAATTATATCTGCTGCGGTTTTATTATAAAATTTTAATTCCTTATCACATAAATTTAACATTCTATAATACATATCATGACAAGTAATTTCTATTGTTTTATCAAGTGTATTATAATCGTATTTTTTAATTACACCTGTAAATTGAAGTACATCCTCTATATAAATTTTTATCTGTGCAAAATTATCTATTACACCTTGCGTTCCTCCTGCAAAAATAGCTGTGGGTAGATTCTCATATTGTGCTGTAACAGTAGCTTCAGCAGTAGGTGTAGTTAAAGTTCTATTTATTTTAACTGACACTAAACAATGTTCTAAGGTTATTTTATTAGCATCACCATTTTCAAAGGCTTGATAGCCATTTTTTTTATAAAATTCTACTTTACATTTTGCCATTATCTTTCACCCATCCACTAGCTTCATGATTACATAAAAGCTCTAAATTTATATAATATATATCACCTTCGATAGGAGTATCTATCTCAAACTTATTTTGTAAATATCCTTTATATTGAATTCCAAATTCATCTACAAATATGAATCTACCTGAATAACTTTTTCTAAAGTCTAAAAACTTAGTTATATTACTTTGTGTTTCCTCATCATTTTCTCCTTTTATATTAAAAGCAACTGTAAACTCAATAATACAGTCACTTTTAACACTTTTTTCAAAATATGTGTATCCTTGTACTGTTCTAATACCCTTACGAAAATAAGCAGGACGAGGTGGCTTATAATTAGTTATTACGCCACCTGTATTTTTTCTATCTTCATAAAGCAAATCTACTTTAAAATCTTTTATTCTATTTAAGTCCATATAAGCCACCCCCTAATCTCTCAATACATCATTCATAAATAATCCTGTCATAACATTTTTCATAGAACTTTCTGTCATTTGTTTAAATTCATTAGCTATCTTATTAGCCCCTTCTTTATCTGCATTTGGTATAGTTACATACATTTTTATATCCTGTGTAAGTCCCATACTTTTATTCATGTTATTAGGTCCATATGGAGATGCATAAGTACCACCATATGCTCCACTAAGTGACATATTATTTAATCCATTAAAATTTGGTCTTACATTTCCTAATCCTTTAATTTTATTAGCTATACCTTTAAATTTATTATTTATGGCGCTTTCTTGATTATCTATACCTTGTATAAGACCTTCTCCAATAAAATTACCATAATCAGCAAATACACGTGATGGAGAGTTTATTCCTAACATTTTCTTAAATCTACTAGATATTTCACTAGCTAGATTTCCTATTACCTGTCCTACTCTTCCAAACATAGCTCTTATACCATTTATAAGACCTTCAACTATATTTCTGCCTATGTTGAAAAGTGCTCCTGCTAAATTACCTAATCCTCGAAATATATTAATCCAACCTTGTACAATTCCATGTAATATAGTTCCAACACCTCGAAATATTGCTATACATCCGTTTATTATGTTGTGTACCATTCCACCTACCCATTGAAGGATTCTAATAAATCCTTGAAATGCATGAATAGCCCCCTGTATAATTGAATTTATAACTCTACCTATTCCTTTAAATATATTTGCTATGAAATTTCCAAACCGGGTAGCATATTTTTTCAAAGTATCCCAATGTTTAATCACTTCATATACTATAAGTCCTATTGCTGCAATAGCAACTAAAATTAGAAGTGTTTTTGAAGTTATTATGGTCTTTAATAATCCAAATATCCCTCCAGCTTTCTTTAATTTACCAAATATACCTATCACATTATTTATAGTACCTACTAATTTGCTAAGTACCGTAAATGTTTTAGCAACTCCAGCTATTGACACAATTATTATTGCAATAGCGTTTTTCACAGGATTAGGCAATTTATTAAATGAATTCATTAATTCTACTGCTTTATTAGCTAGCTTTGTAAATATTGGGATTAATTTATTATTCAATATAGGTACTAATTGATTATTAAATATAGGTATCAACTGTTTTACTATAGATGTTTGTAATTGTGCAAAAGAATCTTGTACTTTTTTTATGGAAGCTTGTATATCTTTTTGAATTTTATCATAATTGCCCTTTGCAATATTAGCAGGACCCTTTTTGGGGTTCTTACTCTTTGTCTCTTCAGCAAGAGTATTTTTCATCCCAGTTTTAAGAAGATTTTGTGCCGCAGCACTAGGTTTTTCCATAGATTTTCCTATTTTGCTTAAAGTTCCTGCTTCTTTGGCTAATGCTTCTTGTAATTTTTCAATTCTAGTTTTTTCTTTCTCAACTTTATGCACAAATATTTCTAAGTCTTTTCCAGCTCCATTAAGTGCTTTTTTAAATTCACTAGTATCTAATGTTAAATGGGCAACTGCCTCTCCTACATTTACTGCCATGTTGTTTCTCACCTCCCACCTTTGGGAATAAAAAGTTTTCTAACTTCATTTAAATAATAATTTAAATTTAAAAATCTATTTTCTATTATTAGCATTTAACCATTGAATCACATCTTCATTATTAGCTTTATTTATTCTATCTCCATCTATAAACTTAGGCTCTCTAGCATCTTCTTTACTAATCTCATTTAATATATAAACGCAGGCCTCATCAAAACAAAAAGCCTCATAATCATTAGTCAACCCTATAATTTCACTGGGCCTTTGTCTATATTGTTTACTTATTGATATTACACTCAGTATTCTCTGACTCTTCACGAAAGGAGTCTAATTCACTTACACCTTCCTGTGTATAATTAAACAATGCTACTATTTGTTCATCTGTAAGCTCTAATCCTACACTTTTTAAATCTTCTATGGAAGGTTCTACAAGTGCATTTTCGGCCATAATATACATAACATCTGTCATTTGTGCTAAATCAACATTCTCTTTTGAACTCTGTTTACCATAAAATAGTTCCTCTGCTGCACTTAATAATTTGTTAGGCACTACTCCTTTTCTTACCAAATTTAAAAGAGATACTCTTTTAACTCTAGCATTAAAAGGTATCCCTTGGCTAAATTGTGGCAACTGAATTACTTCATCTTGAGCTGCTTTTTTTAAATCTTCTATATTAGTTACCTTTAAATCCATTTTATTATCCCCTCACTATCTAATCTTTATTGTTTTAAATTCTGTGGATAATGCTGTGGTTTTACCACTTCCATCTAATTTGTTTATTTCTTTAGCTTCAGCAATATAAACTGTATCTATTGCTAAAGAATCAGGTACAAATGTTACTATTTTCTTAGTATCATCTATAGTTACATTTCCATTTACTCTAGAATTATCAGATTTTCTCTTTATAATAAAGTTTTCTAGGTTAACATCATCTTGATTAATTTTATTTGAAAAACTCCACACTACCCTGTTAGTTATACTTACCCCTACATCTGGATTTTTATTTTCTACTTCTCCACCTTCTACTCCTATATCTTCAATTGGAGTAGATTCTCCTGGCTTTTCTCCATTATTATTCTCTTGTAATTTATTTAAAAATTCTATTTCTACAGGTTTCTCATTTCTAAATGGTATACTTTCAGCCTCATATGAAGACACTAAGAATTTTCCATCTTGAATTTTATATTTAGCTGGCTTACCTTTACAATGCTTATACACGAATTTAACATAGCCTGTGGTTCTAGAATAGTCTTTTTCTTCTGTGAATATTTCCATAGTGAATGGATGTCTTTCTACTGCTATACCTACTTCTGTTCCACAATATTTATTATCTTGTATAGTTCCTCCATCTATTAAAGCCATAGTTTCTATATTAAATAGATTGTCCTTCATTTTTAACTTGTAACCTATAACAATATCATCTGTTTCATTTATTCCATAAATTTTATTTTTAATCCTTAATATATCTCTTTTGCCCTTACTGTTTATAGGTTCTATATCTATTTCATTGCTTGTTTCTATTGTATGTTTTGTATTTGTTACCTCATCAATAAAATTAACTTTCACAACATTAACTAAAGTTTTTCCGCTTGTCATTAAATTACCTCCTTAAACTTTTAAATTGTTGATATTCTATGCTTGTAGTGTAAGCTTGTACATCGTAATCTATAACGCTTGGTGTTTCATTCCCTGTAGGCCTAAGATCTTCTATTTTTTTTAAAGCTTCTTTTATATTCTCTACATAAAATTCTATAGTGGAATATTGATCCATAGGGCTATAGACTATAATATCAAATAGTTTATAACCAGATATATTTCCAACTAAGGCATGTACACCATTTTCCTTTATAACTACATAGCTTTCTGTACATTTGTTTCTCTTTTGTCCAGGAGCATACACATTATATCCTAATTTTTTTAAATATAAATATACATTTTGCCATAAAGTTTCTGGTATAACATTATTAATTATATCTTGCTGTATGCAATCCCCTGGAACCTTGTAATTAAATTTAGACATTTACATCACTTCCCAAATAAATTACTCATCCCCTTAAGTATTTGTGGACTCAGTTTATCTATAGTTGGTTTTAATATTGCATATTTTTTATCATTACATAACTCTAAAGACGGATAGTAATCCTCATTTCCAGTAATATAAATATTACACCTATCGCCTTTCCACTGTTTTCCACCTTTAATTGTTTCAATATCCATATCTAATTGATCCTTCCAAGGTGCATTCTTTTTAGCATCTTCTTCTAGCTTCTTTGCGGCAATATCTGCATACCCACTTATAGCAGTTTTAGATTGCATCTCAAATTCAGATAATCCATCAATAACACTATCTATATTTACTTCAAATTCCCTCATATCATCACACCCTGTTTAATATCATATCAAATACTAGGTTTTGAATATTTCCTGTGTCAACTATTTCATACTTAGTTCCATCTAATATAAAATAATCATCCTTTTGTATTTTAGAGCTTATATCATTATAGATAATTAATAATTTATCATTATATAAATTATTAAATTCCAGTCCTTCCATAGAAGTTGTAATTATATTACTATTATTTCTATAATAATATCCCCTTATAGTGCATACATACACTTCATCTAGTTTTTCTTCAAAAGCATTTTTACCTATTCTTAATATTTTTATTTCTCTTAATAAGTCTTTTTTTTCTAGATGTTCATATATATTTTTACTTATTTTTGCCCTATTTATATTATTCATTAATGTTCATCAACTCTTTCCATAGAAGTTTGATTCTTTAGAATCTTTTGCTCTTCTTTGAAATGCTCTGCTAGAGTTAACCAATAGGCTCTATTACTTTGTAACTTTATATCTGCAACTTCTATTCCATCATCTGCAATTGCTTTTAGAATACACCCTTTATAACTTGCTTTTTCTACATCATTATTATTGATTTCTAGTAGCAATTCTAGCTCTTTATCCTCAAAATAAGGATACTGTTTTTCTTGTAAATTAAATTTCAAAATCTCTAAAGGTGTTCTCACTTTTTCTCACCTTCCTTAGTTAAATTTTATTTGTTTAAGGTTACTAATTTTTCTGCAAATATTTTCAATAATAGTTTAATCATTTATTTAGTCAGTCTATTACATAACCTCAAATCATCCTCATTATGATAAATTATTGAATATAGCTCACCTCCTATGCTTACTGTACAACCTTTAAGTTTTCTTGAAATGAATAAGCATTAGATTTTATAAAAGCCTTAATTTATAACTTTATTTATAAGAAGTTATAAGAATTAAAACTTATTTTGCAAATCTAATGCATTATTTACGAATAATAAAATTTTTAGTTCAAATTATTCAGTTTTTTAGCTTACTCTTAAAAGCTGTAAATTTTAATTTGATTTCATAATATTCATTTATTTTTTAATGAATACTTTACAGTTGTTTTATATAATAAAACCTCTGCTATTTTTATAATACTATTATATTTCATTTGAATACTTTATTTATCCCAACTTTGTCTCATTTTTGTCCCAAAATATTTTTATCAGATGACTACCCGCTCTAATACTCCCATCTTTTTCAAAGTGAGAGTAAAGAGCGGGTACGTCCCTGGATAACGATTTCCCCTAAAGGATAACGACTTCTAAGGAGTAAAACTCCTAAGAATTCTGTTAATAAGCTTTAGAGGGAGTAAAAACTCCCTCTGAAGCCAAGAACTCTGTTTATACTATAAGGTTATTCAATTGTGCTACATGTTCTACTAATTCATTCTTTTTTCTATAAGCTGTACTCCTTGCTCTTCCAAACATTTCTACGGCTATCCAATCTACACTTTTATTTTCTCCATACTTCAACTCTATAAATTTTTTATTTTCTTCATTTAGTGATGAAATATTATCTTCCATTACTGATATTTCTTCTTCTATTTCTCTTATTTTATATTCTACTTTCCCTTTCTTCTTAATTTTTTCTCCTAGTTCTATCTCTAATCTTTCTATTTGTCTTATTAGCTCTTTCTCTGCATAGCCTGTTCCATTGCTAGAGGTTTGTACTATTTCATCATATGTTCTACTTCTAGACTCTTCTTCTAATGTTACATCATTATTTTTAATTTTATCCATTATAATTTCTATTCTATTAGAAAGATGCTTGGCTCTATTTTTTAGCTTATTCAATTCTTTTTTACTTCTAAAATGCCTATATAATCTTTCTTCTGTTTTTATATATAATTTTTTATCCAACATATCTAACCTCCTATAATAATTCTTTAATATATTTTCTTATAACTATAATGTTACTTTTTGATATCTTTAAAGGCCTTTAGAAATGCCTTTTGGTTTGAATTTTATATACTTTTTTACATTTCTTTATTATTTTTATTTAACTCATATATCATTATTTCTTTTCCCACAATATCTAAAAATCTTTTATTGTAAAGTAATGCTTAACCACTTCGTCCGTCCATCTATTTTTTGCAACTCTTAAAAATTCTAATTCCTCTTGATATTTGTCTAATAAATTTATACTTTCCTTTAATAATTTCTCATAATCTATGCTTTTCTTTACATACTCCTTTAATAAAATCTTTAATACTACATTTTCTTTTCTAAATGACTCTATCTCTTCAAAATATTTATTTTCTATTTCTTTAACTAATACAATTGACATCTTATGCCTCCATCATACTTAATTTTCTATTATATTACTAAAGACAATCAATATTCTTATTTCAATAATTCTTTTAATATTTCTGTTTTCTCTTTAGCTTTTTCTTCCCTTATATTTTTACCATCATTTAAAATAGGAGTACACATTTCTAAAATTCTATAGTATGTCCTCTTTTCATATCTATTTTTAAGTTCTATAAGAGATAAATTTGTTGTAATTATAAGTGGTAATCCATTCCTATATCTACTATCTAAAATATTATAGATTTTAGTTCTAGTCCATTCTGTATCCTGTTCTGTTCCCAAATCATCTATTATCAATAGATCTGCATTATCTAATCCTCTCAATATATCTTCTTCTACTTCTTTTCCAGATTTTTTATATGTGTCTTTAATTCTATTTAATAAGCTATCTGCATTTACACATATAACTGGTAACATTTTCTCTATAAGAAAGTTTGCTATACATGCCACAGTATAGGTTTTACCATTTCCCGGAGAACCATATAATAAAAGTCCTACAGATTCTTTTTTCATGTTTTCAAATTTTTTAGTATATTTATTAGCTATTTTATACATTTTGTCATTACCTTTAGTAAAATCCCAATTTTTAAATTTACTATTTCTAAATTTTTCATCTATTAAACTATTTTTAATAATCTTTTTTAATCTTAATTGCTTTTCTTTATTTATTTTTTCTTTCTCTTTTGCCATTAGAGCTTCTCTTTTGCACTTGCACATTACAGGACCTTTTATATACCTATTTAACCCTGGAATATAAGTAATCTTTTCAATAGCTTCTCCACATACAGAACATATTTCAACTCTTTCATTTTCACCAGTAATATTATAATCCAATTCCCTGCTTTTTAAGGTCTTCTCCAAAGCTTGTCCTACTTGTTTCATATACCTCGCCTTCTCTCCATTTCTTACTTATCTCGTTTCTCTTTACATCTTGTGGTAATTTATATCCTTTATTTATCCAGCTTTCGAAGATTGACATTGTATATTTAAATCCTTTTATTTTGCCCTGTTCCTGTTCTCTTTTTTTTGTAATATCTAATGCATATATTAATAAATCAGTATAATCTTCTTTAGCCATGACTTTTAATACTTGATTTAAATAAGTGGCACTTATTTGCCTATAAAAGGTATTAAAATATGCTTCATTAATTTTATCTAAATTTTTTCTAATATCACTCTTTCTATCTTCTTTTATTTCTATATCTATATCTTCTATATCTATATCTCTGCCGTTACTTAACGTTTCATGTAACATTATATTTTTTTTATTGTCATTATTTTTGCAACTTTGTCTTTTAGTTTCTTCTAATAGTTCTTTTTTCTTAGCTCTATGTTTAGCTACCCTTTCCCTTGTTTGTTGTCTAACTTTCTCCATACCTTCTATATTTTGATGTTTGGACCAGTTAGCTATTTTTATTAATTTATCTTCTTGTATCTGTATCATGCCAAAATCTCTAAGTACTTTTAATGCAAACCTTAAACTATTTAATGGCCTATTAAAAATTGTACTTAACATTTCTTCTGTATATGGAACATTATCATTTAGAAAAATATATCCATTTGAATTTGTTTTACCTGCTTGAACTAAAAGTCTCATCCAAATATAATGAACAGTATCTCTTTCTGGCATAGCATCTATTAATTTTATTTTTTCGTCATCAAACATATTTGTTGTTATCTTTATCCACTTAACTTCTGCCAACATATCACCACTTTCTTTTTTATCCATAGTATACAAAATAAAATATTGCTATAATTAAATCAATCCATAATTTATATATAGTTTTTCTATACTTCTTTAATAATTATTGATTTACTATGTTTACCACCACCTCCATAGTTCTTGATCTATCAATTCATTAGGTGTAATTTTCAATATTTTGCATAGATTACAAATAACCTTTAGCCCTGGATTTTCATATTTACCTTCCTCTAATTCTGTAATATAACTTCTAGCTATTTTACTTTTGTAACTCAATTTTGAAATAGATAAGTTTCTTATTCTTCTATATTCTTTTGTTTTTATTACTGCCACTTGAGGATTCCTCCTTAGGATTTATTCCTCTCAATATTAAACTATAAATTTTTAAGTATTCCTAAAGTTGACCATTTCTTTTAAAAAAAAGTTCGTCTATGGTAGTATCAAAAAAATCTGATATAATCTTAGCCTCATTTAAAGTAAAAGACTTCTTACCATTTTCTTTAAAATTATAAGTATTTAGAGATACCCCTATTAGTCTTGCTATATCCTCTTGCTTTGCTCCTCTTAAGCATCTATAAGCTTTTAATTTTTTTGCTGTTGTCATAAAGCTCACCCCTTAATAACTATTTTTAAGTAAACTATAAGAATACTATTTATATTTTTATTATAGTCAACATTAAGAATACTTTCAACTGTATTTTATCATTTTTCTGAAAAAATATTCCTATAGTTTACATTAGTTTTAAAAAGTCAACATATGGTTTATAATATAGTATAAATAGAGGGGTGAAAAAGTTGGCAGAAATAAAAGATAGGTTAAAATGTGAAAGATTAAGAAAAGATTTAAATCAAACTGAATTGGCAAAATTTTTAAATGTATCAAAACAAACAGTTTCCAATTGGGAAAATGGTAACAGAATTCCTGATACCCTTACCTTATCTAAGTTAGCTGACTTCTTTAATTGCTCCGTAGATTATATTTTAGGAAGATCTGAAAATAGAAATGGCATAATTTCTAAAGCTAATATAGATGGAAGTAATTACGAATTTGAATTAGATAAGAGTATATTTCCAAATGGCATAACTAGAGAACAAATGATAAATTATATTAAGGAACTAGAAGATAGAAATAAAGAATTAGAAAAAGAAGCTGAGATATCTAGAAAATTAAAAGAAGCTGGCTTCGATTTCAATCCCGATAAATAAAATATTCTAAAAATTAATTATTTAAAATTAAAATACAAATATGCAAAACTAACAAATATATATGTATTCATGATGTTATGTTTATAATTACATGAAATTCGTATATGTTTGTTAGTTTTTTATTTTGTCTAAAAAAGTAAATACTTGTCCTAAAATTCTGTATACAGACAATTACATTTTCAAAATAAATATGTAATAATTTTCACATAAAGTAATTTAATTATATAAACTTGCAAATTTTATTAAAAGATATTAAAATATACTTGAACACATGTTCGATTTCAGAAAGGAGTCTTAATTTATGTTTAATTTTAGTGGGGTATTAAGTATAAAAAAAGAAGGGGAAATAATATATGAAAAAAAAGATACCTTTACACTGAATAGAAAAAAAACTTCTTGTGAAAAATCTTCTAAGGATAAAATACAATTAGTGCAGAAGGTTAATACATAATATAAAGAATATATAATAACTTCAAAATATAGTTGAAAGAAAAGTGTTAAGAAAGATGAGACTAAAGAACTACTTTAGAACAGTATATACACAACTTAATCGTTACAACTTATAAATTAAATAAGATAAAAAAACAAGTGCTGCTCCTTAGAAAATAAAATTACAACAACTTGATCTTTTTCATTTTAAAAATTTTTATAATTTTATAGTTAAATCATTGAATTCTAAAACTGTATTACAATATCATATAGTAATACATAAAATATTAAATAAAAATCATAGACTAAAATATATCTAACCTAATAGAATTATATAAAATAAAACTGGAACATTAAATATTAAAGAAGCTATTCAAACCTTAACACTTTTTAATAACTTTAGAGTATAAATGCTAATTTAGAAAATGCTTTGCTATTAAGCACTAAGGAAATTCTAAAGCCAGAATATTTAAAGAATTAATGAATGTTATTTACTTTTAATTCTTCTACTAACTTTCTAATGATATTTTAAAATAAAAAAGACTTTGGAAAACTAATCCAAAGCCCTCAAAGTTATATCTATAATGGTGCCGAAGGCGGGAGTCGAACCCGCACGAAGTTACCCTCGACGGATTTTGAATCCGTTGCGTCTGCCAATTCCACCACTCCGGCAAGAAAGATTTAACGTTATAATAATAACATATTAATAGTCTTTAGTCAACCAACATTTTTATTTTCTATATTATATAGAAAGGCTGGTAATCCCACAAAACATCAATTCTTAAGATAATTATGCTTCCTCTCTAAAAAATCAAATAATTTATCCCTCCCAAATAAAATTTATAGTTTTATATTAAACATTAATAGATTATTATAAAAATTTATAAAAAGTTAACCATATCTTATCAGGCTATTCATTGAGTCTTTACATATAAGGCTTATAATAATTCTTGTAAATTTTTGTCGAAAAATATGAAAATATTAGTAAACTAAAAATTAAAAAAGGAGGAGAACGTCTATAAAAATTGTTTCTAAAAAGTTGATGTAATCTAGTATTTATCATATTGGGATTATGAATTAATTAAGAAGGAGTGTATGATAATTGTTATTTAACTCGATGCATTTTTTATTGTTTTTTCCAATCGTTACTTTTATATATTTTTTTATCCCCCATAAATTTCGTTATATCTGGTTACTTATAACTAGTTATTATTTTTATATGAGTTGGAATCCTAAATATGCATTATTAATTGGTATTTCAACAATAATTACATATTTAAGTGGTATATTAATAGAAAAATCAAATAAAATAACTGATAAACAAAAATCAAAATTTTTTAAAAAACTTTGGGTTTTCTTAAGTTTATTTATTAATTTAAGCATATTGTTTTTATTTAAATATTGTAATTTTTTCACATATACCCTTACAAAAATATTTTCCTTAATTAATATTACAATTAAAGTACCCTCCTTTGACTTTATATTACCTGTAGGAATCTCTTTCTACACATTCCAGGCTCTTAGCTATACTATAGATGTCTACAGAGGTAATATTAAATTTGAAAAAAATCTAGGCAAATATGCTTTGTTTGTGTCATTTTTTCCTCAATTAGTGGCTGGACCTATAGAAAAATCAAAAGATTTATTGAATCAATTTAATGAAAAACATATATTTGATTATAATAGAGTAAAAAATGGTTTAGTACTAATGCTATGGGGATTTTTCCAAAAGGTATTCATTTCTGATAGATTAGCCATTCTAGTAGATACTGTATTTAATAACCCTAGTAATTATAAAGGTTTAGAAATTATTGTTGCATCTGTTTTTTTTGCCATTCAAATCTATTGCGACTTTTCTTCTTATTCAAATATAGCTAGAGGAGCTGCTGAAGTTATGGGATTTGATTTATCACTAAACTTTAAACAACCTTATTTTTCAAAATCAATACAAGAATTTTGGAGACGTTGGCATATTACTCTCGGAGCTTGGTTTAAGGATTACTTATATATACCTTTAGGTGGAAATAAGTGCAGCAAATGGAGAAGATATTTTAATAATATGGTTGTATTCTTAATAAGTGGATTATGGCATGGAGCAGCTATAAATTTTATAATCTGGGGTGGCCTACATGGATTTTACATAATAATAGGAGATATGCTAAAGCCACTTAAAGAAAAAATAATAAATAATTTAAAGATAAAAACTAATGTATTTAGCTTTAAATTATTCCAAACATTGTTTACTTTCATATTAGTTGATTTTTCATGGATATTTTTTAGAGCAAATTCATTTTCTGAAGCTAAACTATTAATTAAAAATATGTTTTATTTTAATCCATGGATATTTACCTCTGGTTCCATCTATAAATTAGGATTAGATCAAAAAGATTTTAAAATGTCAATACTAGGTATATTAATAGTTTTTATTATAGATAATATTGCGAGAAATAAAGATGTACGTGTTGAACTCTCTAATCAAAATATAGTATTTAGATGGGCTATTTATTTATCTGCTATTTGCTTTATATTAATATTGGGTATATATGGAGCAGGGTATGATGCCAATCAATTTATTTATTTTCAGTTTTAA
Protein sequences of DBSCAN-SWA_6 >CP028842|3182792:3204692|3200587_3200821_-|AWB18855.1|DBSCAN-SWA MLRRNPQVAVIKTKEYRRIRNLSISKLSYKSKIARSYITELEEGKYENPGLKVICNLCKILKITPNELIDQELWRWW >CP028842|3182792:3204692|3185159_3187055_-|AWB18836.1|DBSCAN-SWA MPLHKIPLCSFEYVGDNAFSSGTFIYDTTEKVVKTTEKLFYKETMGEIDKIKGDKLFYKEPKDNIEKEKNKYISKKITDIKKEFEKELELRNKEVNKNNTISLDKIKYISINRITSKELDVRKNTDISICYNNKLLVREILQLNKANNLINLSIDRENLQLNKFKSIYTDLIVEKEIFKGESLQNLKLEKYINIEKNIGYYLYRIYCKEIDIDKLKFAEKHGFKNINKNKYRFIDRSNLKEVAKISNKTMLNKDIIIGIDIDTSINNLKILDLKDIDRNYKTMLMYNIALKDIEKYRIKNALNKIAHKEICKDHNKKYFYKDVFKFIDKSINGYLYRQAIRSIFKYNNRYLDREYTTNIFKHNEKYLDNSPIINIYKQIERDLLNLSIWQIYRQSNKYLNNGAIRQIYTPNKNKFIEMTKRWWWLKPTNPTDRLIVPNKDYIYNNDLLNNLDYEYLRFNNHPIEWGKDWGVDYNIPPMTISIEIMLDLINILIMIWHKNTQAWLNCTGKESIQFIMELIYDWYTLDTSSPNADYIRAYRWIRWEAEKVYFLNTENGLQAIGLLIANLIDYLKQHHFNLVPIWHNPKAMDIERKFNKVATNGDIMKDLDKLKGKRNYMIETQNFEKKNIFGR >CP028842|3182792:3204692|3192540_3194082_-|AWB18843.1|DBSCAN-SWA MAVNVGEAVAHLTLDTSEFKKALNGAGKDLEIFVHKVEKEKTRIEKLQEALAKEAGTLSKIGKSMEKPSAAAQNLLKTGMKNTLAEETKSKNPKKGPANIAKGNYDKIQKDIQASIKKVQDSFAQLQTSIVKQLIPIFNNQLVPILNNKLIPIFTKLANKAVELMNSFNKLPNPVKNAIAIIIVSIAGVAKTFTVLSKLVGTINNVIGIFGKLKKAGGIFGLLKTIITSKTLLILVAIAAIGLIVYEVIKHWDTLKKYATRFGNFIANIFKGIGRVINSIIQGAIHAFQGFIRILQWVGGMVHNIINGCIAIFRGVGTILHGIVQGWINIFRGLGNLAGALFNIGRNIVEGLINGIRAMFGRVGQVIGNLASEISSRFKKMLGINSPSRVFADYGNFIGEGLIQGIDNQESAINNKFKGIANKIKGLGNVRPNFNGLNNMSLSGAYGGTYASPYGPNNMNKSMGLTQDIKMYVTIPNADKEGANKIANEFKQMTESSMKNVMTGLFMNDVLRD >CP028842|3182792:3204692|3201974_3202124_+|AWB18858.1|DBSCAN-SWA MFNFSGVLSIKKEGEIIYEKKDTFTLNRKKTSCEKSSKDKIQLVQKVNT >CP028842|3182792:3204692|3192093_3192528_-|AWB18842.1|DBSCAN-SWA MDLNRIKDFKVDLLYEDRKNTGGVITNYKPPRPAYFRKGIRTVQGYTYFEKSVKSDCIIEFTVAFNIKGENDEETQSNITKFLDFRKSYSGRFIFVDEFGIQYKGYLQNKFEIDTPIEGDIYYINLELLCNHEASGWVKDNGKM >CP028842|3182792:3204692|3203204_3204692_+|AWB18859.1|DBSCAN-SWA MLFNSMHFLLFFPIVTFIYFFIPHKFRYIWLLITSYYFYMSWNPKYALLIGISTIITYLSGILIEKSNKITDKQKSKFFKKLWVFLSLFINLSILFLFKYCNFFTYTLTKIFSLINITIKVPSFDFILPVGISFYTFQALSYTIDVYRGNIKFEKNLGKYALFVSFFPQLVAGPIEKSKDLLNQFNEKHIFDYNRVKNGLVLMLWGFFQKVFISDRLAILVDTVFNNPSNYKGLEIIVASVFFAIQIYCDFSSYSNIARGAAEVMGFDLSLNFKQPYFSKSIQEFWRRWHITLGAWFKDYLYIPLGGNKCSKWRRYFNNMVVFLISGLWHGAAINFIIWGGLHGFYIIIGDMLKPLKEKIINNLKIKTNVFSFKLFQTLFTFILVDFSWIFFRANSFSEAKLLIKNMFYFNPWIFTSGSIYKLGLDQKDFKMSILGILIVFIIDNIARNKDVRVELSNQNIVFRWAIYLSAICFILILGIYGAGYDANQFIYFQF >CP028842|3182792:3204692|3194359_3194776_-|AWB18845.1|DBSCAN-SWA MDLKVTNIEDLKKAAQDEVIQLPQFSQGIPFNARVKRVSLLNLVRKGVVPNKLLSAAEELFYGKQSSKENVDLAQMTDVMYIMAENALVEPSIEDLKSVGLELTDEQIVALFNYTQEGVSELDSFREESENTECNINK >CP028842|3182792:3204692|3190667_3191009_-|AWB18840.1|DBSCAN-SWA MAHMGYKNFREPVVYILNQELRKRNFKNQINTNEDSKYAGELPEYPCRIIRDSNNKAYKFIYASGTDMQWQEELIRNAEGKVYRIKTTYPNNTNKTIQLIKDNHGKLETIDYV >CP028842|3182792:3204692|3196108_3196456_-|AWB18848.1|DBSCAN-SWA MREFEVNIDSVIDGLSEFEMQSKTAISGYADIAAKKLEEDAKKNAPWKDQLDMDIETIKGGKQWKGDRCNIYITGNEDYYPSLELCNDKKYAILKPTIDKLSPQILKGMSNLFGK >CP028842|3182792:3204692|3182792_3183878_-|AWB18833.1|DBSCAN-SWA MSEFFNVTLDKDIILDDSVISNKTGWSSEKIQKEIIDKRITKFEELEDVDVTNKKNKQLVAYSEETGKFTTIDGIDAGEIVGAGMKQISKMGIVGSAETPRIVNIPVNTVDFKVPRVNVLRYDTENTQDLISVKNEFTNDESNDFIDDRMMTFDGKAHLETNHISDFEVVQDTESFTEYSVNVDKTLFKKIEGFETFEDGVIQKLKTKAIPFDRLLIPKGDMNLSNVDHIDYFRLTANGNNIRIVCSVDSGNTWKTFSGEKWVNVNLTVDDVRKSGMNIATFNAINDVFWNELITTKKIRFAYLFSMDSITDIEEIDKLDLQYDGVGRWKQVKEDLYEVIYASNTLLQVECKFSGNIKINY >CP028842|3182792:3204692|3184899_3185154_-|AWB18835.1|DBSCAN-SWA MLTSTIDFKKTRQKMWGILKNKTLAQLPYGHETDKNGSEITSYATNCYEDALEEAHTLLANGIGTKDIQIVEFVPYDYIMQPRV >CP028842|3182792:3204692|3196825_3197110_-|AWB18850.1|DBSCAN-SWA MRTPLEILKFNLQEKQYPYFEDKELELLLEINNNDVEKASYKGCILKAIADDGIEVADIKLQSNRAYWLTLAEHFKEEQKILKNQTSMERVDEH >CP028842|3182792:3204692|3191021_3192107_-|AWB18841.1|DBSCAN-SWA MAKCKVEFYKKNGYQAFENGDANKITLEHCLVSVKINRTLTTPTAEATVTAQYENLPTAIFAGGTQGVIDNFAQIKIYIEDVLQFTGVIKKYDYNTLDKTIEITCHDMYYRMLNLCDKELKFYNKTAADIISTVVSDAKCSFQRGGGNNYTVPKLECEIGTMYNDIISNLVETMYARIRANKNGTIILEEQYPAYNESNHEANHHDYVLSVDTNLSSETASRDSSLMRNILKICCNDKYSIFESKAMTSYLNGERWVDIIDNPLASTPLLKQKVAGYKFLDMWRESTALNVVPVTGIPNIDLGQVVKLVNNQRGNGWYLIVGISTEINADTYVDTLQLQGMRDKTKVYDQCIQIGSGRLKQ >CP028842|3182792:3204692|3197796_3198318_-|AWB18851.1|DBSCAN-SWA MLDKKLYIKTEERLYRHFRSKKELNKLKNRAKHLSNRIEIIMDKIKNNDVTLEEESRSRTYDEIVQTSSNGTGYAEKELIRQIERLEIELGEKIKKKGKVEYKIREIEEEISVMEDNISSLNEENKKFIELKYGENKSVDWIAVEMFGRARSTAYRKKNELVEHVAQLNNLIV >CP028842|3182792:3204692|3188330_3189311_-|AWB18838.1|DBSCAN-SWA MSLPKYIINFEELTEDLKNHLLSLIDDNIRTNYPEINTNNIQDLLQQLKNLLPSVQYEGLKKKIDAFIYRKIEGIQKVKGILLDIPAIQNDYKEQFKFDKDVYITGLHFNQTGWKKEDKYSLEINKIKIIDNVTTKEIGEHKYFNTFYKVNANTPISFVFHNLSGNSRQIIVDLEYIDGEDSSITVEPPPGIEDIDNEWDIAVVMNWEENTDADIDLHGKIDDKKVWYGNKSYDGFYLNFDYTSHKTNKNPEIISVKGYKNKKLLISIKNFNGVELKEPVTLEIYQYRPYGNKLLKKFNVNLDTNRDLKDIFIMDLNTLKITNLNK >CP028842|3182792:3204692|3194791_3195679_-|AWB18846.1|DBSCAN-SWA MTSGKTLVNVVKVNFIDEVTNTKHTIETSNEIDIEPINSKGKRDILRIKNKIYGINETDDIVIGYKLKMKDNLFNIETMALIDGGTIQDNKYCGTEVGIAVERHPFTMEIFTEEKDYSRTTGYVKFVYKHCKGKPAKYKIQDGKFLVSSYEAESIPFRNEKPVEIEFLNKLQENNNGEKPGESTPIEDIGVEGGEVENKNPDVGVSITNRVVWSFSNKINQDDVNLENFIIKRKSDNSRVNGNVTIDDTKKIVTFVPDSLAIDTVYIAEAKEINKLDGSGKTTALSTEFKTIKIR >CP028842|3182792:3204692|3198490_3198742_-|AWB18852.1|DBSCAN-SWA MSIVLVKEIENKYFEEIESFRKENVVLKILLKEYVKKSIDYEKLLKESINLLDKYQEELEFLRVAKNRWTDEVVKHYFTIKDF >CP028842|3182792:3204692|3194157_3194325_-|AWB18844.1|DBSCAN-SWA MTNDYEAFCFDEACVYILNEISKEDAREPKFIDGDRINKANNEDVIQWLNANNRK >CP028842|3182792:3204692|3195683_3196103_-|AWB18847.1|DBSCAN-SWA MSKFNYKVPGDCIQQDIINNVIPETLWQNVYLYLKKLGYNVYAPGQKRNKCTESYVVIKENGVHALVGNISGYKLFDIIVYSPMDQYSTIEFYVENIKEALKKIEDLRPTGNETPSVIDYDVQAYTTSIEYQQFKSLRR >CP028842|3182792:3204692|3201262_3201673_+|AWB18857.1|DBSCAN-SWA MAEIKDRLKCERLRKDLNQTELAKFLNVSKQTVSNWENGNRIPDTLTLSKLADFFNCSVDYILGRSENRNGIISKANIDGSNYEFELDKSIFPNGITREQMINYIKELEDRNKELEKEAEISRKLKEAGFDFNPDK >CP028842|3182792:3204692|3198798_3199647_-|AWB18853.1|DBSCAN-SWA MKQVGQALEKTLKSRELDYNITGENERVEICSVCGEAIEKITYIPGLNRYIKGPVMCKCKREALMAKEKEKINKEKQLRLKKIIKNSLIDEKFRNSKFKNWDFTKGNDKMYKIANKYTKKFENMKKESVGLLLYGSPGNGKTYTVACIANFLIEKMLPVICVNADSLLNRIKDTYKKSGKEVEEDILRGLDNADLLIIDDLGTEQDTEWTRTKIYNILDSRYRNGLPLIITTNLSLIELKNRYEKRTYYRILEMCTPILNDGKNIREEKAKEKTEILKELLK >CP028842|3182792:3204692|3187069_3188308_-|AWB18837.1|DBSCAN-SWA MATDNFYFVEGNTSVKNLVKTLAAEITQNSGIYKWDLVYPDSINKIGSAGEGSTINLIKDNSKTDKVDTVFTVGSQNDKCIIKATTTYGKEFYVKIDREEADLTKEEKKALIDFNKLHTYYNGNGDSFSRTDAQVLEMMAGVSDRWSKSGDYDVYVSAMTKSNSINNIKLQISDKLNADKTDLGISKNIQAEYNYRLAWYRKLQPEIKDFLPVQYWINVTKDSINLVLCGDPSADVHPYENYLTSYAYIGALKPVEDSAYTDDKYNFGITVSSDIEPNYSKVYGERTATGVTDVCMIANKIGMPYQPHYPAFYATNPFMDKCNVEGSRYNHKKHQFSDITLVHPVDMERGKMINVLVGDASAINDTDRLAYKKDTEEEEYYKKFKITAPYCFLNNSANINYCVAIRCYKTTK >CP028842|3182792:3204692|3199588_3200503_-|AWB18854.1|DBSCAN-SWA MYTMDKKESGDMLAEVKWIKITTNMFDDEKIKLIDAMPERDTVHYIWMRLLVQAGKTNSNGYIFLNDNVPYTEEMLSTIFNRPLNSLRFALKVLRDFGMIQIQEDKLIKIANWSKHQNIEGMEKVRQQTRERVAKHRAKKKELLEETKRQSCKNNDNKKNIMLHETLSNGRDIDIEDIDIEIKEDRKSDIRKNLDKINEAYFNTFYRQISATYLNQVLKVMAKEDYTDLLIYALDITKKREQEQGKIKGFKYTMSIFESWINKGYKLPQDVKRNEISKKWREGEVYETSRTSFGEDLKKQGIGL >CP028842|3182792:3204692|3200861_3201071_-|AWB18856.1|DBSCAN-SWA MTTAKKLKAYRCLRGAKQEDIARLIGVSLNTYNFKENGKKSFTLNEAKIISDFFDTTIDELFFKRNGQL >CP028842|3182792:3204692|3183889_3184888_-|AWB18834.1|DBSCAN-SWA MKLIQVKNGLLEAENFFLASSFADFAGESNITRDIKTGKLKLISNNKIERKFNYKEFVIEVEKENFNDIKDMDYSMLYLGNSDHIFGIKDLKSNEQNRYWKILKKDNYIQAYSSNDGKNYTNMGGMEFAEPLTKQGFMKYSDEDFILNNYKVYANPYVTIQNFPENTLCELYDLDNNLIKTRLFNSDMECKVFIDSKISGYFTFKDRDGKVIYTSDALQLQYGDMWVFSPYNFEIIYHGNVVTNVSPAMLQDLEELITIKNIGDKDYNNIKIGTETPSNDLIQLSFDGINYADSLTIDSIKQRESKGIYVKITKNAENHNFAVRDFHLVISE >CP028842|3182792:3204692|3189312_3190653_-|AWB18839.1|DBSCAN-SWA MGLPSYVVNFDELSDLIKDYLQNGVKVDIGNINFSTKDMENLLSEIKDKIQGVDYNDLINALNALGVKLDNLSGNLGISGTQKIYGKMLEIPAVKGQHIIEFKGNGQITGITYSQSSWRFEDSWDLQVGNDKLFESVRTKEYGEHKFLNVFYPINGTVKFIYNNISGTSKVLWVDFNILENSNLPTPTIPTTSEKNYRFLAIGESEYTLQGANNLMGCTYDADNISNLFKEHKESAKFTKNIVAKNKTKSEALNLIKNTFQDAQDNDISYLFWSGHGTVYEDKFALVAKDNIITVYELQTILDDIKGTKVIFIDTCHSGLAIDKNFAYTLAVVEEKLRSIDKTLNKQGYKVLTASAGSETSGDLSAGYNGNPNPSGAFTWALTQSIKTKKSDKDKNRIVTLEELYQSVLHFYDEFNIKNPYLKITQTAQVYPRNDTSSIFEYKEGA >CP028842|3182792:3204692|3196460_3196826_-|AWB18849.1|DBSCAN-SWA MNNINRAKISKNIYEHLEKKDLLREIKILRIGKNAFEEKLDEVYVCTIRGYYYRNNSNIITTSMEGLEFNNLYNDKLLIIYNDISSKIQKDDYFILDGTKYEIVDTGNIQNLVFDMILNRV |
27 | Clostridium_phage(85.71%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|